top of page

Quelles données peut-on extraire des offres d’emploi ?

Chaque jour, ce sont des centaines de milliers d'offres d'emploi qui sont publiées sur les portails de recrutement en France. Autant dire que ces offres d'emploi regorgent de millions de données précieuses aux acteurs de l'emploi, de la formation et de l'accompagnement en évolution professionnelle.


Etant à la fois plus granulaires et plus dynamiques que l'information traditionnelle sur le marché du travail, ces données fournissent des détails approfondis sur l'état et l'évolution de la demande, offrant ainsi une alternative complémentaire à la fois efficace, viable et nettement plus économique dans son exploitation.


Grâce à ses systèmes Big Data, TrouveTaVoie recueille et analyse les offres d'emploi issues de plus d'une centaines de plateformes d'emploi et d'agrégateurs, ainsi que plusieurs milliers de sites carrières d'entreprises en France.


Dans cet article, nous présentons les différents types de données que l'on peut massivement extraire et exploiter à partir des offres d'emploi.


L'analyse des offres d'emploi en ligne : rappel méthodologique


Les offres d'emploi publiées en ligne offrent une représentation parmi différentes représentations possibles de l'état de la demande du marché, ainsi que les pratiques de recrutement.


Naturellement, cette représentation est imparfaite et ne correspond pas à la demande réelle des employeurs, mais plutôt à ce que ces derniers choisissent de mettre en avant dans un contexte à la fois compétitif et évolutif. Souvent, l'information extraite de ces données reflète ce que les recruteurs expriment le plus souvent, et d'une certaine façon, l'écart entre ce qu'ils attendent et ce qui est largement commun.


Au-delà donc de la prudence statistique requise, le nombre d'offres publiées pouvant être supérieur ou inférieur au nombre d'embauches ou de vacances réelles, l'exploitation des données issues des offres d'emploi nécessite bien une approche méthodologique précise.


Par exemple, selon nos propres analyses, les recruteurs focalisent surtout sur les points qu'ils ne trouvent pas systématiquement, ainsi que sur les cadres d'activités essentiels. En revanche, ils peuvent ne pas expliciter certaines exigences qui sont considérées comme communes ou largement connues.


Bien entendu, quand une même offre apparaît simultanément sur différentes plateformes ou avec une fréquence élevée, nous appliquons des algorithmes de déduplication afin de fournir une indication réaliste sur le nombre d'offres uniques.



Quels types de données pouvons-nous extraire des offres d'emploi ?


Généralement, on peut distinguer trois types de données principaux qu'on peut extraire des offres d'emploi issues du web :

  • les métadonnées,

  • les données descriptives,

  • les données dérivées ou composées.

Les métadonnées


Les métadonnées servent principalement à contextualiser l’offre d’emploi, et ainsi, mieux comprendre et/ou déduire certaines caractéristiques de la demande (point de vues des recruteurs / employeurs). Par exemple, on peut citer :

  • la date de publication de l’offre d’emploi

  • les sites web sources où l'offre a été publiée

  • l'état de l'offre à un instant donné : active ou non active (supprimée ou inaccessible)

  • la langue de publication

Une fois ces données capturées et sauvegardées, nous pouvons les enrichir à travers d'autres traitements analytiques afin de déduire plus d'informations. Par exemple, pour un métier ou une entreprise donnés, on peut calculer :

  • le nombre de jours moyen pendant lesquels les offres restent actives

  • la fréquence de publication

  • le nombre de plateformes (Job Boards) où l'offre est publiée

Ces informations peuvent être ensuite croisées par le biais d'autres algorithmes et méthodologies afin de produire une indication sur le niveau de tension ou de concurrence par exemple.


Les données descriptives


Les données dites descriptives concernent les informations qui se rapportent aux caractéristiques de l'emploi / poste vacant, de l'employeur et de/des candidats recherchés. Citons par exemple :

  • le métier / la fonction/ le rôle

  • les activités du poste

  • les compétences clés (savoirs, savoir-faire, soft skills, langues, etc.)

  • les niveaux d'études recherchés

  • les domaines de formations préférés

  • les certifications requises ou souhaitées

  • les fourchettes salariales proposées

  • le nom du recruteur / de l'annonceur

  • le domaine d'activité / secteur de l'employeur

  • le département / équipe de rattachement

  • la / les localisation(s) de l'offre

  • les avantages proposés

  • les outils / logiciels / technologies / normes etc. exploités

  • le niveau d'expérience requis

  • le processus du recrutement proposé (les modalités)

  • le type de contrat proposé

L'analyse systématique et massive de ces données descriptives ouvre une nouvelle ère et des alternatives inédites aux institutions (publiques et privées), ainsi qu'aux organismes de formations, quant à la façon d'observer et de comprendre les métiers et les compétences pour agir dans un contexte de marché fluctuant.


Ces données permettent, à titre d'exemple, de répondre aux questions suivantes :

  • Quels métiers émergent sur le marché ?

  • Dans quelles industries, quelles régions et chez quels recruteurs vont-ils se développer à l'avenir ?

  • Quelles compétences, connaissances, expériences tirent ces métiers émergents ?

  • Comment garantir l'adéquation d'un programme de formation avec les compétences demandées sur le marché ?

  • Comment préserver son employabilité et identifier les compétences à développer tout au long de la vie ?

  • Comment transférer ses compétences vers des domaines plus porteurs ?

  • Quels sont les métiers, les fonctions, les rôles qui se transforment ?

  • Quels outils, technologies, normes, organisations, méthodes entrainent ces changements ?

  • Comment repérer les Soft Skills les plus essentiels pour l'exercice d'un métier ? Est ce la même chose pour tous les types d'organisation ?

  • Peut-on anticiper les priorités spécifiques d'un secteurs, une industrie, une entreprise pour se démarquer ?

  • Quelles compétences particulières pourraient permettre d'augmenter son salaire sur le marché ?

  • Où serait-il possible de se reconvertir à court terme ?


Les données dérivées


Dans le cadre d'un système d'information sur le marché du travail basé sur l'observation, en temps réel, des offres d'emploi, les données descriptives précités sont nettoyées, standardisées, enrichies, et peuvent être traitées de façon combinée en vue de produire des insights exploitables et utiles à la prise de décision.


De tels traitements analytiques incluent à la fois les données descriptives, les métadonnées, et potentiellement des sources supplémentaires, s'appuyant notamment sur l'exploitation d'intelligences artificielles spécialisées, ainsi que sur des ontologies et/ou des référentiels métiers / compétences standards et/ou propriétaires.


A la sortie, un tel système permet de produire plusieurs données dites dérivées selon les objectifs (i.e. indicateurs, catégorisations etc.). Par exemple, il est possible de mesurer le salaire moyen proposé par métier en combinant l'information sur les salaires et sur les métiers (i.e. à travers une IA de normalisation des intitulés de poste).


Autre exemple : en croisant l'information sur les compétences, les salaires et les métiers, on peut déduire les groupes de compétences qui rémunèrent le mieux par métier.

 

◼️ Vous êtes professionnel de la formation ou du Conseil Carrière ?

◼️ Vous souhaitez en savoir plus sur nos solutions IA et Big Data ?

◼️ Vous avez un projet, une étude spécifique à mener ?

◼️ Vous souhaitez avoir accès à nos données et insights ?

◼️ Vous aimeriez tester notre plateforme https://app.trouvetavoie.io ?



🚀 TrouveTaVoie œuvre pour rendre les données et les technologies de l'emploi largement accessibles à tous les acteurs du marché du travail !


📈 Nous disposons de la base de données temps réel sur le marché du travail la plus large, la plus complète et la plus granulaire en France.

Comentarios


bottom of page