Learning Recruitment-Related Representations from Graphs and Sequential Data - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2023

Learning Recruitment-Related Representations from Graphs and Sequential Data

Apprentissage de la Représentation Liée au Recrutement à partir de Graphes et de Données Séquentielles

Résumé

E-recruitment has become the most important recruitment tool in modern society, facilitating recruitment and bringing a large amount of digital data. How to efficiently process such massive data and improve the efficiency of E-recruitment is a significant and urgent issue for the entire industry. As a human resources services industry pioneer, Randstad hopes to improve the recruitment process, including improving the user experience and reducing expenses. In particular, using Artificial Intelligence (AI) related techniques, inspired by the success of AI in many practical applications. Around the recruitment system, many related sub-tasks need to be handled, including but not limited to information integration, talent search, career advice, and algorithm optimization. Therefore, in this thesis, we will investigate how to use AI techniques to solve some sub-tasks to help the construction of job recommender systems.As in other fields, AI technology is gaining traction in the recruitment industry. These techniques are designed to systematically address the limitations of traditional recruitment procedures, especially for repetitive, high-volume tasks, by incorporating AI-based approaches. Although many studies have demonstrated their effectiveness, they still have some challenges due to the specific characteristics of recruitment data. For example, open datasets are relatively difficult to obtain due to the privacy of the recruitment domain, which limits the use of supervised methods and communication between researchers, and the recruitment domain is constantly evolving, so static methods cannot quickly adapt to data changes. In addition, the data processed and analyzed in existing works mainly include: (i) person-job matching records, (ii) career trajectories, and (iii) jobs or resumes. There are some hidden structures in this data, mainly graphs (networks), which contain lots of extra information. However, this additional information is rarely noticed. Except for this hidden graph information, the recruitment domain also contains some predefined well-structured data, such as skill and occupation taxonomy. These taxonomies often contain much normative knowledge, but no work has yet made use of it, whether directly or indirectly. In such context, this thesis attempts to partially address the problems in existing works, such as learning job representations separately in an unsupervised manner to face the lack of labeled data and using a similarity-based loss function to adapt to continuous and rapid item updates. More importantly, this thesis focuses on a less-studied direction: how to exploit implicitly or explicitly structured recruitment data (i.e. graphs) to improve the learned recruitment-related representations, e.g., learning job title representations from job transition graphs and skill representations from skill taxonomies.Specifically, in this thesis, we study three important sub-tasks: (i) Job titles are short but contain essential information that can be used to facilitate various other sub-tasks of job recommender systems, such as improving talent profile modeling for career guidance, facilitating search and recommendation, and benefiting recruitment analysis. Therefore, in Chapter 4, we propose to learn job title representations from graphs built on working histories. (ii) Then, in Chapter 5, we propose to learn skills representations from a built skill co-occurrence graph and enhance the representations with a predefined skill taxonomy. The learned skill representations can be used to model occupations or talents. (iii) Chapter 6 studies the next job application task, aiming to predict the next most likely job that the job seeker might apply for using the job application sequences. In each sub-task, we use extensive experiments on real-world datasets to demonstrate the effectiveness of our methods.
Le recrutement électronique est devenu l'outil de recrutement le plus important dans la société moderne. Comment traiter efficacement une telle quantité de données et améliorer l'efficacité du recrutement en ligne est un problème important et urgent auquel l'ensemble du secteur est confronté. En tant que pionnier du secteur des services de ressources humaines, Randstad souhaitait améliorer le processus de recrutement, notamment en améliorant l'expérience utilisateur et en réduisant les dépenses. En particulier, en utilisant des techniques liées à l'Intelligence Artificielle (IA), inspirées du succès de l'IA dans de nombreuses applications pratiques. Autour du système de recrutement, de nombreuses sous-tâches connexes doivent être traitées, y compris, mais sans s'y limiter, l'intégration d'informations, la recherche de talents, l'optimisation des algorithmes, etc. Par conséquent, dans cette thèse, nous étudierons comment utiliser des techniques d'IA pour résoudre certaines sous-tâches afin d'aider à construire des recrutement systèmes.Comme d'autres domaines, la technologie de l'IA gagne en popularité dans l'industrie du recrutement. Ces technologies visent à répondre systématiquement aux limites des procédures de recrutement traditionnelles, en particulier pour les tâches répétitives, en intégrant des approches basées sur l'IA. Bien que de nombreuses études aient démontré leur efficacité, elles présentent encore des défis en raison des caractéristiques spécifiques des recrutements données. Par exemple, les ensembles de données ouvertes sont relativement difficiles à obtenir en raison de la confidentialité, ce qui limite l'utilisation de méthodes supervisées, et le domaine du recrutement évolue constamment, de sorte que les méthodes statiques ne peuvent pas s'adapter rapidement aux changements de données. Par ailleurs, les données traitées dans les travaux existants comprennent principalement : (i) les offre-CV paires, (ii) les trajectoires de carrière, et (iii) les emplois ou CV. Il existe des structures cachées dans ces données, principalement des graphes, qui contiennent de nombreuses informations supplémentaires. Cependant, ces informations supplémentaires sont rarement remarquées. En plus de ces informations graphiques cachées, le domaine de recrutement contient également des données prédéfinies bien structurées, telles que la taxonomie des compétences et des professions. Ces taxonomies contiennent souvent beaucoup de connaissances normatives, mais aucun travail ne les a exploitées directement ou indirectement. Dans ce contexte, cette thèse tente de résoudre partiellement les problèmes des travaux existants, tels que l'apprentissage des représentations d'emplois séparément de manière non supervisée pour faire face au manque de données étiquetées et l'utilisation d'une fonction de perte basée sur la similarité pour s'adapter aux mises à jour continues et rapides des éléments. Plus important encore, cette thèse se concentre sur une direction moins étudiée : comment exploiter des données de recrutement implicitement ou explicitement structurées pour améliorer les représentations apprises liées au recrutement.Plus précisément, dans cette thèse, nous étudions trois sous-tâches importantes: (i) Dans le Chapitre 4, nous proposons d'apprendre les représentations des job titres à partir de graphes construits à partir d'histoires professionnelles. (ii) Ensuite, dans le Chapitre 5, nous proposons d'apprendre les représentations des compétences à partir d'un graphe de cooccurrence de compétences construit et d'améliorer les représentations avec une taxonomie de compétences prédéfinie.. (iii) Le Chapitre 6 étudie la tâche de prédiction d'emploi prochain, visant à prédire le prochain emploi le plus probable pour lequel le demandeur d'emploi pourrait postuler à l'aide des séquences de demande d'emploi.
Fichier principal
Vignette du fichier
107652_ZHU_2023_archivage.pdf (17.47 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-04102832 , version 1 (22-05-2023)

Identifiants

  • HAL Id : tel-04102832 , version 1

Citer

Jun Zhu. Learning Recruitment-Related Representations from Graphs and Sequential Data. Artificial Intelligence [cs.AI]. Université Paris-Saclay, 2023. English. ⟨NNT : 2023UPAST046⟩. ⟨tel-04102832⟩
146 Consultations
50 Téléchargements

Partager

Gmail Facebook X LinkedIn More