論文の概要: JobHop: A Large-Scale Dataset of Career Trajectories
- arxiv url: http://arxiv.org/abs/2505.07653v1
- Date: Mon, 12 May 2025 15:22:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.451165
- Title: JobHop: A Large-Scale Dataset of Career Trajectories
- Title(参考訳): JobHop: キャリア軌道の大規模データセット
- Authors: Iman Johary, Raphael Romero, Alexandru C. Mara, Tijl De Bie,
- Abstract要約: ジョブホップ(JobHop)は、ベルギーのフランドルにある公共雇用サービスVDABが提供する匿名の履歴書から派生した大規模なパブリックデータセットである。
構造化されていない履歴データを処理して、構造化された経歴情報を抽出し、標準化された ESCO の職業コードにマッピングする。
これにより、230万以上の作業経験の豊富なデータセットが抽出され、391,000以上のユーザ履歴書にまとめられる。
- 参考スコア(独自算出の注目度): 48.881023210777585
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding labor market dynamics is essential for policymakers, employers, and job seekers. However, comprehensive datasets that capture real-world career trajectories are scarce. In this paper, we introduce JobHop, a large-scale public dataset derived from anonymized resumes provided by VDAB, the public employment service in Flanders, Belgium. Utilizing Large Language Models (LLMs), we process unstructured resume data to extract structured career information, which is then mapped to standardized ESCO occupation codes using a multi-label classification model. This results in a rich dataset of over 2.3 million work experiences, extracted from and grouped into more than 391,000 user resumes and mapped to standardized ESCO occupation codes, offering valuable insights into real-world occupational transitions. This dataset enables diverse applications, such as analyzing labor market mobility, job stability, and the effects of career breaks on occupational transitions. It also supports career path prediction and other data-driven decision-making processes. To illustrate its potential, we explore key dataset characteristics, including job distributions, career breaks, and job transitions, demonstrating its value for advancing labor market research.
- Abstract(参考訳): 労働市場のダイナミクスを理解することは、政策立案者、雇用主、求職者にとって不可欠である。
しかし、現実のキャリアの軌跡を捉える包括的なデータセットは乏しい。
本稿では,ベルギーのフランドルにある公共雇用サービスであるVDABが提供した匿名化された履歴書から得られた大規模公開データセットであるJobHopを紹介する。
LLM(Large Language Models)を利用すると、構造化されていない履歴データを処理して構造化された経歴情報を抽出し、マルチラベル分類モデルを用いて標準化されたESCO職業コードにマッピングする。
この結果、230万以上の作業経験の豊富なデータセットが抽出され、391,000以上のユーザ履歴にグループ化され、標準化された ESCO の職業コードにマッピングされ、現実世界の職業移行に関する貴重な洞察を提供する。
このデータセットは、労働市場のモビリティの分析、仕事の安定性、職業移行における失業の影響など、多様な応用を可能にする。
また、キャリアパス予測やその他のデータ駆動意思決定プロセスもサポートする。
その可能性を説明するために、雇用分配、キャリアブレーク、職の移行など、重要なデータセットの特徴を探求し、労働市場研究の進展にその価値を実証する。
関連論文リスト
- KARRIEREWEGE: A Large Scale Career Path Prediction Dataset [29.24421465266904]
我々は500万以上のキャリアパスを含む包括的な公開データセットであるKARRIEREWEGEを紹介する。
履歴書に典型的に見られる自由テキスト入力の問題に対処するために,職名や記述を合成することで,それを強化する。
これにより、非構造化データからの正確な予測が可能になり、実際のアプリケーションの課題と密接に一致します。
論文 参考訳(メタデータ) (2024-12-19T08:02:08Z) - Job-SDF: A Multi-Granularity Dataset for Job Skill Demand Forecasting and Benchmarking [59.87055275344965]
Job-SDFは、ジョブスキルの需要予測モデルをトレーニングし、ベンチマークするために設計されたデータセットである。
2021年から2023年にかけて、中国の大手オンライン求人プラットフォームから集められた1035万件の求人広告に基づいている。
本データセットは,職業,企業,地域レベルなど,さまざまな粒度でのスキル需要予測モデルの評価を可能にする。
論文 参考訳(メタデータ) (2024-06-17T07:22:51Z) - NNOSE: Nearest Neighbor Occupational Skill Extraction [55.22292957778972]
作業スキルデータセットの複雑さに対処する。
我々は、データセット統一方式で類似したスキルを検索するために、外部データストアを使用します。
我々は、データセット間設定において、頻度の低いパターンを予測し、最大30%のスパンF1で性能向上を観察する。
論文 参考訳(メタデータ) (2024-01-30T15:18:29Z) - Career Path Prediction using Resume Representation Learning and
Skill-based Matching [14.635764829230398]
本稿では,作業履歴データに特化して設計された新しい表現学習手法であるCareerBERTを提案する。
キャリアパス予測のためのスキルベースモデルとテキストベースモデルを開発し,それぞれ35.24%,39.61%のリコール@10を得た。
論文 参考訳(メタデータ) (2023-10-24T08:56:06Z) - A practical method for occupational skills detection in Vietnamese job
listings [0.16114012813668932]
正確でタイムリーな労働市場情報の欠如は、スキルミスマッチにつながる。
従来のアプローチは、既存の分類学および/または大きな注釈付きデータに依存している。
ベトナムの求人求職者におけるスキル検出のための実践的手法を提案する。
論文 参考訳(メタデータ) (2022-10-26T10:23:18Z) - CAREER: A Foundation Model for Labor Sequence Data [21.38386300423882]
ジョブシーケンスの基礎モデルであるCAREERを開発した。
CAREERは最初、大規模で受動的に収集された履歴データに適合し、その後、経済的な推測のためにより小さく、より精度の良いデータセットに微調整される。
我々はCAREERがジョブシーケンスの正確な予測をし、広く使われている3つの経済データセットのエコノメトリベースラインを上回ります。
論文 参考訳(メタデータ) (2022-02-16T23:23:50Z) - Job2Vec: Job Title Benchmarking with Collective Multi-View
Representation Learning [51.34011135329063]
Job Title Benchmarking (JTB) は、様々な企業で同様の専門知識を持つ職種をマッチングすることを目的としている。
従来のJTBのアプローチは主に手作業による市場調査に依存しており、それは高価で労働集約的である。
我々はJTBをジョブ-グラフ上のリンク予測のタスクとして再編成し、ジョブタイトルにマッチするリンクはリンクを持つべきである。
論文 参考訳(メタデータ) (2020-09-16T02:33:32Z) - A Large-scale Industrial and Professional Occupation Dataset [0.2642698101441705]
今日の求人市場では、職業データマイニングと分析の重要性が高まっている。
このデータセットは、LinkedInの56万ユーザに属する192万のジョブから成っている。
論文 参考訳(メタデータ) (2020-04-25T10:45:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。