論文の概要: Enhancing Job Matching: Occupation, Skill and Qualification Linking with the ESCO and EQF taxonomies
- arxiv url: http://arxiv.org/abs/2512.03195v1
- Date: Tue, 02 Dec 2025 19:49:43 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 12:15:42.327296
- Title: Enhancing Job Matching: Occupation, Skill and Qualification Linking with the ESCO and EQF taxonomies
- Title(参考訳): 雇用マッチングの強化: ESCO と EQF の分類と結びついた職業・技能・資格
- Authors: Stylianos Saroglou, Konstantinos Diamantaras, Francesco Preta, Marina Delianidi, Apostolos Benisis, Christian Johannes Meyer,
- Abstract要約: 本研究では、労働市場情報の分類を改善するための言語モデルの可能性について検討する。
本論文では,文文リンクとエンティティリンクの2つの重要な方法論について検討・比較する。
現在進行中の研究を支援するため、これらの2つの方法論を取り入れたオープンソースツールをリリースする。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This study investigates the potential of language models to improve the classification of labor market information by linking job vacancy texts to two major European frameworks: the European Skills, Competences, Qualifications and Occupations (ESCO) taxonomy and the European Qualifications Framework (EQF). We examine and compare two prominent methodologies from the literature: Sentence Linking and Entity Linking. In support of ongoing research, we release an open-source tool, incorporating these two methodologies, designed to facilitate further work on labor classification and employment discourse. To move beyond surface-level skill extraction, we introduce two annotated datasets specifically aimed at evaluating how occupations and qualifications are represented within job vacancy texts. Additionally, we examine different ways to utilize generative large language models for this task. Our findings contribute to advancing the state of the art in job entity extraction and offer computational infrastructure for examining work, skills, and labor market narratives in a digitally mediated economy. Our code is made publicly available: https://github.com/tabiya-tech/tabiya-livelihoods-classifier
- Abstract(参考訳): 本研究では、仕事の空き教科書を欧州スキル、能力、資格、職業(ESCO)の分類と欧州基準フレームワーク(EQF)の2つの主要なフレームワークにリンクさせることで、労働市場情報の分類を改善するための言語モデルの可能性を検討する。
本論文では,文文リンクとエンティティリンクの2つの重要な方法論について検討・比較する。
この2つの手法を取り入れたオープンソースツールを公開し、労働分類と雇用談話のさらなる取り組みを支援する。
表面レベルのスキル抽出を超えて、仕事の空き地テキスト内での職業や資格の表現方法を評価することを目的とした2つの注釈付きデータセットを導入する。
さらに,この課題に対して,生成的大規模言語モデルを利用するための様々な方法を検討する。
本研究は,職種抽出の最先端化に寄与し,デジタル化経済における仕事,技能,労働市場の物語を調べるための計算基盤を提供する。
私たちのコードは公開されています。 https://github.com/tabiya-tech/tabiya-livelihoods-classifier
関連論文リスト
- Standard Occupation Classifier -- A Natural Language Processing Approach [0.0]
本研究は、自然言語処理における最近の開発動向を考察し、ある求人広告に職業コードを割り当てることのできる分類器を構築することを目的とする。
我々は、異なる言語モデルを用いて、UK ONS SOCとUS O*NET SOCの両方の分類器を開発する。
Google BERTとニューラルネットワークの分類器を組み合わせたアンサンブルモデルは,肩書きや説明,スキルを考慮しつつ,最高の予測精度を達成した。
論文 参考訳(メタデータ) (2025-11-28T10:30:37Z) - Overview of the TalentCLEF 2025: Skill and Job Title Intelligence for Human Capital Management [0.2276267460638319]
本稿では,スキルと肩書のインテリジェンスに着目した最初の評価キャンペーンであるTalentCLEF 2025を紹介する。
評価にはモノリンガルとクロスランガルのシナリオが含まれ、性別バイアスの評価をカバーした。
TalentCLEFはこの分野で最初の公開ベンチマークを提供し、労働市場向けの堅牢で公平で移動可能な言語技術の開発を奨励している。
論文 参考訳(メタデータ) (2025-07-17T16:33:57Z) - Tec-Habilidad: Skill Classification for Bridging Education and Employment [0.7373617024876725]
本稿では,スキル抽出と分類のためのスペイン語データセットを開発する。
知識、スキル、能力を区別するアノテーションの方法論を提供する。
また、スキル分類のための堅牢なソリューションを進めるためのディープラーニングベースラインも提供する。
論文 参考訳(メタデータ) (2025-03-05T22:05:42Z) - Joint Extraction and Classification of Danish Competences for Job Matching [13.364545674944825]
本研究はデンマークの求職者から有能性を共同で抽出し分類する最初のモデルを示す。
統合抽出・分類のための単一BERTアーキテクチャとして,本モデルは軽量かつ効率的に推論できる。
論文 参考訳(メタデータ) (2024-10-29T15:00:40Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Hierarchical Classification of Transversal Skills in Job Ads Based on
Sentence Embeddings [0.0]
本稿では,求人広告要件とスキルセットの相関関係をディープラーニングモデルを用いて同定することを目的とする。
このアプローチには、ESCO(European Skills, Competences, Occupations)分類を使用したデータ収集、事前処理、ラベル付けが含まれる。
論文 参考訳(メタデータ) (2024-01-10T11:07:32Z) - Cross-Lingual NER for Financial Transaction Data in Low-Resource
Languages [70.25418443146435]
半構造化テキストデータにおける言語間名前認識のための効率的なモデリングフレームワークを提案する。
我々は2つの独立したSMSデータセットを英語とアラビア語で使用し、それぞれが半構造化された銀行取引情報を持っている。
わずか30のラベル付きサンプルにアクセスすることで、我々のモデルは、英語からアラビア語までの商人、金額、その他の分野の認識を一般化することができる。
論文 参考訳(メタデータ) (2023-07-16T00:45:42Z) - ERICA: Improving Entity and Relation Understanding for Pre-trained
Language Models via Contrastive Learning [97.10875695679499]
そこで本研究では, ERICA という新たなコントラスト学習フレームワークを提案し, エンティティとその関係をテキストでより深く理解する。
実験の結果,提案する erica フレームワークは文書レベルの言語理解タスクにおいて一貫した改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:35:22Z) - CoLAKE: Contextualized Language and Knowledge Embedding [81.90416952762803]
文脈型言語と知識埋め込み(CoLAKE)を提案する。
CoLAKEは、言語と知識の両方の文脈化された表現を、拡張された目的によって共同で学習する。
知識駆動タスク、知識探索タスク、言語理解タスクについて実験を行う。
論文 参考訳(メタデータ) (2020-10-01T11:39:32Z) - Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-02T03:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。