論文の概要: ConFit v2: Improving Resume-Job Matching using Hypothetical Resume Embedding and Runner-Up Hard-Negative Mining
- arxiv url: http://arxiv.org/abs/2502.12361v2
- Date: Wed, 19 Feb 2025 19:18:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-21 10:45:30.183129
- Title: ConFit v2: Improving Resume-Job Matching using Hypothetical Resume Embedding and Runner-Up Hard-Negative Mining
- Title(参考訳): ConFit v2: 仮説列埋め込みとランナアップハード負のマイニングによるリズメジョブマッチングの改善
- Authors: Xiao Yu, Ruize Xu, Chengyuan Xue, Jinzhong Zhang, Zhou Yu,
- Abstract要約: ConFit v2は、分散問題に対処するためのConFitの改善である。
本稿では,エンコーダのコントラスト学習プロセスを強化するための2つの手法を提案する。
実世界の2つのデータセット上でConFit v2を評価し、ConFitおよび先行手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 15.63898598630676
- License:
- Abstract: A reliable resume-job matching system helps a company recommend suitable candidates from a pool of resumes and helps a job seeker find relevant jobs from a list of job posts. However, since job seekers apply only to a few jobs, interaction labels in resume-job datasets are sparse. We introduce ConFit v2, an improvement over ConFit to tackle this sparsity problem. We propose two techniques to enhance the encoder's contrastive training process: augmenting job data with hypothetical reference resume generated by a large language model; and creating high-quality hard negatives from unlabeled resume/job pairs using a novel hard-negative mining strategy. We evaluate ConFit v2 on two real-world datasets and demonstrate that it outperforms ConFit and prior methods (including BM25 and OpenAI text-embedding-003), achieving an average absolute improvement of 13.8% in recall and 17.5% in nDCG across job-ranking and resume-ranking tasks.
- Abstract(参考訳): 信頼できる履歴書マッチングシステムは、企業が履歴書のプールから適切な候補を推薦するのを助け、求職者が求職者リストから関連する求職者を見つけるのを助ける。
しかし、求職者は少数のジョブにしか適用されないため、履歴書ジョブデータセットのインタラクションラベルは少ない。
ConFit v2は、この疎結合問題に対処するために、ConFitに対する改善である。
本研究では,エンコーダの対照的なトレーニングプロセスを強化するための2つの手法を提案する。これは,大規模言語モデルが生成した仮説的参照履歴によるジョブデータの拡大と,新しいハードネガティブマイニング戦略を用いて,ラベル付き履歴/ジョブペアから高品質なハードネガティブを生成することである。
ConFit v2を実世界の2つのデータセットで評価し、ConFitおよび以前の手法(BM25とOpenAIテキスト埋め込み-003を含む)より優れており、平均絶対的な13.8%のリコールと17.5%のnDCGの改善を実現していることを示す。
関連論文リスト
- Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration [54.8229698058649]
本研究では,未ラベルの事前軌跡データを用いて効率的な探索戦略を学習する方法について検討する。
我々の手法 SUPE (Skills from Unlabeled Prior Data for Exploration) は、これらのアイデアの慎重な組み合わせがそれらの利点を兼ね備えていることを示す。
実験により,SUPEが従来の戦略を確実に上回り,長い水平・スパース・リワードタスクの一組の解決に成功したことを実証的に示す。
論文 参考訳(メタデータ) (2024-10-23T17:58:45Z) - List-aware Reranking-Truncation Joint Model for Search and
Retrieval-augmented Generation [80.12531449946655]
本稿では,2つのタスクを同時に実行可能なRe rank-Truncation joint model(GenRT)を提案する。
GenRTは、エンコーダ-デコーダアーキテクチャに基づく生成パラダイムによるリランクとトランケーションを統合している。
提案手法は,Web検索および検索拡張LLMにおけるリランクタスクとトラルケーションタスクの両方においてSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-02-05T06:52:53Z) - ConFit: Improving Resume-Job Matching using Data Augmentation and
Contrastive Learning [20.599962663046007]
データ拡張と単純なコントラスト学習アプローチを用いて,空間性問題に対処する。
ConFitはまず、履歴書またはジョブポストの特定のセクションを言い換えることで、拡張された履歴書ジョブデータセットを作成する。
実世界の2つのデータセット上でConFitを評価し,ジョブとランキング履歴のランキングでは,それぞれnDCG@10で31%,絶対値で先行手法よりも優れていた。
論文 参考訳(メタデータ) (2024-01-29T17:55:18Z) - Distilling Large Language Models using Skill-Occupation Graph Context
for HR-Related Tasks [8.235367170516769]
幅広いHRタスクに対応するためにResume-Job Description Benchmark (RJDB)を導入する。
私たちのベンチマークには、ジョブ記述、マッチした履歴書、未一致の履歴書が5万件以上含まれています。
実験の結果,学生モデルは教師モデル(GPT-4)よりも近・近性能が得られ,ベンチマークの有効性が確認された。
論文 参考訳(メタデータ) (2023-11-10T20:25:42Z) - JobHam-place with smart recommend job options and candidate filtering
options [0.0]
ジョブレコメンデーションとCVランキングは自動キーワード抽出から始まり、Job/CVランキングアルゴリズムで終わる。
Job2SkillはテキストエンコーダとGruベースのレイヤの2つのコンポーネントで構成されている。
ジョブ/CVランキングアルゴリズムは、TFIDFスコアと全スキルナンバーのマッチング比に基づいて、スキルワードの発生率を算出する。
論文 参考訳(メタデータ) (2023-03-31T09:54:47Z) - Selective In-Context Data Augmentation for Intent Detection using
Pointwise V-Information [100.03188187735624]
PLMとPVI(pointwise V-information)に基づく新しい手法を導入し,モデル学習におけるデータポイントの有用性を計測する。
提案手法はまず,学習データの小さなシード上でPLMを微調整し,与えられた意図に対応する発話を新たに生成する。
そこで本手法は,大規模言語モデルの表現力を活用し,多様な学習データを生成する。
論文 参考訳(メタデータ) (2023-02-10T07:37:49Z) - Construction of English Resume Corpus and Test with Pre-trained Language
Models [0.0]
本研究では,履歴書の情報抽出タスクを簡単な文分類タスクに変換することを目的とする。
分類規則は、履歴書のより大きくよりきめ細かな分類データセットを作成するために改善される。
このコーパスは、現在の主要なプレトレーニング言語モデル(PLM)のパフォーマンスをテストするためにも使われる。
論文 参考訳(メタデータ) (2022-08-05T15:07:23Z) - KnowDA: All-in-One Knowledge Mixture Model for Data Augmentation in
Few-Shot NLP [68.43279384561352]
既存のデータ拡張アルゴリズムはタスク非依存のルールや微調整の汎用事前訓練言語モデルを利用する。
これらの手法は、簡単なタスク固有の知識を持ち、単純なタスクにおいて弱いベースラインのための低品質な合成データを得るに限られる。
我々は,様々なNLPタスクを予め学習したエンコーダ/デコーダLMの知識混合データ拡張モデル(KnowDA)を提案する。
論文 参考訳(メタデータ) (2022-06-21T11:34:02Z) - Learning to Match Jobs with Resumes from Sparse Interaction Data using
Multi-View Co-Teaching Network [83.64416937454801]
ジョブ列のインタラクションデータは疎結合でノイズが多く、ジョブ列のマッチングアルゴリズムのパフォーマンスに影響する。
求人情報マッチングのための疎相互作用データから,新しいマルチビュー協調学習ネットワークを提案する。
我々のモデルは求人マッチングの最先端手法より優れている。
論文 参考訳(メタデータ) (2020-09-25T03:09:54Z) - Job2Vec: Job Title Benchmarking with Collective Multi-View
Representation Learning [51.34011135329063]
Job Title Benchmarking (JTB) は、様々な企業で同様の専門知識を持つ職種をマッチングすることを目的としている。
従来のJTBのアプローチは主に手作業による市場調査に依存しており、それは高価で労働集約的である。
我々はJTBをジョブ-グラフ上のリンク予測のタスクとして再編成し、ジョブタイトルにマッチするリンクはリンクを持つべきである。
論文 参考訳(メタデータ) (2020-09-16T02:33:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。