論文の概要: MHSNet:An MoE-based Hierarchical Semantic Representation Network for Accurate Duplicate Resume Detection with Large Language Model
- arxiv url: http://arxiv.org/abs/2508.13676v1
- Date: Tue, 19 Aug 2025 09:27:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.877281
- Title: MHSNet:An MoE-based Hierarchical Semantic Representation Network for Accurate Duplicate Resume Detection with Large Language Model
- Title(参考訳): MHSNet:大規模言語モデルを用いた高精度重複残量検出のためのMoEに基づく階層的意味表現ネットワーク
- Authors: Yu Li, Zulong Chen, Wenjian Xu, Hong Wen, Yipeng Yu, Man Lung Yiu, Yuyu Yin,
- Abstract要約: Recruitersは、サードパーティのWebサイトから履歴書を継続的に検索する必要がある。
第三者の履歴書は不完全で不正確であることが多い。
コントラスト学習を用いてBGE-M3を微調整するフレームワークであるMHSNetを提案する。
- 参考スコア(独自算出の注目度): 26.192086994958228
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: To maintain the company's talent pool, recruiters need to continuously search for resumes from third-party websites (e.g., LinkedIn, Indeed). However, fetched resumes are often incomplete and inaccurate. To improve the quality of third-party resumes and enrich the company's talent pool, it is essential to conduct duplication detection between the fetched resumes and those already in the company's talent pool. Such duplication detection is challenging due to the semantic complexity, structural heterogeneity, and information incompleteness of resume texts. To this end, we propose MHSNet, an multi-level identity verification framework that fine-tunes BGE-M3 using contrastive learning. With the fine-tuned , Mixture-of-Experts (MoE) generates multi-level sparse and dense representations for resumes, enabling the computation of corresponding multi-level semantic similarities. Moreover, the state-aware Mixture-of-Experts (MoE) is employed in MHSNet to handle diverse incomplete resumes. Experimental results verify the effectiveness of MHSNet
- Abstract(参考訳): 同社の人材プールを維持するためには、リクルーターはサードパーティのウェブサイト(例えばLinkedIn、Indentual)から履歴書を継続的に検索する必要がある。
しかし、フェッチされた履歴書は不完全で不正確であることが多い。
他社の履歴書の品質向上と人材プールの充実のためには、取得した履歴書と既に同社の人材プールにあるものとの重複検出が不可欠である。
このような重複検出は、履歴書の意味的複雑さ、構造的不均一性、情報不完全性により困難である。
そこで本稿では,BGE-M3 を比較学習を用いて微調整するマルチレベル識別検証フレームワーク MHSNet を提案する。
微調整により、Mixture-of-Experts (MoE) は履歴書のマルチレベルスパースと密度の高い表現を生成し、対応するマルチレベルセマンティックな類似性の計算を可能にする。
さらに、MHSNetでは、様々な不完全な履歴処理を扱うために、状態認識型Mixture-of-Experts (MoE) が使用されている。
MHSNetの有効性を検証する実験結果
関連論文リスト
- SemCORE: A Semantic-Enhanced Generative Cross-Modal Retrieval Framework with MLLMs [70.79124435220695]
セマンティック強化型Cross-mOdal Retrievalフレームワーク(SemCORE)を提案する。
まず,自然言語の理解と生成に最適化された生成モデルとターゲット識別子を効果的に整合させる構造化自然言語識別器(SID)を構築した。
次に、粒度の細かいターゲット識別を可能にするジェネレーティブ・セマンティック・検証(GSV)戦略を導入する。
論文 参考訳(メタデータ) (2025-04-17T17:59:27Z) - ConFit v2: Improving Resume-Job Matching using Hypothetical Resume Embedding and Runner-Up Hard-Negative Mining [18.379320787293842]
ConFit v2は、分散問題に対処するためのConFitの改善である。
本稿では,エンコーダのコントラスト学習プロセスを強化するための2つの手法を提案する。
実世界の2つのデータセット上でConFit v2を評価し、ConFitおよび先行手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-02-17T22:56:42Z) - Graph-DPEP: Decomposed Plug and Ensemble Play for Few-Shot Document Relation Extraction with Graph-of-Thoughts Reasoning [34.85741925091139]
Graph-DPEPフレームワークは、自然言語で提示された三重項の説明思想の背景にある。
我々は,サブグラフに埋め込まれた推論的思考を活用することで,型リスト全体の「アンサンブルプレイ」生成を開発する。
論文 参考訳(メタデータ) (2024-11-05T07:12:36Z) - Meta-Chunking: Learning Text Segmentation and Semantic Completion via Logical Perception [10.614437503578856]
本稿では,チャンキング品質を特に向上させるメタチャンキングフレームワークを提案する。
我々は不確実性に基づく2つの適応的チャンキング手法、すなわちPerplexity ChunkingとMargin Sampling Chunkingを設計する。
我々は,2段階の階層的要約生成プロセスと3段階のテキストチャンク書き換え手順を含むグローバル情報補償機構を確立する。
論文 参考訳(メタデータ) (2024-10-16T17:59:32Z) - Integrating Planning into Single-Turn Long-Form Text Generation [66.08871753377055]
長文コンテンツを生成するための計画案を提案する。
私たちの主な新規性は、複数のプロンプトや計画のラウンドを必要としない単一の補助的なタスクにあります。
実験では,LLMを補助タスクで微調整し,高品質な文書を生成する,異なる領域からの2つのデータセットを実証した。
論文 参考訳(メタデータ) (2024-10-08T17:02:40Z) - List-aware Reranking-Truncation Joint Model for Search and
Retrieval-augmented Generation [80.12531449946655]
本稿では,2つのタスクを同時に実行可能なRe rank-Truncation joint model(GenRT)を提案する。
GenRTは、エンコーダ-デコーダアーキテクチャに基づく生成パラダイムによるリランクとトランケーションを統合している。
提案手法は,Web検索および検索拡張LLMにおけるリランクタスクとトラルケーションタスクの両方においてSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-02-05T06:52:53Z) - Continual Referring Expression Comprehension via Dual Modular
Memorization [133.46886428655426]
Referring Expression (REC) は、自然言語で記述された対象のイメージ領域をローカライズすることを目的としている。
既存のRECアルゴリズムは、モデルへのデータ供給のトレーニングを前もって行うと強く仮定する。
本稿では、入ってくるタスクのストリーム上でモデルが学習するRECの新しい設定である連続参照表現(CREC)を提案する。
学習済みの知識を忘れずに,スクラッチから繰り返し再学習することなく,逐次的タスクのモデルを継続的に改善するために,デュアルモジュール記憶法という効果的なベースライン手法を提案する。
論文 参考訳(メタデータ) (2023-11-25T02:58:51Z) - Distilling Large Language Models using Skill-Occupation Graph Context
for HR-Related Tasks [8.235367170516769]
幅広いHRタスクに対応するためにResume-Job Description Benchmark (RJDB)を導入する。
私たちのベンチマークには、ジョブ記述、マッチした履歴書、未一致の履歴書が5万件以上含まれています。
実験の結果,学生モデルは教師モデル(GPT-4)よりも近・近性能が得られ,ベンチマークの有効性が確認された。
論文 参考訳(メタデータ) (2023-11-10T20:25:42Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - SCPNet: Semantic Scene Completion on Point Cloud [38.029386594416394]
セマンティックシーン補完のための深層モデル(SSC)の訓練は、スパース入力と不完全入力のために困難である。
マルチスケールな特徴を集約する新しいサブネットワークを設計し、損失の少ないダウンサンプリング操作を不要とする。
そこで本研究では,既設のパノプティクス・セグメンテーション・ラベルを用いて,動的オブジェクトのトレースを除去する簡易かつ効果的なラベル修正手法を提案する。
論文 参考訳(メタデータ) (2023-03-13T06:03:23Z) - Minimally-Supervised Structure-Rich Text Categorization via Learning on
Text-Rich Networks [61.23408995934415]
テキストリッチネットワークから学習することで,最小限に教師付き分類を行う新しいフレームワークを提案する。
具体的には、テキスト理解のためのテキスト解析モジュールと、クラス差別的でスケーラブルなネットワーク学習のためのネットワーク学習モジュールの2つのモジュールを共同でトレーニングします。
実験の結果,1つのカテゴリに3つのシード文書しか与えられず,その精度は約92%であった。
論文 参考訳(メタデータ) (2021-02-23T04:14:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。