論文の概要: Job Skill Extraction via LLM-Centric Multi-Module Framework
- arxiv url: http://arxiv.org/abs/2604.21525v1
- Date: Thu, 23 Apr 2026 10:46:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.449264
- Title: Job Skill Extraction via LLM-Centric Multi-Module Framework
- Title(参考訳): LLM-Centric Multi-Module Frameworkによるジョブスキル抽出
- Authors: Guojing Li, Zichuan Fu, Junyi Li, Faxue Liu, Wenxia Zhou, Yejing Wang, Jingtong Gao, Maolin Wang, Rungen Liu, Wenlin Zhang, Xiangyu Zhao,
- Abstract要約: 本稿では,意味検索,文脈内学習,教師付き微調整を組み合わせたLLM中心のフレームワークであるSRICLを提案する。
SRICLは、6つの公的なスパンラベル付きジョブアド文のコーパスにおいて、GPT-3.5よりも相当なSTRICT-F1の改善を達成し、ベースラインを加速し、無効なタグと幻覚したスパンを激減する。
- 参考スコア(独自算出の注目度): 51.37063712967151
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Span-level skill extraction from job advertisements underpins candidate-job matching and labor-market analytics, yet generative large language models (LLMs) often yield malformed spans, boundary drift, and hallucinations, especially with long-tail terms and cross-domain shift. We present SRICL, an LLM-centric framework that combines semantic retrieval (SR), in-context learning (ICL), and supervised fine-tuning (SFT) with a deterministic verifier. SR pulls in-domain annotated sentences and definitions from ESCO to form format-constrained prompts that stabilize boundaries and handle coordination. SFT aligns output behavior, while the verifier enforces pairing, non-overlap, and BIO legality with minimal retries. On six public span-labeled corpora of job-ad sentences across sectors and languages, SRICL achieves substantial STRICT-F1 improvements over GPT-3.5 prompting baselines and sharply reduces invalid tags and hallucinated spans, enabling dependable sentence-level deployment in low-resource, multi-domain settings.
- Abstract(参考訳): 求人広告からのスパンレベルのスキル抽出は、候補ジョブマッチングと労働市場分析の基盤となっているが、生成可能な大規模言語モデル(LLM)は、特に長い尾の用語とクロスドメインシフトで、しばしば不正なスパン、境界ドリフト、幻覚をもたらす。
本稿では、意味検索(SR)、文脈内学習(ICL)、教師付き微調整(SFT)と決定論的検証を組み合わせたLLM中心のフレームワークであるSRICLを提案する。
SRはドメイン内の注釈付き文と定義をESCOから取り出し、フォーマットに制約のあるプロンプトを形成し、境界を安定させ調整を処理する。
SFTは出力の振舞いを調整し、検証者は最小限の再試行でペアリング、非オーバーラップ、BIOの合法性を強制する。
SRICLは6つのパブリックなスパンラベル付きジョブアド文のコーパスで、GPT-3.5よりも相当なSTRICT-F1の改善を実現し、ベースラインを加速し、無効なタグと幻覚スパンを激減し、低リソースのマルチドメイン設定での文レベルのデプロイを可能にする。
関連論文リスト
- Contrastive Bi-Encoder Models for Multi-Label Skill Extraction: Enhancing ESCO Ontology Matching with BERT and Attention Mechanisms [0.0]
細密労働市場分析は、構造化されていない求人広告をESCOのような標準化されたスキルにマッピングすることにますます依存している。
本稿では,手動でラベル付けされたジョブ・アド・トレーニングデータを必要としないゼロショットスキル抽出フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-14T03:43:45Z) - Connecting the Dots: Training-Free Visual Grounding via Agentic Reasoning [63.109585527799005]
GroundingAgentは、タスク固有の微調整なしで動作するビジュアルグラウンドティングフレームワークである。
広く使用されているベンチマークでは、平均ゼロショットグラウンドの精度は65.1%である。
また、強い解釈可能性を提供し、各推論ステップを透過的に照らす。
論文 参考訳(メタデータ) (2025-11-24T03:11:08Z) - Fine-Tuned Language Models for Domain-Specific Summarization and Tagging [3.543800643014229]
本稿では,ドメイン固有テキスト要約とタグ付けを効率的に行うために,細調整された大言語モデル(LLM)と名前付きエンティティ認識(NER)を統合するパイプラインを提案する。
著者らは、自動化された情報抽出と法執行機関の監視を複雑にする、急速に進化するサブカルチャー言語とスラングによって引き起こされる課題に対処する。
論文 参考訳(メタデータ) (2025-10-29T12:33:48Z) - Context-Alignment: Activating and Enhancing LLM Capabilities in Time Series [3.453940014682793]
本研究では,Large Language Models (LLMs) に習熟した言語環境において,時系列(TS)データを言語成分と整合させるコンテキストアライメントを提案する。
このようなコンテキストレベルのアライメントは、DSCA-GNN(Dual-Scale Context-Alignment GNN)によって達成される構造的アライメントと論理的アライメントを含む。
大規模な実験は、特に少数ショットおよびゼロショット予測において、DeCAの有効性とタスク間のコンテキストアライメントの重要性を示している。
論文 参考訳(メタデータ) (2025-01-07T12:40:35Z) - Refining Translations with LLMs: A Constraint-Aware Iterative Prompting Approach [7.5069214839655345]
大言語モデル(LLM)は機械翻訳(MT)において顕著な熟練性を示している
本稿では,意味的正確性に不可欠なキーワードを優先することで,翻訳忠実度を高める多段階のプロンプトチェーンを提案する。
FLORES-200およびWMTデータセットのベースモデルとしてLlamaとQwenを使用した実験は、ベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-11-13T05:40:24Z) - Self-Augmented In-Context Learning for Unsupervised Word Translation [23.495503962839337]
大規模言語モデル (LLMs) は、強力な単語翻訳やバイリンガル語彙誘導(BLI)機能を示す。
教師なしBLIのための自己拡張型インコンテキスト学習(SAIL)を提案する。
提案手法は,2つの確立したBLIベンチマーク上でのLDMのゼロショットプロンプトよりも大幅に向上することを示す。
論文 参考訳(メタデータ) (2024-02-15T15:43:05Z) - A Multi-level Supervised Contrastive Learning Framework for Low-Resource
Natural Language Inference [54.678516076366506]
自然言語推論(NLI)は、自然言語理解において、ますます重要な課題である。
本稿では,低リソースな自然言語推論のためのマルチSCLという,マルチレベルの教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-31T05:54:18Z) - On Cross-Lingual Retrieval with Multilingual Text Encoders [51.60862829942932]
言語間文書・文検索タスクにおける最先端多言語エンコーダの適合性について検討する。
教師なしのアドホック文と文書レベルのCLIR実験でそれらの性能をベンチマークする。
我々は、ゼロショット言語とドメイン転送CLIR実験のシリーズにおける英語関連データに基づいて、教師付き方式で微調整された多言語エンコーダの評価を行った。
論文 参考訳(メタデータ) (2021-12-21T08:10:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。