論文の概要: AutoScreen-FW: An LLM-based Framework for Resume Screening
- arxiv url: http://arxiv.org/abs/2603.18390v1
- Date: Thu, 19 Mar 2026 01:20:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:05.900185
- Title: AutoScreen-FW: An LLM-based Framework for Resume Screening
- Title(参考訳): AutoScreen-FW: 再試行のためのLLMベースのフレームワーク
- Authors: Zhelin Xu, Shuhei Yamamoto, Atsuyuki Morishima,
- Abstract要約: AutoScreen-FWはLLMベースのローカルで、自動的にスクリーニングフレームワークを再開する。
いくつかのメソッドを使用して、少数の代表履歴サンプルを選択する。
実験により、オープンソースのLCM判事は一貫してGPT-5-nanoを上回っていることが示された。
- 参考スコア(独自算出の注目度): 0.0943973653350757
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Corporate recruiters often need to screen many resumes within a limited time, which increases their burden and may cause suitable candidates to be overlooked. To address these challenges, prior work has explored LLM-based automated resume screening. However, some methods rely on commercial LLMs, which may pose data privacy risks. Moreover, since companies typically do not make resumes with evaluation results publicly available, it remains unclear which resume samples should be used during learning to improve an LLM's judgment performance. To address these problems, we propose AutoScreen-FW, an LLM-based locally and automatically resume screening framework. AutoScreen-FW uses several methods to select a small set of representative resume samples. These samples are used for in-context learning together with a persona description and evaluation criteria, enabling open-source LLMs to act as a career advisor and evaluate unseen resumes. Experiments with multiple ground truths show that the open-source LLM judges consistently outperform GPT-5-nano. Under one ground truth setting, it also surpass GPT-5-mini. Although it is slightly weaker than GPT-5-mini under other ground-truth settings, it runs substantially faster per resume than commercial GPT models. These findings indicate the potential for deploying AutoScreen-FW locally in companies to support efficient screening while reducing recruiters' burden.
- Abstract(参考訳): 企業採用者は、しばしば限られた時間内に多くの履歴書を検査する必要があるため、その負担が増大し、適切な候補者を見落としてしまう可能性がある。
これらの課題に対処するため、従来の研究はLLMベースの自動再実行スクリーニングを探索してきた。
しかし、いくつかの手法は商用のLCMに依存しており、データプライバシーのリスクを引き起こす可能性がある。
また、一般に企業は評価結果を公開していないため、LLMの判定性能を向上させるために学習中にどの履歴書を使うべきかは定かではない。
これらの問題に対処するため、LLMベースのローカルで自動的にスクリーニングフレームワークを再開するAutoScreen-FWを提案する。
AutoScreen-FWは、いくつかのメソッドを使用して、少数の代表履歴サンプルを選択する。
これらのサンプルは、ペルソナ記述と評価基準とともにコンテキスト内学習に使用され、オープンソースのLCMがキャリアアドバイザとして機能し、目に見えない履歴書を評価することができる。
実験では、オープンソースのLLM判事がGPT-5-nanoを一貫して上回っていることが示されている。
1つの前提条件の下では、GPT-5-miniを超越する。
GPT-5-mini より若干弱いが、商業用 GPT モデルより大幅に高速である。
これらの結果から,AutoScreen-FWを社内に展開して効率的なスクリーニングを支援するとともに,採用者の負担を軽減できる可能性が示唆された。
関連論文リスト
- Measuring Validity in LLM-based Resume Screening [45.886624898999145]
我々は、特定のジョブに適した履歴書の大規模なデータセットを構築し、それは、既知の優越性の基底真理と直接的に同等である。
次に、構築したデータセットを用いて、様々なLCMによるランキング決定の有効性を測定する。
等級の候補をランク付けする際、モデルが確実に棄権せず、異なる割合で異なる人口集団の候補者を選択することが判明した。
論文 参考訳(メタデータ) (2026-02-20T18:57:52Z) - Re-Ranking Step by Step: Investigating Pre-Filtering for Re-Ranking with Large Language Models [5.0490573482829335]
大規模言語モデル(LLM)は、さまざまなゼロショット機能を備えた多種多様な自然言語処理タスクに革命をもたらしている。
本稿では、情報検索(IR)における通過前の事前フィルタリングステップの使用について検討する。
実験の結果, この事前フィルタリングにより, LLMは再ランクタスクにおいて, 性能が大幅に向上することがわかった。
論文 参考訳(メタデータ) (2024-06-26T20:12:24Z) - Auto-Arena: Automating LLM Evaluations with Agent Peer Battles and Committee Discussions [77.66677127535222]
Auto-ArenaはLLMエージェントを使用した評価プロセス全体を自動化した革新的なフレームワークである。
我々の実験では、Auto-Arenaは92.14%の相関関係を示し、以前の専門家が注釈付けしたベンチマークをすべて上回っている。
論文 参考訳(メタデータ) (2024-05-30T17:19:19Z) - Application of LLM Agents in Recruitment: A Novel Framework for Resume Screening [0.0]
本稿では,新しいLarge Language Models (LLM) ベースのエージェントフレームワークについて紹介する。
我々のフレームワークは、大規模なデータセットから各履歴を効率的に要約し、評価する能力において、異なる。
その結果,自動再試行フレームワークは従来の手作業よりも11倍高速であることがわかった。
論文 参考訳(メタデータ) (2024-01-16T12:30:56Z) - Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking Agents [53.78782375511531]
大規模言語モデル(LLM)は、様々な言語関連タスクにまたがる顕著なゼロショットの一般化を実証している。
本稿では、情報検索(IR)における関連性ランキングのためのジェネレーティブLLMについて検討する。
LLMのデータ汚染に関する懸念に対処するため,我々はNovereEvalという新しいテストセットを収集した。
実世界のアプリケーションの効率を向上させるため、ChatGPTのランキング能力を小さな特殊モデルに蒸留する可能性を探る。
論文 参考訳(メタデータ) (2023-04-19T10:16:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。