論文の概要: Building AI Agents to Improve Job Referral Requests to Strangers
- arxiv url: http://arxiv.org/abs/2601.10726v1
- Date: Sun, 28 Dec 2025 05:59:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-25 16:54:51.723081
- Title: Building AI Agents to Improve Job Referral Requests to Strangers
- Title(参考訳): ストランガーへの求人要求を改善するAIエージェントの構築
- Authors: Ross Chu, Yuting Huang,
- Abstract要約: 本稿では,求職者の効果的な求職依頼書作成を支援するAIエージェントをオンラインコミュニティで開発する。
基本的なワークフローは、参照要求を書き換える改善エージェントと、リビジョンの品質を測定する評価エージェントで構成される。
- 参考スコア(独自算出の注目度): 0.7891680820824097
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper develops AI agents that help job seekers write effective requests for job referrals in a professional online community. The basic workflow consists of an improver agent that rewrites the referral request and an evaluator agent that measures the quality of revisions using a model trained to predict the probability of receiving referrals from other users. Revisions suggested by the LLM (large language model) increase predicted success rates for weaker requests while reducing them for stronger requests. Enhancing the LLM with Retrieval-Augmented Generation (RAG) prevents edits that worsen stronger requests while it amplifies improvements for weaker requests. Overall, using LLM revisions with RAG increases the predicted success rate for weaker requests by 14\% without degrading performance on stronger requests. Although improvements in model-predicted success do not guarantee more referrals in the real world, they provide low-cost signals for promising features before running higher-stakes experiments on real users.
- Abstract(参考訳): 本稿では,求職者の職業紹介に対する効果的な依頼書作成を支援するAIエージェントを,プロのオンラインコミュニティで開発する。
基本ワークフローは、参照要求を書き換える改善エージェントと、他のユーザからの参照を受信する確率を予測するためにトレーニングされたモデルを使用してリビジョンの品質を測定する評価エージェントとから構成される。
LLM(大規模言語モデル)によって提案されたリビジョンは、より弱い要求に対する成功率を増大させ、より強い要求に対してそれを減らす。
Retrieval-Augmented Generation (RAG) による LLM の強化は、より強いリクエストを悪化させる編集を防止し、弱いリクエストの改善を増幅する。
全体として、RAGを用いたLCMリビジョンを使用することで、より弱い要求に対する予測成功率が14倍に向上する。
モデル予測成功の改善は、現実の世界でより多くの参照を保証するものではないが、実際のユーザに対して高い評価実験を行う前に、有望な機能に対して低コストな信号を提供する。
関連論文リスト
- Explore Data Left Behind in Reinforcement Learning for Reasoning Language Models [61.78513830395669]
RLVR(Reinforcement Learning with Verifiable Rewards)は,大規模言語モデル(LLM)の推論能力向上に有効な手法として登場した。
モデルがより長く、規模が大きくなるにつれて、トレーニングのプロンプトは残余のプロンプトになる。
政策最適化フレームワークにおける探索的残留確率(Explore Residual Prompts in Policy Optimization)を提案する。
論文 参考訳(メタデータ) (2025-11-06T20:40:27Z) - Can Prompt Difficulty be Online Predicted for Accelerating RL Finetuning of Reasoning Models? [65.18157595903124]
本研究では任意のプロンプトの反復的近似評価について検討する。
Model Predictive Prompt Selection (MoPPS)はベイズにおけるリスク予測フレームワークである。
MoPPSは迅速な困難を確実に予測し、ロールアウトを大幅に削減したトレーニングを加速する。
論文 参考訳(メタデータ) (2025-07-07T03:20:52Z) - Lessons from Training Grounded LLMs with Verifiable Rewards [24.35637263339965]
強化学習と内部推論は、大きな言語モデルにおける基盤を強化することができる。
推論強化モデルは命令のみの変種よりも有意に優れていることを示す。
2段階のトレーニングセットアップで、まずは回答と引用の動作を最適化し、次に拒否し、グラウンド化をさらに改善する。
論文 参考訳(メタデータ) (2025-06-18T14:58:13Z) - Intra-Trajectory Consistency for Reward Modeling [67.84522106537274]
軌道内整合性正則化を開発し、より高い次トーケン生成確率を持つプロセスがより一貫した報酬を維持することを強制する。
提案した正規化でトレーニングした報酬モデルにより、より優れたDPO整合ポリシーが導出され、より優れたベスト・オブ・N(BON)検証結果が得られることを示す。
論文 参考訳(メタデータ) (2025-06-10T12:59:14Z) - The Real Barrier to LLM Agent Usability is Agentic ROI [110.31127571114635]
大規模言語モデル(LLM)エージェントは、人間とAIの相互作用において有望な変化を示す。
我々は、需要の高いマスマーケットアプリケーションにおいて、重要なユーザビリティギャップを強調します。
論文 参考訳(メタデータ) (2025-05-23T11:40:58Z) - LLM Agents Improve Semantic Code Search [6.047454623201181]
本稿では、ユーザプロンプトに情報を注入する検索拡張型エージェントのアプローチを提案する。
RAGを利用することで、エージェントはGitHubリポジトリから関連する詳細でユーザクエリを強化し、より情報的でコンテキスト整合性を高めます。
CodeSearchNetデータセットの実験結果は、RepoRiftが既存のメソッドを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2024-08-05T00:43:56Z) - RaFe: Ranking Feedback Improves Query Rewriting for RAG [83.24385658573198]
アノテーションを使わずにクエリ書き換えモデルをトレーニングするためのフレームワークを提案する。
公開されているリランカを活用することで、フィードバックはリライトの目的とよく一致します。
論文 参考訳(メタデータ) (2024-05-23T11:00:19Z) - Pattern-aware Data Augmentation for Query Rewriting in Voice Assistant
Systems [10.332550622090718]
既存のトレーニングペアからパターンを学習し、ラベルの書き換えから書き換え候補を逆に生成し、不十分なQRトレーニングデータを補う拡張フレームワークを提案する。
実験の結果,QRベースラインを十分に訓練し,低リソース領域やローカライズ領域でのQR性能向上に有効である可能性が示された。
論文 参考訳(メタデータ) (2020-12-21T16:36:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。