論文の概要: Zero-Shot Active Feature Acquisition via LLM-Elicitation
- arxiv url: http://arxiv.org/abs/2606.18933v2
- Date: Thu, 18 Jun 2026 07:16:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 13:55:51.813838
- Title: Zero-Shot Active Feature Acquisition via LLM-Elicitation
- Title(参考訳): LLM-Elicitationによるゼロショットアクティブな特徴獲得
- Authors: Binyamin Perets, Natalie Mendelson, Shiran Vainberg, Yehuda Chowers, Shai Shen-Orr, Shie Mannor,
- Abstract要約: 大規模言語モデル(LLM)は教師なしのドメイン知識を提供するが、シーケンシャルプランナーは乏しい。
我々は、規律的な勧誘を通じてゼロショットAFAのためのフレームワークを開発する。
フレームワークをバイナリ分類とトップ$kの識別という2つの設定に適用します。
- 参考スコア(独自算出の注目度): 33.792645413345845
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Active feature acquisition (AFA) sequentially selects which features to observe to reach a classification or ranking decision. Its central limitation is reliance on large amount of labeled data to fit probabilistic models guiding acquisition. Large language models (LLMs) supply unsupervised domain knowledge, but are poor sequential planners. Asking one to both know and decide conflates capabilities best kept separate. Here, we develop a framework for zero-shot AFA through disciplined elicitation: asking the LLM only for what it can be trusted to return, the unary deviations and pairwise co-variations that are the sufficient statistics of a Markov random field (MRF). We apply our framework to two settings: binary classification and top-$k$ identification. In practice, the LLM reliably returns only discriminative statistics, what distinguishes the classes rather than each class in isolation, which precludes classical AFA. We apply a maximum-entropy closure that resolves this gauge ambiguity. We evaluate on a cohort of Inflammatory Bowel Disease (IBD) patients, an active clinical setting where diagnostic ambiguity and patient heterogeneity obstruct stable treatment strategies. Our framework outperforms the LLM both on real labels and on its own extracted beliefs. Where it matters most, on the hardest patients, our top-$k$ acquisition policy markedly outperforms all existing methods.
- Abstract(参考訳): アクティブ機能取得(AFA)は、分類またはランキング決定に達するためにどの特徴を観察するかを順次選択する。
その中心的な制限は、取得を導く確率モデルに適合する大量のラベル付きデータに依存することである。
大規模言語モデル(LLM)は教師なしのドメイン知識を提供するが、シーケンシャルプランナーは乏しい。
コンバウンドの機能を知って、その両方に決めるように指示する。
そこで我々は,ゼロショットAFAの枠組みを規律的推論を通じて開発し,LLMに対して,それが返却できる信頼度,一様偏差,およびマルコフ確率場(MRF)の十分な統計量であるペアの共変量のみを問う。
フレームワークをバイナリ分類とトップ$kの識別という2つの設定に適用します。
実際には、LLMは、古典的なAFAを妨げている各クラスよりもクラスを区別する、差別的な統計のみを確実に返します。
このゲージのあいまいさを解消する最大エントロピー閉包を適用する。
Inflammatory Bowel Disease (IBD) 患者のコホートについて検討した。
我々のフレームワークは、実際のラベルと抽出された信念の両方でLLMを上回ります。
最も大切なのは、最も難しい患者に対して、当社のトップ100ドルの買収ポリシーは、既存のすべての方法を大きく上回っていることです。
関連論文リスト
- Can Revealed Preferences Clarify LLM Alignment and Steering? [23.175180848107093]
LLMの観測した選択が最適化するインプリート嗜好を推定するための経験的パイプラインを提案する。
提案手法は,モデルが一貫したゴール指向の振る舞いをするかどうかの厳密な評価を可能にすることを示す。
論文 参考訳(メタデータ) (2026-05-08T23:26:35Z) - Synergizing Discriminative Exemplars and Self-Refined Experience for MLLM-based In-Context Learning in Medical Diagnosis [4.619078510367921]
クリニック・ミメティックは、差別的模範的コアセット選択(DECS)と自己修正経験要約(SRES)を相乗化するために設計された新しいインコンテキスト・ラーニング(ICL)フレームワークである。
DECSは、ノイズデータから識別的視覚コアセットを計算レベルで選択することで、臨床医の「アンカーケース」を参照する能力をシミュレートする。
SRESは、多様なロールアウトを動的テキスト体験銀行に蒸留することにより、臨床診断における認知と反射を模倣する。
論文 参考訳(メタデータ) (2026-03-29T15:29:59Z) - Diagnosing LLM Reranker Behavior Under Fixed Evidence Pools [0.17188280334580197]
ランク付け評価は、上流レトリバーが返却した候補者をリランカがどのように注文するかを調査する。
この設定は、ランキングの動作と検索品質を結合するので、出力の差はランキングのポリシーだけでは対応できない。
複数Newsクラスタを固定エビデンスプールとして使用することで再ランク付けを分離する制御診断手法を提案する。
論文 参考訳(メタデータ) (2026-02-20T21:07:32Z) - Do LLMs Act Like Rational Agents? Measuring Belief Coherence in Probabilistic Decision Making [28.256934953904317]
大規模言語モデル (LLM) がコヒーレントな信念と安定な嗜好を持つ有理的実用性最大化要因であるかどうかを考察する。
我々のアプローチは、報告された確率がいかなる有理エージェントの真の信念と一致しないような偽りの条件を提供する。
論文 参考訳(メタデータ) (2026-02-06T00:50:33Z) - Dependence-Aware Label Aggregation for LLM-as-a-Judge via Ising Models [55.94503936470247]
大規模なAI評価は、審査員を含む、$K$アノテータからのバイナリ判断を集約することにますます依存している。
ほとんどの古典的なメソッドは、アノテータが条件的に独立であると仮定するが、真のラベルは$Yin0,1$であり、この仮定は LLM の審査員によってしばしば違反される。
我々はIsingグラフィカルモデルと潜在因子に基づく依存認識モデルの階層構造を通してラベルアグリゲーションを研究する。
論文 参考訳(メタデータ) (2026-01-29T21:26:50Z) - Counting Clues: A Lightweight Probabilistic Baseline Can Match an LLM [3.599447860592914]
周波数ベース確率ランク装置(FBPR)について紹介する。
FBPRは、大規模なコーパスによる概念診断の共起統計よりもスムーズなネイブベイズでオプションをスコア付けする。
歴史的に根ざした低複雑さのエキスパートシステムに類似したアプローチが、依然としてベンチマーク性能のかなりの部分を占めていることを示す。
論文 参考訳(メタデータ) (2025-12-14T23:00:10Z) - Ranked from Within: Ranking Large Multimodal Models Without Labels [73.96543593298426]
ソフトマックス分布から導かれる不確実性スコアは,様々なタスクにまたがるランキングモデルに対して,ロバストな基礎となることを示す。
これにより、ラベルのないデータに対するLMMのランク付けが容易になり、手動のアノテーションを必要とせずに、多様なターゲットドメインのモデルを選択するための実践的なアプローチを提供する。
論文 参考訳(メタデータ) (2024-12-09T13:05:43Z) - Cycles of Thought: Measuring LLM Confidence through Stable Explanations [53.15438489398938]
大規模言語モデル(LLM)は、様々なベンチマークで人間レベルの精度に到達し、さらに超えることができるが、不正確な応答における過度な自信は、依然として十分に文書化された障害モードである。
本稿では,LLMの不確実性を測定するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-05T16:35:30Z) - Preference Fine-Tuning of LLMs Should Leverage Suboptimal, On-Policy Data [102.16105233826917]
好みラベルからの学習は、微調整された大きな言語モデルにおいて重要な役割を果たす。
好みの微調整には、教師付き学習、オンライン強化学習(RL)、コントラスト学習など、いくつかの異なるアプローチがある。
論文 参考訳(メタデータ) (2024-04-22T17:20:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。