論文の概要: The Curious Language Model: Strategic Test-Time Information Acquisition
- arxiv url: http://arxiv.org/abs/2506.09173v1
- Date: Tue, 10 Jun 2025 18:38:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 06:35:01.880685
- Title: The Curious Language Model: Strategic Test-Time Information Acquisition
- Title(参考訳): キュラス言語モデル: 戦略的テスト時間情報獲得
- Authors: Michael Cooper, Rohan Wadhawan, John Michael Giorgi, Chenhao Tan, Davis Liang,
- Abstract要約: CuriosiTreeは、大規模な言語モデルでゼロショット情報を取得するためのテストタイムポリシーである。
それは、各アクションの期待される情報ゲインを推定するために、欲張りのツリーサーチを利用する。
期待される情報ゲインと関連するコストのバランスに基づいて、戦略的に行動を選択する。
- 参考スコア(独自算出の注目度): 21.89068655925705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decision-makers often possess insufficient information to render a confident decision. In these cases, the decision-maker can often undertake actions to acquire the necessary information about the problem at hand, e.g., by consulting knowledgeable authorities or by conducting experiments. Importantly, different levers of information acquisition come with different costs, posing the challenge of selecting the actions that are both informative and cost-effective. In this work, we propose CuriosiTree, a heuristic-based, test-time policy for zero-shot information acquisition in large language models (LLMs). CuriosiTree employs a greedy tree search to estimate the expected information gain of each action and strategically chooses actions based on a balance of anticipated information gain and associated cost. Empirical validation in a clinical diagnosis simulation shows that CuriosiTree enables cost-effective integration of heterogenous sources of information, and outperforms baseline action selection strategies in selecting action sequences that enable accurate diagnosis.
- Abstract(参考訳): 意思決定者は自信のある決定を下すのに不十分な情報を持っていることが多い。
このような場合、意思決定者は、手元にある問題に関する必要な情報、例えば、知識のある当局に相談したり、実験を行うことによって、しばしば行動を取ることができる。
重要なことは、異なる情報取得のレバーは異なるコストを伴い、情報的かつコスト効率のよいアクションを選択することの難しさを浮き彫りにしている。
本研究では,大規模言語モデル(LLM)におけるゼロショット情報取得のためのヒューリスティックなテストタイムポリシーであるCuriosiTreeを提案する。
CuriosiTreeは、期待情報ゲインと関連するコストのバランスに基づいて、各アクションの期待情報ゲインを推定し、戦略的にアクションを選択する。
臨床診断シミュレーションにおける実証的検証は、CuriosiTreeが異種情報ソースのコスト効率の高い統合を可能にし、正確な診断を可能にするアクションシーケンスの選択において、ベースラインのアクション選択戦略を上回っていることを示している。
関連論文リスト
- The Sample Complexity of Online Strategic Decision Making with Information Asymmetry and Knowledge Transportability [93.11220429350278]
情報非対称性はマルチエージェントシステムの普及した特徴である。
本論文は,オンライン学習における基本的課題について考察する。知識伝達を必要とする場合でも,共同設立者について学ぶために,非I.d.アクションを適用できるのか?
本稿では,情報非対称性下でのシステム力学を正確に同定し,強化学習における知識伝達の課題を効果的にナビゲートするために,サンプル効率のよいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-11T17:06:57Z) - Agentic Knowledgeable Self-awareness [79.25908923383776]
KnowSelfはデータ中心のアプローチで、人間のような知識のある自己認識を持つエージェントを応用する。
我々の実験により、KnowSelfは、外部知識を最小限に使用して、様々なタスクやモデルにおいて、様々な強力なベースラインを達成できることが実証された。
論文 参考訳(メタデータ) (2025-04-04T16:03:38Z) - A Survey on Active Feature Acquisition Strategies [3.1542695050861544]
アクティブな特徴取得は、完全なデータ収集のコストを抑えながら正確な予測を行うという課題を研究する。
これらの戦略は、各インスタンスで最も重要な機能のみを選択的に取得することにより、データ収集が高価または時間を要するシナリオにおける効率的な意思決定を可能にする。
論文 参考訳(メタデータ) (2025-02-16T10:19:33Z) - The Value of Information in Human-AI Decision-making [23.353778024330165]
情報の価値を特徴付けるための意思決定理論の枠組みに貢献する。
本稿では、SHAPの説明に適応し、人間の補足情報を強調する新しい説明手法を提案する。
我々は,人間の意思決定を最も補完するAIモデルを特定するために,補完的情報の尺度が利用できることを示した。
論文 参考訳(メタデータ) (2025-02-10T04:50:42Z) - AVIS: Autonomous Visual Information Seeking with Large Language Model
Agent [123.75169211547149]
本稿では,視覚的質問応答フレームワークAVISを提案する。
本手法は,LLM(Large Language Model)を利用して外部ツールの利用を動的に強化する。
AVIS は Infoseek や OK-VQA などの知識集約型視覚質問応答ベンチマークの最先端結果を達成する。
論文 参考訳(メタデータ) (2023-06-13T20:50:22Z) - Estimating Conditional Mutual Information for Dynamic Feature Selection [14.706269510726356]
動的な特徴選択は、機能獲得コストを削減し、モデルの予測に透明性を提供する、有望なパラダイムである。
ここでは、情報理論の観点から、応答変数との相互情報に基づいて特徴を優先順位付けする。
提案手法は, 様々なデータセットにわたる最近の手法に対して一貫した利得を提供する。
論文 参考訳(メタデータ) (2023-06-05T23:03:03Z) - The Value of Information When Deciding What to Learn [21.945359614094503]
本研究は情報指向サンプリングの設計原理に基づく(Russo & Van Roy, 2014)。
我々は,学習内容を決定する際の情報の価値を確認する実証的な結果に目を向ける前に,学習目標に関する文献からの新たな知見を提示する。
論文 参考訳(メタデータ) (2021-10-26T19:23:12Z) - Reinforcement Learning with Efficient Active Feature Acquisition [59.91808801541007]
実生活では、情報取得は患者の医療検査に該当する可能性がある。
本稿では,アクティブな特徴獲得ポリシーを学習するモデルに基づく強化学習フレームワークを提案する。
この成功の鍵は、部分的に観察された状態から高品質な表現を学ぶ新しい逐次変分自動エンコーダである。
論文 参考訳(メタデータ) (2020-11-02T08:46:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。