論文の概要: CONDESION-BENCH: Conditional Decision-Making of Large Language Models in Compositional Action Space
- arxiv url: http://arxiv.org/abs/2604.09029v1
- Date: Fri, 10 Apr 2026 06:47:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.730499
- Title: CONDESION-BENCH: Conditional Decision-Making of Large Language Models in Compositional Action Space
- Title(参考訳): ConDESION-BENCH: 構成行動空間における大規模言語モデルの条件決定-
- Authors: Yeonjun Hwang, Sungyong Park, Minju Kim, Dongha Lee, Jinyoung Yeo,
- Abstract要約: コンディション・ベンチ(ConDESION-BENCH)は、コンストラクショナル・アクション空間における条件決定を評価するためのベンチマークである。
オラクルに基づく評価を用いて,意思決定支援ツールとして大規模言語モデルの厳密な評価を行う。
- 参考スコア(独自算出の注目度): 25.384914281879702
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large language models have been widely explored as decision-support tools in high-stakes domains due to their contextual understanding and reasoning capabilities. However, existing decision-making benchmarks rely on two simplifying assumptions: actions are selected from a finite set of pre-defined candidates, and explicit conditions restricting action feasibility are not incorporated into the decision-making process. These assumptions fail to capture the compositional structure of real-world actions and the explicit conditions that constrain their validity. To address these limitations, we introduce CONDESION-BENCH, a benchmark designed to evaluate conditional decision-making in compositional action space. In CONDESION-BENCH, actions are defined as allocations to decision variables and are restricted by explicit conditions at the variable, contextual, and allocation levels. By employing oracle-based evaluation of both decision quality and condition adherence, we provide a more rigorous assessment of LLMs as decision-support tools.
- Abstract(参考訳): 大規模言語モデルは、文脈的理解と推論能力のため、ハイテイク領域における意思決定支援ツールとして広く研究されている。
しかし、既存の意思決定ベンチマークは2つの単純化された仮定に依存している: アクションは事前定義された候補の有限セットから選択され、アクションの実現性を制限する明示的な条件は意思決定プロセスに組み込まれない。
これらの仮定は実世界の行動の構成構造とそれらの妥当性を制約する明示的な条件を捉えるのに失敗する。
これらの制約に対処するために,コンディション・ベンチ(ConDESION-BENCH)という,コンストラクショナルアクション空間における条件決定性を評価するためのベンチマークを導入する。
CONDESION-BENCHでは、アクションは決定変数へのアロケーションとして定義され、変数、コンテキスト、アロケーションレベルの明示的な条件によって制限される。
オラクルによる意思決定品質評価と条件適合性の評価を併用することにより,LLMを意思決定支援ツールとしてより厳密な評価を行う。
関連論文リスト
- Argumentation for Explainable and Globally Contestable Decision Support with LLMs [16.75184263883707]
ArgEvalは、インスタンス固有の推論から一般的な決定オプションの構造化評価に移行するフレームワークである。
これらのフレームワークは、グローバルな競争性をサポートしながら、特定のケースについて説明可能なレコメンデーションを提供する。
本稿では,ArgEvalが臨床実践に合わせて説明可能なガイダンスを作成できることを示す。
論文 参考訳(メタデータ) (2026-03-15T22:37:14Z) - Axiomatic Choice and the Decision-Evaluation Paradox [4.896826879445548]
倫理的制約などの決定に関する言明である公理を用いて意思決定をモデル化する枠組みを導入する。
我々は,その構造的特性に基づいて決定公理の分類を定義し,決定を行うための公理の使用と,決定を評価するための公理の使用との間に緊張関係を示す。
論文 参考訳(メタデータ) (2025-09-26T03:50:55Z) - DecisionFlow: Advancing Large Language Model as Principled Decision Maker [49.088778182807395]
DecisionFlowは、モデルにアクション、属性、制約の構造化された表現を推論するように誘導する、新しい決定モデリングフレームワークである。
プロンプトから直接回答を予測するのではなく、DecisionFlowは意味論的に根拠のある決定空間を構築し、潜在ユーティリティ関数を推論する。
実験の結果,DecisionFlowの精度は,強いプロンプトベースラインよりも最大30%向上した。
論文 参考訳(メタデータ) (2025-05-27T16:23:53Z) - Retrieval Augmented Decision-Making: A Requirements-Driven, Multi-Criteria Framework for Structured Decision Support [8.585671505840637]
本稿では,LLMのセマンティック理解機能とマルチクリトリア意思決定を統合したRAD手法を提案する。
本手法は,産業文書から重要な基準を自動的に抽出し,重み付けされた階層的決定モデルを構築し,モデルガイダンスに基づいて構造化されたレポートを生成する。
様々な意思決定タスクにおいて、RADによって生成された決定報告は、詳細、合理性、構造の観点から、既存の手法よりも著しく優れていた。
論文 参考訳(メタデータ) (2025-05-24T03:13:29Z) - Decision Making in Changing Environments: Robustness, Query-Based Learning, and Differential Privacy [59.64384863882473]
本研究では,環境が時間とともに変化する対話的意思決定の課題について考察する。
意思決定の複雑さと敵意的な設定の複雑さを提供するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-24T21:31:50Z) - Embodied Agent Interface: Benchmarking LLMs for Embodied Decision Making [85.24399869971236]
我々は,大規模言語モデル(LLM)を具体的意思決定のために評価することを目指している。
既存の評価は最終的な成功率にのみ依存する傾向がある。
本稿では,様々なタスクの形式化を支援する汎用インタフェース (Embodied Agent Interface) を提案する。
論文 参考訳(メタデータ) (2024-10-09T17:59:00Z) - Explainable Decision Making with Lean and Argumentative Explanations [11.644036228274176]
ここでは、"よい"決定は、"最も"目標を満たす代替案と、(ii)"最も望ましい"目標を満たす選択肢に相当します。
次に、各変種と「良さ」の概念について、2つの形式で説明し、異なるニーズと能力を持つ観客に対する選択肢の選択を正当化する。
論文 参考訳(メタデータ) (2022-01-18T01:29:02Z) - Inverse Active Sensing: Modeling and Understanding Timely
Decision-Making [111.07204912245841]
我々は,内因性,文脈依存型時間圧下でのエビデンスに基づく意思決定の一般的な設定のための枠組みを開発する。
意思決定戦略において、サプライズ、サスペンス、最適性の直感的な概念をモデル化する方法を実証する。
論文 参考訳(メタデータ) (2020-06-25T02:30:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。