論文の概要: Enhancing Language Model Rationality with Bi-Directional Deliberation Reasoning
- arxiv url: http://arxiv.org/abs/2407.06112v1
- Date: Mon, 8 Jul 2024 16:48:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-09 14:40:07.195715
- Title: Enhancing Language Model Rationality with Bi-Directional Deliberation Reasoning
- Title(参考訳): 双方向熟考推論による言語モデルリボナリティの強化
- Authors: Yadong Zhang, Shaoguang Mao, Wenshan Wu, Yan Xia, Tao Ge, Man Lan, Furu Wei,
- Abstract要約: 本稿では,BI-Directional Deliberation Reasoning (BIDDER)を導入し,言語モデルの意思決定合理性を高める。
私たちのアプローチには3つの重要なプロセスがあります。
歴史的データから、意思決定過程における不確実な情報を表すために隠された国家を推定すること。
隠れた状態を使って将来の潜在的な状態と潜在的な結果を予測する。
歴史的情報(過去コンテキスト)と長期的結果(未来コンテキスト)を統合することで、推論を知らせる。
- 参考スコア(独自算出の注目度): 73.77288647011295
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces BI-Directional DEliberation Reasoning (BIDDER), a novel reasoning approach to enhance the decision rationality of language models. Traditional reasoning methods typically rely on historical information and employ uni-directional (left-to-right) reasoning strategy. This lack of bi-directional deliberation reasoning results in limited awareness of potential future outcomes and insufficient integration of historical context, leading to suboptimal decisions. BIDDER addresses this gap by incorporating principles of rational decision-making, specifically managing uncertainty and predicting expected utility. Our approach involves three key processes: Inferring hidden states to represent uncertain information in the decision-making process from historical data; Using these hidden states to predict future potential states and potential outcomes; Integrating historical information (past contexts) and long-term outcomes (future contexts) to inform reasoning. By leveraging bi-directional reasoning, BIDDER ensures thorough exploration of both past and future contexts, leading to more informed and rational decisions. We tested BIDDER's effectiveness in two well-defined scenarios: Poker (Limit Texas Hold'em) and Negotiation. Our experiments demonstrate that BIDDER significantly improves the decision-making capabilities of LLMs and LLM agents.
- Abstract(参考訳): 本稿では BI-Directional Deliberation Reasoning (BIDDER) を紹介する。
伝統的な推論手法は、典型的には歴史的情報に依存し、一方向(左右)の推論戦略を採用する。
この双方向の議論の推論の欠如は、潜在的な将来の成果に対する認識が限定され、歴史的文脈の不十分な統合をもたらし、最適以下の決定へと繋がる。
BIDDERはこのギャップに対処するため、合理的な意思決定の原則を取り入れ、特に不確実性を管理し、期待されるユーティリティを予測する。
我々のアプローチは3つの主要なプロセスを含む: 歴史的データから意思決定過程における不確実な情報を表すために隠蔽状態を推論すること; これらの隠蔽状態を使用して将来の潜在的な状態と潜在的な結果を予測すること; 歴史的情報(過去状況)と長期的結果(未来状況)を統合すること。
双方向推論を活用することで、BIDDERは過去と将来の両方の文脈を徹底的に探索し、より情報と合理的な決定につながる。
我々はBIDDERの有効性を、Poker(Limit Texas Hold'em)とNegotiation(Negotiation)の2つの明確に定義されたシナリオで検証した。
実験の結果,BIDDER は LLM および LLM エージェントの意思決定能力を大幅に向上することが示された。
関連論文リスト
- Making Large Language Models Better Planners with Reasoning-Decision Alignment [70.5381163219608]
マルチモーダリティ強化LLMに基づくエンドツーエンド意思決定モデルを提案する。
ペア化されたCoTと計画結果との推論・決定アライメントの制約を提案する。
提案する大規模言語プランナをRDA-Driverとして推論・決定アライメントする。
論文 参考訳(メタデータ) (2024-08-25T16:43:47Z) - PresAIse, A Prescriptive AI Solution for Enterprises [6.523929486550928]
本稿は、IBM Researchのイニシアチブの概要であり、一連の規範的AIソリューションを提供することによって、これらの課題のいくつかに対処することを目的としている。
ソリューションスイートには、スケーラブルな因果推論方法、解釈可能な意思決定アプローチ、大規模言語モデルの統合が含まれている。
概念実証であるPresAIseは、非MLの専門家が自然言語インターフェースを介して規範的なAIモデルと対話できるようにすることで、ソリューションの可能性を示している。
論文 参考訳(メタデータ) (2024-02-03T03:23:08Z) - DetermLR: Augmenting LLM-based Logical Reasoning from Indeterminacy to Determinacy [76.58614128865652]
非決定性から決定性への進化として推論過程を再考する新しい視点であるDetermLRを提案する。
まず、既知の条件を次の2つのタイプに分類する: 決定的および不決定的前提 これは、推論プロセスのオール方向を提供し、不決定的データを段階的決定的洞察に変換する際のLCMを導く。
我々は、利用可能な施設の保存と抽出、推論メモリによる推論パスの自動化、そしてその後の推論ステップに関する歴史的推論の詳細を保存する。
論文 参考訳(メタデータ) (2023-10-28T10:05:51Z) - From Heuristic to Analytic: Cognitively Motivated Strategies for
Coherent Physical Commonsense Reasoning [66.98861219674039]
ヒューリスティック分析推論(HAR)戦略は、モデル決定のための合理化のコヒーレンスを大幅に改善する。
以上の結果から, PLM推論の一貫性と信頼性を効果的に向上できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-10-24T19:46:04Z) - Bridging the Gap between Decision and Logits in Decision-based Knowledge
Distillation for Pre-trained Language Models [16.115386424278213]
決定分布からロジットを推定する新しい手法を提案する。
本手法は,自然言語理解と機械読解データセットの両面において,強いベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2023-06-15T07:23:44Z) - Explainability's Gain is Optimality's Loss? -- How Explanations Bias
Decision-making [0.0]
説明は、アルゴリズムと人間の意思決定者とのコミュニケーションを促進するのに役立つ。
因果モデルに関する特徴に基づく説明のセマンティクスは、意思決定者の以前の信念から漏れを引き起こす。
このような違いは、準最適かつ偏った決定結果をもたらす可能性がある。
論文 参考訳(メタデータ) (2022-06-17T11:43:42Z) - AR-LSAT: Investigating Analytical Reasoning of Text [57.1542673852013]
テキストの分析的推論の課題を研究し、1991年から2016年までのロースクール入学試験からの質問からなる新しいデータセットを紹介します。
我々は,この課題をうまくこなすために必要な知識理解と推論能力を分析する。
論文 参考訳(メタデータ) (2021-04-14T02:53:32Z) - On a notion of independence proposed by Teddy Seidenfeld [2.5585152083052574]
Teddy Seidenfeldは長い間、バイナリモデルは不正確な不確定性の重要な側面に対処するのに十分強力ではないと主張してきました。
私たちはこのアプローチを使用して、無関係(と独立)の興味深い概念を探求します。
このような無関係あるいは独立性の評価を行うことの結果は、非常に強いものであることを示す。
論文 参考訳(メタデータ) (2021-02-20T13:15:28Z) - Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。
本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。
本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文 参考訳(メタデータ) (2021-01-24T05:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。