論文の概要: DeLLMa: A Framework for Decision Making Under Uncertainty with Large
Language Models
- arxiv url: http://arxiv.org/abs/2402.02392v1
- Date: Sun, 4 Feb 2024 08:11:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 20:02:17.438092
- Title: DeLLMa: A Framework for Decision Making Under Uncertainty with Large
Language Models
- Title(参考訳): DeLLMa: 大規模言語モデルで不確実性の下で意思決定を行うフレームワーク
- Authors: Ollie Liu, Deqing Fu, Dani Yogatama, Willie Neiswanger
- Abstract要約: 大規模言語モデル(LLM)は、ビジネス、エンジニアリング、医療といった分野を含む、社会全体でますます使われている。
本研究では,不確実な環境における意思決定精度を高めるためのフレームワークであるDeLLMaを提案する。
以上の結果から,DeLLMaはLLM判定性能を大幅に向上し,競合手法よりも40%の精度向上が達成できることがわかった。
- 参考スコア(独自算出の注目度): 34.71443803031482
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) are increasingly used across society, including
in domains like business, engineering, and medicine. These fields often grapple
with decision-making under uncertainty, a critical yet challenging task. In
this paper, we show that directly prompting LLMs on these types of
decision-making problems yields poor results, especially as the problem
complexity increases. To overcome this limitation, we propose DeLLMa
(Decision-making Large Language Model assistant), a framework designed to
enhance decision-making accuracy in uncertain environments. DeLLMa involves a
multi-step scaffolding procedure, drawing upon principles from decision theory
and utility theory, to provide an optimal and human-auditable decision-making
process. We validate our framework on decision-making environments involving
real agriculture and finance data. Our results show that DeLLMa can
significantly improve LLM decision-making performance, achieving up to a 40%
increase in accuracy over competing methods.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ビジネス、エンジニアリング、医療といった分野を含む、社会全体でますます使われている。
これらの分野は不確実性の下で意思決定に苦しむことが多い。
本稿では,このような意思決定問題に対して LLM を直接的に促すと,特に問題複雑性が増大するにつれて,結果が低下することを示す。
この制限を克服するために,不確実な環境での意思決定精度を高めるためのフレームワークであるDeLLMa(Decision-making Large Language Model Assistant)を提案する。
DeLLMaは、決定理論とユーティリティ理論の原理に基づいて多段階の足場作成手順を伴い、最適かつ人間に理解可能な意思決定プロセスを提供する。
実際の農業と財務データを含む意思決定環境に関する枠組みを検証する。
以上の結果から,DeLLMaはLLM判定性能を大幅に向上し,競合手法よりも40%の精度向上が達成できることがわかった。
関連論文リスト
- Determinants of LLM-assisted Decision-Making [0.0]
大規模言語モデル(LLM)は、人間の意思決定プロセスを強化するための多面的サポートを提供する。
本研究は,LCM支援による意思決定に影響を及ぼす決定因子の構造的概要と詳細な分析を提供する。
我々の発見は、人間とAIのコラボレーションにおける意思決定の質向上に不可欠であると見なすことができる。
論文 参考訳(メタデータ) (2024-02-27T10:24:50Z) - From Large Language Models and Optimization to Decision Optimization
CoPilot: A Research Manifesto [2.4981381729038743]
我々は,大規模言語モデルと最適化の交点において,決定最適化CoPilot(DOCP)を作成するための研究を提案する。
DOCPは意思決定者を支援するために設計されたAIツールで、自然言語で対話してビジネスの問題を把握し、その後、対応する最適化モデルを定式化し、解決する。
a) LLMは、既にDOCPに関連する実質的な新しい能力を提供しており、b.主要な研究課題に対処する必要がある。
論文 参考訳(メタデータ) (2024-02-26T03:10:11Z) - K-Level Reasoning with Large Language Models [80.13817747270029]
急速に発展する環境における意思決定のための大規模言語モデル(LLM)の動的推論機能について検討する。
実世界の動的意思決定の複雑さを反映した2つのゲーム理論に基づくパイロットチャレンジを導入する。
これらの課題は明確に定義されており、LLMの動的推論能力の明確で制御可能で正確な評価を可能にする。
論文 参考訳(メタデータ) (2024-02-02T16:07:05Z) - On Leveraging Large Language Models for Enhancing Entity Resolution [11.668263762236343]
本稿では,大規模言語モデル(LLM)を実体分解プロセスで効率的に活用するための戦略を紹介する。
当社のアプローチは、予算に制限された消費を維持しながら、最も効果的なマッチング質問を最適に選択します。
エントロピーを指標として提案手法の有効性を評価し,提案手法の有効性と有効性について実験的に検証した。
論文 参考訳(メタデータ) (2024-01-07T09:06:58Z) - Bridging the Gap: Towards an Expanded Toolkit for ML-Supported Decision-Making in the Public Sector [6.693502127460251]
我々は,MLモデルの要件と公共セクターの意思決定のギャップを埋めることを目的として,主要な技術的課題の包括的概要を提示する。
我々は、モデルと運用環境を接続するMLパイプラインの要点に集中する。
これらの課題は、因果ML、ドメイン適応、不確実性定量化、多目的最適化を含む、新たな方法論の進歩と結びついている。
論文 参考訳(メタデータ) (2023-10-29T17:44:48Z) - LanguageMPC: Large Language Models as Decision Makers for Autonomous
Driving [87.1164964709168]
この作業では、複雑な自律運転シナリオの意思決定コンポーネントとして、Large Language Models(LLM)を採用している。
大規模実験により,提案手法は単車載タスクのベースラインアプローチを一貫して超えるだけでなく,複数車載コーディネートにおいても複雑な運転動作の処理にも有効であることが示された。
論文 参考訳(メタデータ) (2023-10-04T17:59:49Z) - Rational Decision-Making Agent with Internalized Utility Judgment [91.80700126895927]
大規模言語モデル(LLM)は目覚ましい進歩を示し、従来のNLPアプリケーションを超えて複雑な多段階決定タスクを実行できるエージェントにLLMを開発するための重要な努力を惹きつけている。
本稿では,RadAgentを提案する。このRadAgentは,経験探索とユーティリティ学習を含む反復的なフレームワークを通じて,合理性の発展を促進する。
ToolBenchデータセットの実験結果は、RadAgentがベースラインよりも優れていることを示している。
論文 参考訳(メタデータ) (2023-08-24T03:11:45Z) - Causal Fairness Analysis [68.12191782657437]
意思決定設定における公平性の問題を理解し、モデル化し、潜在的に解決するためのフレームワークを導入します。
我々のアプローチの主な洞察は、観測データに存在する格差の定量化と、基礎となる、しばしば観測されていない、因果的なメカニズムの収集を結びつけることである。
本研究は,文献中の異なる基準間の関係を整理し,説明するための最初の体系的試みであるフェアネスマップにおいて,本研究の成果を左右するものである。
論文 参考訳(メタデータ) (2022-07-23T01:06:34Z) - Learning What to Defer for Maximum Independent Sets [84.00112106334655]
本稿では,各段階における解の要素的決定を学習することにより,エージェントが適応的に段階数を縮小あるいは拡張する,新たなDRL方式を提案する。
提案手法を最大独立集合(MIS)問題に適用し、現状のDRL方式よりも大幅に改善したことを示す。
論文 参考訳(メタデータ) (2020-06-17T02:19:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。