論文の概要: ValuePilot: A Two-Phase Framework for Value-Driven Decision-Making
- arxiv url: http://arxiv.org/abs/2503.04569v1
- Date: Thu, 06 Mar 2025 16:02:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 15:59:52.174214
- Title: ValuePilot: A Two-Phase Framework for Value-Driven Decision-Making
- Title(参考訳): ValuePilot: 価値駆動意思決定のための2相フレームワーク
- Authors: Yitong Luo, Hou Hei Lam, Ziang Chen, Zhenliang Zhang, Xue Feng,
- Abstract要約: 本稿では、データセット生成ツールキットDGTと、生成されたデータに基づいて訓練された意思決定モジュールDMMからなる2相値駆動意思決定フレームワークを提案する。
DGTは、データセットの有効性を保証するために、自動フィルタリング技術と人間のキュレーションを使用して、価値次元に基づいてシナリオを生成し、現実世界のタスクを密にミラーリングすることができる。
生成されたデータセットでは、シナリオ固有の値を認識し、アクションの実現可能性を計算し、複数の値次元間のトレードオフをナビゲートして、パーソナライズされた決定を行う。
- 参考スコア(独自算出の注目度): 4.392948275297139
- License:
- Abstract: Despite recent advances in artificial intelligence (AI), it poses challenges to ensure personalized decision-making in tasks that are not considered in training datasets. To address this issue, we propose ValuePilot, a two-phase value-driven decision-making framework comprising a dataset generation toolkit DGT and a decision-making module DMM trained on the generated data. DGT is capable of generating scenarios based on value dimensions and closely mirroring real-world tasks, with automated filtering techniques and human curation to ensure the validity of the dataset. In the generated dataset, DMM learns to recognize the inherent values of scenarios, computes action feasibility and navigates the trade-offs between multiple value dimensions to make personalized decisions. Extensive experiments demonstrate that, given human value preferences, our DMM most closely aligns with human decisions, outperforming Claude-3.5-Sonnet, Gemini-2-flash, Llama-3.1-405b and GPT-4o. This research is a preliminary exploration of value-driven decision-making. We hope it will stimulate interest in value-driven decision-making and personalized decision-making within the community.
- Abstract(参考訳): 人工知能(AI)の最近の進歩にもかかわらず、データセットのトレーニングでは考慮されていないタスクにおいて、パーソナライズされた意思決定を保証することが課題となっている。
本稿では、データセット生成ツールキットDGTと、生成されたデータに基づいてトレーニングされた意思決定モジュールDMMからなる2段階の値駆動意思決定フレームワークであるValuePilotを提案する。
DGTは、データセットの有効性を保証するために、自動フィルタリング技術と人間のキュレーションを使用して、価値次元に基づいてシナリオを生成し、現実世界のタスクを密にミラーリングすることができる。
生成されたデータセットでは、シナリオ固有の値を認識し、アクションの実現可能性を計算し、複数の値次元間のトレードオフをナビゲートして、パーソナライズされた決定を行う。
我々のDMMは人的価値の選好から、Claude-3.5-Sonnet、Gemini-2-flash、Llama-3.1-405b、GPT-4oよりも優れています。
この研究は価値駆動意思決定の予備的な調査である。
コミュニティ内の価値駆動型意思決定とパーソナライズされた意思決定への関心を刺激することを期待しています。
関連論文リスト
- Towards Cost Sensitive Decision Making [14.279123976398926]
本研究では,環境から機能を積極的に獲得し,意思決定の質と確実性を向上するRLモデルを考察する。
本稿では,Active-Acquisition POMDPを提案する。
積極的に獲得された部分観測環境においてエージェントを支援するとともに,探索・探索ジレンマを軽減するため,モデルベースアプローチを開発した。
論文 参考訳(メタデータ) (2024-10-04T19:48:23Z) - Making Large Language Models Better Planners with Reasoning-Decision Alignment [70.5381163219608]
マルチモーダリティ強化LLMに基づくエンドツーエンド意思決定モデルを提案する。
ペア化されたCoTと計画結果との推論・決定アライメントの制約を提案する。
提案する大規模言語プランナをRDA-Driverとして推論・決定アライメントする。
論文 参考訳(メタデータ) (2024-08-25T16:43:47Z) - Language Models are Alignable Decision-Makers: Dataset and Application to the Medical Triage Domain [3.519511988273693]
我々は,一組の意思決定属性(DMA)をラベル付けした医療トリアージ意思決定のための新しいデータセットを提案する。
このデータセットは62のシナリオで構成され、公正性や道徳的砂漠といった倫理的原則を含む6つの異なるDMAをカバーする。
本稿では、これらのDMAを活用して、ヒューマンアラインな意思決定のための新しいソフトウェアフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-10T16:25:23Z) - Open-Source Drift Detection Tools in Action: Insights from Two Use Cases [0.0]
D3Benchは、Evidently AI、NannyML、Alibi-Detectの能力を調べ、2つのスマートなビルディングユースケースから現実のデータを活用する。
MLパイプラインへの統合性、多様なデータタイプへの適応性、ユーザフレンドリさ、計算効率、リソース要求など、包括的な非機能的基準を検討する。
以上の結果から,Evidently AIはその一般的なデータドリフト検出に際し,NannyMLはシフトの正確なタイミングを推定し,その結果が予測精度に与える影響を評価するのに優れていることがわかった。
論文 参考訳(メタデータ) (2024-04-29T13:13:10Z) - D2E-An Autonomous Decision-making Dataset involving Driver States and Human Evaluation [6.890077875318333]
Driver to Evaluationデータセット(D2E)は、自律的な意思決定データセットである。
運転状態、車両状態、環境状況、および人間レビュアーによる評価スコアに関するデータが含まれている。
D2Eは、人間のドライバーファクターから評価結果をカバーする1100以上の対話運転ケースデータを含んでいる。
論文 参考訳(メタデータ) (2024-04-12T21:29:18Z) - Explaining by Imitating: Understanding Decisions by Interpretable Policy
Learning [72.80902932543474]
観察されたデータから人間の行動を理解することは、意思決定における透明性と説明責任にとって重要である。
意思決定者の方針をモデル化することが困難である医療などの現実的な設定を考えてみましょう。
本稿では, 設計による透明性の向上, 部分観測可能性の確保, 完全にオフラインで動作可能なデータ駆動型意思決定行動の表現を提案する。
論文 参考訳(メタデータ) (2023-10-28T13:06:14Z) - Data-Driven Offline Decision-Making via Invariant Representation
Learning [97.49309949598505]
オフラインのデータ駆動意思決定は、アクティブなインタラクションなしで最適化された決定を合成する。
オフラインデータからトレーニングされたモデルへの入力に関して最適化する場合、誤って良いように見えるアウト・オブ・ディストリビューション(OOD)インプットを生成するのは簡単です。
本稿では、オフラインデータ駆動意思決定をドメイン適応として定式化し、最適化された決定値の正確な予測を行うことを目標とする。
論文 参考訳(メタデータ) (2022-11-21T11:01:37Z) - Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。
我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文 参考訳(メタデータ) (2022-05-30T18:40:28Z) - R(Det)^2: Randomized Decision Routing for Object Detection [64.48369663018376]
本稿では,決定木とディープニューラルネットワークをエンドツーエンドの学習方法で組み合わせたオブジェクト検出手法を提案する。
効率的な学習を容易にするために,ノード選択型および連想型損失を伴うランダム化決定経路を提案する。
このアプローチをオブジェクト検出のためのランダム化決定ルーティングとして、R(Det)$2$と略す。
論文 参考訳(メタデータ) (2022-04-02T07:54:58Z) - Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。
本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。
本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文 参考訳(メタデータ) (2021-01-24T05:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。