論文の概要: MADDM: Multi-Advisor Dynamic Binary Decision-Making by Maximizing the
Utility
- arxiv url: http://arxiv.org/abs/2305.08664v1
- Date: Mon, 15 May 2023 14:13:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 14:14:52.595772
- Title: MADDM: Multi-Advisor Dynamic Binary Decision-Making by Maximizing the
Utility
- Title(参考訳): maddm: ユーティリティ最大化によるマルチアドバイザ動的バイナリ意思決定
- Authors: Zhaori Guo, Timothy J. Norman, Enrico H. Gerding
- Abstract要約: 逐次二元決定設定において,助言者の集合を最適に選択するための新しい戦略を提案する。
我々は、根拠となる真実にアクセスできず、助言者の信頼性に関する事前の知識もないと仮定する。
- 参考スコア(独自算出の注目度): 8.212621730577897
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Being able to infer ground truth from the responses of multiple imperfect
advisors is a problem of crucial importance in many decision-making
applications, such as lending, trading, investment, and crowd-sourcing. In
practice, however, gathering answers from a set of advisors has a cost.
Therefore, finding an advisor selection strategy that retrieves a reliable
answer and maximizes the overall utility is a challenging problem. To address
this problem, we propose a novel strategy for optimally selecting a set of
advisers in a sequential binary decision-making setting, where multiple
decisions need to be made over time. Crucially, we assume no access to ground
truth and no prior knowledge about the reliability of advisers. Specifically,
our approach considers how to simultaneously (1) select advisors by balancing
the advisors' costs and the value of making correct decisions, (2) learn the
trustworthiness of advisers dynamically without prior information by asking
multiple advisers, and (3) make optimal decisions without access to the ground
truth, improving this over time. We evaluate our algorithm through several
numerical experiments. The results show that our approach outperforms two other
methods that combine state-of-the-art models.
- Abstract(参考訳): 複数の不完全なアドバイザーの反応から真実を推測できることは、融資、トレーディング、投資、クラウドソーシングといった多くの意思決定アプリケーションにおいて重要な問題である。
しかし実際には、一連のアドバイザーからの回答を集めるにはコストがかかる。
したがって,信頼性の高い回答を検索し,全体の有効性を最大化するアドバイザ選択戦略を見つけることは難しい問題である。
この問題に対処するために,複数の意思決定を行う必要がある連続二分決定設定において,助言者の集合を最適に選択するための新しい戦略を提案する。
重要なことは、我々は根底にある真実にアクセスできず、アドバイザーの信頼性に関する事前の知識もないと仮定する。
具体的には,(1)アドバイザーのコストと正しい意思決定価値のバランスをとることで,アドバイスを同時に選択する方法,(2)複数のアドバイザーに問い合わせることなくアドバイザーの信頼度を動的に学習する方法,(3)根底から真実にアクセスせずに最適な意思決定を行うこと,などを検討する。
本アルゴリズムをいくつかの数値実験により評価する。
その結果,本手法は最先端モデルを組み合わせた他の2つの手法よりも優れていることがわかった。
関連論文リスト
- Expert-guided Bayesian Optimisation for Human-in-the-loop Experimental
Design of Known Systems [0.0]
我々は,高スループット(バッチ)ベイズ最適化と人類学的決定理論を併用して,ドメインの専門家が最適実験の選択に影響を及ぼすことを可能にする。
我々の方法論は、人間が連続的な選択よりも個別に選択する方が優れているという仮説を利用しており、専門家が重要な早期決定に影響を及ぼすことを可能にする。
論文 参考訳(メタデータ) (2023-12-05T16:09:31Z) - Online Decision Mediation [72.80902932543474]
意思決定支援アシスタントを学習し、(好奇心)専門家の行動と(不完全)人間の行動の仲介役として機能することを検討する。
臨床診断では、完全に自律的な機械行動は倫理的余裕を超えることが多い。
論文 参考訳(メタデータ) (2023-10-28T05:59:43Z) - ChoiceMates: Supporting Unfamiliar Online Decision-Making with
Multi-Agent Conversational Interactions [58.71970923420007]
提案するChoiceMatesは,LLMエージェントの動的セットとの対話を可能にするシステムである。
エージェントは、意見のあるペルソナとして、柔軟に会話に参加し、応答を提供するだけでなく、各エージェントの好みを引き出すために互いに会話する。
ChoiceMatesを従来のWeb検索とシングルエージェントと比較した結果,ChoiceMatesはより信頼性の高いWebと比較して,発見,潜水,情報管理に有用であることが判明した。
論文 参考訳(メタデータ) (2023-10-02T16:49:39Z) - Active Ranking of Experts Based on their Performances in Many Tasks [72.96112117037465]
我々は、dタスクのパフォーマンスに基づいて、n名のエキスパートをランク付けする問題を考察する。
我々は,各専門家のペアに対して,各タスクにおいて他方よりも優れているという,単調な仮定を定めている。
論文 参考訳(メタデータ) (2023-06-05T06:55:39Z) - Eliciting User Preferences for Personalized Multi-Objective Decision
Making through Comparative Feedback [76.7007545844273]
目的に対して異なるユーザの好みに対応する多目的意思決定フレームワークを提案する。
我々のモデルは、ベクトル値の報酬関数を持つマルコフ決定プロセスで構成され、各ユーザが未知の選好ベクトルを持つ。
少数の比較クエリを用いて,ユーザに対してほぼ最適なポリシを求めるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-07T23:58:19Z) - Learning from Multiple Independent Advisors in Multi-agent Reinforcement
Learning [15.195932300563541]
本稿では,マルチエージェント強化学習において,複数の独立アドバイザから同時に学習することの課題について考察する。
我々は、各州におけるアドバイザーを評価し、その後、アドバイザーを使用して行動選択をガイドすることで、アドバイザーの集合を組み込んだ原則付きアルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-01-26T15:00:23Z) - On solving decision and risk management problems subject to uncertainty [91.3755431537592]
不確実性は意思決定とリスク管理において広範囲にわたる課題である。
本稿では,このような戦略を体系的に理解し,その適用範囲を判断し,それらをうまく活用するための枠組みを開発する。
論文 参考訳(メタデータ) (2023-01-18T19:16:23Z) - Multi-Agent Advisor Q-Learning [18.8931184962221]
マルチエージェント設定において、オンラインの準最適アドバイザからのアクションレコメンデーションを組み込むための原則化されたフレームワークを提供する。
本稿では,Q-ラーニングに基づく新しいアルゴリズムとして,ADMIRAL-Decision Making (ADMIral-DM) とADMIAL- Advisor Evaluation (ADMIAL-AE) の2つを提案する。
アルゴリズムを理論的に解析し、一般ゲームにおける学習に関する定点保証を提供する。
論文 参考訳(メタデータ) (2021-10-26T00:21:15Z) - Dealing with Expert Bias in Collective Decision-Making [4.588028371034406]
本稿では,コンテキスト型マルチアームバンディット問題(CMAB)に基づく新たなアルゴリズムアプローチを提案する。
CMABにインスパイアされた新しいアプローチは、従来の適応アルゴリズムよりも高速に収束しながら、より高い最終性能を達成する。
論文 参考訳(メタデータ) (2021-06-25T10:17:37Z) - Confidence-Budget Matching for Sequential Budgeted Learning [69.77435313099366]
問合せ予算で意思決定問題を定式化する。
我々は,多腕バンディット,線形バンディット,強化学習問題を考察する。
我々は,CBMに基づくアルゴリズムが逆性の存在下で良好に動作することを示す。
論文 参考訳(メタデータ) (2021-02-05T19:56:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。