論文の概要: Automatic Discovery of Interpretable Planning Strategies
- arxiv url: http://arxiv.org/abs/2005.11730v3
- Date: Sat, 10 Apr 2021 05:28:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 13:16:05.382431
- Title: Automatic Discovery of Interpretable Planning Strategies
- Title(参考訳): 解釈可能な計画戦略の自動発見
- Authors: Julian Skirzy\'nski, Frederic Becker and Falk Lieder
- Abstract要約: 我々は、慣用的ポリシーを単純かつ解釈可能な記述に変換する方法であるAI-Interpretを紹介する。
フローチャートとしてAI-Interpretが生み出す決定ルールを守れば、人々の計画戦略や意思決定は大幅に改善される。
- 参考スコア(独自算出の注目度): 9.410583483182657
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When making decisions, people often overlook critical information or are
overly swayed by irrelevant information. A common approach to mitigate these
biases is to provide decision-makers, especially professionals such as medical
doctors, with decision aids, such as decision trees and flowcharts. Designing
effective decision aids is a difficult problem. We propose that recently
developed reinforcement learning methods for discovering clever heuristics for
good decision-making can be partially leveraged to assist human experts in this
design process. One of the biggest remaining obstacles to leveraging the
aforementioned methods is that the policies they learn are opaque to people. To
solve this problem, we introduce AI-Interpret: a general method for
transforming idiosyncratic policies into simple and interpretable descriptions.
Our algorithm combines recent advances in imitation learning and program
induction with a new clustering method for identifying a large subset of
demonstrations that can be accurately described by a simple, high-performing
decision rule. We evaluate our new algorithm and employ it to translate
information-acquisition policies discovered through metalevel reinforcement
learning. The results of large behavioral experiments showed that prividing the
decision rules generated by AI-Interpret as flowcharts significantly improved
people's planning strategies and decisions across three diferent classes of
sequential decision problems. Moreover, another experiment revealed that this
approach is significantly more effective than training people by giving them
performance feedback. Finally, a series of ablation studies confirmed that
AI-Interpret is critical to the discovery of interpretable decision rules. We
conclude that the methods and findings presented herein are an important step
towards leveraging automatic strategy discovery to improve human
decision-making.
- Abstract(参考訳): 決定を下すとき、人々はしばしば重要な情報を見落とし、無関係な情報によって動揺する。
これらのバイアスを軽減する一般的なアプローチは、意思決定者、特に医師のような専門家に意思決定木やフローチャートなどの意思決定支援を提供することである。
効果的な意思決定支援の設計は難しい問題です。
近年, 優れた意思決定のための巧妙なヒューリスティクスを発見するための強化学習手法が, この設計プロセスにおいて人的専門家を支援するために部分的に活用できることが提案されている。
上記の方法を活用する上での最大の障害の1つは、学習したポリシーが人々に不透明であることです。
この問題を解決するために,AI-Interpretは,慣用的ポリシーをシンプルかつ解釈可能な記述に変換する一般的な方法である。
提案アルゴリズムは,近年の模倣学習とプログラム帰納法の進歩と,単純かつ高性能な決定規則によって正確に記述可能なデモの大規模なサブセットを特定する新たなクラスタリング手法を組み合わせる。
新しいアルゴリズムを評価し,メタレベル強化学習によって発見された情報獲得ポリシーの翻訳を行う。
大規模行動実験の結果,AI-Interpret がフローチャートとして生み出す決定ルールは,逐次的決定問題の3つの異なるクラスにまたがる人々の計画戦略と決定を著しく改善した。
さらに、別の実験では、このアプローチがパフォーマンスフィードバックを与えることで、トレーニング担当者よりもはるかに効果的であることが判明した。
最後に、一連のアブレーション研究により、AI-Interpretが解釈可能な決定規則の発見に不可欠であることが確認された。
本研究は,人的意思決定を改善するために,自動戦略発見を活用するための重要なステップである。
関連論文リスト
- Combining AI Control Systems and Human Decision Support via Robustness and Criticality [53.10194953873209]
我々は、逆説(AE)の方法論を最先端の強化学習フレームワークに拡張する。
学習したAI制御システムは、敵のタンパリングに対する堅牢性を示す。
トレーニング/学習フレームワークでは、この技術は人間のインタラクションを通じてAIの決定と説明の両方を改善することができる。
論文 参考訳(メタデータ) (2024-07-03T15:38:57Z) - Leveraging automatic strategy discovery to teach people how to select better projects [0.9821874476902969]
個人や組織の決定は、規範的な決定戦略が現実の世界であまりにも要求されているため、過小評価されることが多い。
最近の研究は、人工知能を利用して規範的な意思決定戦略を発見し、教えることによって、いくつかのエラーを防ぐことができることを示唆している。
この記事は、このアプローチを現実の意思決定問題、すなわちプロジェクト選択に拡張する最初のものです。
論文 参考訳(メタデータ) (2024-06-06T13:51:44Z) - Designing Algorithmic Recommendations to Achieve Human-AI Complementarity [2.4247752614854203]
人間の意思決定を支援するレコメンデーションアルゴリズムの設計を形式化する。
我々は、潜在的なアウトカムフレームワークを使用して、ヒトの意思決定者による二元的治療選択に対するレコメンデーションの効果をモデル化する。
機械学習で実装可能な最小限の推奨アルゴリズムを導出する。
論文 参考訳(メタデータ) (2024-05-02T17:15:30Z) - Optimising Human-AI Collaboration by Learning Convincing Explanations [62.81395661556852]
本研究では,人間による意思決定によって安全を保ちながら協調的なシステムを構築する手法を提案する。
Ardentは、説明のための個人の好みに適応することで、効率的で効果的な意思決定を可能にする。
論文 参考訳(メタデータ) (2023-11-13T16:00:16Z) - Explainable Data-Driven Optimization: From Context to Decision and Back
Again [76.84947521482631]
データ駆動最適化では、コンテキスト情報と機械学習アルゴリズムを使用して、不確実なパラメータによる決定問題の解決策を見つける。
本稿では,データ駆動型問題に対する解法を説明するために,対実的説明手法を提案する。
在庫管理やルーティングといった運用管理における重要な問題を説明することで,我々のアプローチを実証する。
論文 参考訳(メタデータ) (2023-01-24T15:25:16Z) - Inverse Online Learning: Understanding Non-Stationary and Reactionary
Policies [79.60322329952453]
エージェントが意思決定を行う方法の解釈可能な表現を開発する方法を示す。
一連の軌跡に基づく意思決定プロセスを理解することにより,このオンライン学習問題に対して,政策推論問題を逆問題とみなした。
本稿では、エージェントがそれらを更新するプロセスと並行して、その影響を遡及的に推定する実用的なアルゴリズムを提案する。
UNOSの臓器提供受諾決定の分析に応用することで、我々のアプローチは意思決定プロセスを管理する要因や時間とともにどのように変化するかに、貴重な洞察をもたらすことができることを実証する。
論文 参考訳(メタデータ) (2022-03-14T17:40:42Z) - Boosting human decision-making with AI-generated decision aids [8.373151777137792]
我々は,従来の手法の出力を手続き的命令に変換するアルゴリズムを開発した。
実験の結果、これらの自動意思決定は、道路旅行計画や住宅ローン選択における人々のパフォーマンスを著しく向上させることがわかった。
これらの結果は、AIによる強化が、現実世界における人間の意思決定を改善する可能性があることを示唆している。
論文 参考訳(メタデータ) (2022-03-05T15:57:20Z) - Improving Human Sequential Decision-Making with Reinforcement Learning [29.334511328067777]
トレースデータから"ベストプラクティス"を抽出できる新しい機械学習アルゴリズムを設計する。
我々のアルゴリズムは、労働者の行動と最適な政策によって取られた行動のギャップを最もうまく埋めるヒントを選択する。
実験の結果,提案アルゴリズムが生成したチップは人体の性能を著しく向上させることができることがわかった。
論文 参考訳(メタデータ) (2021-08-19T02:57:58Z) - Decision Rule Elicitation for Domain Adaptation [93.02675868486932]
ヒトインザループ機械学習は、専門家からラベルを引き出すために人工知能(AI)で広く使用されています。
この作業では、専門家が意思決定を説明する決定ルールを作成できるようにします。
決定規則の適用はアルゴリズムのドメイン適応を改善し、専門家の知識をAIモデルに広めるのに役立つことを示す。
論文 参考訳(メタデータ) (2021-02-23T08:07:22Z) - Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。
本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。
本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文 参考訳(メタデータ) (2021-01-24T05:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。