Fugu-MT 論文翻訳(概要): Leveraging AI to improve human planning in large partially observable environments

論文の概要: Leveraging AI to improve human planning in large partially observable environments

arxiv url: http://arxiv.org/abs/2302.02785v1
Date: Mon, 6 Feb 2023 13:57:08 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-07 16:38:02.738775
Title: Leveraging AI to improve human planning in large partially observable environments
Title（参考訳）: 大規模な部分観測可能な環境でAIを活用して人間の計画を改善する
Authors: Lovis Heindrich, Saksham Consul, Falk Lieder
Abstract要約: AIは多くの計画タスクで人より優れていますが、よりよい計画の仕方を教えてくれます。そこで我々は,部分的に観測可能な環境下での人的計画のための資源-合理的戦略を発見するための,最初のメタ推論アルゴリズムを開発した。我々はまた、より困難な問題にどのように計画するかについてのフィードバックを提供することで、自動的に発見された戦略を教えるインテリジェントな家庭教師も開発した。
参考スコア（独自算出の注目度）: 4.8986598953553555
License: http://creativecommons.org/licenses/by/4.0/
Abstract: AI can not only outperform people in many planning tasks, but also teach them how to plan better. All prior work was conducted in fully observable environments, but the real world is only partially observable. To bridge this gap, we developed the first metareasoning algorithm for discovering resource-rational strategies for human planning in partially observable environments. Moreover, we developed an intelligent tutor teaching the automatically discovered strategy by giving people feedback on how they plan in increasingly more difficult problems. We showed that our strategy discovery method is superior to the state-of-the-art and tested our intelligent tutor in a preregistered training experiment with 330 participants. The experiment showed that people's intuitive strategies for planning in partially observable environments are highly suboptimal, but can be substantially improved by training with our intelligent tutor. This suggests our human-centred tutoring approach can successfully boost human planning in complex, partially observable sequential decision problems.
Abstract（参考訳）: AIは多くの計画タスクで人を上回るだけでなく、よりよい計画方法を教えることができる。以前の作業はすべて完全な可観測環境で行われたが、現実の世界は部分的に可観測である。このギャップを埋めるために,人間計画のための資源有理戦略を部分的に観測可能な環境で発見する最初のメトエリアソンアルゴリズムを開発した。さらに,より難しい問題に対してどのように計画するかをフィードバックすることで,自動発見戦略を指導するインテリジェントな家庭教師を開発した。戦略発見手法は最先端技術よりも優れていることを示し、330名の参加者による事前登録トレーニング実験で知的チューターをテストした。実験の結果,部分観測可能な環境における計画の直観的戦略は極めて最適であるが,知的家庭教師の訓練によって大幅に改善できることがわかった。これは、人間中心の学習アプローチが、複雑で部分的に観察可能なシーケンシャルな意思決定問題において、人間の計画を促進することを示唆している。

関連論文リスト

World Modeling Makes a Better Planner: Dual Preference Optimization for Embodied Task Planning [60.100794160682646]
そこで本稿では,嗜好学習による状態予測と行動選択を協調的に最適化する新たな学習フレームワークを提案する。人間のアノテーションを使わずに軌道や段階的な選好データを自動的に収集するために,試行錯誤による広範囲な探索のための木探索機構を導入する。提案手法は,Qwen2-VL (7B), LLaVA-1.6 (7B), LLaMA-3.2 (11B) に適用した場合, 既存の手法と GPT-4o を著しく上回っている。
論文参考訳（メタデータ） (2025-03-13T15:49:56Z)
SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.14969377419633]
タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文参考訳（メタデータ） (2024-10-23T17:42:07Z)
Leveraging automatic strategy discovery to teach people how to select better projects [0.9821874476902969]
個人や組織の決定は、規範的な決定戦略が現実の世界であまりにも要求されているため、過小評価されることが多い。最近の研究は、人工知能を利用して規範的な意思決定戦略を発見し、教えることによって、いくつかのエラーを防ぐことができることを示唆している。この記事は、このアプローチを現実の意思決定問題、すなわちプロジェクト選択に拡張する最初のものです。
論文参考訳（メタデータ） (2024-06-06T13:51:44Z)
Intelligent Execution through Plan Analysis [11.771743106780102]
計画は世界について仮定する。計画を実行する場合、通常、仮定は満たされない。代わりに私たちは、ポジティブな影響や、より良い計画を見つける機会に重点を置いています。いくつかのパラダイム的なロボットタスクの実験は、アプローチが標準的な計画戦略よりも優れていることを示す。
論文参考訳（メタデータ） (2024-03-18T18:23:36Z)
Towards Goal-oriented Intelligent Tutoring Systems in Online Education [69.06930979754627]
目標指向知能チューニングシステム(GITS)という新しいタスクを提案する。 GITSは,演習や評価のカスタマイズを戦略的に計画することで,学生の指定概念の習得を可能にすることを目的としている。 PAI(Planning-Assessment-Interaction)と呼ばれるグラフに基づく新しい強化学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-12-03T12:37:16Z)
Thinker: Learning to Plan and Act [18.425843346728648]
思考アルゴリズムは環境を世界モデルで包み、世界モデルと対話するために設計された新しいアクションを導入する。本研究では,ソコバンとアタリ2600ベンチマークを用いて,実験結果を用いてアルゴリズムの有効性を実証する。
論文参考訳（メタデータ） (2023-07-27T16:40:14Z)
Hierarchical Imitation Learning with Vector Quantized Models [77.67190661002691]
我々は,専門家の軌跡におけるサブゴールの同定に強化学習を用いることを提案する。同定されたサブゴールに対するベクトル量子化生成モデルを構築し,サブゴールレベルの計画を行う。実験では、このアルゴリズムは複雑な長い水平決定問題の解法に優れ、最先端のアルゴリズムよりも優れている。
論文参考訳（メタデータ） (2023-01-30T15:04:39Z)
Achieving mouse-level strategic evasion performance using real-time computational planning [59.60094442546867]
計画とは、脳が想像し、予測可能な未来を成立させる特別な能力である。我々は,動物の生態が空間計画の価値をどのように支配するかという研究に基づいて,より効率的な生物学的に着想を得た計画アルゴリズムであるTLPPOを開発した。 TLPPOを用いたリアルタイムエージェントの性能とライブマウスの性能を比較し,ロボット捕食者を避けることを課題とする。
論文参考訳（メタデータ） (2022-11-04T18:34:36Z)
Have I done enough planning or should I plan more? [0.7734726150561086]
この能力は,学習機構を逆エンジニアリングすることで得られることを示す。計画のコストと利益に対して、どれだけの計画を実行したか、すぐに適応できることに気付きました。その結果,計画の量を調整するメタ認知能力は,政策段階のメカニズムによって学習される可能性が示唆された。
論文参考訳（メタデータ） (2022-01-03T17:11:07Z)
Procedure Planning in Instructional Videosvia Contextual Modeling and Model-based Policy Learning [114.1830997893756]
本研究は,実生活ビデオにおける目標指向アクションを計画するモデルを学習することに焦点を当てる。本研究では,ベイズ推論とモデルに基づく模倣学習を通して,人間の行動のモデル化を行う新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-10-05T01:06:53Z)
Improving Human Decision-Making by Discovering Efficient Strategies for Hierarchical Planning [0.6882042556551609]
計算資源が限られているため、効率的な計画戦略が必要です。これらの戦略を計算する能力は、以前は非常に小さく、非常に単純な計画タスクに限られていました。本稿では,この制限を克服できる認知型強化学習手法を提案する。
論文参考訳（メタデータ） (2021-01-31T19:46:00Z)
Latent Skill Planning for Exploration and Transfer [49.25525932162891]
本稿では,この2つの手法を1つの強化学習エージェントに統合する方法について検討する。テスト時の高速適応に部分的償却の考え方を活用する。私たちは、困難なロコモーションタスクのスイートでデザイン決定のメリットを実演しています。
論文参考訳（メタデータ） (2020-11-27T18:40:03Z)
Planning to Explore via Self-Supervised World Models [120.31359262226758]
Plan2Exploreは自己監督型強化学習エージェントである。我々は、自己監督型探索と、新しいタスクへの迅速な適応に対する新しいアプローチを提案する。 Plan2Exploreは、訓練の監督やタスク固有の相互作用がなければ、自己監督型の探査方法よりも優れている。
論文参考訳（メタデータ） (2020-05-12T17:59:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。