論文の概要: AI Planning: A Primer and Survey (Preliminary Report)
- arxiv url: http://arxiv.org/abs/2412.05528v1
- Date: Sat, 07 Dec 2024 04:00:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-10 14:55:37.233905
- Title: AI Planning: A Primer and Survey (Preliminary Report)
- Title(参考訳): AIプランニング - プライマーとサーベイ(予報)
- Authors: Dillon Z. Chen, Pulkit Verma, Siddharth Srivastava, Michael Katz, Sylvie Thiébaux,
- Abstract要約: 本稿では,従来のAP問題と表現,およびマルコフ決定過程の定式化による不確実性と時間を扱う拡張について紹介する。
次に、AP問題を解くための最先端技術とアイデアを調査し、問題構造を活用できることに焦点を当てる。
最後に、非構造的な入力から学習し、未知のシナリオや状況に一般化するためのAP内のサブフィールドについて述べる。
- 参考スコア(独自算出の注目度): 24.84127907313026
- License:
- Abstract: Automated decision-making is a fundamental topic that spans multiple sub-disciplines in AI: reinforcement learning (RL), AI planning (AP), foundation models, and operations research, among others. Despite recent efforts to ``bridge the gaps'' between these communities, there remain many insights that have not yet transcended the boundaries. Our goal in this paper is to provide a brief and non-exhaustive primer on ideas well-known in AP, but less so in other sub-disciplines. We do so by introducing the classical AP problem and representation, and extensions that handle uncertainty and time through the Markov Decision Process formalism. Next, we survey state-of-the-art techniques and ideas for solving AP problems, focusing on their ability to exploit problem structure. Lastly, we cover subfields within AP for learning structure from unstructured inputs and learning to generalise to unseen scenarios and situations.
- Abstract(参考訳): 自動意思決定は、強化学習(RL)、AI計画(AP)、基礎モデル、運用研究など、AIの複数のサブ分野にまたがる基本的なトピックである。
これらのコミュニティの間に「ギャップを埋める」という最近の取り組みにもかかわらず、まだ境界を超越していない多くの洞察が残っている。
本論文の目的は,APでよく知られたアイデアについて,簡潔かつ非引用的なプライマーを提供することである。
我々は、古典的なAP問題と表現を導入し、マルコフ決定プロセスの定式化を通じて不確実性と時間を扱う拡張を行います。
次に、AP問題を解くための最先端技術とアイデアを調査し、問題構造を活用できることに焦点を当てる。
最後に、非構造的な入力から構造を学ぶためにAP内のサブフィールドを取り上げ、未知のシナリオや状況に一般化するために学習する。
関連論文リスト
- Introduction to AI Planning [0.0]
注記は州モデルの導入から始まり、古典的な計画の探求に移る。
最も広範なセクションは階層的タスクネットワーク(HTN)計画に特化している。
講演ノートは、計画ドメイン定義(PDDL)言語に関するボーナス章で終わる。
論文 参考訳(メタデータ) (2024-12-16T10:38:04Z) - Using AI Alignment Theory to understand the potential pitfalls of regulatory frameworks [55.2480439325792]
本稿では、欧州連合の人工知能法(EU AI法)を批判的に検討する。
人工知能における技術的アライメントの潜在的な落とし穴に焦点を当てたアライメント理論(AT)研究からの洞察を利用する。
これらの概念をEU AI Actに適用すると、潜在的な脆弱性と規制を改善するための領域が明らかになる。
論文 参考訳(メタデータ) (2024-10-10T17:38:38Z) - Reinforcement Learning with Options and State Representation [105.82346211739433]
この論文は、強化学習分野を探求し、改良された手法を構築することを目的としている。
階層的強化学習(Hierarchical Reinforcement Learning)として知られる階層的な方法で学習タスクを分解することで、そのような目標に対処する。
論文 参考訳(メタデータ) (2024-03-16T08:30:55Z) - Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning [50.47568731994238]
人工知能(AI)エージェント作成の鍵となる方法は強化学習(RL)である
本稿では,構造化推論をAIエージェントのポリシーに統合し,学習するための一般的なフレームワークモデルを提案する。
論文 参考訳(メタデータ) (2023-12-22T17:57:57Z) - General Purpose Artificial Intelligence Systems (GPAIS): Properties,
Definition, Taxonomy, Societal Implications and Responsible Governance [16.030931070783637]
汎用人工知能システム(GPAIS)は、これらのAIシステムを指すものとして定義されている。
これまで、人工知能の可能性は、まるで人間であるかのように知的タスクを実行するのに十分強力であり、あるいはそれを改善することさえ可能であり、いまだに願望、フィクションであり、我々の社会にとっての危険であると考えられてきた。
本研究は,GPAISの既存の定義について論じ,その特性や限界に応じて,GPAISの種類間で段階的な分化を可能にする新しい定義を提案する。
論文 参考訳(メタデータ) (2023-07-26T16:35:48Z) - Team Plan Recognition: A Review of the State of the Art [0.0]
協調作業を行う人間のグループを支援する人工知能システムの開発の必要性が高まっている。
この記事では、チームプランの認識に関する文献をレビューし、それを実装するための最新のロジックベースのアプローチを調査します。
論文 参考訳(メタデータ) (2023-01-30T21:01:14Z) - The Paradox of Choice: Using Attention in Hierarchical Reinforcement
Learning [59.777127897688594]
サブゴールオプションのさらなる学習に使用できる、オンラインでモデルフリーなアルゴリズムを提案する。
訓練データ収集におけるハード・ソフト・アテンションの役割,長期的タスクにおける抽象的価値学習,および多数の選択肢に対する対処について検討する。
論文 参考訳(メタデータ) (2022-01-24T13:18:02Z) - Individual Explanations in Machine Learning Models: A Case Study on
Poverty Estimation [63.18666008322476]
機械学習の手法は、敏感な社会的文脈でますます適用されつつある。
本研究の主な目的は2つある。
まず、これらの課題を公開し、関連性のある新しい説明方法の使用にどのように影響するか。
次に、関連するアプリケーションドメインで説明メソッドを実装する際に直面するような課題を軽減する一連の戦略を提示します。
論文 参考訳(メタデータ) (2021-04-09T01:54:58Z) - Decision Rule Elicitation for Domain Adaptation [93.02675868486932]
ヒトインザループ機械学習は、専門家からラベルを引き出すために人工知能(AI)で広く使用されています。
この作業では、専門家が意思決定を説明する決定ルールを作成できるようにします。
決定規則の適用はアルゴリズムのドメイン適応を改善し、専門家の知識をAIモデルに広めるのに役立つことを示す。
論文 参考訳(メタデータ) (2021-02-23T08:07:22Z) - Solving Hard AI Planning Instances Using Curriculum-Driven Deep
Reinforcement Learning [31.92282114603962]
SokobanはPSPACE完全計画タスクであり、現在のAIプランナーにとって最も難しいドメインの1つである。
カリキュラム駆動型手法で強化した深層強化学習に基づくアプローチは,1日以内のハードインスタンスを初めて解決する手法である。
論文 参考訳(メタデータ) (2020-06-04T08:13:12Z) - A Survey of Reinforcement Learning Techniques: Strategies, Recent
Development, and Future Directions [0.0]
強化学習は任意の環境で行動を取るシステムに影響を与える。
本稿では,課題,最近の最先端技術の発展,今後の方向性など,さまざまな側面に焦点をあてる。
論文 参考訳(メタデータ) (2020-01-19T23:51:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。