論文の概要: Counterfactual Planning in AGI Systems
- arxiv url: http://arxiv.org/abs/2102.00834v1
- Date: Fri, 29 Jan 2021 13:44:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-02 16:41:49.111217
- Title: Counterfactual Planning in AGI Systems
- Title(参考訳): AGIシステムにおけるデファクトプランニング
- Authors: Koen Holtman
- Abstract要約: 反現実的計画の鍵となるステップは、AGI機械学習システムを使用して反現実的世界モデルを構築することである。
対物計画エージェントは、この対物計画世界で期待される実用性を最大限に発揮する行動を決定する。
我々は、AGIエージェントの緊急停止ボタンと、諜報機関が爆発する前に自動的にエージェントを停止させる安全インターロックを構築するために、偽造計画を使用している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present counterfactual planning as a design approach for creating a range
of safety mechanisms that can be applied in hypothetical future AI systems
which have Artificial General Intelligence.
The key step in counterfactual planning is to use an AGI machine learning
system to construct a counterfactual world model, designed to be different from
the real world the system is in. A counterfactual planning agent determines the
action that best maximizes expected utility in this counterfactual planning
world, and then performs the same action in the real world.
We use counterfactual planning to construct an AGI agent emergency stop
button, and a safety interlock that will automatically stop the agent before it
undergoes an intelligence explosion. We also construct an agent with an input
terminal that can be used by humans to iteratively improve the agent's reward
function, where the incentive for the agent to manipulate this improvement
process is suppressed. As an example of counterfactual planning in a non-agent
AGI system, we construct a counterfactual oracle.
As a design approach, counterfactual planning is built around the use of a
graphical notation for defining mathematical counterfactuals. This two-diagram
notation also provides a compact and readable language for reasoning about the
complex types of self-referencing and indirect representation which are
typically present inside machine learning agents.
- Abstract(参考訳): 人工知能を応用した未来AIシステムにおいて、様々な安全メカニズムを創造するための設計手法として、反現実的計画を提示する。
反現実計画の重要なステップは、AGI機械学習システムを使用して、システムが現実世界とは異なるように設計された反現実世界モデルを構築することです。
反実計画エージェントは、この反実計画世界で期待される実用性を最大限に引き出す行動を決定し、実世界で同じ行動を行う。
agiエージェントの緊急停止ボタンと、エージェントが情報爆発を起こす前に自動的に停止する安全インターロックを構築するために、偽の計画を用いています。
また、人間によってエージェントの報酬関数を反復的に改善するために使用できる入力端末を備えたエージェントを構築し、この改善プロセスを操作するエージェントに対するインセンティブを抑える。
非エージェントAGIシステムにおける反実用計画の例として、反実用オラクルを構築する。
設計手法として、数理対物の定義にグラフィカル表記を用いることを中心に、対物計画が構築される。
この2ダイアグラム表記法は、機械学習エージェントの中に通常存在する複雑な自己参照および間接表現のタイプを推論するためのコンパクトで可読な言語を提供する。
関連論文リスト
- Long-Horizon Task and Motion Planning with Functional Object-Oriented
Networks [79.94575713911189]
ロボットの知識グラフ表現として機能的オブジェクト指向ネットワーク(FOON)を導入した。
本稿では,FOONグラフをPDDLに基づくドメイン知識表現に変換する階層的タスク計画手法を提案する。
CoppeliaSimを使って計画から実行までのパイプライン全体をデモし、学習したアクションコンテキストを、これまで見たことのないシナリオにどのように拡張できるかを示します。
論文 参考訳(メタデータ) (2022-07-12T19:29:35Z) - Online Grounding of PDDL Domains by Acting and Sensing in Unknown
Environments [62.11612385360421]
本稿では,エージェントが異なるタスクを実行できるフレームワークを提案する。
機械学習モデルを統合して、感覚データを抽象化し、目標達成のためのシンボリックプランニング、ナビゲーションのためのパスプランニングを行う。
提案手法を,RGB-Dオンボードカメラ,GPS,コンパスなど,正確なシミュレーション環境で評価する。
論文 参考訳(メタデータ) (2021-12-18T21:48:20Z) - A Consciousness-Inspired Planning Agent for Model-Based Reinforcement
Learning [104.3643447579578]
本稿では、その状態の関連部分に動的に対応できるエンドツーエンドのモデルベース深層強化学習エージェントを提案する。
この設計により、エージェントは関連するオブジェクトに参画することで効果的に計画を学ぶことができ、配布外一般化がより良くなる。
論文 参考訳(メタデータ) (2021-06-03T19:35:19Z) - Knowledge-Based Hierarchical POMDPs for Task Planning [0.34998703934432684]
タスクプランニングの主な目標は、エージェントを初期状態から目標状態へと移動させる一連のアクションを構築することです。
ロボット工学では、アクションは通常いくつかの可能な結果があり、センサーがエラーで測定を行う傾向があるため、これは特に困難です。
本稿では,情報のモジュール化と再利用を促進するロボットとその環境に関する知識を符号化する手法を提案する。
論文 参考訳(メタデータ) (2021-03-19T05:45:05Z) - Software Architecture for Next-Generation AI Planning Systems [0.0]
我々は、次世代AI計画システムを設計、開発、使用する能力の中核となるサービス指向の計画アーキテクチャを提案する。
ソフトウェア設計の原則とパターンをアーキテクチャに組み込んで、計画機能のユーザビリティ、相互運用性、再利用性を可能にします。
論文 参考訳(メタデータ) (2021-02-22T13:43:45Z) - MATS: An Interpretable Trajectory Forecasting Representation for
Planning and Control [46.86174832000696]
人間の動きに関する推論は、現代の人間ロボットの対話システムの中核的な構成要素である。
自律システムにおける行動予測の主な用途の1つは、ロボットの動作計画と制御を知らせることである。
本稿では,下流の計画や制御に適するトラジェクトリ予測のための新しい出力表現を提案する。
論文 参考訳(メタデータ) (2020-09-16T07:32:37Z) - Modelling Multi-Agent Epistemic Planning in ASP [66.76082318001976]
本稿では,マルチショット・アンサー・セット・プログラミング・ベース・プランナの実装について述べる。
本稿は, アドホックなエピステミック状態表現とASPソルバの効率を生かしたプランナーが, 文献から収集したベンチマークに対して, 競合的な性能を示すことを示す。
論文 参考訳(メタデータ) (2020-08-07T06:35:56Z) - AGI Agent Safety by Iteratively Improving the Utility Function [0.0]
本稿では,AGIエージェントのユーティリティ機能の反復的改善を支援するために,専用の入力端末を作成するAGIセーフティ層を提案する。
因果影響図(CID)にマッピングする作業が進行中であることを示す。
次に、既知の機械学習システムや将来のAGIレベルの学習システムに、安全層をラップする学習エージェントの設計を示す。
論文 参考訳(メタデータ) (2020-07-10T14:30:56Z) - iCORPP: Interleaved Commonsense Reasoning and Probabilistic Planning on
Robots [51.520214480166175]
我々はiCORPPと呼ばれる新しいアルゴリズムを提案し、現在の世界状態を同時に推定し、世界ダイナミクスの推論を行い、タスク指向のコントローラを構築する。
結果は、競合するベースラインと比較して、スケーラビリティ、効率、適応性が大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2020-04-18T17:46:59Z) - Model-based Reinforcement Learning for Decentralized Multiagent
Rendezvous [66.6895109554163]
目標を他のエージェントと整合させる人間の能力の下にあるのは、他人の意図を予測し、自分たちの計画を積極的に更新する能力である。
分散型マルチエージェントレンデブーのためのモデルに基づく強化学習手法である階層型予測計画(HPP)を提案する。
論文 参考訳(メタデータ) (2020-03-15T19:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。