論文の概要: Counterfactual Planning in AGI Systems
- arxiv url: http://arxiv.org/abs/2102.00834v1
- Date: Fri, 29 Jan 2021 13:44:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-02 16:41:49.111217
- Title: Counterfactual Planning in AGI Systems
- Title(参考訳): AGIシステムにおけるデファクトプランニング
- Authors: Koen Holtman
- Abstract要約: 反現実的計画の鍵となるステップは、AGI機械学習システムを使用して反現実的世界モデルを構築することである。
対物計画エージェントは、この対物計画世界で期待される実用性を最大限に発揮する行動を決定する。
我々は、AGIエージェントの緊急停止ボタンと、諜報機関が爆発する前に自動的にエージェントを停止させる安全インターロックを構築するために、偽造計画を使用している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present counterfactual planning as a design approach for creating a range
of safety mechanisms that can be applied in hypothetical future AI systems
which have Artificial General Intelligence.
The key step in counterfactual planning is to use an AGI machine learning
system to construct a counterfactual world model, designed to be different from
the real world the system is in. A counterfactual planning agent determines the
action that best maximizes expected utility in this counterfactual planning
world, and then performs the same action in the real world.
We use counterfactual planning to construct an AGI agent emergency stop
button, and a safety interlock that will automatically stop the agent before it
undergoes an intelligence explosion. We also construct an agent with an input
terminal that can be used by humans to iteratively improve the agent's reward
function, where the incentive for the agent to manipulate this improvement
process is suppressed. As an example of counterfactual planning in a non-agent
AGI system, we construct a counterfactual oracle.
As a design approach, counterfactual planning is built around the use of a
graphical notation for defining mathematical counterfactuals. This two-diagram
notation also provides a compact and readable language for reasoning about the
complex types of self-referencing and indirect representation which are
typically present inside machine learning agents.
- Abstract(参考訳): 人工知能を応用した未来AIシステムにおいて、様々な安全メカニズムを創造するための設計手法として、反現実的計画を提示する。
反現実計画の重要なステップは、AGI機械学習システムを使用して、システムが現実世界とは異なるように設計された反現実世界モデルを構築することです。
反実計画エージェントは、この反実計画世界で期待される実用性を最大限に引き出す行動を決定し、実世界で同じ行動を行う。
agiエージェントの緊急停止ボタンと、エージェントが情報爆発を起こす前に自動的に停止する安全インターロックを構築するために、偽の計画を用いています。
また、人間によってエージェントの報酬関数を反復的に改善するために使用できる入力端末を備えたエージェントを構築し、この改善プロセスを操作するエージェントに対するインセンティブを抑える。
非エージェントAGIシステムにおける反実用計画の例として、反実用オラクルを構築する。
設計手法として、数理対物の定義にグラフィカル表記を用いることを中心に、対物計画が構築される。
この2ダイアグラム表記法は、機械学習エージェントの中に通常存在する複雑な自己参照および間接表現のタイプを推論するためのコンパクトで可読な言語を提供する。
関連論文リスト
- Ask-before-Plan: Proactive Language Agents for Real-World Planning [68.08024918064503]
プロアクティブエージェントプランニングでは、ユーザエージェントの会話とエージェント環境のインタラクションに基づいて、言語エージェントが明確化のニーズを予測する必要がある。
本稿では,明確化,実行,計画の3つのエージェントからなる新しいマルチエージェントフレームワーク,Clarification-Execution-Planning(textttCEP)を提案する。
論文 参考訳(メタデータ) (2024-06-18T14:07:28Z) - Automated Process Planning Based on a Semantic Capability Model and SMT [50.76251195257306]
製造システムと自律ロボットの研究において、機械で解釈可能なシステム機能の仕様に「能力」という用語が用いられる。
セマンティック能力モデルから始めて、AI計画問題を自動的に生成するアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-14T10:37:34Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - On Computing Universal Plans for Partially Observable Multi-Agent Path
Finding [11.977931648859176]
汎用計画問題としてマルチエージェントルーティング問題を定式化することは有益である,と我々は主張する。
ASP-MAUPF (Answer Set Programming for Multi-Agent Universal Plan Finding) と呼ばれるシステムを実装した。
論文 参考訳(メタデータ) (2023-05-25T16:06:48Z) - Online Grounding of PDDL Domains by Acting and Sensing in Unknown
Environments [62.11612385360421]
本稿では,エージェントが異なるタスクを実行できるフレームワークを提案する。
機械学習モデルを統合して、感覚データを抽象化し、目標達成のためのシンボリックプランニング、ナビゲーションのためのパスプランニングを行う。
提案手法を,RGB-Dオンボードカメラ,GPS,コンパスなど,正確なシミュレーション環境で評価する。
論文 参考訳(メタデータ) (2021-12-18T21:48:20Z) - A Consciousness-Inspired Planning Agent for Model-Based Reinforcement
Learning [104.3643447579578]
本稿では、その状態の関連部分に動的に対応できるエンドツーエンドのモデルベース深層強化学習エージェントを提案する。
この設計により、エージェントは関連するオブジェクトに参画することで効果的に計画を学ぶことができ、配布外一般化がより良くなる。
論文 参考訳(メタデータ) (2021-06-03T19:35:19Z) - Knowledge-Based Hierarchical POMDPs for Task Planning [0.34998703934432684]
タスクプランニングの主な目標は、エージェントを初期状態から目標状態へと移動させる一連のアクションを構築することです。
ロボット工学では、アクションは通常いくつかの可能な結果があり、センサーがエラーで測定を行う傾向があるため、これは特に困難です。
本稿では,情報のモジュール化と再利用を促進するロボットとその環境に関する知識を符号化する手法を提案する。
論文 参考訳(メタデータ) (2021-03-19T05:45:05Z) - Software Architecture for Next-Generation AI Planning Systems [0.0]
我々は、次世代AI計画システムを設計、開発、使用する能力の中核となるサービス指向の計画アーキテクチャを提案する。
ソフトウェア設計の原則とパターンをアーキテクチャに組み込んで、計画機能のユーザビリティ、相互運用性、再利用性を可能にします。
論文 参考訳(メタデータ) (2021-02-22T13:43:45Z) - Modelling Multi-Agent Epistemic Planning in ASP [66.76082318001976]
本稿では,マルチショット・アンサー・セット・プログラミング・ベース・プランナの実装について述べる。
本稿は, アドホックなエピステミック状態表現とASPソルバの効率を生かしたプランナーが, 文献から収集したベンチマークに対して, 競合的な性能を示すことを示す。
論文 参考訳(メタデータ) (2020-08-07T06:35:56Z) - AGI Agent Safety by Iteratively Improving the Utility Function [0.0]
本稿では,AGIエージェントのユーティリティ機能の反復的改善を支援するために,専用の入力端末を作成するAGIセーフティ層を提案する。
因果影響図(CID)にマッピングする作業が進行中であることを示す。
次に、既知の機械学習システムや将来のAGIレベルの学習システムに、安全層をラップする学習エージェントの設計を示す。
論文 参考訳(メタデータ) (2020-07-10T14:30:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。