論文の概要: Information-Theoretic Abstractions for Planning in Agents with
Computational Constraints
- arxiv url: http://arxiv.org/abs/2005.09611v2
- Date: Tue, 23 Feb 2021 23:29:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 14:33:08.454442
- Title: Information-Theoretic Abstractions for Planning in Agents with
Computational Constraints
- Title(参考訳): 計算制約のあるエージェントの計画のための情報理論的抽象化
- Authors: Daniel T. Larsson and Dipankar Maity and Panagiotis Tsiotras
- Abstract要約: 本稿では,元空間の抽象化に関する問題を解くことで,環境内の経路計画問題を体系的に近似する方法を示す。
数値的な例を提示し, アプローチの有用性を示し, 理論的知見を裏付ける。
- 参考スコア(独自算出の注目度): 16.565205172451662
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we develop a framework for path-planning on abstractions that
are not provided to the agent a priori but instead emerge as a function of the
available computational resources. We show how a path-planning problem in an
environment can be systematically approximated by solving a sequence of easier
to solve problems on abstractions of the original space. The properties of the
problem are analyzed, and a number of theoretical results are presented and
discussed. A numerical example is presented to show the utility of the approach
and to corroborate the theoretical findings. We conclude by providing a
discussion detailing the connections of the proposed approach to anytime
algorithms and bounded rationality.
- Abstract(参考訳): 本稿では,エージェントaに前もって提供されず,その代わりに利用可能な計算資源の関数として出現する抽象化のパスプランニングのためのフレームワークを開発した。
本稿では,元空間の抽象化に関する問題を解くことで,環境内の経路計画問題を体系的に近似する方法を示す。
問題の性質を解析し, 理論的な結果をいくつか提示し, 考察した。
このアプローチの有用性を示し,理論的な知見を裏付ける数値的な例を示す。
結論として,提案手法の任意の時間アルゴリズムと有界合理性との関係を詳述した議論を行った。
関連論文リスト
- Symbolic Parameter Learning in Probabilistic Answer Set Programming [0.16385815610837165]
本稿では,確率的集合プログラミングの形式化を解くための2つのアルゴリズムを提案する。
第一に、オフザシェルフ制約最適化ソルバを用いてタスクを解く。
2つ目は期待最大化アルゴリズムの実装に基づいている。
論文 参考訳(メタデータ) (2024-08-16T13:32:47Z) - Provable Representation with Efficient Planning for Partial Observable Reinforcement Learning [74.67655210734338]
ほとんどの実世界の強化学習アプリケーションでは、状態情報は部分的にしか観測できないため、マルコフ決定プロセスの仮定を破る。
我々は、部分的な観察から実践的な強化学習のためのコヒーレントな枠組みと抽出可能なアルゴリズムアプローチへと導く表現に基づく視点を開発する。
提案アルゴリズムは,様々なベンチマークで部分的な観察を行い,最先端の性能を超えることができることを実証的に実証した。
論文 参考訳(メタデータ) (2023-11-20T23:56:58Z) - Consciousness-Inspired Spatio-Temporal Abstractions for Better Generalization in Reinforcement Learning [83.41487567765871]
Skipperはモデルベースの強化学習フレームワークである。
これは、与えられたタスクをより小さく、より管理しやすいサブタスクに自動的に一般化する。
環境の関連部分には、スパースな意思決定と集中した抽象化を可能にする。
論文 参考訳(メタデータ) (2023-09-30T02:25:18Z) - From Probabilistic Programming to Complexity-based Programming [0.5874142059884521]
本稿では,CompLogという新しい計算フレームワークの主な特徴と実装について述べる。
ProbLogのような確率的プログラミングシステムにインスパイアされたCompLogは、Simplicity Theoryによって提案された推論メカニズムに基づいている。
提案システムでは,ある状況の予期せぬ事柄を,元投稿や元被写体で計算することができる。
論文 参考訳(メタデータ) (2023-07-28T10:11:01Z) - A Linear Programming Approach for Resource-Aware Information-Theoretic
Tree Abstractions [16.565205172451662]
本稿では,資源制約のある自律エージェントに対して,タスク関連,マルチレゾリューション,環境抽象化を実現するための整数線形プログラミングの定式化について述べる。
本稿では,信号圧縮のための階層木構造,信号エンコーダ,情報理論手法を共通テーマの下で統一する方法について述べる。
多分解能木の空間上の情報理論的抽象問題は、整数線形プログラミング(ILP)問題として定式化できることが示されている。
論文 参考訳(メタデータ) (2022-08-08T15:44:09Z) - Geometric Methods for Sampling, Optimisation, Inference and Adaptive
Agents [102.42623636238399]
我々は,サンプリング,最適化,推論,適応的意思決定といった問題に根ざした基本的な幾何学的構造を同定する。
これらの問題を効率的に解くためにこれらの幾何学的構造を利用するアルゴリズムを導出する。
論文 参考訳(メタデータ) (2022-03-20T16:23:17Z) - Leveraging Unlabeled Data for Entity-Relation Extraction through
Probabilistic Constraint Satisfaction [54.06292969184476]
シンボリックドメイン知識の存在下でのエンティティ関係抽出の問題を研究する。
本手法では,論理文の正確な意味を捉える意味的損失を用いる。
低データ体制に焦点をあてて、セマンティックな損失がベースラインをはるかに上回ることを示す。
論文 参考訳(メタデータ) (2021-03-20T00:16:29Z) - Information-Theoretic Abstractions for Resource-Constrained Agents via
Mixed-Integer Linear Programming [11.247580943940916]
本稿では,資源制約エージェントに対するタスク関連多解像度グラフ抽象化問題に対する混合整数線形プログラミングの定式化について述べる。
非自明な数値例を提示し、リソース限定エージェントの階層的ツリー抽象化のアプローチを用いた実用性を示す。
論文 参考訳(メタデータ) (2021-02-19T16:34:47Z) - Loss Bounds for Approximate Influence-Based Abstraction [81.13024471616417]
影響に基づく抽象化は、システムの残りの部分が与える「影響」とともに、局所的なサブプロブレムをモデル化することでレバレッジを得ることを目的としている。
本稿では,理論的観点から,そのような手法の性能について考察する。
交叉エントロピーで訓練されたニューラルネットワークは、近似的な影響表現を学習するのに適していることを示す。
論文 参考訳(メタデータ) (2020-11-03T15:33:10Z) - A General Framework for Consistent Structured Prediction with Implicit
Loss Embeddings [113.15416137912399]
構造化予測のための理論的・アルゴリズム的な枠組みを提案し,解析する。
問題に対して適切な幾何を暗黙的に定義する、損失関数の大規模なクラスについて検討する。
出力空間を無限の濃度で扱うとき、推定子の適切な暗黙の定式化が重要であることが示される。
論文 参考訳(メタデータ) (2020-02-13T10:30:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。