論文の概要: Active Inference for an Intelligent Agent in Autonomous Reconnaissance Missions
- arxiv url: http://arxiv.org/abs/2510.17450v1
- Date: Mon, 20 Oct 2025 11:35:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.432756
- Title: Active Inference for an Intelligent Agent in Autonomous Reconnaissance Missions
- Title(参考訳): 自律偵察ミッションにおけるインテリジェントエージェントのアクティブ推論
- Authors: Johan Schubert, Farzad Kamrani, Tove Gustavi,
- Abstract要約: 我々は知的エージェントの自律制御のための能動的推論経路計画法を開発した。
目的は、共通の運用図を維持するために、地理的領域を偵察することである。
- 参考スコア(独自算出の注目度): 0.764671395172401
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop an active inference route-planning method for the autonomous control of intelligent agents. The aim is to reconnoiter a geographical area to maintain a common operational picture. To achieve this, we construct an evidence map that reflects our current understanding of the situation, incorporating both positive and "negative" sensor observations of possible target objects collected over time, and diffusing the evidence across the map as time progresses. The generative model of active inference uses Dempster-Shafer theory and a Gaussian sensor model, which provides input to the agent. The generative process employs a Bayesian approach to update a posterior probability distribution. We calculate the variational free energy for all positions within the area by assessing the divergence between a pignistic probability distribution of the evidence map and a posterior probability distribution of a target object based on the observations, including the level of surprise associated with receiving new observations. Using the free energy, we direct the agents' movements in a simulation by taking an incremental step toward a position that minimizes the free energy. This approach addresses the challenge of exploration and exploitation, allowing agents to balance searching extensive areas of the geographical map while tracking identified target objects.
- Abstract(参考訳): 我々は知的エージェントの自律制御のための能動的推論経路計画法を開発した。
目的は、共通の運用図を維持するために、地理的領域を偵察することである。
これを実現するために,我々は現状の理解を反映したエビデンスマップを構築し,時間とともに収集される可能性のある対象物の正と負の両方のセンサ観測を取り入れ,時間とともにそのエビデンスを拡散させる。
活性推論の生成モデルは、エージェントへの入力を提供するDempster-Shafer理論とガウスセンサモデルを用いる。
生成過程は、後続確率分布を更新するためにベイズ的アプローチを用いる。
実験結果に基づいて,証拠マップの確率分布と対象物体の確率分布との相違性を評価することにより,領域内の全ての位置に対する変動自由エネルギーを算出した。
自由エネルギーを用いてエージェントの動きをシミュレーションし、自由エネルギーを最小化する位置に向けて段階的に進む。
このアプローチは探索と搾取の課題に対処し、エージェントは特定対象物を追跡しながら地理的地図の広い領域を探索するバランスをとることができる。
関連論文リスト
- Adaptive Target Localization under Uncertainty using Multi-Agent Deep Reinforcement Learning with Knowledge Transfer [15.605693371392212]
本研究は,不確実環境におけるターゲット位置推定のためのMADRLに基づく新しい手法を提案する。
エージェントの観察は、環境に不可欠な情報を捉えるために最適化された方法で設計されている。
ディープラーニングモデルは、MADRLモデルからの知識に基づいて、到達不可能な場合のターゲット位置を正確に推定する。
論文 参考訳(メタデータ) (2025-01-19T02:58:22Z) - Diffusion as Reasoning: Enhancing Object Navigation via Diffusion Model Conditioned on LLM-based Object-Room Knowledge [9.465351278799016]
我々はObjectNavタスクの強化のための新しいアプローチを提案する。
我々は拡散モデルを訓練し、セマンティックマップにおけるオブジェクトの統計分布パターンを学習する。
ナビゲーション中の探索領域の地図を未知領域の地図を生成する条件として利用することにより,対象対象物の長期的目標推論を実現する。
論文 参考訳(メタデータ) (2024-10-29T08:10:06Z) - Diffusion Models for Multi-target Adversarial Tracking [0.49157446832511503]
標的追跡は現実世界のシナリオ、特に薬物輸送の対話において重要な役割を担っている。
無人ドローンの普及に伴い、安全と安全のためには正確な自律目標推定がさらに重要である。
本稿では、敵位置の包括的予測を生成するアプローチであるCADENCE(Constrained Agent-based Diffusion for Enhanced Multi-Agent Tracking)を提案する。
論文 参考訳(メタデータ) (2023-07-12T15:34:39Z) - Trajectory Forecasting from Detection with Uncertainty-Aware Motion
Encoding [121.66374635092097]
物体検出と追跡から得られる軌道は、必然的にうるさい。
本稿では, 明示的に形成された軌道に依存することなく, 直接検出結果に基づく軌道予測器を提案する。
論文 参考訳(メタデータ) (2022-02-03T09:09:56Z) - Information is Power: Intrinsic Control via Information Capture [110.3143711650806]
我々は,潜時状態空間モデルを用いて推定したエージェントの状態訪問のエントロピーを最小化する,コンパクトで汎用的な学習目的を論じる。
この目的は、不確実性の低減に対応する環境情報収集と、将来の世界状態の予測不可能性の低減に対応する環境制御の両方をエージェントに誘導する。
論文 参考訳(メタデータ) (2021-12-07T18:50:42Z) - Adversarial Intrinsic Motivation for Reinforcement Learning [60.322878138199364]
政策状態の訪問分布と目標分布とのワッサースタイン-1距離が強化学習タスクに有効に活用できるかどうかを検討する。
我々のアプローチは、AIM (Adversarial Intrinsic Motivation) と呼ばれ、このワッサーシュタイン-1距離をその双対目的を通して推定し、補足報酬関数を計算する。
論文 参考訳(メタデータ) (2021-05-27T17:51:34Z) - Modulation of viability signals for self-regulatory control [1.370633147306388]
適応行動のドライバとしてのインストゥルメンタルバリューの役割を再考する。
強化学習タスクでは、好みの分布が報酬の概念に取って代わる。
論文 参考訳(メタデータ) (2020-07-18T01:11:51Z) - Traffic Agent Trajectory Prediction Using Social Convolution and
Attention Mechanism [57.68557165836806]
本稿では,自律走行車周辺における標的エージェントの軌道予測モデルを提案する。
対象エージェントの履歴トラジェクトリをアテンションマスクとしてエンコードし、ターゲットエージェントとその周辺エージェント間の対話関係をエンコードするソーシャルマップを構築する。
提案手法の有効性を検証するため,提案手法を公開データセット上の複数の手法と比較し,20%の誤差低減を実現した。
論文 参考訳(メタデータ) (2020-07-06T03:48:08Z) - Maximizing Information Gain in Partially Observable Environments via
Prediction Reward [64.24528565312463]
本稿では,深いRLエージェントに対する信念に基づく報酬の活用という課題に取り組む。
負のエントロピーと予測される予測報酬の正確な誤差を導出する。
この洞察は、予測報酬を用いたいくつかの分野の理論的動機を与える。
論文 参考訳(メタデータ) (2020-05-11T08:13:49Z) - InfoBot: Transfer and Exploration via the Information Bottleneck [105.28380750802019]
強化学習における中心的な課題は、報酬がわずかに分散されたタスクに対する効果的なポリシーを見つけることである。
我々は、事前の経験から意思決定状態について学ぶことを提案する。
この単純なメカニズムは、部分的に観察された状態であっても、決定状態を効果的に識別する。
論文 参考訳(メタデータ) (2019-01-30T15:33:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。