論文の概要: Flying by Inference: Active Inference World Models for Adaptive UAV Swarms
- arxiv url: http://arxiv.org/abs/2604.27935v1
- Date: Thu, 30 Apr 2026 14:34:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.141269
- Title: Flying by Inference: Active Inference World Models for Adaptive UAV Swarms
- Title(参考訳): 推論による飛行: 適応型UAV群に対するアクティブ推論世界モデル
- Authors: Kaleem Arshid, Ali Krayani, Lucio Marcenaro, David Martin Gomez, Carlo Regazzoni,
- Abstract要約: 本稿では,UAVSwarm軌道計画のための専門家誘導型アクティブ推論型フレームワークを提案する。
オフラインフェーズでは、反発力衝突回避の遺伝的アルゴリズムプランナーが専門家によるデモンストレーションを生成し、ミッション、ルート、モーションディクショナリーに抽象化される。
これらの辞書は、専門家のミッションアロケーションがルートオーダを誘導する方法と、ルートオーダがモーションレベルの振る舞いを誘発する方法をキャプチャする確率論的世界モデルを学ぶために使用される。
- 参考スコア(独自算出の注目度): 5.238520207250123
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents an expert-guided active-inference-inspired framework for adaptive UAV swarm trajectory planning. The proposed method converts multi-UAV trajectory design from a repeated combinatorial optimization problem into a hierarchical probabilistic inference problem. In the offline phase, a genetic-algorithm planner with repulsive-force collision avoidance (GA--RF) generates expert demonstrations, which are abstracted into Mission, Route, and Motion dictionaries. These dictionaries are used to learn a probabilistic world model that captures how expert mission allocations induce route orders and how route orders induce motion-level behaviors. During online operation, the UAV swarm evaluates candidate actions by forming posterior beliefs over symbolic states and minimizing KL-divergence-based abnormality indicators with respect to expert-derived reference distributions. This enables mission allocation, route insertion, motion adaptation, and collision-aware replanning without rerunning the offline optimizer. Bayesian state estimators, including EKF and PF modules, are integrated at the motion level to improve trajectory correction under uncertainty. Simulation results show that the proposed framework preserves expert-like planning structure while producing smoother and more stable behavior than modified Q-learning. Additional validation using real-flight UAV trajectory data demonstrates that the learned world model can correct symbolic predictions under noisy and non-smooth observations, supporting its applicability to adaptive UAV swarm autonomy.
- Abstract(参考訳): 本稿では,UAVSwarm軌道計画のための専門家誘導型アクティブ推論型フレームワークを提案する。
提案手法は,複数UAV軌道設計を繰り返し組合せ最適化問題から階層的確率的推論問題に変換する。
オフラインフェーズでは、GA-RF(repulsive-force collision avoidance)を持つ遺伝的アルゴリズムプランナーが専門家によるデモンストレーションを生成し、ミッション、ルート、モーション辞書に抽象化される。
これらの辞書は、専門家のミッションアロケーションがルートオーダを誘導する方法と、ルートオーダがモーションレベルの振る舞いを誘発する方法をキャプチャする確率論的世界モデルを学ぶために使用される。
オンライン運用中、UAV Swarmは、象徴的状態に対する後続の信念を形成し、専門家による基準分布に関するKL偏差に基づく異常指標を最小化することによって、候補行動を評価する。
これにより、オフラインオプティマイザを再実行することなく、ミッションアロケーション、ルート挿入、モーションアダプティブ、衝突対応の再計画が可能になる。
EKFやPFモジュールを含むベイズ状態推定器は運動レベルで統合され、不確実性の下で軌道補正を改善する。
シミュレーションの結果,提案フレームワークはQ-ラーニングよりもスムーズで安定な動作を実現しつつ,専門家的な計画構造を保っていることがわかった。
実飛行UAV軌道データによるさらなる検証は、学習された世界モデルがノイズや非滑らかな観測の下でシンボル予測を修正できることを示し、UAVスウォームの自律性への適応性を支持している。
関連論文リスト
- TopoCurate:Modeling Interaction Topology for Tool-Use Agent Training [53.93696896939915]
訓練用ツール使用エージェントは一般的に、パスレート選択されたタスクに対して、軌道変更の成功と強化学習(RL)に依存している。
TopoCurateは,同一タスクから多段階的なロールアウトを統一的な意味的商トポロジに投影する対話型フレームワークである。
TopoCurateは最先端のベースラインに対して4.2%(SFT)と6.9%(RL)という一貫したゲインを達成している。
論文 参考訳(メタデータ) (2026-03-02T10:38:54Z) - Active Inference-Driven World Modeling for Adaptive UAV Swarm Trajectory Design [5.238520207250123]
本稿では,UAV群における自律軌道設計のための能動推論に基づくフレームワークを提案する。
この方法は確率論的推論と自己学習を統合し、分散ミッションアロケーション、ルートオーダ、モーションプランニングを可能にする。
論文 参考訳(メタデータ) (2026-01-19T10:47:26Z) - Bayesian Active Inference for Intelligent UAV Anti-Jamming and Adaptive Trajectory Planning [5.620125209890186]
本稿では, 逆ジャミング条件下でのUAV動作のための階層的軌道計画手法を提案する。
このアプローチは、専門家が作成したデモと確率的生成モデルを組み合わせて、高レベルなシンボル計画、低レベルなモーションポリシー、無線信号フィードバックを符号化する。
配備中、UAVは妨害を予測し、ジャムマーをローカライズし、ジャムマーの位置を事前に知ることなくその軌道に適応するためのオンライン推論を行う。
論文 参考訳(メタデータ) (2025-12-05T13:38:52Z) - Controllable Generative Trajectory Prediction via Weak Preference Alignment [19.852327330298746]
PrefCVAE(PrefCVAE)は、ラベルの弱い選好ペアを用いて、セマンティック属性を持つ潜在変数を挿入する拡張CVAEフレームワークである。
本研究は,サンプリングベース生成モデルを改善するためのコスト効率の高い方法として,選好監督の有効性を示す。
論文 参考訳(メタデータ) (2025-10-12T18:06:39Z) - Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。
我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。
本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文 参考訳(メタデータ) (2025-09-24T13:35:15Z) - Self-Boost via Optimal Retraining: An Analysis via Approximate Message Passing [58.52119063742121]
独自の予測と潜在的にノイズの多いラベルを使ってモデルをトレーニングすることは、モデルパフォーマンスを改善するためのよく知られた戦略である。
本稿では,モデルの予測と提供ラベルを最適に組み合わせる方法について論じる。
我々の主な貢献は、現在のモデルの予測と与えられたラベルを組み合わせたベイズ最適集約関数の導出である。
論文 参考訳(メタデータ) (2025-05-21T07:16:44Z) - Decision-Oriented Learning with Differentiable Submodular Maximization
for Vehicle Routing Problem [23.211667169614227]
文脈観測(入力)をサブモジュール関数(出力)のパラメータにマッピングする関数の学習問題について検討する。
本稿では,タスク最適化を予測フェーズにおける微分可能な層として組み込んだフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-02T19:19:39Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。