論文の概要: MMP-A*: Multimodal Perception Enhanced Incremental Heuristic Search on Path Planning
- arxiv url: http://arxiv.org/abs/2601.01910v1
- Date: Mon, 05 Jan 2026 08:55:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.922927
- Title: MMP-A*: Multimodal Perception Enhanced Incremental Heuristic Search on Path Planning
- Title(参考訳): MMP-A*:経路計画におけるマルチモーダル知覚強化型インクリメンタルヒューリスティック探索
- Authors: Minh Hieu Ha, Khanh Ly Ta, Hung Phan, Tung Doan, Tung Dao, Dao Tran, Huynh Thi Thanh Binh,
- Abstract要約: MMP-A* は、視覚言語モデルの空間的接地機能と、新しい適応的減衰機構を統合するマルチモーダルフレームワークである。
MMP-A* は操作コストを大幅に削減し, ほぼ最適軌道を達成できることを示す。
- 参考スコア(独自算出の注目度): 8.522882937983972
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous path planning requires a synergy between global reasoning and geometric precision, especially in complex or cluttered environments. While classical A* is valued for its optimality, it incurs prohibitive computational and memory costs in large-scale scenarios. Recent attempts to mitigate these limitations by using Large Language Models for waypoint guidance remain insufficient, as they rely only on text-based reasoning without spatial grounding. As a result, such models often produce incorrect waypoints in topologically complex environments with dead ends, and lack the perceptual capacity to interpret ambiguous physical boundaries. These inconsistencies lead to costly corrective expansions and undermine the intended computational efficiency. We introduce MMP-A*, a multimodal framework that integrates the spatial grounding capabilities of vision-language models with a novel adaptive decay mechanism. By anchoring high-level reasoning in physical geometry, the framework produces coherent waypoint guidance that addresses the limitations of text-only planners. The adaptive decay mechanism dynamically regulates the influence of uncertain waypoints within the heuristic, ensuring geometric validity while substantially reducing memory overhead. To evaluate robustness, we test the framework in challenging environments characterized by severe clutter and topological complexity. Experimental results show that MMP-A* achieves near-optimal trajectories with significantly reduced operational costs, demonstrating its potential as a perception-grounded and computationally efficient paradigm for autonomous navigation.
- Abstract(参考訳): 自律的な経路計画には、大域的推論と幾何学的精度の相乗効果、特に複雑な環境や散在した環境において必要である。
古典的A*はその最適性から評価されているが、大規模シナリオでは計算とメモリのコストが禁じられている。
近年,大規模言語モデルを用いた経路案内による制限緩和の試みは,空間的根拠のないテキストベースの推論にのみ依存するため,まだまだ不十分である。
結果として、そのようなモデルはしばしば、死の端を持つ位相的に複雑な環境で誤った経路ポイントを生成し、曖昧な物理的境界を解釈する知覚能力が欠如している。
これらの矛盾は、コストのかかる修正拡張をもたらし、意図された計算効率を損なう。
MMP-A*は,視覚言語モデルの空間的接地機能と,新たな適応的減衰機構を融合したマルチモーダルフレームワークである。
物理幾何学における高レベルの推論を固定することにより、このフレームワークはテキストのみのプランナの制限に対処するコヒーレントなウェイポイントガイダンスを生成する。
適応減衰機構は、ヒューリスティック内の不確実な経路点の影響を動的に制御し、メモリオーバーヘッドを大幅に低減し、幾何的妥当性を確保する。
強靭性を評価するため,厳密な乱雑さとトポロジカルな複雑さを特徴とする難易度環境において,この枠組みを検証した。
実験結果から,MMP-A* は運転コストを大幅に削減し,自律航法における知覚的かつ計算学的に効率的なパラダイムとしての可能性を示した。
関連論文リスト
- Discrete-Guided Diffusion for Scalable and Safe Multi-Robot Motion Planning [56.240199425429445]
マルチロボット運動計画(MPMP)は、共有された連続作業空間で動作する複数のロボットのための軌道を生成する。
離散マルチエージェント探索(MAPF)法は,その拡張性から広く採用されているが,粗い離散化の軌道品質は高い。
本稿では、制約付き生成拡散モデルを用いた離散MAPF解法を導入することにより、2つのアプローチの限界に対処する。
論文 参考訳(メタデータ) (2025-08-27T17:59:36Z) - Feature-Space Planes Searcher: A Universal Domain Adaptation Framework for Interpretability and Computational Efficiency [7.889121135601528]
現在の教師なし領域適応法は微調整特徴抽出器に依存している。
領域適応フレームワークとしてFPS(Feature-space Planes Searcher)を提案する。
FPSは最先端の手法と比較して,競争力や性能に優れることを示す。
論文 参考訳(メタデータ) (2025-08-26T05:39:21Z) - A Pseudo Global Fusion Paradigm-Based Cross-View Network for LiDAR-Based Place Recognition [12.93382945887946]
LiDARベースのPlace Recognition(LPR)は、Embodied Artificial Intelligence(AI)とAutonomous Drivingにおいて重要なタスクである。
既存のアプローチは、ユークリッド距離に基づく距離学習タスクへの位置認識を減らし、特徴空間の固有の構造やクラス内分散を無視している。
本稿では,これらの課題に対処する革新的な融合パラダイムに基づく,新しいクロスビューネットワークを提案する。
論文 参考訳(メタデータ) (2025-08-12T13:12:48Z) - Topology-Assisted Spatio-Temporal Pattern Disentangling for Scalable MARL in Large-scale Autonomous Traffic Control [14.929720580977152]
本稿では,動的グラフニューラルネットワーク(DGNN)とトポロジカルデータ解析(TDA)を統合した新しいMARLフレームワークを提案する。
大規模言語モデル (LLMs) におけるMixture of Experts (MoE) アーキテクチャに着想を得て, 位相支援型空間パターンアンタングリング (TSD) 強化型MoEを提案する。
実世界の交通シナリオにおいて行われた大規模な実験は、包括的な理論的分析とともに、提案フレームワークの優れた性能を検証した。
論文 参考訳(メタデータ) (2025-06-14T11:18:12Z) - Efficient Transformed Gaussian Process State-Space Models for Non-Stationary High-Dimensional Dynamical Systems [49.819436680336786]
本研究では,高次元非定常力学系のスケーラブルかつ柔軟なモデリングのための効率的な変換ガウス過程状態空間モデル(ETGPSSM)を提案する。
具体的には、ETGPSSMは、単一の共有GPと入力依存の正規化フローを統合し、複雑な非定常遷移ダイナミクスを捉える前に、表現的な暗黙のプロセスを生成する。
ETGPSSMは、計算効率と精度の観点から、既存のGPSSMとニューラルネットワークベースのSSMより優れています。
論文 参考訳(メタデータ) (2025-03-24T03:19:45Z) - Localized Physics-informed Gaussian Processes with Curriculum Training for Topology Optimization [3.6352820455705372]
物理インフォームドガウス過程(GP)に基づく同時かつメッシュフリーなトポロジー最適化(TO)フレームワークを提案する。
我々のフレームワークは、カスタマイズされたディープニューラルネットワーク(DNN)を介してパラメータ化される共有のマルチアウトプット平均関数を持つGPプリエントを介して、すべての設計と状態変数を提供する。
我々のTOアプローチは、適切に定義された材料インターフェースを生成し、グローバルな最適性を促進するための継続特性を内蔵している。
論文 参考訳(メタデータ) (2025-03-18T22:59:16Z) - Efficient High-Resolution Visual Representation Learning with State Space Model for Human Pose Estimation [60.80423207808076]
高解像度の視覚表現を維持しながら長距離依存関係をキャプチャすることは、人間のポーズ推定のような密集した予測タスクに不可欠である。
マルチスケールの畳み込み操作で視覚状態空間モデルを拡張する動的ビジュアル状態空間(DVSS)ブロックを提案する。
HRVMambaは効率的な高分解能表現学習のための新しいモデルである。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - LLM-A*: Large Language Model Enhanced Incremental Heuristic Search on Path Planning [91.95362946266577]
経路計画はロボット工学と自律航法における基本的な科学的問題である。
A*やその変種のような伝統的なアルゴリズムは、パスの妥当性を保証することができるが、状態空間が大きくなるにつれて、計算とメモリの非効率が著しく低下する。
本稿では, A* の正確なパスフィニング能力と LLM のグローバルな推論能力とを相乗的に組み合わせた LLM ベースの経路計画法を提案する。
このハイブリッドアプローチは、特に大規模シナリオにおいて、パス妥当性の完全性を維持しながら、時間と空間の複雑さの観点からパスフィニング効率を向上させることを目的としている。
論文 参考訳(メタデータ) (2024-06-20T01:24:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。