論文の概要: DIFF-IPPO: Diffusion-Based Informative Path Planning with Open-Vocabulary Belief Maps
- arxiv url: http://arxiv.org/abs/2606.16780v2
- Date: Thu, 18 Jun 2026 10:52:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 13:55:51.618204
- Title: DIFF-IPPO: Diffusion-Based Informative Path Planning with Open-Vocabulary Belief Maps
- Title(参考訳): DIFF-IPPO:開語彙分布図を用いた拡散型インフォーマティブパス計画
- Authors: Sausar Karaf, Oleg Sautenkov, Mikhail Martynov, Dzmitry Tsetserukou,
- Abstract要約: オープンボキャブラリ信念マップ生成器と拡散型プランナを統合したパイプラインであるDIFF-IPPOを提案する。
この方法は、高信頼領域にセンサーのカバレッジを集中させ、異なるデータセットのシナリオで81.49%から86.55%の正規化検出スコアを達成するトラジェクトリを生成する。
- 参考スコア(独自算出の注目度): 2.1806251298441817
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Exploration and object search require robots to perceive their environment, identify regions of interest, and plan trajectories that improve target-detection likelihood or maximize information gain. Many IPP methods, especially in continuous environmental monitoring, rely on Gaussian-process belief models, while object-search settings often produce complex, multimodal belief maps from semantic or open-vocabulary perception. Global trajectory generation directly conditioned on such non-Gaussian belief maps remains comparatively underexplored. Although diffusion-based planners offer strong capabilities for modeling such distributions, their use in informative path planning remains limited. In this work, we propose DIFF-IPPO, a pipeline that integrates an open-vocabulary belief map generator with a diffusion-based planner for global trajectory generation over belief maps. The method generates trajectories that concentrate sensor coverage over high-belief regions, achieving normalized detection scores between 81.49% and 86.55% across different dataset scenarios. We validate the system in a simulated search-and-rescue scenario where the planner searches candidate building regions to locate a burning building. In this setting, a team of five drones using batched belief-map-conditioned trajectory generation achieves first detections in 3.5 minutes.
- Abstract(参考訳): 探索と対象探索は、ロボットが環境を知覚し、関心のある領域を特定し、目標検出の可能性を高め、情報の獲得を最大化するための計画的軌跡を必要とする。
多くのIPP法、特に継続的環境モニタリングでは、ガウス過程の信念モデルに依存し、一方、オブジェクト検索の設定は、意味論やオープンボキャブラリの知覚から複雑なマルチモーダルな信念マップを生成する。
このような非ガウス的信念写像上で直接条件付けられた大域的軌道生成は、相対的に過小評価されている。
拡散型プランナーはそのような分布をモデル化する強力な能力を提供するが、情報的経路計画における使用は限定的である。
本研究では,オープンボキャブラリ信念マップ生成器と拡散型プランナを統合したパイプラインであるDIFF-IPPOを提案する。
この方法は、高信頼領域にセンサーのカバレッジを集中させ、異なるデータセットのシナリオで81.49%から86.55%の正規化検出スコアを達成するトラジェクトリを生成する。
提案手法は, 計画立案者が建築候補地を探索し, 燃える建物の位置を推定する, 模擬検索・救助のシナリオで検証する。
この設定では、5つのドローンからなるチームが、バッチ化された信念マップ条件付き軌道生成を使用して3.5分で最初の検出を行う。
関連論文リスト
- Explore From Sketch: Accelerating UAV Exploration in Large-scale Environments with Prior Maps [20.559950853029]
本稿では,LiDARをベースとしたUAV探査において,スパース,アンアライメント,さらには2次元事前地図の離散化を生かした新しい探索フレームワークを提案する。
ベンチマーク評価では、探査効率が34.2%向上し、飛行距離が37.9%減少した。
論文 参考訳(メタデータ) (2026-06-10T06:30:29Z) - Generative MIMO Beam Map Construction for Location Recovery and Beam Tracking [67.65578956523403]
本稿では,スパースチャネル状態情報(CSI)から位置ラベルを直接復元する生成フレームワークを提案する。
生のCSIを直接格納する代わりに、小型の低次元無線地図の埋め込みを学び、生成モデルを利用して高次元CSIを再構築する。
数値実験により,NLOSシナリオにおける局所化精度が30%以上向上し,20%のキャパシティゲインが得られることが示された。
論文 参考訳(メタデータ) (2025-11-21T07:25:49Z) - Semantic Exploration and Dense Mapping of Complex Environments using Ground Robot with Panoramic LiDAR-Camera Fusion [10.438142938687326]
本稿では,LiDAR-パノラマカメラスイートを備えた地上ロボットを用いて,複雑な未知環境の自律的セマンティック探索と密集的セマンティックターゲットマッピングを行うシステムを提案する。
そこで我々はまず,幾何的カバレッジと意味的視点の両方の観察を完遂するタスクを再定義し,その後,意味的視点と幾何学的視点を別々に管理し,局所的な視点を生成するための新たな優先順位駆動型デカップリング型局所サンプリングを提案する。
さらに,ロボットの安全性を確保しつつ,積極的な探索行動を可能にする安全な攻撃的探索状態マシンを提案する。
論文 参考訳(メタデータ) (2025-05-28T21:27:32Z) - Diffusion as Reasoning: Enhancing Object Navigation via Diffusion Model Conditioned on LLM-based Object-Room Knowledge [9.465351278799016]
我々はObjectNavタスクの強化のための新しいアプローチを提案する。
我々は拡散モデルを訓練し、セマンティックマップにおけるオブジェクトの統計分布パターンを学習する。
ナビゲーション中の探索領域の地図を未知領域の地図を生成する条件として利用することにより,対象対象物の長期的目標推論を実現する。
論文 参考訳(メタデータ) (2024-10-29T08:10:06Z) - Mapping High-level Semantic Regions in Indoor Environments without
Object Recognition [50.624970503498226]
本研究では,屋内環境における埋め込みナビゲーションによる意味領域マッピング手法を提案する。
地域識別を実現するために,視覚言語モデルを用いて地図作成のためのシーン情報を提供する。
グローバルなフレームにエゴセントリックなシーン理解を投影することにより、提案手法は各場所の可能な領域ラベル上の分布としてのセマンティックマップを生成する。
論文 参考訳(メタデータ) (2024-03-11T18:09:50Z) - Radio Map Estimation -- An Open Dataset with Directive Transmitter
Antennas and Initial Experiments [49.61405888107356]
実世界の現実的な都市地図とオープンなデータソースからの航空画像とともに、シミュレーションされた経路損失無線マップのデータセットをリリースする。
モデルアーキテクチャ,入力特徴設計,航空画像からの無線マップの推定に関する実験を行った。
論文 参考訳(メタデータ) (2024-01-12T14:56:45Z) - Three-Way Deep Neural Network for Radio Frequency Map Generation and
Source Localization [67.93423427193055]
空間、時間、周波数領域にわたる無線スペクトルのモニタリングは、5Gと6G以上の通信技術において重要な特徴となる。
本稿では,空間領域全体にわたる不規則分散計測を補間するGAN(Generative Adversarial Network)機械学習モデルを提案する。
論文 参考訳(メタデータ) (2021-11-23T22:25:10Z) - Large-scale Autonomous Flight with Real-time Semantic SLAM under Dense
Forest Canopy [48.51396198176273]
本研究では,大規模自律飛行とリアルタイムセマンティックマッピングを,挑戦的なアンダーキャノピー環境下で実現可能な統合システムを提案する。
我々は、スキャン全体で関連付けられ、木のトランクモデルと同様にロボットのポーズを制約するために使用されるLiDARデータから、木の幹と地面の平面を検出し、モデル化する。
ドリフト補償機構は、プランナー最適性とコントローラ安定性を維持しつつ、セマンティックSLAM出力を用いたドリフトをリアルタイムで最小化するように設計されている。
論文 参考訳(メタデータ) (2021-09-14T07:24:53Z) - Real-time Outdoor Localization Using Radio Maps: A Deep Learning
Approach [59.17191114000146]
LocUNet: ローカライゼーションタスクのための畳み込み、エンドツーエンドのトレーニングニューラルネットワーク(NN)。
我々は,LocUNetがユーザを最先端の精度でローカライズし,無線マップ推定における不正確性が高いことを示す。
論文 参考訳(メタデータ) (2021-06-23T17:27:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。