論文の概要: ReVoLT: Relational Reasoning and Voronoi Local Graph Planning for
Target-driven Navigation
- arxiv url: http://arxiv.org/abs/2301.02382v2
- Date: Tue, 10 Jan 2023 06:06:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 14:07:39.373629
- Title: ReVoLT: Relational Reasoning and Voronoi Local Graph Planning for
Target-driven Navigation
- Title(参考訳): ReVoLT: ターゲット駆動ナビゲーションのための関係推論とボロノイ局所グラフ計画
- Authors: Junjia Liu, Jianfei Guo, Zehui Meng, Jingtao Xue
- Abstract要約: Embodied AIは、知的な実体と現実世界の相互作用を強調する必然的なトレンドである。
グラフニューラルネットワーク(GNN)によるレイアウト関係の活用に関する研究
このタスクを分離し、階層的なフレームワークであるReVoLTを提案する。
- 参考スコア(独自算出の注目度): 1.0896567381206714
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Embodied AI is an inevitable trend that emphasizes the interaction between
intelligent entities and the real world, with broad applications in Robotics,
especially target-driven navigation. This task requires the robot to find an
object of a certain category efficiently in an unknown domestic environment.
Recent works focus on exploiting layout relationships by graph neural networks
(GNNs). However, most of them obtain robot actions directly from observations
in an end-to-end manner via an incomplete relation graph, which is not
interpretable and reliable. We decouple this task and propose ReVoLT, a
hierarchical framework: (a) an object detection visual front-end, (b) a
high-level reasoner (infers semantic sub-goals), (c) an intermediate-level
planner (computes geometrical positions), and (d) a low-level controller
(executes actions). ReVoLT operates with a multi-layer semantic-spatial
topological graph. The reasoner uses multiform structured relations as priors,
which are obtained from combinatorial relation extraction networks composed of
unsupervised GraphSAGE, GCN, and GraphRNN-based Region Rollout. The reasoner
performs with Upper Confidence Bound for Tree (UCT) to infer semantic
sub-goals, accounting for trade-offs between exploitation (depth-first
searching) and exploration (regretting). The lightweight intermediate-level
planner generates instantaneous spatial sub-goal locations via an online
constructed Voronoi local graph. The simulation experiments demonstrate that
our framework achieves better performance in the target-driven navigation tasks
and generalizes well, which has an 80% improvement compared to the existing
state-of-the-art method. The code and result video will be released at
https://ventusff.github.io/ReVoLT-website/.
- Abstract(参考訳): Embodied AIは、インテリジェントなエンティティと現実世界の相互作用を強調する必然的なトレンドであり、ロボティクス、特にターゲット駆動ナビゲーションに広く応用されている。
このタスクは、未知の家庭環境において、特定のカテゴリーのオブジェクトを効率的に見つけることを必要とする。
最近の研究は、グラフニューラルネットワーク(GNN)によるレイアウト関係の活用に焦点を当てている。
しかし、ほとんどのロボットは、不完全な関係グラフを通して、エンドツーエンドで観察から直接ロボットの動作を得るが、これは解釈可能で信頼性に欠ける。
このタスクを分離し、階層的なフレームワークであるReVoLTを提案する。
(a)物体検出用視覚フロントエンド
(b)高水準推論者(意味サブゴールを推定する)
(c)中間レベルプランナー(幾何学的位置を計算)、及び
(d)低レベルコントローラ(アクションの実行)。
ReVoLTは多層意味空間トポロジグラフで動作する。
推論器は、教師なしグラフsage、gcn、およびgraphrnnベースの領域ロールアウトからなる組合せ関係抽出ネットワークから得られる、事前としてマルチフォーム構造化関係を用いる。
セマンティックなサブゴールを推論し、エクスプロイト(深み優先探索)と探索(参照)のトレードオフを考慮し、アッパー信頼境界木(UCT)で実行します。
軽量中間レベルプランナーは、オンライン構築されたボロノイ局所グラフを介して、瞬時空間的な部分ゴール位置を生成する。
シミュレーション実験により,本フレームワークは目標駆動型ナビゲーションタスクの性能向上と,既存の最先端手法と比較して80%向上した一般化を実現していることが示された。
コードと結果のビデオはhttps://ventusff.github.io/ReVoLT-website/で公開される。
関連論文リスト
- Heuristic Learning with Graph Neural Networks: A Unified Framework for Link Prediction [25.87108956561691]
リンク予測はグラフ学習における基本的なタスクであり、本質的にグラフのトポロジーによって形作られる。
種々の重みを適応・一般化するための統一行列定式化を提案する。
また,この定式化を効率的に実装するためのHuristic Learning Graph Neural Network (HL-GNN)を提案する。
論文 参考訳(メタデータ) (2024-06-12T08:05:45Z) - Can Graph Learning Improve Planning in LLM-based Agents? [61.47027387839096]
言語エージェントにおけるタスクプランニングは、大規模言語モデル(LLM)の開発とともに重要な研究トピックとして浮上している。
本稿では,課題計画のためのグラフ学習に基づく手法について検討する。
我々のグラフ学習への関心は、注意のバイアスと自己回帰的損失が、グラフ上の意思決定を効果的にナビゲートするLLMの能力を妨げているという理論的な発見に起因している。
論文 参考訳(メタデータ) (2024-05-29T14:26:24Z) - Active Neural Topological Mapping for Multi-Agent Exploration [24.91397816926568]
マルチエージェント協調探索問題では、複数のエージェントが限られた時間で感覚信号を介して見えない環境を探索する必要がある。
トポロジカルマップは、抽象的だが不可欠な情報を持つノードとエッジのみからなる、有望な代替手段である。
深層強化学習は、高速なエンドツーエンド推論を通じて(ほぼ)最適ポリシーを学ぶ大きな可能性を示している。
マルチエージェント探索作業における探索効率の向上と一般化を目的とした,Multi-Agent Neural Topological Mapping (MANTM)を提案する。
論文 参考訳(メタデータ) (2023-11-01T03:06:14Z) - SimTeG: A Frustratingly Simple Approach Improves Textual Graph Learning [131.04781590452308]
テキストグラフ学習におけるフラストレーションに富んだアプローチであるSimTeGを提案する。
まず、下流タスクで予め訓練されたLM上で、教師付きパラメータ効率の微調整(PEFT)を行う。
次に、微調整されたLMの最後の隠れ状態を用いてノード埋め込みを生成する。
論文 参考訳(メタデータ) (2023-08-03T07:00:04Z) - Cell Attention Networks [25.72671436731666]
グラフの頂点上で定義されたデータを操作するニューラルネットワークであるCell Attention Networks (CANs)を紹介する。
CANは、細胞複合体にコードされているように、下部と上部の地区を利用して、2つの独立したマスク付き自己保持機構を設計する。
実験結果から,CANはグラフベースの学習課題における技術結果と同等に比較可能な,低複雑性戦略であることが示唆された。
論文 参考訳(メタデータ) (2022-09-16T21:57:39Z) - Automatic Relation-aware Graph Network Proliferation [182.30735195376792]
GNNを効率的に検索するためのARGNP(Automatic Relation-Aware Graph Network Proliferation)を提案する。
これらの操作は階層的なノード/リレーショナル情報を抽出し、グラフ上のメッセージパッシングのための異方的ガイダンスを提供する。
4つのグラフ学習タスクのための6つのデータセットの実験により、我々の手法によって生成されたGNNは、現在最先端の手作りおよび検索に基づくGNNよりも優れていることが示された。
論文 参考訳(メタデータ) (2022-05-31T10:38:04Z) - Multi-Robot Active Mapping via Neural Bipartite Graph Matching [49.72892929603187]
本稿では,最小時間ステップにおけるシーンマップ構築の完全化を目的としたマルチロボットアクティブマッピングの問題点について検討する。
この問題の鍵は、より効率的なロボットの動きを可能にするゴール位置推定にある。
本稿では,ニューラルコマッピング(NeuralCoMapping)という新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-30T14:03:17Z) - Temporal Graph Network Embedding with Causal Anonymous Walks
Representations [54.05212871508062]
本稿では,時間グラフネットワークに基づく動的ネットワーク表現学習のための新しいアプローチを提案する。
評価のために、時間的ネットワーク埋め込みの評価のためのベンチマークパイプラインを提供する。
欧州の大手銀行が提供した実世界のダウンストリームグラフ機械学習タスクにおいて、我々のモデルの適用性と優れた性能を示す。
論文 参考訳(メタデータ) (2021-08-19T15:39:52Z) - A Task-Motion Planning Framework Using Iteratively Deepened AND/OR Graph
Networks [1.3535770763481902]
本稿では,TMP-IDAN (Iterative Deepened and/OR Graph Networks) を用いたタスク移動計画手法を提案する。
TMP-IDANはタスクレベルの状態とアクションをコンパクトに表現するためにAND/ORグラフネットワークベースの新しい抽象化を使用する。
バクスターロボットと最先端のロボティクスシミュレーターを用いて、アプローチの検証と能力評価を行います。
論文 参考訳(メタデータ) (2021-04-04T07:06:52Z) - Learning Long-term Visual Dynamics with Region Proposal Interaction
Networks [75.06423516419862]
オブジェクト間およびオブジェクト環境間の相互作用を長距離にわたってキャプチャするオブジェクト表現を構築します。
単純だが効果的なオブジェクト表現のおかげで、我々の手法は先行手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2020-08-05T17:48:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。