Fugu-MT 論文翻訳(概要): Beyond Isolation: A Unified Benchmark for General-Purpose Navigation

論文の概要: Beyond Isolation: A Unified Benchmark for General-Purpose Navigation

arxiv url: http://arxiv.org/abs/2605.09441v1
Date: Sun, 10 May 2026 09:34:05 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-19 14:40:17.674189
Title: Beyond Isolation: A Unified Benchmark for General-Purpose Navigation
Title（参考訳）: BeyondIsolate: 汎用ナビゲーションのための統一ベンチマーク
Authors: Samson Sun, Tianyi Yang, Tengyue Wang, Yikai Xue, Zhengjie Xu, Lingming Zhang, Qichen Zhang, Chao Liang, Zhipeng Zhang,
Abstract要約: OmniNavBenchは、クロススキルコーディネーションとクロスエボディメントの一般化のためのベンチマークである。本研究では,単形態評価への依存を断ち切るシミュレーションプラットフォームを提案し,ヒューマノイド,四足歩行,車輪付きロボット間の一般化テストを可能にする。我々は、1779年の専門的軌跡を人間の遠隔操作でキュレートし、探索的な視線や予測的回避といった行動のニュアンスを捉えた。
参考スコア（独自算出の注目度）: 25.795669972829018
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The pursuit of general-purpose embodied agents is hindered by fragmented evaluation protocols that isolate navigation skills and fixate on specific robot morphologies, failing to reflect real-world scenarios where agents must orchestrate diverse behaviors across varying embodiments. To bridge this gap, we introduce OmniNavBench, a benchmark for cross-skill coordination and cross-embodiment generalization. OmniNavBench introduces three paradigm shifts: (1) Compositional Complexity. We propose composite instructions that interleave sub-tasks from 6 categories (PointNav, VLN, ObjectNav, SocialNav, Human Following and EQA), compelling agents to transition between exploration, interaction, and social compliance within a single episode. (2) Morphological Universality and Sensor Flexibility. We present a simulation platform that breaks the reliance on single-morphology evaluation, enabling generalization tests across humanoid, quadrupedal, and wheeled robots, with a modular sensor interface and 170 environments blending synthetic assets with real-world scans. (3) Demonstrations Quality. Moving beyond shortest-path algorithms, we curate 1779 expert trajectories via human teleoperation, capturing behavioral nuances such as exploratory glance and anticipatory avoidance. Extensive evaluations demonstrate that current methods, despite their claimed unified design, struggle with the complex, interleaved nature of general-purpose navigation. This exposes a critical disparity between existing capabilities and real-world deployment demands, underscoring OmniNavBench as a testbed for the next generation of generalist navigators. Dataset, code, and leaderboard are available at http://omninavbench.cloud-ip.cc.
Abstract（参考訳）: 汎用エンボディードエージェントの追求は、ナビゲーションスキルを分離し、特定のロボット形態を固定する断片化された評価プロトコルによって妨げられ、エージェントが様々なエンボディーメントにまたがる多様な振る舞いを編成しなければならない現実のシナリオを反映しない。このギャップを埋めるために、クロススキルコーディネーションとクロスエボディメントの一般化のためのベンチマークであるOmniNavBenchを紹介する。 OmniNavBench氏は3つのパラダイムシフトを紹介している。本稿では,6つのカテゴリ(PointNav,VLN,ObjectNav,SocialNav,Human following,EQA)からサブタスクをインターリーブする複合命令を提案する。 (2)形態的普遍性とセンサフレキシビリティ本稿では, 単一形態評価の信頼性を損なうシミュレーションプラットフォームを提案する。ヒューマノイド, 四足歩行ロボット, 車輪付きロボットを対象とし, モジュール型センサインタフェースと170環境の合成資産と実世界のスキャンを混合したシミュレーションプラットフォームを提案する。 (3)デモの質。最短経路アルゴリズムを超えて、1779の専門的軌跡を人間の遠隔操作によってキュレートし、探索的な視線や予測的回避といった行動のニュアンスを捉える。大規模な評価では、現在の手法は統一された設計を主張するにも拘わらず、汎用ナビゲーションの複雑でインターリーブな性質に苦しむことが示されている。これにより、既存の機能と現実世界のデプロイメント要求の間に重要な相違が生じ、次世代のジェネラリストナビゲータのためのテストベッドとしてOmniNavBenchが強調される。データセット、コード、およびリーダーボードはhttp://omninavbench.cloud-ip.cc.comで入手できる。

関連論文リスト

Benchmarking Interaction, Beyond Policy: a Reproducible Benchmark for Collaborative Instance Object Navigation [54.6417539730783]
Question-Asking Navigation (QAsk-Nav)は、CoIN(Collaborative Instance Object Navigation)の最初の再現可能なベンチマークである。光コナブ(Light-CoNav)は,従来のモジュール方式よりも3倍小さく,70倍高速な協調ナビゲーションのための軽量統一モデルである。
論文参考訳（メタデータ） (2026-03-31T21:45:00Z)
ManipArena: Comprehensive Real-world Evaluation of Reasoning-Oriented Generalist Robot Manipulation [66.02142169323521]
Vision-Language-ActionモデルとWorld Modelは最近、汎用ロボットインテリジェンスのための有望なパラダイムとして登場した。既存のベンチマークは、主にシミュレータ中心であり、制御性を提供するが、知覚ノイズによって引き起こされる現実のギャップを捉えることができない。シミュレーションと実世界の実行を橋渡しする標準化された評価フレームワークであるManipArenaを紹介する。
論文参考訳（メタデータ） (2026-03-30T15:06:41Z)
General-Purpose Robotic Navigation via LVLM-Orchestrated Perception, Reasoning, and Acting [5.291702442384798]
Agentic Robotic Navigation Architecture (ARNA)は、LVLMベースのエージェントに知覚、推論、ナビゲーションツールのライブラリを装備する汎用フレームワークである。実行時にエージェントは、現代のロボットスタックから引き出されたタスク固有のナビゲーションツールを自律的に定義し、実行します。 ARNAは最先端のEQA特異的アプローチより優れている。
論文参考訳（メタデータ） (2025-06-20T20:06:14Z)
RoboRAN: A Unified Robotics Framework for Reinforcement Learning-Based Autonomous Navigation [15.548637925166986]
多様なロボットプラットフォームと運用環境にまたがって、RLベースのナビゲーションポリシーをトレーニング、評価、デプロイするためのマルチドメインフレームワークを提案する。本研究は,(1)シームレスなロボットタスク交換性と再現可能なトレーニングパイプラインを実現するスケーラブルでモジュール化されたフレームワーク,(2)複数のロボットによる実世界実験を通じて実世界へのトランスファーを実証するsim-to-real,(3)Isaac Labがトレーニングしたポリシーを実際のロボットに展開する最初のオープンソースAPIのリリース,の4つの重要な貢献について述べる。
論文参考訳（メタデータ） (2025-05-20T15:48:23Z)
HA-VLN 2.0: An Open Benchmark and Leaderboard for Human-Aware Navigation in Discrete and Continuous Environments with Dynamic Multi-Human Interactions [64.69468932145234]
HA-VLN 2.0は、明示的な社会的認識制約を導入した統一ベンチマークである。その結果、明示的な社会的モデリングはナビゲーションの堅牢性を向上し、衝突を減らすことが示唆された。
論文参考訳（メタデータ） (2025-03-18T13:05:55Z)
HEIGHT: Heterogeneous Interaction Graph Transformer for Robot Navigation in Crowded and Constrained Environments [13.574462966591199]
廊下や家具などの環境制約のある密集した対話型群集におけるロボットナビゲーションの問題点について検討する。従来の手法ではエージェントと障害物間のあらゆる種類の相互作用を考慮できないため、安全で非効率なロボット経路につながる。本稿では,ロボットナビゲーションポリシーを強化学習で学習するための構造化フレームワークを提案する。
論文参考訳（メタデータ） (2024-11-19T00:56:35Z)
CorNav: Autonomous Agent with Self-Corrected Planning for Zero-Shot Vision-and-Language Navigation [73.78984332354636]
CorNavは視覚・言語ナビゲーションのための新しいゼロショットフレームワークである。将来の計画の見直しや行動調整のための環境フィードバックが組み込まれている。ゼロショットマルチタスク設定ですべてのベースラインを一貫して上回る。
論文参考訳（メタデータ） (2023-06-17T11:44:04Z)
Navigating to Objects in the Real World [76.1517654037993]
本稿では,古典的,モジュール的,エンド・ツー・エンドの学習手法と比較した,意味的視覚ナビゲーション手法に関する大規模な実証的研究について述べる。モジュラー学習は実世界ではうまく機能し、90%の成功率に達しています。対照的に、エンド・ツー・エンドの学習は、シミュレーションと現実の間の画像領域の差が大きいため、77%のシミュレーションから23%の実際の成功率へと低下する。
論文参考訳（メタデータ） (2022-12-02T01:10:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。