論文の概要: fARfetch: Enabling Collocated AR-HRC in Large Visually Diverse Environments with VLM-Driven AR Content Adaptation
- arxiv url: http://arxiv.org/abs/2606.25162v1
- Date: Tue, 23 Jun 2026 20:51:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:05:30.142241
- Title: fARfetch: Enabling Collocated AR-HRC in Large Visually Diverse Environments with VLM-Driven AR Content Adaptation
- Title(参考訳): fARfetch: VLM駆動ARコンテンツ適応による大規模な視覚的多言語環境におけるコラボレートAR-HRCの実現
- Authors: Christian Fronk, Hanting Ye, David Hunt, Miroslav Pajic, Maria Gorlatova,
- Abstract要約: fARfetchはARヘッドセットとロボット間のセマンティック環境マッピングを統合するAR-HRCシステムである。
視覚言語モデル駆動のARビュー管理は、視覚的に多様な環境において、視認性を維持するために、仮想コンテンツの色、サイズ、方向を適応させる。
- 参考スコア(独自算出の注目度): 13.940441399632844
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Augmented Reality (AR) can improve collocated human-robot collaboration by making robot state and intent visible and enabling intuitive control, yet large, visually diverse environments like the outdoors challenge both interaction and content legibility, especially at long distances and beyond visual line of sight. We present fARfetch, an AR-HRC system that integrates (i) shared semantic environment mapping across an AR headset and robot that visualizes detected landmarks in AR to support landmark-grounded go-to commands, (ii) a context-aware world-in-miniature representation of the shared environment for fine-grained path authoring, and (iii) vision-language-model driven AR view management that jointly adapts virtual content color, size, and orientation to maintain legibility in large visually diverse environments. We implement fARfetch with a Meta Quest 3 headset and Unitree Go2 quadruped robot, and conduct a within-subjects user study (N=13) on a real-world large-scale (30.5m) outdoor inspection task. fARfetch yielded significantly faster completion times than a non-AR baseline (66%) and significantly lower workload in mental demand (-43%), temporal demand (-34%), and frustration (-66%). A custom legibility survey indicated fARfetch effectively maintained virtual content legibility in the large outdoor environment.
- Abstract(参考訳): Augmented Reality(AR)は、ロボットの状態と意図を可視化し、直感的な制御を可能にすることで、コロケーションされた人間とロボットのコラボレーションを改善することができる。
統合されたAR-HRCシステムであるfARfetchを提案する。
i)ARヘッドセットとロボットにまたがるセマンティック環境のマッピング。
(二 微粒なパスオーサリングのための共有環境の文脈対応ワールドインミニチュア表現及び
三 視覚的に多様な環境において、視認性を維持するために、仮想コンテンツの色、サイズ、方向を共同で適応する視覚言語モデルによるARビュー管理。
我々は,Meta Quest 3ヘッドセットとUnitree Go2四足歩行ロボットを用いてfARfetchを実装し,実世界の大規模(0.5m)屋外検査タスクにおいて,内在型ユーザスタディ(N=13)を実行する。
fARfetchは,非ARベースライン(66%),精神的要求(43%),時間的要求(34%),フラストレーション(66%),作業負荷(66%)よりも有意に速かった。
大規模な屋外環境において,fARfetchは仮想的コンテンツのレジリエンスを効果的に維持した。
関連論文リスト
- GA3T: A Ground-Aerial Terrain Traversability Dataset for Heterogeneous Robot Teams in Unstructured Environments [8.883110592055017]
GA3Tは、Clearpath Husky UGVとAutel EVOII UAVを用いて収集された、現実のマルチロボット協調認識データセットである。
データセットは4つのユニークな環境で収集され、約29分間に13,000以上の同期フレームがある。
SLAMやシミュレートされた協調運転に焦点を当てた従来のマルチロボットデータセットとは異なり、GA3Tはクロスビュー知覚、空中視点融合、トラバーサビリティ推定、協調的なシーン理解の研究を支援するように設計されている。
論文 参考訳(メタデータ) (2026-05-07T16:03:15Z) - ZoomEarth: Active Perception for Ultra-High-Resolution Geospatial Vision-Language Tasks [49.99788276124186]
既存の動的解像度とトークンプルーニング法は受動的知覚パラダイムによって制約される。
本稿では,UHR RS処理におけるアクティブな認識に適した大規模ベンチマークデータセット LRS-GRO を提案する。
ZoomEarthは,より詳細なガイダンスを提供する新しい地域誘導報酬を用いた適応的収穫・造粒フレームワークである。
論文 参考訳(メタデータ) (2025-11-15T15:47:46Z) - RAVEN: Resilient Aerial Navigation via Open-Set Semantic Memory and Behavior Adaptation [20.730528223747967]
RAVENは、非構造化屋外環境での空中セマンティックナビゲーションのための3Dメモリベースの行動ツリーフレームワークである。
空間的に一貫したセマンティックなボクセル線マップを永続記憶として使用し、長期計画を可能にし、純粋に反応性のある振る舞いを避ける。
RAVENは、シミュレーションのベースラインを85.25%上回り、屋外フィールドテストにおける空中ロボットへの展開を通じて実世界の適用性を実証している。
論文 参考訳(メタデータ) (2025-09-28T01:43:25Z) - EmbRACE-3K: Embodied Reasoning and Action in Complex Environments [48.32142591866083]
EmRACE-3KはUnreal EngineとUnrealCV-Zooフレームワークを使って構築された3000以上の言語誘導タスクのデータセットである。
探索,動的空間意味推論,多段階ゴール実行の3つの重要な次元にわたって,VLMの具体的推論能力を評価するためのベンチマークを構築した。
ゼロショット設定では、すべてのモデルが20%未満の成功率を達成した。
論文 参考訳(メタデータ) (2025-07-14T17:59:46Z) - A Vision for AI-Driven Adaptation of Dynamic AR Content to Users and Environments [15.578223073114156]
このビジョンペーパーは、適応ARコンテンツ配置のためのAI駆動アプローチを推測する。
我々は、様々な産業におけるイノベーションと改善の新たな機会を構想することを目指している。
論文 参考訳(メタデータ) (2025-04-23T09:42:38Z) - UnrealZoo: Enriching Photo-realistic Virtual Worlds for Embodied AI [37.47562766916571]
Unreal Engine上に構築された100以上の写真リアルな3DバーチャルワールドのコレクションであるUnrealZooを紹介します。
私たちはまた、人間、動物、ロボット、そしてAI研究の具体化のための車両を含む、さまざまな遊び可能なエンティティも提供しています。
論文 参考訳(メタデータ) (2024-12-30T14:31:01Z) - RoboSense: Large-scale Dataset and Benchmark for Egocentric Robot Perception and Navigation in Crowded and Unstructured Environments [62.5830455357187]
我々は3種類のセンサー(Camera, LiDAR, Fisheye)をベースとした自我中心型マルチセンサデータ収集プラットフォームを構築した。
大規模なマルチモーダルデータセットであるRoboSenseは、エゴセントリックなロボット知覚を促進するために構築されている。
論文 参考訳(メタデータ) (2024-08-28T03:17:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。