論文の概要: OceanGym: A Benchmark Environment for Underwater Embodied Agents
- arxiv url: http://arxiv.org/abs/2509.26536v1
- Date: Tue, 30 Sep 2025 17:09:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.630737
- Title: OceanGym: A Benchmark Environment for Underwater Embodied Agents
- Title(参考訳): OceanGym: 水中のエボダイドエージェントのベンチマーク環境
- Authors: Yida Xue, Mingjun Mao, Xiangyuan Ru, Yuqi Zhu, Baochang Ren, Shuofei Qiao, Mengru Wang, Shumin Deng, Xinyu An, Ningyu Zhang, Ying Chen, Huajun Chen,
- Abstract要約: OceanGymは、海洋水中のエンボディエージェントに関する最初の総合的なベンチマークである。
それは、最も要求の多い現実世界環境の1つでAIを前進させるように設計されている。
高忠実で厳格に設計されたプラットフォームを提供することで、OceanGymは堅牢なエンボディAIを開発するためのテストベッドを確立する。
- 参考スコア(独自算出の注目度): 69.56465775825275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce OceanGym, the first comprehensive benchmark for ocean underwater embodied agents, designed to advance AI in one of the most demanding real-world environments. Unlike terrestrial or aerial domains, underwater settings present extreme perceptual and decision-making challenges, including low visibility, dynamic ocean currents, making effective agent deployment exceptionally difficult. OceanGym encompasses eight realistic task domains and a unified agent framework driven by Multi-modal Large Language Models (MLLMs), which integrates perception, memory, and sequential decision-making. Agents are required to comprehend optical and sonar data, autonomously explore complex environments, and accomplish long-horizon objectives under these harsh conditions. Extensive experiments reveal substantial gaps between state-of-the-art MLLM-driven agents and human experts, highlighting the persistent difficulty of perception, planning, and adaptability in ocean underwater environments. By providing a high-fidelity, rigorously designed platform, OceanGym establishes a testbed for developing robust embodied AI and transferring these capabilities to real-world autonomous ocean underwater vehicles, marking a decisive step toward intelligent agents capable of operating in one of Earth's last unexplored frontiers. The code and data are available at https://github.com/OceanGPT/OceanGym.
- Abstract(参考訳): 私たちはOceanGymを紹介します。OceanGymは、海洋水中のエンボディエージェントのための最初の総合的なベンチマークで、最も要求の多い現実世界環境のひとつでAIを前進させるように設計されています。
地上や空中のドメインとは異なり、水中の環境は視界が低く、海流がダイナミックで、効果的なエージェントの配置が困難であるなど、極端に知覚的および意思決定上の課題を呈する。
OceanGymは8つの現実的なタスクドメインと、知覚、記憶、シーケンシャルな意思決定を統合したMLLM(Multi-modal Large Language Models)によって駆動される統合されたエージェントフレームワークを含んでいる。
エージェントは、光学的およびソナー的データを理解し、複雑な環境を自律的に探索し、これらの厳しい条件下で長い水平目標を達成する必要がある。
大規模な実験では、最先端のMLLM駆動エージェントと人間の専門家の間にかなりのギャップが見られ、海洋水中環境における知覚、計画、適応性の持続的困難が浮き彫りにされている。
高忠実で厳格に設計されたプラットフォームを提供することで、OceanGymは堅牢なエンボディAIを開発し、これらの能力を現実の自律型水中車両に転送するためのテストベッドを確立する。
コードとデータはhttps://github.com/OceanGPT/OceanGym.comで公開されている。
関連論文リスト
- UAV-ON: A Benchmark for Open-World Object Goal Navigation with Aerial Agents [17.86691411018085]
UAV-ONは、オープンワールド環境における航空エージェントによる大規模目標航法(NavObject)のベンチマークである。
多様な意味領域と複雑な空間レイアウトを備えた14の高忠実なUnreal Engine環境で構成されている。
1270のアノテートされたターゲットオブジェクトを定義し、それぞれがカテゴリ、物理フットプリント、視覚ディスクリプタをエンコードするインスタンスレベルの命令によって特徴付けられる。
論文 参考訳(メタデータ) (2025-08-01T03:23:06Z) - Towards an Autonomous Surface Vehicle Prototype for Artificial Intelligence Applications of Water Quality Monitoring [68.41400824104953]
本稿では,人工知能アルゴリズムの利用と水質モニタリングのための高感度センシング技術に対処する車両プロトタイプを提案する。
車両には水質パラメータと水深を測定するための高品質なセンサーが装備されている。
ステレオカメラにより、実際の環境でのマクロプラスチックの検出と検出も可能である。
論文 参考訳(メタデータ) (2024-10-08T10:35:32Z) - KUNPENG: An Embodied Large Model for Intelligent Maritime [16.21066869005095]
KUNPENGは、スマートオーシャン構築において、インテリジェントな海洋のモデルとして初めて具現化された大型モデルである。
総合的な海上作業評価において、KUNPENGは優れた性能を示した。
論文 参考訳(メタデータ) (2024-07-12T07:16:22Z) - AgentGym: Evolving Large Language Model-based Agents across Diverse Environments [116.97648507802926]
大規模言語モデル(LLM)はそのようなエージェントを構築するための有望な基盤と考えられている。
我々は、自己進化能力を備えた一般機能 LLM ベースのエージェントを構築するための第一歩を踏み出す。
我々はAgentGymを提案する。AgentGymは、幅広い、リアルタイム、ユニフォーマット、並行エージェント探索のための様々な環境とタスクを特徴とする新しいフレームワークである。
論文 参考訳(メタデータ) (2024-06-06T15:15:41Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Aeolus Ocean -- A simulation environment for the autonomous
COLREG-compliant navigation of Unmanned Surface Vehicles using Deep
Reinforcement Learning and Maritime Object Detection [0.0]
海上部門における無人水上機(USV)の航行自律性は、より安全な水と運用コストの削減につながる可能性がある。
本稿では, 現実的な海洋シミュレーション環境において, COLREG 準拠の DRL を用いた衝突回避航法システムの開発について述べる。
論文 参考訳(メタデータ) (2023-07-13T11:20:18Z) - Guaranteed Discovery of Controllable Latent States with Multi-Step
Inverse Models [51.754160866582005]
エージェント制御可能な状態探索アルゴリズム(AC-State)
アルゴリズムは多段階の逆モデル(遠方の観測から行動を予測する)と情報ボトルネックから構成される。
本稿では,3つの領域において制御可能な潜伏状態の発見を実証する。ロボットアームの局所化,他のエージェントとともに迷路を探索し,Matterportハウスシミュレーターをナビゲートする。
論文 参考訳(メタデータ) (2022-07-17T17:06:52Z) - Occupancy Anticipation for Efficient Exploration and Navigation [97.17517060585875]
そこで我々は,エージェントが自我中心のRGB-D観測を用いて,その占有状態を可視領域を超えて推定する,占有予測を提案する。
エゴセントリックなビューとトップダウンマップの両方でコンテキストを活用することで、私たちのモデルは環境のより広いマップを予測できます。
われわれのアプローチは、2020 Habitat PointNav Challengeの優勝だ。
論文 参考訳(メタデータ) (2020-08-21T03:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。