Fugu-MT 論文翻訳(概要): UMI-Underwater: Learning Underwater Manipulation without Underwater Teleoperation

論文の概要: UMI-Underwater: Learning Underwater Manipulation without Underwater Teleoperation

arxiv url: http://arxiv.org/abs/2603.27012v1
Date: Fri, 27 Mar 2026 22:01:19 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-31 23:18:44.735374
Title: UMI-Underwater: Learning Underwater Manipulation without Underwater Teleoperation
Title（参考訳）: UMI-Underwater:水中遠隔操作のない水中操作の学習
Authors: Hao Li, Long Yin Chung, Jack Goler, Ryan Zhang, Xiaochi Xie, Huy Ha, Shuran Song, Mark Cutkosky,
Abstract要約: 水中ロボティクスの把握は、劣化した、高度に変動した画像と、多様な水中デモを収集する費用が原因で困難である。本稿では,自己教師型データ収集パイプラインを通じて,水中のグリップデモを自律的に収集するシステムを提案する。プール実験において,本手法はバックグラウンドシフトに対する性能とロバスト性を向上し,オンランドデータにのみ見られるオブジェクトへの一般化を可能にする。
参考スコア（独自算出の注目度）: 14.624992211938155
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Underwater robotic grasping is difficult due to degraded, highly variable imagery and the expense of collecting diverse underwater demonstrations. We introduce a system that (i) autonomously collects successful underwater grasp demonstrations via a self-supervised data collection pipeline and (ii) transfers grasp knowledge from on-land human demonstrations through a depth-based affordance representation that bridges the on-land-to-underwater domain gap and is robust to lighting and color shift. An affordance model trained on on-land handheld demonstrations is deployed underwater zero-shot via geometric alignment, and an affordance-conditioned diffusion policy is then trained on underwater demonstrations to generate control actions. In pool experiments, our approach improves grasping performance and robustness to background shifts, and enables generalization to objects seen only in on-land data, outperforming RGB-only baselines. Code, videos, and additional results are available at https://umi-under-water.github.io.
Abstract（参考訳）: 水中ロボティクスの把握は、劣化した、高度に変動した画像と、多様な水中デモを収集する費用が原因で困難である。私たちは、システムを導入します。一自己監督データ収集パイプラインを介して、自律的に水中の把握デモを成功させる。二陸地と水中のドメインギャップを橋渡しし、照明や色の変化に頑健な深度に基づくアベイランス表現を通じて、陸地人間による実演からの知識を伝達する。地上でのハンドヘルドデモで訓練された余剰モデルを幾何学的アライメントにより水中ゼロショットに配置し、余剰条件付き拡散ポリシーを水中デモで訓練して制御動作を生成する。プール実験において,本手法は,背景シフトの把握性能とロバスト性を改善し,陸域データにのみ見られるオブジェクトへの一般化を可能にし,RGBのみのベースラインを上回った。コード、ビデオ、その他の結果はhttps://umi-under-water.github.io.comで公開されている。

関連論文リスト

NAUTILUS: A Large Multimodal Model for Underwater Scene Understanding [60.76337064425815]
本研究では,水中の自動探査を目的とした水中シーン理解手法について検討する。 NautDataは、8つの水中シーン理解タスクをサポートする1.45Mイメージテキストペアを含むデータセットである。本稿では,透明な水中情報を明示的に復元するVFEモジュールを提案する。
論文参考訳（メタデータ） (2025-10-31T14:00:35Z)
Expose Camouflage in the Water: Underwater Camouflaged Instance Segmentation and Dataset [76.92197418745822]
カモフラージュされたインスタンスセグメンテーション(CIS)は、周囲と密接に融合したオブジェクトを正確にセグメンテーションする際の大きな課題に直面します。従来のカモフラージュされたインスタンスセグメンテーション法は、水中のサンプルが限られている地球上で支配的なデータセットに基づいて訓練されており、水中のシーンでは不十分な性能を示す可能性がある。本研究は,海中カモフラージュされた海洋生物の3,953枚の画像とインスタンスレベルのアノテーションを含む,最初の水中カモフラージュされたインスタンスセグメンテーションデータセットUCIS4Kを紹介する。
論文参考訳（メタデータ） (2025-10-20T14:34:51Z)
Learning Underwater Active Perception in Simulation [51.205673783866146]
タービディティは、検査された構造物の正確な視覚的記録を阻止する可能性があるため、ミッション全体を危険に晒す可能性がある。従来の研究は、濁度や後方散乱に適応する手法を導入してきた。本研究では, 広範囲の水環境下での高品質な画像取得を実現するための, 単純かつ効率的なアプローチを提案する。
論文参考訳（メタデータ） (2025-04-23T06:48:38Z)
FAFA: Frequency-Aware Flow-Aided Self-Supervision for Underwater Object Pose Estimation [65.01601309903971]
無人水中車両(UUV)の6次元ポーズ推定のための周波数認識フロー支援フレームワークであるFAFAを紹介する。我々のフレームワークは、3DモデルとRGB画像のみに依存しており、実際のポーズアノテーションや奥行きのような非モダリティデータの必要性を軽減しています。本研究では,一般的な水中オブジェクトポーズベンチマークにおけるFAFAの有効性を評価し,最先端手法と比較して顕著な性能向上を示した。
論文参考訳（メタデータ） (2024-09-25T03:54:01Z)
Diving into Underwater: Segment Anything Model Guided Underwater Salient Instance Segmentation and A Large-scale Dataset [60.14089302022989]
水中視覚タスクは複雑な水中状況のため、しばしばセグメンテーションの精度が低い。第1次大規模水中塩分分節データセット(USIS10K)を構築した。本研究では,水中ドメインに特化してセグメンツ・ア・シング・モデル(USIS-SAM)に基づく水中塩分・インスタンス・アーキテクチャを提案する。
論文参考訳（メタデータ） (2024-06-10T06:17:33Z)
An Efficient Detection and Control System for Underwater Docking using Machine Learning and Realistic Simulation: A Comprehensive Approach [5.039813366558306]
この研究は、水中ドッキングの検出と分類を行うために異なるディープラーニングアーキテクチャと比較する。 GAN(Generative Adversarial Network)は画像から画像への変換に用いられ、ガゼボのシミュレーション画像を水中画像に変換する。その結果,水中の潮流によらず,高濁度シナリオでは20%の改善が見られた。
論文参考訳（メタデータ） (2023-11-02T18:10:20Z)
DeepAqua: Self-Supervised Semantic Segmentation of Wetland Surface Water Extent with SAR Images using Knowledge Distillation [44.99833362998488]
トレーニングフェーズ中に手動アノテーションを不要にする自己教師型ディープラーニングモデルであるDeepAquaを提案する。我々は、光とレーダーをベースとしたウォーターマスクが一致する場合を利用して、水面と植物の両方を検知する。実験の結果,DeepAquaの精度は7%向上し,Intersection Over Unionが27%,F1が14%向上した。
論文参考訳（メタデータ） (2023-05-02T18:06:21Z)
Knowledge Distillation for Feature Extraction in Underwater VSLAM [29.167521895895455]
本稿では,水中の特徴検出・マッチングネットワーク(UFEN)を訓練するためのクロスモーダルな知識蒸留フレームワークを提案する。特に,大気中のRGBDデータを用いて,物理的水中画像形成モデルに基づく合成水中画像を生成する。提案手法の有効性を検証するため, EASI という地中観測データを用いた新しい水中データセットを構築した。
論文参考訳（メタデータ） (2023-03-31T11:33:21Z)
Self-Supervised Monocular Depth Underwater [8.830479021890575]
近年,単眼画像からの深度推定は大幅に改善されている。水中環境下では、媒質による外観の変化により、まだ遅れている。水中環境に対処するための自己監督型フレームワークにいくつかの追加を提案する。
論文参考訳（メタデータ） (2022-10-06T20:57:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。