Fugu-MT 論文翻訳(概要): FAFA: Frequency-Aware Flow-Aided Self-Supervision for Underwater Object Pose Estimation

論文の概要: FAFA: Frequency-Aware Flow-Aided Self-Supervision for Underwater Object Pose Estimation

arxiv url: http://arxiv.org/abs/2409.16600v1
Date: Wed, 25 Sep 2024 03:54:01 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-27 05:45:19.465350
Title: FAFA: Frequency-Aware Flow-Aided Self-Supervision for Underwater Object Pose Estimation
Title（参考訳）: FAFA:水中物体電位推定のための周波数対応フロー支援セルフスーパービジョン
Authors: Jingyi Tang, Gu Wang, Zeyu Chen, Shengquan Li, Xiu Li, Xiangyang Ji,
Abstract要約: 無人水中車両(UUV)の6次元ポーズ推定のための周波数認識フロー支援フレームワークであるFAFAを紹介する。我々のフレームワークは、3DモデルとRGB画像のみに依存しており、実際のポーズアノテーションや奥行きのような非モダリティデータの必要性を軽減しています。本研究では,一般的な水中オブジェクトポーズベンチマークにおけるFAFAの有効性を評価し,最先端手法と比較して顕著な性能向上を示した。
参考スコア（独自算出の注目度）: 65.01601309903971
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Although methods for estimating the pose of objects in indoor scenes have achieved great success, the pose estimation of underwater objects remains challenging due to difficulties brought by the complex underwater environment, such as degraded illumination, blurring, and the substantial cost of obtaining real annotations. In response, we introduce FAFA, a Frequency-Aware Flow-Aided self-supervised framework for 6D pose estimation of unmanned underwater vehicles (UUVs). Essentially, we first train a frequency-aware flow-based pose estimator on synthetic data, where an FFT-based augmentation approach is proposed to facilitate the network in capturing domain-invariant features and target domain styles from a frequency perspective. Further, we perform self-supervised training by enforcing flow-aided multi-level consistencies to adapt it to the real-world underwater environment. Our framework relies solely on the 3D model and RGB images, alleviating the need for any real pose annotations or other-modality data like depths. We evaluate the effectiveness of FAFA on common underwater object pose benchmarks and showcase significant performance improvements compared to state-of-the-art methods. Code is available at github.com/tjy0703/FAFA.
Abstract（参考訳）: 屋内シーンにおける物体のポーズを推定する方法は大きな成功を収めているが, 劣化照明, ぼやけ, 実際のアノテーションを得るためのかなりのコストなど, 複雑な水中環境がもたらす困難さから, 水中物体のポーズ推定はいまだに困難である。本研究では,無人水中車両(UUV)の6次元ポーズ推定のための周波数認識フロー支援フレームワークであるFAFAを紹介する。そこでFFTに基づく拡張手法を提案し、周波数視点からドメイン不変の特徴や対象ドメインスタイルを抽出するネットワークを容易にする。さらに,実環境の水中環境に適応するために,フロー支援型多層成分を強制して自己指導訓練を行う。我々のフレームワークは、3DモデルとRGB画像のみに依存しており、実際のポーズアノテーションや奥行きのような非モダリティデータの必要性を軽減しています。本研究では,一般的な水中オブジェクトポーズベンチマークにおけるFAFAの有効性を評価し,最先端手法と比較して顕著な性能向上を示した。コードはgithub.com/tjy0703/FAFAで入手できる。

関連論文リスト

Underwater Monocular Metric Depth Estimation: Real-World Benchmarks and Synthetic Fine-Tuning with Vision Foundation Models [0.0]
実世界の水中データセットを用いたゼロショットおよび微調整単分子メートル法深度推定モデルのベンチマークを示す。その結果,地上データ(実データや合成データ)に基づいて訓練した大規模モデルでは,水中での作業は不十分であることがわかった。本研究では,水中における単分子距離深度推定の詳細な評価と可視化を行う。
論文参考訳（メタデータ） (2025-07-02T21:06:39Z)
Learning Underwater Active Perception in Simulation [51.205673783866146]
タービディティは、検査された構造物の正確な視覚的記録を阻止する可能性があるため、ミッション全体を危険に晒す可能性がある。従来の研究は、濁度や後方散乱に適応する手法を導入してきた。本研究では, 広範囲の水環境下での高品質な画像取得を実現するための, 単純かつ効率的なアプローチを提案する。
論文参考訳（メタデータ） (2025-04-23T06:48:38Z)
Diff9D: Diffusion-Based Domain-Generalized Category-Level 9-DoF Object Pose Estimation [68.81887041766373]
ドメイン一般化9-DoFオブジェクトポーズ推定のための拡散に基づくパラダイムを提案する。本研究では,9-DoFオブジェクトのポーズ推定を生成的観点から再定義する効果的な拡散モデルを提案する。提案手法は,最先端の領域一般化性能を実現する。
論文参考訳（メタデータ） (2025-02-04T17:46:34Z)
PIGUIQA: A Physical Imaging Guided Perceptual Framework for Underwater Image Quality Assessment [59.9103803198087]
水中画像品質評価(UIQA)のための物理画像ガイド型知覚フレームワークを提案する。水中放射移動理論を応用して、物理に基づく画像推定を統合して、これらの歪みの定量的な測定値を確立する。提案モデルは,画像品質のスコアを正確に予測し,最先端の性能を実現する。
論文参考訳（メタデータ） (2024-12-20T03:31:45Z)
Sonar-based Deep Learning in Underwater Robotics: Overview, Robustness and Challenges [0.46873264197900916]
水中でのソナーの使用は、限られた訓練データと固有のノイズが特徴であり、頑丈さをモデル化する上での課題となっている。本稿では,分類,物体検出,セグメンテーション,SLAMなどのソナーベース認知タスクモデルについて検討する。ソナーベースの最先端データセット、シミュレータ、ニューラルネットワーク検証、アウト・オブ・ディストリビューション、敵攻撃などの堅牢性メソッドを体系化する。
論文参考訳（メタデータ） (2024-12-16T15:03:08Z)
UW-SDF: Exploiting Hybrid Geometric Priors for Neural SDF Reconstruction from Underwater Multi-view Monocular Images [63.32490897641344]
ニューラルSDFに基づく多視点水中画像から対象物を再構成するフレームワークを提案する。再建過程を最適化するためのハイブリッドな幾何学的先行手法を導入し、神経SDF再建の質と効率を著しく向上させる。
論文参考訳（メタデータ） (2024-10-10T16:33:56Z)
TanDepth: Leveraging Global DEMs for Metric Monocular Depth Estimation in UAVs [5.6168844664788855]
本研究は,推定時間における相対的推定値から計量深度値を求めるための,実践的なオンラインスケール回復手法であるTanDepthを提案する。本手法は無人航空機(UAV)の用途に応用され,GDEM(Global Digital Elevation Models)のスパース計測をカメラビューに投影することで活用する。推定深度マップから接地点を選択して、投影された基準点と相関するクラスシミュレーションフィルタへの適応を示す。
論文参考訳（メタデータ） (2024-09-08T15:54:43Z)
A Sonar-based AUV Positioning System for Underwater Environments with Low Infrastructure Density [2.423370951696279]
本研究では,人為的資産の分散分布を考慮したAUV(Autonomous Underwater Vehicles)のための,新しいリアルタイムソナーベースグローバル位置決めアルゴリズムを提案する。実水中植物に類似した模擬環境下での予備実験は有望な結果をもたらした。
論文参考訳（メタデータ） (2024-05-03T09:53:28Z)
ADOD: Adaptive Domain-Aware Object Detection with Residual Attention for Underwater Environments [1.2624532490634643]
本研究では,水中物体検出における領域一般化のための新しいアプローチであるADODを提案する。本手法は, 様々な水中環境下での堅牢性を確保するため, 多様な領域にまたがってモデルを一般化する能力を高める。
論文参考訳（メタデータ） (2023-12-11T19:20:56Z)
PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。水中画像強調(UIE)の課題も、時間とともに現れた。本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文参考訳（メタデータ） (2023-06-15T07:41:12Z)
Fully Self-Supervised Depth Estimation from Defocus Clue [79.63579768496159]
スパース焦点スタックから深度を純粋に推定する自己教師型フレームワークを提案する。筆者らのフレームワークは,深度とAIF画像の接地構造の必要性を回避し,より優れた予測を得られることを示す。
論文参考訳（メタデータ） (2023-03-19T19:59:48Z)
Model-Based Underwater 6D Pose Estimation from RGB [1.9160624126555885]
本研究では,2次元物体検出を応用して,異なる水中シナリオにおける6次元ポーズ推定を確実に計算する手法を提案する。すべてのオブジェクトとシーンは、オブジェクト検出とポーズ推定のためのアノテーションを含むオープンソースのデータセットで利用可能である。
論文参考訳（メタデータ） (2023-02-14T04:27:03Z)
CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation [67.12857074801731]
そこで本研究では,シミュレートからリアルなポーズ推定のための新しい手法であるCPPF++を提案する。投票衝突による課題に対処するため,投票の不確実性をモデル化する新たなアプローチを提案する。ノイズの多いペアフィルタリング、オンラインアライメント最適化、機能アンサンブルなど、いくつかの革新的なモジュールを組み込んでいます。
論文参考訳（メタデータ） (2022-11-24T03:27:00Z)
SVAM: Saliency-guided Visual Attention Modeling by Autonomous Underwater Robots [16.242924916178282]
本稿では,自律型水中ロボットの視覚的注意モデル(SVAM)に対する総合的なアプローチを提案する。提案するSVAM-Netは,様々なスケールの深部視覚的特徴を統合し,自然水中画像に有効なSOD(Salient Object Detection)を実現する。
論文参考訳（メタデータ） (2020-11-12T08:17:21Z)
Leveraging Photometric Consistency over Time for Sparsely Supervised Hand-Object Reconstruction [118.21363599332493]
本稿では,ビデオ中のフレームの粗いサブセットに対してのみアノテーションが利用できる場合に,時間とともに光度整合性を活用する手法を提案する。本モデルでは,ポーズを推定することにより,手や物体を3Dで共同で再構成するカラーイメージをエンドツーエンドに訓練する。提案手法は,3次元手動画像再構成の精度向上に有効であることを示す。
論文参考訳（メタデータ） (2020-04-28T12:03:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。