論文の概要: Rethinking Unsupervised Cross-modal Flow Estimation: Learning from Decoupled Optimization and Consistency Constraint
- arxiv url: http://arxiv.org/abs/2509.24423v1
- Date: Mon, 29 Sep 2025 08:10:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.846809
- Title: Rethinking Unsupervised Cross-modal Flow Estimation: Learning from Decoupled Optimization and Consistency Constraint
- Title(参考訳): 教師なしクロスモーダルフロー推定の再考:非結合最適化と一貫性制約から学ぶ
- Authors: Runmin Zhang, Jialiang Wang, Si-Yuan Cao, Zhu Yu, Junchen Yu, Guangyi Zhang, Hui-Liang Shen,
- Abstract要約: DCFlowは、教師なしのクロスモーダルフロー推定フレームワークである。
本稿では,タスク固有の監督機能を備えた非結合最適化戦略を導入し,モダリティの相違と幾何学的相違を明確に解消する。
評価のために、パブリックデータセットを再取得することで、包括的なクロスモーダルフローベンチマークを構築する。
- 参考スコア(独自算出の注目度): 20.46870753632375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work presents DCFlow, a novel unsupervised cross-modal flow estimation framework that integrates a decoupled optimization strategy and a cross-modal consistency constraint. Unlike previous approaches that implicitly learn flow estimation solely from appearance similarity, we introduce a decoupled optimization strategy with task-specific supervision to address modality discrepancy and geometric misalignment distinctly. This is achieved by collaboratively training a modality transfer network and a flow estimation network. To enable reliable motion supervision without ground-truth flow, we propose a geometry-aware data synthesis pipeline combined with an outlier-robust loss. Additionally, we introduce a cross-modal consistency constraint to jointly optimize both networks, significantly improving flow prediction accuracy. For evaluation, we construct a comprehensive cross-modal flow benchmark by repurposing public datasets. Experimental results demonstrate that DCFlow can be integrated with various flow estimation networks and achieves state-of-the-art performance among unsupervised approaches.
- Abstract(参考訳): この研究は、非教師なしのクロスモーダルフロー推定フレームワークであるDCFlowを紹介し、デカップリング最適化戦略とクロスモーダル整合性制約を統合する。
見た目の類似性からのみフロー推定を暗黙的に学習する従来の手法とは異なり、タスク固有の監督を兼ね備えた非結合最適化戦略を導入し、モダリティの相違や幾何学的相違に対処する。
これは、モダリティ伝達ネットワークとフロー推定ネットワークを協調的にトレーニングすることで達成される。
そこで本研究では,外乱損失を伴う幾何認識型データ合成パイプラインを提案する。
さらに,両ネットワークを協調的に最適化するクロスモーダル整合性制約を導入し,フロー予測精度を大幅に向上させる。
評価のために、パブリックデータセットを再取得することで、包括的なクロスモーダルフローベンチマークを構築する。
実験により,DCFlowを各種フロー推定ネットワークに統合し,教師なし手法による最先端性能を実現することができた。
関連論文リスト
- Topology-Aware Conformal Prediction for Stream Networks [54.505880918607296]
本研究では,ネットワークトポロジと時間的ダイナミクスを共形予測フレームワークに統合した新しいフレームワークであるspatio-Temporal Adaptive Conformal Inference (textttCISTA)を提案する。
この結果から,TextttCISTAは予測効率とカバレッジのバランスを効果的に保ち,既存のストリームネットワークの共形予測手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2025-03-06T21:21:15Z) - Joint Optimal Transport and Embedding for Network Alignment [66.49765320358361]
本稿では,JOENA というネットワークアライメントのための統合最適トランスポートおよび埋め込みフレームワークを提案する。
統一された目的により、両手法の相互利益は、コンバージェンスを保証する最適化スキーマの交互化によって達成できる。
実世界のネットワークの実験はJOENAの有効性とスケーラビリティを検証し、最大16%の改善と20倍の高速化を実現した。
論文 参考訳(メタデータ) (2025-02-26T17:28:08Z) - Efficient Text-driven Motion Generation via Latent Consistency Training [21.348658259929053]
非線形逆拡散軌道を解くための動き潜時整合トレーニングフレームワーク(MLCT)を提案する。
これらの拡張を組み合わせることで、非画素モダリティおよび潜在表現空間における安定かつ一貫性のあるトレーニングを実現する。
論文 参考訳(メタデータ) (2024-05-05T02:11:57Z) - Over-the-Air Federated Learning and Optimization [52.5188988624998]
エッジ・ザ・エア計算(AirComp)によるフェデレーション学習(FL)に焦点を当てる。
本稿では,AirComp ベースの FedAvg (AirFedAvg) アルゴリズムの凸および非凸条件下での収束について述べる。
エッジデバイス(モデル、勾配、モデル差など)で送信できるローカルアップデートの種類によって、AirFedAvgで送信するとアグリゲーションエラーが発生する可能性がある。
さらに、より実用的な信号処理方式を検討し、通信効率を改善し、これらの信号処理方式によって引き起こされるモデル集約誤差の異なる形式に収束解析を拡張する。
論文 参考訳(メタデータ) (2023-10-16T05:49:28Z) - DistractFlow: Improving Optical Flow Estimation via Realistic
Distractions and Pseudo-Labeling [49.46842536813477]
本稿では,光フロー推定モデルのトレーニングのための新しいデータ拡張手法であるDistractFlowを提案する。
2つのフレームのうちの1つを、類似したドメインを描写したイントラクタイメージと組み合わせることで、自然の物体やシーンと相反する視覚的摂動を誘発することができる。
私たちのアプローチでは、追加のアノテーションを必要とせずに、利用可能なトレーニングペアの数を大幅に増やすことができます。
論文 参考訳(メタデータ) (2023-03-24T15:42:54Z) - Flow Guidance Deformable Compensation Network for Video Frame
Interpolation [33.106776459443275]
既存の動きに基づく手法の欠点を克服するため,フローガイダンス変形補償ネットワーク(FGDCN)を提案する。
FGDCNは、フレームサンプリングプロセスをフローステップと変形ステップの2つのステップに分解する。
実験結果から,提案アルゴリズムはパラメータが少ない各種データセットに対して優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2022-11-22T09:35:14Z) - Complementing Brightness Constancy with Deep Networks for Optical Flow
Prediction [30.10864927536864]
COMBOは、従来の方法で使用される輝度不安定性(BC)モデルを利用するディープネットワークである。
我々は,最適協調を保証するために,分解の異なる構成要素を学習するための共同学習手法を導出する。
実験により、COMBOは最先端の教師付きネットワーク上での性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2022-07-08T09:42:40Z) - GMFlow: Learning Optical Flow via Global Matching [124.57850500778277]
光フロー推定学習のためのGMFlowフレームワークを提案する。
機能拡張のためのカスタマイズトランスフォーマー、グローバル機能マッチングのための相関層とソフトマックス層、フロー伝搬のための自己保持層である。
我々の新しいフレームワークは、挑戦的なSintelベンチマークにおいて、32項目RAFTのパフォーマンスより優れています。
論文 参考訳(メタデータ) (2021-11-26T18:59:56Z) - What Matters in Unsupervised Optical Flow [51.45112526506455]
教師なし光流における鍵成分の集合を比較し解析する。
教師なしフローモデルに対する新しい改良点を多数構築する。
本稿では,従来の最先端技術よりもはるかに優れた非教師なしフロー技術を提案する。
論文 参考訳(メタデータ) (2020-06-08T19:36:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。