論文の概要: A Trajectory-Driven Spatio-Temporal Refinement Solution for CVPR 2026 8th UG2+ Challenge Track 3: DOST
- arxiv url: http://arxiv.org/abs/2606.00522v2
- Date: Thu, 04 Jun 2026 10:14:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 19:21:32.90438
- Title: A Trajectory-Driven Spatio-Temporal Refinement Solution for CVPR 2026 8th UG2+ Challenge Track 3: DOST
- Title(参考訳): CVPR 2026 8th UG2+ Challenge Track 3: DOST における軌道駆動時空間微細化法
- Authors: Hongzhen Li, Miao Yu, Leilei Cao, Youwei Pan, Yingfang Zhu, Fengjie Zhu,
- Abstract要約: 第8回 UG2+ Challenge (CVPR 2026) Track 3: Dynamic Object in Turbulence (DOST) について述べる。
本手法は、強力なマスク生成とモーショントラッキング機能を提供する強力なベースラインフレームワークSegment Any Motion(SegAnyMo)上に構築されている。
- 参考スコア(独自算出の注目度): 4.253597037211198
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we present our solution for the 8th UG2+ Challenge (CVPR 2026) Track 3: Dynamic Object Segmentation in Turbulence (DOST). Our method is built upon the strong baseline framework Segment Any Motion (SegAnyMo), which provides powerful mask generation and motion tracking capabilities. To further boost the segmentation performance under severe atmospheric distortions, we propose two key improvements. First, we employ a data-centric domain adaptation strategy. We significantly expand our training data by incorporating selected sequences from the DAVIS dataset alongside a subset of the DOST dataset, and apply simulated atmospheric fluctuation degradations to enhance the model's robustness against complex geometric distortions. Second, we introduce a spatio-temporal post-processing module. This refinement step effectively removes persistent boundary-connected false foregrounds and short-lived fragmented noise, while strictly preserving genuine small targets and maintaining original individual labels across frames. With these combined strategies, our proposed method ranks the 2st place in the challenge.
- Abstract(参考訳): 本研究では,第8回 UG2+ Challenge (CVPR 2026) Track 3: Dynamic Object Segmentation in Turbulence (DOST) について述べる。
本手法は、強力なマスク生成とモーショントラッキング機能を提供する強力なベースラインフレームワークSegment Any Motion(SegAnyMo)上に構築されている。
重大大気歪み下でのセグメンテーション性能をさらに向上するため,2つの重要な改善点を提案する。
まず、データ中心のドメイン適応戦略を採用する。
DAVISデータセットから選択したシーケンスをDOSTデータセットのサブセットと合わせて組み込むことでトレーニングデータを大幅に拡張し、複雑な幾何学的歪みに対するモデルの堅牢性を高めるために大気変動のシミュレーションを適用した。
次に,時空間後処理モジュールを提案する。
この精細化ステップは、真に小さなターゲットを厳密に保存し、フレーム全体で元の個別ラベルを維持しながら、永続的な境界接続された偽フォアグラウンドと短寿命のフラグメントノイズを効果的に除去する。
これらの戦略を組み合わせることで,提案手法は課題の2位にランクインする。
関連論文リスト
- Turbulence-Robust Dynamic Object Segmentation with Multi-Signal Priors and SAM2 Refinement [18.250105847259285]
本稿では, CVPR 2026 UG2+ Challenge Track 3: Dynamic Object in Turbulence (DOST) について述べる。
我々は,事前訓練された動作推定,自己教師付きセマンティック先行,背景異常モデリング,手動キャリブレーションによる提案融合,SAM2ベースのマスク改善を組み合わせた,トレーニング不要な多信号分割パイプラインを設計する。
この設計はDOSTの設定に適しており、激しい大気乱流は擬似的な動き、ぼかし、間欠的な目標視認性を生じさせ、単一の動きキューを信頼できないようにする。
論文 参考訳(メタデータ) (2026-05-28T03:18:18Z) - Dual-End Consistency Model [41.982957134224904]
スロー反復サンプリングは拡散モデルとフローベース生成モデルの実践的展開において大きなボトルネックとなる。
本稿では,安定かつ効果的なトレーニングを実現するために,バイタルサブ軌道クラスタを選択するDual-End Consistency Model (DE-CM)を提案する。
提案手法は,ImageNet 256x256データセットの1ステップ生成において,最先端のFIDスコア1.70を達成し,既存のCMベースのワンステップアプローチよりも優れていた。
論文 参考訳(メタデータ) (2026-02-11T11:51:01Z) - RobustSplat: Decoupling Densification and Dynamics for Transient-Free 3DGS [79.15416002879239]
3D Gaussian Splattingは、ノベルビュー合成と3Dモデリングにおけるリアルタイム、フォトリアリスティックレンダリングにおいて大きな注目を集めている。
既存の手法は、過渡的なオブジェクトに影響されたシーンを正確にモデル化するのに苦労し、描画された画像のアーティファクトに繋がる。
2つの重要な設計に基づく堅牢なソリューションであるRobustSplatを提案する。
論文 参考訳(メタデータ) (2025-06-03T11:13:48Z) - MASSeg : 2nd Technical Report for 4th PVUW MOSE Track [4.988774092444048]
複雑なビデオオブジェクトセグメンテーションのためのMASSegという改良モデルを提案し,MOSE+という拡張データセットを構築した。
トレーニング中に、堅牢性と一般化を改善するために、フレーム間の一貫性と一貫性のないデータ拡張戦略を組み合わせる。
MASSegはJスコア0.8250、Fスコア0.9007、J&Fスコア0.8628をMOSEテストセットで達成する。
論文 参考訳(メタデータ) (2025-04-14T14:15:46Z) - Event-boosted Deformable 3D Gaussians for Dynamic Scene Reconstruction [50.873820265165975]
本稿では,高時間分解能連続運動データと動的シーン再構成のための変形可能な3D-GSを併用したイベントカメラについて紹介する。
本稿では、3次元再構成としきい値モデリングの両方を大幅に改善する相互強化プロセスを作成するGS-Thresholdジョイントモデリング戦略を提案する。
提案手法は,合成および実世界の動的シーンを用いた最初のイベント包摂型4Dベンチマークであり,その上で最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-11-25T08:23:38Z) - Dynamic Position Transformation and Boundary Refinement Network for Left Atrial Segmentation [17.09918110723713]
左心房細動は不整脈(心房細動)の診断において重要な手法である。
LAセグメンテーションの現在のほとんどの方法は、入力データがオブジェクト指向のセンタートリミングによって取得されると厳密に仮定している。
本稿では,これらの問題に対処するための新しい動的位置変換と境界改善ネットワーク(DPBNet)を提案する。
論文 参考訳(メタデータ) (2024-07-07T22:09:35Z) - Unsupervised Region-Growing Network for Object Segmentation in Atmospheric Turbulence [10.8380383565446]
大気乱流による動画中の移動物体のセグメンテーションに対する教師なしのアプローチを提案する。
まず、高信頼で動く物体の小さな集合を識別し、その後、これらの種子から徐々に前景マスクを成長させ、すべての動く物体を分割する。
その結果, 移動物体のセグメンテーションにおける精度は良好であり, 様々な乱流強度を持つ長距離ビデオに対してロバストであることがわかった。
論文 参考訳(メタデータ) (2023-11-06T22:17:18Z) - Leveraging the Power of Data Augmentation for Transformer-based Tracking [64.46371987827312]
トラッキング用にカスタマイズされた2つのデータ拡張手法を提案する。
まず、動的探索半径機構と境界サンプルのシミュレーションにより、既存のランダムトリミングを最適化する。
第2に,背景干渉などの問題に対するモデルを可能にする,トークンレベルの機能混在強化戦略を提案する。
論文 参考訳(メタデータ) (2023-09-15T09:18:54Z) - DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。
具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。
我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-09-09T04:40:01Z) - Learning to Segment Rigid Motions from Two Frames [72.14906744113125]
本研究では, 運動場から独立物体の動きを復元する幾何学的解析により, モジュラーネットワークを提案する。
2つの連続フレームを入力とし、背景のセグメンテーションマスクと複数の剛体移動オブジェクトを予測し、3次元の剛体変換によってパラメータ化する。
本手法はkittiおよびsintelにおける剛体運動セグメンテーションの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-11T04:20:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。