論文の概要: Cycle Consistency in Video Object-Centric Learning
- arxiv url: http://arxiv.org/abs/2605.30211v1
- Date: Thu, 28 May 2026 16:45:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.552007
- Title: Cycle Consistency in Video Object-Centric Learning
- Title(参考訳): ビデオオブジェクト中心学習におけるサイクル整合性
- Authors: Rongzhen Zhao, Zhiyuan Li, Ruonan Wei, Juho Kannala, Joni Pajarinen,
- Abstract要約: 自己監督型ビデオオブジェクト中心学習は、異なるオブジェクトを発見し、時間をかけて関連付けることを目的としている。
Cycle Consistency (CC) はOCLの潜在スロット空間に因果的あるいは明示的に適用できない。
本稿では,周期整合性制約を制約付きスロット空間から連続再構成多様体へシフトさせるImplicit Cycle Consistency (ICC)を提案する。
- 参考スコア(独自算出の注目度): 33.833061023960546
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-supervised video Object-Centric Learning (OCL) aims to discover distinct objects and associate them across time, whereas self-supervised Multi-Object Tracking (MOT) focuses on associating pre-defined object detections or segmentations. Although well-established in MOT, Cycle Consistency (CC) cannot naively or explicitly apply to the latent slot space of OCL. Unlike the deterministic and ideal object representations in MOT, OCL slots are inherently stochastic and ambiguous due to non-unique scene decompositions. Enforcing explicit cycle consistency (ECC) on slots imposes rigid mean seeking. This severely penalizes the model for exploring alternative but equally valid decompositions, thereby driving towards feature collapse. To resolve this dilemma, we propose \textit{Implicit Cycle Consistency (ICC)}, which shifts the cycle-consistency constraint from the restrictive slot space to the continuous reconstruction manifold, encouraging slots to reach a soft consensus on collectively interpreting the visual scene rather than forcing rigid point-to-point feature alignment. Extensive experiments on complex video OCL benchmarks demonstrate that ICC avoids feature collapse and outperforms ECC baselines. Our source code, model checkpoints and training logs are provided on https://github.com/Genera1Z/ICC.
- Abstract(参考訳): OCL(Self-supervised video Object-Centric Learning)は、異なるオブジェクトを発見し、時間にわたって関連付けることを目的としており、MOT(Self-supervised Multi-Object Tracking)は、事前に定義されたオブジェクト検出やセグメンテーションの関連付けに重点を置いている。
MOTで十分に確立されているにもかかわらず、Cycle Consistency (CC) はOCLの潜在スロット空間に因果的または明示的に適用できない。
MOTにおける決定論的および理想的なオブジェクト表現とは異なり、OCLスロットは本質的に確率的であり、非特異なシーン分解のために曖昧である。
スロットに明示的なサイクル一貫性(ECC)を強制することは、厳密な平均探索を強制する。
これにより、代替となるが等価な分解を探索するモデルが厳しく罰せられ、特徴の崩壊に向かう。
このジレンマを解決するために,制約付きスロット空間から連続再構成多様体へのサイクル整合性制約をシフトさせる「textit{Implicit Cycle Consistency(ICC)」を提案する。
複雑なビデオOCLベンチマークでの大規模な実験により、ICCは機能崩壊を避け、ECCベースラインを上回っていることが示された。
ソースコード、モデルチェックポイント、トレーニングログはhttps://github.com/Genera1Z/ICC.comで公開されています。
関連論文リスト
- CIG: Exploration via Conditional Information Gain [10.289348661352841]
異なる文脈における強化学習条件における探索の本質的な報奨
条件情報ゲイン(CIG)は、トラクタブルサロゲートとしての報酬である。
我々はCIGをモデルベースでインスタンス化し、ロールアウトは短く、ロールアウト内修正は未探索のままである。
論文 参考訳(メタデータ) (2026-05-20T08:15:57Z) - From Global to Local: Rethinking CLIP Feature Aggregation for Person Re-Identification [20.74226476678832]
中間パッチトークンとCLIPのテキスト埋め込み空間でパラメータ化されたアンカーベクトルを整列することで、同一性表現を再構築するSAGA-ReIDを提案する。
制御された実験は、2つの定性的に異なる条件下で凝集機構を分離する。
ベンチマーク評価では、CLIP-ReIDよりも標準設定と無視設定で一貫したゲインを確認している。
論文 参考訳(メタデータ) (2026-04-24T03:37:21Z) - Improved Object-Centric Diffusion Learning with Registers and Contrastive Alignment [83.56510119503265]
事前訓練された拡散モデルによるスロット注意(SA)は、最近オブジェクト中心学習(OCL)の可能性を示唆しているが、スロットの絡み合いや、オブジェクトスロットと画像内容との弱いアライメントに悩まされている。
提案するCODA(Contrastive Object-centric Diffusion Alignment)は,(i)残響を吸収し,オブジェクトスロット間の干渉を低減するためにレジスタスロットを使用する単純な拡張であり,(ii)スロットイメージ対応を明示的に促進するためにコントラストアライメントロスを適用する。
論文 参考訳(メタデータ) (2026-01-03T16:10:18Z) - On the Alignment Between Supervised and Self-Supervised Contrastive Learning [8.71512981775656]
自己指導型コントラスト学習(CL)は経験的成功を収めた。
最近の理論では、CLの損失は教師付きサロゲートであるNegatives-Only Supervised Contrastive Learning (NSCL)の損失と密接に近似している。
共有ランダム性の下で学習したCLモデルとNSCLモデルの表現アライメントを解析する。
論文 参考訳(メタデータ) (2025-10-09T23:01:42Z) - Imputation-free and Alignment-free: Incomplete Multi-view Clustering Driven by Consensus Semantic Learning [65.75756724642932]
不完全なマルチビュークラスタリングでは、欠落したデータがビュー内のプロトタイプシフトとビュー間のセマンティック不整合を誘導する。
コンセンサスセマンティクス学習(FreeCSL)のためのIMVCフレームワークを提案する。
FreeCSLは、最先端の競合他社と比較して、IMVCタスクの信頼性と堅牢な割り当てを実現している。
論文 参考訳(メタデータ) (2025-05-16T12:37:10Z) - Are We Done with Object-Centric Learning? [65.67948794110212]
オブジェクト中心学習(OCL)は、シーン内の他のオブジェクトやバックグラウンドキューから分離されたオブジェクトのみをエンコードする表現を学習しようとする。
最近のサンプル効率のセグメンテーションモデルでは、ピクセル空間内のオブジェクトを分離し、それらを独立に符号化することができる。
我々は,OCLのレンズを通した背景刺激によるOOD一般化の課題に対処する。
論文 参考訳(メタデータ) (2025-04-09T17:59:05Z) - Semi-supervised Semantic Segmentation with Multi-Constraint Consistency Learning [81.02648336552421]
本稿では,エンコーダとデコーダの段階的拡張を容易にするためのマルチ制約一貫性学習手法を提案する。
自己適応型特徴マスキングとノイズ注入は、デコーダの堅牢な学習のための特徴を摂動させるために、インスタンス固有の方法で設計されている。
Pascal VOC2012およびCityscapesデータセットの実験結果から,提案したMCCLが新たな最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2025-03-23T03:21:33Z) - Triplet Contrastive Learning for Unsupervised Vehicle Re-identification [55.445358749042384]
部分的特徴学習は、車両の再識別におけるセマンティック理解にとって重要な技術である。
本稿では,クラスタ機能を活用したTCL(Triplet Contrastive Learning framework)を提案する。
論文 参考訳(メタデータ) (2023-01-23T15:52:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。