論文の概要: Ego4OOD: Rethinking Egocentric Video Domain Generalization via Covariate Shift Scoring
- arxiv url: http://arxiv.org/abs/2601.17056v1
- Date: Wed, 21 Jan 2026 20:05:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:07.103683
- Title: Ego4OOD: Rethinking Egocentric Video Domain Generalization via Covariate Shift Scoring
- Title(参考訳): Ego4OOD: Covariate Shift ScoringによるEgocentric Video Domain Generalizationの再考
- Authors: Zahra Vaseqi, James Clark,
- Abstract要約: Ego4OODは、Ego4Dから派生した領域一般化ベンチマークである。
Ego4OODは地理的に異なる8つのドメインにまたがる。
本稿では、最先端の自己中心型ドメイン一般化手法と競合する軽量な2層完全接続ネットワーク性能を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Egocentric video action recognition under domain shifts remains challenging due to large intra-class spatio-temporal variability, long-tailed feature distributions, and strong correlations between actions and environments. Existing benchmarks for egocentric domain generalization often conflate covariate shifts with concept shifts, making it difficult to reliably evaluate a model's ability to generalize across input distributions. To address this limitation, we introduce Ego4OOD, a domain generalization benchmark derived from Ego4D that emphasizes measurable covariate diversity while reducing concept shift through semantically coherent, moment-level action categories. Ego4OOD spans eight geographically distinct domains and is accompanied by a clustering-based covariate shift metric that provides a quantitative proxy for domain difficulty. We further leverage a one-vs-all binary training objective that decomposes multi-class action recognition into independent binary classification tasks. This formulation is particularly well-suited for covariate shift by reducing interference between visually similar classes under feature distribution shift. Using this formulation, we show that a lightweight two-layer fully connected network achieves performance competitive with state-of-the-art egocentric domain generalization methods on both Argo1M and Ego4OOD, despite using fewer parameters and no additional modalities. Our empirical analysis demonstrates a clear relationship between measured covariate shift and recognition performance, highlighting the importance of controlled benchmarks and quantitative domain characterization for studying out-of-distribution generalization in egocentric video.
- Abstract(参考訳): ドメインシフト下でのエゴセントリックなビデオアクション認識は、クラス内の時間変動、長い尾の特徴分布、行動と環境の間に強い相関関係があるため、依然として困難である。
エゴセントリック領域一般化のための既存のベンチマークは、しばしば共変量シフトを概念シフトと説明し、入力分布をまたいで一般化するモデルの能力を確実に評価することは困難である。
この制限に対処するために、Ego4OODというドメイン一般化ベンチマークを導入する。Ego4OODは、意味的コヒーレントなモーメントレベルアクションカテゴリによる概念シフトを減らしながら、測定可能な共変量多様性を強調する。
Ego4OODは地理的に異なる8つのドメインにまたがり、クラスタリングベースの共変量シフトメトリックが伴い、ドメインの難易度を定量的にプロキシする。
さらに,マルチクラス動作認識を独立したバイナリ分類タスクに分解する,一対一のバイナリトレーニング目標を活用する。
この定式化は、特徴分布シフトの下で視覚的に類似したクラス間の干渉を減らすことで、共変量シフトに特に適している。
本稿では,Argo1MとEgo4OODの両領域において,より少ないパラメータと余分なモダリティを使わずに,最先端のエゴセントリックな領域一般化手法と競合する軽量な2層完全連結ネットワークを実現することを示す。
実験的な分析により,測定された共変量シフトと認識性能の明確な関係が示され,エゴセントリックビデオにおける分布外一般化の研究において,制御されたベンチマークの重要性と量的領域のキャラクタリゼーションが強調された。
関連論文リスト
- Attention Residual Fusion Network with Contrast for Source-free Domain Adaptation [7.195870730342018]
ソースフリードメイン適応(SFDA)は、ソースドメイン上でモデルをトレーニングし、関連するターゲットドメインに適用する。
最近の研究は有望な結果を示しているが、ドメイン適応への多くのアプローチはドメインシフトに集中している。
本研究では, 負の移動とドメインシフトを軽減するために, SFDAのコントラスト学習に基づくARFNet(Attention Residual Fusion Network)の新たなフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-25T03:27:26Z) - Fair Deepfake Detectors Can Generalize [51.21167546843708]
共同設立者(データ分散とモデルキャパシティ)の制御により,公正な介入による一般化が向上することを示す。
この知見を応用して, 逆正当性重み付けとサブグループワイド特徴正規化を併用し, 新たなアライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・インセンティブ・インターベンション・インベンション・インテクション(DAID)を提案する。
DAIDは、いくつかの最先端技術と比較して、公平性と一般化の両方において一貫して優れた性能を達成する
論文 参考訳(メタデータ) (2025-07-03T14:10:02Z) - Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - Rethinking Domain Generalization: Discriminability and Generalizability [31.967801550742312]
ドメイン一般化(DG)は、優れた識別可能性を維持しつつ、強力な一般化性を持つ堅牢なモデルを開発する。
DMDA(Distriminative Microscopic Distribution Alignment)という新しいフレームワークを提案する。
DMDAはSelective Channel Pruning(SCP)とMicro-level Distribution Alignment(MDA)の2つのコアコンポーネントを組み込んでいる。
論文 参考訳(メタデータ) (2023-09-28T14:45:54Z) - Generalizable Heterogeneous Federated Cross-Correlation and Instance
Similarity Learning [60.058083574671834]
本稿では,新しいFCCL+,フェデレーション相関と非ターゲット蒸留との類似性学習を提案する。
不均一な問題に対しては、無関係な公開データを通信に活用する。
局所的な更新段階における破滅的な忘れ物として、FCCL+はFederated Non Target Distillationを導入している。
論文 参考訳(メタデータ) (2023-09-28T09:32:27Z) - Coarse to Fine: Domain Adaptive Crowd Counting via Adversarial Scoring
Network [58.05473757538834]
本稿では,ドメイン間のギャップを粗い粒度から細かな粒度に埋める新しい逆スコアリングネットワーク (ASNet) を提案する。
3組のマイグレーション実験により,提案手法が最先端のカウント性能を実現することを示す。
論文 参考訳(メタデータ) (2021-07-27T14:47:24Z) - Learning from Self-Discrepancy via Multiple Co-teaching for Cross-Domain
Person Re-Identification [12.106894735305714]
ドメイン適応者再IDのための複数コティーチングフレームワークを提案する。
本手法は最先端技術と比較して競争力が向上する。
論文 参考訳(メタデータ) (2021-04-06T03:12:11Z) - Margin Preserving Self-paced Contrastive Learning Towards Domain
Adaptation for Medical Image Segmentation [51.93711960601973]
クロスモーダル医療画像セグメンテーションのための自己ペースコントラスト学習モデルを保存する新しいマージンを提案する。
プログレッシブに洗練されたセマンティックプロトタイプの指導により、埋め込み表現空間の識別性を高めるために、コントラスト損失を減少させる新しいマージンが提案される。
クロスモーダル心セグメンテーションタスクの実験は、MPSCLが意味セグメンテーション性能を大幅に改善することを示した。
論文 参考訳(メタデータ) (2021-03-15T15:23:10Z) - Adaptively-Accumulated Knowledge Transfer for Partial Domain Adaptation [66.74638960925854]
部分ドメイン適応(PDA)は、ソースドメインラベル空間がターゲットドメインを置き換えるとき、現実的で困難な問題を扱う。
本稿では,2つの領域にまたがる関連カテゴリを整合させる適応的知識伝達フレームワーク(A$2KT)を提案する。
論文 参考訳(メタデータ) (2020-08-27T00:53:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。