論文の概要: TTVD: Towards a Geometric Framework for Test-Time Adaptation Based on Voronoi Diagram
- arxiv url: http://arxiv.org/abs/2412.07980v1
- Date: Tue, 10 Dec 2024 23:40:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 14:03:57.645566
- Title: TTVD: Towards a Geometric Framework for Test-Time Adaptation Based on Voronoi Diagram
- Title(参考訳): TTVD:ボロノイ図に基づくテスト時間適応のための幾何学的フレームワーク
- Authors: Mingxi Lei, Chunwei Ma, Meng Ding, Yufan Zhou, Ziyun Huang, Jinhui Xu,
- Abstract要約: テスト時間適応(TTA)は、この問題に対処するために推論時に使われる新しいスキームである。
幾何学的観点からTTA問題を考察する。
本稿では,この幾何学的特性の利点を利用した新しいフレームワークであるVoronoi Diagram guidance (TTVD) によるテスト時間調整を提案する。
- 参考スコア(独自算出の注目度): 14.238620530634392
- License:
- Abstract: Deep learning models often struggle with generalization when deploying on real-world data, due to the common distributional shift to the training data. Test-time adaptation (TTA) is an emerging scheme used at inference time to address this issue. In TTA, models are adapted online at the same time when making predictions to test data. Neighbor-based approaches have gained attention recently, where prototype embeddings provide location information to alleviate the feature shift between training and testing data. However, due to their inherit limitation of simplicity, they often struggle to learn useful patterns and encounter performance degradation. To confront this challenge, we study the TTA problem from a geometric point of view. We first reveal that the underlying structure of neighbor-based methods aligns with the Voronoi Diagram, a classical computational geometry model for space partitioning. Building on this observation, we propose the Test-Time adjustment by Voronoi Diagram guidance (TTVD), a novel framework that leverages the benefits of this geometric property. Specifically, we explore two key structures: 1) Cluster-induced Voronoi Diagram (CIVD): This integrates the joint contribution of self-supervision and entropy-based methods to provide richer information. 2) Power Diagram (PD): A generalized version of the Voronoi Diagram that refines partitions by assigning weights to each Voronoi cell. Our experiments under rigid, peer-reviewed settings on CIFAR-10-C, CIFAR-100-C, ImageNet-C, and ImageNet-R shows that TTVD achieves remarkable improvements compared to state-of-the-art methods. Moreover, extensive experimental results also explore the effects of batch size and class imbalance, which are two scenarios commonly encountered in real-world applications. These analyses further validate the robustness and adaptability of our proposed framework.
- Abstract(参考訳): ディープラーニングモデルは、トレーニングデータへの共通の分散シフトのため、実世界のデータにデプロイする際の一般化に苦慮することが多い。
テスト時間適応(TTA)は、この問題に対処するために推論時に使われる新しいスキームである。
TTAでは、モデルをオンライン化して、データテストの予測を行う。
隣のアプローチは近年注目を集めており、プロトタイプの埋め込みは、トレーニングデータとテストデータの間の機能シフトを軽減するために、位置情報を提供する。
しかし、シンプルさの継承制限のため、有用なパターンを学び、パフォーマンスの劣化に直面するのに苦労することが多い。
この課題に対処するために,幾何学的観点からTTA問題を考察する。
まず、近傍の手法の基盤となる構造が、空間分割のための古典的な計算幾何学モデルであるボロノイ図と整合していることを明らかにする。
本稿では,この幾何学的特性の利点を生かした新しいフレームワークであるVoronoi Diagram Guide (TTVD)によるテスト時間調整を提案する。
具体的には2つの重要な構造を探求する。
1)クラスター誘起ボロノイ図(CIVD):より豊かな情報を提供するための自己超越法とエントロピー法の共同貢献を統合する。
2)パワーダイアグラム (PD): 各ボロノイセルに重みを割り当てることで分割を洗練させるボロノイダイアグラムの一般化版。
CIFAR-10-C, CIFAR-100-C, ImageNet-C, ImageNet-Rの厳密でピアレビューされた条件下での実験を行ったところ, TTVDは最先端の手法に比べて顕著に改善されていることがわかった。
さらに,実世界のアプリケーションでよく見られる2つのシナリオである,バッチサイズとクラス不均衡の影響についても検討した。
これらの分析は,提案フレームワークの堅牢性と適応性をさらに検証する。
関連論文リスト
- Deep Companion Learning: Enhancing Generalization Through Historical Consistency [35.5237083057451]
本稿では,不整合モデル予測をペナライズすることによって一般化を促進するディープニューラルネットワーク(DNN)の新たなトレーニング手法を提案する。
我々は、新しい入力の予測を提供するために、以前のバージョンのモデルを用いて、ディープコンパニオンモデル(DCM)を訓練する。
このコンパニオンモデルは、データ内の有意義な潜在意味構造を解読し、ターゲットの監視を提供する。
論文 参考訳(メタデータ) (2024-07-26T15:31:13Z) - Modern Neighborhood Components Analysis: A Deep Tabular Baseline Two Decades Later [59.88557193062348]
我々は、インスタンス間のセマンティックな類似性をキャプチャする線形射影を学習するために設計された古典的近傍成分分析(NCA)を再考する。
学習目的の調整や深層学習アーキテクチャの統合といった微調整は,NAAの性能を著しく向上させることがわかった。
また,提案したModernNCAの効率性と予測精度を向上する,近隣のサンプリング戦略も導入する。
論文 参考訳(メタデータ) (2024-07-03T16:38:57Z) - Test-Time Domain Generalization for Face Anti-Spoofing [60.94384914275116]
Face Anti-Spoofing (FAS) は、顔認識システムをプレゼンテーション攻撃から保護するために重要である。
本稿では,テストデータを活用してモデルの一般化性を高める新しいテスト時間領域一般化フレームワークについて紹介する。
テスト時間スタイル投影 (TTSP) とディバーススタイルシフトシミュレーション (DSSS) によって構成された本手法は, 目に見えないデータを領域空間に効果的に投影する。
論文 参考訳(メタデータ) (2024-03-28T11:50:23Z) - Towards interpretable-by-design deep learning algorithms [11.154826546951414]
I という名前のフレームワークは、標準教師付き分類問題をトレーニングデータから派生したプロトタイプのセットに類似した関数に再キャストする。
本稿では,そのようなDLモデルを概念的にシンプルで説明可能なプロトタイプモデルにすることができることを示す。
論文 参考訳(メタデータ) (2023-11-19T18:40:49Z) - Engineering the Neural Collapse Geometry of Supervised-Contrastive Loss [28.529476019629097]
Supervised-Contrastive Los (SCL) は、分類タスクのためのクロスエントロピー(CE)の代替品である。
コントラスト損失を補正することにより,学習した特徴埋め込みの幾何学を設計する手法を提案する。
論文 参考訳(メタデータ) (2023-10-02T04:23:17Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - History Repeats: Overcoming Catastrophic Forgetting For Event-Centric
Temporal Knowledge Graph Completion [33.38304336898247]
時間知識グラフ(TKG)の完成モデルは、トレーニング中にグラフ全体にアクセスすることに依存する。
TKGデータは、イベントが展開するにつれて徐々に受信され、時間とともに動的に非定常なデータ分布につながる。
本稿では,任意のTKG完了法に適用可能な一般的な連続トレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-30T01:21:36Z) - Toward Learning Robust and Invariant Representations with Alignment
Regularization and Data Augmentation [76.85274970052762]
本論文はアライメント正則化の選択肢の増大を動機としている。
我々は、ロバスト性および不変性の次元に沿って、いくつかの人気のある設計選択のパフォーマンスを評価する。
我々はまた、現実的と考える仮定の下で経験的な研究を補完するために、アライメント正則化の挙動を正式に分析する。
論文 参考訳(メタデータ) (2022-06-04T04:29:19Z) - Few-shot Learning as Cluster-induced Voronoi Diagrams: A Geometric
Approach [12.382578792491747]
CIVD(Cluster-induced Voronoi Diagram)は、数ショット学習の精度と堅牢性を改善する。
CIVDベースのワークフローにより、mini-ImageNet、CUB、hered-ImagenNetデータセット上で、最先端の新たな結果が得られます。
論文 参考訳(メタデータ) (2022-02-05T02:52:06Z) - Learning Gaussian Graphical Models with Latent Confounders [74.72998362041088]
我々は、グラフィカルモデルにおける推論のための2つの戦略を、潜伏した共同創設者と比較し、対比する。
これら2つのアプローチは、類似した目標を持っているが、それらは共起に関する異なる仮定によって動機付けられている。
これら2つのアプローチの強みを組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2021-05-14T00:53:03Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。