論文の概要: Shedding the Facades, Connecting the Domains: Detecting Shifting Multimodal Hate Video with Test-Time Adaptation
- arxiv url: http://arxiv.org/abs/2602.00132v1
- Date: Wed, 28 Jan 2026 05:59:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:32.96769
- Title: Shedding the Facades, Connecting the Domains: Detecting Shifting Multimodal Hate Video with Test-Time Adaptation
- Title(参考訳): ドメインを接続するファサードのシーディング:テスト時間適応によるマルチモーダル・ヘイト動画のシフト検出
- Authors: Jiao Li, Jian Lang, Xikai Tang, Wenzheng Shu, Ting Zhong, Qiang Gao, Yong Wang, Leiting Chen, Fan Zhou,
- Abstract要約: ヘイトビデオ検出(HVD)は、オンラインエコシステムにとって不可欠である。
テスト時間適応(TTA)は、ドメイン間のギャップを狭めるために推論中にモデルを適用することで、ソリューションを提供する。
HVDに適した最初のTTAフレームワークであるSCANNERを提案する。
- 参考スコア(独自算出の注目度): 34.08076960067023
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hate Video Detection (HVD) is crucial for online ecosystems. Existing methods assume identical distributions between training (source) and inference (target) data. However, hateful content often evolves into irregular and ambiguous forms to evade censorship, resulting in substantial semantic drift and rendering previously trained models ineffective. Test-Time Adaptation (TTA) offers a solution by adapting models during inference to narrow the cross-domain gap, while conventional TTA methods target mild distribution shifts and struggle with the severe semantic drift in HVD. To tackle these challenges, we propose SCANNER, the first TTA framework tailored for HVD. Motivated by the insight that, despite the evolving nature of hateful manifestations, their underlying cores remain largely invariant (i.e., targeting is still based on characteristics like gender, race, etc), we leverage these stable cores as a bridge to connect the source and target domains. Specifically, SCANNER initially reveals the stable cores from the ambiguous layout in evolving hateful content via a principled centroid-guided alignment mechanism. To alleviate the impact of outlier-like samples that are weakly correlated with centroids during the alignment process, SCANNER enhances the prior by incorporating a sample-level adaptive centroid alignment strategy, promoting more stable adaptation. Furthermore, to mitigate semantic collapse from overly uniform outputs within clusters, SCANNER introduces an intra-cluster diversity regularization that encourages the cluster-wise semantic richness. Experiments show that SCANNER outperforms all baselines, with an average gain of 4.69% in Macro-F1 over the best.
- Abstract(参考訳): ヘイトビデオ検出(HVD)は、オンラインエコシステムにとって不可欠である。
既存の方法は、トレーニング(ソース)と推論(ターゲット)データの間に同じ分布を仮定する。
しかし、ヘイトフルコンテンツはしばしば検閲を避けるために不規則で曖昧な形式に進化し、意味的な漂流と以前に訓練されたモデルのレンダリングは効果がない。
テスト時間適応(TTA)は、ドメイン間ギャップを狭めるために推論中にモデルを適用することで解を提供する。
これらの課題に対処するために,HVDに適した最初のTTAフレームワークであるSCANNERを提案する。
ヘイトフルな表現の進化した性質にもかかわらず、その根底にあるコアは変わらず(つまり、ターゲティングは依然として性別や人種などの特徴に基づいている)、ソースとターゲットドメインを繋ぐブリッジとしてこれらの安定コアを利用するという洞察に動機づけられた。
特に、SCANNERは最初、原則付きセントロイド誘導アライメント機構を通じて、ヘイトフルコンテンツの進化における曖昧なレイアウトから安定したコアを明らかにする。
アライメント過程において、センチロイドと弱い相関関係を持つアウタリアのようなサンプルの影響を軽減するため、SCANNERはサンプルレベル適応センチロイドアライメント戦略を取り入れ、より安定した適応を促進することで、先行性を高める。
さらに、クラスタ内の過度に均一な出力からセマンティック崩壊を緩和するために、SCANNERはクラスタ単位のセマンティックリッチ性を促進するクラスタ内多様性の正規化を導入している。
実験の結果、SCANNERは全てのベースラインを上回り、マクロF1では平均4.69%の上昇を示した。
関連論文リスト
- Attention Residual Fusion Network with Contrast for Source-free Domain Adaptation [7.195870730342018]
ソースフリードメイン適応(SFDA)は、ソースドメイン上でモデルをトレーニングし、関連するターゲットドメインに適用する。
最近の研究は有望な結果を示しているが、ドメイン適応への多くのアプローチはドメインシフトに集中している。
本研究では, 負の移動とドメインシフトを軽減するために, SFDAのコントラスト学習に基づくARFNet(Attention Residual Fusion Network)の新たなフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-25T03:27:26Z) - Advancing Reliable Test-Time Adaptation of Vision-Language Models under Visual Variations [67.35596444651037]
視覚言語モデル(VLM)は、素晴らしいゼロショット機能を示すが、ラベル付きデータが利用できない場合、下流タスクの分散シフトに苦慮する。
本稿では,信頼性を両面から高めるReliable Test-Time Adaptation (ReTA)法を提案する。
論文 参考訳(メタデータ) (2025-07-13T05:37:33Z) - DRIVE: Dual-Robustness via Information Variability and Entropic Consistency in Source-Free Unsupervised Domain Adaptation [10.127634263641877]
ラベル付きデータなしで機械学習モデルを新しいドメインに適応させることは、医療画像、自律運転、リモートセンシングといったアプリケーションにおいて重要な課題である。
Source-Free Unsupervised Domain Adaptation (SFUDA)と呼ばれるこのタスクでは、未ラベルのターゲットデータのみを使用して、トレーニング済みのモデルをターゲットドメインに適応させる。
既存のSFUDAメソッドは、しばしば単一モデルアーキテクチャに依存し、ターゲットドメインにおける不確実性と可変性に悩まされる。
本稿では、2重モデルアーキテクチャを利用した新しいSFUDAフレームワークDRIVEを提案する。
論文 参考訳(メタデータ) (2024-11-24T20:35:04Z) - Adaptive Bidirectional Displacement for Semi-Supervised Medical Image Segmentation [11.195959019678314]
整合性学習は、半教師付き医療画像セグメンテーションにおいて、ラベルのないデータに取り組むための中心的な戦略である。
本稿では,上記の課題を解決するための適応的双方向変位法を提案する。
論文 参考訳(メタデータ) (2024-05-01T08:17:43Z) - Confidence Attention and Generalization Enhanced Distillation for
Continuous Video Domain Adaptation [62.458968086881555]
連続ビデオドメイン適応(CVDA、Continuous Video Domain Adaptation)は、ソースモデルが個々の変更対象ドメインに適応する必要があるシナリオである。
CVDAの課題に対処するため,遺伝子組み換え型自己知識解離(CART)を用いた信頼性保証ネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-18T16:40:10Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Margin Preserving Self-paced Contrastive Learning Towards Domain
Adaptation for Medical Image Segmentation [51.93711960601973]
クロスモーダル医療画像セグメンテーションのための自己ペースコントラスト学習モデルを保存する新しいマージンを提案する。
プログレッシブに洗練されたセマンティックプロトタイプの指導により、埋め込み表現空間の識別性を高めるために、コントラスト損失を減少させる新しいマージンが提案される。
クロスモーダル心セグメンテーションタスクの実験は、MPSCLが意味セグメンテーション性能を大幅に改善することを示した。
論文 参考訳(メタデータ) (2021-03-15T15:23:10Z) - Contradictory Structure Learning for Semi-supervised Domain Adaptation [67.89665267469053]
現在の逆順応法は、クロスドメインの特徴を整列させようとする。
1)条件分布ミスマッチ、2)決定境界のソース領域へのバイアス。
本稿では,対向構造の学習を統一することで,半教師付きドメイン適応のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-06T22:58:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。