論文の概要: CD-FKD: Cross-Domain Feature Knowledge Distillation for Robust Single-Domain Generalization in Object Detection
- arxiv url: http://arxiv.org/abs/2603.16439v1
- Date: Tue, 17 Mar 2026 12:20:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.267875
- Title: CD-FKD: Cross-Domain Feature Knowledge Distillation for Robust Single-Domain Generalization in Object Detection
- Title(参考訳): CD-FKD:オブジェクト検出におけるロバスト単一ドメイン一般化のためのクロスドメイン特徴知識蒸留
- Authors: Junseok Lee, Sungho Shin, Seongju Lee, Kyoobin Lee,
- Abstract要約: 単一ドメインの一般化はオブジェクト検出に不可欠である。
天気、照明、シーン条件の変化などのドメインシフトは、既存のモデルの一般化能力に重大な課題をもたらす。
本稿では,学生ネットワークの一般化能力を高めるクロスドメイン特徴知識蒸留(CD-FKD)を提案する。
- 参考スコア(独自算出の注目度): 10.93820509165745
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Single-domain generalization is essential for object detection, particularly when training models on a single source domain and evaluating them on unseen target domains. Domain shifts, such as changes in weather, lighting, or scene conditions, pose significant challenges to the generalization ability of existing models. To address this, we propose Cross-Domain Feature Knowledge Distillation (CD-FKD), which enhances the generalization capability of the student network by leveraging both global and instance-wise feature distillation. The proposed method uses diversified data through downscaling and corruption to train the student network, whereas the teacher network receives the original source domain data. The student network mimics the features of the teacher through both global and instance-wise distillation, enabling it to extract object-centric features effectively, even for objects that are difficult to detect owing to corruption. Extensive experiments on challenging scenes demonstrate that CD-FKD outperforms state-of-the-art methods in both target domain generalization and source domain performance, validating its effectiveness in improving object detection robustness to domain shifts. This approach is valuable in real-world applications, like autonomous driving and surveillance, where robust object detection in diverse environments is crucial.
- Abstract(参考訳): 単一ドメインの一般化は、特に単一のソースドメイン上でモデルをトレーニングし、未確認のターゲットドメイン上でそれらを評価する場合、オブジェクト検出に不可欠である。
天気、照明、シーン条件の変化などのドメインシフトは、既存のモデルの一般化能力に重大な課題をもたらす。
そこで本研究では,グローバルな特徴蒸留とインスタンス的な特徴蒸留の両方を活用することで,学生ネットワークの一般化能力を高めるクロスドメイン特徴知識蒸留(CD-FKD)を提案する。
提案手法は,学生ネットワークをトレーニングするために,ダウンスケーリングと汚職による多様化データを用いており,教師ネットワークは元のドメインデータを受け取る。
学生ネットワークは、グローバル蒸留とインスタンス蒸留の両方を通じて教師の特徴を模倣し、汚職による検出が難しいオブジェクトであっても、オブジェクト中心の特徴を効果的に抽出することを可能にする。
挑戦シーンに関する大規模な実験により、CD-FKDはターゲットドメインの一般化とソースドメインの性能の両方において最先端の手法より優れており、オブジェクト検出の堅牢性を向上させる上での有効性が検証された。
このアプローチは、自律運転や監視など、さまざまな環境で堅牢なオブジェクト検出が不可欠である現実世界のアプリケーションにおいて、価値があります。
関連論文リスト
- Improving Generalization Ability for 3D Object Detection by Learning Sparsity-invariant Features [21.761631081209263]
単一領域における3次元物体検出の一般化能力を向上させる手法を提案する。
1つのソースドメインから空間不変の特徴を学習するために、ソースデータを特定のビームに選択的にサブサンプリングする。
我々はまた、異なる点の雲の密度にBird’s Eye View機能を調整するために、教師学生のフレームワークも使用しています。
論文 参考訳(メタデータ) (2025-02-04T13:47:02Z) - Feature Based Methods in Domain Adaptation for Object Detection: A Review Paper [0.6437284704257459]
ドメイン適応は、異なるデータ分布を持つターゲットドメインにデプロイされた場合、機械学習モデルの性能を向上させることを目的としている。
本総説では, 対人学習, 相違に基づく多分野, 教師学生, アンサンブル, ビジョン言語モデルなど, ドメイン適応のための高度な方法論を考察する。
特に合成ドメインシフトを含むシナリオにおいて、ラベル付きデータへの依存を最小限に抑える戦略に特に注意が払われる。
論文 参考訳(メタデータ) (2024-12-23T06:34:23Z) - Object Style Diffusion for Generalized Object Detection in Urban Scene [69.04189353993907]
本稿では,GoDiffという新しい単一ドメインオブジェクト検出一般化手法を提案する。
擬似ターゲットドメインデータとソースドメインデータを統合することで、トレーニングデータセットを多様化する。
実験により,本手法は既存の検出器の一般化能力を高めるだけでなく,他の単一領域一般化手法のプラグ・アンド・プレイ拡張として機能することが示された。
論文 参考訳(メタデータ) (2024-12-18T13:03:00Z) - Prompt-Driven Dynamic Object-Centric Learning for Single Domain
Generalization [61.64304227831361]
単一ドメインの一般化は、単一のソースドメインデータからモデルを学び、他の見えないターゲットドメイン上での一般的なパフォーマンスを達成することを目的としている。
本稿では,画像の複雑さの変化に対応することを目的とした,素早い学習に基づく動的物体中心知覚ネットワークを提案する。
論文 参考訳(メタデータ) (2024-02-28T16:16:51Z) - CLIP the Gap: A Single Domain Generalization Approach for Object
Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。
本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。
本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文 参考訳(メタデータ) (2023-01-13T12:01:18Z) - Cross Domain Object Detection by Target-Perceived Dual Branch
Distillation [49.68119030818388]
クロスドメインオブジェクト検出は、現実的で挑戦的なタスクです。
本稿では,TDD(Target-perceived Dual-branch Distillation)フレームワークを提案する。
私たちのTDDは、すべてのベンチマークで最先端のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-05-03T03:51:32Z) - Decompose to Adapt: Cross-domain Object Detection via Feature
Disentanglement [79.2994130944482]
本研究では,DDF(Domain Disentanglement Faster-RCNN)を設計し,タスク学習のための特徴のソース固有情報を排除した。
DDF法は,グローバルトリプルト・ディアンタングルメント(GTD)モジュールとインスタンス類似性・ディアンタングルメント(ISD)モジュールを用いて,グローバルおよびローカルステージでの機能ディアンタングルを容易にする。
提案手法は,4つのUDAオブジェクト検出タスクにおいて最先端の手法より優れており,広い適用性で有効であることが実証された。
論文 参考訳(メタデータ) (2022-01-06T05:43:01Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。