論文の概要: Exploring Effective Knowledge Transfer for Few-shot Object Detection
- arxiv url: http://arxiv.org/abs/2210.02021v1
- Date: Wed, 5 Oct 2022 04:53:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 14:01:04.114658
- Title: Exploring Effective Knowledge Transfer for Few-shot Object Detection
- Title(参考訳): ファウショット物体検出のための効果的な知識伝達の探索
- Authors: Zhiyuan Zhao, Qingjie Liu, Yunhong Wang
- Abstract要約: ローショットのレジームで優れている方法は、ハイショットのレジームで苦労する傾向があり、その逆もある。
ローショット方式では、内級変動の欠如が主な課題である。
ハイショットの体制では、分散が実数に近づくにつれて、パフォーマンスに対する主な障害は、学習された分布と真の分布のミスアライメントから生じる。
- 参考スコア(独自算出の注目度): 54.45009859654753
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, few-shot object detection~(FSOD) has received much attention from
the community, and many methods are proposed to address this problem from a
knowledge transfer perspective. Though promising results have been achieved,
these methods fail to achieve shot-stable:~methods that excel in low-shot
regimes are likely to struggle in high-shot regimes, and vice versa. We believe
this is because the primary challenge of FSOD changes when the number of shots
varies. In the low-shot regime, the primary challenge is the lack of
inner-class variation. In the high-shot regime, as the variance approaches the
real one, the main hindrance to the performance comes from misalignment between
learned and true distributions. However, these two distinct issues remain
unsolved in most existing FSOD methods. In this paper, we propose to overcome
these challenges by exploiting rich knowledge the model has learned and
effectively transferring them to the novel classes. For the low-shot regime, we
propose a distribution calibration method to deal with the lack of inner-class
variation problem. Meanwhile, a shift compensation method is proposed to
compensate for possible distribution shift during fine-tuning. For the
high-shot regime, we propose to use the knowledge learned from ImageNet as
guidance for the feature learning in the fine-tuning stage, which will
implicitly align the distributions of the novel classes. Although targeted
toward different regimes, these two strategies can work together to further
improve the FSOD performance. Experiments on both the VOC and COCO benchmarks
show that our proposed method can significantly outperform the baseline method
and produce competitive results in both low-shot settings (shot<5) and
high-shot settings (shot>=5). Code is available at
https://github.com/JulioZhao97/EffTrans_Fsdet.git.
- Abstract(参考訳): 近年,fsod(non-shot object detection)がコミュニティから注目を集め,知識伝達の観点からこの問題に対処するための手法が数多く提案されている。
有望な結果が得られたが、これらの方法はショット安定には至らなかった:~ ローショットレジームで優れているメソッドは、ハイショットレジームで苦労する可能性が高い。
fsodの主な課題は、ショット数が変化すると変わるからだ、と私たちは信じています。
低ショットのシステムでは、主な課題は内部クラスのバリエーションの欠如である。
高ショット方式では、分散が実分布に近づくと、性能の主な障害は学習分布と真の分布の間の不一致である。
しかし、これらの2つの問題は既存のFSOD法では未解決のままである。
本稿では,モデルが学んだ豊富な知識を活用して,これらの課題を克服し,新しいクラスに効果的に移行することを提案する。
低ショット方式では,内部クラス変動問題に対処できる分散キャリブレーション手法を提案する。
一方,微調整時の分散シフトを補償するシフト補償法が提案されている。
高ショット方式では,imagenet から学んだ知識を微調整段階における特徴学習の指導として利用し,新たなクラスの分布を暗黙的に整えることを提案する。
異なる体制をターゲットにしているが、これらの2つの戦略はFSODのパフォーマンスをさらに向上するために協力することができる。
VOCとCOCOのベンチマーク実験により,提案手法はベースライン法を著しく上回り,低ショット設定 (shot<5) と高ショット設定 (shot>=5) の競争結果が得られることが示された。
コードはhttps://github.com/juliozhao97/efftrans_fsdet.gitで入手できる。
関連論文リスト
- Enhancing Training Data Attribution for Large Language Models with Fitting Error Consideration [74.09687562334682]
Debias and Denoise Attribution (DDA) と呼ばれる新しいトレーニングデータ属性法を導入する。
提案手法は既存のアプローチよりも優れており,平均91.64%のAUCを実現している。
DDAは、様々なソースとLLaMA2、QWEN2、Mistralのような異なるスケールのモデルに対して、強力な汎用性とスケーラビリティを示す。
論文 参考訳(メタデータ) (2024-10-02T07:14:26Z) - Phasic Content Fusing Diffusion Model with Directional Distribution
Consistency for Few-Shot Model Adaption [73.98706049140098]
本稿では,方向分布の整合性を損なう少数ショット拡散モデルを用いた新しいファシックコンテンツを提案する。
具体的には、ファシックコンテンツ融合を用いたファシックトレーニング戦略を設計し、tが大きければ、モデルがコンテンツやスタイル情報を学ぶのに役立てる。
最後に、ドメイン適応時の構造整合性を高めるクロスドメイン構造ガイダンス戦略を提案する。
論文 参考訳(メタデータ) (2023-09-07T14:14:11Z) - Causal Interventions-based Few-Shot Named Entity Recognition [5.961427870758681]
名前付きエンティティ認識(NER)システムは、いくつかのラベル付きサンプルに基づいて新しいエンティティのクラスを認識することを目的としている。
少数ショット学習における過度なオーバーフィッティングは主に、少数のサンプル選択バイアスによって引き起こされる刺激的な相関によって導かれる。
本稿では,因果的介入に基づく複数ショットNER法を提案する。
論文 参考訳(メタデータ) (2023-05-03T06:11:39Z) - Stable Target Field for Reduced Variance Score Estimation in Diffusion
Models [5.9115407007859755]
拡散モデルは、固定された前方拡散過程を反転させてサンプルを生成する。
このような分散の源泉は、中間雑音分散スケールの取り扱いにあると論じる。
より安定したトレーニングターゲットとして重み付けされた条件スコアを計算するために使用する参照バッチを組み込むことにより、この問題を修復することを提案する。
論文 参考訳(メタデータ) (2023-02-01T18:57:01Z) - MEAL: Stable and Active Learning for Few-Shot Prompting [26.60924937965494]
ショットの分類は、いくつかのショットの異なるセットと異なる微調整ランの両方に高いばらつきがある。
そこで本研究では,新たなアンサンブル手法を提案し,実行可能性を大幅に低下させることを示す。
第2に、データ選択のための新しいアクティブラーニング(AL)基準を導入し、プロンプトベースラーニングに特化したALベースのアプローチを提示する。
論文 参考訳(メタデータ) (2022-11-15T18:06:53Z) - A New Knowledge Distillation Network for Incremental Few-Shot Surface
Defect Detection [20.712532953953808]
本稿では,DKAN(Dual Knowledge Align Network)と呼ばれる新しい知識蒸留ネットワークを提案する。
提案したDKAN法は,事前学習型ファインタニング伝達学習パラダイムを踏襲し,ファインタニングのための知識蒸留フレームワークを設計した。
Few-shot NEU-DETデータセットをインクリメンタルに実験した結果、DKANは様々なシーンで他の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-09-01T15:08:44Z) - Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。
実験結果から,これらの手法が直面する課題を分析した。
本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文 参考訳(メタデータ) (2022-03-23T07:33:37Z) - Revisiting Consistency Regularization for Semi-Supervised Learning [80.28461584135967]
そこで我々は,FeatDistLossというシンプルな手法により,一貫性の規則化を改良したフレームワークを提案する。
実験結果から,本モデルは様々なデータセットや設定のための新しい技術状態を定義する。
論文 参考訳(メタデータ) (2021-12-10T20:46:13Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z) - Leveraging the Feature Distribution in Transfer-based Few-Shot Learning [2.922007656878633]
ラベル付きサンプルの少ない使用によって生じる不確実性のため、ほとんどショット分類が難しい問題である。
本稿では,(1)特徴ベクトルをガウス分布に近づけるように前処理し,2)最適輸送インスパイアされたアルゴリズムを用いて,この前処理を活用する。
提案手法は,様々なデータセット,バックボーンアーキテクチャ,少数ショット設定を用いて,最先端の精度を実現することができる。
論文 参考訳(メタデータ) (2020-06-06T07:32:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。