Fugu-MT 論文翻訳(概要): A Closer Look at Cross-Domain Few-Shot Object Detection: Fine-Tuning Matters and Parallel Decoder Helps

論文の概要: A Closer Look at Cross-Domain Few-Shot Object Detection: Fine-Tuning Matters and Parallel Decoder Helps

arxiv url: http://arxiv.org/abs/2603.28182v1
Date: Mon, 30 Mar 2026 08:46:10 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-31 23:18:45.310794
Title: A Closer Look at Cross-Domain Few-Shot Object Detection: Fine-Tuning Matters and Parallel Decoder Helps
Title（参考訳）: クロスドメインFew-Shotオブジェクト検出のクローズアップ:微調整と並列デコーダ
Authors: Xuanlong Yu, Youyang Sha, Longfei Liu, Xi Shen, Di Yang,
Abstract要約: 微調整時の一般化を高めるハイブリッドデコーダアンサンブルを提案する。アンサンブル学習にインスパイアされたデコーダは、共有階層層と、複数の並列デコーダブランチから構成される。この設計は、追加パラメータを導入することなく事前訓練された重みを完全に活用し、その結果の多様な予測を効果的に組み込んで一般化を改善することができる。
参考スコア（独自算出の注目度）: 7.9629908861093766
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Few-shot object detection (FSOD) is challenging due to unstable optimization and limited generalization arising from the scarcity of training samples. To address these issues, we propose a hybrid ensemble decoder that enhances generalization during fine-tuning. Inspired by ensemble learning, the decoder comprises a shared hierarchical layer followed by multiple parallel decoder branches, where each branch employs denoising queries either inherited from the shared layer or newly initialized to encourage prediction diversity. This design fully exploits pretrained weights without introducing additional parameters, and the resulting diverse predictions can be effectively ensembled to improve generalization. We further leverage a unified progressive fine-tuning framework with a plateau-aware learning rate schedule, which stabilizes optimization and achieves strong few-shot adaptation without complex data augmentations or extensive hyperparameter tuning. Extensive experiments on CD-FSOD, ODinW-13, and RF100-VL validate the effectiveness of our approach. Notably, on RF100-VL, which includes 100 datasets across diverse domains, our method achieves an average performance of 41.9 in the 10-shot setting, significantly outperforming the recent approach SAM3, which obtains 35.7. We further construct a mixed-domain test set from CD-FSOD to evaluate robustness to out-of-distribution (OOD) samples, showing that our proposed modules lead to clear improvement gains. These results highlight the effectiveness, generalization, and robustness of the proposed method. Code is available at: https://github.com/Intellindust-AI-Lab/FT-FSOD.
Abstract（参考訳）: トレーニングサンプルの不足に起因する不安定な最適化と限定的な一般化のため、FSOD(Few-shot Object Detection)は困難である。これらの問題に対処するために,微調整時の一般化を促進するハイブリッドアンサンブルデコーダを提案する。アンサンブル学習にインスパイアされたデコーダは、共有階層層と、複数の並列デコーダブランチで構成される。この設計は、追加パラメータを導入することなく事前訓練された重みを完全に活用し、その結果の多様な予測を効果的に組み込んで一般化を改善することができる。さらに、高度に認識された学習率スケジュールと統合されたプログレッシブ微調整フレームワークを活用し、最適化を安定させ、複雑なデータ拡張や広範なハイパーパラメータチューニングを伴わずに強力な数ショット適応を実現する。 CD-FSOD,ODinW-13,RF100-VLの広範囲な実験により,本手法の有効性が検証された。特にRF100-VLでは、多様な領域にまたがる100のデータセットを含む10ショット設定で平均41.9の性能を達成し、最近のSAM3よりも大幅に向上し、35.7となった。さらに,CD-FSODを用いた混合ドメインテストセットを構築し,分布外(OOD)サンプルに対するロバスト性を評価する。これらの結果は,提案手法の有効性,一般化,堅牢性を明らかにするものである。コードは、https://github.com/Intellindust-AI-Lab/FT-FSODで入手できる。

関連論文リスト

Benchmarking Few-shot Transferability of Pre-trained Models with Improved Evaluation Protocols [123.73663884421272]
より強力な事前訓練モデルと改良された適応アルゴリズムによって、わずかなショット転送が革新されている。 FEWTRANSは10種類のデータセットを含む総合的なベンチマークである。 FEWTRANS をリリースすることにより,数発の転写学習研究において再現性の向上を合理化するための厳密な "ルーラー" の提供を目指す。
論文参考訳（メタデータ） (2026-02-28T05:41:57Z)
Fractional-Order Federated Learning [4.1751058176413105]
フェデレートラーニング(FL)は、リモートクライアントがクライアントのプライバシを保護しながら、グローバルモデルを協調的にトレーニングすることを可能にする。プライバシー保護のメリットにもかかわらず、FLには、収束の遅い、通信コストの高い、非独立性および独立性のない(非IID)データなど、大きな欠点がある。
論文参考訳（メタデータ） (2026-02-17T06:25:23Z)
Empowering Contrastive Federated Sequential Recommendation with LLMs [13.016120865205258]
フェデレートシーケンシャルレコメンデーション(FedSeqRec)は、ユーザのデータを分散化しながら、次のイテム予測を実行することを目的としている。パラメータ分離型FedSeqRecアーキテクチャである textbfLUMOS を提案する。
論文参考訳（メタデータ） (2026-02-10T00:47:43Z)
SPREAD: Sampling-based Pareto front Refinement via Efficient Adaptive Diffusion [0.8594140167290097]
SPREADは拡散確率モデル(DDPM)に基づく生成フレームワークである決定空間からサンプリングされた点上の条件拡散過程を学習する。適応的多重勾配降下インスパイアされた更新を高速収束に利用するサンプリングスキームにより、候補を洗練する。
論文参考訳（メタデータ） (2025-09-25T12:09:37Z)
HyperTTA: Test-Time Adaptation for Hyperspectral Image Classification under Distribution Shifts [28.21559601586271]
HyperTTA (Test-Time Adaptable Transformer for Hyperspectral Degradation) は、様々な劣化条件下でモデルロバスト性を高める統一フレームワークである。テスト時の適応戦略である、信頼を意識したエントロピー最小化LayerNorm Adapter (CELA)は、LayerNorm層のアフィンパラメータのみを動的に更新する。 2つのベンチマークデータセットの実験では、HyperTTAがさまざまな劣化シナリオで最先端のベースラインを上回っていることが示されている。
論文参考訳（メタデータ） (2025-09-10T09:31:37Z)
A Multi-Step Comparative Framework for Anomaly Detection in IoT Data Streams [0.9208007322096533]
IoT(Internet of Things)デバイスは重要なセキュリティ問題を導入し、正確な異常検出の必要性を強調している。本稿では,前処理選択が3つの機械学習アルゴリズムに与える影響を評価する多段階評価フレームワークを提案する。 IoTID20データセットの実験は、GBoostingが前処理設定で常に優れた精度を提供することを示している。
論文参考訳（メタデータ） (2025-05-22T16:28:22Z)
On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文参考訳（メタデータ） (2025-04-02T17:40:47Z)
Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文参考訳（メタデータ） (2023-04-22T15:32:59Z)
CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文参考訳（メタデータ） (2022-03-03T05:58:49Z)
Semantic Perturbations with Normalizing Flows for Improved Generalization [62.998818375912506]
我々は、非教師付きデータ拡張を定義するために、潜在空間における摂動が利用できることを示す。トレーニングを通して分類器に適応する潜伏性対向性摂動が最も効果的であることが判明した。
論文参考訳（メタデータ） (2021-08-18T03:20:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。