論文の概要: Scalpel-SAM: A Semi-Supervised Paradigm for Adapting SAM to Infrared Small Object Detection
- arxiv url: http://arxiv.org/abs/2512.22483v1
- Date: Sat, 27 Dec 2025 05:59:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.078549
- Title: Scalpel-SAM: A Semi-Supervised Paradigm for Adapting SAM to Infrared Small Object Detection
- Title(参考訳): Scalpel-SAM: SAMを赤外線小物体検出に適用するための半監督パラダイム
- Authors: Zihan Liu, Xiangning Ren, Dezhang Kong, Yipeng Zhang, Meng Han,
- Abstract要約: 赤外線小物体検出は、アノテーションのコストが高いため、緊急に半教師付きパラダイムを必要とする。
SAMのような既存のメソッドは、ドメインギャップ、物理的プリエントをエンコードできないこと、そして固有のアーキテクチャの複雑さという重大な課題に直面している。
本研究では,(1)知識の蒸留と伝達のための2段階のパラダイムを提案する。(1)MoEアダプタと10%の完全教師付きデータを用いてSAMを専門教師(Scalpel-SAM)に蒸留し,(2)Scalpel-SAMを用いて疑似ラベルを生成し,軽量で効率的な下流モデルのトレーニングを行う。
- 参考スコア(独自算出の注目度): 18.83693797360931
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Infrared small object detection urgently requires semi-supervised paradigms due to the high cost of annotation. However, existing methods like SAM face significant challenges of domain gaps, inability of encoding physical priors, and inherent architectural complexity. To address this, we designed a Hierarchical MoE Adapter consisting of four white-box neural operators. Building upon this core component, we propose a two-stage paradigm for knowledge distillation and transfer: (1) Prior-Guided Knowledge Distillation, where we use our MoE adapter and 10% of available fully supervised data to distill SAM into an expert teacher (Scalpel-SAM); and (2) Deployment-Oriented Knowledge Transfer, where we use Scalpel-SAM to generate pseudo labels for training lightweight and efficient downstream models. Experiments demonstrate that with minimal annotations, our paradigm enables downstream models to achieve performance comparable to, or even surpassing, their fully supervised counterparts. To our knowledge, this is the first semi-supervised paradigm that systematically addresses the data scarcity issue in IR-SOT using SAM as the teacher model.
- Abstract(参考訳): 赤外線小物体検出は、アノテーションのコストが高いため、緊急に半教師付きパラダイムを必要とする。
しかし、SAMのような既存のメソッドは、ドメインギャップ、物理の事前をエンコーディングできないこと、そして固有のアーキテクチャの複雑さという重大な課題に直面している。
これを解決するために、4つのホワイトボックスニューラル演算子からなる階層型MoEアダプタを設計した。
このコアコンポーネントを基盤として,(1)知識の蒸留と伝達のための2段階のパラダイムを提案する。(1)MoEアダプタと10%の完全教師付きデータを用いてSAMを専門教師(Scalpel-SAM)に蒸留し,(2)Scalpel-SAMを用いて疑似ラベルを生成して,軽量かつ効率的な下流モデルのトレーニングを行う。
実験により、最小限のアノテーションで、我々のパラダイムは、下流モデルが完全に教師されたモデルに匹敵する、あるいは超えるパフォーマンスを達成することができることを示した。
我々の知る限り、SAMを教師モデルとして利用し、IR-SOTにおけるデータ不足問題に体系的に対処する最初の半教師付きパラダイムである。
関連論文リスト
- SAM2-UNeXT: An Improved High-Resolution Baseline for Adapting Foundation Models to Downstream Segmentation Tasks [50.97089872043121]
SAM2-UNeXTはSAM2-UNetの中核となる原理を基盤とした高度なフレームワークである。
我々は、補助的なDINOv2エンコーダの統合によりSAM2の表現能力を拡張する。
我々のアプローチは、単純なアーキテクチャでより正確なセグメンテーションを可能にし、複雑なデコーダ設計の必要性を緩和する。
論文 参考訳(メタデータ) (2025-08-05T15:36:13Z) - InfoSAM: Fine-Tuning the Segment Anything Model from An Information-Theoretic Perspective [9.466559751950639]
Segment Anything Model (SAM)は、一般的なタスクにおいて印象的なゼロショット機能を示すが、専門領域では苦労している。
本研究では,SAMの蒸留・保存による微調整を促進する情報理論であるInfoSAMを提案する。
多様なベンチマークによる実験では、InfoSAMが現実世界のタスクにおけるSAMファミリーのパフォーマンスを改善する効果を検証している。
論文 参考訳(メタデータ) (2025-05-28T03:09:22Z) - Adapting Segment Anything Model for Unseen Object Instance Segmentation [70.60171342436092]
Unseen Object Instance(UOIS)は、非構造環境で動作する自律ロボットにとって不可欠である。
UOISタスクのためのデータ効率のよいソリューションであるUOIS-SAMを提案する。
UOIS-SAMは、(i)HeatmapベースのPrompt Generator(HPG)と(ii)SAMのマスクデコーダに適応する階層識別ネットワーク(HDNet)の2つの重要なコンポーネントを統合する。
論文 参考訳(メタデータ) (2024-09-23T19:05:50Z) - GoodSAM++: Bridging Domain and Capacity Gaps via Segment Anything Model for Panoramic Semantic Segmentation [22.344399402787644]
GoodSAM++はSAMの強力なゼロショットインスタンスセグメンテーション機能を利用して、コンパクトなパノラマ意味セグメンテーションモデルを学ぶ新しいフレームワークである。
GoodSAM++は、1)パノラマ画像のセマンティックラベルと固有の歪み問題をSAMが提供できないこと、2)SAMと学生の間に大きな容量格差があること、の2つの重要な課題に対処する。
論文 参考訳(メタデータ) (2024-08-17T06:53:10Z) - GoodSAM: Bridging Domain and Capacity Gaps via Segment Anything Model for Distortion-aware Panoramic Semantic Segmentation [22.344399402787644]
本稿では,新しい課題に取り組み,新たなセグメンテーションモデル(SAM)から知識を伝達する方法について述べる。
そこで我々は,サンブルロジットを生成するためにSAMと統合された意味情報を提供する教師アシスタント(TA)を導入したGoodSAMというフレームワークを提案する。
2つのベンチマーク実験により、我々のGoodSAMは最先端(SOTA)ドメイン適応法よりも3.75%のmIoU改善を実現していることが示された。
論文 参考訳(メタデータ) (2024-03-25T02:30:32Z) - A SAM-guided Two-stream Lightweight Model for Anomaly Detection [44.73985145110819]
我々は、教師なし異常検出(STLM)のためのSAM誘導2ストリーム軽量モデルを提案する。
MVTec ADベンチマークを用いて行った実験により,約16Mのパラメータを持ち,20msの推論時間を実現したSTLMは,最先端の手法と効果的に競合することが示された。
論文 参考訳(メタデータ) (2024-02-29T13:29:10Z) - Boosting Segment Anything Model Towards Open-Vocabulary Learning [69.24734826209367]
Segment Anything Model (SAM)は、新しいパラダイムビジョン基盤モデルとして登場した。
SAMは様々な領域で応用や適応を発見できるが、その主な制限はオブジェクトの意味を把握できないことである。
我々は,SAMとオープン語彙オブジェクト検出器をエンドツーエンドフレームワークでシームレスに統合するSamborを提案する。
論文 参考訳(メタデータ) (2023-12-06T17:19:00Z) - SurgicalSAM: Efficient Class Promptable Surgical Instrument Segmentation [65.52097667738884]
そこで本研究では,SAMの知識と外科的特異的情報を統合し,汎用性を向上させるための,新しいエンドツーエンドの効率的なチューニング手法であるScientialSAMを紹介した。
具体的には,タイピングのための軽量なプロトタイプベースクラスプロンプトエンコーダを提案し,クラスプロトタイプから直接プロンプト埋め込みを生成する。
また,手術器具カテゴリー間のクラス間差異の低さに対応するために,コントラッシブなプロトタイプ学習を提案する。
論文 参考訳(メタデータ) (2023-08-17T02:51:01Z) - AdaSAM: Boosting Sharpness-Aware Minimization with Adaptive Learning
Rate and Momentum for Training Deep Neural Networks [76.90477930208982]
シャープネス認識(SAM)は、ディープニューラルネットワークのトレーニングにおいて、より一般的なものにするため、広範囲に研究されている。
AdaSAMと呼ばれる適応的な学習摂動と運動量加速度をSAMに統合することはすでに検討されている。
いくつかのNLPタスクにおいて,SGD,AMS,SAMsGradと比較して,AdaSAMが優れた性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2023-03-01T15:12:42Z) - Guided Hybrid Quantization for Object detection in Multimodal Remote
Sensing Imagery via One-to-one Self-teaching [35.316067181895264]
本稿では,1対1の自己学習(GHOST)フレームワークを用いたハイブリッド量子化手法を提案する。
まず, 導電性量子化自己蒸留(GQSD)と呼ばれる構造を設計する。
第3に、情報変換を改善するために、学生ネットワークに自己判断能力を与える1対1の自己学習モジュールを提案する。
論文 参考訳(メタデータ) (2022-12-31T06:14:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。