論文の概要: Adaptive Attention Distillation for Robust Few-Shot Segmentation under Environmental Perturbations
- arxiv url: http://arxiv.org/abs/2601.03596v1
- Date: Wed, 07 Jan 2026 05:27:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.276047
- Title: Adaptive Attention Distillation for Robust Few-Shot Segmentation under Environmental Perturbations
- Title(参考訳): 環境負荷下でのロバストショットセグメンテーションに対する適応的注意蒸留法
- Authors: Qianyu Guo, Jingrong Wu, Jieji Ren, Weifeng Ge, Wenqiang Zhang,
- Abstract要約: Few-shot segmentation (FSS) は、限られた例から新しいクラス概念を迅速に学習し、特定のターゲットを目に見えない画像に分割することを目的としている。
既存の研究は、現実世界のシナリオで遭遇する複雑な環境要因を概ね見落としている。
本稿では,複雑な環境から生じる挑戦的なテストケースを明示的に組み込んだ,環境負荷の高いFSS設定を提案する。
- 参考スコア(独自算出の注目度): 43.30169413561605
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few-shot segmentation (FSS) aims to rapidly learn novel class concepts from limited examples to segment specific targets in unseen images, and has been widely applied in areas such as medical diagnosis and industrial inspection. However, existing studies largely overlook the complex environmental factors encountered in real world scenarios-such as illumination, background, and camera viewpoint-which can substantially increase the difficulty of test images. As a result, models trained under laboratory conditions often fall short of practical deployment requirements. To bridge this gap, in this paper, an environment-robust FSS setting is introduced that explicitly incorporates challenging test cases arising from complex environments-such as motion blur, small objects, and camouflaged targets-to enhance model's robustness under realistic, dynamic conditions. An environment robust FSS benchmark (ER-FSS) is established, covering eight datasets across multiple real world scenarios. In addition, an Adaptive Attention Distillation (AAD) method is proposed, which repeatedly contrasts and distills key shared semantics between known (support) and unknown (query) images to derive class-specific attention for novel categories. This strengthens the model's ability to focus on the correct targets in complex environments, thereby improving environmental robustness. Comparative experiments show that AAD improves mIoU by 3.3% - 8.5% across all datasets and settings, demonstrating superior performance and strong generalization. The source code and dataset are available at: https://github.com/guoqianyu-alberta/Adaptive-Attention-Distillation-for-FSS.
- Abstract(参考訳): Few-shot segmentation (FSS) は、限られた例から新しいクラス概念を迅速に学習し、未確認画像の特定のターゲットをセグメント化することを目的としており、医療診断や産業検査などの分野で広く応用されている。
しかし、既存の研究では、照明、背景、カメラ視点といった現実世界のシナリオで発生する複雑な環境要因を概ね見落としており、テスト画像の難易度を大幅に高める可能性がある。
その結果、実験室で訓練されたモデルは、実際的な配備要件に満たないことが多い。
このギャップを埋めるために,本論文では,現実的かつダイナミックな条件下でのモデル頑健性を高めるために,動きのぼやけ,小さな物体,キャモフラージュされたターゲットなどの複雑な環境から生じる挑戦的なテストケースを明示的に組み込んだ,環境負荷のFSS設定を導入する。
環境ロバストなFSSベンチマーク(ER-FSS)が確立され、複数の実世界のシナリオにまたがる8つのデータセットをカバーする。
さらに,AAD (Adaptive Attention Distillation, 適応注意蒸留法) 法を提案する。
これにより、複雑な環境で適切なターゲットにフォーカスするモデルの能力が強化され、環境の堅牢性が改善される。
比較実験によると、AADはすべてのデータセットと設定でmIoUを3.3%から8.5%改善し、優れたパフォーマンスと強力な一般化を示している。
ソースコードとデータセットは、https://github.com/guoqianyu-alberta/Adaptive-Attention-Distillation-for-FSS.comで公開されている。
関連論文リスト
- DI3CL: Contrastive Learning With Dynamic Instances and Contour Consistency for SAR Land-Cover Classification Foundation Model [47.09803039926004]
本稿では,SAR土地被覆分類のための汎用基盤モデルを開発する。
Dynamic InstanceとContour Consistency Contrastive Learning (DI3CL)事前トレーニングフレームワークが組み込まれている。
その結果,提案したDI3CLは既存手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2025-11-11T03:58:22Z) - Grounded Test-Time Adaptation for LLM Agents [75.62784644919803]
大規模言語モデル(LLM)ベースのエージェントは、新規で複雑な環境への一般化に苦慮している。
環境特化情報を活用することで, LLMエージェントを適応するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2025-11-06T22:24:35Z) - Data Augmentation and Resolution Enhancement using GANs and Diffusion Models for Tree Segmentation [49.13393683126712]
都市森林は、環境の質を高め、都市における生物多様性を支援する上で重要な役割を担っている。
複雑な地形と異なる衛星センサーやUAV飛行高度による画像解像度の変化により、正確に木を検知することは困難である。
低解像度空中画像の品質を高めるため,GANと拡散モデルとドメイン適応を統合した新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2025-05-21T03:57:10Z) - Open-set Anomaly Segmentation in Complex Scenarios [88.11076112792992]
本稿では,複雑なシナリオにおけるオープンセット異常セグメンテーションのベンチマークであるComsAmyを紹介する。
ComsAmyは、幅広い悪天候、動的な運転環境、様々な異常タイプを含む。
本稿では,エネルギーとエントロピーの相補的情報を統合する新しいエネルギ-エントロピー学習(EEL)戦略を提案する。
論文 参考訳(メタデータ) (2025-04-28T12:00:10Z) - Enhancing Environmental Robustness in Few-shot Learning via Conditional Representation Learning [27.549889991320203]
ドメイン固有の視覚認識において、トレーニングデータの不足を克服するために、ショットラーニングが広く活用されている。
現実のシナリオでは、複雑な背景、様々な照明条件、長距離射撃、移動目標などの環境要因は、テスト画像に多くの不完全なターゲットやノイズ破壊を生じさせる。
本稿では,それぞれの表現過程における条件情報として,トレーニングとテスト画像間の相互作用を統合する新しい条件表現学習ネットワーク(CRLNet)を提案する。
論文 参考訳(メタデータ) (2025-02-03T09:18:03Z) - Enhancing Object Detection with Hybrid dataset in Manufacturing Environments: Comparing Federated Learning to Conventional Techniques [0.0]
フェデレートラーニング(FL)は、堅牢なモデル開発とプライバシ保護機能のために製造に大きな注目を集めている。
本稿では,物体検出におけるFLモデルのロバスト性に着目した研究に貢献する。
論文 参考訳(メタデータ) (2024-08-16T18:50:06Z) - MuLA-GAN: Multi-Level Attention GAN for Enhanced Underwater Visibility [1.9272863690919875]
本稿では,総合的な水中画像強調のためのGAN(Geneversarative Adrial Networks)とマルチレベルアテンション機構の相乗効果を利用した新しいアプローチであるMuLA-GANを紹介する。
本モデルは,水中画像の複雑な細部を捉え保存することに優れており,様々な用途に欠かせない。
この研究は、水中画像の強調における重要な研究ギャップに対処するだけでなく、GANの強化におけるマルチレベル注意の重要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-12-25T07:33:47Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。