論文の概要: HiProto: Hierarchical Prototype Learning for Interpretable Object Detection Under Low-quality Conditions
- arxiv url: http://arxiv.org/abs/2604.13981v1
- Date: Wed, 15 Apr 2026 15:26:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.607118
- Title: HiProto: Hierarchical Prototype Learning for Interpretable Object Detection Under Low-quality Conditions
- Title(参考訳): HiProto:低品質条件下での解釈対象検出のための階層型プロトタイプ学習
- Authors: Jianlin Xiang, Linhui Dai, Xue Yang, Chaolei Yang, Yanshan Li,
- Abstract要約: 重要なアプリケーションにオブジェクト検出システムをデプロイするには、解釈可能性が不可欠である。
既存の手法は、画像の品質を高めるか、複雑なアーキテクチャを設計するが、しばしば解釈可能性に欠け、意味的差別の改善に失敗する。
階層型プロトタイプ学習に基づくオブジェクト検出のための新しいパラダイムであるHiProtoを提案する。
- 参考スコア(独自算出の注目度): 12.176786575462152
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interpretability is essential for deploying object detection systems in critical applications, especially under low-quality imaging conditions that degrade visual information and increase prediction uncertainty. Existing methods either enhance image quality or design complex architectures, but often lack interpretability and fail to improve semantic discrimination. In contrast, prototype learning enables interpretable modeling by associating features with class-centered semantics, which can provide more stable and interpretable representations under degradation. Motivated by this, we propose HiProto, a new paradigm for interpretable object detection based on hierarchical prototype learning. By constructing structured prototype representations across multiple feature levels, HiProto effectively models class-specific semantics, thereby enhancing both semantic discrimination and interpretability. Building upon prototype modeling, we first propose a Region-to-Prototype Contrastive Loss (RPC-Loss) to enhance the semantic focus of prototypes on target regions. Then, we propose a Prototype Regularization Loss (PR-Loss) to improve the distinctiveness among class prototypes. Finally, we propose a Scale-aware Pseudo Label Generation Strategy (SPLGS) to suppress mismatched supervision for RPC-Loss, thereby preserving the robustness of low-level prototype representations. Experiments on ExDark, RTTS, and VOC2012-FOG demonstrate that HiProto achieves competitive results while offering clear interpretability through prototype responses, without relying on image enhancement or complex architectures. Our code will be available at https://github.com/xjlDestiny/HiProto.git.
- Abstract(参考訳): オブジェクト検出システムを重要な応用、特に視覚情報を劣化させ、予測の不確実性を増大させる低品質な撮像条件下での展開には、解釈可能性が不可欠である。
既存の手法は、画像の品質を高めるか、複雑なアーキテクチャを設計するが、しばしば解釈可能性に欠け、意味的差別の改善に失敗する。
対照的に、プロトタイプ学習は、機能とクラス中心のセマンティクスを関連付けることで解釈可能なモデリングを可能にし、分解下でより安定で解釈可能な表現を提供する。
そこで本研究では,階層型プロトタイプ学習に基づくオブジェクト検出のための新しいパラダイムであるHiProtoを提案する。
複数の機能レベルで構造化されたプロトタイプ表現を構築することで、HiProtoはクラス固有のセマンティクスを効果的にモデル化し、セマンティクスの識別と解釈性の両方を強化する。
プロトタイプモデルに基づいて,まず,プロトタイプのターゲット領域へのセマンティックフォーカスを高めるために,地域間コントラスト損失(RPC-Loss)を提案する。
そこで我々は,クラスプロトタイプの識別性を改善するために,プロトタイプ正規化損失(PR-Loss)を提案する。
最後に、RPC-Lossのミスマッチした管理を抑え、低レベルのプロトタイプ表現の堅牢性を維持するために、スケール対応Pseudo Label Generation Strategy (SPLGS)を提案する。
ExDark、RTTS、VOC2012-FOGの実験では、HiProtoは、画像の強化や複雑なアーキテクチャに頼ることなく、プロトタイプレスポンスを通じて明確な解釈性を提供しながら、競争結果を達成することを示した。
私たちのコードはhttps://github.com/xjlDestiny/HiProto.git.comで公開されます。
関連論文リスト
- Divide, Conquer and Unite: Hierarchical Style-Recalibrated Prototype Alignment for Federated Medical Image Segmentation [66.82598255715696]
フェデレートラーニング(Federated Learning)は、複数の医療機関がデータを共有することなく、グローバルなモデルをトレーニングすることを可能にする。
現在のアプローチは主に、重要なマルチレベルキューを見下ろす最終層機能に重点を置いている。
我々は,ドメイン不変のコンテキスト型プロトタイプアライメントを介して特徴表現ギャップをブリッジするFedBCSを提案する。
論文 参考訳(メタデータ) (2025-11-14T04:15:34Z) - Probabilistic Prototype Calibration of Vision-Language Models for Generalized Few-shot Semantic Segmentation [75.18058114915327]
一般化されたFew-Shot Semanticnative(GFSS)は、いくつかの注釈付き例だけでセグメンテーションモデルを新しいクラスに拡張することを目的としている。
プリトレーニング済みCLIPのマルチモーダルプロトタイプ上での確率的プロトタイプ校正フレームワークであるFewCLIPを提案する。
FewCLIPはGFSSとクラスインクリメンタルセッティングの両方で最先端のアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2025-06-28T18:36:22Z) - ProtoSolo: Interpretable Image Classification via Single-Prototype Activation [3.720945628294273]
本稿では,ProtoSoloと呼ばれる画像分類のための新しい解釈可能な深層アーキテクチャを提案する。
ProtoSoloは、分類を完了するには1つのプロトタイプのみをアクティベートする必要がある。
CUB-200-2011およびStanford Carsデータセットの実験では、ProtoSoloは分類精度において最先端の解釈可能な手法と一致することを示した。
論文 参考訳(メタデータ) (2025-06-24T17:18:35Z) - Multi-Scale Grouped Prototypes for Interpretable Semantic Segmentation [7.372346036256517]
意味的セグメンテーションを解釈可能なものにするための、有望なアプローチとして、プロトタイプ的な部分学習が登場している。
本稿では,多スケール画像表現を利用した意味的セグメンテーションの解釈手法を提案する。
Pascal VOC,Cityscapes,ADE20Kで行った実験により,提案手法はモデルの疎結合性を高め,既存のプロトタイプ手法よりも解釈可能性を高め,非解釈可能なモデルとの性能ギャップを狭めることを示した。
論文 参考訳(メタデータ) (2024-09-14T17:52:59Z) - Hunting Attributes: Context Prototype-Aware Learning for Weakly
Supervised Semantic Segmentation [22.591512454923883]
我々は、インスタンスとコンテキスト間の知識バイアスが、インスタンスのセマンティクスを十分に理解するプロトタイプの能力に影響を与えると主張している。
プロトタイプ学習理論に触発された本研究では,インスタンスの多種多様かつきめ細かな特徴を捉えるために,プロトタイプ認識を活用することを提案する。
本稿では,コンテキスト型認識学習(CPAL:Context Prototype-Aware Learning)戦略を提案する。
論文 参考訳(メタデータ) (2024-03-12T13:11:58Z) - Dual Prototypical Contrastive Learning for Few-shot Semantic
Segmentation [55.339405417090084]
本稿では,FSSタスクに適合する2つの特徴的コントラスト学習手法を提案する。
第一の考え方は、プロトタイプの特徴空間におけるクラス内距離を減少させながら、クラス間距離を増やすことで、プロトタイプをより差別的にすることである。
提案手法は,PASCAL-5iおよびCOCO-20iデータセット上で,最先端のFSS手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-09T08:14:50Z) - Attentional Prototype Inference for Few-Shot Segmentation [128.45753577331422]
数発のセグメンテーションのための確率的潜在変数フレームワークである注意型プロトタイプ推論(API)を提案する。
我々は各オブジェクトカテゴリのプロトタイプを表現するためにグローバル潜在変数を定義し、確率分布としてモデル化する。
我々は4つのベンチマークで広範な実験を行い、提案手法は最先端のプロトタイプベースの手法よりも、少なくとも競争力があり、しばしば優れた性能が得られる。
論文 参考訳(メタデータ) (2021-05-14T06:58:44Z) - Prototypical Contrastive Learning of Unsupervised Representations [171.3046900127166]
原型コントラスト学習(Prototypeal Contrastive Learning, PCL)は、教師なし表現学習法である。
PCLは暗黙的にデータのセマンティック構造を学習された埋め込み空間にエンコードする。
PCLは、複数のベンチマークで最先端のインスタンスワイド・コントラスト学習法より優れている。
論文 参考訳(メタデータ) (2020-05-11T09:53:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。