論文の概要: Cascade Learning Localises Discriminant Features in Visual Scene
Classification
- arxiv url: http://arxiv.org/abs/2311.12704v1
- Date: Tue, 21 Nov 2023 16:19:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 23:50:07.414360
- Title: Cascade Learning Localises Discriminant Features in Visual Scene
Classification
- Title(参考訳): 視覚場面分類における識別特徴のカスケード学習
- Authors: Junwen Wang and Katayoun Farrahi
- Abstract要約: 階層的な学習戦略,すなわちカスケード学習(CL)がより局所的な特徴をもたらすことを示す。
ローカライゼーションの精度を考慮すると、CLがE2Eより優れているだけでなく、領域を予測するための有望な方法であることを示す。
- 参考スコア(独自算出の注目度): 2.8852708354106507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Lack of interpretability of deep convolutional neural networks (DCNN) is a
well-known problem particularly in the medical domain as clinicians want
trustworthy automated decisions. One way to improve trust is to demonstrate the
localisation of feature representations with respect to expert labeled regions
of interest. In this work, we investigate the localisation of features learned
via two varied learning paradigms and demonstrate the superiority of one
learning approach with respect to localisation. Our analysis on medical and
natural datasets show that the traditional end-to-end (E2E) learning strategy
has a limited ability to localise discriminative features across multiple
network layers. We show that a layer-wise learning strategy, namely cascade
learning (CL), results in more localised features. Considering localisation
accuracy, we not only show that CL outperforms E2E but that it is a promising
method of predicting regions. On the YOLO object detection framework, our best
result shows that CL outperforms the E2E scheme by $2\%$ in mAP.
- Abstract(参考訳): 深層畳み込みニューラルネットワーク(DCNN)の解釈可能性の欠如は、特に臨床医が信頼できる自動決定を望んでいる医療分野においてよく知られた問題である。
信頼を改善する一つの方法は、専門的なラベル付き関心領域に対する特徴表現のローカライズを示すことである。
本研究では,2つの異なる学習パラダイムを通じて学習した特徴の局所化について検討し,その局所化に対する1つの学習アプローチの優位性を実証する。
従来のe2e(end-to-end)学習戦略では,複数のネットワーク層にまたがる識別的特徴のローカライズが制限されている。
階層的な学習戦略,すなわちカスケード学習(CL)がより局所的な特徴をもたらすことを示す。
ローカライゼーションの精度を考慮すると、CLがE2Eより優れているだけでなく、領域を予測するための有望な方法であることを示す。
YOLO オブジェクト検出フレームワークでは,CL が mAP において E2E スキームを 2 % 上回る性能を示した。
関連論文リスト
- Exploiting CLIP for Zero-shot HOI Detection Requires Knowledge
Distillation at Multiple Levels [52.50670006414656]
大規模事前学習型視覚言語モデルであるCLIPを,多段階の知識蒸留に利用した。
私たちのモデルをトレーニングするために、CLIPを使用して、グローバルイメージとローカルユニオン領域の両方のHOIスコアを生成する。
このモデルは、完全な教師付きおよび弱い教師付き手法に匹敵する強力な性能を達成する。
論文 参考訳(メタデータ) (2023-09-10T16:27:54Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - Learning Consistency from High-quality Pseudo-labels for Weakly
Supervised Object Localization [7.602783618330373]
より一貫したローカライゼーションを学習するための2段階のアプローチを提案する。
まず,マスクを用いた擬似ラベル生成アルゴリズムを提案し,擬似教師付き学習手法を用いてオブジェクトの局所化ネットワークを初期化する。
第2段階では,分類識別に基づく疑似ラベルの信頼度を簡易かつ効果的に評価する手法を提案する。
論文 参考訳(メタデータ) (2022-03-18T09:05:51Z) - Region-Based Semantic Factorization in GANs [67.90498535507106]
本稿では,任意の画像領域についてGAN(Generative Adversarial Networks)が学習した潜在意味を分解するアルゴリズムを提案する。
適切に定義された一般化されたレイリー商を通して、アノテーションや訓練なしにそのような問題を解く。
様々な最先端のGANモデルに対する実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-19T17:46:02Z) - GCA-Net : Utilizing Gated Context Attention for Improving Image Forgery
Localization and Detection [0.9883261192383611]
本稿では,グローバルな文脈学習に非局所的注意ブロックを利用するGated Context Attention Network (GCA-Net)を提案する。
提案手法は,複数のベンチマークデータセットにおいて,平均4.2%-5.4%のAUCで最先端のネットワークより優れていることを示す。
論文 参考訳(メタデータ) (2021-12-08T14:13:14Z) - Enhancing Prototypical Few-Shot Learning by Leveraging the Local-Level
Strategy [75.63022284445945]
既存の作業では、ローカルレベルの機能をすべて混ぜることで、イメージレベルの機能に基づいた、いくつかのショットモデルを構築することがよくあります。
a) 基地と新規カテゴリーの識別的位置バイアスを回避するための地域非依存のトレーニング戦略,(b) 地域レベルの特徴の正確な比較を捉えるための新しい地域レベルの類似度尺度を提案する。
論文 参考訳(メタデータ) (2021-11-08T08:45:15Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z) - Contrastive learning of global and local features for medical image
segmentation with limited annotations [10.238403787504756]
教師付きディープラーニングの成功のための重要な要件は、大きなラベル付きデータセットである。
半教師付き環境での医用画像のセグメンテーションのためのコントラスト学習フレームワークの拡張戦略を提案する。
限定的なアノテーション設定では、提案手法は、他の自己超越的および半教師付き学習技術と比較して大幅に改善される。
論文 参考訳(メタデータ) (2020-06-18T13:31:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。