論文の概要: Batch-CAM: Introduction to better reasoning in convolutional deep learning models
- arxiv url: http://arxiv.org/abs/2510.00664v1
- Date: Wed, 01 Oct 2025 08:47:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.473696
- Title: Batch-CAM: Introduction to better reasoning in convolutional deep learning models
- Title(参考訳): Batch-CAM:畳み込み型ディープラーニングモデルにおけるより良い推論入門
- Authors: Giacomo Ignesti, Davide Moroni, Massimo Martinelli,
- Abstract要約: Batch-CAMはGrad-CAMアルゴリズムのバッチ実装を融合した新しいトレーニングパラダイムである。
以上の結果から,Batch-CAMはトレーニング時間と推論時間を短縮しつつ,精度と画像再構成品質の同時向上を実現していることがわかった。
- 参考スコア(独自算出の注目度): 2.0391237204597363
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Understanding the inner workings of deep learning models is crucial for advancing artificial intelligence, particularly in high-stakes fields such as healthcare, where accurate explanations are as vital as precision. This paper introduces Batch-CAM, a novel training paradigm that fuses a batch implementation of the Grad-CAM algorithm with a prototypical reconstruction loss. This combination guides the model to focus on salient image features, thereby enhancing its performance across classification tasks. Our results demonstrate that Batch-CAM achieves a simultaneous improvement in accuracy and image reconstruction quality while reducing training and inference times. By ensuring models learn from evidence-relevant information,this approach makes a relevant contribution to building more transparent, explainable, and trustworthy AI systems.
- Abstract(参考訳): ディープラーニングモデルの内部動作を理解することは、人工知能、特に正確さと同じくらい正確な説明が不可欠である医療などの高度な分野の進歩に不可欠である。
本稿では,Grad-CAMアルゴリズムのバッチ実装とプロトタイプ再構成損失を融合した新しいトレーニングパラダイムであるBatch-CAMを紹介する。
この組み合わせにより、モデルが健全な画像特徴に焦点を合わせ、分類タスク全体のパフォーマンスを向上させることができる。
以上の結果から,Batch-CAMはトレーニング時間と推論時間を短縮しつつ,精度と画像再構成品質の同時向上を実現していることがわかった。
モデルがエビデンスに関連する情報から学ぶことを保証することによって、このアプローチはより透明で説明可能な、信頼できるAIシステムの構築に、関連する貢献をする。
関連論文リスト
- Foundations and Models in Modern Computer Vision: Key Building Blocks in Landmark Architectures [34.542592986038265]
本報告では,コンピュータビジョンにおけるキーデザインパターンの進化を,影響力のある6つの論文から分析する。
本稿では,残差接続を導入したResNetについて概説する。
画像パッチのシーケンスにトランスフォーマーアーキテクチャを適用し,新たなパラダイムを確立したビジョントランスフォーマー(ViT)について検討する。
論文 参考訳(メタデータ) (2025-07-31T09:08:11Z) - Retrospective Memory for Camouflaged Object Detection [18.604039107883317]
本稿では,カモフラージュパターンの認識と推論を動的に調節するリコール拡張CODアーキテクチャであるRetroMemを提案する。
本稿では,リコール段階で動的メモリ機構と推論パターン再構成を提案する。
私たちのRetroMemは、既存の最先端メソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-06-18T08:22:19Z) - Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。
十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。
近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。
本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:45:32Z) - Generative Model-based Feature Knowledge Distillation for Action
Recognition [11.31068233536815]
本稿では,軽量学生モデルの学習のための生成モデルを用いた,革新的な知識蒸留フレームワークについて紹介する。
提案手法の有効性は,多種多様な人気データセットに対する総合的な実験によって実証される。
論文 参考訳(メタデータ) (2023-12-14T03:55:29Z) - Dual-Activated Lightweight Attention ResNet50 for Automatic Histopathology Breast Cancer Image Classification [0.0]
本研究では,乳がんの新たな分類法であるDual-Activated Lightweight Attention ResNet50モデルを提案する。
トレーニング済みのResNet50モデルと軽量なアテンション機構を統合し、ResNet50の第4層にアテンションモジュールを埋め込む。
DALAResNet50法は,40X,100X,200X,400Xの乳がん組織像を用いて,それぞれ98.5%,98.7%,97.9%,94.3%の検診を行った。
論文 参考訳(メタデータ) (2023-08-25T03:08:41Z) - Retrieval-Enhanced Contrastive Vision-Text Models [61.783728119255365]
そこで本研究では,メモリから取得したクロスモーダルな情報を推論時に表現することで,その埋め込みを洗練できる視覚テキストモデルを提案する。
注目すべきことに、これは凍ったCLIPの上に軽量の単層核融合トランスを用いて行うことができる。
検索強化コントラスト訓練(RECO)がCLIPの性能を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-06-12T15:52:02Z) - GPT4Image: Large Pre-trained Models Help Vision Models Learn Better on Perception Task [47.1857510710807]
我々はGPT4Imageと呼ばれる新しい学習フレームワークを提案し、CNNやViTがより良い表現を学ぶのに役立つ大規模な事前学習モデルの知識を抽出する。
本研究では,様々な視覚認知タスクにおける提案アルゴリズムの有効性を検証するために,広範囲な実験を行った。
論文 参考訳(メタデータ) (2023-06-01T14:02:45Z) - Learning Rich Nearest Neighbor Representations from Self-supervised
Ensembles [60.97922557957857]
推論時間における勾配降下から直接表現を学習する新しい手法により、自己教師付きモデルアンサンブルを行うためのフレームワークを提供する。
この技術は、ドメイン内のデータセットと転送設定の両方において、k-nearestの隣人によって測定されるように、表現品質を改善する。
論文 参考訳(メタデータ) (2021-10-19T22:24:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。