論文の概要: Test Automation with Grad-CAM Heatmaps -- A Future Pipe Segment in MLOps
for Vision AI?
- arxiv url: http://arxiv.org/abs/2103.01837v1
- Date: Tue, 2 Mar 2021 16:23:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-03 16:02:11.993588
- Title: Test Automation with Grad-CAM Heatmaps -- A Future Pipe Segment in MLOps
for Vision AI?
- Title(参考訳): grad-cam heatmapsによるテスト自動化 -- vision aiのためのmlopsの今後のパイプセグメント?
- Authors: Markus Borg, Ronald Jabangwe, Simon {\AA}berg, Arvid Ekblom, Ludwig
Hedlund, August Lidfeldt
- Abstract要約: Grad-CAMのヒートマップを使用して、歩行者のアンダーパス用に訓練された画像認識モデルの説明性を高める方法を示す。
我々は、このヒートマップがEUの7つの重要な要件であるTrustworthy AIへのコンプライアンスをどのようにサポートしているかを議論する。
- 参考スコア(独自算出の注目度): 6.385815474157358
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine Learning (ML) is a fundamental part of modern perception systems. In
the last decade, the performance of computer vision using trained deep neural
networks has outperformed previous approaches based on careful feature
engineering. However, the opaqueness of large ML models is a substantial
impediment for critical applications such as in the automotive context. As a
remedy, Gradient-weighted Class Activation Mapping (Grad-CAM) has been proposed
to provide visual explanations of model internals. In this paper, we
demonstrate how Grad-CAM heatmaps can be used to increase the explainability of
an image recognition model trained for a pedestrian underpass. We argue how the
heatmaps support compliance to the EU's seven key requirements for Trustworthy
AI. Finally, we propose adding automated heatmap analysis as a pipe segment in
an MLOps pipeline. We believe that such a building block can be used to
automatically detect if a trained ML-model is activated based on invalid pixels
in test images, suggesting biased models.
- Abstract(参考訳): 機械学習(ML)は現代の知覚システムの基本部分である。
過去10年間、訓練されたディープニューラルネットワークを用いたコンピュータビジョンのパフォーマンスは、注意深い機能工学に基づく以前のアプローチを上回っている。
しかし、大規模なMLモデルの不透明さは、自動車の文脈のような重要な応用にとって重大な障害となる。
モデル内部を視覚的に説明するために,グラデーション重み付けクラスアクティベーションマッピング(grad-cam)が提案されている。
本稿では,Grad-CAMのヒートマップを用いて,歩行者の地下道で訓練された画像認識モデルの説明性を高める方法について述べる。
我々は、このヒートマップがEUの7つの重要な要件であるTrustworthy AIへのコンプライアンスをどのようにサポートしているかを議論する。
最後に、MLOpsパイプラインにパイプセグメントとして自動ヒートマップ解析を追加することを提案する。
このようなビルディングブロックは、テストイメージの無効なピクセルに基づいて訓練されたMLモデルがアクティブになっているかどうかを自動的に検出し、バイアスモデルを提案する。
関連論文リスト
- TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.84644266024571]
我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。
我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文 参考訳(メタデータ) (2024-11-22T06:13:42Z) - Guiding Attention in End-to-End Driving Models [49.762868784033785]
模倣学習によって訓練された視覚ベースのエンドツーエンドの運転モデルは、自動運転のための安価なソリューションにつながる可能性がある。
トレーニング中に損失項を追加することにより、これらのモデルの注意を誘導し、運転品質を向上させる方法について検討する。
従来の研究とは対照的に,本手法では,テスト期間中にこれらの有意義なセマンティックマップを利用できない。
論文 参考訳(メタデータ) (2024-04-30T23:18:51Z) - On the Road to Clarity: Exploring Explainable AI for World Models in a Driver Assistance System [3.13366804259509]
我々は畳み込み変分オートエンコーダ(VAE)のための透明なバックボーンモデルを構築した。
本稿では,予測ネットワークの内部力学と特徴関連性に関する説明と評価手法を提案する。
本稿では,都市交通状況における歩行者の認識を予測したVAE-LSTM世界モデルの解析により,提案手法を実証する。
論文 参考訳(メタデータ) (2024-04-26T11:57:17Z) - Context-Aware Meta-Learning [52.09326317432577]
本研究では,大規模言語モデルのエミュレートを行うメタ学習アルゴリズムを提案する。
我々のアプローチは、11のメタラーニングベンチマークのうち8つで最先端のアルゴリズムであるP>M>Fを上回り、一致します。
論文 参考訳(メタデータ) (2023-10-17T03:35:27Z) - BroadCAM: Outcome-agnostic Class Activation Mapping for Small-scale
Weakly Supervised Applications [69.22739434619531]
そこで我々はBroadCAMと呼ばれる結果に依存しないCAMアプローチを提案する。
VOC2012でBroadCAM、WSSSでBCSS-WSSS、WSOLでOpenImages30kを評価することで、BroadCAMは優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-09-07T06:45:43Z) - Read Pointer Meters in complex environments based on a Human-like
Alignment and Recognition Algorithm [16.823681016882315]
これらの問題を克服するための人間ライクなアライメントと認識アルゴリズムを提案する。
STM(Spatial Transformed Module)は,画像のフロントビューを自己自律的に取得するために提案される。
VAM(Value Acquisition Module)は、エンドツーエンドのトレーニングフレームワークによって正確なメーター値を推測するために提案される。
論文 参考訳(メタデータ) (2023-02-28T05:37:04Z) - Policy Pre-training for End-to-end Autonomous Driving via
Self-supervised Geometric Modeling [96.31941517446859]
PPGeo (Policy Pre-training via Geometric Modeling) は,視覚運動運転における政策事前学習のための,直感的かつ直接的な完全自己教師型フレームワークである。
本研究では,大規模な未ラベル・未校正動画の3次元幾何学シーンをモデル化することにより,ポリシー表現を強力な抽象化として学習することを目的とする。
第1段階では、幾何モデリングフレームワークは、2つの連続したフレームを入力として、ポーズと深さの予測を同時に生成する。
第2段階では、視覚エンコーダは、将来のエゴモーションを予測し、現在の視覚観察のみに基づいて測光誤差を最適化することにより、運転方針表現を学習する。
論文 参考訳(メタデータ) (2023-01-03T08:52:49Z) - Could Giant Pretrained Image Models Extract Universal Representations? [94.97056702288317]
本稿では,多種多様なコンピュータビジョンタスクに適用した凍結事前学習モデルについて述べる。
私たちの研究は、この凍結した設定にどのような事前学習タスクが最適か、凍結した設定を様々な下流タスクに柔軟にする方法、より大きなモデルサイズの影響について、質問に答えています。
論文 参考訳(メタデータ) (2022-11-03T17:57:10Z) - Generalizing Adversarial Explanations with Grad-CAM [7.165984630575092]
本稿では,Grad-CAMを例ベースの説明からグローバルモデル動作を説明する方法まで拡張する手法を提案する。
実験では,VGG16,ResNet50,ResNet101などの深層モデルと,InceptionNetv3やXceptionNetのような広層モデルに対する敵攻撃について検討した。
提案手法は、画像解析のためのブラックボックスCNNモデルの振る舞いを解析し、敵攻撃を理解するために利用できる。
論文 参考訳(メタデータ) (2022-04-11T22:09:21Z) - Eigen-CAM: Class Activation Map using Principal Components [1.2691047660244335]
この論文は、解釈可能で堅牢で透明なモデルに対する需要の増加に対応するために、従来の考え方に基づいている。
提案したEigen-CAMは、畳み込み層から学習した特徴/表現の基本的なコンポーネントを計算し、視覚化する。
論文 参考訳(メタデータ) (2020-08-01T17:14:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。