論文の概要: When Can We Trust Deep Neural Networks? Towards Reliable Industrial Deployment with an Interpretability Guide
- arxiv url: http://arxiv.org/abs/2604.19206v1
- Date: Tue, 21 Apr 2026 08:10:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.681688
- Title: When Can We Trust Deep Neural Networks? Towards Reliable Industrial Deployment with an Interpretability Guide
- Title(参考訳): ディープニューラルネットワークはいつ信頼できるのか? 解釈可能性ガイドによる信頼性の高い産業展開に向けて
- Authors: Hang-Cheng Dong, Yuhao Jiang, Yibo Jiao, Lu Zou, Kai Zheng, Bingguo Liu, Dong Ye, Guodong Liu,
- Abstract要約: 安全クリティカルなドメインへのAIシステムのデプロイは、信頼性の欠如によって妨げられている。
誤検出された1つの誤った予測は破滅的な結果をもたらす可能性がある。
本稿では,2値欠陥検出ネットワークにおける偽陰性検出のためのポストホックな説明に基づくインジケータを提案する。
- 参考スコア(独自算出の注目度): 6.944960925152066
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The deployment of AI systems in safety-critical domains, such as industrial defect inspection, autonomous driving, and medical diagnosis, is severely hampered by their lack of reliability. A single undetected erroneous prediction can lead to catastrophic outcomes. Unfortunately, there is often no alternative but to place trust in the outputs of a trained AI system, which operates without an internal safeguard to flag unreliable predictions, even in cases of high accuracy. We propose a post-hoc explanation-based indicator to detect false negatives in binary defect detection networks. To our knowledge, this is the first method to proactively identify potentially erroneous network outputs. Our core idea leverages the difference between class-specific discriminative heatmaps and class-agnostic ones. We compute the difference in their intersection over union (IoU) as a reliability score. An adversarial enhancement method is further introduced to amplify this disparity. Evaluations on two industrial defect detection benchmarks show our method effectively identifies false negatives. With adversarial enhancement, it achieves 100\% recall, albeit with a trade-off for true negatives. Our work thus advocates for a new and trustworthy deployment paradigm: data-model-explanation-output, moving beyond conventional end-to-end systems to provide critical support for reliable AI in real-world applications.
- Abstract(参考訳): 産業的欠陥検査、自律運転、医療診断など、AIシステムの安全クリティカルな領域への展開は、信頼性の欠如によって著しく妨げられている。
誤検出された1つの誤った予測は破滅的な結果をもたらす可能性がある。
残念なことに、トレーニング済みのAIシステムの出力を信頼する以外に、信頼性の低い場合には、信頼できない予測をフラグする内部安全ガードなしで運用する、という方法がしばしばあります。
本稿では,2値欠陥検出ネットワークにおける偽陰性検出のためのポストホックな説明に基づくインジケータを提案する。
我々の知る限り、これは潜在的に誤ったネットワーク出力を積極的に識別する最初の方法である。
私たちの中核的な考え方は、クラス固有の差別的ヒートマップとクラスに依存しないヒートマップの違いを利用しています。
我々は、信頼度スコアとして、ユニオン(IoU)との交点の差を計算する。
さらに、この格差を増幅するために、対向増強法を導入する。
2つの産業的欠陥検出ベンチマークで評価した結果, 偽陰性を効果的に同定できることがわかった。
逆の強化により、真の負のトレードオフはあるものの、100\%のリコールを達成する。
私たちの研究は、信頼性の高いAIを現実のアプリケーションでサポートするために、従来のエンドツーエンドシステムを超えて、データモデル・エクスラレーション・アウトプットという、新しい信頼性の高いデプロイメントパラダイムを提唱しています。
関連論文リスト
- DeepTrust: Multi-Step Classification through Dissimilar Adversarial Representations for Robust Android Malware Detection [3.523860679419481]
この研究は、柔軟な分類器を順序づけられたシーケンスに配置する新しいメタヒューリスティックであるDeepTrustを提示する。
2025年のIEEE Conference SaTMLのRobust Android Malware Detectionコンペティションでは、DeepTrustが第一位を獲得し、最先端の結果を得た。
これは、非敵マルウェアの最も高い検出率と1%以下の偽陽性率を維持しながら達成される。
論文 参考訳(メタデータ) (2025-10-14T09:10:23Z) - TrustLoRA: Low-Rank Adaptation for Failure Detection under Out-of-distribution Data [62.22804234013273]
本稿では,共変量および意味的シフトの両条件下での拒絶による分類を統一し,促進する,単純な故障検出フレームワークを提案する。
キーとなる洞察は、障害固有の信頼性知識を低ランクアダプタで分離し、統合することにより、障害検出能力を効果的かつ柔軟に向上できるということです。
論文 参考訳(メタデータ) (2025-04-20T09:20:55Z) - Network Inversion for Generating Confidently Classified Counterfeits [11.599035626374409]
視覚分類において、自信のある予測をもたらす入力を生成することは、モデルの振る舞いと信頼性を理解するための鍵となる。
我々はネットワーク・インバージョン・テクニックを拡張してCCC(Confidently Classified Counterfeits)を生成する。
CCCは信頼性に関するモデル中心の視点を提供し、モデルが完全に合成されたアウト・オブ・ディストリビューション・インプットに高い信頼を割り当てることを明らかにする。
論文 参考訳(メタデータ) (2025-03-26T03:26:49Z) - What If the Input is Expanded in OOD Detection? [77.37433624869857]
Out-of-distriion (OOD) 検出は未知のクラスからのOOD入力を特定することを目的としている。
In-distriion(ID)データと区別するために,様々なスコアリング関数を提案する。
入力空間に異なる共通の汚職を用いるという、新しい視点を導入する。
論文 参考訳(メタデータ) (2024-10-24T06:47:28Z) - Trustworthy Intrusion Detection: Confidence Estimation Using Latent Space [7.115540429006041]
侵入検知システム(IDS)における異常検出の信頼性向上のための新しい手法を提案する。
遅延空間表現に基づく信頼度尺度の開発により,サイバー攻撃に対するIDS予測の信頼性向上を目指す。
NSL-KDDデータセットの適用により,通常のネットワークアクティビティと悪意のあるネットワークアクティビティを効果的に区別するバイナリ分類タスクに焦点をあてる。
論文 参考訳(メタデータ) (2024-09-19T08:09:44Z) - Error-Driven Uncertainty Aware Training [7.702016079410588]
Error-Driven Uncertainty Aware Trainingは、ニューラル分類器が不確実性を正確に推定する能力を高めることを目的としている。
EUATアプローチは、モデルのトレーニングフェーズ中に、トレーニング例が正しく予測されているか、あるいは正しく予測されているかによって、2つの損失関数を選択的に使用することによって機能する。
画像認識領域における多様なニューラルモデルとデータセットを用いてEUATを評価する。
論文 参考訳(メタデータ) (2024-05-02T11:48:14Z) - Free Lunch for Generating Effective Outlier Supervision [46.37464572099351]
本稿では, ほぼ現実的な外乱監視を実現するための超効率的な手法を提案する。
提案したtextttBayesAug は,従来の方式に比べて偽陽性率を 12.50% 以上削減する。
論文 参考訳(メタデータ) (2023-01-17T01:46:45Z) - Diffusion Denoising Process for Perceptron Bias in Out-of-distribution
Detection [67.49587673594276]
我々は、識別器モデルが入力の特定の特徴に対してより敏感であることを示唆する新しいパーセプトロンバイアスの仮定を導入し、過度な問題を引き起こした。
DMの拡散分解過程 (DDP) が非対称の新たな形態として機能し, 入力を高め, 過信問題を緩和するのに適していることを示す。
CIFAR10, CIFAR100, ImageNetによる実験により, 提案手法がSOTA手法より優れていることが示された。
論文 参考訳(メタデータ) (2022-11-21T08:45:08Z) - Inter-Domain Fusion for Enhanced Intrusion Detection in Power Systems:
An Evidence Theoretic and Meta-Heuristic Approach [0.0]
ICSネットワークにおけるIDSによる不正な警告は、経済的および運用上の重大な損害をもたらす可能性がある。
本研究は,CPS電力系統における誤警報の事前分布を伴わずに不確実性に対処し,誤警報を低減する手法を提案する。
論文 参考訳(メタデータ) (2021-11-20T00:05:39Z) - Improving Uncertainty Calibration via Prior Augmented Data [56.88185136509654]
ニューラルネットワークは、普遍関数近似器として機能することで、複雑なデータ分布から学習することに成功した。
彼らはしばしば予測に自信過剰であり、不正確で誤った確率的予測に繋がる。
本稿では,モデルが不当に過信である特徴空間の領域を探索し,それらの予測のエントロピーをラベルの以前の分布に対して条件的に高める手法を提案する。
論文 参考訳(メタデータ) (2021-02-22T07:02:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。