論文の概要: Interactive Explainable Anomaly Detection for Industrial Settings
- arxiv url: http://arxiv.org/abs/2410.12817v1
- Date: Tue, 01 Oct 2024 11:06:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-20 10:10:26.982476
- Title: Interactive Explainable Anomaly Detection for Industrial Settings
- Title(参考訳): 産業環境における対話型説明可能な異常検出
- Authors: Daniel Gramelt, Timon Höfer, Ute Schmid,
- Abstract要約: 我々は,ユーザインタラクションを通じてAIを改善するNearCAIPIインタラクションフレームワークを提案する。
また、NearCAIPIが人間のフィードバックを対話的なプロセスチェーンに統合する方法について説明する。
- 参考スコア(独自算出の注目度): 1.9897061813159418
- License:
- Abstract: Being able to recognise defects in industrial objects is a key element of quality assurance in production lines. Our research focuses on visual anomaly detection in RGB images. Although Convolutional Neural Networks (CNNs) achieve high accuracies in this task, end users in industrial environments receive the model's decisions without additional explanations. Therefore, it is of interest to enrich the model's outputs with further explanations to increase confidence in the model and speed up anomaly detection. In our work, we focus on (1) CNN-based classification models and (2) the further development of a model-agnostic explanation algorithm for black-box classifiers. Additionally, (3) we demonstrate how we can establish an interactive interface that allows users to further correct the model's output. We present our NearCAIPI Interaction Framework, which improves AI through user interaction, and show how this approach increases the system's trustworthiness. We also illustrate how NearCAIPI can integrate human feedback into an interactive process chain.
- Abstract(参考訳): 工業用オブジェクトの欠陥を認識することは、生産ラインの品質保証の重要な要素である。
本研究は,RGB画像における視覚異常検出に焦点をあてる。
畳み込みニューラルネットワーク(CNN)はこのタスクにおいて高い精度を達成するが、産業環境のエンドユーザは、追加の説明なしにモデルの判断を受ける。
したがって、モデルの信頼性を高め、異常検出を高速化するために、さらなる説明でモデルの出力を豊かにすることに興味がある。
本研究では,(1)CNNに基づく分類モデルに焦点をあて,(2)ブラックボックス分類のためのモデルに依存しない説明アルゴリズムの開発について述べる。
さらに,ユーザがモデルの出力をさらに補正できる対話型インターフェースの確立を実証する。
我々は,ユーザインタラクションを通じてAIを改善するNearCAIPIインタラクションフレームワークを紹介し,このアプローチがシステムの信頼性を高める方法を示す。
また、NearCAIPIが人間のフィードバックを対話的なプロセスチェーンに統合する方法について説明する。
関連論文リスト
- Exploring Cross-model Neuronal Correlations in the Context of Predicting Model Performance and Generalizability [2.6708879445664584]
本稿では,新しいモデルを用いたモデルの性能評価手法を提案する。
提案手法は,1つのネットワーク内の各ニューロンに対して,類似の出力を生成する他のネットワークにニューロンが存在するかどうかを判定することにより相関性を評価する。
論文 参考訳(メタデータ) (2024-08-15T22:57:39Z) - Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。
十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。
近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。
本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:45:32Z) - CAManim: Animating end-to-end network activation maps [0.2509487459755192]
本稿では,CNN予測に対するエンドユーザの理解の拡大と集中を目的とした,CAManimという新しいXAI可視化手法を提案する。
また,Remove and Debias(ROAD)尺度に基づいて,新たな定量的評価法を提案する。
これは、解釈可能で堅牢で透明なモデルアセスメント方法論に対する需要の増加に対応するために、先行研究に基づいている。
論文 参考訳(メタデータ) (2023-12-19T01:07:36Z) - Point-aware Interaction and CNN-induced Refinement Network for RGB-D
Salient Object Detection [95.84616822805664]
我々は,CNNによるトランスフォーマーアーキテクチャを導入し,ポイント・アウェア・インタラクションとCNNによるリファインメントを備えた新しいRGB-D SODネットワークを提案する。
トランスフォーマーがもたらすブロック効果とディテール破壊問題を自然に軽減するために,コンテンツリファインメントとサプリメントのためのCNNRユニットを設計する。
論文 参考訳(メタデータ) (2023-08-17T11:57:49Z) - Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.041049052843604]
STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。
まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - NL-FCOS: Improving FCOS through Non-Local Modules for Object Detection [0.0]
FCOSヘッドと組み合わせた非局所モジュール(NL-FCOS)は実用的で効率的であることを示す。
衣服検出と手書き量認識問題における最先端性能を確立した。
論文 参考訳(メタデータ) (2022-03-29T15:00:14Z) - A Multimodal Canonical-Correlated Graph Neural Network for
Energy-Efficient Speech Enhancement [4.395837214164745]
本稿では,エネルギー効率の高いAV音声強調のための新しいマルチモーダル自己教師型アーキテクチャを提案する。
グラフニューラルネットワークと標準相関解析(CCA-GNN)を統合する
ベンチマークのChiME3データセットを用いて行った実験により、提案したフレームベースのAV CCA-GNNは、時間的文脈におけるより良い特徴学習を強化していることがわかった。
論文 参考訳(メタデータ) (2022-02-09T15:47:07Z) - Interactive Analysis of CNN Robustness [11.136837582678869]
Perturberはウェブベースのアプリケーションで、3D入力シーンがインタラクティブに摂動した場合、CNNのアクティベーションと予測がどのように進化するかをユーザが調査することができる。
パーターバーは、カメラコントロール、照明とシェーディング効果、背景の修正、物体の変形、敵の攻撃など、様々なシーン修正を提供している。
機械学習の専門家によるケーススタディによると、Perturberはモデルの脆弱性に関する仮説を素早く生成し、モデルの振る舞いを質的に比較するのに役立つ。
論文 参考訳(メタデータ) (2021-10-14T18:52:39Z) - On the benefits of robust models in modulation recognition [53.391095789289736]
畳み込み層を用いたディープニューラルネットワーク(DNN)は、通信における多くのタスクにおいて最先端である。
画像分類のような他の領域では、DNNは敵の摂動に弱いことが示されている。
最新モデルの堅牢性をテストするための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-27T19:58:06Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。