論文の概要: A novel application of Shapley values for large multidimensional time-series data: Applying explainable AI to a DNA profile classification neural network
- arxiv url: http://arxiv.org/abs/2409.18156v1
- Date: Thu, 26 Sep 2024 07:34:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 15:41:17.993769
- Title: A novel application of Shapley values for large multidimensional time-series data: Applying explainable AI to a DNA profile classification neural network
- Title(参考訳): 大規模多次元時系列データに対するShapley値の新しい応用:DNAプロファイル分類ニューラルネットワークへの説明可能なAIの適用
- Authors: Lauren Elborough, Duncan Taylor, Melissa Humphries,
- Abstract要約: 本研究は,シェープリー値にスーパーピクセルの考え方を適応させる,時系列ライクなデータに対する効率的な解法を提案する。
法医学的なDNA分類の例により、この方法は、畳み込みニューラルネットワーク(CNN)によって分類された時系列のようなデータに適用される。
本研究は,この大規模タスクに対するShapley値の現実的で正確かつ高速な計算を実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The application of Shapley values to high-dimensional, time-series-like data is computationally challenging - and sometimes impossible. For $N$ inputs the problem is $2^N$ hard. In image processing, clusters of pixels, referred to as superpixels, are used to streamline computations. This research presents an efficient solution for time-seres-like data that adapts the idea of superpixels for Shapley value computation. Motivated by a forensic DNA classification example, the method is applied to multivariate time-series-like data whose features have been classified by a convolutional neural network (CNN). In DNA processing, it is important to identify alleles from the background noise created by DNA extraction and processing. A single DNA profile has $31,200$ scan points to classify, and the classification decisions must be defensible in a court of law. This means that classification is routinely performed by human readers - a monumental and time consuming process. The application of a CNN with fast computation of meaningful Shapley values provides a potential alternative to the classification. This research demonstrates the realistic, accurate and fast computation of Shapley values for this massive task
- Abstract(参考訳): シェープリー値の高次元時系列的データへの適用は、計算的に困難であり、時には不可能である。
N$入力の場合、問題は2^N$ハードである。
画像処理では、スーパーピクセルと呼ばれるピクセルのクラスタが計算の合理化に使用される。
本研究は,シェープ値計算のためのスーパーピクセルの考え方に適応した時系列データに対する効率的な解を提案する。
法医学的なDNA分類の例により、この方法は、畳み込みニューラルネットワーク(CNN)によって分類された多変量時系列のようなデータに適用される。
DNA処理では,DNA抽出処理によって生じる背景雑音からアレルを同定することが重要である。
1つのDNAプロファイルは、分類するために31,200ドルのスキャンポイントを持ち、その分類決定は、裁判所で保護されなければならない。
これは、分類が人間の読者によって日常的に行われることを意味します。
意味のあるShapley値の高速な計算によるCNNの適用は、分類の代替となる可能性がある。
この膨大なタスクに対するシェープ値の現実的で正確かつ高速な計算を実証する
関連論文リスト
- Unified Functional Hashing in Automatic Machine Learning [58.77232199682271]
高速に統一された関数型ハッシュを用いることで,大きな効率向上が得られることを示す。
私たちのハッシュは"機能的"であり、表現やコードが異なる場合でも同等の候補を識別します。
ニューラルアーキテクチャ検索やアルゴリズム発見など、複数のAutoMLドメインで劇的な改善がなされている。
論文 参考訳(メタデータ) (2023-02-10T18:50:37Z) - Invariance encoding in sliced-Wasserstein space for image classification
with limited training data [10.435990685398595]
我々は、ラドン累積分布変換(R-CDT)の特定の数学的性質を利用して、スライスされたワッサーシュタイン空間における最近傍部分空間分類モデルを数学的に拡張することを提案する。
特定の学習問題に対して,我々の数学的解法は,分類精度と計算複雑性の観点から,深層CNNによるデータ拡張よりも有利であることを示す。
論文 参考訳(メタデータ) (2022-01-09T10:25:27Z) - Deep ensembles in bioimage segmentation [74.01883650587321]
本研究では,畳み込みニューラルネットワーク(CNN)のアンサンブルを提案する。
アンサンブル法では、多くの異なるモデルが訓練され、分類に使用され、アンサンブルは単一分類器の出力を集約する。
提案するアンサンブルは,DeepLabV3+とHarDNet環境を用いて,異なるバックボーンネットワークを組み合わせることで実現されている。
論文 参考訳(メタデータ) (2021-12-24T05:54:21Z) - Cherry-Picking Gradients: Learning Low-Rank Embeddings of Visual Data
via Differentiable Cross-Approximation [53.95297550117153]
本稿では,大規模な視覚データテンソルの処理を行うエンドツーエンドのトレーニング可能なフレームワークを提案する。
提案手法は大規模多次元グリッドデータや,大規模受容領域上のコンテキストを必要とするタスクに特に有用である。
論文 参考訳(メタデータ) (2021-05-29T08:39:57Z) - Deep Convolutional Neural Network for Non-rigid Image Registration [0.0]
本稿では、深層ニューラルネットワーク(dnn)と、より具体的には、深層畳み込みニューラルネットワーク(cnn)の非剛性画像登録を効率的に行う能力について検討する。
実験の結果、CNNは非剛体画像の効率的な登録に利用でき、従来のDiffomorphic Demons や Pyramiding に比べて計算時間もかなり少ないことがわかった。
論文 参考訳(メタデータ) (2021-04-24T23:24:29Z) - CNNs for JPEGs: A Study in Computational Cost [49.97673761305336]
畳み込みニューラルネットワーク(CNN)は過去10年間で驚くべき進歩を遂げてきた。
CNNはRGBピクセルから直接データの堅牢な表現を学習することができる。
近年,圧縮領域から直接学習できる深層学習手法が注目されている。
論文 参考訳(メタデータ) (2020-12-26T15:00:10Z) - Solving Mixed Integer Programs Using Neural Networks [57.683491412480635]
本稿では,mipソルバの2つのキーサブタスクに学習を適用し,高品質なジョイント変数割当を生成し,その割当と最適課題との客観的値の差を限定する。
提案手法は,ニューラルネットワークに基づく2つのコンポーネントであるニューラルダイバーディングとニューラルブランチを構築し,SCIPなどのベースMIPソルバで使用する。
2つのGoogle生産データセットとMIPLIBを含む6つの現実世界データセットに対するアプローチを評価し、それぞれに別々のニューラルネットワークをトレーニングする。
論文 参考訳(メタデータ) (2020-12-23T09:33:11Z) - Region Growing with Convolutional Neural Networks for Biomedical Image
Segmentation [1.5469452301122177]
本稿では,各座標方向の予測マスク領域を反復的に成長させることにより,畳み込みニューラルネットワーク(CNN)を用いてセグメンテーションを行う手法を提案する。
我々は、CNNの確率スコアのしきい値を用いて、その領域にピクセルが追加され、その領域に新しいピクセルが加わらないまで繰り返し続けるかどうかを判定する。
本手法は,少量のトレーニングデータを活用するとともに,計算効率を保ちながら,高いセグメンテーション精度を達成し,生物学的に現実的な形態的特徴を維持できる。
論文 参考訳(メタデータ) (2020-09-23T17:53:00Z) - When CNNs Meet Random RNNs: Towards Multi-Level Analysis for RGB-D
Object and Scene Recognition [10.796613905980609]
オブジェクトおよびシーン認識タスクのための多モードRGB-D画像から識別的特徴表現を抽出する新しいフレームワークを提案する。
CNNアクティベーションの高次元性に対応するため、ランダムな重み付けプール方式が提案されている。
実験では、RNNステージにおける完全ランダム化構造がCNNアクティベーションを符号化し、識別的ソリッドな特徴を成功させることを確認した。
論文 参考訳(メタデータ) (2020-04-26T10:58:27Z) - Radon cumulative distribution transform subspace modeling for image
classification [18.709734704950804]
画像変形モデルの幅広いクラスに適用可能な新しい教師付き画像分類法を提案する。
この方法は、画像データに先述のRandon Cumulative Distribution Transform(R-CDT)を用いる。
テスト精度の向上に加えて,計算効率の向上も示す。
論文 参考訳(メタデータ) (2020-04-07T19:47:26Z) - Computational optimization of convolutional neural networks using
separated filters architecture [69.73393478582027]
我々は、計算複雑性を低減し、ニューラルネットワーク処理を高速化する畳み込みニューラルネットワーク変換を考える。
畳み込みニューラルネットワーク(CNN)の使用は、計算的に要求が多すぎるにもかかわらず、画像認識の標準的なアプローチである。
論文 参考訳(メタデータ) (2020-02-18T17:42:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。