論文の概要: Covered Information Disentanglement: Model Transparency via Unbiased
Permutation Importance
- arxiv url: http://arxiv.org/abs/2111.09744v2
- Date: Sun, 21 Nov 2021 21:22:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-23 12:06:25.431024
- Title: Covered Information Disentanglement: Model Transparency via Unbiased
Permutation Importance
- Title(参考訳): cover information disentanglement: unbiased permutation importanceによるモデルの透明性
- Authors: Jo\~ao Pereira and Erik S.G. Stroes and Aeilko H. Zwinderman and
Evgeni Levin
- Abstract要約: マルコフ確率場と組み合わせた場合,CID(Covered Information Disentanglement)を効率的に計算する方法を示す。
本研究は,まず,制御された玩具データセット上での置換重要度調整の有効性を実証し,実世界の医療データへの影響について論じる。
- 参考スコア(独自算出の注目度): 2.064612766965483
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Model transparency is a prerequisite in many domains and an increasingly
popular area in machine learning research. In the medical domain, for instance,
unveiling the mechanisms behind a disease often has higher priority than the
diagnostic itself since it might dictate or guide potential treatments and
research directions. One of the most popular approaches to explain model global
predictions is the permutation importance where the performance on permuted
data is benchmarked against the baseline. However, this method and other
related approaches will undervalue the importance of a feature in the presence
of covariates since these cover part of its provided information. To address
this issue, we propose Covered Information Disentanglement (CID), a method that
considers all feature information overlap to correct the values provided by
permutation importance. We further show how to compute CID efficiently when
coupled with Markov random fields. We demonstrate its efficacy in adjusting
permutation importance first on a controlled toy dataset and discuss its effect
on real-world medical data.
- Abstract(参考訳): モデルの透明性は、多くのドメインにおいて必須条件であり、機械学習研究でますます人気が高まっている分野である。
例えば、医学領域では、疾患の背後にあるメカニズムを明らかにすることは、治療や研究の方向性を指示する可能性があるため、診断自体よりも優先度が高いことが多い。
モデルグローバル予測を説明する最も一般的なアプローチの1つは、順列データのパフォーマンスがベースラインに対してベンチマークされる順列の重要性である。
しかし,本手法や他の関連手法は,提供情報の一部をカバーしているため,共変量の存在下での特徴の重要性を過小評価する。
そこで本研究では,すべての特徴情報を重ね合わせて置換重要度によって提供された値を補正する手法であるcovered information disentanglement (cid)を提案する。
さらに,マルコフ確率場と組み合わせてCIDを効率的に計算する方法を示す。
まず,コントロールトイデータセット上での順応重要度調整の効果を実証し,実世界医療データへの影響について考察する。
関連論文リスト
- Localized Gaussians as Self-Attention Weights for Point Clouds Correspondence [92.07601770031236]
本稿では,エンコーダのみのトランスフォーマーアーキテクチャのアテンションヘッドにおける意味的意味パターンについて検討する。
注意重みの修正はトレーニングプロセスの促進だけでなく,最適化の安定性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-09-20T07:41:47Z) - Cross-Dataset Generalization For Retinal Lesions Segmentation [2.1160877779256126]
本研究は,複数の既知のデータセットを特徴付け,モデルの一般化性能を向上させるために提案された様々な手法を比較する。
以上の結果から,粗いラベル付きデータを微細なデータセットと組み合わせて病変のセグメンテーションを改善する方法についての知見が得られた。
論文 参考訳(メタデータ) (2024-05-14T05:52:01Z) - Prospector Heads: Generalized Feature Attribution for Large Models & Data [82.02696069543454]
本稿では,説明に基づく帰属手法の効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - Domain-invariant Clinical Representation Learning by Bridging Data
Distribution Shift across EMR Datasets [16.317118701435742]
適切な診断を行い、パーソナライズされた治療計画を設計する上で、効果的な予後モデルが期待されている。
疾患の初期段階では、限られたデータ収集と臨床経験に加えて、プライバシと倫理の懸念から、参照のためのデータ可用性が制限される可能性がある。
本稿では、ソースデータセットからターゲットデータセットへの遷移モデルを構築するためのドメイン不変表現学習手法を紹介する。
論文 参考訳(メタデータ) (2023-10-11T18:32:21Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Drug Discovery under Covariate Shift with Domain-Informed Prior
Distributions over Functions [30.305418761024143]
実世界の薬物発見タスクは、しばしばラベル付きデータの不足とかなりの範囲のデータによって特徴づけられる。
我々は、データ生成プロセスの明示的な事前知識を事前分布にエンコードする原理的な方法を提案する。
我々は,Q-SAVIを組み込んで,事前知識のような化学空間をモデリングプロセスに組み込むことで,相当な精度と校正が可能であることを実証した。
論文 参考訳(メタデータ) (2023-07-14T05:01:10Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Encoding Domain Information with Sparse Priors for Inferring Explainable
Latent Variables [2.8935588665357077]
説明可能な因子の推論を促進するために,スパース先行の因子潜在変数モデルであるspex-LVMを提案する。
spex-LVMは、既存の生物医療経路の知識を利用して、潜在因子にアノテート属性を自動的に割り当てる。
シミュレーションおよび実シングルセルRNA-seqデータセットの評価は、本モデルが本質的に説明可能な方法で関連構造を頑健に識別することを示す。
論文 参考訳(メタデータ) (2021-07-08T10:19:32Z) - Explaining COVID-19 and Thoracic Pathology Model Predictions by
Identifying Informative Input Features [47.45835732009979]
ニューラルネットワークは胸部X線上の分類および回帰タスクにおいて顕著な性能を示した。
特徴帰属法は、出力予測における入力特徴の重要性を識別する。
本研究では,NIH Chest X-ray8およびBrixIAデータセット上で,人間中心の解釈可能性指標と人間に依存しない特徴重要度指標の両方を用いて評価する。
論文 参考訳(メタデータ) (2021-04-01T11:42:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。