論文の概要: L'explicabilit\'e au service de l'extraction de connaissances :
application \`a des donn\'ees m\'edicales
- arxiv url: http://arxiv.org/abs/2302.02653v1
- Date: Mon, 6 Feb 2023 09:49:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-07 17:04:44.992772
- Title: L'explicabilit\'e au service de l'extraction de connaissances :
application \`a des donn\'ees m\'edicales
- Title(参考訳): L'explicabilit\'e au service de l'extraction de connaissances : application \`a des donn\'ees m\'edicales
- Authors: Robin Cugny, Emmanuel Doumard, Elodie Escriva, Haomiao Wang
- Abstract要約: 本稿では,データから知識を抽出し,特徴の選択,データサブグループ分析,高度に情報に富んだ事例の選択がいかに役立つかを示す。
次に、これらの手法を用いた完全なデータ処理パイプラインを医療データに提示する。
- 参考スコア(独自算出の注目度): 0.34410212782758054
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The use of machine learning has increased dramatically in the last decade.
The lack of transparency is now a limiting factor, which the field of
explainability wants to address. Furthermore, one of the challenges of data
mining is to present the statistical relationships of a dataset when they can
be highly non-linear. One of the strengths of supervised learning is its
ability to find complex statistical relationships that explainability allows to
represent in an intelligible way. This paper shows that explanations can be
used to extract knowledge from data and shows how feature selection, data
subgroup analysis and selection of highly informative instances benefit from
explanations. We then present a complete data processing pipeline using these
methods on medical data. -- --
L'utilisation de l'apprentissage automatique a connu un bond cette derni\`ere
d\'ecennie. Le manque de transparence est aujourd'hui un frein, que le domaine
de l'explicabilit\'e veut r\'esoudre. Par ailleurs, un des d\'efis de
l'exploration de donn\'ees est de pr\'esenter les relations statistiques d'un
jeu de donn\'ees alors que celles-ci peuvent \^etre hautement non-lin\'eaires.
Une des forces de l'apprentissage supervis\'e est sa capacit\'e \`a trouver des
relations statistiques complexes que l'explicabilit\'e permet de repr\'esenter
de mani\`ere intelligible. Ce papier montre que les explications permettent de
faire de l'extraction de connaissance sur des donn\'ees et comment la
s\'election de variables, l'analyse de sous-groupes de donn\'ees et la
s\'election d'instances avec un fort pouvoir informatif b\'en\'eficient des
explications. Nous pr\'esentons alors un pipeline complet de traitement des
donn\'ees utilisant ces m\'ethodes pour l'exploration de donn\'ees m\'edicales.
- Abstract(参考訳): 機械学習の利用はこの10年間で劇的に増加した。
今や透明性の欠如は、説明可能性の分野が対処しようとしている制限要因となっている。
さらに、データマイニングの課題の1つは、高度に非線形な場合にデータセットの統計的関係を示すことである。
教師付き学習の強みの1つは、説明可能性によって理解可能な方法で表現できる複雑な統計的関係を見つける能力である。
本稿では,データから知識を抽出し,特徴の選択,データサブグループ分析,高度に情報に富んだ事例の選択がいかに役立つかを示す。
次に医療データにこれらの手法を用いた完全なデータ処理パイプラインを提案する。
---l'utilisation de l'apprentissage automatique a connu un bond cette derni\`ere d\'ecennie
トランスパレンス・エスト・アウジュール・ユ・ウン・フレイン・ル・ドメイン・ド・l'explicabilit\'e veut r\'esoudre 』に収録。
ailleurs, un des d'efis de l'exploration de donn\'ees est de pr\'esenter les relations statistiques d'un jeu de donn\'ees alors que celles-ci peuvent \^etre hautement non-lin\eaires
関係統計学における「関係統計学」と「関係統計学」は「関係統計学」と「関係統計学」と「関係統計学」を兼ね備えている。
ce papier montre que les explications permettent de faire de l'extraction de connaissance sur des donn\'ees et comment la s\'election de variables, l'analyse de sous-groupes de donn\'ees et la s\'election d'instances avec un fort pouvoir informatif b\'en\eficient des explications
nous pr\'esentons alors un pipeline complet de traitement des donn\'ees utilisant ces m\'ethodes pour l'exploration de donn\'ees m\'edicales
関連論文リスト
- XplainLLM: A QA Explanation Dataset for Understanding LLM
Decision-Making [13.928951741632815]
大規模言語モデル(LLM)は、最近、自然言語理解タスクにおいて顕著な進歩を遂げた。
本稿では、新しい説明データセットを導入することにより、このプロセスに透明性をもたらすことを検討する。
我々のデータセットには12,102のQAEトリプルが含まれている。
論文 参考訳(メタデータ) (2023-11-15T00:34:28Z) - Physics of Language Models: Part 3.1, Knowledge Storage and Extraction [51.68385617116854]
大規模言語モデル(LLM)は膨大な量の世界の知識を格納することができ、しばしば質問応答によって抽出できる。
モデルが知識を抽出する能力と,トレーニングデータの多様な多様性尺度との間には,強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-09-25T17:37:20Z) - From Weakly Supervised Learning to Active Learning [1.52292571922932]
この論文は、教師付き学習よりも汎用的なフレームワークを導き出せるか?
私たちは、ユニークなターゲットではなく、ターゲット候補のセットを与えるものとして、弱い監督をモデル化します。
我々は、ほとんどの観測値と一致する楽観的な'関数を求めるべきだと論じる。これにより、部分ラベルを曖昧にするための原則を導出できる。
論文 参考訳(メタデータ) (2022-09-23T14:55:43Z) - Reasoning-Modulated Representations [85.08205744191078]
タスクが純粋に不透明でないような共通的な環境について研究する。
我々のアプローチは、新しいデータ効率表現学習の道を開く。
論文 参考訳(メタデータ) (2021-07-19T13:57:13Z) - Toward Understanding the Feature Learning Process of Self-supervised
Contrastive Learning [43.504548777955854]
本研究では,その特徴学習過程を解析することにより,ニューラルネットワークの特徴表現のコントラスト学習について検討する。
textbfReLUネットワークを用いたコントラスト学習は、適切な拡張が採用されれば、所望のスパース特徴を確実に学習できることを実証する。
論文 参考訳(メタデータ) (2021-05-31T16:42:09Z) - Overcoming the curse of dimensionality with Laplacian regularization in
semi-supervised learning [80.20302993614594]
ラプラシア正規化の欠点を克服するための統計的解析を提供する。
望ましい振る舞いを示すスペクトルフィルタリング法を多数発表する。
我々は,本手法を大量のデータで利用できるようにするために,現実的な計算ガイドラインを提供する。
論文 参考訳(メタデータ) (2020-09-09T14:28:54Z) - Adding Seemingly Uninformative Labels Helps in Low Data Regimes [6.953976287091344]
マンモグラフィー画像における腫瘍のセグメンテーションという,専門的アノテーションを必要とする課題について考察する。
低データ設定では、専門家アノテーションと非専門家アノテーションの非形式的なラベルを補完し、タスクをマルチクラス問題にすることで、パフォーマンスを向上させることができることを示す。
論文 参考訳(メタデータ) (2020-07-20T17:38:59Z) - How Useful is Self-Supervised Pretraining for Visual Tasks? [133.1984299177874]
我々は、総合的な合成データセットと下流タスクにまたがる様々な自己教師付きアルゴリズムを評価する。
我々の実験は、利用可能なラベルの数が増えるにつれて、セルフスーパービジョンの有用性がどう変化するかについての洞察を提供する。
論文 参考訳(メタデータ) (2020-03-31T16:03:22Z) - Laplacian Denoising Autoencoder [114.21219514831343]
本稿では,新しいタイプの自動符号化器を用いてデータ表現を学習することを提案する。
勾配領域における潜伏クリーンデータを破損させて雑音入力データを生成する。
いくつかのビジュアルベンチマークの実験では、提案されたアプローチでより良い表現が学べることが示されている。
論文 参考訳(メタデータ) (2020-03-30T16:52:39Z) - A Theory of Usable Information Under Computational Constraints [103.5901638681034]
本稿では,複雑なシステムにおける情報推論のための新しいフレームワークを提案する。
我々の基礎はシャノンの情報理論の変分拡張に基づいている。
計算制約を組み込むことで,データから$mathcalV$-informationを確実に推定できることを示す。
論文 参考訳(メタデータ) (2020-02-25T06:09:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。