論文の概要: LCS-DIVE: An Automated Rule-based Machine Learning Visualization
Pipeline for Characterizing Complex Associations in Classification
- arxiv url: http://arxiv.org/abs/2104.12844v1
- Date: Mon, 26 Apr 2021 19:47:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-29 01:10:56.251368
- Title: LCS-DIVE: An Automated Rule-based Machine Learning Visualization
Pipeline for Characterizing Complex Associations in Classification
- Title(参考訳): LCS-DIVE: 分類における複雑な関連を識別するルールベース機械学習可視化パイプライン
- Authors: Robert Zhang, Rachael Stolzenberg-Solomon, Shannon M. Lynch, Ryan J.
Urbanowicz
- Abstract要約: 本研究では、複雑な生物医学分類のための自動LCS解釈パイプラインであるLCS Discovery Visualization Environment(LCS-DIVE)を紹介する。
LCS-DIVEは、バイオメディカルデータマイニングにおけるノイズとスケーラビリティを克服するために設計されたLCSであるExSTraCSの新しいシキット学習実装を使用してモデリングを行います。
特徴追跡スコアおよび/またはルールを利用して、(1)特徴の重要性(2)基礎となる付加、エピスタティック、および/または異種関係のパターン、(3)クラスタリング、視覚化生成、およびクラスタ尋問を介してモデル駆動の異種サブグループを自動的に評価する。
- 参考スコア(独自算出の注目度): 0.7226144684379191
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning (ML) research has yielded powerful tools for training
accurate prediction models despite complex multivariate associations (e.g.
interactions and heterogeneity). In fields such as medicine, improved
interpretability of ML modeling is required for knowledge discovery,
accountability, and fairness. Rule-based ML approaches such as Learning
Classifier Systems (LCSs) strike a balance between predictive performance and
interpretability in complex, noisy domains. This work introduces the LCS
Discovery and Visualization Environment (LCS-DIVE), an automated LCS model
interpretation pipeline for complex biomedical classification. LCS-DIVE
conducts modeling using a new scikit-learn implementation of ExSTraCS, an LCS
designed to overcome noise and scalability in biomedical data mining yielding
human readable IF:THEN rules as well as feature-tracking scores for each
training sample. LCS-DIVE leverages feature-tracking scores and/or rules to
automatically guide characterization of (1) feature importance (2) underlying
additive, epistatic, and/or heterogeneous patterns of association, and (3)
model-driven heterogeneous instance subgroups via clustering, visualization
generation, and cluster interrogation. LCS-DIVE was evaluated over a diverse
set of simulated genetic and benchmark datasets encoding a variety of complex
multivariate associations, demonstrating its ability to differentiate between
them and then applied to characterize associations within a real-world study of
pancreatic cancer.
- Abstract(参考訳): 機械学習(ML)の研究は、複雑な多変量関連(例えば)にもかかわらず、正確な予測モデルをトレーニングするための強力なツールを生み出している。
相互作用と異質性)
医学などの分野では、知識発見、説明可能性、公平性においてMLモデリングの解釈可能性の向上が必要である。
学習分類システム(LCS)のようなルールベースのMLアプローチは、複雑な雑音のある領域における予測性能と解釈可能性のバランスをとる。
この研究は、複雑な生物医学分類のためのLCSモデル解釈パイプラインであるLCSディスカバリー・ビジュアライゼーション・環境(LCS-DIVE)を紹介する。
LCS-DIVEは、生体医学データマイニングにおけるノイズとスケーラビリティを克服し、人間の可読性IF:THENルールとトレーニングサンプル毎の機能追跡スコアを用いてモデリングを行う。
LCS-DIVEは機能追跡スコアと/またはルールを活用し、(1)特徴重要度、(2)付加的、エピスタティック、および/または不均一な関連パターン、(3)クラスタリング、可視化生成、クラスタ尋問によるモデル駆動の異種インスタンスサブグループを自動指導する。
LCS-DIVEは、様々な複雑な多変量関連をコードする様々な遺伝子およびベンチマークデータセットを用いて評価され、膵がんの実際の研究における関連を識別する能力を示した。
関連論文リスト
- ISAM-MTL: Cross-subject multi-task learning model with identifiable spikes and associative memory networks [6.240145569484483]
脳波のクロスオブジェクト変動は、現在のディープラーニングモデルの性能を低下させる。
本稿では,識別可能なスパイキング(IS)表現と連想メモリ(AM)ネットワークに基づくマルチタスク学習(MTL)脳波分類モデルISAM-MTLを提案する。
論文 参考訳(メタデータ) (2025-01-30T02:00:48Z) - Biology Instructions: A Dataset and Benchmark for Multi-Omics Sequence Understanding Capability of Large Language Models [51.316001071698224]
本稿では,生物配列関連命令チューニングデータセットであるBiology-Instructionsを紹介する。
このデータセットは、大きな言語モデル(LLM)と複雑な生物学的シーケンスに関連するタスクのギャップを埋めることができます。
また、新たな3段階トレーニングパイプラインを備えたChatMultiOmicsという強力なベースラインも開発しています。
論文 参考訳(メタデータ) (2024-12-26T12:12:23Z) - In-Context Language Learning: Architectures and Algorithms [73.93205821154605]
我々は、文脈言語学習(ICLL)において、私たちが用語する新しいモデル問題群(英語版)のレンズを通してICLを研究する。
我々は,通常のICLLタスクにおいて,多種多様なニューラルシーケンスモデルを評価する。
論文 参考訳(メタデータ) (2024-01-23T18:59:21Z) - An Ensemble Approach to Question Classification: Integrating Electra
Transformer, GloVe, and LSTM [0.0]
本研究では,Electra,GloVe,LSTMモデルの強みを組み合わせた質問分類のための革新的なアンサンブル手法を提案する。
このモデルは、よく認識されたTRECデータセットで厳密にテストされ、これらの異なる技術の統合がより優れた結果をもたらすことを示す。
論文 参考訳(メタデータ) (2023-08-13T18:14:10Z) - Extension of Transformational Machine Learning: Classification Problems [0.0]
本研究では、薬物発見における変換機械学習(TML)の適用と性能について検討する。
メタ学習アルゴリズムであるTMLは、さまざまなドメインにまたがる共通属性の活用に優れています。
薬物発見プロセスは複雑で時間を要するが、予測精度の増大から大きな恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-08-07T07:34:18Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Using Representation Expressiveness and Learnability to Evaluate
Self-Supervised Learning Methods [61.49061000562676]
本稿では,学習可能性を評価するためにCluster Learnability (CL)を導入する。
CLは、K-meansで表現をクラスタリングすることによって得られたラベルを予測するために訓練されたKNNのパフォーマンスで測定される。
CLは、他の競合する評価手法よりも分布内モデルの性能と相関することがわかった。
論文 参考訳(メタデータ) (2022-06-02T19:05:13Z) - Development of Interpretable Machine Learning Models to Detect
Arrhythmia based on ECG Data [0.0]
この論文は、最先端モデルに基づいた畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)分類器を構築する。
大域的および局所的解釈可能性法は、依存変数と独立変数の相互作用を理解するために利用される。
提案したCNNモデルとLSTMモデルの予測を説明する上で,Grad-Camが最も効果的な解釈可能性技術であることが判明した。
論文 参考訳(メタデータ) (2022-05-05T17:29:33Z) - A Rigorous Machine Learning Analysis Pipeline for Biomedical Binary
Classification: Application in Pancreatic Cancer Nested Case-control Studies
with Implications for Bias Assessments [2.9726886415710276]
バイナリ分類にフォーカスした、厳格で厳格なML分析パイプラインをレイアウトし、組み立てました。
この'自動'だがカスタマイズ可能なパイプラインは、a)探索分析、b)データのクリーニングと変換、c)特徴選択、d)9つの確立されたMLアルゴリズムによるモデルトレーニングを含む。
本パイプラインは,癌に対する確立された,新たに同定されたリスクファクターの疫学的検討に適用し,MLアルゴリズムによって異なるバイアス源がどのように扱われるかを評価する。
論文 参考訳(メタデータ) (2020-08-28T19:58:05Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。