論文の概要: ProtoGate: Prototype-based Neural Networks with Global-to-local Feature Selection for Tabular Biomedical Data
- arxiv url: http://arxiv.org/abs/2306.12330v2
- Date: Mon, 3 Jun 2024 12:09:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-04 21:20:11.238331
- Title: ProtoGate: Prototype-based Neural Networks with Global-to-local Feature Selection for Tabular Biomedical Data
- Title(参考訳): ProtoGate: タブラルバイオメディカルデータに対するグローバル-ローカル特徴選択によるプロトタイプベースニューラルネットワーク
- Authors: Xiangjian Jiang, Andrei Margeloiu, Nikola Simidjievski, Mateja Jamnik,
- Abstract要約: 本稿では,HDLSSデータの特徴選択のためのプロトタイプベースニューラルモデルProtoGateを提案する。
ProtoGateはグローバルとローカルの機能選択を適応的にバランスすることで、インスタンスワイズ機能を選択する。
ProtoGateは、非パラメトリックなプロトタイプベースの予測メカニズムを使用して、協調適応問題に対処する。
- 参考スコア(独自算出の注目度): 10.88959673845634
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tabular biomedical data poses challenges in machine learning because it is often high-dimensional and typically low-sample-size (HDLSS). Previous research has attempted to address these challenges via local feature selection, but existing approaches often fail to achieve optimal performance due to their limitation in identifying globally important features and their susceptibility to the co-adaptation problem. In this paper, we propose ProtoGate, a prototype-based neural model for feature selection on HDLSS data. ProtoGate first selects instance-wise features via adaptively balancing global and local feature selection. Furthermore, ProtoGate employs a non-parametric prototype-based prediction mechanism to tackle the co-adaptation problem, ensuring the feature selection results and predictions are consistent with underlying data clusters. We conduct comprehensive experiments to evaluate the performance and interpretability of ProtoGate on synthetic and real-world datasets. The results show that ProtoGate generally outperforms state-of-the-art methods in prediction accuracy by a clear margin while providing high-fidelity feature selection and explainable predictions. Code is available at https://github.com/SilenceX12138/ProtoGate.
- Abstract(参考訳): タブラルバイオメディカルデータは、しばしば高次元で典型的には低サンプルサイズ(HDLSS)であるため、機械学習において課題を提起する。
従来の研究では、局所的な特徴選択を通じてこれらの課題に対処しようと試みてきたが、グローバルな重要な特徴の特定と、協調適応問題への感受性の制限により、既存のアプローチは最適な性能を達成できない場合が多い。
本稿では,HDLSSデータの特徴選択のためのプロトタイプベースニューラルモデルであるProtoGateを提案する。
ProtoGateはまず、グローバルとローカルの機能選択を適応的にバランスさせることで、インスタンスワイズ機能を選択する。
さらに、ProtoGateは、非パラメトリックプロトタイプベースの予測メカニズムを使用して、コ適応問題に対処し、特徴の選択結果と予測が基礎となるデータクラスタと一致していることを保証する。
人工および実世界のデータセット上でのProtoGateの性能と解釈可能性を評価するための総合的な実験を行う。
その結果,ProtoGateは,高忠実度特徴選択と説明可能な予測を提供しながら,平均余白による予測精度の最先端手法よりも優れていた。
コードはhttps://github.com/SilenceX12138/ProtoGateで入手できる。
関連論文リスト
- Can EEG resting state data benefit data-driven approaches for motor-imagery decoding? [4.870701423888026]
本稿では,デコードモデルの一般化を促進するための特徴結合手法を提案する。
我々は、EEG信号分類のための標準的な畳み込みニューラルネットワークであるEEGNetモデルと、静止状態のEEGデータから導かれる機能的接続手段を組み合わせる。
ユーザ内のシナリオに対する平均精度の改善が観察されているが、ランダムなデータ結合と比較して、ユーザ間のシナリオ間の結合はメリットがない。
論文 参考訳(メタデータ) (2024-10-28T07:18:32Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - A Performance-Driven Benchmark for Feature Selection in Tabular Deep
Learning [131.2910403490434]
データサイエンティストは通常、データセットにできるだけ多くの機能を集め、既存の機能から新しい機能を設計する。
既存のタブ形式の特徴選択のためのベンチマークでは、古典的な下流モデル、おもちゃの合成データセット、あるいは下流のパフォーマンスに基づいて特徴セレクタを評価していない。
変換器を含む下流ニューラルネットワーク上で評価された課題のある特徴選択ベンチマークを構築した。
また,従来の特徴選択法よりも高い性能を有するニューラルネットワークのための,Lassoのインプット・グラディエント・ベース・アナログも提案する。
論文 参考訳(メタデータ) (2023-11-10T05:26:10Z) - Feature Selection in the Contrastive Analysis Setting [17.90957424147776]
コントラスト分析(Contrastive Analysis、CA)は、ターゲットデータセットに独自に濃縮されたバリエーションの探索を指す。
コントラスト特徴選択(CFS)は,CA設定において特徴選択を行う手法である。
提案手法は従来提案されていた教師付きかつ完全に教師なしな特徴選択法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2023-10-27T23:16:03Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Causality and Independence Enhancement for Biased Node Classification [56.38828085943763]
各種グラフニューラルネットワーク(GNN)に適用可能な新しい因果性・独立性向上(CIE)フレームワークを提案する。
提案手法は,ノード表現レベルでの因果的特徴と突発的特徴を推定し,突発的相関の影響を緩和する。
我々のアプローチCIEは、GNNの性能を大幅に向上するだけでなく、最先端の debiased ノード分類法よりも優れています。
論文 参考訳(メタデータ) (2023-10-14T13:56:24Z) - A Federated Learning-based Industrial Health Prognostics for
Heterogeneous Edge Devices using Matched Feature Extraction [16.337207503536384]
本稿では,特徴類似性マッチングパラメータアグリゲーションアルゴリズムを用いたFL型健康予後モデルを提案する。
提案手法は, 健康状態推定と生活寿命推定において, 44.5%, 39.3%の精度向上を達成できることを示す。
論文 参考訳(メタデータ) (2023-05-13T07:20:31Z) - Data-IQ: Characterizing subgroups with heterogeneous outcomes in tabular
data [81.43750358586072]
本稿では,サンプルをサブグループに体系的に階層化するフレームワークであるData-IQを提案する。
実世界の4つの医療データセットに対するData-IQの利点を実験的に実証した。
論文 参考訳(メタデータ) (2022-10-24T08:57:55Z) - Robust self-healing prediction model for high dimensional data [0.685316573653194]
本研究は、ロバスト自己治癒(RSH)ハイブリッド予測モデルを提案する。
それは、データを捨てるのではなく、エラーや不整合を取り除くことによって、データ全体を活用することによって機能する。
提案手法は,既存のハイパフォーマンスモデルと比較し,解析を行った。
論文 参考訳(メタデータ) (2022-10-04T17:55:50Z) - BMD: A General Class-balanced Multicentric Dynamic Prototype Strategy
for Source-free Domain Adaptation [74.93176783541332]
Source-free Domain Adaptation (SFDA)は、トレーニング済みのソースモデルを、十分にラベル付けされたソースデータにアクセスすることなく、未ラベルのターゲットドメインに適応することを目的としている。
ソースデータの欠如を補うため、既存のほとんどのメソッドは、機能プロトタイプベースの擬似ラベル戦略を導入した。
SFDAタスクのための汎用クラスベース多中心動的プロトタイプ戦略を提案する。
論文 参考訳(メタデータ) (2022-04-06T13:23:02Z) - Dynamic Bayesian Approach for decision-making in Ego-Things [8.577234269009042]
本稿では,マルチセンサデータと特徴選択に基づく動的システムの異常検出手法を提案する。
成長型ニューラルガス(GNG)は、マルチセンサーデータを一連のノードにクラスタリングするために使用される。
本手法は状態推定と異常検出にマルコフジャンプ粒子フィルタ(MJPF)を用いる。
論文 参考訳(メタデータ) (2020-10-28T11:38:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。