論文の概要: ProtoGate: Prototype-based Neural Networks with Local Feature Selection
for Tabular Biomedical Data
- arxiv url: http://arxiv.org/abs/2306.12330v1
- Date: Wed, 21 Jun 2023 15:17:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-22 12:47:53.168927
- Title: ProtoGate: Prototype-based Neural Networks with Local Feature Selection
for Tabular Biomedical Data
- Title(参考訳): ProtoGate: Tabular Biomedical Dataのための局所特徴選択型プロトタイプベースニューラルネットワーク
- Authors: Xiangjian Jiang, Andrei Margeloiu, Nikola Simidjievski, Mateja Jamnik
- Abstract要約: 本稿では, サンプル間の均一性と不均一性を両立させることにより, 誘導バイアスを導入するプロトタイプベースニューラルモデルProtoGateを提案する。
この結果から,データ中の同種パターンと異種パターンを利用することで予測精度が向上し,プロトタイプによる解釈可能性の向上が期待できることがわかった。
- 参考スコア(独自算出の注目度): 7.923088041693465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tabular biomedical data poses challenges in machine learning because it is
often high-dimensional and typically low-sample-size. Previous research has
attempted to address these challenges via feature selection approaches, which
can lead to unstable performance on real-world data. This suggests that current
methods lack appropriate inductive biases that capture patterns common to
different samples. In this paper, we propose ProtoGate, a prototype-based
neural model that introduces an inductive bias by attending to both homogeneity
and heterogeneity across samples. ProtoGate selects features in a
global-to-local manner and leverages them to produce explainable predictions
via an interpretable prototype-based model. We conduct comprehensive
experiments to evaluate the performance of ProtoGate on synthetic and
real-world datasets. Our results show that exploiting the homogeneous and
heterogeneous patterns in the data can improve prediction accuracy while
prototypes imbue interpretability.
- Abstract(参考訳): タブラルバイオメディカルデータは、しばしば高次元で典型的には低サンプルサイズであるため、機械学習において課題となる。
これまでの研究は、実際のデータで不安定なパフォーマンスをもたらす可能性のある機能選択アプローチを通じて、これらの課題に対処しようと試みてきた。
これは、現在の手法には、異なるサンプルに共通するパターンをキャプチャする適切な帰納バイアスがないことを示唆している。
本稿では,サンプル間の均一性と不均一性を両立させて誘導バイアスを導入するプロトタイプベースニューラルモデルであるProtoGateを提案する。
ProtoGateはグローバルからローカルの方法で機能を選択し、解釈可能なプロトタイプベースのモデルを通じて説明可能な予測を生成する。
合成および実世界のデータセット上でのProtoGateの性能を評価するための総合的な実験を行う。
この結果から,データ中の同種パターンと異種パターンを利用することで予測精度を向上できることがわかった。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - Combining propensity score methods with variational autoencoders for
generating synthetic data in presence of latent sub-groups [0.0]
ヘテロジニティは、例えば、サブグループラベルによって示されるように知られ、あるいは未知であり、双曲性や歪みのような分布の性質にのみ反映されるかもしれない。
本研究では,変分オートエンコーダ(VAE)から合成データを取得する際に,このような異種性をどのように保存し,制御するかを検討する。
論文 参考訳(メタデータ) (2023-12-12T22:49:24Z) - Predictive Heterogeneity: Measures and Applications [26.85283526483783]
本稿では,モデルキャパシティと計算制約を考慮した表現可能な予測不均一性を提案する。
ほぼ正しい(PAC)境界を持つ有限データから確実に推定できることを示す。
実験的に、探索された異質性は、所得予測、収量予測、画像分類タスクにおけるサブ人口区分に関する洞察を提供する。
論文 参考訳(メタデータ) (2023-04-01T12:20:06Z) - Heterogeneous Datasets for Federated Survival Analysis Simulation [6.489759672413373]
本研究では、既存の非フェデレーションデータセットから再現可能な方法で開始することで、現実的な異種データセットを構築する新しい手法を提案する。
具体的には、ディリクレ分布に基づく2つの新しいデータセット分割アルゴリズムを提供し、各データサンプルを慎重に選択したクライアントに割り当てる。
提案手法の実装は,フェデレートされた環境をシミュレートしてサバイバル分析を行うことを推奨し,広く普及している。
論文 参考訳(メタデータ) (2023-01-28T11:37:07Z) - Learning Causal Representations of Single Cells via Sparse Mechanism
Shift Modeling [3.2435888122704037]
本稿では,各摂動を未知の,しかしスパースな,潜伏変数のサブセットを標的とした介入として扱う単一細胞遺伝子発現データの深部生成モデルを提案する。
これらの手法をシミュレーションした単一セルデータ上でベンチマークし、潜伏単位回復、因果的目標同定、領域外一般化における性能を評価する。
論文 参考訳(メタデータ) (2022-11-07T15:47:40Z) - Data-IQ: Characterizing subgroups with heterogeneous outcomes in tabular
data [81.43750358586072]
本稿では,サンプルをサブグループに体系的に階層化するフレームワークであるData-IQを提案する。
実世界の4つの医療データセットに対するData-IQの利点を実験的に実証した。
論文 参考訳(メタデータ) (2022-10-24T08:57:55Z) - Discovering Invariant Rationales for Graph Neural Networks [104.61908788639052]
グラフニューラルネットワーク(GNN)の固有の解釈可能性とは、入力グラフの特徴の小さなサブセットを見つけることである。
本稿では,本質的に解釈可能なGNNを構築するために,不変理性(DIR)を発見するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2022-01-30T16:43:40Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - A Causal Direction Test for Heterogeneous Populations [10.653162005300608]
ほとんどの因果モデルでは、単一の同質な集団を仮定するが、これは多くの応用において成り立たない仮定である。
等質性仮定に違反した場合、そのような仮定に基づいて開発された因果モデルが正しい因果方向を識別できないことを示す。
我々は,$k$-means型クラスタリングアルゴリズムを用いて,一般的な因果方向検定統計量の調整を提案する。
論文 参考訳(メタデータ) (2020-06-08T18:59:14Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。