論文の概要: Split Modeling for High-Dimensional Logistic Regression
- arxiv url: http://arxiv.org/abs/2102.08591v1
- Date: Wed, 17 Feb 2021 05:57:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-18 14:33:14.715827
- Title: Split Modeling for High-Dimensional Logistic Regression
- Title(参考訳): 高次元ロジスティック回帰のための分割モデル
- Authors: Anthony-Alexander Christidis, Stefan Van Aelst, Ruben Zamar
- Abstract要約: 短時間コンパイルしたアンサンブルロジスティック分類モデルに対して,新しい手法を提案する。
本手法は,予測精度に優れたバイアスオフの活用法を学習する。
提案手法を実装したオープンソースソフトウェアライブラリを議論する。
- 参考スコア(独自算出の注目度): 0.2676349883103404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A novel method is proposed to learn an ensemble of logistic classification
models in the context of high-dimensional binary classification. The models in
the ensemble are built simultaneously by optimizing a multi-convex objective
function. To enforce diversity between the models the objective function
penalizes overlap between the models in the ensemble. We study the bias and
variance of the individual models as well as their correlation and discuss how
our method learns the ensemble by exploiting the accuracy-diversity trade-off
for ensemble models. In contrast to other ensembling approaches, the resulting
ensemble model is fully interpretable as a logistic regression model and at the
same time yields excellent prediction accuracy as demonstrated in an extensive
simulation study and gene expression data applications. An open-source compiled
software library implementing the proposed method is briefly discussed.
- Abstract(参考訳): 高次元二項分類の文脈において,ロジスティック分類モデルのアンサンブルを学習するための新しい手法を提案する。
アンサンブルのモデルは、マルチ凸目的関数を最適化することにより同時に構築される。
モデル間の多様性を強制するために、目的関数はアンサンブル内のモデル間の重複を罰する。
本研究では,個々のモデルのバイアスとばらつきと相関性について検討し,アンサンブルモデルの精度と多様性のトレードオフを利用してアンサンブルを学習する方法について議論する。
他のセンシングアプローチとは対照的に、結果として得られるアンサンブルモデルはロジスティック回帰モデルとして完全に解釈可能であると同時に、広範なシミュレーション研究や遺伝子発現データ応用で示されるような優れた予測精度をもたらす。
提案手法を実装したオープンソースコンパイルソフトウェアライブラリについて概説する。
関連論文リスト
- Stacked ensemble\-based mutagenicity prediction model using multiple modalities with graph attention network [0.9736758288065405]
変異原性は、様々なネガティブな結果をもたらす遺伝子変異と関連しているため、懸念される。
本研究では,新しいアンサンブルに基づく変異原性予測モデルを提案する。
論文 参考訳(メタデータ) (2024-09-03T09:14:21Z) - Simplicity within biological complexity [0.0]
文献を調査し、マルチスケール分子ネットワークデータの埋め込みのための包括的フレームワークの開発について論じる。
ネットワーク埋め込み手法はノードを低次元空間の点にマッピングすることにより、学習空間の近接性はネットワークのトポロジ-関数関係を反映する。
本稿では,モデルから効率的かつスケーラブルなソフトウェア実装に至るまで,マルチオミックネットワークデータのための汎用的な包括的埋め込みフレームワークを開発することを提案する。
論文 参考訳(メタデータ) (2024-05-15T13:32:45Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Embracing assay heterogeneity with neural processes for markedly
improved bioactivity predictions [0.276240219662896]
リガンドの生物活性を予測することは、コンピュータ支援薬物発見において最も困難かつ最も重要な課題の1つである。
長年のデータ収集とキュレーションの努力にもかかわらず、生物活性データは希少で不均一である。
異種アッセイ間の情報シナジーを利用した階層型メタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-17T16:26:58Z) - Functional Integrative Bayesian Analysis of High-dimensional
Multiplatform Genomic Data [0.8029049649310213]
我々は高次元多プラットフォームゲノミクスデータ(fiBAG)の関数積分ベイズ解析というフレームワークを提案する。
fiBAGは、プロテオゲノムバイオマーカーの上流での機能的証拠の同時同定を可能にする。
本研究は,14種類のがんのパン・カンサー解析を用いて,fiBAGの収益性を示す。
論文 参考訳(メタデータ) (2022-12-29T03:31:45Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。