論文の概要: BaGGLS: A Bayesian Shrinkage Framework for Interpretable Modeling of Interactions in High-Dimensional Biological Data
- arxiv url: http://arxiv.org/abs/2511.15330v1
- Date: Wed, 19 Nov 2025 10:48:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.770499
- Title: BaGGLS: A Bayesian Shrinkage Framework for Interpretable Modeling of Interactions in High-Dimensional Biological Data
- Title(参考訳): BaGGLS:高次元生体データにおける相互作用の解釈モデリングのためのベイズ収縮フレームワーク
- Authors: Marta S. Lemanczyk, Lucas Kock, Johanna Schlimme, Nadja Klein, Bernhard Y. Renard,
- Abstract要約: BaGGLSは、機能相互作用を含む高次元の生物学的推論のための、柔軟で解釈可能な2次回帰モデルである。
BaGGLSは生物学的に関係のある相互作用パターンを明らかにするための有望な手法であり、計算生物学における様々な高次元タスクに適用可能であることを示す。
- 参考スコア(独自算出の注目度): 2.849014311160882
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Biological data sets are often high-dimensional, noisy, and governed by complex interactions among sparse signals. This poses major challenges for interpretability and reliable feature selection. Tasks such as identifying motif interactions in genomics exemplify these difficulties, as only a small subset of biologically relevant features (e.g., motifs) are typically active, and their effects are often non-linear and context-dependent. While statistical approaches often result in more interpretable models, deep learning models have proven effective in modeling complex interactions and prediction accuracy, yet their black-box nature limits interpretability. We introduce BaGGLS, a flexible and interpretable probabilistic binary regression model designed for high-dimensional biological inference involving feature interactions. BaGGLS incorporates a Bayesian group global-local shrinkage prior, aligned with the group structure introduced by interaction terms. This prior encourages sparsity while retaining interpretability, helping to isolate meaningful signals and suppress noise. To enable scalable inference, we employ a partially factorized variational approximation that captures posterior skewness and supports efficient learning even in large feature spaces. In extensive simulations, we can show that BaGGLS outperforms the other methods with regard to interaction detection and is many times faster than MCMC sampling under the horseshoe prior. We also demonstrate the usefulness of BaGGLS in the context of interaction discovery from motif scanner outputs and noisy attribution scores from deep learning models. This shows that BaGGLS is a promising approach for uncovering biologically relevant interaction patterns, with potential applicability across a range of high-dimensional tasks in computational biology.
- Abstract(参考訳): 生物学的データセットは、しばしば高次元でノイズがあり、スパース信号間の複雑な相互作用によって制御される。
これは、解釈可能性と信頼性の高い機能選択において大きな課題となる。
ゲノム学におけるモチーフ相互作用の同定のようなタスクは、生物学的に関係のある特徴(例えばモチーフ)のごく一部のサブセットが通常活発であり、その効果は非線形で文脈に依存しないことが多いため、これらの困難を実証している。
統計的アプローチはより解釈可能なモデルをもたらすことが多いが、深層学習モデルは複雑な相互作用と予測精度をモデル化するのに有効であるが、ブラックボックスの性質は解釈可能性を制限する。
本稿では,機能的相互作用を含む高次元の生物学的推論のために設計された,柔軟で解釈可能な2値回帰モデルBaGGLSを紹介する。
BaGGLSは、相互作用項によって導入された群構造と整合して、ベイズ群グローバル局所収縮を前もって組み込む。
この前者は、解釈可能性を維持しながら疎結合を奨励し、意味のある信号を分離し、ノイズを抑えるのに役立つ。
スケーラブルな推論を実現するために,後方歪を捕捉し,大きな特徴空間においても効率的な学習を支援する部分分解型変分近似を用いる。
広範囲なシミュレーションでは、BaGGLSは相互作用検出において他の手法よりも優れており、以前の馬靴下でのMCMCサンプリングよりも何倍も高速であることを示すことができる。
また、モチーフスキャナー出力とディープラーニングモデルからの雑音帰属スコアからの相互作用発見の文脈におけるBaGGLSの有用性を示す。
このことは、BaGGLSが生物学的に関連する相互作用パターンを明らかにするための有望なアプローチであり、計算生物学における様々な高次元タスクに適用可能であることを示している。
関連論文リスト
- Information-theoretic Quantification of High-order Feature Effects in Classification Problems [0.19791587637442676]
特徴重要度(Hi-Fi)法における高次相互作用の情報理論拡張について述べる。
私たちのフレームワークは、機能のコントリビューションをユニークでシナジスティックで冗長なコンポーネントに分解します。
その結果,提案した推定器は理論的および予測された結果を正確に復元することがわかった。
論文 参考訳(メタデータ) (2025-07-06T11:50:30Z) - Bayesian Hybrid Machine Learning of Gallstone Risk [0.0]
ギャルストーン病(Gallstone disease)は、世界的な健康上の重荷を負う複雑な多因子疾患である。
本稿では,ロバストな変数選択と高度な相互作用検出を統合したハイブリッド機械学習フレームワークを提案する。
この枠組みは, 予測を向上するだけでなく, 医療研究や意思決定に有用な支援ツールとして, 実用的な洞察も得られる。
論文 参考訳(メタデータ) (2025-06-17T14:19:02Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Causal Representation Learning from Multimodal Biomedical Observations [57.00712157758845]
バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。
主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - Latent Variable Sequence Identification for Cognitive Models with Neural Network Estimators [7.7227297059345466]
本稿では,ニューラルベイズ推定を拡張して,実験データと対象変数空間との直接マッピングを学習する手法を提案する。
我々の研究は、リカレントニューラルネットワークとシミュレーションベースの推論を組み合わせることで、潜在変数配列を特定することで、研究者がより広範な認知モデルにアクセスできるようになることを強調している。
論文 参考訳(メタデータ) (2024-06-20T21:13:39Z) - Cognitive Evolutionary Learning to Select Feature Interactions for Recommender Systems [59.117526206317116]
Cellはさまざまなタスクやデータに対して,さまざまなモデルに適応的に進化可能であることを示す。
4つの実世界のデータセットの実験では、細胞は最先端のベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2024-05-29T02:35:23Z) - MoReL: Multi-omics Relational Learning [26.484803417186384]
ヘテロジニアスビューの分子間相互作用をコードする多部グラフを効率的に推定する新しいディープベイズ生成モデルを提案する。
このようなディープベイズ生成モデルにおける最適輸送正則化により、ビュー固有側情報を組み込むだけでなく、分布ベース正則化によるモデルの柔軟性も向上する。
論文 参考訳(メタデータ) (2022-03-15T02:50:07Z) - Towards Interaction Detection Using Topological Analysis on Neural
Networks [55.74562391439507]
ニューラルネットワークでは、あらゆる相互作用する特徴は共通の隠蔽ユニットとの強い重み付けの接続に従う必要がある。
本稿では, 永続的ホモロジーの理論に基づいて, 相互作用強度を定量化するための新しい尺度を提案する。
PID(Persistence Interaction Detection)アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-10-25T02:15:24Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。