論文の概要: Enforcing Predictive Invariance across Structured Biomedical Domains
- arxiv url: http://arxiv.org/abs/2006.03908v3
- Date: Wed, 7 Oct 2020 17:43:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 21:05:26.936809
- Title: Enforcing Predictive Invariance across Structured Biomedical Domains
- Title(参考訳): 構造化バイオメディカルドメイン間の予測的不変性の促進
- Authors: Wengong Jin, Regina Barzilay, Tommi Jaakkola
- Abstract要約: 本稿では,新しい後悔最小化(RGM)アルゴリズムと構造化環境に対する拡張を提案する。
RGMは、予測的後悔の観点から、同時最適条件を再キャストすることで、不変リスク最小化(IRM)から構築する。
分子特性予測,タンパク質のホモロジー,安定性予測,およびRGMが従来の最先端のベースラインを著しく上回っていることを示す。
- 参考スコア(独自算出の注目度): 38.637412590671865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many biochemical applications such as molecular property prediction require
models to generalize beyond their training domains (environments). Moreover,
natural environments in these tasks are structured, defined by complex
descriptors such as molecular scaffolds or protein families. Therefore, most
environments are either never seen during training, or contain only a single
training example. To address these challenges, we propose a new regret
minimization (RGM) algorithm and its extension for structured environments. RGM
builds from invariant risk minimization (IRM) by recasting simultaneous
optimality condition in terms of predictive regret, finding a representation
that enables the predictor to compete against an oracle with hindsight access
to held-out environments. The structured extension adaptively highlights
variation due to complex environments via specialized domain perturbations. We
evaluate our method on multiple applications: molecular property prediction,
protein homology and stability prediction and show that RGM significantly
outperforms previous state-of-the-art baselines.
- Abstract(参考訳): 分子特性予測のような多くの生化学的応用は、訓練領域(環境)を超えて一般化するモデルを必要とする。
さらに、これらのタスクの自然環境は、分子足場やタンパク質ファミリーのような複雑な記述子によって定義される。
したがって、ほとんどの環境はトレーニング中に見ることも、トレーニングの例だけを含むこともない。
これらの課題に対処するために、新しい後悔最小化(RGM)アルゴリズムと構造化環境の拡張を提案する。
rgmは、予測的な後悔という観点から同時最適条件を再キャストすることで、不変リスク最小化(invariant risk minimization, irm)から構築されている。
構造拡張は、特殊領域摂動による複雑な環境による変動を適応的に強調する。
本手法は, 分子特性予測, タンパク質ホモロジー, 安定性予測などの複数の応用で評価し, rgmが過去の最先端のベースラインを大きく上回ることを示した。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本研究では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデルを提案する。
このモデルは分子生物学の中心的なドグマに固執し、タンパク質のコード配列を正確に生成する。
また、特にプロモーター配列の即応的な生成を通じて、シーケンス最適化において大きな可能性を示している。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - Causality Pursuit from Heterogeneous Environments via Neural Adversarial Invariance Learning [12.947265104477237]
データから因果関係を抽出することは、科学的発見、治療介入、伝達学習における根本的な問題である。
本稿では,複数の環境における回帰モデルにおける非パラメトリック不変性と因果学習に対処するアルゴリズムを提案する。
提案したFocused Adrial Invariant Regularizationフレームワークは、逆検定により回帰モデルを予測不変解へ向ける革新的なミニマックス最適化手法を利用する。
論文 参考訳(メタデータ) (2024-05-07T23:37:40Z) - Continual Invariant Risk Minimization [46.051656238770086]
経験的リスク最小化は、学習モデルが不変な特徴表現をキャプチャしない場合、目に見えない環境での一般化の振る舞いを損なう可能性がある。
不変リスク最小化(IRM)は環境不変表現を発見するための最近の提案である。
論文 参考訳(メタデータ) (2023-10-21T11:44:47Z) - Iterative Feature Matching: Toward Provable Domain Generalization with
Logarithmic Environments [55.24895403089543]
ドメインの一般化は、限られた数のトレーニング環境からのデータで、目に見えないテスト環境でうまく機能することを目的としています。
我々は,O(logd_s)$環境のみを見た後に一般化する予測器を高確率で生成することを保証する反復的特徴マッチングに基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-18T04:39:19Z) - Robust Reconfigurable Intelligent Surfaces via Invariant Risk and Causal
Representations [55.50218493466906]
本稿では,データ分布の変化に伴うロバスト再構成可能なインテリジェントサーフェス(ris)システム設計の問題について検討する。
不変リスク最小化(IRM)の概念を用いて、複数の環境にまたがる不変因果表現を用いて、予測器が各環境に対して同時に最適となるようにする。
予測器を探すためにニューラルネットワークベースのソリューションを採用し、その性能は経験的リスク最小化に基づく設計に対するシミュレーションによって検証される。
論文 参考訳(メタデータ) (2021-05-04T21:36:31Z) - The Risks of Invariant Risk Minimization [52.7137956951533]
不変リスク最小化(Invariant Risk Minimization)は、データの深い不変性を学ぶという考え方に基づく目標である。
我々は、IRMの目的に基づく分類の最初の分析と、最近提案されたこれらの代替案について、かなり自然で一般的なモデルで分析する。
IRMは、テストデータがトレーニング分布と十分に類似していない限り、破滅的に失敗する可能性がある。
論文 参考訳(メタデータ) (2020-10-12T14:54:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。