論文の概要: Enforcing Predictive Invariance across Structured Biomedical Domains
- arxiv url: http://arxiv.org/abs/2006.03908v3
- Date: Wed, 7 Oct 2020 17:43:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 21:05:26.936809
- Title: Enforcing Predictive Invariance across Structured Biomedical Domains
- Title(参考訳): 構造化バイオメディカルドメイン間の予測的不変性の促進
- Authors: Wengong Jin, Regina Barzilay, Tommi Jaakkola
- Abstract要約: 本稿では,新しい後悔最小化(RGM)アルゴリズムと構造化環境に対する拡張を提案する。
RGMは、予測的後悔の観点から、同時最適条件を再キャストすることで、不変リスク最小化(IRM)から構築する。
分子特性予測,タンパク質のホモロジー,安定性予測,およびRGMが従来の最先端のベースラインを著しく上回っていることを示す。
- 参考スコア(独自算出の注目度): 38.637412590671865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many biochemical applications such as molecular property prediction require
models to generalize beyond their training domains (environments). Moreover,
natural environments in these tasks are structured, defined by complex
descriptors such as molecular scaffolds or protein families. Therefore, most
environments are either never seen during training, or contain only a single
training example. To address these challenges, we propose a new regret
minimization (RGM) algorithm and its extension for structured environments. RGM
builds from invariant risk minimization (IRM) by recasting simultaneous
optimality condition in terms of predictive regret, finding a representation
that enables the predictor to compete against an oracle with hindsight access
to held-out environments. The structured extension adaptively highlights
variation due to complex environments via specialized domain perturbations. We
evaluate our method on multiple applications: molecular property prediction,
protein homology and stability prediction and show that RGM significantly
outperforms previous state-of-the-art baselines.
- Abstract(参考訳): 分子特性予測のような多くの生化学的応用は、訓練領域(環境)を超えて一般化するモデルを必要とする。
さらに、これらのタスクの自然環境は、分子足場やタンパク質ファミリーのような複雑な記述子によって定義される。
したがって、ほとんどの環境はトレーニング中に見ることも、トレーニングの例だけを含むこともない。
これらの課題に対処するために、新しい後悔最小化(RGM)アルゴリズムと構造化環境の拡張を提案する。
rgmは、予測的な後悔という観点から同時最適条件を再キャストすることで、不変リスク最小化(invariant risk minimization, irm)から構築されている。
構造拡張は、特殊領域摂動による複雑な環境による変動を適応的に強調する。
本手法は, 分子特性予測, タンパク質ホモロジー, 安定性予測などの複数の応用で評価し, rgmが過去の最先端のベースラインを大きく上回ることを示した。
関連論文リスト
- Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - Causality Pursuit from Heterogeneous Environments via Neural Adversarial Invariance Learning [12.947265104477237]
データから因果関係を抽出することは、科学的発見、治療介入、伝達学習における根本的な問題である。
Focused Adversial Invariant Regularization (FAIR) フレームワークは、革新的なミニマックス最適化アプローチを採用している。
FAIR-NNは最小の識別条件下で不変変数と準因果変数を見つけることができる。
論文 参考訳(メタデータ) (2024-05-07T23:37:40Z) - Continual Invariant Risk Minimization [46.051656238770086]
経験的リスク最小化は、学習モデルが不変な特徴表現をキャプチャしない場合、目に見えない環境での一般化の振る舞いを損なう可能性がある。
不変リスク最小化(IRM)は環境不変表現を発見するための最近の提案である。
論文 参考訳(メタデータ) (2023-10-21T11:44:47Z) - Iterative Feature Matching: Toward Provable Domain Generalization with
Logarithmic Environments [55.24895403089543]
ドメインの一般化は、限られた数のトレーニング環境からのデータで、目に見えないテスト環境でうまく機能することを目的としています。
我々は,O(logd_s)$環境のみを見た後に一般化する予測器を高確率で生成することを保証する反復的特徴マッチングに基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-18T04:39:19Z) - Robust Reconfigurable Intelligent Surfaces via Invariant Risk and Causal
Representations [55.50218493466906]
本稿では,データ分布の変化に伴うロバスト再構成可能なインテリジェントサーフェス(ris)システム設計の問題について検討する。
不変リスク最小化(IRM)の概念を用いて、複数の環境にまたがる不変因果表現を用いて、予測器が各環境に対して同時に最適となるようにする。
予測器を探すためにニューラルネットワークベースのソリューションを採用し、その性能は経験的リスク最小化に基づく設計に対するシミュレーションによって検証される。
論文 参考訳(メタデータ) (2021-05-04T21:36:31Z) - The Risks of Invariant Risk Minimization [52.7137956951533]
不変リスク最小化(Invariant Risk Minimization)は、データの深い不変性を学ぶという考え方に基づく目標である。
我々は、IRMの目的に基づく分類の最初の分析と、最近提案されたこれらの代替案について、かなり自然で一般的なモデルで分析する。
IRMは、テストデータがトレーニング分布と十分に類似していない限り、破滅的に失敗する可能性がある。
論文 参考訳(メタデータ) (2020-10-12T14:54:32Z) - Invariant Causal Prediction for Block MDPs [106.63346115341862]
環境全体にわたる一般化は、実世界の課題への強化学習アルゴリズムの適用の成功に不可欠である。
本稿では,多環境環境における新しい観測を一般化するモデル不適合状態抽象化(MISA)を学習するための不変予測法を提案する。
論文 参考訳(メタデータ) (2020-03-12T21:03:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。