論文の概要: Is novelty predictable?
- arxiv url: http://arxiv.org/abs/2306.00872v1
- Date: Thu, 1 Jun 2023 16:32:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 14:37:54.178054
- Title: Is novelty predictable?
- Title(参考訳): 新規性は予測可能であるか?
- Authors: Clara Fannjiang and Jennifer Listgarten
- Abstract要約: 機械学習に基づくデザインは科学で注目を集めている。
特に、新規なプロパティ値を持つタンパク質の設計に焦点をあてる。
私たちの議論の多くは、マシンラーニングベースの設計をより広範囲に扱います。
- 参考スコア(独自算出の注目度): 8.22379888383833
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning-based design has gained traction in the sciences, most
notably in the design of small molecules, materials, and proteins, with
societal implications spanning drug development and manufacturing, plastic
degradation, and carbon sequestration. When designing objects to achieve novel
property values with machine learning, one faces a fundamental challenge: how
to push past the frontier of current knowledge, distilled from the training
data into the model, in a manner that rationally controls the risk of failure.
If one trusts learned models too much in extrapolation, one is likely to design
rubbish. In contrast, if one does not extrapolate, one cannot find novelty.
Herein, we ponder how one might strike a useful balance between these two
extremes. We focus in particular on designing proteins with novel property
values, although much of our discussion addresses machine learning-based design
more broadly.
- Abstract(参考訳): 機械学習に基づく設計は、特に小さな分子、材料、タンパク質の設計において、薬の開発と製造、プラスチックの分解、炭素の隔離といった社会的な意味合いを持つ、科学の牽引力を得てきた。
マシンラーニングで新しい特性値を達成するためにオブジェクトを設計する場合、現在の知識のフロンティアをいかに越えるか、トレーニングデータからモデルに蒸留するか、障害のリスクを合理的に制御する方法、という根本的な課題に直面する。
学習したモデルを外挿で過大に信頼しているなら、ゴミをデザインする可能性が高い。
対照的に、外挿がなければ、新しいものを見つけることはできない。
ここでは、この2つの極端の間でどのように有用なバランスをとるかを考えます。
特に、新しい特性値を持つタンパク質を設計することに重点を置いていますが、多くの議論は機械学習ベースの設計をより広く取り上げています。
関連論文リスト
- Brain-Inspired Computational Intelligence via Predictive Coding [89.6335791546526]
予測符号化(PC)は、マシンインテリジェンスタスクにおいて有望なパフォーマンスを示している。
PCは様々な脳領域で情報処理をモデル化することができ、認知制御やロボティクスで使用することができる。
論文 参考訳(メタデータ) (2023-08-15T16:37:16Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Hybrid Quantum Generative Adversarial Networks for Molecular Simulation
and Drug Discovery [13.544339314714902]
現在の古典的な計算力は、小さな分子以上をシミュレートするには不十分である。
毎年数十億ドルが研究に費やされている。
グラフ構造化データの深い生成モデルは、化学合成の問題に新たな視点を与えてくれる。
論文 参考訳(メタデータ) (2022-12-15T13:36:35Z) - Encrypted machine learning of molecular quantum properties [0.0]
予測過程の暗号化は、二重盲検モデル評価によってこの問題を解決することができる。
セキュアで計算可能な暗号化機械学習モデルを実装している。
カーネルリッジ回帰モデルを用いた暗号化予測は、暗号化なしでは100万倍のコストがかかることがわかった。
論文 参考訳(メタデータ) (2022-12-05T11:04:08Z) - Synthetic Model Combination: An Instance-wise Approach to Unsupervised
Ensemble Learning [92.89846887298852]
ラベル付きデータのトレーニングセットから学ぶ機会のない、新しいテストデータに対する予測を検討する。
専門家モデルのセットと予測へのアクセスと、トレーニングに使用するデータセットに関する制限された情報を提供すること。
論文 参考訳(メタデータ) (2022-10-11T10:20:31Z) - Learnware: Small Models Do Big [69.88234743773113]
自然言語処理やコンピュータビジョンの応用で目覚ましい成果を上げてきた、一般的なビッグモデルパラダイムは、これらの問題にまだ対応していないが、炭素排出量の深刻な源となっている。
この記事では、マシンラーニングモデルをスクラッチから構築する必要がないようにするための学習ソフトウェアパラダイムの概要を紹介します。
論文 参考訳(メタデータ) (2022-10-07T15:55:52Z) - When is Memorization of Irrelevant Training Data Necessary for
High-Accuracy Learning? [53.523017945443115]
我々は,十分な精度のトレーニングアルゴリズムが,予測モデルにおいて,そのトレーニング例の大規模サブセットに関する情報を本質的にすべてエンコードしなければならない自然予測問題を記述する。
私たちの結果は、トレーニングアルゴリズムや学習に使用されるモデルのクラスに依存しません。
論文 参考訳(メタデータ) (2020-12-11T15:25:14Z) - The Rise of AI-Driven Simulators: Building a New Crystal Ball [6.289422225292999]
米国と国際的な繁栄、安全保障、健康は、シミュレーション能力の継続的な改善に大きく依存している。
過去10年は相補的な分野に著しい進歩をもたらした。
本稿では,結束的,多学際的,応用に触発された研究課題の一部として,我々が構想するテーマについて述べる。
論文 参考訳(メタデータ) (2020-12-11T00:13:40Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Autofocused oracles for model-based design [8.22379888383833]
非ゼロサムゲームとしてデータ駆動設計問題を定式化する。
設計アルゴリズムが進むにつれて回帰モデルを再訓練するための原則的戦略を開発する。
論文 参考訳(メタデータ) (2020-06-14T23:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。