論文の概要: Predicting Nanorobot Shapes via Generative Models
- arxiv url: http://arxiv.org/abs/2101.12719v1
- Date: Fri, 29 Jan 2021 18:29:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-01 13:40:12.580515
- Title: Predicting Nanorobot Shapes via Generative Models
- Title(参考訳): 生成モデルによるナノロボット形状の予測
- Authors: Emma Benjaminson (1), Rebecca E. Taylor (1,2,3), Matthew Travers (4)
((1) Mechanical Engineering, Carnegie Mellon University, Pittsburgh, PA, (2)
Biomedical Engineering, Carnegie Mellon University, Pittsburgh, PA, (3)
Electrical and Computer Engineering, Carnegie Mellon University, Pittsburgh
PA, (4) Robotics Institute, Carnegie Mellon University, Pittsburgh, PA)
- Abstract要約: 予測モデルのトレーニングは通常、大きなデータセットを必要とする。
この研究は、2段階のプロセスを用いて生成モデルをトレーニングするために、低忠実度と高忠実度のデータを組み合わせている。
我々はまだナノロボットの高忠実度データセットを蓄積していない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The field of DNA nanotechnology has made it possible to assemble, with high
yields, different structures that have actionable properties. For example,
researchers have created components that can be actuated. An exciting next step
is to combine these components into multifunctional nanorobots that could,
potentially, perform complex tasks like swimming to a target location in the
human body, detect an adverse reaction and then release a drug load to stop it.
However, as we start to assemble more complex nanorobots, the yield of the
desired nanorobot begins to decrease as the number of possible component
combinations increases. Therefore, the ultimate goal of this work is to develop
a predictive model to maximize yield. However, training predictive models
typically requires a large dataset. For the nanorobots we are interested in
assembling, this will be difficult to collect. This is because high-fidelity
data, which allows us to characterize the shape and size of individual
structures, is very time-consuming to collect, whereas low-fidelity data is
readily available but only captures bulk statistics for different processes.
Therefore, this work combines low- and high-fidelity data to train a generative
model using a two-step process. We first use a relatively small, high-fidelity
dataset to train a generative model. At run time, the model takes low-fidelity
data and uses it to approximate the high-fidelity content. We do this by
biasing the model towards samples with specific properties as measured by
low-fidelity data. In this work we bias our distribution towards a desired node
degree of a graphical model that we take as a surrogate representation of the
nanorobots that this work will ultimately focus on. We have not yet accumulated
a high-fidelity dataset of nanorobots, so we leverage the MolGAN architecture
[1] and the QM9 small molecule dataset [2-3] to demonstrate our approach.
- Abstract(参考訳): dnaナノテクノロジーの分野は、高い収率で、作用可能な特性を持つ異なる構造を組み立てることを可能にした。
例えば、研究者はアクティベート可能なコンポーネントを作成しました。
刺激的な次のステップは、これらのコンポーネントを多機能ナノロボットに組み合わせ、人体のターゲット場所に泳ぐなどの複雑なタスクを実行し、有害反応を検出し、その後、薬物負荷を解放して停止させることです。
しかし、より複雑なナノロボットを組み立て始めると、望まれるナノロボットの収量は、コンポーネントの組み合わせの数が増えるにつれて減少し始める。
したがって、この研究の最終的な目標は、収率を最大化する予測モデルを開発することである。
しかし、予測モデルのトレーニングは通常、大きなデータセットを必要とする。
私たちが組み立てに興味があるナノロボットにとって、これは収集が難しいでしょう。
これは、個々の構造の形状と大きさを特徴付ける高忠実度データが収集に非常に時間がかかるのに対して、低忠実度データは容易に入手できるが、異なるプロセスのバルク統計しか取得できないためである。
そこで本研究では,低忠実度データと高忠実度データを組み合わせて,二段階プロセスを用いて生成モデルを訓練する。
まず、比較的小さな高忠実度データセットを使用して、生成モデルをトレーニングします。
実行時、モデルは低忠実度データを取り込み、高忠実度コンテンツの近似に使用する。
低忠実度データで測定した特定の特性のサンプルに対してモデルに偏りを与えることでこれを行う。
この研究では、我々は最終的にこの研究が焦点を合わせるナノロボットの代理表現として取るグラフィカルモデルの所望のノード程度に私たちの分布をバイアスします。
我々はまだナノロボットの忠実度の高いデータセットを蓄積していないので、molgan architecture [1] と qm9 small molecule dataset [2-3] を利用してアプローチを実証している。
関連論文リスト
- Quantum Generative Modeling of Sequential Data with Trainable Token
Embedding [0.0]
ボルンマシンとして知られる量子インスパイアされた生成モデルは、古典的および量子的データの学習において大きな進歩を見せている。
本稿では,MPSを同時に使用可能なトレーニング可能な量子計測演算子への埋め込み法を一般化する。
私たちの研究は、トレーニング可能な埋め込みと組み合わせることで、Bornマシンはより良いパフォーマンスを示し、データセットからより深い相関関係を学習できることを示した。
論文 参考訳(メタデータ) (2023-11-08T22:56:37Z) - Let's Synthesize Step by Step: Iterative Dataset Synthesis with Large
Language Models by Extrapolating Errors from Small Models [69.76066070227452]
※データ合成*はラベル付きデータの少ない小さなモデルをトレーニングするための有望な方法です。
本稿では,この分散ギャップを縮めるデータ合成フレームワークであるStep* (**S3**) による合成ステップを提案する。
提案手法は,合成データセットと実データとのギャップを小さくすることで,小型モデルの性能を向上させる。
論文 参考訳(メタデータ) (2023-10-20T17:14:25Z) - Synthetic data enable experiments in atomistic machine learning [0.0]
既存のMLポテンシャルモデルから,原子単位のエネルギーをラベル付けした大規模データセットの使用を実演する。
このプロセスの安価さは、量子力学の土台真実に比べれば、数百万のデータポイントを生成できる。
合成データラベルの学習は、後続の小さなデータセットの微調整に有用な事前学習タスクであることを示す。
論文 参考訳(メタデータ) (2022-11-29T18:17:24Z) - Ensemble Machine Learning Model Trained on a New Synthesized Dataset
Generalizes Well for Stress Prediction Using Wearable Devices [3.006016887654771]
本研究では,少数の被験者を含むデータセット上に構築されたモデルの一般化能力について検討した。
本研究では,新たな未知のデータに対する予測パワーを測定するために,勾配押し上げと人工ニューラルネットワークを組み合わせたアンサンブル手法を提案する。
論文 参考訳(メタデータ) (2022-09-30T00:20:57Z) - HyperTransformer: Model Generation for Supervised and Semi-Supervised
Few-Shot Learning [14.412066456583917]
本稿では,支援サンプルから直接畳み込みニューラルネットワーク(CNN)の重みを生成する,少数ショット学習のためのトランスフォーマーベースモデルを提案する。
本手法は,タスク非依存の定型埋め込みの学習が最適でない小ターゲットCNNアーキテクチャにおいて,特に有効である。
提案手法は,サポートセット内のラベルなしサンプルを利用した半教師付きシステムに拡張され,さらにショット性能が向上する。
論文 参考訳(メタデータ) (2022-01-11T20:15:35Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - Contrastive Model Inversion for Data-Free Knowledge Distillation [60.08025054715192]
そこで、データ多様性を最適化可能な目的として明示的にモデル化するContrastive Model Inversionを提案します。
我々の主な観察では、同じ量のデータの制約の下では、高いデータの多様性は、通常より強いインスタンス識別を示す。
CIFAR-10, CIFAR-100, Tiny-ImageNetを用いた実験により, 生成したデータを知識蒸留に使用する場合, CMIは極めて優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-05-18T15:13:00Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Fast, Accurate, and Simple Models for Tabular Data via Augmented
Distillation [97.42894942391575]
本研究では、FAST-DADを用いて、任意の複雑なアンサンブル予測を、高木、無作為林、深層ネットワークなどの個々のモデルに抽出する。
我々の個々の蒸留モデルは、H2O/AutoSklearnのようなAutoMLツールが生成するアンサンブル予測よりも10倍高速で精度が高い。
論文 参考訳(メタデータ) (2020-06-25T09:57:47Z) - Convolutional Tensor-Train LSTM for Spatio-temporal Learning [116.24172387469994]
本稿では,ビデオシーケンスの長期相関を効率的に学習できる高次LSTMモデルを提案する。
これは、時間をかけて畳み込み特徴を組み合わせることによって予測を行う、新しいテンソルトレインモジュールによって達成される。
この結果は,幅広いアプリケーションやデータセットにおいて,最先端のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-02-21T05:00:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。