論文の概要: Dynamic control of self-assembly of quasicrystalline structures through
reinforcement learning
- arxiv url: http://arxiv.org/abs/2309.06869v1
- Date: Wed, 13 Sep 2023 10:26:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-14 14:41:06.366342
- Title: Dynamic control of self-assembly of quasicrystalline structures through
reinforcement learning
- Title(参考訳): 強化学習による準結晶構造の自己組織化の動的制御
- Authors: Uyen Tu Lieu, Natsuhiko Yoshinaga
- Abstract要約: 本研究では, ドデカゴナル準結晶(DDQC)の動的自己集合を, パッチ粒子から制御するための強化学習を提案する。
我々はQ-ラーニング法で訓練された温度制御の最適方針を推定し、少ない欠陥でDDQCを生成できることを実証する。
補強学習は, 構造変動が世界規模で安定な状態を形成する可能性を高める臨界温度を自律的に発見することを発見した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose reinforcement learning to control the dynamical self-assembly of
the dodecagonal quasicrystal (DDQC) from patchy particles. The patchy particles
have anisotropic interactions with other particles and form DDQC. However,
their structures at steady states are significantly influenced by the kinetic
pathways of their structural formation. We estimate the best policy of
temperature control trained by the Q-learning method and demonstrate that we
can generate DDQC with few defects using the estimated policy. The temperature
schedule obtained by reinforcement learning can reproduce the desired structure
more efficiently than the conventional pre-fixed temperature schedule, such as
annealing. To clarify the success of the learning, we also analyse a simple
model describing the kinetics of structural changes through the motion in a
triple-well potential. We have found that reinforcement learning autonomously
discovers the critical temperature at which structural fluctuations enhance the
chance of forming a globally stable state. The estimated policy guides the
system toward the critical temperature to assist the formation of DDQC.
- Abstract(参考訳): 本研究では, ドデカゴナル準結晶(DDQC)の動的自己集合性を制御するための強化学習を提案する。
パッチ状粒子は他の粒子と異方性相互作用を持ち、DDQCを形成する。
しかし、定常状態におけるそれらの構造は、その構造形成の運動経路に大きく影響される。
q-learning法によって訓練された温度制御の最適方針を推定し、推定したポリシーを用いて、少ない欠陥でddqcを生成できることを実証する。
強化学習により得られた温度スケジュールは、焼鈍などの従来の固定温度スケジュールよりも効率的に所望の構造を再現することができる。
学習の成功を明らかにするために,トリプルウェルポテンシャルの運動による構造変化の速度論を記述した簡単なモデルも分析した。
強化学習は,構造ゆらぎがグローバルに安定な状態を形成する可能性を高める臨界温度を自律的に発見することを発見した。
推定ポリシは、DDQCの形成を支援するために、システムを臨界温度に導く。
関連論文リスト
- Instance Temperature Knowledge Distillation [15.095465128404161]
既存の学習方法は、学生ネットワークが様々な学習困難に適応できるように、動的に温度調整を行う。
本稿では,温度調整を逐次意思決定タスクとして定式化し,強化学習に基づく手法を提案する。
我々のフレームワークは、様々なKDメソッドに簡単に挿入できるプラグイン・アンド・プレイ技術として機能する。
論文 参考訳(メタデータ) (2024-06-27T14:00:05Z) - Dynamic Temperature Knowledge Distillation [9.6046915661065]
知識蒸留(KD)領域におけるラベルソフトネスの調整における温度の役割
従来のアプローチでは、KDプロセス全体を通して静的な温度を用いることが多い。
本研究では,教師モデルと学生モデルの両方に対して,動的かつ協調的な温度制御を同時に導入する動的温度知識蒸留(DTKD)を提案する。
論文 参考訳(メタデータ) (2024-04-19T08:40:52Z) - Temperature Balancing, Layer-wise Weight Analysis, and Neural Network
Training [58.20089993899729]
本稿では,直感的で効果的な階層学習手法であるTempBalanceを提案する。
我々は、TempBalanceが通常のSGDと注意深く調整されたスペクトルノルム正規化より著しく優れていることを示す。
また、TempBalanceは最先端のメトリクスやスケジューラよりも優れています。
論文 参考訳(メタデータ) (2023-12-01T05:38:17Z) - Learn from the Past: A Proxy Guided Adversarial Defense Framework with
Self Distillation Regularization [53.04697800214848]
敵対的訓練(AT)は、ディープラーニングモデルの堅牢性を固める上で重要な要素である。
AT方式は、目標モデルの防御のために直接反復的な更新を頼りにしており、不安定な訓練や破滅的なオーバーフィッティングといった障害に頻繁に遭遇する。
汎用プロキシガイド型防衛フレームワークLAST(bf Pbf astから学ぶ)を提案する。
論文 参考訳(メタデータ) (2023-10-19T13:13:41Z) - Crystal-GFN: sampling crystals with desirable properties and constraints [103.79058968784163]
本稿では,結晶構造の生成モデルであるCrystal-GFNを紹介する。
本稿では,MatBenchで学習した新しいプロキシ機械学習モデルにより予測された結晶構造の原子1個あたりの生成エネルギーを目的として利用する。
その結果、Crystal-GFNは低(中間-3.1 eV/原子)で生成エネルギーが予測される非常に多様な結晶をサンプリングできることが示された。
論文 参考訳(メタデータ) (2023-10-07T21:36:55Z) - Neural Extended Kalman Filters for Learning and Predicting Dynamics of
Structural Systems [5.252966797394752]
複雑な物理系の潜在進化力学を学習するための学習可能な拡張カルマンフィルタ(EKF)を提案する。
ニューラルEKFは従来のEKFの一般化版であり、プロセスダイナミクスと感覚観測のモデリングをニューラルネットワークでパラメータ化することができる。
ニューラルEKFが課す構造は学習プロセスに有益であることを示す。
論文 参考訳(メタデータ) (2022-10-09T04:39:15Z) - Correlating exciton coherence length, localization, and its optical
lineshape. I. a finite temperature solution of the Davydov soliton model [6.321935605877715]
分子励起子のラインシェイプを有限温度格子振動に接続する新しい手法を提案する。
エネルギーゆらぎと局所化の両方がパラメータフリーで還元された記述で記述できることがわかった。
論文 参考訳(メタデータ) (2022-03-10T19:51:02Z) - Adiabatic Sensing Technique for Optimal Temperature Estimation using
Trapped Ions [64.31011847952006]
捕捉イオンを用いた最適なフォノン温度推定のための断熱法を提案する。
フォノンの熱分布に関する関連する情報は、スピンの集合的な自由度に伝達することができる。
それぞれの熱状態確率は、各スピン励起構成に近似的にマッピングされることを示す。
論文 参考訳(メタデータ) (2020-12-16T12:58:08Z) - Training Generative Adversarial Networks by Solving Ordinary
Differential Equations [54.23691425062034]
GANトレーニングによって引き起こされる連続時間ダイナミクスについて検討する。
この観点から、GANのトレーニングにおける不安定性は積分誤差から生じると仮定する。
本研究では,有名なODEソルバ(Runge-Kutta など)がトレーニングを安定化できるかどうかを実験的に検証する。
論文 参考訳(メタデータ) (2020-10-28T15:23:49Z) - Data-driven control of micro-climate in buildings: an event-triggered
reinforcement learning approach [56.22460188003505]
半マルコフ決定過程に基づく微小気候制御問題を定式化する。
建物内の微小気候のイベントトリガー制御のための2つの学習アルゴリズムを提案する。
スマートなサーモスタットを設計することで,提案手法の有効性を示す。
論文 参考訳(メタデータ) (2020-01-28T18:20:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。