論文の概要: Deep Reinforcement Learning Methods for Structure-Guided Processing Path
Optimization
- arxiv url: http://arxiv.org/abs/2009.09706v4
- Date: Wed, 7 Jul 2021 23:00:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 03:56:20.643466
- Title: Deep Reinforcement Learning Methods for Structure-Guided Processing Path
Optimization
- Title(参考訳): 構造誘導処理経路最適化のための深層強化学習法
- Authors: Johannes Dornheim, Lukas Morand, Samuel Zeitvogel, Tarek Iraki,
Norbert Link, Dirk Helm
- Abstract要約: 材料設計の大きな目標は、望ましい特性を持つ材料構造を見つけることである。
本稿では,処理経路最適化のための深層強化学習手法を提案する。
- 参考スコア(独自算出の注目度): 2.462953128215088
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A major goal of materials design is to find material structures with desired
properties and in a second step to find a processing path to reach one of these
structures. In this paper, we propose and investigate a deep reinforcement
learning approach for the optimization of processing paths. The goal is to find
optimal processing paths in the material structure space that lead to
target-structures, which have been identified beforehand to result in desired
material properties. There exists a target set containing one or multiple
different structures. Our proposed methods can find an optimal path from a
start structure to a single target structure, or optimize the processing paths
to one of the equivalent target-structures in the set. In the latter case, the
algorithm learns during processing to simultaneously identify the best
reachable target structure and the optimal path to it. The proposed methods
belong to the family of model-free deep reinforcement learning algorithms. They
are guided by structure representations as features of the process state and by
a reward signal, which is formulated based on a distance function in the
structure space. Model-free reinforcement learning algorithms learn through
trial and error while interacting with the process. Thereby, they are not
restricted to information from a priori sampled processing data and are able to
adapt to the specific process. The optimization itself is model-free and does
not require any prior knowledge about the process itself. We instantiate and
evaluate the proposed methods by optimizing paths of a generic metal forming
process. We show the ability of both methods to find processing paths leading
close to target structures and the ability of the extended method to identify
target-structures that can be reached effectively and efficiently and to focus
on these targets for sample efficient processing path optimization.
- Abstract(参考訳): 材料設計の主な目標は、所望の特性を持つ材料構造を見つけ、その1つに到達するための処理経路を見つけるための第2のステップである。
本稿では,処理経路の最適化のための深層強化学習手法を提案し,検討する。
目標は、ターゲット構造につながる材料構造空間における最適な処理経路を見つけることである。
1つまたは複数の異なる構造を含むターゲットセットが存在する。
提案手法では,スタート構造から単一ターゲット構造への最適経路の探索や,その集合内の等価なターゲット構造への処理経路の最適化が可能である。
後者の場合、アルゴリズムは処理中に学習し、最適な到達可能なターゲット構造とそれへの最適な経路を同時に識別する。
提案手法はモデルのない深層強化学習アルゴリズムのファミリーに属する。
それらは、プロセス状態の特徴としての構造表現と、構造空間における距離関数に基づいて定式化された報酬信号によって導かれる。
モデルフリー強化学習アルゴリズムは、プロセスと対話しながら試行錯誤を通じて学習する。
これにより、事前のサンプル処理データからの情報に制限されず、特定のプロセスに適応することができる。
最適化自体はモデルフリーであり、プロセス自体に関する事前の知識は必要ない。
汎用金属成形プロセスの経路を最適化することにより,提案手法のインスタンス化と評価を行う。
提案手法は,ターゲット構造に接近する処理経路を探索する能力と,効果的かつ効率的に到達可能なターゲット構造を識別する拡張手法の能力を示し,サンプル効率的な処理経路最適化のためのターゲットに着目した。
関連論文リスト
- The Algorithm Configuration Problem [0.8075866265341176]
本稿では、決定/最適化問題の特定事例を解決するためのパラメータ化アルゴリズムの最適化に焦点を当てる。
本稿では,アルゴリズム構成問題の定式化だけでなく,その解決のための様々なアプローチを概説する包括的フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-01T17:29:34Z) - Unleashing the Potential of Large Language Models as Prompt Optimizers: An Analogical Analysis with Gradient-based Model Optimizers [108.72225067368592]
本稿では,大規模言語モデル(LLM)に基づくプロンプトの設計について検討する。
モデルパラメータ学習における2つの重要な要素を同定する。
特に、勾配に基づく最適化から理論的な枠組みや学習手法を借用し、改良された戦略を設計する。
論文 参考訳(メタデータ) (2024-02-27T15:05:32Z) - Towards Optimal Feature-Shaping Methods for Out-of-Distribution
Detection [36.316424348556154]
特徴整形(英: Feature shaping)とは、オフ・オブ・ディストリビューション(OOD)検出のための最先端性能を示す手法の一群である。
簡単な一方向の定形化機能を持つフレームワークの具体的な削減を提案する。
提案手法は,OOD検出の多種多様なデータセットに対する一般化能力を向上することを示す。
論文 参考訳(メタデータ) (2024-02-01T18:59:22Z) - Efficient Non-Parametric Optimizer Search for Diverse Tasks [93.64739408827604]
興味のあるタスクを直接検索できる,スケーラブルで汎用的なフレームワークを初めて提示する。
基礎となる数学表現の自然木構造に着想を得て、空間を超木に再配置する。
我々は,モンテカルロ法を木探索に適用し,レジェクションサンプリングと等価形状検出を備える。
論文 参考訳(メタデータ) (2022-09-27T17:51:31Z) - Object Representations as Fixed Points: Training Iterative Refinement
Algorithms with Implicit Differentiation [88.14365009076907]
反復的洗練は表現学習に有用なパラダイムである。
トレーニングの安定性とトラクタビリティを向上させる暗黙の差別化アプローチを開発する。
論文 参考訳(メタデータ) (2022-07-02T10:00:35Z) - A multi-task learning-based optimization approach for finding diverse
sets of material microstructures with desired properties and its application
to texture optimization [1.6311150636417262]
本稿では,材料テクスチャ最適化のためのマルチタスク学習手法を提案する。
このアプローチは、マルチタスク学習とシアムネットワークを組み合わせた機械学習モデルと相互作用する最適化アルゴリズムで構成されている。
論文 参考訳(メタデータ) (2021-10-27T08:25:26Z) - Parameter Tuning Strategies for Metaheuristic Methods Applied to
Discrete Optimization of Structural Design [0.0]
本稿では, 鉄筋コンクリート(RC)構造物の設計最適化のためのメタヒューリスティック手法のパラメータを調整するためのいくつかの手法を提案する。
平均性能曲線の下での面積に基づいて, 実用性指標を提案する。
論文 参考訳(メタデータ) (2021-10-12T17:34:39Z) - Conservative Objective Models for Effective Offline Model-Based
Optimization [78.19085445065845]
計算設計の問題は、合成生物学からコンピュータアーキテクチャまで、様々な場面で発生している。
本研究では,分布外入力に対する接地的目標の実際の値を低くする目的関数のモデルを学習する手法を提案する。
COMは、様々なMBO問題に対して、既存のメソッドの実装と性能の面では単純である。
論文 参考訳(メタデータ) (2021-07-14T17:55:28Z) - An AI-Assisted Design Method for Topology Optimization Without
Pre-Optimized Training Data [68.8204255655161]
トポロジ最適化に基づくAI支援設計手法を提示し、最適化された設計を直接的に得ることができる。
設計は、境界条件と入力データとしての充填度に基づいて、人工ニューラルネットワーク、予測器によって提供される。
論文 参考訳(メタデータ) (2020-12-11T14:33:27Z) - Process Discovery for Structured Program Synthesis [70.29027202357385]
プロセスマイニングにおける中核的なタスクは、イベントログデータから正確なプロセスモデルを学ぶことを目的としたプロセス発見である。
本稿では,ターゲットプロセスモデルとして(ブロック-)構造化プログラムを直接使用することを提案する。
我々は,このような構造化プログラムプロセスモデルの発見に対して,新たなボトムアップ・アグリメティブ・アプローチを開発する。
論文 参考訳(メタデータ) (2020-08-13T10:33:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。