論文の概要: Transfer learning-assisted inverse modeling in nanophotonics based on
mixture density networks
- arxiv url: http://arxiv.org/abs/2401.12254v1
- Date: Sun, 21 Jan 2024 09:03:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-24 17:53:36.333148
- Title: Transfer learning-assisted inverse modeling in nanophotonics based on
mixture density networks
- Title(参考訳): 混合密度ネットワークに基づくナノフォトニクスの移動学習支援逆モデリング
- Authors: Liang Cheng and Prashant Singh and Francesco Ferranti
- Abstract要約: 本稿では,移動学習により強化された混合密度ネットワークモデルに基づくナノフォトニック構造の逆モデリング手法を提案する。
提案手法は,光応答を入力とする設計ソリューションの予測能力を高い精度で保ちながら,伝達学習に基づく手法を用いてこれらの制限を克服することができる。
- 参考スコア(独自算出の注目度): 0.945014381093685
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The simulation of nanophotonic structures relies on electromagnetic solvers,
which play a crucial role in understanding their behavior. However, these
solvers often come with a significant computational cost, making their
application in design tasks, such as optimization, impractical. To address this
challenge, machine learning techniques have been explored for accurate and
efficient modeling and design of photonic devices. Deep neural networks, in
particular, have gained considerable attention in this field. They can be used
to create both forward and inverse models. An inverse modeling approach avoids
the need for coupling a forward model with an optimizer and directly performs
the prediction of the optimal design parameters values.
In this paper, we propose an inverse modeling method for nanophotonic
structures, based on a mixture density network model enhanced by transfer
learning. Mixture density networks can predict multiple possible solutions at a
time including their respective importance as Gaussian distributions. However,
multiple challenges exist for mixture density network models. An important
challenge is that an upper bound on the number of possible simultaneous
solutions needs to be specified in advance. Also, another challenge is that the
model parameters must be jointly optimized, which can result computationally
expensive. Moreover, optimizing all parameters simultaneously can be
numerically unstable and can lead to degenerate predictions. The proposed
approach allows overcoming these limitations using transfer learning-based
techniques, while preserving a high accuracy in the prediction capability of
the design solutions given an optical response as an input. A dimensionality
reduction step is also explored. Numerical results validate the proposed
method.
- Abstract(参考訳): ナノフォトニクス構造のシミュレーションは電磁解法に依存しており、その挙動を理解する上で重要な役割を果たす。
しかし、これらの解法は計算コストがかなり高く、最適化や非現実的な設計タスクに応用されることが多い。
この課題に対処するために、フォトニックデバイスの正確かつ効率的なモデリングと設計のために機械学習技術が研究されている。
特にディープニューラルネットワークは、この分野でかなりの注目を集めている。
前方モデルと逆モデルの両方を作成するために使用できる。
逆モデリングアプローチは、フォワードモデルとオプティマイザを結合する必要性を回避し、最適な設計パラメータの予測を直接実行する。
本稿では,移動学習により強化された混合密度ネットワークモデルに基づいて,ナノフォトニック構造の逆モデリング手法を提案する。
混合密度ネットワークはガウス分布としての重要性を含む複数の可能な解を同時に予測することができる。
しかし,混合密度ネットワークモデルには複数の課題が存在する。
重要な課題は、同時解の可能な数に対する上限を事前に指定する必要があることである。
また、別の課題として、モデルパラメータは共同で最適化されなければならない。
さらに、全てのパラメータを同時に最適化することは数値的に不安定であり、退化予測につながる可能性がある。
提案手法は,光応答を入力とする設計ソリューションの予測能力を高い精度で保ちながら,伝達学習に基づく手法を用いてこれらの制限を克服することができる。
次元化のステップも検討されている。
提案手法を数値計算により検証した。
関連論文リスト
- Diffusion Models as Network Optimizers: Explorations and Analysis [71.69869025878856]
生成拡散モデル(GDM)は,ネットワーク最適化の新しいアプローチとして期待されている。
本研究ではまず,生成モデルの本質的な特徴について考察する。
本稿では,識別的ネットワーク最適化よりも生成モデルの利点を簡潔かつ直感的に示す。
論文 参考訳(メタデータ) (2024-11-01T09:05:47Z) - Dynamical Measure Transport and Neural PDE Solvers for Sampling [77.38204731939273]
本研究では, 対象物へのトラクタブル密度関数の移動として, 確率密度からサンプリングする作業に取り組む。
物理インフォームドニューラルネットワーク(PINN)を用いて各偏微分方程式(PDE)の解を近似する。
PINNはシミュレーションと離散化のない最適化を可能にし、非常に効率的に訓練することができる。
論文 参考訳(メタデータ) (2024-07-10T17:39:50Z) - Deep Neural Networks as Variational Solutions for Correlated Open
Quantum Systems [0.0]
より強力なモデルで直接密度行列をパラメータ化することで、より良い変分アンザッツ関数が得られることを示す。
本稿では, 散逸的一次元逆場イジングモデルと2次元散逸的ハイゼンベルクモデルについて述べる。
論文 参考訳(メタデータ) (2024-01-25T13:41:34Z) - Compositional Generative Inverse Design [69.22782875567547]
入力変数を設計して目的関数を最適化する逆設計は重要な問題である。
拡散モデルにより得られた学習エネルギー関数を最適化することにより、そのような逆例を避けることができることを示す。
N-body 相互作用タスクと2次元多面体設計タスクにおいて,実験時に学習した拡散モデルを構成することにより,初期状態と境界形状を設計できることを示す。
論文 参考訳(メタデータ) (2024-01-24T01:33:39Z) - Diffusion Generative Inverse Design [28.04683283070957]
逆設計(英: inverse design)とは、目的関数の入力を最適化し、目的の結果を導出する問題を指す。
学習グラフニューラルネットワーク(GNN)の最近の進歩は、シミュレーション力学の正確で効率的で微分可能な推定に利用することができる。
本稿では, 分散拡散モデルを用いて, 逆設計問題の解法を効率的に行う方法を示し, より効率的な粒子サンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-05T08:32:07Z) - Deep Learning-based surrogate models for parametrized PDEs: handling
geometric variability through graph neural networks [0.0]
本研究では,時間依存型PDEシミュレーションにおけるグラフニューラルネットワーク(GNN)の可能性について検討する。
本稿では,データ駆動型タイムステッピング方式に基づくサロゲートモデルを構築するための体系的戦略を提案する。
GNNは,計算効率と新たなシナリオへの一般化の観点から,従来の代理モデルに代わる有効な代替手段を提供することができることを示す。
論文 参考訳(メタデータ) (2023-08-03T08:14:28Z) - Monte Carlo Neural PDE Solver for Learning PDEs via Probabilistic Representation [59.45669299295436]
教師なしニューラルソルバのトレーニングのためのモンテカルロPDEソルバを提案する。
我々は、マクロ現象をランダム粒子のアンサンブルとみなすPDEの確率的表現を用いる。
対流拡散, アレン・カーン, ナヴィエ・ストークス方程式に関する実験により, 精度と効率が著しく向上した。
論文 参考訳(メタデータ) (2023-02-10T08:05:19Z) - Tackling Multimodal Device Distributions in Inverse Photonic Design
using Invertible Neural Networks [0.0]
逆設計は、デバイスまたはプロセスパラメータをマッチングして望ましい性能を示すプロセスである。
ほとんどの従来の最適化ルーチンは、設計パラメータと目標のパフォーマンスの間の可逆的な1対1マッピングを前提としています。
逆設計問題に対して、可逆ニューラルネットワークに基づく生成的モデリングアプローチが、可能解の完全な分布を提供する方法を示す。
論文 参考訳(メタデータ) (2022-08-29T08:46:17Z) - Modeling Design and Control Problems Involving Neural Network Surrogates [1.1602089225841632]
ニューラルネットワークで表される代理モデルを含む非線形最適化問題を考察する。
ニューラルネットワーク評価を直接最適化モデルに組み込む方法を示し、収束を防止できるこのアプローチの難しさを強調します。
本稿では、ReLUを活性化したフィードフォワードニューラルネットワークの特定の場合において、これらの問題の2つの別の定式化を提案する。
論文 参考訳(メタデータ) (2021-11-20T01:09:15Z) - Offline Model-Based Optimization via Normalized Maximum Likelihood
Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。
この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。
我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文 参考訳(メタデータ) (2021-02-16T06:04:27Z) - Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems [83.98774574197613]
最も単純な推論手法の1つとして、切り詰められた最大積のBelief伝播を取り上げ、それをディープラーニングモデルの適切なコンポーネントにするために必要となるものを加えます。
このBP-Layerは畳み込みニューラルネットワーク(CNN)の最終ブロックまたは中間ブロックとして使用できる
このモデルは様々な密集予測問題に適用可能であり、パラメータ効率が高く、ステレオ、光フロー、セマンティックセグメンテーションにおける堅牢な解を提供する。
論文 参考訳(メタデータ) (2020-03-13T13:11:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。