論文の概要: Transfer learning-assisted inverse modeling in nanophotonics based on mixture density networks
- arxiv url: http://arxiv.org/abs/2401.12254v2
- Date: Tue, 21 May 2024 13:39:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-22 18:41:35.668165
- Title: Transfer learning-assisted inverse modeling in nanophotonics based on mixture density networks
- Title(参考訳): 混合密度ネットワークに基づくナノフォトニクスの移動学習支援逆モデリング
- Authors: Liang Cheng, Prashant Singh, Francesco Ferranti,
- Abstract要約: 本稿では,移動学習により強化された混合密度ネットワークモデルに基づくナノフォトニック構造の逆モデリング手法を提案する。
提案手法は,光応答を入力とする設計ソリューションの予測能力を高い精度で保ちながら,伝達学習に基づく手法を用いてこれらの制限を克服することができる。
- 参考スコア(独自算出の注目度): 0.840835093659811
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The simulation of nanophotonic structures relies on electromagnetic solvers, which play a crucial role in understanding their behavior. However, these solvers often come with a significant computational cost, making their application in design tasks, such as optimization, impractical. To address this challenge, machine learning techniques have been explored for accurate and efficient modeling and design of photonic devices. Deep neural networks, in particular, have gained considerable attention in this field. They can be used to create both forward and inverse models. An inverse modeling approach avoids the need for coupling a forward model with an optimizer and directly performs the prediction of the optimal design parameters values. In this paper, we propose an inverse modeling method for nanophotonic structures, based on a mixture density network model enhanced by transfer learning. Mixture density networks can predict multiple possible solutions at a time including their respective importance as Gaussian distributions. However, multiple challenges exist for mixture density network models. An important challenge is that an upper bound on the number of possible simultaneous solutions needs to be specified in advance. Also, another challenge is that the model parameters must be jointly optimized, which can result computationally expensive. Moreover, optimizing all parameters simultaneously can be numerically unstable and can lead to degenerate predictions. The proposed approach allows overcoming these limitations using transfer learning-based techniques, while preserving a high accuracy in the prediction capability of the design solutions given an optical response as an input. A dimensionality reduction step is also explored. Numerical results validate the proposed method.
- Abstract(参考訳): ナノフォトニクス構造のシミュレーションは電磁解法に依存しており、その挙動を理解する上で重要な役割を担っている。
しかし、これらの解法は計算コストがかなり高く、最適化や非現実的な設計タスクに応用されることが多い。
この課題に対処するために、フォトニックデバイスの正確かつ効率的なモデリングと設計のために機械学習技術が研究されている。
特にディープニューラルネットワークはこの分野で大きな注目を集めている。
前方モデルと逆モデルの両方を作成するのに使用できる。
逆モデリングアプローチは、フォワードモデルとオプティマイザを結合する必要性を回避し、最適な設計パラメータの予測を直接実行する。
本稿では,移動学習により強化された混合密度ネットワークモデルに基づいて,ナノフォトニック構造の逆モデリング手法を提案する。
混合密度ネットワークは、ガウス分布としての重要性を含む複数の可能な解を同時に予測することができる。
しかし、混合密度ネットワークモデルには複数の課題が存在する。
重要な課題は、同時解の可能な数に対する上限を事前に指定する必要があることである。
また、別の課題として、モデルパラメータを共同で最適化する必要があることがあり、計算コストがかかる可能性がある。
さらに、全てのパラメータを同時に最適化することは数値的に不安定であり、退化予測につながる可能性がある。
提案手法は,光応答を入力とする設計ソリューションの予測能力を高い精度で保ちながら,伝達学習に基づく手法を用いてこれらの制限を克服することができる。
また,次元低減ステップについても検討した。
提案手法を数値計算により検証した。
関連論文リスト
- Diffusion Models as Network Optimizers: Explorations and Analysis [71.69869025878856]
生成拡散モデル(GDM)は,ネットワーク最適化の新しいアプローチとして期待されている。
本研究ではまず,生成モデルの本質的な特徴について考察する。
本稿では,識別的ネットワーク最適化よりも生成モデルの利点を簡潔かつ直感的に示す。
論文 参考訳(メタデータ) (2024-11-01T09:05:47Z) - Dynamical Measure Transport and Neural PDE Solvers for Sampling [77.38204731939273]
本研究では, 対象物へのトラクタブル密度関数の移動として, 確率密度からサンプリングする作業に取り組む。
物理インフォームドニューラルネットワーク(PINN)を用いて各偏微分方程式(PDE)の解を近似する。
PINNはシミュレーションと離散化のない最適化を可能にし、非常に効率的に訓練することができる。
論文 参考訳(メタデータ) (2024-07-10T17:39:50Z) - Deep Neural Networks as Variational Solutions for Correlated Open
Quantum Systems [0.0]
より強力なモデルで直接密度行列をパラメータ化することで、より良い変分アンザッツ関数が得られることを示す。
本稿では, 散逸的一次元逆場イジングモデルと2次元散逸的ハイゼンベルクモデルについて述べる。
論文 参考訳(メタデータ) (2024-01-25T13:41:34Z) - Compositional Generative Inverse Design [69.22782875567547]
入力変数を設計して目的関数を最適化する逆設計は重要な問題である。
拡散モデルにより得られた学習エネルギー関数を最適化することにより、そのような逆例を避けることができることを示す。
N-body 相互作用タスクと2次元多面体設計タスクにおいて,実験時に学習した拡散モデルを構成することにより,初期状態と境界形状を設計できることを示す。
論文 参考訳(メタデータ) (2024-01-24T01:33:39Z) - Diffusion Generative Inverse Design [28.04683283070957]
逆設計(英: inverse design)とは、目的関数の入力を最適化し、目的の結果を導出する問題を指す。
学習グラフニューラルネットワーク(GNN)の最近の進歩は、シミュレーション力学の正確で効率的で微分可能な推定に利用することができる。
本稿では, 分散拡散モデルを用いて, 逆設計問題の解法を効率的に行う方法を示し, より効率的な粒子サンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-05T08:32:07Z) - Deep Learning-based surrogate models for parametrized PDEs: handling
geometric variability through graph neural networks [0.0]
本研究では,時間依存型PDEシミュレーションにおけるグラフニューラルネットワーク(GNN)の可能性について検討する。
本稿では,データ駆動型タイムステッピング方式に基づくサロゲートモデルを構築するための体系的戦略を提案する。
GNNは,計算効率と新たなシナリオへの一般化の観点から,従来の代理モデルに代わる有効な代替手段を提供することができることを示す。
論文 参考訳(メタデータ) (2023-08-03T08:14:28Z) - Monte Carlo Neural PDE Solver for Learning PDEs via Probabilistic Representation [59.45669299295436]
教師なしニューラルソルバのトレーニングのためのモンテカルロPDEソルバを提案する。
我々は、マクロ現象をランダム粒子のアンサンブルとみなすPDEの確率的表現を用いる。
対流拡散, アレン・カーン, ナヴィエ・ストークス方程式に関する実験により, 精度と効率が著しく向上した。
論文 参考訳(メタデータ) (2023-02-10T08:05:19Z) - Tackling Multimodal Device Distributions in Inverse Photonic Design
using Invertible Neural Networks [0.0]
逆設計は、デバイスまたはプロセスパラメータをマッチングして望ましい性能を示すプロセスである。
ほとんどの従来の最適化ルーチンは、設計パラメータと目標のパフォーマンスの間の可逆的な1対1マッピングを前提としています。
逆設計問題に対して、可逆ニューラルネットワークに基づく生成的モデリングアプローチが、可能解の完全な分布を提供する方法を示す。
論文 参考訳(メタデータ) (2022-08-29T08:46:17Z) - Modeling Design and Control Problems Involving Neural Network Surrogates [1.1602089225841632]
ニューラルネットワークで表される代理モデルを含む非線形最適化問題を考察する。
ニューラルネットワーク評価を直接最適化モデルに組み込む方法を示し、収束を防止できるこのアプローチの難しさを強調します。
本稿では、ReLUを活性化したフィードフォワードニューラルネットワークの特定の場合において、これらの問題の2つの別の定式化を提案する。
論文 参考訳(メタデータ) (2021-11-20T01:09:15Z) - Offline Model-Based Optimization via Normalized Maximum Likelihood
Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。
この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。
我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文 参考訳(メタデータ) (2021-02-16T06:04:27Z) - Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems [83.98774574197613]
最も単純な推論手法の1つとして、切り詰められた最大積のBelief伝播を取り上げ、それをディープラーニングモデルの適切なコンポーネントにするために必要となるものを加えます。
このBP-Layerは畳み込みニューラルネットワーク(CNN)の最終ブロックまたは中間ブロックとして使用できる
このモデルは様々な密集予測問題に適用可能であり、パラメータ効率が高く、ステレオ、光フロー、セマンティックセグメンテーションにおける堅牢な解を提供する。
論文 参考訳(メタデータ) (2020-03-13T13:11:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。