論文の概要: Data-driven Modeling of Mach-Zehnder Interferometer-based Optical Matrix
Multipliers
- arxiv url: http://arxiv.org/abs/2210.09171v1
- Date: Mon, 17 Oct 2022 15:19:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 16:19:12.864753
- Title: Data-driven Modeling of Mach-Zehnder Interferometer-based Optical Matrix
Multipliers
- Title(参考訳): Mach-Zehnder干渉計を用いた光マトリックス乗算器のデータ駆動モデリング
- Authors: Ali Cem, Siqi Yan, Yunhong Ding, Darko Zibar, Francesco Da Ros
- Abstract要約: フォトニック集積回路は光ニューラルネットワークの開発を促進する。
光学行列乗算器のオフライントレーニングのための単純な解析モデルとデータ駆動モデルの両方について述べる。
ニューラルネットワークベースのモデルは、予測誤差の観点から、単純な物理ベースのモデルよりも優れています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Photonic integrated circuits are facilitating the development of optical
neural networks, which have the potential to be both faster and more energy
efficient than their electronic counterparts since optical signals are
especially well-suited for implementing matrix multiplications. However,
accurate programming of photonic chips for optical matrix multiplication
remains a difficult challenge. Here, we describe both simple analytical models
and data-driven models for offline training of optical matrix multipliers. We
train and evaluate the models using experimental data obtained from a
fabricated chip featuring a Mach-Zehnder interferometer mesh implementing
3-by-3 matrix multiplication. The neural network-based models outperform the
simple physics-based models in terms of prediction error. Furthermore, the
neural network models are also able to predict the spectral variations in the
matrix weights for up to 100 frequency channels covering the C-band. The use of
neural network models for programming the chip for optical matrix
multiplication yields increased performance on multiple machine learning tasks.
- Abstract(参考訳): フォトニック集積回路は、光信号が特に行列乗算の実装に適しているため、電子回路よりも高速でエネルギー効率が高い可能性を持つ光ニューラルネットワークの開発を促進する。
しかし、光マトリックス乗算のためのフォトニックチップの正確なプログラミングは難しい課題である。
本稿では,光学行列乗算器のオフライントレーニングのための簡易解析モデルとデータ駆動モデルについて述べる。
3-by-3行列乗算を実装したマッハ・ツェーダー干渉計メッシュを用いた試作チップから得られた実験データを用いてモデルを訓練し,評価した。
ニューラルネットワークベースのモデルは、予測エラーの観点から単純な物理モデルよりも優れている。
さらに、ニューラルネットワークモデルは、Cバンドをカバーする最大100個の周波数チャネルの行列重みのスペクトル変動を予測することもできる。
光行列乗算のためのチップのプログラミングにニューラルネットワークモデルを使用すると、複数の機械学習タスクのパフォーマンスが向上する。
関連論文リスト
- Optical training of large-scale Transformers and deep neural networks with direct feedback alignment [48.90869997343841]
我々は,ハイブリッド電子フォトニックプラットフォーム上で,ダイレクトフィードバックアライメントと呼ばれる多目的でスケーラブルなトレーニングアルゴリズムを実験的に実装した。
光処理ユニットは、このアルゴリズムの中央動作である大規模ランダム行列乗算を最大1500テラOpsで行う。
我々は、ハイブリッド光アプローチの計算スケーリングについて検討し、超深度・広帯域ニューラルネットワークの潜在的な利点を実証する。
論文 参考訳(メタデータ) (2024-09-01T12:48:47Z) - Mechanistic Neural Networks for Scientific Machine Learning [58.99592521721158]
我々は、科学における機械学習応用のためのニューラルネットワーク設計であるメカニスティックニューラルネットワークを提案する。
新しいメカニスティックブロックを標準アーキテクチャに組み込んで、微分方程式を表現として明示的に学習する。
我々のアプローチの中心は、線形プログラムを解くために線形ODEを解く技術に着想を得た、新しい線形計画解法(NeuRLP)である。
論文 参考訳(メタデータ) (2024-02-20T15:23:24Z) - Addressing Data Scarcity in Optical Matrix Multiplier Modeling Using
Transfer Learning [0.0]
本稿では,データ不足に対処するためにトランスファーラーニング(transfer learning)を用いて実験的検討を行った。
提案手法では,より精度の低い解析モデルから生成された合成データを用いて,モデルの事前学習を行う。
3x3フォトニックチップで実装された行列重みに対する1dBのルート平均二乗誤差を、利用可能なデータの25%だけを用いて達成する。
論文 参考訳(メタデータ) (2023-08-10T07:33:00Z) - Data-efficient Modeling of Optical Matrix Multipliers Using Transfer
Learning [0.0]
本稿では,光学行列乗算器の伝送学習支援ニューラルネットワークモデルについて述べる。
提案手法では,Mach-Zehnder干渉計メッシュの解析モデルの性能向上と性能向上に要する実験データの10%を用いている。
論文 参考訳(メタデータ) (2022-11-29T09:22:42Z) - An Adversarial Active Sampling-based Data Augmentation Framework for
Manufacturable Chip Design [55.62660894625669]
リソグラフィーモデリングは、チップ設計マスクが製造可能であることを保証するため、チップ設計において重要な問題である。
機械学習の最近の進歩は、時間を要するリソグラフィーシミュレーションをディープニューラルネットワークに置き換えるための代替ソリューションを提供している。
本稿では,限られたデータのジレンマを解消し,機械学習モデルの性能を向上させるために,データ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-27T20:53:39Z) - All-Photonic Artificial Neural Network Processor Via Non-linear Optics [0.0]
本稿では,全フォトニックニューラルネットワークプロセッサを提案する。
情報はニューロンとして機能する周波数モードの振幅に符号化される。
私たちのアーキテクチャは、完全にユニタリで可逆的な計算方法を提供するという点でユニークなものです。
論文 参考訳(メタデータ) (2022-05-17T19:55:30Z) - Mixed Precision Low-bit Quantization of Neural Network Language Models
for Speech Recognition [67.95996816744251]
長期間のメモリリカレントニューラルネットワーク(LSTM-RNN)とトランスフォーマーで表される最先端言語モデル(LM)は、実用アプリケーションではますます複雑で高価なものになりつつある。
現在の量子化法は、均一な精度に基づいており、量子化誤差に対するLMの異なる部分での様々な性能感度を考慮できない。
本稿では,新しい混合精度ニューラルネットワークLM量子化法を提案する。
論文 参考訳(メタデータ) (2021-11-29T12:24:02Z) - Comparison of Models for Training Optical Matrix Multipliers in
Neuromorphic PICs [0.0]
プログラム可能なフォトニックチップのオフライントレーニングにおいて、単純な物理ベースとデータ駆動型ニューラルネットワークベースのモデルを比較した。
ニューラルネットワークモデルは、熱クロストークを持つチップの物理モデルよりも優れ、テスト精度が向上する。
論文 参考訳(メタデータ) (2021-11-23T12:15:21Z) - Joint Deep Reinforcement Learning and Unfolding: Beam Selection and
Precoding for mmWave Multiuser MIMO with Lens Arrays [54.43962058166702]
離散レンズアレイを用いたミリ波マルチユーザマルチインプット多重出力(MU-MIMO)システムに注目が集まっている。
本研究では、DLA を用いた mmWave MU-MIMO システムのビームプリコーディング行列の共同設計について検討する。
論文 参考訳(メタデータ) (2021-01-05T03:55:04Z) - Compressing LSTM Networks by Matrix Product Operators [7.395226141345625]
Long Short Term Memory(LSTM)モデルは、多くの最先端自然言語処理(NLP)と音声強調(SE)アルゴリズムの構築ブロックである。
ここでは、量子多体物理学における量子状態の局所的相関を記述するMPO分解を紹介する。
LSTMモデルを置き換えるために,行列積演算子(MPO)に基づくニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-12-22T11:50:06Z) - Rapid characterisation of linear-optical networks via PhaseLift [51.03305009278831]
集積フォトニクスは優れた位相安定性を提供し、半導体産業によって提供される大規模な製造性に依存することができる。
このような光回路に基づく新しいデバイスは、機械学習アプリケーションにおいて高速でエネルギー効率の高い計算を約束する。
線形光ネットワークの転送行列を再構成する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-01T16:04:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。