論文の概要: Model-free Optical Processors using In Situ Reinforcement Learning with Proximal Policy Optimization
- arxiv url: http://arxiv.org/abs/2507.05583v1
- Date: Tue, 08 Jul 2025 01:39:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:37.476843
- Title: Model-free Optical Processors using In Situ Reinforcement Learning with Proximal Policy Optimization
- Title(参考訳): 近似ポリシ最適化を用いたIn situ強化学習を用いたモデルフリー光プロセッサ
- Authors: Yuhang Li, Shiqi Chen, Tingyu Gong, Aydogan Ozcan,
- Abstract要約: 微分光学プロセッサのin situトレーニングに近似ポリシー最適化を用いたモデルフリー強化学習手法を提案する。
我々は,ランダムディフューザ,ホログラフィック画像生成,収差補正,光学画像分類による目標エネルギーを含む,様々なその場学習タスクにおいて,本手法の有効性を実験的に検証した。
- 参考スコア(独自算出の注目度): 18.41925837760181
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optical computing holds promise for high-speed, energy-efficient information processing, with diffractive optical networks emerging as a flexible platform for implementing task-specific transformations. A challenge, however, is the effective optimization and alignment of the diffractive layers, which is hindered by the difficulty of accurately modeling physical systems with their inherent hardware imperfections, noise, and misalignments. While existing in situ optimization methods offer the advantage of direct training on the physical system without explicit system modeling, they are often limited by slow convergence and unstable performance due to inefficient use of limited measurement data. Here, we introduce a model-free reinforcement learning approach utilizing Proximal Policy Optimization (PPO) for the in situ training of diffractive optical processors. PPO efficiently reuses in situ measurement data and constrains policy updates to ensure more stable and faster convergence. We experimentally validated our method across a range of in situ learning tasks, including targeted energy focusing through a random diffuser, holographic image generation, aberration correction, and optical image classification, demonstrating in each task better convergence and performance. Our strategy operates directly on the physical system and naturally accounts for unknown real-world imperfections, eliminating the need for prior system knowledge or modeling. By enabling faster and more accurate training under realistic experimental constraints, this in situ reinforcement learning approach could offer a scalable framework for various optical and physical systems governed by complex, feedback-driven dynamics.
- Abstract(参考訳): 光コンピューティングは、高速でエネルギー効率のよい情報処理を約束しており、タスク固有の変換を実装するための柔軟なプラットフォームとして、微分光学ネットワークが登場している。
しかし、ハードウェアの不完全性やノイズ、不整合といった物理的システムを正確にモデル化することが困難であるため、回折層の効果的な最適化とアライメントが困難である。
既存のin situ最適化手法は、明示的なシステムモデリングを使わずに、物理系の直接訓練の利点を提供するが、限られた測定データの非効率使用により、遅い収束と不安定な性能によって制限されることが多い。
本稿では,PPO(Proximal Policy Optimization)を応用したモデルフリー強化学習手法を提案する。
PPOはin situ測定データを効率的に再利用し、ポリシー更新を制約し、より安定で高速な収束を保証する。
我々は,ランダムなディフューザ,ホログラフィック画像生成,収差補正,光学画像分類による目標エネルギーに着目し,各タスクの収束性や性能を実証した。
我々の戦略は物理的システムを直接運用し、未知の現実世界の欠陥を自然に考慮し、事前のシステム知識やモデリングの必要性を排除します。
現実的な実験的制約の下でより速く、より正確なトレーニングを可能にすることで、このその場強化学習アプローチは、複雑なフィードバック駆動力学によって制御される様々な光学系および物理系のためのスケーラブルなフレームワークを提供することができる。
関連論文リスト
- LAPSO: A Unified Optimization View for Learning-Augmented Power System Operations [3.754570687412345]
本稿では,LAPSO(Learning-Augmented Power System Operations)の総合的枠組みを提案する。
LAPSOは運用段階を中心におり、時間的にサイロ化された電力系統のタスクの境界線を断ち切ることを目的としている。
学習可能なコンポーネントで既存のパワーシステム最適化モデルを自動的に拡張するために、専用のPythonパッケージ-lapsoが導入された。
論文 参考訳(メタデータ) (2025-05-08T13:00:24Z) - Successive optimization of optics and post-processing with differentiable coherent PSF operator and field information [9.527960631238173]
我々は正確な光学シミュレーションモデルを導入し、パイプライン内の全ての操作は微分可能である。
様々な劣化に効率的に対処するために,フィールド情報を活用する共同最適化手法を設計する。
論文 参考訳(メタデータ) (2024-12-19T07:49:40Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Forward-Forward Training of an Optical Neural Network [6.311461340782698]
光ファイバにおける多重モード非線形波動伝搬を利用した実験を行い, 光学系を用いたFFAアプローチの実現可能性を示す。
その結果、FFAで訓練された多層NNアーキテクチャに光変換を組み込むことにより、性能が向上する可能性が示唆された。
論文 参考訳(メタデータ) (2023-05-30T16:15:57Z) - Toward Fast, Flexible, and Robust Low-Light Image Enhancement [87.27326390675155]
我々は、現実の低照度シナリオにおいて、高速でフレキシブルで頑健な鮮明化のための新しい自己校正イルミネーション(SCI)学習フレームワークを開発した。
カスケードパターンの計算負担を考慮すると、各ステージの結果の収束を実現する自己校正モジュールを構築する。
我々は,SCI固有の特性について,操作不感適応性やモデル非関係の一般性を含む包括的探索を行う。
論文 参考訳(メタデータ) (2022-04-21T14:40:32Z) - Low-light Image Enhancement by Retinex Based Algorithm Unrolling and
Adjustment [50.13230641857892]
本稿では,低照度画像強調(LIE)問題に対する新たなディープラーニングフレームワークを提案する。
提案フレームワークは,大域的明るさと局所的明るさ感度の両方を考慮したアルゴリズムアンロールと調整ネットワークに着想を得た分解ネットワークを含む。
一連の典型的なLIEデータセットの実験では,既存の手法と比較して,定量的かつ視覚的に,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-12T03:59:38Z) - Universal and Flexible Optical Aberration Correction Using Deep-Prior
Based Deconvolution [51.274657266928315]
そこで本研究では,収差画像とpsfマップを入力とし,レンズ固有深層プリエントを組み込んだ潜在高品質版を生成する,psf対応プラグイン・アンド・プレイ深層ネットワークを提案する。
具体的には、多彩なレンズの集合からベースモデルを事前訓練し、パラメータを迅速に精製して特定のレンズに適応させる。
論文 参考訳(メタデータ) (2021-04-07T12:00:38Z) - Progressive residual learning for single image dehazing [57.651704852274825]
物理モデルフリーなデハジングプロセスと, 再構成された散乱モデルに基づくデハジング操作を組み合わせるために, 漸進的残留学習戦略が提案されている。
提案手法は,公開デヘイジングベンチマークにおける最先端手法に対して,複雑なデータに対するモデル解釈性と適応性に優れる。
論文 参考訳(メタデータ) (2021-03-14T16:54:44Z) - Optimization-driven Machine Learning for Intelligent Reflecting Surfaces
Assisted Wireless Networks [82.33619654835348]
インテリジェントサーフェス(IRS)は、個々の散乱素子の位相シフトを制御して無線チャネルを再形成するために用いられる。
散乱素子の規模が大きいため、受動ビームフォーミングは一般に高い計算複雑性によって挑戦される。
本稿では、IRS支援無線ネットワークの性能向上のための機械学習(ML)アプローチに焦点を当てる。
論文 参考訳(メタデータ) (2020-08-29T08:39:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。