論文の概要: Decision-making and control with diffractive optical networks
- arxiv url: http://arxiv.org/abs/2212.11278v3
- Date: Thu, 21 Sep 2023 13:34:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-22 20:04:58.663988
- Title: Decision-making and control with diffractive optical networks
- Title(参考訳): 回折光ネットワークによる意思決定と制御
- Authors: Jumin Qiu, Shuyuan Xiao, Lujun Huang, Andrey Miroshnichenko, Dejian
Zhang, Tingting Liu, Tianbao Yu
- Abstract要約: 人工知能の最終的な目標は、人間の脳を模倣して、高次元の感覚入力から直接意思決定と制御を行うことである。
回折光学ネットワークは、高速かつ低消費電力で人工知能を実装するための有望なソリューションを提供する。
本稿では,人間レベルの意思決定能力と制御能力を模倣した回折光学ネットワークを実現するために,深層強化学習を提案する。
- 参考スコア(独自算出の注目度): 1.3356127774729136
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ultimate goal of artificial intelligence is to mimic the human brain to
perform decision-making and control directly from high-dimensional sensory
input. Diffractive optical networks provide a promising solution for
implementing artificial intelligence with high-speed and low-power consumption.
Most of the reported diffractive optical networks focus on single or multiple
tasks that do not involve environmental interaction, such as object recognition
and image classification. In contrast, the networks capable of performing
decision-making and control have not yet been developed to our knowledge. Here,
we propose using deep reinforcement learning to implement diffractive optical
networks that imitate human-level decision-making and control capability. Such
networks taking advantage of a residual architecture, allow for finding optimal
control policies through interaction with the environment and can be readily
implemented with existing optical devices. The superior performance of these
networks is verified by engaging three types of classic games, Tic-Tac-Toe,
Super Mario Bros., and Car Racing. Finally, we present an experimental
demonstration of playing Tic-Tac-Toe by leveraging diffractive optical networks
based on a spatial light modulator. Our work represents a solid step forward in
advancing diffractive optical networks, which promises a fundamental shift from
the target-driven control of a pre-designed state for simple recognition or
classification tasks to the high-level sensory capability of artificial
intelligence. It may find exciting applications in autonomous driving,
intelligent robots, and intelligent manufacturing.
- Abstract(参考訳): 人工知能の最終的な目標は、人間の脳を模倣して意思決定を行い、高次元の感覚入力から直接制御することである。
回折光学ネットワークは、高速かつ低消費電力で人工知能を実装するための有望なソリューションを提供する。
報告されている回折光ネットワークのほとんどは、物体認識や画像分類など、環境相互作用を伴わない単タスクや複数タスクに焦点を当てている。
対照的に、意思決定と制御が可能なネットワークは、我々の知識にはまだ開発されていない。
本稿では,人間レベルの意思決定と制御機能を模倣した拡散型光ネットワークを実現するための深層強化学習手法を提案する。
残余アーキテクチャを利用するネットワークは、環境との相互作用を通じて最適な制御ポリシーを見つけることができ、既存の光学デバイスで容易に実装できる。
これらのネットワークの性能は、Tic-Tac-Toe、Super Mario Bros.、Car Racingの3種類のクラシックゲームで検証される。
最後に,空間光変調器に基づく回折光ネットワークを利用したtic-tac-toeの演奏実験を行う。
我々の研究は、単純な認識や分類タスクのために設計された状態の目標駆動制御から、人工知能の高レベルな知覚能力への根本的なシフトを約束する、回折光学ネットワークの進歩における確固たる一歩である。
自動運転、インテリジェントロボット、そしてインテリジェントな製造にエキサイティングな応用が見つかるかもしれない。
関連論文リスト
- Genetically programmable optical random neural networks [0.0]
遺伝的にプログラム可能であるが、光学的ランダムプロジェクションによる高性能を実現するための単純な光学ニューラルネットワークを実証する。
ランダムプロジェクションカーネルとして機能する散乱媒質の配向を遺伝的にプログラミングすることにより,本手法は最適なカーネルを発見し,初期試験精度を7-22%向上させる。
提案手法は,シンプルでスケーラブルな設計で,光ニューラルネットワークの高性能化を実現するための有望な手法である。
論文 参考訳(メタデータ) (2024-03-19T06:55:59Z) - Self-Supervised Interpretable Sensorimotor Learning via Latent Functional Modularity [2.163881720692685]
MoNetは、エンド・ツー・エンドの学習とモジュラー・ネットワーク・アーキテクチャを組み合わせた、自己教師型・解釈可能な官能学習のための新しい手法である。
現実世界の屋内環境では、MoNetは効果的な視覚自律ナビゲーションを示し、ベースラインモデルの11%から47%を超えている。
論文 参考訳(メタデータ) (2024-02-21T15:17:20Z) - Causal Semantic Communication for Digital Twins: A Generalizable
Imitation Learning Approach [74.25870052841226]
デジタルツイン(DT)は、物理世界の仮想表現と通信(例えば6G)、コンピュータ、人工知能(AI)技術を活用して、多くの接続されたインテリジェンスサービスを実現する。
無線システムは、厳密な通信制約下での情報意思決定を容易にするために意味コミュニケーション(SC)のパラダイムを利用することができる。
DTベースの無線システムでは,因果意味通信(CSC)と呼ばれる新しいフレームワークが提案されている。
論文 参考訳(メタデータ) (2023-04-25T00:15:00Z) - Learning Deep Sensorimotor Policies for Vision-based Autonomous Drone
Racing [52.50284630866713]
既存のシステムは、状態推定、計画、制御のために手作業によるコンポーネントを必要とすることが多い。
本稿では、深層感触者ポリシーを学習することで、視覚に基づく自律ドローンレース問題に取り組む。
論文 参考訳(メタデータ) (2022-10-26T19:03:17Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Pervasive Machine Learning for Smart Radio Environments Enabled by
Reconfigurable Intelligent Surfaces [56.35676570414731]
Reconfigurable Intelligent Surfaces(RIS)の新たな技術は、スマート無線環境の実現手段として準備されている。
RISは、無線媒体上の電磁信号の伝搬を動的に制御するための、高度にスケーラブルで低コストで、ハードウェア効率が高く、ほぼエネルギーニュートラルなソリューションを提供する。
このような再構成可能な無線環境におけるRISの密配置に関する大きな課題の1つは、複数の準曲面の効率的な構成である。
論文 参考訳(メタデータ) (2022-05-08T06:21:33Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Physical deep learning based on optimal control of dynamical systems [0.0]
本研究では,連続時間力学系の最適制御に基づくパターン認識を行う。
鍵となる例として、光電子遅延システムにダイナミックスに基づく認識アプローチを適用する。
これは、多くの重みパラメータをトレーニングする必要がある従来の多層ニューラルネットワークとは対照的である。
論文 参考訳(メタデータ) (2020-12-16T06:38:01Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Deep Reinforcement Learning with Population-Coded Spiking Neural Network
for Continuous Control [0.0]
深層強化学習(DRL)を用いた深層批評家ネットワークと連携して訓練された集団符号化スパイキングアクターネットワーク(PopSAN)を提案する。
我々は、トレーニング済みのPopSANをIntelのLoihiニューロモルフィックチップにデプロイし、本手法をメインストリームのDRLアルゴリズムと比較し、連続的な制御を行った。
本研究はニューロモルフィックコントローラの効率性をサポートし,エネルギー効率とロバスト性の両方が重要である場合,我々のハイブリッドRLをディープラーニングの代替として提案する。
論文 参考訳(メタデータ) (2020-10-19T16:20:45Z) - Compatible Learning for Deep Photonic Neural Network [0.0]
フォトニックニューラルネットワークは、予測指向のタスクに重要な可能性を秘めている。
そこで我々は,非線形な活性化を効率的に選択できる,複雑な空間における互換性のある学習プロトコルを開発した。
論文 参考訳(メタデータ) (2020-03-14T13:21:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。