論文の概要: Controlling chaotic itinerancy in laser dynamics for reinforcement
learning
- arxiv url: http://arxiv.org/abs/2205.05987v1
- Date: Thu, 12 May 2022 09:48:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-13 14:46:57.650825
- Title: Controlling chaotic itinerancy in laser dynamics for reinforcement
learning
- Title(参考訳): 強化学習のためのレーザーダイナミックスにおけるカオス反復性制御
- Authors: Ryugo Iwami, Takatomo Mihana, Kazutaka Kanno, Satoshi Sunada, Makoto
Naruse, and Atsushi Uchida
- Abstract要約: カオス的反復は、脳のような機能を実現するために用いられる。
本稿では,多モード半導体レーザのカオスイテランシを制御し,機械学習の課題を解決する方法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photonic artificial intelligence has attracted considerable interest in
accelerating machine learning; however, the unique optical properties have not
been fully utilized for achieving higher-order functionalities. Chaotic
itinerancy, with its spontaneous transient dynamics among multiple
quasi-attractors, can be employed to realize brain-like functionalities. In
this paper, we propose a method for controlling the chaotic itinerancy in a
multi-mode semiconductor laser to solve a machine learning task, known as the
multi-armed bandit problem, which is fundamental to reinforcement learning. The
proposed method utilizes ultrafast chaotic itinerant motion in mode competition
dynamics controlled via optical injection. We found that the exploration
mechanism is completely different from a conventional searching algorithm and
is highly scalable, outperforming the conventional approaches for large-scale
bandit problems. This study paves the way to utilize chaotic itinerancy for
effectively solving complex machine learning tasks as photonic hardware
accelerators.
- Abstract(参考訳): フォトニック人工知能は機械学習の加速にかなりの関心を集めているが、そのユニークな光学特性は高次機能を達成するために十分に活用されていない。
複数の準トラクター間の自発的な過渡的ダイナミクスを持つカオス的反復は、脳のような機能を実現するために用いられる。
本稿では,マルチモード半導体レーザにおけるカオス的不連続性を制御する手法を提案し,強化学習の基礎となる多腕バンディット問題と呼ばれる機械学習課題を解決する。
提案手法は光注入により制御されるモード競合力学における超高速カオスイテナント運動を利用する。
その結果,探索機構は従来の探索アルゴリズムとは全く異なり,スケーラブルであり,大規模バンディット問題に対する従来のアプローチに匹敵することがわかった。
本研究は,フォトニックハードウェアアクセラレーターとして複雑な機械学習タスクを効果的に解くために,カオス的イテナンシを利用する方法である。
関連論文リスト
- Parallel bandit architecture based on laser chaos for reinforcement
learning [0.0]
フォトニクスは、光子のユニークな性質を活用することを目的とした、活発な研究分野である。
本研究では,多状態強化学習のための新しいアーキテクチャを,バンドイット問題の並列配列として整理する。
PBRLとQ-ラーニングの相違点として,学習期間中にシステムが実行されたさまざまな状態が,PBRLとQ-ラーニングの相違点として現れることがわかった。
論文 参考訳(メタデータ) (2022-05-19T13:12:21Z) - Auto-SDE: Learning effective reduced dynamics from data-driven
stochastic dynamical systems [0.8602553195689513]
この研究は、低速力学系に対する効果的な還元力学の研究に費やされている。
遅い多様体で学習するために,Auto-SDEと呼ばれるニューラルネットワークを含む新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-09T09:56:58Z) - Divide & Conquer Imitation Learning [75.31752559017978]
模倣学習は学習プロセスをブートストラップするための強力なアプローチである。
本稿では,専門的軌道の状態から複雑なロボットタスクを模倣する新しいアルゴリズムを提案する。
提案手法は,非ホロノミックナビゲーションタスクを模倣し,非常に高いサンプル効率で複雑なロボット操作タスクにスケールすることを示す。
論文 参考訳(メタデータ) (2022-04-15T09:56:50Z) - Accelerated Policy Learning with Parallel Differentiable Simulation [59.665651562534755]
微分可能シミュレータと新しいポリシー学習アルゴリズム(SHAC)を提案する。
本アルゴリズムは,スムーズな批判機能により局所最小化の問題を軽減する。
現状のRLと微分可能なシミュレーションベースアルゴリズムと比較して,サンプル効率と壁面時間を大幅に改善した。
論文 参考訳(メタデータ) (2022-04-14T17:46:26Z) - From Machine Learning to Robotics: Challenges and Opportunities for
Embodied Intelligence [113.06484656032978]
記事は、インテリジェンスが機械学習技術の進歩の鍵を握っていると主張している。
私たちは、インテリジェンスを具体化するための課題と機会を強調します。
本稿では,ロボット学習の最先端性を著しく向上させる研究の方向性を提案する。
論文 参考訳(メタデータ) (2021-10-28T16:04:01Z) - Learning Robotic Manipulation Skills Using an Adaptive Force-Impedance
Action Space [7.116986445066885]
強化学習は、様々な困難な意思決定タスクにおいて、有望な結果をもたらしました。
高速な人間のような適応制御手法は複雑なロボットの相互作用を最適化するが、非構造化タスクに必要なマルチモーダルフィードバックを統合することができない。
本稿では,階層的学習と適応アーキテクチャにおける学習問題を要因として,両世界を最大限に活用することを提案する。
論文 参考訳(メタデータ) (2021-10-19T12:09:02Z) - Efficient Differentiable Simulation of Articulated Bodies [89.64118042429287]
本稿では, 音素の効率的な微分可能シミュレーション法を提案する。
これにより、ボディダイナミクスを深層学習フレームワークに統合することが可能になる。
提案手法を用いて, 調音システムによる強化学習を高速化できることを示す。
論文 参考訳(メタデータ) (2021-09-16T04:48:13Z) - Causal Navigation by Continuous-time Neural Networks [108.84958284162857]
本研究では,連続時間ニューラルネットワークを用いた因果表現学習のための理論的,実験的枠組みを提案する。
本手法は,ドローンの視覚制御学習の文脈において,一連の複雑なタスクにおいて評価する。
論文 参考訳(メタデータ) (2021-06-15T17:45:32Z) - Trajectory Tracking of Underactuated Sea Vessels With Uncertain
Dynamics: An Integral Reinforcement Learning Approach [2.064612766965483]
積分強化学習に基づくオンライン機械学習メカニズムを提案し,非線形追跡問題のクラスに対する解を求める。
このソリューションは、適応的批評家と勾配降下アプローチを用いて実現されるオンライン価値反復プロセスを用いて実装される。
論文 参考訳(メタデータ) (2021-04-01T01:41:49Z) - Reservoir Computing with Thin-film Ferromagnetic Devices [51.43445497514241]
薄膜ジオメトリーの磁性材料は、デジタルリカレントニューラルネットワークと同等かそれ以上の精度でリザーバコンピュータを実現することができる。
その結果,磁気フィルムの基本スピン特性が要求される非線形ダイナミクスとメモリを生成することが明らかとなった。
個別の神経コンポーネントや外部処理の必要性をなくすことで,神経形態的ハードウェアのサイズを縮小できることを示した。
論文 参考訳(メタデータ) (2021-01-29T17:37:17Z) - Ensemble learning and iterative training (ELIT) machine learning:
applications towards uncertainty quantification and automated experiment in
atom-resolved microscopy [0.0]
深層学習は、画像の分野をまたいだ迅速な特徴抽出の技法として登場した。
本稿では,原子分解電子顕微鏡における特徴抽出における深層学習の応用について検討する。
このアプローチは、深層学習解析に不確実性をもたらし、また、画像条件の変化によるネットワークの再訓練が人間のオペレータやアンサンブルからのネットワークの選択に代えて、分散のずれを補うための自動実験的検出を可能にする。
論文 参考訳(メタデータ) (2021-01-21T05:29:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。