論文の概要: Controlling chaotic itinerancy in laser dynamics for reinforcement
learning
- arxiv url: http://arxiv.org/abs/2205.05987v1
- Date: Thu, 12 May 2022 09:48:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-13 14:46:57.650825
- Title: Controlling chaotic itinerancy in laser dynamics for reinforcement
learning
- Title(参考訳): 強化学習のためのレーザーダイナミックスにおけるカオス反復性制御
- Authors: Ryugo Iwami, Takatomo Mihana, Kazutaka Kanno, Satoshi Sunada, Makoto
Naruse, and Atsushi Uchida
- Abstract要約: カオス的反復は、脳のような機能を実現するために用いられる。
本稿では,多モード半導体レーザのカオスイテランシを制御し,機械学習の課題を解決する方法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photonic artificial intelligence has attracted considerable interest in
accelerating machine learning; however, the unique optical properties have not
been fully utilized for achieving higher-order functionalities. Chaotic
itinerancy, with its spontaneous transient dynamics among multiple
quasi-attractors, can be employed to realize brain-like functionalities. In
this paper, we propose a method for controlling the chaotic itinerancy in a
multi-mode semiconductor laser to solve a machine learning task, known as the
multi-armed bandit problem, which is fundamental to reinforcement learning. The
proposed method utilizes ultrafast chaotic itinerant motion in mode competition
dynamics controlled via optical injection. We found that the exploration
mechanism is completely different from a conventional searching algorithm and
is highly scalable, outperforming the conventional approaches for large-scale
bandit problems. This study paves the way to utilize chaotic itinerancy for
effectively solving complex machine learning tasks as photonic hardware
accelerators.
- Abstract(参考訳): フォトニック人工知能は機械学習の加速にかなりの関心を集めているが、そのユニークな光学特性は高次機能を達成するために十分に活用されていない。
複数の準トラクター間の自発的な過渡的ダイナミクスを持つカオス的反復は、脳のような機能を実現するために用いられる。
本稿では,マルチモード半導体レーザにおけるカオス的不連続性を制御する手法を提案し,強化学習の基礎となる多腕バンディット問題と呼ばれる機械学習課題を解決する。
提案手法は光注入により制御されるモード競合力学における超高速カオスイテナント運動を利用する。
その結果,探索機構は従来の探索アルゴリズムとは全く異なり,スケーラブルであり,大規模バンディット問題に対する従来のアプローチに匹敵することがわかった。
本研究は,フォトニックハードウェアアクセラレーターとして複雑な機械学習タスクを効果的に解くために,カオス的イテナンシを利用する方法である。
関連論文リスト
- Multi-Objective Algorithms for Learning Open-Ended Robotic Problems [1.0124625066746598]
四足歩行は、自動運転車の普及に不可欠な複雑でオープンな問題である。
従来の強化学習アプローチは、トレーニングの不安定性とサンプルの非効率のため、しばしば不足する。
自動カリキュラム学習機構として多目的進化アルゴリズムを活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-11T16:26:42Z) - Optical training of large-scale Transformers and deep neural networks with direct feedback alignment [48.90869997343841]
我々は,ハイブリッド電子フォトニックプラットフォーム上で,ダイレクトフィードバックアライメントと呼ばれる多目的でスケーラブルなトレーニングアルゴリズムを実験的に実装した。
光処理ユニットは、このアルゴリズムの中央動作である大規模ランダム行列乗算を最大1500テラOpsで行う。
我々は、ハイブリッド光アプローチの計算スケーリングについて検討し、超深度・広帯域ニューラルネットワークの潜在的な利点を実証する。
論文 参考訳(メタデータ) (2024-09-01T12:48:47Z) - Decentralized multi-agent reinforcement learning algorithm using a cluster-synchronized laser network [1.124958340749622]
競合するマルチアームバンディット問題に対処するフォトニクスに基づく意思決定アルゴリズムを提案する。
シミュレーションにより,光結合型レーザーのカオス振動とクラスタ同期,分散結合調整,探索と利用の効率向上が示された。
論文 参考訳(メタデータ) (2024-07-12T09:38:47Z) - RObotic MAnipulation Network (ROMAN) $\unicode{x2013}$ Hybrid
Hierarchical Learning for Solving Complex Sequential Tasks [70.69063219750952]
ロボットマニピュレーションネットワーク(ROMAN)のハイブリッド階層型学習フレームワークを提案する。
ROMANは、行動クローニング、模倣学習、強化学習を統合することで、タスクの汎用性と堅牢な障害回復を実現する。
実験結果から,これらの専門的な操作専門家の組織化と活性化により,ROMANは高度な操作タスクの長いシーケンスを達成するための適切なシーケンシャルなアクティベーションを生成することがわかった。
論文 参考訳(メタデータ) (2023-06-30T20:35:22Z) - On Robust Numerical Solver for ODE via Self-Attention Mechanism [82.95493796476767]
我々は,内在性雑音障害を緩和し,AIによって強化された数値解法を,データサイズを小さくする訓練について検討する。
まず,教師付き学習における雑音を制御するための自己認識機構の能力を解析し,さらに微分方程式の数値解に付加的な自己認識機構を導入し,簡便かつ有効な数値解法であるAttrを提案する。
論文 参考訳(メタデータ) (2023-02-05T01:39:21Z) - Variational Quantum Soft Actor-Critic for Robotic Arm Control [0.0]
本研究の目的は、連続制御のための最先端の強化学習技術の一つに量子コンピューティングを適用することの利点を探求し、評価することである。
具体的には、量子回路のディジタルシミュレーションにより、仮想ロボットアームの動きに対する変分量子ソフトアクター・クライトの性能について検討した。
論文 参考訳(メタデータ) (2022-12-20T19:02:24Z) - Accelerated Policy Learning with Parallel Differentiable Simulation [59.665651562534755]
微分可能シミュレータと新しいポリシー学習アルゴリズム(SHAC)を提案する。
本アルゴリズムは,スムーズな批判機能により局所最小化の問題を軽減する。
現状のRLと微分可能なシミュレーションベースアルゴリズムと比較して,サンプル効率と壁面時間を大幅に改善した。
論文 参考訳(メタデータ) (2022-04-14T17:46:26Z) - From Machine Learning to Robotics: Challenges and Opportunities for
Embodied Intelligence [113.06484656032978]
記事は、インテリジェンスが機械学習技術の進歩の鍵を握っていると主張している。
私たちは、インテリジェンスを具体化するための課題と機会を強調します。
本稿では,ロボット学習の最先端性を著しく向上させる研究の方向性を提案する。
論文 参考訳(メタデータ) (2021-10-28T16:04:01Z) - Trajectory Tracking of Underactuated Sea Vessels With Uncertain
Dynamics: An Integral Reinforcement Learning Approach [2.064612766965483]
積分強化学習に基づくオンライン機械学習メカニズムを提案し,非線形追跡問題のクラスに対する解を求める。
このソリューションは、適応的批評家と勾配降下アプローチを用いて実現されるオンライン価値反復プロセスを用いて実装される。
論文 参考訳(メタデータ) (2021-04-01T01:41:49Z) - Robust trajectory generation for robotic control on the neuromorphic
research chip Loihi [0.0]
我々は、最近開発されたスパイクニューラルネットワークモデル、いわゆる異方性ネットワークを利用する。
我々は,Loihi上の異方性ネットワークが神経活動の逐次パターンを確実に符号化していることを示す。
そこで本研究では,複雑なロボットの動きを生成できる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-08-26T16:02:39Z) - Limited-angle tomographic reconstruction of dense layered objects by
dynamical machine learning [68.9515120904028]
強い散乱準透明物体の有限角トモグラフィーは困難で、非常に不適切な問題である。
このような問題の状況を改善することにより、アーティファクトの削減には、事前の定期化が必要である。
我々は,新しい分割畳み込みゲート再帰ユニット(SC-GRU)をビルディングブロックとして,リカレントニューラルネットワーク(RNN)アーキテクチャを考案した。
論文 参考訳(メタデータ) (2020-07-21T11:48:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。