論文の概要: Autocorrelation effects in a stochastic-process model for decision making via time series
- arxiv url: http://arxiv.org/abs/2603.05559v1
- Date: Thu, 05 Mar 2026 09:39:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:44.191696
- Title: Autocorrelation effects in a stochastic-process model for decision making via time series
- Title(参考訳): 時系列による意思決定のための確率過程モデルにおける自己相関効果
- Authors: Tomoki Yamagami, Mikio Hasegawa, Takatomo Mihana, Ryoichi Horisaki, Atsushi Uchida,
- Abstract要約: 意思決定者は、半導体レーザーによって得られた光カオス力学を利用して、多重武装のバンドイット問題を解決する。
実験では、決定の正確性はこの自己相関性に強く依存していると報告されている。
本研究は,無線通信およびロボット工学における強化学習応用のための意思決定方法を改善する方法である。
- 参考スコア(独自算出の注目度): 0.28707625120094377
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Decision makers exploiting photonic chaotic dynamics obtained by semiconductor lasers provide an ultrafast approach to solving multi-armed bandit problems by using a temporal optical signal as the driving source for sequential decisions. In such systems, the sampling interval of the chaotic waveform shapes the temporal correlation of the resulting time series, and experiments have reported that decision accuracy depends strongly on this autocorrelation property. However, it remains unclear whether the benefit of autocorrelation can be explained by a minimal mathematical model. Here, we analyze a stochastic-process model of the time-series-based decision making using the tug-of-war principle for solving the two-armed bandit problem, where the threshold and a two-valued Markov signal evolve jointly. Numerical results reveal an environment-dependent structure: negative (positive) autocorrelation is optimal in reward-rich (reward-poor) environments. These findings show that negative autocorrelation of the time series is advantageous when the sum of the winning probabilities is more than $1$, whereas positive autocorrelation is useful when the sum of the winning probabilities is less than $1$. Moreover, the performance is independent of autocorrelation if the sum of the winning probabilities equals $1$, which is mathematically clarified. This study paves the way for improving the decision-making scheme for reinforcement learning applications in wireless communications and robotics.
- Abstract(参考訳): 半導体レーザーによる光カオス力学を利用した決定器は、時間光学信号を駆動源として逐次決定を行うことにより、マルチアームバンディット問題を解決するための超高速なアプローチを提供する。
このようなシステムでは、カオス波形のサンプリング間隔は、結果の時系列の時間的相関を形作っており、実験では、決定精度がこの自己相関性に強く依存していると報告している。
しかし、自己相関の利点が最小の数学的モデルで説明できるかどうかは不明である。
ここでは,2本腕のバンディット問題を解くための綱引き原理を用いて,時系列に基づく意思決定の確率過程モデルを解析し,しきい値と2値のマルコフ信号が協調して進化する。
負の(正の)自己相関は報酬に富む(逆の)環境において最適である。
これらの結果は、勝利確率の和が1ドル以上である場合には、時系列の負の自己相関が有利である一方、勝利確率の和が1ドル未満である場合には、正の自己相関が有用であることを示している。
さらに、勝利確率の和が1ドルと等しい場合、その性能は自己相関とは独立であり、数学的に解明される。
本研究は,無線通信およびロボット工学における強化学習応用のための意思決定方法を改善する方法である。
関連論文リスト
- Harmonic Path Integral Diffusion [0.4527270266697462]
本稿では,連続多変量確率分布から抽出する新しい手法を提案する。
本手法では,状態空間の起点を中心とするデルタ関数を$t=0$とし,ターゲット分布に$t=1$で変換する。
これらのアルゴリズムは他のサンプリング手法、特にシミュレートおよびパス積分サンプリングと対比し、解析制御、精度、計算効率の点でそれらの利点を強調した。
論文 参考訳(メタデータ) (2024-09-23T16:20:21Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - PerturbScore: Connecting Discrete and Continuous Perturbations in NLP [64.28423650146877]
本稿では,離散摂動と連続摂動を結びつけることを目的とする。
回帰タスクをPerturbScoreとして設計し,相関関係を自動的に学習する。
離散摂動と連続摂動の接続を構築でき、提案したPerturbScoreを使ってそのような相関関係を学習できる。
論文 参考訳(メタデータ) (2023-10-13T06:50:15Z) - Seeing is not Believing: Robust Reinforcement Learning against Spurious
Correlation [57.351098530477124]
国家の異なる部分には、保存されていない共同設立者が引き起こす相関関係が存在しない。
このような役に立たないあるいは有害な相関を学習するモデルは、テストケースの共同創設者がトレーニングケースから逸脱したときに破滅的に失敗する可能性がある。
したがって、単純かつ非構造的な不確実性集合を仮定する既存の頑健なアルゴリズムは、この問題に対処するには不十分である。
論文 参考訳(メタデータ) (2023-07-15T23:53:37Z) - Continuous-Time Modeling of Counterfactual Outcomes Using Neural
Controlled Differential Equations [84.42837346400151]
反現実的な結果を予測することは、パーソナライズされたヘルスケアをアンロックする可能性がある。
既存の因果推論アプローチでは、観察と治療決定の間の通常の離散時間間隔が考慮されている。
そこで本研究では,腫瘍増殖モデルに基づく制御可能なシミュレーション環境を提案する。
論文 参考訳(メタデータ) (2022-06-16T17:15:15Z) - Theory of Acceleration of Decision Making by Correlated Times Sequences [0.15658704610960572]
フォトニック加速器は情報処理能力を高めるために集中的に研究されている。
レーザーカオスは、マルチアームバンディット(MAB)問題や意思決定問題をGHzオーダーで解決する機能を提供する。
相関時間列によって意思決定が加速される理由のメカニズムは不明である。
論文 参考訳(メタデータ) (2022-03-30T02:27:01Z) - Stochastic Optimization under Distributional Drift [3.0229888038442922]
予測と高い確率の両方で有効な境界に焦点をあて、平均化を繰り返すアルゴリズムに対して非漸近収束保証を提供する。
勾配法の追従効率がステップ崩壊スケジュールから大きく向上する低ドリフト・ツー・ノイズ方式を同定する。
論文 参考訳(メタデータ) (2021-08-16T21:57:39Z) - Momentum Accelerates the Convergence of Stochastic AUPRC Maximization [80.8226518642952]
高精度リコール曲線(AUPRC)に基づく領域の最適化について検討し,不均衡なタスクに広く利用されている。
我々は、$O (1/epsilon4)$のより優れた反復による、$epsilon$定常解を見つけるための新しい運動量法を開発する。
また,O(1/epsilon4)$と同じ複雑さを持つ適応手法の新たなファミリを設計し,実際により高速な収束を享受する。
論文 参考訳(メタデータ) (2021-07-02T16:21:52Z) - Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。
エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文 参考訳(メタデータ) (2021-06-05T09:16:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。