論文の概要: Position control of an acoustic cavitation bubble by reinforcement
learning
- arxiv url: http://arxiv.org/abs/2312.05674v1
- Date: Sat, 9 Dec 2023 20:33:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 19:23:52.665663
- Title: Position control of an acoustic cavitation bubble by reinforcement
learning
- Title(参考訳): 強化学習による音響キャビテーション気泡の位置制御
- Authors: K\'alm\'an Klapcsik, B\'alint Gyires-T\'oth, Juan Manuel Rossell\'o,
Ferenc Heged\H{u}s
- Abstract要約: 音響キャビテーションバブルの位置を任意に制御できる制御技術を開発した。
エージェントは、バブル位置を操作するために最適な圧力振幅値を選択する必要がある。
場合によっては、最適制御は線形理論から期待される解の7倍の速度で行うことができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A control technique is developed via Reinforcement Learning that allows
arbitrary controlling of the position of an acoustic cavitation bubble in a
dual-frequency standing acoustic wave field. The agent must choose the optimal
pressure amplitude values to manipulate the bubble position in the range of
$x/\lambda_0\in[0.05, 0.25]$. To train the agent an actor-critic off-policy
algorithm (Deep Deterministic Policy Gradient) was used that supports
continuous action space, which allows setting the pressure amplitude values
continuously within $0$ and $1\, \mathrm{bar}$. A shaped reward function is
formulated that minimizes the distance between the bubble and the target
position and implicitly encourages the agent to perform the position control
within the shortest amount of time. In some cases, the optimal control can be 7
times faster than the solution expected from the linear theory.
- Abstract(参考訳): 二重周波数定在音場における音響キャビテーションバブルの位置を任意に制御できる強化学習を用いて制御技術を開発した。
エージェントは、x/\lambda_0\in[0.05, 0.25]$の範囲でバブル位置を操作するために最適な圧力振幅値を選択する必要がある。
エージェントを訓練するために、連続的なアクションスペースをサポートするアクター-批判オフポリシーアルゴリズム(ディープ決定論的ポリシー勾配)が用いられ、圧力振幅値を0$と1\, \mathrm{bar}$で連続的に設定できる。
気泡と目標位置との間の距離を最小化し、エージェントが最短時間で位置制御を行うことを暗黙的に促す形状の報酬関数を定式化する。
場合によっては、最適制御は、線形理論から期待される解の7倍高速である。
関連論文リスト
- Optimizing Pulse Shapes of an Echoed Conditional Displacement Gate in a Superconducting Bosonic System [0.0]
ECDゲートの標準構成において,ゲート時間に対する上限が低いことを示す。
本研究では, パルス整形法を用いて, 実験制約の組を考慮し, ECDゲートのパルス形状を最適化する手法を提案する。
我々は,標準構成で使用されるプリミティブの非オーバーラップ制約を緩和するか,最適制御法を用いて,CDゲートの総ゲート時間を$beta$の小さい値で削減できることを実証した。
論文 参考訳(メタデータ) (2024-08-09T18:49:09Z) - Quantum optimal control robust to $1/f^α$ noises using fractional calculus: voltage-controlled exchange in semiconductor spin qubits [0.0]
低周波の1/falpha$の電荷雑音は、量子ドットにおける電圧制御されたスピン量子ビットの性能を著しく阻害する。
ここでは、分数計算を用いて、ノイズの多い量子ゲート演算において、最も高い平均忠実度が得られる電圧制御パルスを設計する。
論文 参考訳(メタデータ) (2024-05-21T16:46:47Z) - Spectrum Breathing: Protecting Over-the-Air Federated Learning Against Interference [73.63024765499719]
モバイルネットワークは、近隣のセルやジャマーからの干渉によって損なわれる可能性がある。
本稿では,帯域幅拡大を伴わない干渉を抑制するために,カスケード段階のプルーニングとスペクトル拡散を行うスペクトルブリーチングを提案する。
呼吸深度によって制御された勾配プルーニングと干渉誘発誤差の間には,性能的トレードオフが認められた。
論文 参考訳(メタデータ) (2023-05-10T07:05:43Z) - Optimal State Manipulation for a Two-Qubit System Driven by Coherent and
Incoherent Controls [77.34726150561087]
2量子ビット量子系の最適制御には状態準備が重要である。
物理的に異なる2つのコヒーレント制御を利用し、ヒルベルト・シュミット目標密度行列を最適化する。
論文 参考訳(メタデータ) (2023-04-03T10:22:35Z) - Optimal control for state preparation in two-qubit open quantum systems
driven by coherent and incoherent controls via GRAPE approach [77.34726150561087]
我々は、コヒーレントかつ非コヒーレントな時間依存制御によって駆動される2つの量子ビットのモデルを考える。
系の力学はゴリーニ=コサコフスキー=スダルシャン=リンドブラッドのマスター方程式によって支配される。
最適化制御の下で, フォン・ノイマンエントロピー, 純度, および1ビット還元密度行列の進化について検討した。
論文 参考訳(メタデータ) (2022-11-04T15:20:18Z) - Optimal scheduling of entropy regulariser for continuous-time
linear-quadratic reinforcement learning [9.779769486156631]
ここで、エージェントは最適な緩和ポリシーに従って分散されたノイズ制御を生成することで環境と相互作用する。
この探索-探索トレードオフはエントロピー正則化の強さによって決定される。
どちらの学習アルゴリズムも、$mathcalO(sqrtN)$(対数係数まで)を$N$のエピソードよりも高く、文献から最もよく知られた結果と一致することを証明している。
論文 参考訳(メタデータ) (2022-08-08T23:36:40Z) - Actor-Critic based Improper Reinforcement Learning [61.430513757337486]
我々は,未知のマルコフ決定プロセスに対して,学習者に100万ドルのベースコントローラを付与する不適切な強化学習環境を考える。
本稿では,(1)ポリシーグラディエントに基づくアプローチ,(2)単純なアクター・クリティカル・スキームとNatural Actor-Criticスキームを切り替えるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-19T05:55:02Z) - Provably Optimal Control for Multiplicative Amplitude Control Noise [0.0]
我々は,そのようなシーケンスを最適性を保証する凸最適化問題にマップできることを示した。
また、この手法は、より一般的なオフ軸時間関連デフォーカスノイズと互換性があることも示している。
このアプローチにより、制御における振幅ドリフトによるノイズがデフォーカスに対して強いシステムにおける最適量子論理ゲートの開発が可能になる。
論文 参考訳(メタデータ) (2022-05-13T16:19:56Z) - Optimal control and selectivity of qubits in contact with a structured
environment [7.07321040534471]
量子ビット人口と緩和効果の操作範囲を示す。
一定の最大強度の形状制御による到達可能な量子状態が数値的に見つかる。
論文 参考訳(メタデータ) (2022-03-29T13:35:12Z) - Direct Optimal Control Approach to Laser-Driven Quantum Particle
Dynamics [77.34726150561087]
間接制御理論に対する頑健で柔軟な代替手段として, 直接最適制御を提案する。
この方法は、バイスタブルポテンシャルにおけるレーザー駆動のウェーブパレットダイナミクスの場合に説明される。
論文 参考訳(メタデータ) (2020-10-08T07:59:29Z) - Time-local optimal control for parameter estimation in the Gaussian
regime [68.8204255655161]
瞬時制御ユニタリは、オープンダイナミクスによって引き起こされる情報の減少を軽減するために用いられる。
このような制御に対して、局所的に最適な(時間内での)選択は、量子フィッシャー情報の時間微分を最大化するものである。
論文 参考訳(メタデータ) (2020-01-10T16:24:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。