論文の概要: Beacon, a lightweight deep reinforcement learning benchmark library for
flow control
- arxiv url: http://arxiv.org/abs/2402.17402v1
- Date: Tue, 27 Feb 2024 10:48:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-28 16:43:37.751899
- Title: Beacon, a lightweight deep reinforcement learning benchmark library for
flow control
- Title(参考訳): beacon - フロー制御のための軽量深層強化学習ベンチマークライブラリ
- Authors: Jonathan Viquerat and Philippe Meliga and Pablo Jeken and Elie Hachem
- Abstract要約: 本研究では,7つの軽量な1次元フロー制御問題と2次元フロー制御問題からなるオープンソースのベンチマークライブラリであるBeaconを提案する。
このコントリビューションでは、考慮すべき7つの問題を記述し、参照制御ソリューションを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recently, the increasing use of deep reinforcement learning for flow control
problems has led to a new area of research, focused on the coupling and the
adaptation of the existing algorithms to the control of numerical fluid
dynamics environments. Although still in its infancy, the field has seen
multiple successes in a short time span, and its fast development pace can
certainly be partly imparted to the open-source effort that drives the
expansion of the community. Yet, this emerging domain still misses a common
ground to (i) ensure the reproducibility of the results, and (ii) offer a
proper ad-hoc benchmarking basis. To this end, we propose Beacon, an
open-source benchmark library composed of seven lightweight 1D and 2D flow
control problems with various characteristics, action and observation space
characteristics, and CPU requirements. In this contribution, the seven
considered problems are described, and reference control solutions are
provided. The sources for the following work are available at
https://github.com/jviquerat/beacon.
- Abstract(参考訳): 近年,流れ制御問題に対する深部強化学習の利用が増加し,数値流体力学環境の制御に対する既存アルゴリズムの結合と適応に着目した新たな研究領域が生まれている。
まだ初期段階だが、この分野は短期間で複数の成功を収めており、その迅速な開発ペースは、コミュニティの拡大を推進するオープンソースの取り組みに部分的に影響を与えている。
しかし、この新興ドメインは依然として共通の根拠を逃している。
(i)結果の再現性を確保すること、
(ii)適切なアドホックなベンチマークベースを提供する。
そこで本研究では,様々な特性,動作・観測空間特性,cpu要件の7つの軽量1dおよび2dフロー制御問題からなる,オープンソースのベンチマークライブラリであるbeaconを提案する。
このコントリビューションでは、考慮された7つの問題を説明し、参照制御ソリューションを提供する。
以下の作業のソースはhttps://github.com/jviquerat/beaconにある。
関連論文リスト
- Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - GAFlow: Incorporating Gaussian Attention into Optical Flow [62.646389181507764]
我々はガウス的注意(GA)を光学フローモデルに押し込み、表現学習中に局所特性をアクセントする。
本稿では,既存の Transformer ブロックに簡単に接続可能な新しい Gaussian-Constrained Layer (GCL) を提案する。
動作解析のための新しいガウス誘導注意モジュール(GGAM)を提供する。
論文 参考訳(メタデータ) (2023-09-28T07:46:01Z) - Active flow control for three-dimensional cylinders through deep
reinforcement learning [0.0]
本稿では,複数のゼロネット・マス・フラックス合成ジェットを用いたアクティブフロー制御の初回成功例を示す。
ジェットは、ドラッグ係数を低減するために、そのスパンに沿って三次元のシリンダー上に配置される。
この手法は,計算流体力学解法とエージェントを結合した深層強化学習フレームワークに基づいている。
論文 参考訳(メタデータ) (2023-09-04T13:30:29Z) - AccFlow: Backward Accumulation for Long-Range Optical Flow [70.4251045372285]
本稿では、長距離光フロー推定のためのAccFlowと呼ばれる新しいリカレントフレームワークを提案する。
従来の前方累積よりも後方累積の方が優れていることを示す。
長距離光流量推定におけるAccFlowの有効性を検証する実験
論文 参考訳(メタデータ) (2023-08-25T01:51:26Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Parallel bootstrap-based on-policy deep reinforcement learning for
continuous flow control applications [0.0]
学習過程における並行環境は、合理的な時間で効率的に制御するために不可欠な要素である。
本稿では,リターンブートストラッピングステップで終了する部分軌道バッファに依存する並列性パターンを提案する。
このアプローチは、文献からのCPU集約型連続フロー制御問題に説明される。
論文 参考訳(メタデータ) (2023-04-24T08:54:14Z) - Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。
この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文 参考訳(メタデータ) (2022-02-23T18:11:19Z) - FedADC: Accelerated Federated Learning with Drift Control [6.746400031322727]
フェデレーション学習(fl)は、プライバシーを懸念するエッジデバイス間のコラボレーション学習のためのデファクトフレームワークとなっている。
FLの大規模実装は、SGD用に設計された加速技術の分散環境への導入や、局所データセットの非均一分布によるドリフト問題の緩和など、新たな課題をもたらす。
flフレームワークに大きな変更を加えることなく、あるいは追加の計算と通信負荷を導入することなく、単一の戦略を使って両方の問題に対処することが可能であることを示す。
ドリフト制御を用いた加速FLアルゴリズムであるFedADCを提案する。
論文 参考訳(メタデータ) (2020-12-16T17:49:37Z) - SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep
Reinforcement Learning [102.78958681141577]
SUNRISEは単純な統一アンサンブル法であり、様々な非政治的な深層強化学習アルゴリズムと互換性がある。
SUNRISEは, (a) アンサンブルに基づく重み付きベルマンバックアップと, (b) 最上位の自信境界を用いて行動を選択する推論手法を統合し, 効率的な探索を行う。
論文 参考訳(メタデータ) (2020-07-09T17:08:44Z) - Single-step deep reinforcement learning for open-loop control of laminar
and turbulent flows [0.0]
本研究は,流体力学系の最適化と制御を支援するための深部強化学習(DRL)技術の能力を評価する。
原型ポリシー最適化(PPO)アルゴリズムの新たな"退化"バージョンを組み合わせることで、学習エピソード当たり1回だけシステムを最適化するニューラルネットワークをトレーニングする。
論文 参考訳(メタデータ) (2020-06-04T16:11:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。