Fugu-MT 論文翻訳(概要): Beacon, a lightweight deep reinforcement learning benchmark library for flow control

論文の概要: Beacon, a lightweight deep reinforcement learning benchmark library for flow control

arxiv url: http://arxiv.org/abs/2402.17402v2
Date: Thu, 18 Apr 2024 08:58:27 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-19 14:09:37.687434
Title: Beacon, a lightweight deep reinforcement learning benchmark library for flow control
Title（参考訳）: Beacon - フロー制御のための軽量深部強化学習ベンチマークライブラリ
Authors: Jonathan Viquerat, Philippe Meliga, Pablo Jeken, Elie Hachem,
Abstract要約: 本研究では,7つの軽量な1次元フロー制御問題と2次元フロー制御問題からなるオープンソースのベンチマークライブラリであるBeaconを提案する。このコントリビューションでは、考慮すべき7つの問題を記述し、参照制御ソリューションを提供する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Recently, the increasing use of deep reinforcement learning for flow control problems has led to a new area of research, focused on the coupling and the adaptation of the existing algorithms to the control of numerical fluid dynamics environments. Although still in its infancy, the field has seen multiple successes in a short time span, and its fast development pace can certainly be partly imparted to the open-source effort that drives the expansion of the community. Yet, this emerging domain still misses a common ground to (i) ensure the reproducibility of the results, and (ii) offer a proper ad-hoc benchmarking basis. To this end, we propose Beacon, an open-source benchmark library composed of seven lightweight 1D and 2D flow control problems with various characteristics, action and observation space characteristics, and CPU requirements. In this contribution, the seven considered problems are described, and reference control solutions are provided. The sources for the following work are available at https://github.com/jviquerat/beacon.
Abstract（参考訳）: 近年,流れ制御問題に対する深部強化学習の利用が増加し,数値流体力学環境の制御に対する既存アルゴリズムの結合と適応に着目した新たな研究領域が生まれている。初期段階ではあるが、この分野は短期間で複数の成功を経験しており、その開発ペースは間違いなく、コミュニティの拡大を推進しているオープンソースの取り組みの一部に委ねられている。しかし、この新興ドメインは依然として共通の根拠を逃している。一結果の再現性を確保すること。 (ii)適切なアドホックベンチマークベースを提供する。そこで本研究では,7つの軽量1次元および2次元フロー制御問題からなるオープンソースのベンチマークライブラリであるBeaconを提案する。このコントリビューションでは、考慮すべき7つの問題を記述し、参照制御ソリューションを提供する。以下の作業のソースはhttps://github.com/jviquerat/beacon.comにある。

関連論文リスト

LEAR: Learning Edge-Aware Representations for Event-to-LiDAR Localization [15.308350522323588]
LEARは、エッジ構造と高密度事象深度流れ場を共同で推定し、知覚とモダリティの分断を橋渡しする。いくつかの人気があり、挑戦的なデータセットにおいて、LEARは最高の先行メソッドよりも優れたパフォーマンスを達成している。
論文参考訳（メタデータ） (2026-03-02T13:18:25Z)
Controllable Exploration in Hybrid-Policy RLVR for Multi-Modal Reasoning [88.42566960813438]
CalibRLは、制御可能な探索と専門家のガイダンスをサポートするハイブリッド政治RLVRフレームワークである。 CalibRLは政策エントロピーを誘導的に増加させ、目標分布を明らかにする。ドメイン内設定とドメイン外設定の両方を含む8つのベンチマークの実験は、一貫した改善を示している。
論文参考訳（メタデータ） (2026-02-22T07:23:36Z)
Plug-and-Play Benchmarking of Reinforcement Learning Algorithms for Large-Scale Flow Control [61.155940786140455]
強化学習(RL)は,アクティブフロー制御(AFC)において有望な結果を示した。現在のAFCベンチマークは、外部計算流体力学(CFD)の解法に依存しており、完全には微分不可能であり、3Dとマルチエージェントのサポートが限られている。 AFCにおけるRLのための最初のスタンドアロンで完全に差別化可能なベンチマークスイートであるFluidGymを紹介する。
論文参考訳（メタデータ） (2026-01-21T14:13:44Z)
Learning Power Control Protocol for In-Factory 6G Subnetworks [0.8466004732265869]
In-X Subnetworksは、多様な6Gユースケースにおける短距離通信の厳しい要求を満たすために構想されている。電力制御は、潜在的に高いサブネットワーク密度に起因する干渉の影響を軽減するために重要である。本稿では、アクセスポイントが信号制御プロトコルと電力制御プロトコルの両方を自律的に学習できるように設計された、新しいマルチエージェント強化学習フレームワークを提案する。
論文参考訳（メタデータ） (2025-05-09T11:39:18Z)
OccLinker: Deflickering Occupancy Networks through Lightweight Spatio-Temporal Correlation [15.726401007342087]
視覚ベースの占有ネットワーク(VON)は、自動運転における3D環境を再構築するためのエンドツーエンドのソリューションを提供する。近年のアプローチでは、この問題を軽減するために歴史的データを組み込んでいるが、しばしば高い計算コストを発生させ、物体検出に干渉するノイズの多い情報を導入している。我々はOccLinkerを提案する。OccLinkerは既存のVONとシームレスに統合してパフォーマンスを向上させるための新しいプラグインフレームワークである。
論文参考訳（メタデータ） (2025-02-21T13:07:45Z)
Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文参考訳（メタデータ） (2024-04-05T17:58:37Z)
GAFlow: Incorporating Gaussian Attention into Optical Flow [62.646389181507764]
我々はガウス的注意(GA)を光学フローモデルに押し込み、表現学習中に局所特性をアクセントする。本稿では,既存の Transformer ブロックに簡単に接続可能な新しい Gaussian-Constrained Layer (GCL) を提案する。動作解析のための新しいガウス誘導注意モジュール(GGAM)を提供する。
論文参考訳（メタデータ） (2023-09-28T07:46:01Z)
Active flow control for three-dimensional cylinders through deep reinforcement learning [0.0]
本稿では,複数のゼロネット・マス・フラックス合成ジェットを用いたアクティブフロー制御の初回成功例を示す。ジェットは、ドラッグ係数を低減するために、そのスパンに沿って三次元のシリンダー上に配置される。この手法は,計算流体力学解法とエージェントを結合した深層強化学習フレームワークに基づいている。
論文参考訳（メタデータ） (2023-09-04T13:30:29Z)
AccFlow: Backward Accumulation for Long-Range Optical Flow [70.4251045372285]
本稿では、長距離光フロー推定のためのAccFlowと呼ばれる新しいリカレントフレームワークを提案する。従来の前方累積よりも後方累積の方が優れていることを示す。長距離光流量推定におけるAccFlowの有効性を検証する実験
論文参考訳（メタデータ） (2023-08-25T01:51:26Z)
Small Object Detection via Coarse-to-fine Proposal Generation and Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。 CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文参考訳（メタデータ） (2023-08-18T13:13:09Z)
Parallel bootstrap-based on-policy deep reinforcement learning for continuous flow control applications [0.0]
学習過程における並行環境は、合理的な時間で効率的に制御するために不可欠な要素である。本稿では,リターンブートストラッピングステップで終了する部分軌道バッファに依存する並列性パターンを提案する。このアプローチは、文献からのCPU集約型連続フロー制御問題に説明される。
論文参考訳（メタデータ） (2023-04-24T08:54:14Z)
Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文参考訳（メタデータ） (2022-02-23T18:11:19Z)
FedADC: Accelerated Federated Learning with Drift Control [6.746400031322727]
フェデレーション学習(fl)は、プライバシーを懸念するエッジデバイス間のコラボレーション学習のためのデファクトフレームワークとなっている。 FLの大規模実装は、SGD用に設計された加速技術の分散環境への導入や、局所データセットの非均一分布によるドリフト問題の緩和など、新たな課題をもたらす。 flフレームワークに大きな変更を加えることなく、あるいは追加の計算と通信負荷を導入することなく、単一の戦略を使って両方の問題に対処することが可能であることを示す。ドリフト制御を用いた加速FLアルゴリズムであるFedADCを提案する。
論文参考訳（メタデータ） (2020-12-16T17:49:37Z)
SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep Reinforcement Learning [102.78958681141577]
SUNRISEは単純な統一アンサンブル法であり、様々な非政治的な深層強化学習アルゴリズムと互換性がある。 SUNRISEは, (a) アンサンブルに基づく重み付きベルマンバックアップと, (b) 最上位の自信境界を用いて行動を選択する推論手法を統合し, 効率的な探索を行う。
論文参考訳（メタデータ） (2020-07-09T17:08:44Z)
Single-step deep reinforcement learning for open-loop control of laminar and turbulent flows [0.0]
本研究は,流体力学系の最適化と制御を支援するための深部強化学習(DRL)技術の能力を評価する。原型ポリシー最適化(PPO)アルゴリズムの新たな"退化"バージョンを組み合わせることで、学習エピソード当たり1回だけシステムを最適化するニューラルネットワークをトレーニングする。
論文参考訳（メタデータ） (2020-06-04T16:11:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。