論文の概要: Economic span selection of bridge based on deep reinforcement learning
- arxiv url: http://arxiv.org/abs/2407.06507v1
- Date: Tue, 9 Jul 2024 02:27:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-10 19:25:27.834353
- Title: Economic span selection of bridge based on deep reinforcement learning
- Title(参考訳): 深い強化学習に基づく橋梁の経済的な選択
- Authors: Leye Zhang, Xiangxiang Tian, Chengli Zhang, Hongjun Zhang,
- Abstract要約: ディープQネットワークアルゴリズムは、経済的な橋梁の選択に使用される。
橋梁の経済スパンを理論的に解析し, 経済スパンの理論解式を導出する。
- 参考スコア(独自算出の注目度): 1.4185188982404755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep Q-network algorithm is used to select economic span of bridge. Selection of bridge span has a significant impact on the total cost of bridge, and a reasonable selection of span can reduce engineering cost. Economic span of bridge is theoretically analyzed, and the theoretical solution formula of economic span is deduced. Construction process of bridge simulation environment is described in detail, including observation space, action space and reward function of the environment. Agent is constructed, convolutional neural network is used to approximate Q function,{\epsilon} greedy policy is used for action selection, and experience replay is used for training. The test verifies that the agent can successfully learn optimal policy and realize economic span selection of bridge. This study provides a potential decision-making tool for bridge design.
- Abstract(参考訳): ディープQネットワークアルゴリズムは、経済的な橋梁の選択に使用される。
橋梁の選定は橋梁の総コストに大きな影響を及ぼし、適切な橋梁の選択はエンジニアリングコストを低減させる。
橋梁の経済スパンを理論的に解析し, 経済スパンの理論解式を導出する。
橋梁シミュレーション環境の構築プロセスについて, 観測空間, 行動空間, 報奨関数などについて詳述する。
エージェントが構築され、畳み込みニューラルネットワークを使用してQ関数を近似し、アクション選択には{\epsilon}greedyポリシーを使用し、トレーニングにはエクスペリエンスリプレイを使用する。
この試験により, 最適政策の学習に成功し, 橋梁の経済的な選択を実現することができることを確認した。
本研究は橋梁設計のための潜在的な意思決定ツールを提供する。
関連論文リスト
- Bridge-IF: Learning Inverse Protein Folding with Markov Bridges [32.53142367116483]
逆タンパク質折り畳みは計算タンパク質設計の基本的な課題である。
逆折り畳みのための生成拡散ブリッジモデルであるBridge-IFを提案する。
以上の結果から,Bridge-IFは配列回復において既存のベースラインを超え,高い折りたたみ性を有する可塑性タンパク質の設計に優れることがわかった。
論文 参考訳(メタデータ) (2024-11-04T14:35:14Z) - Control, Transport and Sampling: Towards Better Loss Design [10.732151772173083]
我々は、最適制御されたダイナミクスを介して$nu$から$mu$への輸送に使用できる客観的関数を提案する。
我々は、パスワイズ・パースペクティブの重要性と、パス尺度における様々な最適条件が、有効なトレーニング損失の設計に果たす役割を強調した。
論文 参考訳(メタデータ) (2024-05-22T15:24:48Z) - An attempt to generate new bridge types from latent space of generative
adversarial network [2.05750372679553]
三次元ビームブリッジ,アーチブリッジ,ケーブルステイドブリッジ,サスペンションブリッジの対称構造画像データセットを用いる。
Pythonプログラミング言語とKerasディープラーニングプラットフォームフレームワークに基づいて、ジェネレーティブな敵ネットワークを構築し、訓練する。
論文 参考訳(メタデータ) (2024-01-01T08:46:29Z) - Active Exploration via Experiment Design in Markov Chains [86.41407938210193]
科学と工学における重要な課題は、未知の量の興味について学ぶために実験を設計することである。
本稿では,最適値に収束したポリシを効率的に選択するアルゴリズムを提案する。
理論分析に加えて,生態モニタリングと薬理学の応用に関する枠組みを概説する。
論文 参考訳(メタデータ) (2022-06-29T00:04:40Z) - Learning To Cut By Looking Ahead: Cutting Plane Selection via Imitation
Learning [80.45697245527019]
我々は、最良限の改善をもたらすカットを明示的に目指している欲求選択規則が、カット選択に対して強い決定を下すことを示す。
本研究では,頭頂部の専門家を対象とした模擬学習のための新しいニューラルアーキテクチャ(NeuralCut)を提案する。
論文 参考訳(メタデータ) (2022-06-27T16:07:27Z) - Simulation Paths for Quantum Circuit Simulation with Decision Diagrams [72.03286471602073]
決定図を用いて量子回路をシミュレートする際に選択される経路の重要性について検討する。
我々は、専用のシミュレーションパスを調査できるオープンソースのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-01T19:00:11Z) - A semi-supervised self-training method to develop assistive intelligence
for segmenting multiclass bridge elements from inspection videos [6.75013674088437]
本稿では,検査ビデオから多クラス橋要素をセグメント化するための補助情報モデルを開発する。
大規模な公開データセットで事前トレーニングされたマスクリージョンベースの畳み込みニューラルネットワーク(Mask R-CNN)が新しいタスクに転送された。
半教師付き自己訓練(S$3$T)法が開発され、経験豊富な検査官がネットワークを精査する。
論文 参考訳(メタデータ) (2021-09-10T19:22:45Z) - Online Active Model Selection for Pre-trained Classifiers [72.84853880948894]
我々は,任意のラウンドにおいて高い確率で最良のモデルをラベル付けし,出力する情報的サンプルを積極的に選択するオンライン選択的サンプリング手法を設計する。
我々のアルゴリズムは、敵とストリームの両方のオンライン予測タスクに利用できる。
論文 参考訳(メタデータ) (2020-10-19T19:53:15Z) - The multi-objective optimisation of breakwaters using evolutionary
approach [62.997667081978825]
工学的な実践では、港や海岸の既存の保護施設の有効性を高めることがしばしば必要である。
本稿では, ブレークウォーター最適化のための多目的進化的アプローチを提案する。
論文 参考訳(メタデータ) (2020-04-06T21:48:01Z) - Cost-Sensitive Portfolio Selection via Deep Reinforcement Learning [100.73223416589596]
深層強化学習を用いたコスト依存型ポートフォリオ選択手法を提案する。
具体的には、価格系列パターンと資産相関の両方を抽出するために、新しい2ストリームポートフォリオポリシーネットワークを考案した。
蓄積したリターンを最大化し、強化学習によるコストの両立を抑えるため、新たなコスト感受性報酬関数が開発された。
論文 参考訳(メタデータ) (2020-03-06T06:28:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。