Fugu-MT 論文翻訳(概要): Reinforcement Learning for Flexibility Design Problems

論文の概要: Reinforcement Learning for Flexibility Design Problems

arxiv url: http://arxiv.org/abs/2101.00355v2
Date: Mon, 18 Jan 2021 14:35:06 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-13 07:21:53.274324
Title: Reinforcement Learning for Flexibility Design Problems
Title（参考訳）: フレキシビリティ設計問題に対する強化学習
Authors: Yehua Wei, Lei Zhang, Ruiyi Zhang, Shijing Si, Hao Zhang, Lawrence Carin
Abstract要約: フレキシビリティ設計問題に対する強化学習フレームワークを開発した。実験の結果、RL法は古典的手法よりも優れた解を常に見出すことがわかった。
参考スコア（独自算出の注目度）: 77.37213643948108
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Flexibility design problems are a class of problems that appear in strategic decision-making across industries, where the objective is to design a ($e.g.$, manufacturing) network that affords flexibility and adaptivity. The underlying combinatorial nature and stochastic objectives make flexibility design problems challenging for standard optimization methods. In this paper, we develop a reinforcement learning (RL) framework for flexibility design problems. Specifically, we carefully design mechanisms with noisy exploration and variance reduction to ensure empirical success and show the unique advantage of RL in terms of fast-adaptation. Empirical results show that the RL-based method consistently finds better solutions compared to classical heuristics.
Abstract（参考訳）: フレキシビリティ設計問題(英: Flexibility design problem)とは、産業間の戦略的意思決定において、柔軟性と適応性を持つネットワーク(例えば製造コスト)を設計することを目的とする問題である。基礎となる組合せの性質と確率的目的は、標準最適化法において柔軟性設計の問題を引き起こす。本稿では、柔軟性設計問題に対する強化学習(RL)フレームワークを開発する。具体的には、実験的な成功を確実にするため、ノイズ探索と分散低減によるメカニズムを慎重に設計し、高速適応の観点からRLの独特な利点を示す。実験結果から、RLに基づく手法は古典的ヒューリスティックよりも優れた解を常に見出すことが示された。

関連論文リスト

Learning Memory-Enhanced Improvement Heuristics for Flexible Job Shop Scheduling [39.98859285173431]
フレキシブルなジョブショップスケジューリング問題(FJSP)は、現実の運用シナリオと複雑で強い整合性のため、大きな注目を集めている。現在の深部強化学習(DRL)に基づくFJSPのアプローチは主に建設的手法を採用している。本稿では,異種グラフ表現を用いたメモリ拡張改善検索フレームワーク-MIStarを提案する。
論文参考訳（メタデータ） (2026-03-03T10:43:01Z)
Large Language Models for Design Structure Matrix Optimization [4.513609458468522]
複雑なエンジニアリングシステムでは、設計構造行列(DSM)を用いてコンポーネントや開発活動間の相互依存性をモデル化し分析することが多い。フィードバックループを最小限に抑え、モジュール性やプロセス効率を向上させるためにDSM内の要素を再編成することは、エンジニアリング設計と運用において困難な最適化問題となっている。本研究では, 大規模言語モデル (LLM) が, 高度な推論や文脈理解にその能力を活用することで, そうしたCO問題の解決を支援する可能性について検討する。
論文参考訳（メタデータ） (2025-06-11T13:53:35Z)
Preference Optimization for Combinatorial Optimization Problems [54.87466279363487]
強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文参考訳（メタデータ） (2025-05-13T16:47:00Z)
Efficient Design of Compliant Mechanisms Using Multi-Objective Optimization [50.24983453990065]
そこで本研究では,大きな角状脳卒中を許容できる適合型クロスヒンジ機構の合成について述べる。キネトスタティックな性能測定に基づいて,多目的最適化問題を定式化する。
論文参考訳（メタデータ） (2025-04-23T06:29:10Z)
Generative Reliability-Based Design Optimization Using In-Context Learning Capabilities of Large Language Models [0.8356765961526956]
LLM(Large Language Models)は、コンテキスト内学習機能を示す。本稿では,LLMの文脈内学習機能を活用した生成設計手法を提案する。
論文参考訳（メタデータ） (2025-03-28T13:10:04Z)
Robust Asymmetric Heterogeneous Federated Learning with Corrupted Clients [60.22876915395139]
本稿では、異種・データ破損クライアントをモデルとした頑健な連立学習課題について検討する。データ破損は、ランダムノイズ、圧縮アーティファクト、現実のデプロイメントにおける環境条件などの要因によって避けられない。本稿では,これらの問題に対処する新しいロバスト非対称不均一なフェデレート学習フレームワークを提案する。
論文参考訳（メタデータ） (2025-03-12T09:52:04Z)
Navigating Demand Uncertainty in Container Shipping: Deep Reinforcement Learning for Enabling Adaptive and Feasible Master Stowage Planning [3.565151496245487]
本研究では、状態依存的制約を伴う逐次動的意思決定問題に対処する。関連性のある実世界のケーススタディとして、コンテナの出荷におけるストーッジ計画の問題に注目します。本稿では,凸制約を満たすエンコーダ・デコーダモデルとファシビリティ層を備えた深いRLフレームワークを提案する。
論文参考訳（メタデータ） (2025-02-18T11:18:17Z)
Towards Autonomous Experimentation: Bayesian Optimization over Problem Formulation Space for Accelerated Alloy Development [0.31457219084519]
問題定式化空間上のベイズ最適化を利用して最適な設計定式化を同定する新しい枠組みを提案する。ガスタービンエンジンブレード応用を目的としたMo-Nb-Ti-V-W合金系におけるインサイリコケーススタディにより,本手法の有効性を実証した。今後は、人間のフィードバックを取り入れて、実世界の実験環境におけるシステムの適応性をさらに強化していく予定だ。
論文参考訳（メタデータ） (2025-02-09T01:05:58Z)
Liner Shipping Network Design with Reinforcement Learning [1.833650794546064]
本稿では,Liner Shipping Network Design Problem (LSNDP) に対処する新しい強化学習フレームワークを提案する。提案手法では,ALIBをベースとしたマルチコモディティ・フロー・ソルバと統合したモデルレス強化学習アルゴリズムをネットワーク設計に適用する。
論文参考訳（メタデータ） (2024-11-13T22:49:16Z)
Can Learned Optimization Make Reinforcement Learning Less Difficult? [70.5036361852812]
学習の最適化が強化学習の難しさを克服するのに役立つかどうかを検討する。本稿では, 塑性, 探索および非定常性のための学習最適化手法(OPEN)を用いて, 入力特性と出力構造がこれらの困難に対して予め提案された情報によって通知される更新規則をメタラーニングする。
論文参考訳（メタデータ） (2024-07-09T17:55:23Z)
Hybrid Reinforcement Learning Framework for Mixed-Variable Problems [0.7146036252503987]
離散変数選択のためのRLと連続変数調整のためのベイズ最適化を組み合わせたハイブリッド強化学習(RL)フレームワークを提案する。提案手法は,従来のRL,ランダム探索,スタンドアローンベイズ最適化を有効性と効率で常に上回っている。
論文参考訳（メタデータ） (2024-05-30T21:42:33Z)
Instance-Conditioned Adaptation for Large-scale Generalization of Neural Combinatorial Optimization [15.842155380912002]
本研究は,ニューラル最適化の大規模一般化のための新しいインスタンス・コンディション適応モデル(ICAM)を提案する。特に,NCOモデルのための強力なインスタンス条件付きルーティング適応モジュールを設計する。我々は,ラベル付き最適解を使わずに,モデルがクロススケールな特徴を学習することのできる,効率的な3段階強化学習ベーストレーニング手法を開発した。
論文参考訳（メタデータ） (2024-05-03T08:00:19Z)
Generative Inverse Design of Metamaterials with Functional Responses by Interpretable Learning [3.931881794708454]
ランダムフォレストに基づく解釈可能生成逆設計(RIGID)を提案する。 RIGIDは、オンデマンド機能挙動を持つメタマテリアル設計を高速に生成するための単発逆設計法である。 RIGIDの音響的・光学的メタマテリアル設計問題に対する評価を行った。
論文参考訳（メタデータ） (2023-12-08T04:24:03Z)
Accelerate Presolve in Large-Scale Linear Programming via Reinforcement Learning [92.31528918811007]
本稿では,P1)-(P3) を同時に扱うための簡易かつ効率的な強化学習フレームワーク,すなわち,事前解決のための強化学習(RL4Presolve)を提案する。 2つの解法と8つのベンチマーク(実世界と合成)の実験により、RL4Presolveは大規模LPの解法効率を大幅に改善することを示した。
論文参考訳（メタデータ） (2023-10-18T09:51:59Z)
Reinforcement Learning with Stepwise Fairness Constraints [50.538878453547966]
本稿では,段階的公正性制約を伴う強化学習について紹介する。我々は、ポリシーの最適性と公正性違反に関して、強力な理論的保証を持つ学習アルゴリズムを提供する。
論文参考訳（メタデータ） (2022-11-08T04:06:23Z)
Revisiting GANs by Best-Response Constraint: Perspective, Methodology, and Application [49.66088514485446]
ベストレスポンス制約(Best-Response Constraint、BRC)は、ジェネレータのディスクリミネータへの依存性を明示的に定式化する一般的な学習フレームワークである。モチベーションや定式化の相違があっても, フレキシブルBRC法により, 様々なGANが一様に改善できることが示される。
論文参考訳（メタデータ） (2022-05-20T12:42:41Z)
Reversible Action Design for Combinatorial Optimization with Reinforcement Learning [35.50454156611722]
強化学習(rl)は、これらの問題に取り組むための新しいフレームワークとして最近登場した。最先端の実証性能を示すだけでなく、様々な種類のCOPに一般化する汎用RLフレームワークを提案します。
論文参考訳（メタデータ） (2021-02-14T18:05:42Z)
Optimization-Inspired Learning with Architecture Augmentations and Control Mechanisms for Low-Level Vision [74.9260745577362]
本稿では,GDC(Generative, Discriminative, and Corrective)の原則を集約する,最適化に着想を得た統合学習フレームワークを提案する。フレキシブルな組み合わせで最適化モデルを効果的に解くために,3つのプロパゲーティブモジュールを構築した。低レベル視覚タスクにおける実験は、GDCの有効性と適応性を検証する。
論文参考訳（メタデータ） (2020-12-10T03:24:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。