論文の概要: A reinforcement learning based decision support system in textile
manufacturing process
- arxiv url: http://arxiv.org/abs/2005.09867v1
- Date: Wed, 20 May 2020 06:33:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 04:37:20.791302
- Title: A reinforcement learning based decision support system in textile
manufacturing process
- Title(参考訳): 繊維製造プロセスにおける強化学習に基づく意思決定支援システム
- Authors: Zhenglei He (GEMTEX), Kim Phuc Tran (GEMTEX), S\'ebastien Thomassey
(GEMTEX), Xianyi Zeng (GEMTEX), Changhai Yi
- Abstract要約: 本稿では,繊維製造工程における強化学習支援システムについて紹介する。
提案したMDPモデルは,繊維製造プロセスの最適化問題をよく表している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduced a reinforcement learning based decision support system
in textile manufacturing process. A solution optimization problem of color
fading ozonation is discussed and set up as a Markov Decision Process (MDP) in
terms of tuple {S, A, P, R}. Q-learning is used to train an agent in the
interaction with the setup environment by accumulating the reward R. According
to the application result, it is found that the proposed MDP model has well
expressed the optimization problem of textile manufacturing process discussed
in this paper, therefore the use of reinforcement learning to support decision
making in this sector is conducted and proven that is applicable with promising
prospects.
- Abstract(参考訳): 本稿では,繊維製造プロセスにおける強化学習に基づく意思決定支援システムを提案する。
カラーフェーディングオゾン化の解最適化問題を議論し、タプル {S, A, P, R} の観点からマルコフ決定過程(MDP)として設定する。
q-learningは,報酬rを蓄積することで,エージェントと設定環境との相互作用を訓練するために用いられる。本論文では,提案するmdpモデルが繊維製造プロセスの最適化問題をよく表しており,本分野における意思決定を支援する強化学習の利用が有望な予測に当てはまることを証明している。
関連論文リスト
- Enhancing Multi-Step Reasoning Abilities of Language Models through Direct Q-Function Optimization [50.485788083202124]
強化学習(Reinforcement Learning, RL)は、大規模言語モデルを人間の好みと整合させ、複雑なタスクを遂行する能力を向上させる上で重要な役割を担っている。
反応生成過程をマルコフ決定プロセス(MDP)として定式化し,ソフトアクター・クリティック(SAC)フレームワークを用いて,言語モデルによって直接パラメータ化されたQ関数を最適化する,直接Q関数最適化(DQO)を提案する。
GSM8KとMATHという2つの数学問題解決データセットの実験結果から、DQOは従来の手法よりも優れており、言語モデルを整合させるための有望なオフライン強化学習手法として確立されている。
論文 参考訳(メタデータ) (2024-10-11T23:29:20Z) - Cognitive LLMs: Towards Integrating Cognitive Architectures and Large Language Models for Manufacturing Decision-making [51.737762570776006]
LLM-ACTRは、ヒトに適応し、多目的な意思決定を提供する新しいニューロシンボリックアーキテクチャである。
我々のフレームワークは、ACT-Rの内部決定過程の知識を潜在神経表現として抽出し、組み込む。
デザイン・フォー・マニュファクチャリング・タスクに関する我々の実験は、タスク性能の向上と基礎的意思決定能力の向上を両立させたものである。
論文 参考訳(メタデータ) (2024-08-17T11:49:53Z) - Optimized Task Assignment and Predictive Maintenance for Industrial
Machines using Markov Decision Process [0.0]
本稿では,タスク割り当てと条件に基づく機械の健康維持のための分散意思決定手法について考察する。
マルコフ決定プロセスに基づく意思決定エージェントの設計を提案する。
論文 参考訳(メタデータ) (2024-01-20T12:12:14Z) - Let's reward step by step: Step-Level reward model as the Navigators for
Reasoning [64.27898739929734]
Process-Supervised Reward Model (PRM)は、トレーニングフェーズ中にステップバイステップのフィードバックをLLMに提供する。
LLMの探索経路を最適化するために,PRMからのステップレベルのフィードバックを応用した欲求探索アルゴリズムを提案する。
提案手法の汎用性を探るため,コーディングタスクのステップレベル報酬データセットを自動生成する手法を開発し,コード生成タスクにおける同様の性能向上を観察する。
論文 参考訳(メタデータ) (2023-10-16T05:21:50Z) - Flexible Job Shop Scheduling via Dual Attention Network Based
Reinforcement Learning [73.19312285906891]
フレキシブルなジョブショップスケジューリング問題(FJSP)では、複数のマシンで操作を処理でき、操作とマシンの間の複雑な関係が生じる。
近年, 深層強化学習(DRL)を用いて, FJSP解決のための優先派遣規則(PDR)を学習している。
本稿では,Deep機能抽出のための自己注意モデルと,スケーラブルな意思決定のためのDRLの利点を生かした,エンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-09T01:35:48Z) - A study on a Q-Learning algorithm application to a manufacturing
assembly problem [0.8937905773981699]
本研究では,対象物の集合問題に対する強化学習アルゴリズムの実装に焦点を当てた。
環境との連続的な相互作用からQ値の行列(Q-table)を学習することを考慮して,モデルフリーQ-Learningアルゴリズムを適用した。
最適化アプローチは、98.3%の時間で最適なアセンブリシーケンスを学習することで、非常に有望な結果を得た。
論文 参考訳(メタデータ) (2023-04-17T15:38:34Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - A Deep Reinforcement Learning Based Multi-Criteria Decision Support
System for Textile Manufacturing Process Optimization [5.900286890213338]
本論文では、インテリジェントデータに基づくランダムフォレスト(RF)モデルと、人知に基づく分析階層プロセス(AHP)構造を組み合わせた意思決定支援システムを提案する。
このシステムの有効性は,織物のオゾン処理を最適化する事例で検証されている。
論文 参考訳(メタデータ) (2020-12-29T15:09:48Z) - Multi-Objective Optimization of the Textile Manufacturing Process Using
Deep-Q-Network Based Multi-Agent Reinforcement Learning [5.900286890213338]
本稿では,最適化プロセスをゲームに変換するマルチエージェント強化学習(MARL)フレームワークを提案する。
このゲームでは,複数平衡の中断を避けるために実用的選択機構が採用された。
提案したMARLシステムは,繊維のオゾン化プロセスの最適解を実現することが可能であり,従来の手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2020-12-02T11:37:44Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。