論文の概要: Intelligent Collaborative Optimization for Rubber Tyre Film Production Based on Multi-path Differentiated Clipping Proximal Policy Optimization
- arxiv url: http://arxiv.org/abs/2511.12060v2
- Date: Wed, 19 Nov 2025 04:47:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 13:41:21.091243
- Title: Intelligent Collaborative Optimization for Rubber Tyre Film Production Based on Multi-path Differentiated Clipping Proximal Policy Optimization
- Title(参考訳): 多経路微分クリッピング近似最適化に基づくゴムタイヤフィルム製造のための知的協調最適化
- Authors: Yinghao Ruan, Wei Pang, Shuaihao Liu, Huili Yang, Leyi Han, Xinghui Dong,
- Abstract要約: 深層強化学習アルゴリズムについて紹介する:MPD-PPO(Multipathiated Different Clipping Proximal Policy Optimization)
MPD-PPOはチューニング精度と操作効率の両方で大幅に改善されている。
このフレームワークは、高次元性、多目的トレードオフ、動的適応など、重要な課題にうまく取り組みます。
- 参考スコア(独自算出の注目度): 7.195303822213173
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The advent of smart manufacturing is addressing the limitations of traditional centralized scheduling and inflexible production line configurations in the rubber tyre industry, especially in terms of coping with dynamic production demands. Contemporary tyre manufacturing systems form complex networks of tightly coupled subsystems pronounced nonlinear interactions and emergent dynamics. This complexity renders the effective coordination of multiple subsystems, posing an essential yet formidable task. For high-dimensional, multi-objective optimization problems in this domain, we introduce a deep reinforcement learning algorithm: Multi-path Differentiated Clipping Proximal Policy Optimization (MPD-PPO). This algorithm employs a multi-branch policy architecture with differentiated gradient clipping constraints to ensure stable and efficient high-dimensional policy updates. Validated through experiments on width and thickness control in rubber tyre film production, MPD-PPO demonstrates substantial improvements in both tuning accuracy and operational efficiency. The framework successfully tackles key challenges, including high dimensionality, multi-objective trade-offs, and dynamic adaptation, thus delivering enhanced performance and production stability for real-time industrial deployment in tyre manufacturing.
- Abstract(参考訳): スマートマニュファクチャリングの出現は、ゴムタイヤ産業における伝統的な集中型スケジューリングと非フレキシブル生産ライン構成の限界、特に動的生産需要に対応することの限界に対処している。
現代のタイヤ製造システムは、非線形相互作用と創発的ダイナミクスを発音する密結合サブシステムの複雑なネットワークを形成する。
この複雑さは、複数のサブシステムの効果的な調整を図り、本質的だが恐ろしくないタスクを振舞う。
この領域における高次元多目的最適化問題に対して,多経路微分クリッピング近似最適化 (MPD-PPO) という深層強化学習アルゴリズムを導入する。
このアルゴリズムは、安定かつ効率的な高次元ポリシー更新を保証するために、微分勾配クリッピング制約を持つマルチブランチポリシーアーキテクチャを採用している。
ゴムタイヤフィルム製造における幅と厚さの制御実験により検証され,MPD-PPOは調整精度と運転効率の両面で大幅に向上した。
このフレームワークは、高次元性、多目的トレードオフ、動的適応といった重要な課題に対処し、タイヤ製造におけるリアルタイム産業展開のためのパフォーマンスと生産安定性の向上を実現している。
関連論文リスト
- Optimizing Predictive Maintenance in Intelligent Manufacturing: An Integrated FNO-DAE-GNN-PPO MDP Framework [1.6921396880325779]
本稿では,高度なソフトコンピューティング技術を統合する新しいマルコフ決定プロセス(MDP)フレームワークを提案する。
このフレームワークは、最大13%のコスト削減で、複数のディープラーニングベースラインモデルよりも大幅に優れていることを示す。
このフレームワークは、データ駆動戦略を通じて、ダウンタイムと運用コストを効果的に削減する、相当な工業的可能性を秘めている。
論文 参考訳(メタデータ) (2025-11-05T13:21:29Z) - ACPO: Adaptive Curriculum Policy Optimization for Aligning Vision-Language Models in Complex Reasoning [17.928214942495412]
ACPOは、安定的で、準政治的な探索段階から、効率的で、非政治的な搾取段階へ、原則的な移行を編成する動的カリキュラムを採用している。
我々は、MathVista、LogicVista、MMMU-Proなど、挑戦的なマルチモーダル推論ベンチマークのスイートで広範な実験を行う。
その結果,ACPOはDAPOやPAPOなどの強いベースラインを一貫して上回り,最先端性能,収束の促進,訓練安定性の向上を実現している。
論文 参考訳(メタデータ) (2025-10-01T09:11:27Z) - Learning to Optimize Multi-Objective Alignment Through Dynamic Reward Weighting [48.87957020168614]
マルチリワード学習における以前の研究は、通常、固定重み付き線形スカラー化を使用しており、効果的なオンライン学習を捉えることができない。
目的整合性を高めるための2つのアプローチ、オンライン学習のためのもの、宇宙探査のためのものを紹介する。
論文 参考訳(メタデータ) (2025-09-14T21:56:35Z) - Simulation-Driven Reinforcement Learning in Queuing Network Routing Optimization [0.0]
本研究では、複雑な待ち行列ネットワークシステムにおけるルーティング決定を最適化するためのシミュレーション駆動強化学習(RL)フレームワークの開発に焦点をあてる。
我々は、Dyna-DDPG(Dyna-DDPG)とDyna-DDPG(Dyna-DDPG)を組み合わせた、Deep Deterministic Policy Gradient(DDPG)を利用したロバストなRLアプローチを提案する。
包括的な実験と厳密な評価は、効果的なルーティングポリシーを迅速に学習するフレームワークの能力を示している。
論文 参考訳(メタデータ) (2025-07-24T20:32:47Z) - RAG/LLM Augmented Switching Driven Polymorphic Metaheuristic Framework [5.10888539576355]
Polymorphic Metaheuristic Framework (PMF) は、リアルタイムパフォーマンスフィードバックと動的アルゴリズム選択によって駆動される自己適応型メタヒューリスティックスイッチング機構である。
AIによる意思決定と自己修正メカニズムを統合することで、PMFはスケーラブルでインテリジェントで自律的な最適化フレームワークの道を開いた。
論文 参考訳(メタデータ) (2025-05-20T01:41:22Z) - Synergistic Development of Perovskite Memristors and Algorithms for Robust Analog Computing [53.77822620185878]
本稿では,ペロブスカイト・メムリスタの製作を同時に最適化し,ロバストなアナログDNNを開発するための相乗的手法を提案する。
BO誘導ノイズインジェクションを利用したトレーニング戦略であるBayesMultiを開発した。
我々の統合されたアプローチは、より深くより広いネットワークでのアナログコンピューティングの使用を可能にし、最大100倍の改善を実現します。
論文 参考訳(メタデータ) (2024-12-03T19:20:08Z) - HarmoDT: Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning [72.25707314772254]
本稿では,各タスクに対するパラメータの最適な調和部分空間を特定するための新しいソリューションであるHarmoDT(Harmony Multi-Task Decision Transformer)を紹介する。
このフレームワークの上位レベルは、調和部分空間を規定するタスク固有のマスクの学習に特化しており、内部レベルは、統一されたポリシーの全体的なパフォーマンスを高めるためにパラメータの更新に重点を置いている。
論文 参考訳(メタデータ) (2024-05-28T11:41:41Z) - Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.460898983429374]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。
EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。
得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文 参考訳(メタデータ) (2023-12-10T15:22:30Z) - Proximal Policy Optimization-based Transmit Beamforming and Phase-shift
Design in an IRS-aided ISAC System for the THz Band [90.45915557253385]
テラヘルツ(THz)帯で動作するIRS支援統合センシング・通信(ISAC)システムを提案し,システム容量を最大化する。
透過ビームフォーミングと位相シフト設計はエルゴード制約を伴う普遍最適化問題に変換される。
論文 参考訳(メタデータ) (2022-03-21T09:15:18Z) - Multi-Objective Optimization of the Textile Manufacturing Process Using
Deep-Q-Network Based Multi-Agent Reinforcement Learning [5.900286890213338]
本稿では,最適化プロセスをゲームに変換するマルチエージェント強化学習(MARL)フレームワークを提案する。
このゲームでは,複数平衡の中断を避けるために実用的選択機構が採用された。
提案したMARLシステムは,繊維のオゾン化プロセスの最適解を実現することが可能であり,従来の手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2020-12-02T11:37:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。