論文の概要: Multi-Head Attention-Based Feature Extractor Integration with Soft Actor-Critic for Porosity Prediction and Process Parameter Optimization in Additive Manufacturing
- arxiv url: http://arxiv.org/abs/2606.20087v1
- Date: Thu, 18 Jun 2026 11:07:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.810612
- Title: Multi-Head Attention-Based Feature Extractor Integration with Soft Actor-Critic for Porosity Prediction and Process Parameter Optimization in Additive Manufacturing
- Title(参考訳): 付加製造における多面的アテンションに基づく特徴外乱器とソフトアクター・クオリティの統合によるポロシティ予測とプロセスパラメータ最適化
- Authors: Kianoush Aqabakee, Leonardo Stella,
- Abstract要約: 伝統的な強化学習アプローチは、緩やかな収束と局所的な最適性への感受性に悩まされている。
本研究では、連続的なアクション空間と新しいアーキテクチャを組み合わせることで、これらの制約に対処する。
提案手法は,14エピソード以内の収束値322.79を達成し,既存手法より優れている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Additive manufacturing process optimization requires precise parameter control to minimize defects such as porosity. Traditional reinforcement learning (RL) approaches using discrete action spaces suffer from slow convergence and susceptibility to local optima, limiting their effectiveness for high-precision manufacturing tasks. This study addresses these limitations by employing a continuous action space combined with a novel architecture that integrates a multi-head attention mechanism with the Soft Actor-Critic (SAC) algorithm. The attention-based feature extractor enhances the agent's ability to capture subtle variations in low-dimensional input features, enabling more effective exploration-exploitation balance for navigating value spaces with local minima. We validate our approach on porosity prediction and process parameter optimization in laser powder bed fusion, demonstrating faster convergence and higher final reward values compared to standard RL methods including DQN, PPO, TD3, and vanilla SAC. The proposed methodology achieves a convergence value of 322.79 within 14 episodes, outperforming existing approaches while maintaining stability throughout training.
- Abstract(参考訳): 付加的な製造プロセスの最適化には、ポーシティなどの欠陥を最小限に抑えるために正確なパラメータ制御が必要である。
離散的な行動空間を用いた従来の強化学習(RL)アプローチは、局所最適性に対する緩やかな収束と感受性に悩まされ、高精度な製造タスクに対するその効果が制限される。
本研究では,マルチヘッドアテンション機構とSoft Actor-Critic (SAC)アルゴリズムを統合した,連続的なアクション空間と新しいアーキテクチャを組み合わせることで,これらの制約に対処する。
注意に基づく特徴抽出器は、低次元入力特徴の微妙な変動を捕捉するエージェントの能力を高め、局所的なミニマで値空間をナビゲートするためのより効率的な探索・探索バランスを可能にする。
DQN, PPO, TD3, バニラSACなどの標準RL法と比較して, レーザ粉末層融合におけるポーシティ予測とプロセスパラメータ最適化の手法の有効性を検証した。
提案手法は,14エピソード以内の収束値322.79を達成し,トレーニングを通しての安定性を維持しつつ,既存のアプローチよりも優れていた。
関連論文リスト
- NeuroPareto: Calibrated Acquisition for Costly Many-Goal Search in Vast Parameter Spaces [13.246738608273711]
NeuroParetoは、ランク中心のフィルタリング、不確実性回避、履歴条件付き取得戦略を統合する、凝集性のあるアーキテクチャである。
歴史的ハイパーボリュームの改善からオンラインでトレーニングされた軽量な取得ネットワークは、収束と多様性のバランスをとる領域に対する高価な評価を導く。
論文 参考訳(メタデータ) (2026-02-03T10:02:06Z) - Nemotron-Flash: Towards Latency-Optimal Hybrid Small Language Models [97.55009021098554]
本研究の目的は、SLMのリアルタイムレイテンシの主要な決定要因を特定し、SLMの設計とトレーニングのための一般化可能な原則と方法論を提供することである。
我々はNemotron-Flashと呼ばれるハイブリッドSLMの新たなファミリーを導入し、最先端SLMの精度・効率のフロンティアを大幅に向上させる。
論文 参考訳(メタデータ) (2025-11-24T08:46:36Z) - Intersection of Reinforcement Learning and Bayesian Optimization for Intelligent Control of Industrial Processes: A Safe MPC-based DPG using Multi-Objective BO [0.0]
Model Predictive Control (MPC)ベースのReinforcement Learning (RL)は、Deep Neural Network (DNN)ベースのRL手法の、構造化された解釈可能な代替手段を提供する。
標準MPC-RLアプローチは、収束の遅さ、パラメータ化の制限による最適条件学習、オンライン適応時の安全性の問題に悩まされることが多い。
MPC-RLと多目的ベイズ最適化(MOBO)を統合した新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-14T02:31:52Z) - Exploration from a Primal-Dual Lens: Value-Incentivized Actor-Critic Methods for Sample-Efficient Online RL [40.05960121330012]
複雑な関数近似を持つオンライン強化学習(RL)は、現代の人工知能の実践において重要な役割を果たす。
探検と搾取の基本的なトレードオフのバランスは、依然として長年にわたる課題である。
本稿では,主対最適化のレンズによる楽観主義の原理を解釈する。
論文 参考訳(メタデータ) (2025-06-27T17:18:43Z) - LLM-guided Chemical Process Optimization with a Multi-Agent Approach [8.714038047141202]
本稿では,最小限のプロセス記述から動作制約を自律的に推論するマルチエージェントLLMフレームワークを提案する。
当社のAutoGenベースのフレームワークは、制約生成、パラメータ検証、シミュレーション、最適化ガイダンスのための特別なエージェントを備えたOpenAIのo3モデルを採用しています。
論文 参考訳(メタデータ) (2025-06-26T01:03:44Z) - Tuning for Trustworthiness -- Balancing Performance and Explanation Consistency in Neural Network Optimization [49.567092222782435]
我々は,異なる特徴帰属法間の合意として定義された,XAI整合性という新しい概念を紹介する。
予測性能と説明のバランスをとる多目的最適化フレームワークを構築した。
本研究は、トレードオフゾーンバランス性能損失とXAI整合性による強靭性向上のモデルについて、今後の研究基盤を提供する。
論文 参考訳(メタデータ) (2025-05-12T13:19:14Z) - A Simple and Effective Reinforcement Learning Method for Text-to-Image Diffusion Fine-tuning [61.403275660120606]
強化学習(Reinforcement Learning, RL)に基づく微調整は, 拡散モデルとブラックボックスの目的を整合させる強力なアプローチとして登場した。
拡散微調整のための新しいRLであるLOOP(Left-one-out PPO)を提案する。
以上の結果から, LOOPは様々なブラックボックス対象の拡散モデルを効果的に改善し, 計算効率と性能のバランスを良くすることを示す。
論文 参考訳(メタデータ) (2025-03-02T13:43:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。