論文の概要: Safe reinforcement learning with online filtering for fatigue-predictive human-robot task planning and allocation in production
- arxiv url: http://arxiv.org/abs/2604.12667v1
- Date: Tue, 14 Apr 2026 12:38:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.446546
- Title: Safe reinforcement learning with online filtering for fatigue-predictive human-robot task planning and allocation in production
- Title(参考訳): 疲労予測型ヒューマンロボットタスク計画と生産におけるアロケーションのためのオンラインフィルタリングによる安全強化学習
- Authors: Jintao Xue, Xiao Li, Nianmin Zhang,
- Abstract要約: 本稿では,人間ロボットのタスク計画とアロケーションの問題に対処する。
タスクをいつ実行するか、効率を最大化するために誰が実行するかを決定する必要がある。
疲労制約と生産力学を組み合わせることで、HRTPA問題の複雑さが大幅に増大する。
- 参考スコア(独自算出の注目度): 3.8704000484099264
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Human-robot collaborative manufacturing, a core aspect of Industry 5.0, emphasizes ergonomics to enhance worker well-being. This paper addresses the dynamic human-robot task planning and allocation (HRTPA) problem, which involves determining when to perform tasks and who should execute them to maximize efficiency while ensuring workers' physical fatigue remains within safe limits. The inclusion of fatigue constraints, combined with production dynamics, significantly increases the complexity of the HRTPA problem. Traditional fatigue-recovery models in HRTPA often rely on static, predefined hyperparameters. However, in practice, human fatigue sensitivity varies daily due to factors such as changed work conditions and insufficient sleep. To better capture this uncertainty, we treat fatigue-related parameters as inaccurate and estimate them online based on observed fatigue progression during production. To address these challenges, we propose PF-CD3Q, a safe reinforcement learning (safe RL) approach that integrates the particle filter with constrained dueling double deep Q-learning for real-time fatigue-predictive HRTPA. Specifically, we first develop PF-based estimators to track human fatigue and update fatigue model parameters in real-time. These estimators are then integrated into CD3Q by making task-level fatigue predictions during decision-making and excluding tasks that exceed fatigue limits, thereby constraining the action space and formulating the problem as a constrained Markov decision process (CMDP).
- Abstract(参考訳): 産業5.0の中核的な側面である人ロボット共同製造は、労働者の幸福を高めるために人間工学を強調している。
本稿では,作業者の身体的疲労を安全限度内に抑えつつ,作業の実施時期や効率を最大化するために行うべき課題を,動的ヒューマンロボットタスク計画・アロケーション(HRTPA)問題に対処する。
疲労制約と生産力学を組み合わせることで、HRTPA問題の複雑さが大幅に増大する。
HRTPAの伝統的な疲労回復モデルは、しばしば静的で事前定義されたハイパーパラメータに依存している。
しかし実際には、労働条件の変化や睡眠不足などの要因により、毎日の疲労感が変化する。
この不確実性をよりよく把握するために、疲労関連パラメータを不正確なものとして扱い、生産中に観察された疲労の進行に基づいてオンラインで見積もる。
これらの課題に対処するために、PF-CD3Qを提案する。これは安全な強化学習(セーフRL)アプローチであり、リアルタイム疲労予測型HRTPAに対して、粒子フィルタと制約付き二重深度Q-ラーニングを統合する。
具体的には、まず、人間の疲労を追跡し、疲労モデルパラメータをリアルタイムで更新するPFベースの推定器を開発する。
これらの推定器は、意思決定中にタスクレベルの疲労予測を行い、疲労限界を超えるタスクを除外することによりCD3Qに統合され、それによってアクション空間を制約し、マルコフ決定過程(CMDP)として問題を定式化する。
関連論文リスト
- FatigueFusion: Latent Space Fusion for Fatigue-Driven Motion Synthesis [3.5195917252906272]
本稿では,潜伏表現空間内での疲労特徴の融合のためのディープラーニングアーキテクチャであるFreepFusionを提案する。
本フレームワークはアルゴリズムおよびデータ駆動モジュールを組み込んで,不満足な動作に主観的時間的・空間的疲労特性を課す。
exhaustFusionは、不満足な関節角度シーケンスと制御パラメータを直接操作するエンドツーエンドアーキテクチャを提供する。
論文 参考訳(メタデータ) (2026-04-11T13:12:20Z) - Estimating Human Muscular Fatigue in Dynamic Collaborative Robotic Tasks with Learning-Based Models [0.19249287163937967]
本研究は,アームマウント表面筋電図(sEMG)を用いた動的循環型pHRIにおける疲労を推定するためのデータ駆動型フレームワークを提案する。
主観固有の機械学習回帰モデルは、3つの周波数領域と1つの時間領域EMG特徴からサイクルの疲労(FCF)を予測し、畳み込みニューラルネットワーク(CNN)に対してベンチマークする。
全体として、機能ベースのMLとスペクトログラムベースのDLの両方が繰り返しpHRI中に残される作業容量を推定できることを示した。
論文 参考訳(メタデータ) (2026-02-17T16:08:11Z) - Fatigue-PINN: Physics-Informed Fatigue-Driven Motion Modulation and Synthesis [2.0308338182844263]
疲労条件下での人間の動作をモデル化するための運動合成タスクには疲労モデリングが不可欠である。
本稿では,物理インフォームドニューラルネットワークに基づくディープラーニングフレームワークであるFreep-PINNを提案する。
本研究では,三成分制御モデルのPINN適応を利用して最大関節トルクの疲労誘起変動をシミュレートする。
論文 参考訳(メタデータ) (2025-02-26T11:14:48Z) - Model Predictive Task Sampling for Efficient and Robust Adaptation [57.414812940406996]
本稿では,タスク空間と適応リスク分布をブリッジするフレームワークであるモデル予測タスクサンプリング(MPTS)を紹介する。
MPTSは、エピソード最適化プロセスの特徴付けに生成モデルを使用し、後部推論によりタスク固有の適応リスクを予測する。
MPTSはゼロショット、少数ショット、教師付き微調整設定にシームレスに統合される。
論文 参考訳(メタデータ) (2025-01-19T13:14:53Z) - Towards Robust Continual Learning with Bayesian Adaptive Moment Regularization [51.34904967046097]
継続的な学習は、モデルが以前に学習した情報を忘れてしまう破滅的な忘れ込みの課題を克服しようとする。
本稿では,パラメータ成長の制約を緩和し,破滅的な忘れを減らし,新しい事前手法を提案する。
以上の結果から, BAdamは, 単頭クラスインクリメンタル実験に挑戦する先行手法に対して, 最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-09-15T17:10:51Z) - Long Short-term Memory with Two-Compartment Spiking Neuron [64.02161577259426]
LSTM-LIFとよばれる,生物学的にインスパイアされたLong Short-Term Memory Leaky Integrate-and-Fireのスパイキングニューロンモデルを提案する。
実験結果は,時間的分類タスクの多種多様な範囲において,優れた時間的分類能力,迅速な訓練収束,ネットワークの一般化性,LSTM-LIFモデルの高エネルギー化を実証した。
したがって、この研究は、新しいニューロモルフィック・コンピューティング・マシンにおいて、困難な時間的処理タスクを解決するための、無数の機会を開放する。
論文 参考訳(メタデータ) (2023-07-14T08:51:03Z) - Vision-based Estimation of Fatigue and Engagement in Cognitive Training
Sessions [9.018775341716305]
本研究では,リアルタイムな心的疲労をモニタリングするための新しいリカレントビデオトランス (RVT) 手法を開発し,検証する。
RVTモデルは最先端のバイナリモデルと比較して高いバランスの取れた精度(78%)と精度(0.82)を達成した。
論文 参考訳(メタデータ) (2023-04-24T21:58:14Z) - Clinical Risk Prediction with Temporal Probabilistic Asymmetric
Multi-Task Learning [80.66108902283388]
マルチタスク学習手法は、臨床リスク予測などの安全クリティカルな応用に注意を払って使用すべきである。
既存の非対称なマルチタスク学習手法は、低損失のタスクから高損失のタスクへの知識伝達を行うことにより、この負の伝達問題に対処する。
特徴レベルの不確実性に基づいて,特定のタスク/タイムステップから関連する不確実なタスクへの知識伝達を行う,新しい時間的非対称型マルチタスク学習モデルを提案する。
論文 参考訳(メタデータ) (2020-06-23T06:01:36Z) - Risk-Aware Energy Scheduling for Edge Computing with Microgrid: A
Multi-Agent Deep Reinforcement Learning Approach [82.6692222294594]
マイクログリッドを用いたMECネットワークにおけるリスク対応エネルギースケジューリング問題について検討する。
ニューラルネットワークを用いたマルチエージェントディープ強化学習(MADRL)に基づくアドバンテージアクター・クリティック(A3C)アルゴリズムを適用し,その解を導出する。
論文 参考訳(メタデータ) (2020-02-21T02:14:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。