論文の概要: Learning Where, What and How to Transfer: A Multi-Role Reinforcement Learning Approach for Evolutionary Multitasking
- arxiv url: http://arxiv.org/abs/2511.15199v1
- Date: Wed, 19 Nov 2025 07:38:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.687
- Title: Learning Where, What and How to Transfer: A Multi-Role Reinforcement Learning Approach for Evolutionary Multitasking
- Title(参考訳): 進化的マルチタスクのためのマルチロール強化学習アプローチ
- Authors: Jiajun Zhan, Zeyuan Ma, Yue-Jiao Gong, Kay Chen Tan,
- Abstract要約: 強化学習による体系的で一般化可能な知識伝達政策の設計について検討する。
主な課題は、転送(場所)のタスクの決定、転送される知識(何)、転送(方法)のメカニズムである。
- 参考スコア(独自算出の注目度): 32.26014625728783
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Evolutionary multitasking (EMT) algorithms typically require tailored designs for knowledge transfer, in order to assure convergence and optimality in multitask optimization. In this paper, we explore designing a systematic and generalizable knowledge transfer policy through Reinforcement Learning. We first identify three major challenges: determining the task to transfer (where), the knowledge to be transferred (what) and the mechanism for the transfer (how). To address these challenges, we formulate a multi-role RL system where three (groups of) policy networks act as specialized agents: a task routing agent incorporates an attention-based similarity recognition module to determine source-target transfer pairs via attention scores; a knowledge control agent determines the proportion of elite solutions to transfer; and a group of strategy adaptation agents control transfer strength by dynamically controlling hyper-parameters in the underlying EMT framework. Through pre-training all network modules end-to-end over an augmented multitask problem distribution, a generalizable meta-policy is obtained. Comprehensive validation experiments show state-of-the-art performance of our method against representative baselines. Further in-depth analysis not only reveals the rationale behind our proposal but also provide insightful interpretations on what the system have learned.
- Abstract(参考訳): 進化的マルチタスク(EMT)アルゴリズムは通常、マルチタスク最適化における収束性と最適性を保証するために、知識伝達のための調整された設計を必要とする。
本稿では,強化学習による体系的で一般化可能な知識伝達政策の設計について検討する。
まず、転送すべきタスク(場所)、転送すべき知識(何)、転送のメカニズム(方法)の3つの大きな課題を特定します。
これらの課題に対処するために,3つの(グループの)ポリシーネットワークが特別なエージェントとして機能するマルチロールRLシステムを定式化する。タスクルーティングエージェントは,アテンションスコアを介してソースとターゲットのトランスファーペアを決定するために,アテンションベースの類似度認識モジュールを組み込む。知識制御エージェントは,転送に対するエリートソリューションの割合を決定する。戦略適応エージェントのグループは,基盤となるEMTフレームワークのハイパーパラメータを動的に制御することで,転送強度を制御する。
拡張マルチタスク問題分布上で、すべてのネットワークモジュールをエンドツーエンドに事前学習することにより、一般化可能なメタポリシーを得る。
総合的検証実験により,提案手法の汎用ベースラインに対する最先端性能を示す。
さらに詳細な分析は、提案の背景にある理論的根拠を明らかにするだけでなく、システムが学んだことに関する洞察に富んだ解釈も提供する。
関連論文リスト
- From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning [62.54484062185869]
本稿では,エージェントの強化学習プロセスの最適化にステップワイド報酬を利用するStepAgentを紹介する。
エージェント反射とポリシー調整を容易にする暗黙の逆・逆の強化学習手法を提案する。
論文 参考訳(メタデータ) (2024-11-06T10:35:11Z) - Learning to Transfer for Evolutionary Multitasking [30.01466615418299]
進化的マルチタスク(EMT)は、マルチタスク最適化問題(MTOP)を解決するための新しいアプローチである。
暗黙のEMTにおける現在のアプローチは、限られた数の進化演算子を使用するため、適応性の課題に直面している。
本稿では,MTOPの効率的なKTポリシーを自動検出する新しいLearning to Transfer(L2T)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-20T14:31:24Z) - Enabling Multi-Agent Transfer Reinforcement Learning via Scenario
Independent Representation [0.7366405857677227]
マルチエージェント強化学習(MARL)アルゴリズムは、エージェント間の協調や競合を必要とする複雑なタスクに広く採用されている。
本稿では,様々な状態空間を固定サイズの入力に統一することで,MARLの伝達学習を可能にする新しいフレームワークを提案する。
スクラッチから学習するエージェントと比較して,他のシナリオから学んだ操作スキルを用いたマルチエージェント学習性能の大幅な向上を示す。
論文 参考訳(メタデータ) (2024-02-13T02:48:18Z) - Network Slicing via Transfer Learning aided Distributed Deep
Reinforcement Learning [7.126310378721161]
本稿では, セル間リソース分割のためのマルチエージェント間類似性解析を用いた多エージェント深部強化学習(MADRL)手法を提案する。
提案手法は, 性能, 収束速度, サンプル効率の観点から, 最先端のソリューションよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-01-09T10:55:13Z) - UPDeT: Universal Multi-agent Reinforcement Learning via Policy
Decoupling with Transformers [108.92194081987967]
タスクに適合する1つのアーキテクチャを設計し、汎用的なマルチエージェント強化学習パイプラインを最初に試行する。
従来のRNNモデルとは異なり、トランスフォーマーモデルを用いてフレキシブルなポリシーを生成する。
提案方式はUPDeT(Universal Policy Decoupling Transformer)と名付けられ,動作制限を緩和し,マルチエージェントタスクの決定プロセスをより説明しやすいものにする。
論文 参考訳(メタデータ) (2021-01-20T07:24:24Z) - Dif-MAML: Decentralized Multi-Agent Meta-Learning [54.39661018886268]
我々は,MAML や Dif-MAML と呼ばれる協調型マルチエージェントメタ学習アルゴリズムを提案する。
提案手法により, エージェントの集合が線形速度で合意に達し, 集約MAMLの定常点に収束できることを示す。
シミュレーションの結果は従来の非協調的な環境と比較して理論的な結果と優れた性能を示している。
論文 参考訳(メタデータ) (2020-10-06T16:51:09Z) - Unsupervised Transfer Learning for Spatiotemporal Predictive Networks [90.67309545798224]
我々は、教師なし学習されたモデルの動物園から別のネットワークへ知識を伝達する方法を研究する。
私たちのモチベーションは、モデルは異なるソースからの複雑なダイナミクスを理解することが期待されていることです。
提案手法は,時間的予測のための3つのベンチマークで大幅に改善され,重要度が低いベンチマークであっても,ターゲットのメリットが得られた。
論文 参考訳(メタデータ) (2020-09-24T15:40:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。