Fugu-MT 論文翻訳(概要): Multipath agents for modular multitask ML systems

論文の概要: Multipath agents for modular multitask ML systems

arxiv url: http://arxiv.org/abs/2302.02721v1
Date: Mon, 6 Feb 2023 11:57:45 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-07 16:45:38.895043
Title: Multipath agents for modular multitask ML systems
Title（参考訳）: モジュール型マルチタスクmlシステムのためのマルチパスエージェント
Authors: Andrea Gesmundo
Abstract要約: 提案した研究は、複数のメソッドを異なるエージェントとして定義できる新しい方法論を紹介した。エージェントは、与えられたタスクに対するMLモデルの生成と改善のために協力し、競争することができる。
参考スコア（独自算出の注目度）: 2.579908688646812
License: http://creativecommons.org/licenses/by/4.0/
Abstract: A standard ML model is commonly generated by a single method that specifies aspects such as architecture, initialization, training data and hyperparameters configuration. The presented work introduces a novel methodology allowing to define multiple methods as distinct agents. Agents can collaborate and compete to generate and improve ML models for a given tasks. The proposed methodology is demonstrated with the generation and extension of a dynamic modular multitask ML system solving more than one hundred image classification tasks. Diverse agents can compete to produce the best performing model for a task by reusing the modules introduced to the system by competing agents. The presented work focuses on the study of agents capable of: 1) reusing the modules generated by concurrent agents, 2) activating in parallel multiple modules in a frozen state by connecting them with trainable modules, 3) condition the activation mixture on each data sample by using a trainable router module. We demonstrate that this simple per-sample parallel routing method can boost the quality of the combined solutions by training a fraction of the activated parameters.
Abstract（参考訳）: 標準MLモデルは、アーキテクチャ、初期化、トレーニングデータ、ハイパーパラメータ設定などのアスペクトを指定する単一のメソッドによって一般的に生成される。本稿では,複数のメソッドを異なるエージェントとして定義できる新しい手法を提案する。エージェントは、与えられたタスクに対するMLモデルの生成と改善のために協力し、競争することができる。提案手法は,100以上の画像分類課題を解いた動的モジュール型マルチタスクmlシステムの生成と拡張によって実証された。多様なエージェントは、競合エージェントによってシステムに導入されたモジュールを再利用することで、タスクの最高のパフォーマンスモデルを作成するために競争することができる。本研究は, 有能なエージェントの研究に焦点を当てたものである。 1) 並行エージェントが生成するモジュールの再利用 2)複数のモジュールを凍結状態で並列に活性化し、それらを訓練可能なモジュールで接続する。 3) トレーニング可能なルータモジュールを用いて各データサンプル上でのアクティベーション混合を条件とする。この単純なサンプル毎の並列ルーティング手法は、活性化されたパラメータのほんの一部をトレーニングすることで、組み合わせソリューションの品質を高めることができる。

関連論文リスト

Learning to Chain Operations by Routing Information Through a Global Workspace [3.1614158472531435]
本稿では,グローバルワークスペース理論(Global Workspace Theory)にインスパイアされたモデルを提案する。モデルの性能を単純な追加タスクで評価し、そこでは2つの加算をまとめる必要がある。本研究は,深層学習の推論能力を高めるため,グローバルワークスペース理論に触発されたアーキテクチャの可能性を強調した。
論文参考訳（メタデータ） (2025-02-28T15:30:55Z)
Model Evolution Framework with Genetic Algorithm for Multi-Task Reinforcement Learning [85.91908329457081]
マルチタスク強化学習は、様々なシナリオにまたがって一般化可能なエージェントを開発することを目的として、様々なタスクを完遂するために単一のポリシーを採用する。既存のアプローチでは、ルーティングネットワークを使用して各タスクの特定のルートを生成し、モジュールのセットをさまざまなモデルに再構築し、複数のタスクを同時に完了させるのが一般的である。本稿では,遺伝的アルゴリズム(MEGA)を用いたモデル進化フレームワークを提案する。
論文参考訳（メタデータ） (2025-02-19T09:22:34Z)
Efficient and Effective Weight-Ensembling Mixture of Experts for Multi-Task Model Merging [111.8456671452411]
マルチタスク学習(MTL)は、共有モデルを利用して複数のタスクを遂行し、知識伝達を促進する。マルチタスクモデル統合のためのウェイトエンセブリング・ミックス・オブ・エキスパート(WEMoE)手法を提案する。 WEMoEとE-WEMoEは, MTL性能, 一般化, 堅牢性の観点から, 最先端(SOTA)モデルマージ法より優れていることを示す。
論文参考訳（メタデータ） (2024-10-29T07:16:31Z)
Towards Modular LLMs by Building and Reusing a Library of LoRAs [64.43376695346538]
マルチタスクデータに対して最適なアダプタライブラリを構築する方法について検討する。モデルベースクラスタリング(MBC)を導入し,パラメータの類似性に基づいてタスクをグループ化する手法を提案する。ライブラリを再使用するために,最も関連性の高いアダプタの動的選択を可能にする新しいゼロショットルーティング機構であるArrowを提案する。
論文参考訳（メタデータ） (2024-05-18T03:02:23Z)
Merging Multi-Task Models via Weight-Ensembling Mixture of Experts [64.94129594112557]
異なるタスクでトレーニングされたTransformerベースのモデルを単一の統一モデルにマージすることで、すべてのタスクを同時に実行できる。従来の手法は、タスク演算によって例示され、効率的かつスケーラブルであることが証明されている。本稿では,Transformer層をMoEモジュールにアップスケーリングしながら,ほとんどのパラメータをマージすることを提案する。
論文参考訳（メタデータ） (2024-02-01T08:58:57Z)
Contrastive Modules with Temporal Attention for Multi-Task Reinforcement Learning [29.14234496784581]
マルチタスク強化学習のためのCMTA法を用いたコントラストモジュールを提案する。 CMTAは、互いに異なるモジュールを対照的に学習し、共有モジュールをタスクレベルよりも細かい粒度で組み合わせることによって制約する。実験の結果,CMTAは各タスクを個別に学習し,大幅な性能向上を実現していることがわかった。
論文参考訳（メタデータ） (2023-11-02T08:41:00Z)
Towards Robust Multi-Modal Reasoning via Model Selection [7.6621866737827045]
LLMはエージェントの"脳"として機能し、協調的な多段階タスク解決のための複数のツールを編成する。我々はテスト時に無視できるランタイムオーバーヘッドを持つプラグインとして、$textitM3$フレームワークを提案する。実験の結果,我々のフレームワークは,ユーザ入力とサブタスク依存の両方を考慮した動的モデル選択を可能にすることがわかった。
論文参考訳（メタデータ） (2023-10-12T16:06:18Z)
BYOM: Building Your Own Multi-Task Model For Free [69.63765907216442]
BYOM-FFTは完全微調整モデルのマージ用であり、BYOM-LoRAはLoRA微調整モデルのマージ用である。コンピュータビジョンと自然言語処理タスクの実験により、提案手法は既存のマージ手法よりも大きなマージ率で優れていることが示された。
論文参考訳（メタデータ） (2023-10-03T08:39:33Z)
MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
MADiffは拡散型マルチエージェント学習フレームワークである。分散ポリシと集中型コントローラの両方として機能する。実験の結果,MADiffは様々なマルチエージェント学習タスクにおいて,ベースラインアルゴリズムよりも優れていた。
論文参考訳（メタデータ） (2023-05-27T02:14:09Z)
OFASys: A Multi-Modal Multi-Task Learning System for Building Generalist Models [72.8156832931841]
ジェネリストモデルは、単一のモデル内でタスクに依存しない方法で多様なマルチモーダルタスクを実行することができる。マルチモーダル命令と呼ばれる宣言型タスクインタフェース上に構築された汎用モデル学習システムOFASysをリリースする。
論文参考訳（メタデータ） (2022-12-08T17:07:09Z)
Compositional Models: Multi-Task Learning and Knowledge Transfer with Modular Networks [13.308477955656592]
本稿では,ResNetの等尺バージョンに基づくモジュールネットワーク学習手法を提案する。本手法では,モジュールを繰り返し呼び出すことができ,新しいタスクへの知識伝達を可能にする。本手法は,マルチタスク学習,移動学習,ドメイン適応の場合に,モジュールの解釈可能な自己組織化につながることを示す。
論文参考訳（メタデータ） (2021-07-23T00:05:55Z)
MALib: A Parallel Framework for Population-based Multi-agent Reinforcement Learning [61.28547338576706]
人口ベースマルチエージェント強化学習(PB-MARL)は、強化学習(RL)アルゴリズムでネストした一連の手法を指す。 PB-MARLのためのスケーラブルで効率的な計算フレームワークMALibを提案する。
論文参考訳（メタデータ） (2021-06-05T03:27:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。