論文の概要: MAT-Agent: Adaptive Multi-Agent Training Optimization
- arxiv url: http://arxiv.org/abs/2510.17845v1
- Date: Fri, 10 Oct 2025 19:41:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-26 16:57:26.504124
- Title: MAT-Agent: Adaptive Multi-Agent Training Optimization
- Title(参考訳): MAT-Agent: 適応型マルチエージェントトレーニング最適化
- Authors: Jusheng Zhang, Kaitong Cai, Yijia Fan, Ningyuan Liu, Keze Wang,
- Abstract要約: マルチラベル画像分類は、複雑で進化する視覚風景をナビゲートするために適応的なトレーニング戦略を要求する。
MAT-Agentは、協調的リアルタイム最適化プロセスとしてトレーニングを再定義する新しいマルチエージェントフレームワークである。
- 参考スコア(独自算出の注目度): 9.922228276424393
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-label image classification demands adaptive training strategies to navigate complex, evolving visual-semantic landscapes, yet conventional methods rely on static configurations that falter in dynamic settings. We propose MAT-Agent, a novel multi-agent framework that reimagines training as a collaborative, real-time optimization process. By deploying autonomous agents to dynamically tune data augmentation, optimizers, learning rates, and loss functions, MAT-Agent leverages non-stationary multi-armed bandit algorithms to balance exploration and exploitation, guided by a composite reward harmonizing accuracy, rare-class performance, and training stability. Enhanced with dual-rate exponential moving average smoothing and mixed-precision training, it ensures robustness and efficiency. Extensive experiments across Pascal VOC, COCO, and VG-256 demonstrate MAT-Agent's superiority: it achieves an mAP of 97.4 (vs. 96.2 for PAT-T), OF1 of 92.3, and CF1 of 91.4 on Pascal VOC; an mAP of 92.8 (vs. 92.0 for HSQ-CvN), OF1 of 88.2, and CF1 of 87.1 on COCO; and an mAP of 60.9, OF1 of 70.8, and CF1 of 61.1 on VG-256. With accelerated convergence and robust cross-domain generalization, MAT-Agent offers a scalable, intelligent solution for optimizing complex visual models, paving the way for adaptive deep learning advancements.
- Abstract(参考訳): マルチラベル画像分類は、複雑で進化するビジュアル・セマンティックな風景をナビゲートするための適応的なトレーニング戦略を要求するが、従来の手法は動的設定に干渉する静的な設定に依存している。
MAT-Agentは、協調的リアルタイム最適化プロセスとしてトレーニングを再定義する新しいマルチエージェントフレームワークである。
データ拡張、オプティマイザ、学習率、損失関数を動的にチューニングするために自律エージェントをデプロイすることで、MAT-Agentは、非定常マルチアームバンディットアルゴリズムを活用して、探索とエクスプロイトのバランスをとる。
2レートの指数運動平均平滑化と混合精度トレーニングによって強化され、堅牢性と効率が保証される。
パスカルVOC、COCO、VG-256にわたる大規模な実験は、MAT-Agentの優位性を示している: 97.4(PAT-Tは96.2)、92.3(PAT-Tは96.1)、CF1(PAT-CvNは91.4)、mAPは92.8(HSQ-CvNは92.0)、CF1(COCOは87.1)、mAPは60.9(PAT-Tは96.2)、CF1(VG-256は61.1)。
収束の加速とクロスドメインの堅牢な一般化により、MAT-Agentは複雑なビジュアルモデルを最適化するためのスケーラブルでインテリジェントなソリューションを提供し、適応的なディープラーニングの進歩の道を開いた。
関連論文リスト
- From Static to Dynamic: Adaptive Monte Carlo Search for Mathematical Process Supervision [49.59309446816251]
既存手法は, 定予算サンプリング戦略に基づいて, 推論ステップの質を推定する。
本稿では,データ生成を静的から適応に変換するフレームワークであるAdaptive Monte Carlo Search (AMCS)を提案する。
AMCSは、より多くのサンプルを不確実な推論ステップに割り当てることによって、予測を適応的に洗練し、予測しやすくする。
論文 参考訳(メタデータ) (2025-09-29T06:52:35Z) - Heart Disease Prediction: A Comparative Study of Optimisers Performance in Deep Neural Networks [0.0]
そこで我々は,Kaggleの心臓病データセットを用いて,シンプルな多層パーセプトロンモデルのトレーニングにおける10種類のアプローチの性能を比較した。
我々は、一貫したトレーニングパラダイムを設定し、収束速度や安定性などのメトリクスに基づいてメトリクスを評価する。
すべてのメトリクスに対して、重要なメトリクス間でバランスのとれたパフォーマンスを提供するため、この心臓病予測タスクに最も効果的であるようにRMSPropを選択しました。
論文 参考訳(メタデータ) (2025-09-10T11:15:44Z) - GRAM-MAMBA: Holistic Feature Alignment for Wireless Perception with Adaptive Low-Rank Compensation [8.217823995127201]
スマートホーム、インテリジェントトランスポート、産業自動化、ヘルスケアに広くデプロイされている、IoT(Internet of Things)の認識には、マルチモーダル融合が不可欠である。
既存のシステムは、しばしば課題に直面している。高モデル複雑さは、リソースに制約のある環境へのデプロイを妨げる。
本稿では,センサ時系列の効率的な処理に線形複雑マンバモデルを用いるGRAM-MAMBAと,モーダル間のペアアライメントを最適化したGRAM行列戦略を提案する。
論文 参考訳(メタデータ) (2025-07-18T10:30:37Z) - ESSA: Evolutionary Strategies for Scalable Alignment [8.418036456622158]
我々は,前向き推論とブラックボックス最適化のみを用いて,Large Language Models (LLM) を整列する勾配のないフレームワークであるESSAを提案する。
ESSAはQwen2.5-Math-7Bのテスト精度をGSM8Kで12.6%、PRM800Kで14.8%改善し、IFEvalでLLaMA3.1-8Bの精度を22.5%向上させた。
大規模な設定では、ESSAは勾配ベースの方法よりもスケーリングが強い。
論文 参考訳(メタデータ) (2025-07-06T16:23:07Z) - AegisLLM: Scaling Agentic Systems for Self-Reflective Defense in LLM Security [74.22452069013289]
AegisLLMは、敵の攻撃や情報漏洩に対する協調的なマルチエージェント防御である。
テスト時のエージェント推論システムのスケーリングは,モデルの有用性を損なうことなく,ロバスト性を大幅に向上させることを示す。
アンラーニングやジェイルブレイクを含む主要な脅威シナリオに対する総合的な評価は、AegisLLMの有効性を示している。
論文 参考訳(メタデータ) (2025-04-29T17:36:05Z) - Collab: Controlled Decoding using Mixture of Agents for LLM Alignment [90.6117569025754]
人間のフィードバックからの強化学習は、大規模言語モデルを整合させる効果的な手法として現れてきた。
制御された復号化は、再訓練せずに推論時にモデルを整列するメカニズムを提供する。
本稿では,既存の既成のLCMポリシを活用するエージェントベースのデコーディング戦略の混合を提案する。
論文 参考訳(メタデータ) (2025-03-27T17:34:25Z) - Building Math Agents with Multi-Turn Iterative Preference Learning [56.71330214021884]
本稿では,モデル性能をさらに向上させるために,補完的な直接選好学習手法について検討する。
既存の直接選好学習アルゴリズムは、もともとシングルターンチャットタスク用に設計されている。
この文脈に合わせたマルチターン直接選好学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-04T02:41:04Z) - Dynamic Multi-Objective Lion Swarm Optimization with Multi-strategy Fusion: An application in 6R robot trajectory planning [11.421300692057029]
本研究では,MF-DMOLSO (MF-DMOLSO) を用いた動的多目的ライオン群最適化手法を提案する。
MF-DMOLSOは初期化、Swarm位置更新、外部アーカイブ更新の3つの重要なコンポーネントから構成される。
6Rロボット軌道計画の適用により、MF-DMOLSOは走行時間と最大加速を8.3sと0.3pi rad/s2に最適化し、70.97%に設定された。
論文 参考訳(メタデータ) (2024-05-31T18:05:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。