論文の概要: LargeMonitor: Monitoring Online Task-Free Continual Learning via Large Pretrained Models
- arxiv url: http://arxiv.org/abs/2606.09430v1
- Date: Mon, 08 Jun 2026 12:41:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:07.065373
- Title: LargeMonitor: Monitoring Online Task-Free Continual Learning via Large Pretrained Models
- Title(参考訳): LargeMonitor: 大規模事前トレーニングモデルによるオンラインタスクフリー連続学習の監視
- Authors: Mingqi Yuan, Xiaoquan Sun, Shihao Luo, Jiayu Chen,
- Abstract要約: オンラインタスクフリー連続学習(TFCL)では、インテリジェントエージェントが非定常データストリームからの知識を逐次蓄積する必要がある。
既存のオンラインTFCLパラダイムは、トレーニング結合された最適化ダイナミクスによって駆動されるパラメータ効率の高いプロンプトチューニングや動的構造拡張に依存している。
我々は,タスクフリーな継続的適応を自律的にオーケストレーションするために,大規模な事前学習基盤モデルを活用するフレームワークであるLargeMonitorを提案する。
- 参考スコア(独自算出の注目度): 5.257217773590746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online task-free continual learning (TFCL) requires intelligent agents to sequentially accumulate knowledge from an unbounded, non-stationary data stream under strict single-pass constraints and without any explicit task identifiers. Existing online TFCL paradigms primarily rely on parameter-efficient prompt tuning or dynamic structure expansion driven by training-coupled optimization dynamics, such as empirical loss fluctuations or evolving latent distances. As a result, these training-coupled solvers remain agnostic to the structural origins of distribution drift, mechanically enforcing a fixed strategy across fundamentally distinct streaming variations. To address this gap, we propose LargeMonitor, a framework that leverages large pretrained foundation models to autonomously orchestrate task-free continuous adaptation. Specifically, LargeMonitor introduces a decoupled detection module utilizing the frozen, stable representation space of large vision models (LVMs) to achieve robust, zero-shot drift detection without training-dependent interference or brittle threshold tuning. Upon a confirmed drift, the framework activates a context-aware diagnostic module driven by large multimodal models (LMMs) to interpret the precise semantic etiologies of the stream variation (e.g., novel class emergence vs. environmental domain shift). This dual-stage capability empowers the continuous learner to dynamically deploy adaptive and shift-specific optimization strategies. Extensive experiments across multiple TFCL settings and benchmarks demonstrate that LargeMonitor achieves precise, robust detection and diagnosis of complex data streams while consistently improving the performance of existing online TFCL algorithms.
- Abstract(参考訳): オンラインタスクフリー連続学習(TFCL)では、知的エージェントが厳密な単一パス制約の下で、明示的なタスク識別子なしで、非定常データストリームからの知識を逐次蓄積する必要がある。
既存のオンラインTFCLパラダイムは、主にパラメータ効率のよいプロンプトチューニングや、経験的損失変動や潜伏距離の進化など、トレーニングと結合した最適化ダイナミクスによって駆動される動的構造拡張に依存している。
結果として、これらのトレーニング結合型解法は、分散ドリフトの構造的起源を知らないままであり、基本的に異なるストリーミング変動に対する固定戦略を機械的に実施する。
このギャップを解決するために,大規模な事前学習基盤モデルを利用してタスクフリーな継続的適応を自律的にオーケストレーションするフレームワークであるLargeMonitorを提案する。
具体的には、大規模ビジョンモデル(LVM)の凍結した安定した表現空間を利用して、トレーニング依存の干渉や不安定なしきい値チューニングを伴わずに、堅牢でゼロショットドリフト検出を実現する。
ドリフトが確認されると、このフレームワークは、大きなマルチモーダルモデル(LMM)によって駆動されるコンテキスト認識診断モジュールを起動し、ストリーム変動の正確なセマンティックエティロジー(例えば、新しいクラス出現と環境ドメインシフト)を解釈する。
このデュアルステージ機能は、継続的学習者が適応性とシフト固有の最適化戦略を動的に展開することを可能にする。
複数のTFCL設定とベンチマークにわたる大規模な実験により、LargeMonitorは、既存のオンラインTFCLアルゴリズムのパフォーマンスを一貫して改善しつつ、複雑なデータストリームの正確で堅牢な検出と診断を実現している。
関連論文リスト
- Multi-scale Coarse-to-fine Modeling for Test-time Human Motion Control [51.92884966472683]
MSCoTは、テストタイムの人間のモーション合成と制御のための、マルチスケールで粗い粒度モデルである。
MSCoTは動きを多スケールの階層表現に識別し、各時間スケールでトークンシーケンス全体を予測する。
論文 参考訳(メタデータ) (2026-05-14T15:09:49Z) - SAMOFT: Robust Multi-Object Tracking via Region and Flow [42.6206516982406]
マルチオブジェクトトラッキング(MOT)は、コンピュータビジョンにおける基本的なタスクであり、複数のターゲットを継続的に追跡する必要がある。
既存のアプローチのほとんどは、軌道関連のためのインスタンスレベルのオブジェクト機能に依存しています。
我々は,複雑な動作シナリオ下でのロバスト性向上のために,画素レベルのキューを活用するロバストトラッカーSAMOFTを提案する。
論文 参考訳(メタデータ) (2026-05-10T08:39:54Z) - Drift-Aware Online Dynamic Learning for Nonstationary Multivariate Time Series: Application to Sintering Quality Prediction [8.77587871192859]
堅牢な多時間予測性能を維持するために,DA-MSDL(Drift-Aware Multi-Scale Dynamic Learning)フレームワークを提案する。
提案フレームワークは,非定常環境における品質モニタリングに有効なオンライン動的学習パラダイムを提供する。
論文 参考訳(メタデータ) (2026-04-10T14:30:57Z) - UniT: Unified Multimodal Chain-of-Thought Test-time Scaling [85.590774707406]
統一モデルは単一のアーキテクチャ内でマルチモーダル理解と生成の両方を扱うことができるが、通常は出力を反復的に書き換えることなく単一のパスで操作する。
マルチモーダルなテストタイムスケーリングのためのフレームワークであるUniTを導入し、単一の統一モデルで複数のラウンドをまたいだ推論、検証、精査を可能にします。
論文 参考訳(メタデータ) (2026-02-12T18:59:49Z) - Guided Verifier: Collaborative Multimodal Reasoning via Dynamic Process Supervision [11.159231524113764]
マルチモーダル大規模言語モデル(MLLM)の複雑な推論能力を高めるための重要なメカニズムとして強化学習(RL)が登場した。
本稿では,これらの構造的制約に対処する textbfGuided Verifier フレームワークを提案する。
我々は,マルチモーダル幻覚をターゲットとした特殊なデータ合成パイプラインを開発し,プロセスレベルの負の textbfCoRe データセットとtextbfCorrect-guide textbfReasoning トラジェクトリを構築し,ガイド付き検証器を訓練する。
論文 参考訳(メタデータ) (2026-02-04T07:38:42Z) - Unsupervised Online 3D Instance Segmentation with Synthetic Sequences and Dynamic Loss [52.28880405119483]
教師なしのオンライン3Dインスタンスのセグメンテーションは、基本的だが難しい課題だ。
UNITのような既存の手法はこの方向に進んできたが、訓練の多様性が制限されているままである。
本稿では,合成点雲列生成によるトレーニング分布の強化を目的とした新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-27T08:53:27Z) - Spatial-Temporal-Spectral Unified Modeling for Remote Sensing Dense Prediction [20.1863553357121]
リモートセンシングのための現在のディープラーニングアーキテクチャは、基本的に堅固である。
本稿では,統合モデリングのための空間時間スペクトル統一ネットワーク(STSUN)について紹介する。
STSUNは任意の空間サイズ、時間長、スペクトル帯域で入力および出力データに適応することができる。
様々な密集した予測タスクと多様な意味クラス予測を統一する。
論文 参考訳(メタデータ) (2025-05-18T07:39:17Z) - Enhancing Online Continual Learning with Plug-and-Play State Space Model and Class-Conditional Mixture of Discretization [72.81319836138347]
オンライン連続学習(OCL)は、以前に学習したタスクの知識を保持しながら、一度だけ現れるデータストリームから新しいタスクを学習することを目指している。
既存の方法の多くはリプレイに依存しており、正規化や蒸留によるメモリ保持の強化に重点を置いている。
既存のほとんどのメソッドに組み込むことができ、適応性を直接改善できるプラグイン・アンド・プレイモジュールであるS6MODを導入する。
論文 参考訳(メタデータ) (2024-12-24T05:25:21Z) - Stochastic Control for Fine-tuning Diffusion Models: Optimality, Regularity, and Convergence [19.484676783876306]
拡散モデルは生成モデリングの強力なツールとして登場してきた。
微調整拡散モデルのための制御フレームワークを提案する。
PI-FTは線形速度で大域収束することを示す。
論文 参考訳(メタデータ) (2024-12-24T04:55:46Z) - Adaptive Discrete Communication Bottlenecks with Dynamic Vector
Quantization [76.68866368409216]
入力に条件付けされた離散化の厳密度を動的に選択する学習を提案する。
コミュニケーションボトルネックの動的に変化する厳密さは、視覚的推論や強化学習タスクにおけるモデル性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2022-02-02T23:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。