Fugu-MT 論文翻訳(概要): Learning from Many and Adapting to the Unknown in Open-set Test Streams

論文の概要: Learning from Many and Adapting to the Unknown in Open-set Test Streams

arxiv url: http://arxiv.org/abs/2604.00533v1
Date: Wed, 01 Apr 2026 06:23:24 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-02 16:44:31.868393
Title: Learning from Many and Adapting to the Unknown in Open-set Test Streams
Title（参考訳）: オープンセットテストストリームにおける多くの人々からの学びと未知への適応
Authors: Xiao Zhang, Juntao Lyu, Tianyu Hu, Qianchuan Zhao, Huimin Ma,
Abstract要約: 大規模言語モデル(LLM)は、再利用可能な表現と柔軟な推論を通じてタスクを一般化する。 SyCoはRac1およびMAPK経路を介して低ランクアダプタを更新するパラメータ効率適応法である。
参考スコア（独自算出の注目度）: 24.690368986775848
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large Language Models (LLMs) generalize across tasks via reusable representations and flexible reasoning, yet remain brittle in real deployment under evolving tasks and continual distribution shift. A common approach is Test-Time Adaptation (TTA), existing ones of which updates models with hand-designed unsupervised objectives over the full parameter space and mostly overlook preserving shared source knowledge and the reliability of adaptation signals. Drawing on molecular signaling cascades of memory updating in Drosophila, we propose Synapse Consolidation (SyCo), a parameter-efficient LLM adaptation method that updates low-rank adapters through Rac1 and MAPK pathways under the guidance of a structured TTA objective driven by problem understanding, process understanding, and source-domain guardrail. Rac1 confines plasticity to a tail-gradient subspace that is less critical for source knowledge, enabling rapid specialization while preserving source representations. MAPK uses a tiered controller to suppress noisy updates and consolidate useful adaptations under non-stationary streams. To model real deployments with multiple sources and continually emerging tasks, we introduce Multi-source Open-set Adaptation (MOA) setting, where a model is trained on multiple labeled source tasks and then adapts on open, non-stationary unlabeled test streams that mix seen and unseen tasks with partial overlap in label and intent space. Across 18 NLP datasets and the MOA setting, SyCo consistently outperforms strong baselines, achieving 78.31\% on unseen-task adaptation and 85.37\% on unseen-data shifts.
Abstract（参考訳）: 大規模言語モデル(LLM)は、再利用可能な表現と柔軟な推論を通じてタスクを一般化するが、進化するタスクと連続的な分散シフトの下では、実際のデプロイメントでは不安定なままである。一般的なアプローチはテスト時間適応(TTA)であり、手動で設計した教師なしの目的を持つモデルを全パラメータ空間上で更新し、共有ソース知識と適応信号の信頼性をほとんど見落としている。ショウジョウバエのメモリ更新の分子シグナリングカスケードに基づいて,Rac1およびMAPK経路を介して低ランクアダプタを更新するパラメータ効率のLLM適応法であるSyCoを提案する。 Rac1は、ソース知識にあまり重要でない尾の勾配部分空間に可塑性を閉じ込め、ソース表現を保存しながら、迅速な特殊化を可能にする。 MAPKは階層型コントローラを使用してノイズの多い更新を抑え、非定常ストリームの下で有用な適応を統合する。複数のソースと継続的なタスクで実際のデプロイをモデル化するために、マルチソースのオープンセット適応(MOA)設定を導入します。 18のNLPデータセットとMOA設定で、SyCoは強いベースラインを一貫して上回り、目に見えないタスク適応では78.31\%、目に見えないデータシフトでは85.37\%を達成している。

関連論文リスト

Offline Meta-Reinforcement Learning with Flow-Based Task Inference and Adaptive Correction of Feature Overgeneralization [12.107082786676907]
オフラインメタ強化学習(OMRL)は、オフラインRLにおける多様なデータセットからの学習の強みと、メタRLの新しいタスクへの適応性を組み合わせる。既存の研究では、$Q$ネットワークの一般化がオフラインRLにおける外挿誤差に影響を与えることが示されている。特徴分布をモデル化し,不確かさを推定することでOODサンプルを同定するFLORAを提案する。
論文参考訳（メタデータ） (2026-01-12T03:16:07Z)
Collaborative Learning with Multiple Foundation Models for Source-Free Domain Adaptation [9.231185930198162]
Source-Free Domain Adaptation (SFDA)は、トレーニング済みのソースモデルを、ソースデータにアクセスすることなく、ラベルなしのターゲットドメインに適応することを目的としている。ファンデーションモデル(FM)の最近の進歩は、SFDAをガイドするための外部意味知識を活用する新たな機会をもたらした。
論文参考訳（メタデータ） (2025-11-24T14:12:22Z)
RECALL: REpresentation-aligned Catastrophic-forgetting ALLeviation via Hierarchical Model Merging [33.22889542330089]
大規模言語モデル(LLM)の内部表現は、学習知識の信頼できるプロキシとして機能する。本稿では,過去データにアクセスせずに連続的な学習を行うための表現認識モデル統合フレームワークRECALLを提案する。
論文参考訳（メタデータ） (2025-10-23T12:17:37Z)
Efficient Federated Class-Incremental Learning of Pre-Trained Models via Task-agnostic Low-rank Residual Adaptation [22.454292668849035]
Fed-TaLoRA(Federated Task-Agnostic Low-rank Residual Adaptation) 我々は,最小限のオーバーヘッドで正確な知識統合を実現するための,新たな残量更新機構を開発した。我々の方法論的革新は,タスク非依存適応,ポストアグリゲーションモデル校正,LORAモジュールの戦略的配置の3つの主要な戦略に起因している。
論文参考訳（メタデータ） (2025-05-18T09:19:13Z)
Reference Trustable Decoding: A Training-Free Augmentation Paradigm for Large Language Models [79.41139393080736]
大規模言語モデル(LLM)は急速に進歩し、印象的な機能を示している。 In-Context Learning (ICL) など。効率的なファインチューニング(PEFT)は、現在2つの主要な拡張方法である。下流タスクへのLLM。我々は、モデルが微調整なしで新しいタスクに迅速に適応できるパラダイムである参照信頼復号(RTD)を提案する。
論文参考訳（メタデータ） (2024-09-30T10:48:20Z)
Learn from the Learnt: Source-Free Active Domain Adaptation via Contrastive Sampling and Visual Persistence [60.37934652213881]
ドメイン適応(DA)は、ソースドメインから関連するターゲットドメインへの知識伝達を容易にする。本稿では、ソースデータフリーなアクティブドメイン適応(SFADA)という実用的なDAパラダイムについて検討する。本稿では,学習者学習(LFTL)というSFADAの新たなパラダイムを紹介し,学習した学習知識を事前学習モデルから活用し,余分なオーバーヘッドを伴わずにモデルを積極的に反復する。
論文参考訳（メタデータ） (2024-07-26T17:51:58Z)
Task-Distributionally Robust Data-Free Meta-Learning [99.56612787882334]
Data-Free Meta-Learning (DFML)は、複数の事前学習モデルを活用することで、独自のトレーニングデータを必要とせずに、新しいタスクを効率的に学習することを目的としている。 TDS(Task-Distribution Shift)とTDC(Task-Distribution Corruption)の2つの大きな課題を初めて明らかにした。
論文参考訳（メタデータ） (2023-11-23T15:46:54Z)
AdaMerging: Adaptive Model Merging for Multi-Task Learning [68.75885518081357]
本稿では,Adaptive Model Merging (AdaMerging)と呼ばれる革新的な手法を紹介する。本来のトレーニングデータに頼ることなく、タスクレベルでも階層的にも、モデルマージの係数を自律的に学習することを目指している。 AdaMergingは、現在の最先端のタスク演算のマージ方式と比較すると、パフォーマンスが11%向上している。
論文参考訳（メタデータ） (2023-10-04T04:26:33Z)
Do We Really Need to Access the Source Data? Source Hypothesis Transfer for Unsupervised Domain Adaptation [102.67010690592011]
Unsupervised adaptUDA (UDA) は、ラベル付きソースデータセットから学んだ知識を活用して、新しいラベル付きドメインで同様のタスクを解決することを目的としている。従来のUDAメソッドは、モデルに適応するためには、通常、ソースデータにアクセスする必要がある。この作業は、訓練済みのソースモデルのみが利用できる実践的な環境に取り組み、ソースデータなしでそのようなモデルを効果的に活用してUDA問題を解決する方法に取り組みます。
論文参考訳（メタデータ） (2020-02-20T03:13:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。