論文の概要: ASA: Activation Steering for Tool-Calling Domain Adaptation
- arxiv url: http://arxiv.org/abs/2602.04935v1
- Date: Wed, 04 Feb 2026 14:20:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.559676
- Title: ASA: Activation Steering for Tool-Calling Domain Adaptation
- Title(参考訳): ASA: ツールカーリングドメイン適応のためのアクティベーションステアリング
- Authors: Youjin Wang, Run Zhou, Rong Fu, Shuaishuai Cao, Hongwei Zeng, Jiaxuan Lu, Sicheng Fan, Jiaqiao Zhao, Liangming Pan,
- Abstract要約: 我々は、中間活性化からルーティング信号を読み取る軽量で推論時間のない学習機構である textbfActivation Steering Adapter (ASA) を提案し、超軽量ルータを用いて、正確なドメインアライメントのための適応制御強度を生成する。
複数のモデルスケールとドメインにまたがって、ASAはLoRA互換の適応を実現し、オーバーヘッドは大幅に小さく、クロスモデル転送性が強い。
- 参考スコア(独自算出の注目度): 27.41214164139876
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For real-world deployment of general-purpose LLM agents, the core challenge is often not tool use itself, but efficient domain adaptation under rapidly evolving toolsets, APIs, and protocols. Repeated LoRA or SFT across domains incurs exponentially growing training and maintenance costs, while prompt or schema methods are brittle under distribution shift and complex interfaces. We propose \textbf{Activation Steering Adapter (ASA}), a lightweight, inference-time, training-free mechanism that reads routing signals from intermediate activations and uses an ultra-light router to produce adaptive control strengths for precise domain alignment. Across multiple model scales and domains, ASA achieves LoRA-comparable adaptation with substantially lower overhead and strong cross-model transferability, making it ideally practical for robust, scalable, and efficient multi-domain tool ecosystems with frequent interface churn dynamics.
- Abstract(参考訳): 汎用LLMエージェントの現実的なデプロイでは、ツールの使用自体ではなく、急速に進化するツールセット、API、プロトコルの下での効率的なドメイン適応が課題となる。
ドメイン間の繰り返しLoRAやSFTは、トレーニングとメンテナンスのコストを指数関数的に増加させ、プロンプトやスキーマメソッドは分散シフトや複雑なインターフェースの下で脆弱である。
本稿では、中間動作からのルーティング信号を読み取る軽量で推論時間のない機構である‘textbf{Activation Steering Adapter (ASA}) を提案し、超軽量ルータを用いて正確なドメインアライメントのための適応制御強度を生成する。
複数のモデルスケールとドメインにわたって、ASAはロードバランサと強力なクロスモデルトランスファービリティを備えたLoRA互換の適応を実現し、頻繁なインターフェースのチャーンダイナミクスを備えた堅牢でスケーラブルで効率的なマルチドメインツールエコシステムに理想的である。
関連論文リスト
- RISER: Orchestrating Latent Reasoning Skills for Adaptive Activation Steering [62.63376387138257]
本稿では,アクティベーション空間における大規模言語モデル(LLM)推論を適応的に制御するプラグイン・アンド・プレイ介入フレームワークを提案する。
RISERは再利用可能な推論ベクトルのライブラリを構築し、軽量ルータを使用して各入力に対して動的に構成する。
ルーターは、タスクレベルの報酬の下で強化学習を通じて最適化され、緊急かつ構成的な方法で潜在する認知的プリミティブを活性化する。
論文 参考訳(メタデータ) (2026-01-14T08:04:33Z) - PAGen: Phase-guided Amplitude Generation for Domain-adaptive Object Detection [15.55359477953804]
教師なしドメイン適応(UDA)は、さまざまな環境にまたがるニューラルネットワークの展開を大いに促進する。
本稿では、周波数領域における画像スタイルの適応を学習し、ソース領域とターゲット領域との差を小さくする、シンプルで効果的なUDA手法を提案する。
論文 参考訳(メタデータ) (2025-11-27T02:22:37Z) - Adaptive Minds: Empowering Agents with LoRA-as-Tools [0.0]
Adaptive Mindsは、LoRAアダプタをドメイン固有のツールとして扱うエージェントシステムである。
Systemはワークフロー管理のためにLangGraphで構築され、APIとWebインターフェースの両方をサポートし、完全にオープンソースである。
論文 参考訳(メタデータ) (2025-10-17T08:10:06Z) - Generalized Adaptive Transfer Network: Enhancing Transfer Learning in Reinforcement Learning Across Domains [11.705324423141606]
強化学習(RL)における伝達学習により、エージェントはソースタスクからの知識を活用して、ターゲットタスクでの学習を加速することができる。
本稿では、ドメイン間のタスクの一般化に取り組むために設計された深いRLアーキテクチャであるGeneralized Adaptive Transfer Network (GATN)を紹介する。
GATNはドメインに依存しない表現モジュール、堅牢性を認識したポリシーアダプタ、そしてこれらの目標を達成するための効率的な転送スケジューラを使用している。
論文 参考訳(メタデータ) (2025-07-02T21:33:48Z) - To Adapt or Not to Adapt? Real-Time Adaptation for Semantic Segmentation [45.74645069886128]
HAMLETは、リアルタイムドメイン適応のためのハードウェア対応Modular Least Expensive Trainingフレームワークである。
当社のアプローチでは,1つのコンシューマグレードGPU上で29FPS以上を同時に適用しながらセマンティックセグメンテーションを行うことができる。
論文 参考訳(メタデータ) (2023-07-27T17:59:59Z) - Multi-Prompt Alignment for Multi-Source Unsupervised Domain Adaptation [86.02485817444216]
マルチプロンプトアライメント(MPA: Multi-Prompt Alignment)は,マルチソースUDAのためのシンプルかつ効率的なフレームワークである。
MPAは、学習したプロンプトを自動エンコードプロセスで認知し、再構築されたプロンプトの合意を最大化することでそれらを調整する。
実験によると、MPAは3つの一般的なデータセットで最先端の結果を達成し、DomainNetの平均精度は54.1%である。
論文 参考訳(メタデータ) (2022-09-30T03:40:10Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - DA-DETR: Domain Adaptive Detection Transformer with Information Fusion [53.25930448542148]
DA-DETRは、ラベル付きソースドメインからラベルなしターゲットドメインへの効果的な転送のための情報融合を導入するドメイン適応型オブジェクト検出変換器である。
本稿では,CNN機能とトランスフォーマー機能を融合した新しいCNN-Transformer Blender(CTBlender)を提案する。
CTBlenderはTransformer機能を使用して、高レベルの意味情報と低レベルの空間情報が融合した複数のスケールでCNN機能を変調し、正確な物体識別と位置決めを行う。
論文 参考訳(メタデータ) (2021-03-31T13:55:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。