論文の概要: ASA: Training-Free Representation Engineering for Tool-Calling Agents
- arxiv url: http://arxiv.org/abs/2602.04935v2
- Date: Sun, 08 Feb 2026 09:26:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 17:49:39.471363
- Title: ASA: Training-Free Representation Engineering for Tool-Calling Agents
- Title(参考訳): ASA:ツールカートリングエージェントの学習自由表現工学
- Authors: Youjin Wang, Run Zhou, Rong Fu, Shuaishuai Cao, Hongwei Zeng, Jiaxuan Lu, Sicheng Fan, Jiaqiao Zhao, Liangming Pan,
- Abstract要約: Activation Steering Adapter (ASA)は、トレーニング不要で推論時のコントローラで、シングルショットの中間層介入を実行し、ツールドメインをターゲットにしている。
Qwen2.5-1.5B の MTU-Bench では、ASA は厳格なツール使用率 F1 を 0.18 から 0.50 に改善し、偽陽性率は 0.15 から 0.05 に減らした。
- 参考スコア(独自算出の注目度): 27.41214164139876
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adapting LLM agents to domain-specific tool calling remains notably brittle under evolving interfaces. Prompt and schema engineering is easy to deploy but often fragile under distribution shift and strict parsers, while continual parameter-efficient fine-tuning improves reliability at the cost of training, maintenance, and potential forgetting. We identify a critical Lazy Agent failure mode where tool necessity is nearly perfectly decodable from mid-layer activations, yet the model remains conservative in entering tool mode, revealing a representation-behavior gap. We propose Activation Steering Adapter (ASA), a training-free, inference-time controller that performs a single-shot mid-layer intervention and targets tool domains via a router-conditioned mixture of steering vectors with a probe-guided signed gate to amplify true intent while suppressing spurious triggers. On MTU-Bench with Qwen2.5-1.5B, ASA improves strict tool-use F1 from 0.18 to 0.50 while reducing the false positive rate from 0.15 to 0.05, using only about 20KB of portable assets and no weight updates.
- Abstract(参考訳): LLMエージェントをドメイン固有のツール呼び出しに適応することは、進化するインターフェイスの下では顕著に不安定である。
プロンプトとスキーマエンジニアリングは容易にデプロイできるが、分散シフトや厳密なパーサの下では脆弱であることが多い。
ツール要求が中間層アクティベーションからほぼ完全にデオード可能なクリティカルな遅延エージェント障害モードを識別するが、ツールモードの入力には保存的であり、表現と振る舞いのギャップが明らかになる。
本研究では、単発の中間層介入を行う訓練不要な推論時コントローラであるActivation Steering Adapter(ASA)を提案し、ステアリングベクトルとプローブ誘導署名ゲートをルータ条件で混合してツールドメインをターゲットにし、刺激的なトリガを抑えながら真の意図を増幅する。
Qwen2.5-1.5B の MTU-Bench では、ASA は厳格なツール使用率 F1 を 0.18 から 0.50 に改善し、偽陽性率は 0.15 から 0.05 に減らした。
関連論文リスト
- RISER: Orchestrating Latent Reasoning Skills for Adaptive Activation Steering [62.63376387138257]
本稿では,アクティベーション空間における大規模言語モデル(LLM)推論を適応的に制御するプラグイン・アンド・プレイ介入フレームワークを提案する。
RISERは再利用可能な推論ベクトルのライブラリを構築し、軽量ルータを使用して各入力に対して動的に構成する。
ルーターは、タスクレベルの報酬の下で強化学習を通じて最適化され、緊急かつ構成的な方法で潜在する認知的プリミティブを活性化する。
論文 参考訳(メタデータ) (2026-01-14T08:04:33Z) - PAGen: Phase-guided Amplitude Generation for Domain-adaptive Object Detection [15.55359477953804]
教師なしドメイン適応(UDA)は、さまざまな環境にまたがるニューラルネットワークの展開を大いに促進する。
本稿では、周波数領域における画像スタイルの適応を学習し、ソース領域とターゲット領域との差を小さくする、シンプルで効果的なUDA手法を提案する。
論文 参考訳(メタデータ) (2025-11-27T02:22:37Z) - Adaptive Minds: Empowering Agents with LoRA-as-Tools [0.0]
Adaptive Mindsは、LoRAアダプタをドメイン固有のツールとして扱うエージェントシステムである。
Systemはワークフロー管理のためにLangGraphで構築され、APIとWebインターフェースの両方をサポートし、完全にオープンソースである。
論文 参考訳(メタデータ) (2025-10-17T08:10:06Z) - Generalized Adaptive Transfer Network: Enhancing Transfer Learning in Reinforcement Learning Across Domains [11.705324423141606]
強化学習(RL)における伝達学習により、エージェントはソースタスクからの知識を活用して、ターゲットタスクでの学習を加速することができる。
本稿では、ドメイン間のタスクの一般化に取り組むために設計された深いRLアーキテクチャであるGeneralized Adaptive Transfer Network (GATN)を紹介する。
GATNはドメインに依存しない表現モジュール、堅牢性を認識したポリシーアダプタ、そしてこれらの目標を達成するための効率的な転送スケジューラを使用している。
論文 参考訳(メタデータ) (2025-07-02T21:33:48Z) - To Adapt or Not to Adapt? Real-Time Adaptation for Semantic Segmentation [45.74645069886128]
HAMLETは、リアルタイムドメイン適応のためのハードウェア対応Modular Least Expensive Trainingフレームワークである。
当社のアプローチでは,1つのコンシューマグレードGPU上で29FPS以上を同時に適用しながらセマンティックセグメンテーションを行うことができる。
論文 参考訳(メタデータ) (2023-07-27T17:59:59Z) - Multi-Prompt Alignment for Multi-Source Unsupervised Domain Adaptation [86.02485817444216]
マルチプロンプトアライメント(MPA: Multi-Prompt Alignment)は,マルチソースUDAのためのシンプルかつ効率的なフレームワークである。
MPAは、学習したプロンプトを自動エンコードプロセスで認知し、再構築されたプロンプトの合意を最大化することでそれらを調整する。
実験によると、MPAは3つの一般的なデータセットで最先端の結果を達成し、DomainNetの平均精度は54.1%である。
論文 参考訳(メタデータ) (2022-09-30T03:40:10Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - DA-DETR: Domain Adaptive Detection Transformer with Information Fusion [53.25930448542148]
DA-DETRは、ラベル付きソースドメインからラベルなしターゲットドメインへの効果的な転送のための情報融合を導入するドメイン適応型オブジェクト検出変換器である。
本稿では,CNN機能とトランスフォーマー機能を融合した新しいCNN-Transformer Blender(CTBlender)を提案する。
CTBlenderはTransformer機能を使用して、高レベルの意味情報と低レベルの空間情報が融合した複数のスケールでCNN機能を変調し、正確な物体識別と位置決めを行う。
論文 参考訳(メタデータ) (2021-03-31T13:55:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。