論文の概要: State Transfer Reveals Reuse in Controlled Routing
- arxiv url: http://arxiv.org/abs/2604.18158v1
- Date: Mon, 20 Apr 2026 12:22:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.854472
- Title: State Transfer Reveals Reuse in Controlled Routing
- Title(参考訳): 制御されたルーティングにおける状態伝達の再利用
- Authors: Yanzhen Lu, Zhicheng Qian, Muchen Jiang, Xingyu Zhou,
- Abstract要約: インプロンプトベースの介入はモデル行動を変えることができるが、訓練された成功だけでは、振る舞いに関連する状態がどこに表現されているかは特定できない。
本稿では,サポートデータ上で選択されたインタフェース,クエリ評価,マッチングの必要性,十分性,インターフェースの誤制御などを用いて,制御されたルーティングタスクにおいてこの問題を考察する。
- 参考スコア(独自算出の注目度): 4.640757402699249
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Prompt-based interventions can change model behavior, but trained success alone does not identify where the behaviorally relevant state is represented. We study this question in controlled routing tasks using interfaces chosen on support data, held-out query evaluation, and matched necessity, sufficiency, and wrong-interface controls. On GPT-2 triop, an early interface supports exact transfer under these tests. On GPT-2 add/sub, zero-retrain compiled transfer at the fixed interface recovers most of donor routing accuracy, while trainable prompt slots can relearn the same behavior at several other positions only after additional support examples and optimization. These results distinguish fixed-interface reuse from prompt relocation in a setting where the two can be tested directly. Qwen routing provides a cross-architecture consistency check for the same matched-interface pattern at the operator token, although donor-specific identity on the local V-path remains unresolved. Generation and reasoning branches are used to map scope: they show broader transport or weaker controller identifiability once control depends on longer trajectories or harder selection. In controlled routing, fixed-interface transfer is therefore stronger evidence of reuse than trained prompt success alone.
- Abstract(参考訳): プロンプトベースの介入はモデルの振る舞いを変えることができるが、訓練された成功だけでは、振る舞いに関連する状態がどこに表現されているかを特定できない。
本研究では,サポートデータ上で選択されたインタフェース,クエリ評価,マッチングの必要性,十分性,インターフェースの誤制御などを用いて,制御されたルーティングタスクにおいてこの問題を考察する。
GPT-2トリオでは、初期インタフェースがこれらのテストの下で正確な転送をサポートする。
GPT-2 add/subでは、固定インターフェースでのゼロリトラクションコンパイル転送がドナールーティングの精度の大部分を回復する一方、トレーニング可能なプロンプトスロットは追加のサポート例と最適化後にのみ、他のいくつかの場所で同じ動作を再現することができる。
これらの結果から,両面を直接テスト可能な環境において,インタフェースの再利用と迅速な再配置を区別した。
Qwenルーティングは、オペレータトークンで同じマッチしたインターフェースパターンのクロスアーキテクチャ整合性チェックを提供するが、ローカルなVパス上のドナー固有のアイデンティティは未解決のままである。
生成と推論のブランチはスコープをマップするために使用され、コントロールが長い軌道や難しい選択に依存すると、より広いトランスポートまたはより弱いコントローラ識別能力を示す。
制御されたルーティングでは、固定インターフェース転送は、訓練された迅速な成功単独よりも、再利用の強い証拠である。
関連論文リスト
- Guideline2Graph: Profile-Aware Multimodal Parsing for Executable Clinical Decision Graphs [3.459382629188014]
完全ガイドラインの証拠を実行可能な臨床判定グラフに変換する分解第一パイプラインを提案する。
我々は,一致する入力と基礎となるVLMバックボーンを併用した適応型前立腺ガイドリンベンチマークで評価を行った。
論文 参考訳(メタデータ) (2026-04-02T19:21:31Z) - GUI-Libra: Training Native GUI Agents to Reason and Act with Action-aware Supervision and Partially Verifiable RL [64.8155693023222]
オープンソースのネイティブGUIエージェントは、長い水平ナビゲーションタスクのクローズドソースシステムに遅れを取っている。
このギャップは、高品質でアクション整合性のある推論データが不足していることに起因している。
GUI-Libraは、これらの課題に対処する調整されたトレーニングレシピです。
論文 参考訳(メタデータ) (2026-02-25T18:34:57Z) - Route-DETR: Pairwise Query Routing in Transformers for Object Detection [11.46025964297103]
Detection Transformer (DETR) はオブジェクト検出のためのエンドツーエンドソリューションを提供する。
DETRは、複数のクエリが同じ位置に収束する非効率なクエリ競合に悩まされている。
本稿では,デコーダの自己アテンション層における適応的ペアワイズルーティングを通じて,これらの問題に対処するRoute-DETRを提案する。
論文 参考訳(メタデータ) (2025-12-15T20:26:58Z) - OneTrans: Unified Feature Interaction and Sequence Modeling with One Transformer in Industrial Recommender [32.265739328468584]
OneTransは、ユーザー・ビヘイビア・シーケンス・モデリングと機能相互作用を同時に実行する統合トランスフォーマー・バックボーンである。
オンラインA/Bテストでは、OneTransはパラメータの増加とともに効率よくスケールし、強いベースラインを一貫して上回り、ユーザ当たりのGMVは5.68%上昇する。
論文 参考訳(メタデータ) (2025-10-30T03:30:12Z) - Multiscale Vision Transformers meet Bipartite Matching for efficient single-stage Action Localization [27.472705540825316]
アクションローカライゼーションは、しばしば別々に対処される検出タスクと認識タスクを組み合わせた、困難な問題である。
両タスクを両パートマッチングでトレーニングした単一のMViTv2-Sアーキテクチャが,RoIで事前計算した有界ボックス上でトレーニングした場合,同一のMViTv2-Sを超えることを示す。
論文 参考訳(メタデータ) (2023-12-29T17:08:38Z) - Semi-DETR: Semi-Supervised Object Detection with Detection Transformers [105.45018934087076]
半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
論文 参考訳(メタデータ) (2023-07-16T16:32:14Z) - Unified Sequence-to-Sequence Learning for Single- and Multi-Modal Visual Object Tracking [64.28025685503376]
SeqTrackは、ビジュアルトラッキングをシーケンス生成タスクとしてキャストし、オブジェクト境界ボックスを自動回帰的に予測する。
SeqTrackv2は補助モダリティのための統一インターフェースとタスクを指定するためのタスクプロンプトトークンのセットを統合している。
このシーケンス学習パラダイムは、トラッキングフレームワークを単純化するだけでなく、14の挑戦的なベンチマークで優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-04-27T17:56:29Z) - DOAD: Decoupled One Stage Action Detection Network [77.14883592642782]
人々をローカライズし、ビデオからアクションを認識することは、ハイレベルなビデオ理解にとって難しい課題だ。
既存の手法は主に2段階ベースで、1段階は人物境界ボックス生成、もう1段階は行動認識を行う。
本稿では、時間的行動検出の効率を向上させるために、DOADと呼ばれる分離したワンステージネットワークを提案する。
論文 参考訳(メタデータ) (2023-04-01T08:06:43Z) - Exploring Sequence Feature Alignment for Domain Adaptive Detection
Transformers [141.70707071815653]
本稿では,検出変圧器の適応に特化して設計された新しいシーケンス特徴アライメント(SFA)法を提案する。
SFAはドメインクエリベースの機能アライメント(DQFA)モジュールとトークンワイド機能アライメント(TDA)モジュールで構成される。
3つの挑戦的なベンチマーク実験により、SFAは最先端のドメイン適応オブジェクト検出方法より優れていることが示された。
論文 参考訳(メタデータ) (2021-07-27T07:17:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。