論文の概要: Sense Representations Are Inducible Interfaces
- arxiv url: http://arxiv.org/abs/2605.28669v1
- Date: Wed, 27 May 2026 16:04:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:56.198008
- Title: Sense Representations Are Inducible Interfaces
- Title(参考訳): センス表現は誘導可能なインタフェースである
- Authors: Jan Christian Blaise Cruz, Alham Fikri Aji,
- Abstract要約: ACROSは凍結保存されたLMに明示的な感覚経路を誘導する。
SmolLM2-360Mでは、ACROSは、同じ誘導変数の3つの使用をサポートしながら、基本的なLM品質を保っている。
- 参考スコア(独自算出の注目度): 19.58872436367658
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Sense representations (explicit, per-token meaning decompositions) are useful for disambiguation, steering, and cross-lingual alignment, but existing approaches require models to be pretrained with sense structure baked in. We introduce ACROS, which induces an explicit sense pathway into a frozen pretrained decoder LM through a gated residual addition. On SmolLM2-360M, ACROS preserves base LM quality while supporting three uses of the same induced variables: zero-shot word-sense disambiguation (64.95 F1 on Raganato ALL, competitive with the WordNet first-sense heuristic), low-KL lexical steering across 5,161 CoInCo cases where a simple non-oracle proxy recovers about 90% of positive shifts, and SENSIA cross-lingual adaptation to four languages (mean R@1 0.988, target FLORES PPL 7.94). ACROS makes sense representations an inducible interface for ordinary pretrained LMs.
- Abstract(参考訳): センス表現は曖昧さ、ステアリング、言語間のアライメントに有用であるが、既存のアプローチでは感覚構造を組み込んだ事前訓練が必要である。
我々はACROSを導入し、ゲート残余付加により凍結したプレトレーニングデコーダLMに明示的な感覚経路を誘導する。
SmolLM2-360Mでは、ACROSは、ゼロショットワードセンスの曖昧さ(Raganato ALLの64.95 F1)、WordNetファーストセンスのヒューリスティックと競合する)、5,161 CoInCoのケースでの低KLレキシカルステアリング、単純な非オーラルプロキシが約90%の正のシフトを回復する、SENSIAの4つの言語への言語間適応(平均R@1 0.988、ターゲットFLORES PPL 7.94)の3つの使用をサポートしながら、基本的なLM品質を保っている。
ACROSは、通常の事前訓練されたLMのための誘導可能なインタフェースである。
関連論文リスト
- Incentivizing Parametric Knowledge via Reinforcement Learning with Verifiable Rewards for Cross-Cultural Entity Translation [68.85147984815778]
本稿では, EA-RLVR(Entity-Anchored Reinforcement Learning with Verifiable Rewards)を提案する。
EA-RLVRは、検証可能なエンティティレベルの報酬信号の監視をアンカーし、最適化を安定させるために軽量な構造ゲートを組み込む。
EA-RLVRをXC-Translate上で評価し、エンティティ翻訳精度とドメイン外一般化の両面で一貫した改善を観察する。
論文 参考訳(メタデータ) (2026-04-18T07:15:43Z) - ProGAL-VLA: Grounded Alignment through Prospective Reasoning in Vision-Language-Action Models [3.546105930931843]
視覚言語アクション(VLA)モデルは汎用的なロボットエージェントを可能にするが、しばしば言語無知を示す。
本稿では3次元実体中心グラフを構成するプロジェクティブグラウンドとアライメントVLA(ProGAL-VLA)について述べる。
すべてのアクションは、その注意エントロピーが固有のあいまいさ信号を提供する、$g_t$を埋め込んだ検証済みのゴールで条件付けされる。
論文 参考訳(メタデータ) (2026-04-10T18:56:48Z) - STaR-DRO: Stateful Tsallis Reweighting for Group-Robust Structured Prediction [0.20165644958637055]
制御可能な推論と堅牢な微調整のための2部フレームワークを提案する。
まず、フォーマットのドリフト、ラベルの曖昧さ、エビデンス幻覚、メタデータ条件の混乱に対処するためのタスクに依存しないプロンプト戦略を導入する。
第2に,グループ不均一性のステートフルなロバスト最適化手法STaR-DROを導入する。
論文 参考訳(メタデータ) (2026-04-09T21:58:42Z) - Re-Mask and Redirect: Exploiting Denoising Irreversibility in Diffusion Language Models [0.0]
拡散言語モデル(dLLM)における安全性の整合性は、単一の負荷を持つ仮定に依存している。
コミットされた拒絶トークンを再マッシングし,短い肯定的接頭辞を注入することにより,HarmBench上で74~82%のASRが得られることを示す。
我々はこの攻撃をTrajHijackと呼び、これはdLLMに対する最初の軌道レベルの攻撃であり、計算を必要とせず、SFTモデルと優先最適化(VRPO)モデルにまたがって一般化する。
論文 参考訳(メタデータ) (2026-03-17T02:24:37Z) - RefineBench: Evaluating Refinement Capability of Language Models via Checklists [71.02281792867531]
本研究は,2つの改良モード(ガイドリファインメントと自己リファインメント)を評価する。
ガイド付き改良では、プロプライエタリなLMと大きなオープンウェイトLMの両方が目標フィードバックを利用して、5ターン以内のほぼ完全なレベルへの応答を洗練できる。
これらの結果は、フロンティアLMは誤った反応を自己調整するためにブレークスルーを必要とすることを示唆している。
論文 参考訳(メタデータ) (2025-11-27T07:20:52Z) - Direct Semantic Communication Between Large Language Models via Vector Translation [3.81908263930559]
大規模言語モデル(LLM)は、メッセージをプレーントークンとして渡すことで、最も遅延したセマンティクスを破棄する。
我々は、直接意味交換を可能にする学習されたマッピングを用いて、ベクトル変換を介して潜時ブリッジを形成する。
論文 参考訳(メタデータ) (2025-11-06T00:43:29Z) - Does higher interpretability imply better utility? A Pairwise Analysis on Sparse Autoencoders [63.544453925182005]
3つの言語モデルで90のSAEをトレーニングし、解釈可能性と操舵性を評価します。
解析の結果,比較的弱い正の相関(tau b approx 0.298)しか示さず,解釈性は操舵性能の指標として不十分であることが示唆された。
本稿では,特徴量の増幅が次のトークン分布に与える影響を計測するデルタトークン信頼性(Delta Token Confidence)という新しい選択基準を提案する。
論文 参考訳(メタデータ) (2025-10-04T04:14:50Z) - SEAL: Steerable Reasoning Calibration of Large Language Models for Free [58.931194824519935]
大規模言語モデル(LLM)は、拡張チェーン・オブ・ソート(CoT)推論機構を通じて複雑な推論タスクに魅力的な機能を示した。
最近の研究では、CoT推論トレースにかなりの冗長性が示されており、これはモデル性能に悪影響を及ぼす。
我々は,CoTプロセスをシームレスに校正し,高い効率性を示しながら精度を向上する,トレーニング不要なアプローチであるSEALを紹介した。
論文 参考訳(メタデータ) (2025-04-07T02:42:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。