論文の概要: Relational Intervention During Functional Collapse in Large Language Models: A Lexical-Statistical Ablation and a Structure x Register Factorial
- arxiv url: http://arxiv.org/abs/2606.00935v1
- Date: Sun, 31 May 2026 00:10:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:28.988008
- Title: Relational Intervention During Functional Collapse in Large Language Models: A Lexical-Statistical Ablation and a Structure x Register Factorial
- Title(参考訳): 大規模言語モデルにおける機能的崩壊時の関係的干渉:語彙統計アブレーションと構造xレジスタ係数
- Authors: Franco Santana, Horacio Vico,
- Abstract要約: 機能的崩壊時に伝達されるリレーショナルスタイルの介入が,技術的フィードバックと区別可能な崩壊後の挙動を生じさせるかどうかを検証した。
Qwen3.5-4Bと意図的に壊れたbashツールを使って、6つの条件で300エピソードをマッチしたペアデザインで実行します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We test whether a relational-style intervention delivered during functional collapse in a small language model produces post-collapse behavior distinguishable from technical feedback, from a lexically-matched scrambled control, and from each of the two pragmatic dimensions in isolation. Using Qwen3.5-4B with a deliberately broken bash tool, we run 300 episodes across six conditions in a matched-pairs design (50 tasks): no intervention (A), technical/impersonal (B), relational/first-person (C), scrambled relational (D), technical/first-person (E), and relational/impersonal (F). E and F form a 2x2 factorial with B and C that dissociates relational structure (acknowledgment, absolution, agency restoration, unconditional acceptance) from sender register (first-person vs. impersonal). We report two main findings. First, an attention-behavior dissociation: attention follows lexical surprise (D > F > C > E > B, all q_FDR < 10^{-10}), with the scrambled message capturing the most attention; yet behaviorally A ~ B ~ D < E ~ F << C. Second, the factorial localizes the C effect: neither relational structure alone (F) nor first-person register alone (E) replicates C's behavioral signature; main effects of both dimensions are individually significant, and the structure x register interaction is significant on persistence (p = 0.046). A third dissociation emerges in emotion probes: F tracks C on 7 of 8 probes despite producing only baseline behavior, indicating that relational structure alone installs a probe-level state that only translates into behavior when paired with first-person register. The model's processing decomposes into three dissociable stages: attention (ordered by lexical surprise), probe-level state (ordered by structure), and behavior (ordered by the conjunction of both).
- Abstract(参考訳): 小言語モデルにおける機能的崩壊時に生じるリレーショナルスタイルの介入が、語彙的に整合したスクランブル制御から分離された2つの実用的次元のそれぞれから、技術的フィードバックと区別可能なポスト崩壊挙動をもたらすかどうかを検証した。
Qwen3.5-4Bと意図的に壊れたbashツールを用いて、6つの条件にまたがって300エピソードを実行し(50タスク)、介入なし(A)、技術/個人(B)、リレーショナル/第一人物(C)、スクランブルドリレーショナル(D)、技術/第一人物(E)、リレーショナル/人間(F)の6つの条件で実行します。
E と F は、B と C で 2x2 因子を成し、リレーショナル構造(承認、棄却、エージェンシー復元、無条件受容)を送信者レジスタ(一人称対非人称)から解離する。
主な所見は2つである。
まず、注意-行動解離:注意は語彙的驚き(D > F > C > E > B, all q_FDR < 10^{-10})に従っており、スクランブルメッセージは最も注意を引いているが、行動的には A ~ B ~ D < E ~ F < << C である。
第3の解離は感情プローブに現れる: Fは8つのプローブのうち7つのプローブに C をトラックするが、ベースラインの振舞いしか発生しない。
モデルの処理は3つの解離可能な段階に分解される: 注意(語彙的驚きによって順序付けされる)、プローブレベル状態(構造によって順序付けされる)、行動(両方の組み合わせで順序付けされる)。
関連論文リスト
- Emergent Ordinal Geometry in Transformers Trained on Local Comparisons [0.0]
推移的推論は、A C が隣り合う関係しか知らないことを推測する挑戦である。
我々は、Transformerが同じプリミティブを取得し、隣接した比較のみに基づいて小さなモデルを訓練するかどうかを問う。
分布外一般化は、目覚ましい幾何学的再編成とともに現れる。
論文 参考訳(メタデータ) (2026-05-31T14:44:54Z) - MTI: A Behavior-Based Temperament Profiling System for AI Agents [4.358468367889626]
モデルテンペラメント指数(MTI)は,4軸にわたるAIエージェントのテンペラメントを測定する行動ベースのプロファイリングシステムである。
MTIは、自分たちが何を言っているのかではなく、エージェントが何をするのかを、2段階の設計で構造化された検査プロトコルを使って測定する。
論文 参考訳(メタデータ) (2026-04-02T15:15:57Z) - Breaking the Chain: A Causal Analysis of LLM Faithfulness to Intermediate Structures [58.54426802984356]
本稿では,出力を因果的に決定する因果評価プロトコルを提案する。
8つのモデルと3つのベンチマークで、モデルは自身の中間構造と自己整合しているように見えるが、最大60%のケースに介入した後に予測を更新できない。
全体として、スキーマ誘導パイプラインの中間構造は、安定した因果メディエータよりも影響のある文脈として機能する。
論文 参考訳(メタデータ) (2026-03-17T13:01:44Z) - TopoOR: A Unified Topological Scene Representation for the Operating Room [54.50897207203292]
手術シーングラフは外科手術室(OR)の複雑さを実体の構造とその関連性に抽象化する。
マルチモーダルな手術室を高次構造としてモデル化する新しいパラダイムであるTopoORを紹介する。
また,多様体の構造やモジュラリティに特有な特徴を明示的に保存する高次アテンション機構を提案する。
論文 参考訳(メタデータ) (2026-03-10T10:19:42Z) - On the Structural Non-Preservation of Epistemic Behaviour under Policy Transformation [51.56484100374058]
このような情報条件の相互作用パターンを振る舞い依存として定式化する。
これにより、$$-behavioural equivalenceというプローブ相対的な概念と、政治内行動距離が導かれる。
その結果、共通政策変換の下でプローブ条件の挙動分離が保存されない構造条件が明らかになった。
論文 参考訳(メタデータ) (2026-02-24T22:55:21Z) - ReBeCA: Unveiling Interpretable Behavior Hierarchy behind the Iterative Self-Reflection of Language Models with Causal Analysis [35.12196884025294]
textbftexttReflection textbftexttBehavior, textbftexttBehavior は自己回帰結果の解釈可能な行動階層を明らかにするフレームワークである。
自己回帰軌道を因果グラフとしてモデル化することにより、ReBeCAは真の性能決定因子を分離する。
論文 参考訳(メタデータ) (2026-02-06T04:00:57Z) - CausalAffect: Causal Discovery for Facial Affective Understanding [26.904783570786773]
CausalAffectは、顔への影響分析における因果グラフ発見のための最初のフレームワークである。
私たちのアプローチでは、共同注釈付きデータセットも手作りの因果前処理も必要ありません。
トレーニングされたモデルとソースコードはすべて、受け入れ次第リリースされる。
論文 参考訳(メタデータ) (2025-11-29T12:07:33Z) - If Attention Serves as a Cognitive Model of Human Memory Retrieval, What is the Plausible Memory Representation? [3.757103053174534]
本研究では,トランスフォーマー文法(TG)の注意機構が,人間の記憶検索の認知モデルとして機能するかどうかを検討する。
実験により,TGの注意力は,バニラ変圧器と比較して,セルフペースト読影時間において優れた予測力を発揮することが示された。
論文 参考訳(メタデータ) (2025-02-17T05:58:25Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Score-based Causal Representation Learning with Interventions [54.735484409244386]
本稿では,潜在因果変数を間接的に観察する際の因果表現学習問題について検討する。
目的は、 (i) 未知の線形変換(スケーリングまで)を回復し、 (ii) 潜在変数の下の有向非巡回グラフ(DAG)を決定することである。
論文 参考訳(メタデータ) (2023-01-19T18:39:48Z) - Nested Counterfactual Identification from Arbitrary Surrogate
Experiments [95.48089725859298]
観測と実験の任意の組み合わせからネスト反事実の同定について検討した。
具体的には、任意のネストされた反事実を非ネストされたものへ写像できる反ファクト的非ネスト定理(英語版)(CUT)を証明する。
論文 参考訳(メタデータ) (2021-07-07T12:51:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。