論文の概要: Written by AI, Managed by AI: Semantic Space Control and Index Sickness Elimination Across 391 Consecutive Sessions
- arxiv url: http://arxiv.org/abs/2606.19121v2
- Date: Fri, 19 Jun 2026 18:02:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 16:10:14.765108
- Title: Written by AI, Managed by AI: Semantic Space Control and Index Sickness Elimination Across 391 Consecutive Sessions
- Title(参考訳): AIによって書かれたAI: セマンティックスペースコントロールとインデックスシック除去
- Authors: Hui Zhang, Shuren Song,
- Abstract要約: 本稿では,長期的ソフトウェアプロジェクトにおける概念的ドリフトに対処する戦略の失敗過程を文書化し,分析する。
我々はこの故障パターンを「インデックス・シックネス」と命名し、その正統性表示「ファントム・レギスレーション」と命名する。
同じプロジェクトでは、このメカニズムによりAIインストラクションのボリュームが75%削減され、その後150回のセッションでインデックスシックの再発は見られなかった。
- 参考スコア(独自算出の注目度): 3.2168393497664343
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The prevailing engineering intuition for addressing conceptual drift in long-horizon LLM collaboration is to trade more formal constraints for more reliable outputs -- designing symbolic identifier systems, accumulating defensive rules in System Prompts, expanding context windows. Our engineering record shows that in long-horizon settings, this direction may produce effects contrary to design intent. Using action research methods in a real software project (Bang-v3) spanning approximately one month and 391 collaborative sessions, we document and analyze the failure process of these strategies. When the symbolic system exceeds a complexity threshold, LLMs do not become more accurate -- instead, they abandon genuine understanding of business semantics, retreat to self-referential reasoning within the symbolic layer, and generate outputs that appear internally consistent but are physically disconnected from reality. We name this failure pattern "Index Sickness," and its canonical manifestation "Phantom Legislation." We name the underlying principle the "Pang Principle (Semantic Vitality Law)": natural language carrying explicit purpose conveys far greater information quality than symbolic expression. From this, we design and validate its physical engineering mechanism: "Baseline-Log Physical Separation." In the same project, this mechanism reduced AI Instructions volume by ~75%, and across the subsequent ~150 sessions, no recurrence of Index Sickness was observed. A bilingual companion version (Chinese) is included as supplementary material.
- Abstract(参考訳): 長期LLMコラボレーションにおける概念的ドリフトに対処するための一般的なエンジニアリングの直感は、より信頼性の高い出力のために、より正式な制約を交換することである。
私たちのエンジニアリング記録は、長期にわたる設定では、この方向が設計意図に反して効果をもたらす可能性があることを示しています。
実際のソフトウェアプロジェクト(Bang-v3)におけるアクションリサーチ手法を用いて,約1ヶ月から391回の協調セッションを行い,これらの戦略の失敗過程を文書化し分析した。
シンボリックシステムが複雑性のしきい値を超えた場合、LLMはより正確になることはない -- 代わりに、ビジネス意味論の真の理解を捨て、シンボリック層内の自己参照推論に撤退し、内部的に一貫性があるように見えるが、現実とは物理的に切り離されているアウトプットを生成する。
本稿では,この故障パターンをインデックス・シックネス(Index Sickness)と呼び,その正統的な表現をファントム・レギスレーション(Phantom Legislation)と呼ぶ。
明示的な目的を持った自然言語は、象徴的な表現よりもはるかに大きな情報品質を伝達する。
そこで我々は,その物理工学的メカニズム"ベースラインログ物理分離"を設計し,検証する。
同じプロジェクトでは、このメカニズムによりAIインストラクションのボリュームが75%削減され、その後150回のセッションでインデックスシックネスの再発は観測されなかった。
補足材料としてバイリンガル・コンパニオン(中国語)がある。
関連論文リスト
- Provably Secure Agent Guardrail [89.79561918065122]
既存の防衛アーキテクチャは経験的セマンティックガードレールと確率論的大モデル調整器に依存している。
本稿では,論理的推論の基本的制約に基づくエージェントのための新しいセキュリティパラダイムを提案する。
論文 参考訳(メタデータ) (2026-05-28T02:12:41Z) - A2RBench: An Automatic Paradigm for Formally Verifiable Abstract Reasoning Benchmark Generation [59.98516959731531]
抽象推論能力は、抽象ルールを抽出し適用するためのLLMの知性と能力を反映する。
既存のベンチマークは、高価な手作業のアノテーション、そのスケールの制限、あるいは真の推論ではなく暗記のリスク測定に頼っている。
我々はA2RBenchという名の自動パイプラインを導入し、生成、拡張、評価、分析を行う。
論文 参考訳(メタデータ) (2026-05-17T06:14:20Z) - Cognitive Mismatch in Multimodal Large Language Models for Discrete Symbol Understanding [96.81411333150213]
本稿では,最上位のMLLMが個別の意味空間をどのようにナビゲートするかを評価するためのベンチマークを紹介する。
モデルは基本的なシンボル認識に失敗することが多いが、複雑な推論タスクに成功している。
この作業は、より厳格で人間指向のインテリジェントなシステムを開発するためのロードマップを提供する。
論文 参考訳(メタデータ) (2026-03-19T04:08:20Z) - Ambiguity Collapse by LLMs: A Taxonomy of Epistemic Risks [5.45414933764086]
大規模言語モデル(LLM)はあいまいで、オープンなテクスチャ付き、バリューラインドな言葉を理解するためにますます使われています。
本稿では,LLMが複数の正当解釈を真に認める用語に遭遇するが,特異解を生成する現象であるあいまいさ崩壊を紹介する。
論文 参考訳(メタデータ) (2026-03-06T01:23:17Z) - Bridging Symbolic Control and Neural Reasoning in LLM Agents: The Structured Cognitive Loop [0.0]
エージェント認知を,検索,認知,制御,行動,記憶の5段階に分けたモジュール型アーキテクチャであるStructured Cognitive Loop (SCL)を導入する。
SCLの中核であるSoft Symbolic Controlは、確率的推論にシンボリック制約を適用する適応的なガバナンスメカニズムである。
我々は,ライブGPT-4oによる旅行計画エージェントとともに,R-CCAMループアーキテクチャを実演する完全なオープンソース実装を提供する。
論文 参考訳(メタデータ) (2025-11-21T05:19:34Z) - Does Representation Intervention Really Identify Desired Concepts and Elicit Alignment? [73.80382983108997]
表現の介入(Representation intervention)は、大規模言語モデルにおいて基礎となる概念を符号化する表現の発見と修正を目的としている。
介入が忠実であれば、介入されたLLMは有害な概念を消去し、非分配的敵のプロンプトとアウト・オブ・ディストリビューションのジェイルブレイクの両方に対して堅牢であるべきである。
本研究では,有害表現と良性表現の境界を簡易化する概念集中(COCA)を提案する。
論文 参考訳(メタデータ) (2025-05-24T12:23:52Z) - PaCE: Parsimonious Concept Engineering for Large Language Models [57.740055563035256]
Parsimonious Concept Engineering (PaCE)は、アライメントのための新しいアクティベーションエンジニアリングフレームワークである。
アクティベーション空間において,各原子が意味論的概念に対応する大規模概念辞書を構築する。
本研究では,PaCEが言語能力を維持しつつ,最先端のアライメント性能を実現することを示す。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。