論文の概要: Hallucination as a Computational Boundary: A Hierarchy of Inevitability and the Oracle Escape
- arxiv url: http://arxiv.org/abs/2508.07334v1
- Date: Sun, 10 Aug 2025 13:26:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.81495
- Title: Hallucination as a Computational Boundary: A Hierarchy of Inevitability and the Oracle Escape
- Title(参考訳): 計算境界としての幻覚 - 必然性の階層とOracleの脱出
- Authors: Quan Shi, Wang Xi, Zenghui Ding, Jianqing Gao, Xianjun Yang,
- Abstract要約: 大規模言語モデル(LLM)のイリュージョン現象は、信頼性の高いデプロイメントにおける中核的な障害である。
本稿では,「計算必要階層」を構築することにより,大規模言語モデルを確率的チューリングマシンとして定式化する。
2つの「エスケープルート」を提案する。1つは「コンピュータジャンプ」による絶対脱出を証明し、レトリーバル拡張世代(RAG)をオラクルマシンとしてモデル化することである。
- 参考スコア(独自算出の注目度): 9.737202904844562
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The illusion phenomenon of large language models (LLMs) is the core obstacle to their reliable deployment. This article formalizes the large language model as a probabilistic Turing machine by constructing a "computational necessity hierarchy", and for the first time proves the illusions are inevitable on diagonalization, incomputability, and information theory boundaries supported by the new "learner pump lemma". However, we propose two "escape routes": one is to model Retrieval Enhanced Generations (RAGs) as oracle machines, proving their absolute escape through "computational jumps", providing the first formal theory for the effectiveness of RAGs; The second is to formalize continuous learning as an "internalized oracle" mechanism and implement this path through a novel neural game theory framework.Finally, this article proposes a
- Abstract(参考訳): 大規模言語モデル(LLM)のイリュージョン現象は、信頼性の高いデプロイメントにおける中核的な障害である。
本稿では「計算必要階層」を構築して確率的チューリングマシンとして大規模言語モデルを定式化し、新しい「ラーナーポンプ補題」によって支持される対角化、不計算性、情報理論の境界において、初めて錯覚が避けられないことを証明した。
ひとつは、RAGの有効性に関する最初の公式な理論を提供する「計算ジャンプ」による絶対的脱出を証明し、もうひとつは、新しいニューラルゲーム理論フレームワークを通じて、継続的学習を「内部化されたオラクル」メカニズムとして形式化し、この経路を実装することである。
関連論文リスト
- Training Cross-Morphology Embodied AI Agents: From Practical Challenges to Theoretical Foundations [16.735655028118817]
この記事では、現実のエンジニアリング障壁を克服するために理論的洞察が不可欠であることを示す。
PSPACE完全である構造化部分可観測マルコフ決定プロセス(POMDP)に還元されることを証明した。
また,生物システムにインスパイアされた分散学習手法である集合適応についても検討する。
論文 参考訳(メタデータ) (2025-06-04T06:44:49Z) - Training Neural Networks as Recognizers of Formal Languages [87.06906286950438]
ニューラルネットワークを文字列のバイナリ分類器として直接訓練し評価する。
3つのニューラルアーキテクチャに対して、チョムスキー階層の様々な言語について結果を提供する。
我々の貢献は、将来の研究において、言語認識の主張を理論的に健全に検証するのに役立つだろう。
論文 参考訳(メタデータ) (2024-11-11T16:33:25Z) - Interpretability at Scale: Identifying Causal Mechanisms in Alpaca [62.65877150123775]
本研究では、Boundless DASを用いて、命令に従う間、大規模言語モデルにおける解釈可能な因果構造を効率的に探索する。
私たちの発見は、成長し、最も広くデプロイされている言語モデルの内部構造を忠実に理解するための第一歩です。
論文 参考訳(メタデータ) (2023-05-15T17:15:40Z) - Multimodal Chain-of-Thought Reasoning in Language Models [94.70184390935661]
言語(テキスト)と視覚(画像)のモダリティを2段階のフレームワークに組み込んだマルチモーダルCoTを提案する。
その結果,ScienceQA と A-OKVQA のベンチマークは,提案手法の有効性を示した。
論文 参考訳(メタデータ) (2023-02-02T07:51:19Z) - Deep learning applied to computational mechanics: A comprehensive
review, state of the art, and the classics [77.34726150561087]
人工知能,特に深層学習(DL)の最近の進歩を概観する。
ハイブリッドおよび純粋機械学習(ML)の手法について論じる。
AIの歴史と限界は、特に古典の誤解や誤解を指摘し、議論され、議論される。
論文 参考訳(メタデータ) (2022-12-18T02:03:00Z) - Explainable AI via Learning to Optimize [2.8010955192967852]
機械学習(ML)では非解読可能なブラックボックスが一般的だが、アプリケーションは説明可能な人工知能(XAI)を必要としている。
この作業は、事前の知識を符号化し、信頼できない推論をフラグ付けしなければならない状況において、XAIのための具体的なツールを提供する。
論文 参考訳(メタデータ) (2022-04-29T15:57:03Z) - Neural Unification for Logic Reasoning over Natural Language [0.28675177318965034]
自動定理証明(Automated Theorem Proving)は、いくつかの予想(クエリ)が一連の公理(事実と規則)の論理的な結果であることを示すことができるコンピュータプログラムの開発を扱う。
近年のアプローチでは、自然言語(英語)で表される公理の予想を導出するトランスフォーマーに基づくアーキテクチャが提案されている。
本研究は, 一般化の項における最先端結果を実現するニューラルユニファイザという, 新たなアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-17T10:48:39Z) - A Study of the Mathematics of Deep Learning [1.14219428942199]
深層学習」/「深層ニューラルネットワーク」は、人工知能の最先端のタスクにますます展開されている技術的驚異です。
この論文は、これらの新しいディープラーニングのパラダイムの強力な理論基盤を構築するためのいくつかのステップを踏む。
論文 参考訳(メタデータ) (2021-04-28T22:05:54Z) - Realising Active Inference in Variational Message Passing: the
Outcome-blind Certainty Seeker [3.5450828190071655]
本稿では、離散時間および状態空間におけるアクティブ推論フレームワークの完全な数学的処理について述べる。
アクティブ推論と変動メッセージパッシングの理論的関係を活用します。
完全因子化変分分布を用いることで, 期待自由エネルギーの簡易化が図れる。
論文 参考訳(メタデータ) (2021-04-23T19:40:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。