論文の概要: Uncertainty Propagation in LLM-Based Systems
- arxiv url: http://arxiv.org/abs/2604.23505v1
- Date: Sun, 26 Apr 2026 02:48:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.398918
- Title: Uncertainty Propagation in LLM-Based Systems
- Title(参考訳): LLMシステムにおける不確実性伝播
- Authors: Boming Xia, Liming Zhu, Erdun Gao, Qinghua Lu, Minhui Xue, Dino Sejdinovic,
- Abstract要約: 大規模言語モデル(LLM)ベースのシステムにおける不確実性は、単一のモデル出力のレベルでしばしば研究される。
本稿では,不確実性伝播のシステムレベルでの考察を行う。
- 参考スコア(独自算出の注目度): 29.364057146424415
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Uncertainty in large language model (LLM)-based systems is often studied at the level of a single model output, yet deployed LLM applications are compound systems in which uncertainty is transformed and reused across model internals, workflow stages, component boundaries, persistent state, and human or organisational processes. Without principled treatment of how uncertainty is carried and reused across these boundaries, early errors can propagate and compound in ways that are difficult to detect and govern. This paper develops a systems-level account of uncertainty propagation. It introduces a conceptual framing for characterising propagated uncertainty signals, presents a structured taxonomy spanning intra-model (P1), system-level (P2), and socio-technical (P3) propagation mechanisms, synthesises cross-cutting engineering insights, and identifies five open research challenges.
- Abstract(参考訳): 大規模言語モデル(LLM)ベースのシステムにおける不確実性は、単一のモデル出力のレベルでしばしば研究されるが、デプロイされたLLMアプリケーションは、モデル内部、ワークフローステージ、コンポーネント境界、永続状態、人間または組織プロセスの間で不確実性が変換され再利用される複合システムである。
これらの境界を越えて不確実性がどのように運ばれ、再利用されるかという原則的な処理がなければ、早期エラーは、検出し、管理することが難しい方法で伝播し、複雑化する可能性がある。
本稿では,不確実性伝播のシステムレベルでの考察を行う。
伝播する不確実性信号を特徴付けるための概念的フレーミングを導入し、モデル内(P1)、システムレベル(P2)、社会技術(P3)の伝播機構にまたがる構造的分類を示し、横断的な工学的洞察を合成し、5つのオープンな研究課題を特定する。
関連論文リスト
- The Anatomy of Uncertainty in LLMs [10.50144444577399]
我々は、不確実性を3つの異なる意味的構成要素に分解する不確実性分解フレームワークを提唱する。
我々のフレームワークは、LSMの信頼性を監査し、幻覚を検知し、目標とする介入やより信頼できるシステムへの道を開くためのより良い理解を提供する。
論文 参考訳(メタデータ) (2026-03-26T02:59:40Z) - Managing Uncertainty in LLM-based Multi-Agent System Operation [4.565220771764574]
安全クリティカルなマルチエージェントソフトウェアシステムのためのライフサイクルベースの不確実性管理フレームワークを提案する。
臨床共同で開発された実世界のLCMベースのマルチエージェント心エコーソフトウェアシステムを用いて,本フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2026-02-26T13:49:16Z) - Why Does the LLM Stop Computing: An Empirical Study of User-Reported Failures in Open-Source LLMs [50.075587392477935]
オープンソースのDeepSeek、Llama、Qwenのエコシステムから、705の現実世界の失敗に関する大規模な実証的研究を行った。
ホワイトボックスオーケストレーションは、モデルアルゴリズムの欠陥からデプロイメントスタックのシステム的脆弱性へと、信頼性のボトルネックを移動させます。
論文 参考訳(メタデータ) (2026-01-20T06:42:56Z) - Beyond Single-Agent Safety: A Taxonomy of Risks in LLM-to-LLM Interactions [0.0]
本稿では,大規模な言語モデルが相互に相互作用する環境に,人間-モデル相互作用用に設計された安全メカニズムがスケールしない理由について検討する。
モデルレベルの安全性からシステムレベルの安全性への概念的移行を提案し,ESRH(Emergent Systemic Risk Horizon)の枠組みを導入する。
i) LLMの相互作用における集団的リスクの理論的考察,(ii)マイクロ,メソ,マクロレベルの障害モードを接続する分類法,および(iii)マルチエージェントシステムに適応的監視を組み込むアーキテクチャであるInstitutionalAIの設計を提案する。
論文 参考訳(メタデータ) (2025-12-02T12:06:57Z) - A Survey of Frontiers in LLM Reasoning: Inference Scaling, Learning to Reason, and Agentic Systems [93.8285345915925]
推論(Reasoning)は、論理的推論、問題解決、意思決定を可能にする基本的な認知プロセスである。
大規模言語モデル(LLM)の急速な進歩により、推論は高度なAIシステムを区別する重要な能力として浮上した。
我々は,(1)推論が達成される段階を定義するレジーム,(2)推論プロセスに関与するコンポーネントを決定するアーキテクチャの2つの側面に沿って既存の手法を分類する。
論文 参考訳(メタデータ) (2025-04-12T01:27:49Z) - Decomposing Uncertainty for Large Language Models through Input Clarification Ensembling [69.83976050879318]
大規模言語モデル(LLM)では、不確実性の原因を特定することが、信頼性、信頼性、解釈可能性を改善するための重要なステップである。
本稿では,LLMのための不確実性分解フレームワークについて述べる。
提案手法は,入力に対する一連の明確化を生成し,それらをLLMに入力し,対応する予測をアンサンブルする。
論文 参考訳(メタデータ) (2023-11-15T05:58:35Z) - Supporting Early-Safety Analysis of IoT Systems by Exploiting Testing
Techniques [9.095386349136717]
フェールロジック分析 FLAは、潜在的な障害シナリオを予測するテクニックである。
手動でFLAルールを指定すれば、不完全あるいは不正確な仕様につながる、厳しいエラーが発生します。
これらのルールの完全性と正確性を改善するために,テスト手法を採用することを提案する。
論文 参考訳(メタデータ) (2023-09-06T13:32:39Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - STPA for Learning-Enabled Systems: A Survey and A New Practice [12.665507596261266]
システム理論プロセス分析(System Theoretic Process Analysis、STPA)は、輸送、エネルギー、防衛を含む多くの産業セクターで使用されているハザード分析の体系的なアプローチである。
安全クリティカルシステムにおける機械学習(ML)の利用傾向は、学習可能システム(LES)へのSTPAの拡張の必要性につながっている。
我々は,31論文の体系的な調査を行い,これらを5つの視点から要約する(関心,研究対象,修正,デリバティブ,プロセスのモデル化)。
私たちはDeepSTPAを紹介します。DeepSTPAは、現状から欠落している2つの側面から、DeepSTPAを強化します。
論文 参考訳(メタデータ) (2023-02-21T10:43:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。