論文の概要: Coherence Mechanisms for Provable Self-Improvement
- arxiv url: http://arxiv.org/abs/2511.08440v1
- Date: Wed, 12 Nov 2025 01:58:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.818287
- Title: Coherence Mechanisms for Provable Self-Improvement
- Title(参考訳): 予防可能な自己改善のためのコヒーレンスメカニズム
- Authors: Mehryar Mohri, Jon Schneider, Yifan Wu,
- Abstract要約: 両立概念に基づく自己改善のための原則的枠組みを提案する。
我々は、この概念をプロジェクションに基づくメカニズムを用いて定式化し、ベースラインモデルを一貫した状態に更新すると同時に、元の振る舞いに可能な限り近づいたままにしておく。
我々の分析は包括的であり、遠近法と遠近法の両方を網羅し、これらの保証を実現不可能な設定にしっかりと拡張している。
- 参考スコア(独自算出の注目度): 38.3455527898461
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-improvement is a critical capability for large language models and other intelligent systems, enabling them to refine their behavior and internal consistency without external supervision. Despite its importance, prior approaches largely rely on empirical heuristics and lack formal guarantees. In this paper, we propose a principled framework for self-improvement based on the concept of \emph{coherence}, which requires that a model's outputs remain consistent under task-preserving transformations of the input. We formalize this concept using projection-based mechanisms that update a baseline model to be coherent while remaining as close as possible to its original behavior. We provide rigorous theoretical guarantees that these mechanisms achieve \emph{monotonic improvement}, measured by a reduction in expected Bregman divergence. Our analysis is comprehensive, covering both \emph{direct} and \emph{two-step} projection methods, and robustly extends these guarantees to non-realizable settings, empirical (finite-sample) distributions, and relaxed coherence constraints. Furthermore, we establish a general \emph{characterization theorem}, showing that any mechanism with similar provable improvement guarantees must inherently conform to a coherence-based structure. This culminates in rigidity results under the demand for universal improvement, establishing coherence as a fundamental and, in a formal sense, necessary principle for provable self-improvement.
- Abstract(参考訳): 自己改善は、大規模な言語モデルやその他のインテリジェントシステムにとって重要な能力であり、外部の監督なしに、その振る舞いと内部の一貫性を洗練できる。
その重要性にもかかわらず、先行のアプローチは経験的ヒューリスティックに大きく依存し、正式な保証を欠いている。
本稿では,入力のタスク保存変換の下でモデルの出力が一貫したままでいなければならないという,‘emph{coherence}’という概念に基づく自己改善の原則的枠組みを提案する。
我々は、この概念をプロジェクションに基づくメカニズムを用いて定式化し、ベースラインモデルを一貫した状態に更新すると同時に、元の振る舞いに可能な限り近づいたままにしておく。
我々はこれらのメカニズムが期待されるブレグマンの発散の減少によって測定された 'emph{monotonic Improvement} を達成するという厳密な理論的保証を提供する。
我々の分析は包括的であり、 \emph{direct} と \emph{two-step} の射影法の両方を網羅し、これらの保証を、実現不可能な設定、経験的(有限サンプル)分布、緩和されたコヒーレンス制約に強く拡張する。
さらに、同様の証明可能な改善保証を持つメカニズムは、本質的にコヒーレンスに基づく構造に従わなければならないことを示す、一般的な 'emph{characterization theorem} を確立する。
このことは、普遍的な改善の要求の下で厳密な結果をもたらし、コヒーレンスを基本として、形式的な意味では、証明可能な自己改善に必要な原則として確立する。
関連論文リスト
- The Causal Round Trip: Generating Authentic Counterfactuals by Eliminating Information Loss [4.166536642958902]
構造再構成誤差(SRE)を除去して因果音を発生させる最初の拡散型フレームワークであるBELM-MDCMを紹介する。
我々の研究は、古典的因果論の厳密さと近代的な生成モデルのパワーを調和させる。
論文 参考訳(メタデータ) (2025-11-07T13:37:23Z) - Utility-Learning Tension in Self-Modifying Agents [0.12744523252873352]
本研究では,即時ないし期待される性能を改善するユーティリティ駆動型変更により,信頼性のある学習と一般化のための統計的前提条件を省くことができることを示す。
本研究は, 配電保証が保留されていること, ポリシ到達可能なモデルファミリが一様に容量制限されていることを示唆する。
現実に共通する標準的な仮定では、これらの軸は同じ容量の基準に還元され、安全な自己修正のための単一の境界となる。
論文 参考訳(メタデータ) (2025-10-05T23:52:16Z) - ERIS: An Energy-Guided Feature Disentanglement Framework for Out-of-Distribution Time Series Classification [51.07970070817353]
理想的な時系列分類(TSC)は不変表現をキャプチャできるべきである。
現在の手法は、真に普遍的な特徴を分離するために必要な意味的な方向性を欠いている。
本稿では,シフト・ロバストネス・フレームワークのためのエンドツーエンドのエネルギー規則化情報を提案する。
論文 参考訳(メタデータ) (2025-08-19T12:13:41Z) - Toward a Graph-Theoretic Model of Belief: Confidence, Credibility, and Structural Coherence [0.0]
本稿では、有向重み付きグラフとして、信念システムに対する最小の定式化を導入する。
論理的および議論に基づくフレームワークとは異なり、バイナリの正当化ステータスや推論的クロージャをコミットすることなく、きめ細かい構造表現をサポートする。
その目的は、信念体系の内部組織を解析するための基盤となる基盤を提供することである。
論文 参考訳(メタデータ) (2025-08-05T14:03:23Z) - Function-coherent gambles [0.0]
本稿では,非線形効用に対応する一般化である関数コヒーレントギャンブルを提案する。
連続線型汎函数を通した許容ギャンブルを特徴づける表現定理を証明する。
関数コヒーレントフレームワークに定レート指数割引の代替手段を組み込むことを実証する。
論文 参考訳(メタデータ) (2025-02-22T14:44:54Z) - Strategyproof and Proportionally Fair Facility Location [77.16035689756859]
簡単な1次元集団決定問題(しばしば施設配置問題と呼ばれる)に焦点を当てる。
比例に基づく様々な強度のフェアネス公理の階層構造を解析する。
各公理に対して、公理と戦略の安全性を満足するメカニズムのファミリーを特徴付ける。
論文 参考訳(メタデータ) (2021-11-02T12:41:32Z) - Towards a Theoretical Understanding of the Robustness of Variational
Autoencoders [82.68133908421792]
敵攻撃や他の入力摂動に対する変分オートエンコーダ(VAE)の堅牢性を理解するために,我々は進出している。
確率モデルにおけるロバスト性のための新しい基準である$r$-robustnessを開発する。
遠心法を用いて訓練したVAEが、ロバストネスの指標でよく評価されていることを示す。
論文 参考訳(メタデータ) (2020-07-14T21:22:29Z) - A general framework for defining and optimizing robustness [74.67016173858497]
分類器の様々な種類の堅牢性を定義するための厳密でフレキシブルなフレームワークを提案する。
我々の概念は、分類器の堅牢性は正確性とは無関係な性質と考えるべきであるという仮定に基づいている。
我々は,任意の分類モデルに適用可能な,非常に一般的なロバスト性フレームワークを開発する。
論文 参考訳(メタデータ) (2020-06-19T13:24:20Z) - Target-Embedding Autoencoders for Supervised Representation Learning [111.07204912245841]
本稿では,対象空間が高次元な純粋教師付き環境における一般化の枠組みを解析する。
我々は、教師付き予測のための目標埋め込みオートエンコーダ(TEA)の一般的なフレームワークのモチベーションと形式化を行い、特徴とターゲットの予測の両方から予測可能なように最適化された中間潜在表現を学習する。
論文 参考訳(メタデータ) (2020-01-23T02:37:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。