論文の概要: Consolidation-Expansion Operator Mechanics:A Unified Framework for Adaptive Learning
- arxiv url: http://arxiv.org/abs/2605.09968v2
- Date: Wed, 13 May 2026 04:13:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 17:13:58.846345
- Title: Consolidation-Expansion Operator Mechanics:A Unified Framework for Adaptive Learning
- Title(参考訳): 統合拡張演算子力学:適応学習のための統一フレームワーク
- Authors: Debashis Guha,
- Abstract要約: 本稿では,この構造を正確にするためのフレームワークであるemphConsolidation Operator Mechanics (OpMech)を提案する。
中心となるオブジェクトは、emphorder-gap $Ogap(; e)$、コンソリデーション演算子$Q$と拡張演算子$P_e$が与えられた知識状態で通勤できない程度である。
順序ギャップはシステム自身の軌道から計算可能であるため、リアルタイム制御信号として機能する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Every adaptive learning system must alternate between two operations: consolidating what it already knows and expanding into new evidence. We propose \emph{Consolidation-Expansion Operator Mechanics} (OpMech), a framework that makes this structure precise. The central object is the \emph{order-gap} $\Ogap(θ; e)$, the degree to which a consolidation operator~$Q$ and an expansion operator~$P_e$ fail to commute at a given knowledge state. Because the order-gap is computable from the system's own trajectory, it serves as a real-time control signal: large values indicate that the system is still sensitive to the ordering of consolidation and expansion; once the order-gap falls and stays small, further processing is unlikely to change the outcome. Three results give the signal precise meaning: the order-gap decays along convergent trajectories; a persistently large order-gap implies the system is far from its settled state; and an order-gap-based stopping rule terminates with provable guarantees in both noiseless and bounded-noise settings. The framework applies across five domains: bandits, reinforcement learning, stochastic optimization, continual learning, and recursive language models. We give conditions under which the order-gap reliably tracks convergence in three representative cases. We develop the recursive language model application in detail, showing how OpMech replaces heuristic stopping rules and fixed recursion budgets with principled, evidence-driven alternatives.
- Abstract(参考訳): すべての適応学習システムは、2つの操作を交互に行う必要がある。
我々は,この構造を正確にするためのフレームワークである 'emph{Consolidation-Expansion Operator Mechanics} (OpMech) を提案する。
中心となる対象は \emph{order-gap} $\Ogap(θ; e)$ であり、連結作用素~$Q$ と拡張作用素~$P_e$ が与えられた知識状態で通勤できない程度である。
オーダーギャップはシステム自身の軌道から計算可能であるため、リアルタイム制御信号として機能する: 大きな値は、システムが統合と拡張の順序にまだ敏感であることを示し、オーダーギャップが小さくなり続けると、さらなる処理が結果を変える可能性は低い。
3つの結果は信号の正確な意味を与える: 順序ギャップは収束軌跡に沿って崩壊する; 永続的に大きい順序ギャップは系が落ち着いた状態から遠く離れていることを示す; 順序ギャップに基づく停止規則は、ノイズレスおよび有界雑音の両方において証明可能な保証で終了する。
このフレームワークは、帯域幅、強化学習、確率最適化、連続学習、再帰言語モデルという5つの領域にまたがる。
順序ギャップが3つの代表事例における収束を確実に追跡する条件を与える。
我々は,OpMechがヒューリスティックな停止規則と固定された再帰予算を,原則的,エビデンス駆動の代替手段でどのように置き換えるかを示す,再帰的言語モデルアプリケーションを開発した。
関連論文リスト
- State Representation and Termination for Recursive Reasoning Systems [3.276545330242602]
再帰的推論システムは、新しい証拠の取得と蓄積された理解の精査を交互に行う。
本稿では、進化する推論状態の表現方法と、いつ反復を止めるかについて述べる。
我々は,この枠組みをエージェントループ,ツリー・オブ・シント推論,定理証明,連続学習に適用する。
論文 参考訳(メタデータ) (2026-05-02T07:40:09Z) - When Agents Evolve, Institutions Follow [52.359340707289114]
大規模言語モデル上に構築されたマルチエージェントシステムは、同じ課題に直面している。
彼らの中心的な問題は、個人の知性だけでなく、集団的な組織である。
我々は,4つの標準的ガバナンスパターンにまたがる7つの歴史的政治機関を,実行可能なマルチエージェントアーキテクチャに翻訳する。
論文 参考訳(メタデータ) (2026-04-30T10:30:58Z) - Compiling Deterministic Structure into SLM Harnesses [0.6117371161379209]
小型言語モデル(SLM)は高価であり、大量使用にはデータ主権が制限される。
本稿では,エージェント改善を個別実行計画にコンパイルするSGDe(Semantic Gradient Descent)を提案する。
論文 参考訳(メタデータ) (2026-04-19T14:04:29Z) - Riemannian Optimization in Modular Systems [0.006486143522483092]
バックプロパゲーションアルゴリズムは、ニューラルネットワークの成功に有効である。
実証的な成功にもかかわらず、それに対する強い理論的理解は欠如している。
我々は、収束特性を定量化できる構成可能なリーマン加群の枠組みを開発する。
論文 参考訳(メタデータ) (2026-03-04T00:47:29Z) - Phase Transition for Budgeted Multi-Agent Synergy [41.486076708302456]
マルチエージェントシステムは信頼性を向上させることができるが、固定された推論予算の下では、しばしば役立つか、飽和するか、崩壊するかさえある。
我々は、現代のエージェントスタックの3つの束縛制約からこれらの状態を予測する最小限の校正可能な理論を開発する。
論文 参考訳(メタデータ) (2026-01-24T05:32:50Z) - Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large Reasoning Models [86.88657425848547]
大型推論モデル(LRMs)はすでに長い連鎖推論のための潜在能力を持っている。
我々は、自動生成の自己検証タスクを使用して、モデルに推論、帰納、誘拐の3つのメタ能力を持たせることを明確にした。
我々の3つのステージ・パイプラインの個別アライメント、パラメータ空間のマージ、ドメイン固有の強化学習は、命令調整ベースラインと比較して10%以上のパフォーマンス向上を実現します。
論文 参考訳(メタデータ) (2025-05-15T17:58:33Z) - Near-Optimal Online Learning for Multi-Agent Submodular Coordination: Tight Approximation and Communication Efficiency [52.60557300927007]
離散部分モジュラー問題を連続的に最適化するために,$textbfMA-OSMA$アルゴリズムを提案する。
また、一様分布を混合することによりKLの発散を効果的に活用する、プロジェクションフリーな$textbfMA-OSEA$アルゴリズムも導入する。
我々のアルゴリズムは最先端OSGアルゴリズムによって提供される$(frac11+c)$-approximationを大幅に改善する。
論文 参考訳(メタデータ) (2025-02-07T15:57:56Z) - Optimization of Time-Dependent Decoherence Rates and Coherent Control
for a Qutrit System [77.34726150561087]
非コヒーレント制御は、特定の制御方法で時間に応じてデコヒーレンス率を決定する。
我々は、システムの最終状態$rho(T)$と与えられたターゲット状態$rho_rmターゲットとの間のヒルベルト・シュミットの重なりを最大化する問題を考察する。
論文 参考訳(メタデータ) (2023-08-08T01:28:50Z) - Discovering Non-monotonic Autoregressive Orderings with Variational
Inference [67.27561153666211]
我々は、訓練データから高品質な生成順序を純粋に検出する、教師なし並列化可能な学習装置を開発した。
エンコーダを非因果的注意を持つトランスフォーマーとして実装し、1つのフォワードパスで置換を出力する。
言語モデリングタスクにおける経験的結果から,我々の手法は文脈認識であり,一定の順序と競合する,あるいはより優れた順序を見つけることができる。
論文 参考訳(メタデータ) (2021-10-27T16:08:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。