論文の概要: Physics of Learning: A Lagrangian perspective to different learning paradigms
- arxiv url: http://arxiv.org/abs/2509.21049v1
- Date: Thu, 25 Sep 2025 12:00:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.881685
- Title: Physics of Learning: A Lagrangian perspective to different learning paradigms
- Title(参考訳): 学習の物理 : 異なる学習パラダイムに対するラグランジュ的視点
- Authors: Siyuan Guo, Bernhard Schölkopf,
- Abstract要約: 効率的な学習は情報を最小時間で処理し、すなわち、最小数の観測値で所望の誤差閾値に達するシステムを構築する。
我々は古典的な学習アルゴリズム、強化学習におけるベルマンの最適性方程式、第一原理から生成モデルにおけるアダムを導出する。
我々は,ラグランジアンにおける定常経路の学習探索と,定常軌道を求めることによって学習アルゴリズムが導出可能であることを仮定する。
- 参考スコア(独自算出の注目度): 60.75807831005178
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the problem of building an efficient learning system. Efficient learning processes information in the least time, i.e., building a system that reaches a desired error threshold with the least number of observations. Building upon least action principles from physics, we derive classic learning algorithms, Bellman's optimality equation in reinforcement learning, and the Adam optimizer in generative models from first principles, i.e., the Learning $\textit{Lagrangian}$. We postulate that learning searches for stationary paths in the Lagrangian, and learning algorithms are derivable by seeking the stationary trajectories.
- Abstract(参考訳): 本稿では,効率的な学習システム構築の課題について考察する。
効率的な学習は情報を最小時間で処理し、すなわち、最小数の観測値で所望の誤差閾値に達するシステムを構築する。
物理学から最小の作用原理を構築し、古典的な学習アルゴリズム、強化学習におけるベルマンの最適性方程式、第一原理から生成モデルにおけるアダム最適化、すなわち学習$\textit{Lagrangian}$を導出する。
我々は,ラグランジアンにおける定常経路の学習探索と,定常軌道を求めることによって学習アルゴリズムが導出可能であることを仮定する。
関連論文リスト
- A Unified Framework for Neural Computation and Learning Over Time [56.44910327178975]
Hamiltonian Learningはニューラルネットワークを"時間とともに"学習するための新しい統合フレームワーク
i)外部ソフトウェアソルバを必要とせずに統合できる、(ii)フィードフォワードおよびリカレントネットワークにおける勾配に基づく学習の概念を一般化する、(iii)新しい視点で開放する、という微分方程式に基づいている。
論文 参考訳(メタデータ) (2024-09-18T14:57:13Z) - From Learning to Optimize to Learning Optimization Algorithms [1.2031796234206134]
我々は、古典的アルゴリズムが従うが、これまでは、学習の最適化(L2O)には使われていない重要な原則を特定します。
我々は,データ,アーキテクチャ,学習戦略を考慮した汎用設計パイプラインを提供し,古典最適化とL2Oの相乗効果を実現する。
我々は,新しい学習強化BFGSアルゴリズムを設計し,テスト時に多くの設定に適応する数値実験を行うことにより,これらの新原理の成功を実証する。
論文 参考訳(メタデータ) (2024-05-28T14:30:07Z) - Neural Algorithmic Reasoning Without Intermediate Supervision [21.852775399735005]
我々は、中間的監督に訴えることなく、入出力ペアからのみニューラルネットワーク推論を学ぶことに集中する。
我々は、アルゴリズムの軌跡にアクセスできることなく、モデルの中間計算を正規化できる自己教師対象を構築する。
CLRSic Algorithmic Reasoning Benchmarkのタスクにおいて,提案手法はトラジェクトリを教師する手法と競合することを示す。
論文 参考訳(メタデータ) (2023-06-23T09:57:44Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Tree-Based Adaptive Model Learning [62.997667081978825]
我々はKearns-Vazirani学習アルゴリズムを拡張し、時間とともに変化するシステムを扱う。
本稿では,学習前の動作を再利用し,更新し,LearnerLibライブラリに実装し,大規模な実例で評価する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-31T21:24:22Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - Mastering Rate based Curriculum Learning [78.45222238426246]
学習の進行という概念には、学習者のサンプル効率の低下につながるいくつかの欠点があると主張する。
本稿では,習得率の概念に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-08-14T16:34:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。