論文の概要: Thermodynamic Machine Learning through Maximum Work Production
- arxiv url: http://arxiv.org/abs/2006.15416v3
- Date: Mon, 12 Apr 2021 17:04:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 07:40:15.586329
- Title: Thermodynamic Machine Learning through Maximum Work Production
- Title(参考訳): 最大生産量による熱力学機械学習
- Authors: A. B. Boyd, J. P. Crutchfield, and M. Gu
- Abstract要約: 本稿では, 適応型物理エージェントにおいて, 作業生産が最も重要な性能指標であるという熱力学の原理を紹介する。
与えられた環境データに対する最大作業エージェントの選択は、最大作業員モデルを見つけることと一致していることを示す。
このようにして、適応的な熱力学系における学習の基盤となる組織原理として研究が生まれる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adaptive systems -- such as a biological organism gaining survival advantage,
an autonomous robot executing a functional task, or a motor protein
transporting intracellular nutrients -- must model the regularities and
stochasticity in their environments to take full advantage of thermodynamic
resources. Analogously, but in a purely computational realm, machine learning
algorithms estimate models to capture predictable structure and identify
irrelevant noise in training data. This happens through optimization of
performance metrics, such as model likelihood. If physically implemented, is
there a sense in which computational models estimated through machine learning
are physically preferred? We introduce the thermodynamic principle that work
production is the most relevant performance metric for an adaptive physical
agent and compare the results to the maximum-likelihood principle that guides
machine learning. Within the class of physical agents that most efficiently
harvest energy from their environment, we demonstrate that an efficient agent's
model explicitly determines its architecture and how much useful work it
harvests from the environment. We then show that selecting the maximum-work
agent for given environmental data corresponds to finding the
maximum-likelihood model. This establishes an equivalence between
nonequilibrium thermodynamics and dynamic learning. In this way, work
maximization emerges as an organizing principle that underlies learning in
adaptive thermodynamic systems.
- Abstract(参考訳): 生物の生存の優位性、機能的タスクを実行する自律ロボット、細胞内の栄養素を輸送するモータータンパク質などの適応システムは、熱力学的資源を最大限に活用するために、環境の規則性と確率性をモデル化する必要がある。
同様に、純粋に計算領域では、機械学習アルゴリズムは予測可能な構造をキャプチャし、トレーニングデータの無関係なノイズを識別するためにモデルを推定する。
これはモデルの可能性のようなパフォーマンスメトリクスの最適化によって起こる。
物理的に実装すれば、機械学習によって推定される計算モデルが物理的に望ましいという感覚はあるだろうか?
本稿では,作業生産が適応的物理エージェントの最も重要なパフォーマンス指標であるという熱力学原理を導入し,その結果を機械学習を導く最大原理と比較する。
効率の良いエージェントのモデルが環境からエネルギーを最も効率的に取り出す物理的エージェントのクラスの中で、そのアーキテクチャと、それが環境からどれだけ有用な仕事を得るかを明確に決定できることを実証する。
次に,与えられた環境データに対する最大作業エージェントの選択は,最大類似度モデルの発見に対応していることを示す。
これは非平衡熱力学と動的学習の等価性を確立する。
このように、仕事の最大化は適応熱力学系における学習の基盤となる組織原理として現れる。
関連論文リスト
- Understanding Machine Learning Paradigms through the Lens of Statistical Thermodynamics: A tutorial [0.0]
このチュートリアルは、エントロピー、自由エネルギー、そして機械学習に使用される変分推論のような高度なテクニックを掘り下げる。
物理的システムの振る舞いを深く理解することで、より効果的で信頼性の高い機械学習モデルが得られることを示す。
論文 参考訳(メタデータ) (2024-11-24T18:20:05Z) - DiffuseBot: Breeding Soft Robots With Physics-Augmented Generative
Diffusion Models [102.13968267347553]
本稿では,様々なタスクにおいて優れたソフトロボット形態を生成する物理拡張拡散モデルであるDiffuseBotを提案する。
我々は、その能力とともに、シミュレーションされた、そして製造された様々なロボットを紹介します。
論文 参考訳(メタデータ) (2023-11-28T18:58:48Z) - STORM: Efficient Stochastic Transformer based World Models for
Reinforcement Learning [82.03481509373037]
近年,モデルに基づく強化学習アルゴリズムは視覚入力環境において顕著な有効性を示している。
本稿では,強力なモデリングと生成機能を組み合わせた効率的な世界モデルアーキテクチャであるTransformer-based wORld Model (STORM)を紹介する。
Stormは、Atari 100$kベンチマークで平均126.7%の人的パフォーマンスを達成し、最先端のメソッドの中で新しい記録を樹立した。
論文 参考訳(メタデータ) (2023-10-14T16:42:02Z) - A Comparative Study of Machine Learning Algorithms for Anomaly Detection
in Industrial Environments: Performance and Environmental Impact [62.997667081978825]
本研究は,環境の持続可能性を考慮した高性能機械学習モデルの要求に応えることを目的としている。
Decision TreesやRandom Forestsといった従来の機械学習アルゴリズムは、堅牢な効率性とパフォーマンスを示している。
しかし, 資源消費の累積増加にもかかわらず, 最適化された構成で優れた結果が得られた。
論文 参考訳(メタデータ) (2023-07-01T15:18:00Z) - Dynamic-Resolution Model Learning for Object Pile Manipulation [33.05246884209322]
本研究では,様々な抽象レベルで動的かつ適応的な表現を学習し,効率と効率の最適なトレードオフを実現する方法について検討する。
具体的には、環境の動的分解能粒子表現を構築し、グラフニューラルネットワーク(GNN)を用いた統一力学モデルを学ぶ。
本手法は, 粒状オブジェクトの収集, ソート, 再分配において, 最先端の固定解像度ベースラインよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2023-06-29T05:51:44Z) - Pessimism meets VCG: Learning Dynamic Mechanism Design via Offline
Reinforcement Learning [114.36124979578896]
オフライン強化学習アルゴリズムを用いて動的メカニズムを設計する。
我々のアルゴリズムは悲観主義の原理に基づいており、オフラインデータセットのカバレッジについて軽度な仮定しか必要としない。
論文 参考訳(メタデータ) (2022-05-05T05:44:26Z) - Gradient-Based Trajectory Optimization With Learned Dynamics [80.41791191022139]
データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。
ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。
ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
論文 参考訳(メタデータ) (2022-04-09T22:07:34Z) - Model Predictive Actor-Critic: Accelerating Robot Skill Acquisition with
Deep Reinforcement Learning [42.525696463089794]
Model Predictive Actor-Critic (MoPAC)は、モデル予測ロールアウトとポリシー最適化を組み合わせてモデルバイアスを軽減するハイブリッドモデルベース/モデルフリーメソッドである。
MoPACは最適なスキル学習を近似誤差まで保証し、環境との物理的相互作用を減らす。
論文 参考訳(メタデータ) (2021-03-25T13:50:24Z) - Tensor network approaches for learning non-linear dynamical laws [0.0]
制御方程式のテンソルネットワークに基づくパラメータ化により,様々な物理的制約を捉えることができることを示す。
データから構造化された動的法則を復元する物理インフォームドアプローチを提案し、表現性とスケーラビリティの必要性を適応的にバランスさせる。
論文 参考訳(メタデータ) (2020-02-27T19:02:40Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。