論文の概要: An entropy-optimal path to humble AI
- arxiv url: http://arxiv.org/abs/2506.17940v1
- Date: Sun, 22 Jun 2025 08:13:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.660281
- Title: An entropy-optimal path to humble AI
- Title(参考訳): 謙虚なAIへのエントロピー最適経路
- Authors: Davide Bassetti, Lukáš Pospíšil, Michael Groom, Terence J. O'Kane, Illia Horenko,
- Abstract要約: ボルツマン機械の非平衡エントロピー最適化改革のための新しい数学的枠組みを全確率の正確な法則に基づいて導入する。
その結果、数学的に正当化された存在と独特さの基準を持つ高度に高性能で、より安価で、勾配のない学習フレームワークが得られる。
この枠組みを歴史的気候データに適用すると、ラニーナ現象とエルニーノ現象の発症の予測スキルが体系的に高いモデルが得られる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Progress of AI has led to a creation of very successful, but by no means humble models and tools, especially regarding (i) the huge and further exploding costs and resources they demand, and (ii) the over-confidence of these tools with the answers they provide. Here we introduce a novel mathematical framework for a non-equilibrium entropy-optimizing reformulation of Boltzmann machines based on the exact law of total probability. It results in the highly-performant, but much cheaper, gradient-descent-free learning framework with mathematically-justified existence and uniqueness criteria, and answer confidence/reliability measures. Comparisons to state-of-the-art AI tools in terms of performance, cost and the model descriptor lengths on a set of synthetic problems with varying complexity reveal that the proposed method results in more performant and slim models, with the descriptor lengths being very close to the intrinsic complexity scaling bounds for the underlying problems. Applying this framework to historical climate data results in models with systematically higher prediction skills for the onsets of La Ni\~na and El Ni\~no climate phenomena, requiring just few years of climate data for training - a small fraction of what is necessary for contemporary climate prediction tools.
- Abstract(参考訳): AIの進歩は、非常に成功したが、決して謙虚なモデルやツール、特にそれに関するものではない。
一 要求する巨額でさらに爆発する費用及び資源
(ii)これらのツールの過剰な信頼と、それらが提供する回答。
ここでは、全確率の正確な法則に基づいて、ボルツマンマシンの非平衡エントロピー最適化再構成のための新しい数学的枠組みを紹介する。
その結果、数学的に正当化された存在と独特さの基準を持ち、信頼性/信頼性の尺度に答える、高度に高性能で、より安価で、勾配のない学習フレームワークが得られる。
性能,コスト,モデル記述子長の面での最先端のAIツールと比較すると,提案手法はより高性能でスリムなモデルとなり,デクリプタ長は本質的な複雑性スケーリング境界に非常に近いことが分かる。
このフレームワークを歴史的気候データに適用すると、La Ni~naとEl Ni~noの温暖化現象の発症に対して体系的に高い予測スキルを持つモデルが生まれ、訓練に数年の気候データを必要とする。
関連論文リスト
- Modèles de Substitution pour les Modèles à base d'Agents : Enjeux, Méthodes et Applications [0.0]
エージェントベースモデル(ABM)は、局所的な相互作用から生じる創発的な現象を研究するために広く用いられている。
ABMの複雑さは、リアルタイム意思決定と大規模シナリオ分析の可能性を制限する。
これらの制限に対処するため、サロゲートモデルはスパースシミュレーションデータから近似を学習することで効率的な代替手段を提供する。
論文 参考訳(メタデータ) (2025-05-17T08:55:33Z) - EquiNO: A Physics-Informed Neural Operator for Multiscale Simulations [0.8345452787121658]
我々は,マイクロスケール物理予測のための物理インフォームドPDEサロゲートとしてEquiNOを提案する。
我々のフレームワークは、いわゆるマルチスケール FE$,2,$ の計算に適用でき、有限要素法(FE)と演算子学習法(OL)を統合することで FE-OL アプローチを導入している。
論文 参考訳(メタデータ) (2025-03-27T08:42:13Z) - Quantum Neural Networks for Cloud Cover Parameterizations in Climate Models [0.08271752505511926]
短時間の高解像度気候シミュレーションで訓練された機械学習モデルは、従来のパラメータ化を代替する有望な候補である。
QNNは従来のものと異なり、その高い表現性が、正確なデータ駆動スキームのための有望なツールになる可能性がある。
調査対象のQNNの全体的な性能は、トレーニング可能なパラメータの数と同じ大きさの古典的NNと同等であることを示す。
論文 参考訳(メタデータ) (2025-02-14T13:02:49Z) - Towards Physically Consistent Deep Learning For Climate Model Parameterizations [46.07009109585047]
パラメータ化は、気候予測において、系統的なエラーと大きな不確実性の主な原因である。
深層学習(DL)に基づくパラメータ化は、計算に高価で高解像度のショートシミュレーションのデータに基づいて訓練されており、気候モデルを改善するための大きな可能性を示している。
本稿では,DLに基づくパラメータ化のための効率的な教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-06T10:02:49Z) - Towards Learning Stochastic Population Models by Gradient Descent [0.0]
パラメータと構造を同時に推定することで,最適化手法に大きな課題が生じることを示す。
モデルの正確な推定を実証するが、擬似的、解釈可能なモデルの推論を強制することは、難易度を劇的に高める。
論文 参考訳(メタデータ) (2024-04-10T14:38:58Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z) - STORM: Efficient Stochastic Transformer based World Models for
Reinforcement Learning [82.03481509373037]
近年,モデルに基づく強化学習アルゴリズムは視覚入力環境において顕著な有効性を示している。
本稿では,強力なモデリングと生成機能を組み合わせた効率的な世界モデルアーキテクチャであるTransformer-based wORld Model (STORM)を紹介する。
Stormは、Atari 100$kベンチマークで平均126.7%の人的パフォーマンスを達成し、最先端のメソッドの中で新しい記録を樹立した。
論文 参考訳(メタデータ) (2023-10-14T16:42:02Z) - Robots That Ask For Help: Uncertainty Alignment for Large Language Model
Planners [85.03486419424647]
KnowNoは、大きな言語モデルの不確実性を測定し、調整するためのフレームワークである。
KnowNoは、タスク完了に関する統計的保証を提供する共形予測理論に基づいている。
論文 参考訳(メタデータ) (2023-07-04T21:25:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。