論文の概要: minAction.net: Energy-First Neural Architecture Design -- From Biological Principles to Systematic Validation
- arxiv url: http://arxiv.org/abs/2604.24805v2
- Date: Wed, 29 Apr 2026 19:07:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 14:06:12.65189
- Title: minAction.net: Energy-First Neural Architecture Design -- From Biological Principles to Systematic Validation
- Title(参考訳): minAction.net: エネルギーファーストのニューラルアーキテクチャ設計 - 生物学的原理から体系的検証まで
- Authors: Martin G. Frasch,
- Abstract要約: 現代の学習は、内部計算コストを明示的に扱うことなく精度を最適化する。
視覚, テキストニューロモーフィック, 生理的データセットにまたがる2203実験におけるエネルギー認識学習の評価を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Modern machine learning optimizes for accuracy without explicit treatment of internal computational cost, even though physical and biological systems operate under intrinsic energy constraints. We evaluate energy-aware learning across 2,203 experiments spanning vision, text, neuromorphic, and physiological datasets with 10 seeds per configuration and factorial statistical analysis. Three findings emerge. First, architecture alone explains negligible variance in accuracy (partial eta^2 = 0.001), while the architecture x dataset interaction is large (partial eta^2 = 0.44, p < 0.001), demonstrating that optimal architecture depends critically on task modality and rejecting the assumption of a universal best architecture. Second, a controlled lambda-sweep across lambda in {0, 1e-5, 1e-4, 1e-3, 1e-2} validates a single-parameter energy-regularized objective L = L_CE + lambda * E(theta, x): across this range, internal activation energy decreases by approximately three orders of magnitude relative to the unregularized lambda=0 baseline, with negligible accuracy change (<0.5 percentage points) on both MNIST and Fashion-MNIST. Third, energy-first architectures inspired by an action-principle framework yield 5-33% within-modality training-efficiency gains over conventional baselines. These results emerge from a research program that interprets learning through a structural correspondence between the action functional in classical mechanics, free energy in statistical physics, and KL-regularized objectives in variational inference. We frame this correspondence as a design hypothesis, not a derivation.
- Abstract(参考訳): 現代の機械学習は、物理的および生物学的システムが本質的なエネルギー制約の下で動作しているにもかかわらず、内部計算コストを明示的に扱うことなく精度を最適化する。
視覚, テキスト, ニューロモーフィック, 生理的データセットを対象とし, 構成10種, 因子統計分析を行った。
3つの発見がある。
まず、アーキテクチャだけでは精度の無視可能な分散(partial eta^2 = 0.001)を説明し、一方アーキテクチャ x データセットの相互作用は大きい(partial eta^2 = 0.44, p < 0.001)。
第2に、制御されたラムダ-sweep in {0, 1e-5, 1e-4, 1e-3, 1e-2} は、MNIST と Fashion-MNIST の両方で無視できる精度変化 (0.5%) とともに、制御されたラムダ-sweep across lambda において、1パラメータのエネルギー正規化対象 L = L_CE + lambda * E(theta, x) を検証する。
第3に、アクション・プリンシプル・フレームワークにインスパイアされたエネルギー優先アーキテクチャは、従来のベースラインよりも5~33%のモダリティ内トレーニング・効率向上をもたらす。
これらの結果は、古典力学における機能的作用、統計物理学における自由エネルギー、変分推論におけるKL正規化目的の間の構造的対応を通して学習を解釈する研究プログラムから生まれた。
私たちはこの対応を、導出ではなく、設計仮説として捉えています。
関連論文リスト
- From Phenomenological Fitting to Endogenous Deduction: A Paradigm Leap via Meta-Principle Physics Architecture [0.0]
メタ原理物理アーキテクチャ(MPPA)の構築
MPPAは3つの中核となるメタ原則 – 接続性、保存性、周期性 – をアーキテクチャに組み込む。
物理推論(0から0から0.436、0.436対0.000)、2.18xの数学的タスク改善(0.330対0.151)、52%の論理的タスクゲイン(0.456対0.300)、3.69%の検証難読度(259.45対269.40)、11.8%のパラメータ(242.40M対216.91M)。
論文 参考訳(メタデータ) (2026-04-09T13:35:17Z) - Neuro-Symbolic Activation Discovery: Transferring Mathematical Structures from Physics to Ecology for Parameter-Efficient Neural Networks [0.0]
本稿では、遺伝的プログラミングを用いてデータから解釈可能な数学的公式を抽出するNeuro-Symbolic Activation Discoveryを提案する。
我々の重要な貢献は、幾何移動現象の発見である: 粒子物理学のデータから得られた活性化関数は、生態学的分類にうまく一般化する。
我々の研究は、効率的な科学的機械学習のためのドメイン固有のアクティベーションライブラリへの道を開く。
論文 参考訳(メタデータ) (2026-01-10T02:49:32Z) - Phythesis: Physics-Guided Evolutionary Scene Synthesis for Energy-Efficient Data Center Design via LLMs [9.210347753567092]
データセンターインフラストラクチャは、コンピューティング能力の増大する需要をサポートするバックボーンとして機能する。
伝統的な設計手法は、人間の専門知識と専門的なシミュレーションツールを混ぜ合わせている。
近年の研究では、有能な人間中心の屋内レイアウトを設計するために、生成人工知能が採用されている。
大規模言語モデル(LLM)と物理誘導進化最適化を相乗化する新しいフレームワークであるPhythesisを提案する。
論文 参考訳(メタデータ) (2025-12-11T13:04:44Z) - Teaching Language Models to Reason with Tools [73.21700643314917]
emphHint-Engineeringは、推論経路内の最適点に様々なヒントを戦略的に注入する新しいデータ合成戦略である。
CoRTは効率を大幅に向上させ、32Bモデルのトークン使用量を約30%削減し、1.5Bモデルのトークン使用量を50%削減した。
論文 参考訳(メタデータ) (2025-10-23T08:41:44Z) - A Neural Network for the Identical Kuramoto Equation: Architectural Considerations and Performance Evaluation [0.0]
同一振動子倉本モデルから導かれる非局所保存法の解法を近似するためのディープニューラルネットワーク(DNN)の効率について検討する。
ネットワーク構成パラメータが収束特性に影響を与えることを示す。
我々は,一意的あるいは一意的な解を扱う際に,標準フィードフォワードアーキテクチャの基本的限界を特定する。
論文 参考訳(メタデータ) (2025-09-17T19:37:01Z) - ZeroLM: Data-Free Transformer Architecture Search for Language Models [54.83882149157548]
現在の自動プロキシ発見アプローチは、検索時間の拡張、データの過度なオーバーフィットへの感受性、構造的な複雑さに悩まされている。
本稿では,効率的な重み統計によるモデルキャパシティの定量化を目的とした,新しいゼロコストプロキシ手法を提案する。
本評価は,FlexiBERT ベンチマークで Spearman's rho 0.76 と Kendall's tau 0.53 を達成し,このアプローチの優位性を示すものである。
論文 参考訳(メタデータ) (2025-03-24T13:11:22Z) - DimINO: Dimension-Informed Neural Operator Learning [41.37905663176428]
Diminoは次元分析にインスパイアされたフレームワークである。
既存のニューラル演算子アーキテクチャにシームレスに統合することができる。
PDEデータセットで最大76.3%のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2024-10-08T10:48:50Z) - Energy Transformer [64.22957136952725]
我々の研究は、機械学習における有望な3つのパラダイム、すなわち注意機構、エネルギーベースモデル、連想記憶の側面を組み合わせる。
本稿では,エネルギー変換器(ET,Energy Transformer)と呼ばれる新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-14T18:51:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。