論文の概要: Metriplector: From Field Theory to Neural Architecture
- arxiv url: http://arxiv.org/abs/2603.29496v2
- Date: Mon, 06 Apr 2026 09:07:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.444462
- Title: Metriplector: From Field Theory to Neural Architecture
- Title(参考訳): Metriplector:フィールド理論からニューラルアーキテクチャへ
- Authors: Dan Oprisa, Peter Toth,
- Abstract要約: 本稿では,入力が抽象物理系を構成するニューラルネットワークプリミティブであるMetriplectorを提案する。
多重場は結合メチトレティックダイナミクスによって発展し、ネーターの定理から導かれる応力エネルギーテンソルTは読み出しを与える。
我々は5つの領域にまたがるMetriplectorを評価し、それぞれが、この共有プリミティブから構築されたタスク固有のアーキテクチャと、徐々にリッチな物理を用いて評価する。
- 参考スコア(独自算出の注目度): 0.25168553347063854
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Metriplector, a neural architecture primitive in which the input configures an abstract physical system -- fields, sources, and operators -- and the dynamics of that system is the computation. Multiple fields evolve via coupled metriplectic dynamics, and the stress-energy tensor T^{μν}, derived from Noether's theorem, provides the readout. The metriplectic formulation admits a natural spectrum of instantiations: the dissipative branch alone yields a screened Poisson equation solved exactly via conjugate gradient; activating the full structure -- including the antisymmetric Poisson bracket -- gives field dynamics for image recognition, language modeling, and robotic control. We evaluate Metriplector across five domains, each using a task-specific architecture built from this shared primitive with progressively richer physics: 81.03% on CIFAR-100 with 2.26M parameters; 88% CEM success on Reacher robotic control with under 1M parameters; 97.2% exact Sudoku solve rate with zero structural injection; 1.182 bits/byte on language modeling with 3.6x fewer training tokens than a GPT baseline; and F1=1.0 on maze pathfinding, generalizing from 15x15 training grids to unseen 39x39 grids.
- Abstract(参考訳): 我々は、入力がフィールド、ソース、演算子という抽象的な物理システムを構成するニューラルネットワークプリミティブであるMetriplectorを紹介し、そのシステムのダイナミクスは計算である。
多重場は結合メチトレティックダイナミクスによって発展し、ネーターの定理から導かれる応力エネルギーテンソル T^{μν} が読み出しを与える。
散逸分枝は共役勾配によって正確に解かれたポアソン方程式を生じさせ、反対称ポアソンブラケットを含む完全な構造の活性化は、画像認識、言語モデリング、ロボット制御のための場力学を与える。
CIFAR-100では2.26Mパラメータの81.03%、Reacherロボット制御では88%のCEM成功で1Mパラメータ未満で97.2%、正確なSudokuソルバレートでは97.2%、言語モデリングでは1.182ビット/バイト、GPTベースラインより3.6倍少ないトレーニングトークンでは1.182ビット/バイト、迷路パスフィニングではF1=1.0、一般的な39x39グリッドでは15x15のトレーニンググリッドから一般化されている。
関連論文リスト
- PolyGLU: State-Conditional Activation Routing in Transformer Feed-Forward Networks [0.0]
我々は、各FFNニューロンがK=4の活性化関数を動的にルーティングすることを可能にする、SwiGLUのドロップイン置換であるPolyGLUを紹介する。
標準的なベンチマークでは、PlychromaticLMは3,600倍のトークンのトレーニングにもかかわらず、Qwen3-0.6B-Baseのパフォーマンスの62-89%を達成した。
論文 参考訳(メタデータ) (2026-03-07T10:39:56Z) - Resonant Sparse Geometry Networks [0.0]
共振器スパース幾何ネットワーク(Resonant Sparse Geometry Networks, RSGN)は, 自己組織型スパーススパース入力依存接続を持つ脳にインスパイアされたアーキテクチャである。
RSGNは、接続強度が測地距離で減衰する学習された双曲空間に計算ノードを埋め込む。
論文 参考訳(メタデータ) (2026-01-26T01:45:51Z) - Differentiable Logic Synthesis: Spectral Coefficient Selection via Sinkhorn-Constrained Composition [0.0]
凍結フーリエ基底からスペクトル係数を選択する微分可能なアーキテクチャである階層スペクトル合成を導入する。
我々はこのフレームワークを論理合成に適用し、ブール否定を可能にするカラムサイン変調を追加する。
論文 参考訳(メタデータ) (2026-01-20T13:26:52Z) - URDF-Anything: Constructing Articulated Objects with 3D Multimodal Language Model [76.08429266631823]
3次元マルチモーダル大言語モデル(MLLM)に基づくエンドツーエンドの自動再構築フレームワークを提案する。
URDF-Anythingは、ポイントクラウドとテキストマルチモーダル入力に基づく自己回帰予測フレームワークを使用して、幾何学的セグメンテーションと運動論的パラメータ予測を協調的に最適化する。
シミュレーションと実世界の両方のデータセットの実験は、我々の手法が既存の手法よりも大幅に優れていることを示した。
論文 参考訳(メタデータ) (2025-11-02T13:45:51Z) - Symmetry-Constrained Multi-Scale Physics-Informed Neural Networks for Graphene Electronic Band Structure Prediction [0.0]
本稿では,Symmetry-Constrained Multi-Scale Physics-Informed Neural Network (SCMS-PINN) v35を紹介する。
グラフェンバンド構造を直接学習し、結晶対称性を厳格に強化する。
このモデルは、理論ゼロの30.3$mu$eVと平均誤差53.9meVとブリルアンゾーンの40.5meV(導電性)でディラック点ギャップを予測する。
論文 参考訳(メタデータ) (2025-08-14T14:59:10Z) - BriLLM: Brain-inspired Large Language Model [40.47939901030644]
BriLLMは、機械学習の基礎を再定義する、脳にインスパイアされた大きな言語モデルである。
BriLLMは2つの重要な神経認知原理を取り入れている。(1) 静的な意味マッピング、(2) トークンは皮質領域に類似した特定のノードにマッピングされ、(2) 脳活動で観察される電気生理学的情報ダイナミクスをシミュレートする動的信号伝達である。
このアーキテクチャは、自然なマルチモーダル互換性、ノードレベルでの完全なモデル解釈可能性、コンテキスト長の独立スケーリング、言語タスクのための脳に似た情報処理のグローバルなシミュレーションなど、複数の革新的なブレークスルーを可能にする。
論文 参考訳(メタデータ) (2025-03-14T11:08:30Z) - Geometry-Informed Neural Operator for Large-Scale 3D PDEs [76.06115572844882]
大規模偏微分方程式の解演算子を学習するために,幾何インフォームド・ニューラル演算子(GINO)を提案する。
我々はGINOを訓練し、わずか500点のデータポイントで車両表面の圧力を予測することに成功した。
論文 参考訳(メタデータ) (2023-09-01T16:59:21Z) - Equivariant Architectures for Learning in Deep Weight Spaces [54.61765488960555]
重み空間の学習のための新しいネットワークアーキテクチャを提案する。
入力として、事前訓練された不変量の重みとバイアスの連結をとる。
これらのレイヤを3つの基本的な操作で実装する方法を示す。
論文 参考訳(メタデータ) (2023-01-30T10:50:33Z) - NeuroMorph: Unsupervised Shape Interpolation and Correspondence in One
Go [109.88509362837475]
入力2つの3次元形状を考慮したニューラルネットワークアーキテクチャであるNeuroMorphを提案する。
NeuroMorphはそれらの間のスムーズかつポイントツーポイント対応を生成する。
異なる対象カテゴリの非等尺性ペアを含む、さまざまな入力形状に対してうまく機能する。
論文 参考訳(メタデータ) (2021-06-17T12:25:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。