論文の概要: Sutra: Tensor-Op RNNs as a Compilation Target for Vector Symbolic Architectures
- arxiv url: http://arxiv.org/abs/2605.20919v1
- Date: Wed, 20 May 2026 09:04:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.587412
- Title: Sutra: Tensor-Op RNNs as a Compilation Target for Vector Symbolic Architectures
- Title(参考訳): 経典 ベクトル記号アーキテクチャのコンパイルターゲットとしてのテンソルOp RNN
- Authors: Emma Leonhart,
- Abstract要約: Sutraは、コンパイルされた前方通過がPyTorchニューラルネットワークである型付き純粋関数型プログラミング言語である。
同じ成果物は、ロジックプログラムとトレーニング可能なニューラルネットワークの両方である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sutra is a typed, purely functional programming language whose compiled forward pass is a PyTorch neural network. The compiler beta-reduces the whole program -- primitives, control flow, string I/O -- to one fused tensor-op graph over a frozen embedding substrate. Rotation binding, unbind, bundle, polynomial Kleene three-valued logic, and tail-recursive loops all lower to tensor operations; the Kleene connectives are Lagrange-interpolated polynomials exact on the {-1, 0, +1} truth grid. Validation is one fact tested two ways. (1) The same program runs on four frozen embeddings spanning two modalities -- three text encoders (nomic-embed-text, all-minilm, mxbai-embed-large) and one protein language model (ESM-2) -- and decodes bundles at 100% accuracy through width k=8 on every substrate, where the textbook Hadamard product has already collapsed (2.5% on mxbai-embed-large, 7.5% on all-minilm). (2) PyTorch autograd flows through the actually compiled graph: a fuzzy-rule classifier written in .su trains from random init (18.7 +/- 9.5%; chance = 20%, five classes) to 100.0 +/- 0.0% (three seeds) by backpropagating through the emitted graph, the symbolic source unmodified. A weighted variant additionally trains a scalar cosine gain and writes it back into the .su source as a numeric literal; recompiling reproduces the trained behaviour to ~2e-7 per logit, so the trained model is itself legible, recompilable code. The same artifact is therefore both a logic program and a trainable neural network.
- Abstract(参考訳): Sutraは、コンパイルされた前方通過がPyTorchニューラルネットワークである型付き純粋関数型プログラミング言語である。
コンパイラは、プリミティブ、制御フロー、文字列I/Oといったプログラム全体を、凍結した埋め込み基板上の1つの融合テンソルオプグラフに変換する。
回転結合、ユニバインド、バンドル、多項式 Kleene の三値論理、テール再帰ループはテンソル演算より下限である; クリーネ接続は {-1, 0, +1} の真理格子上のラグランジュ補間多項式である。
検証には2つの方法がある。
1)同じプログラムは、2つのモダリティにまたがる4つのフリーズエンコーダ(nomic-embed-text, all-minilm, mxbai-embed-large)と1つのタンパク質言語モデル(ESM-2)で動作する。
2) PyTorch autogradは、実際にコンパイルされたグラフを流れる。
ランダムなイニット(18.7 +/-9.5%; チャンス = 20%, 5クラス)から100.0 +/-0.0%(3つの種)までの列車は、出力されたグラフをバックプロパゲートすることで、そのシンボル源は変更されていない。
重み付き変種は、スカラーコサインゲインを訓練し、それを.NETに書き戻す。
Su source as a numeric literal; recompilingは、トレーニングされた振る舞いをロジットあたり ~2e-7 に再現するので、トレーニングされたモデルはそれ自体が正当で再コンパイル可能なコードである。
したがって、同じ成果物は論理プログラムとトレーニング可能なニューラルネットワークの両方である。
関連論文リスト
- A PyTorch Library of Turing-Complete Neural Networks [0.0]
本稿では、チューリングマシン記述からニューラルネットワークとその重みをコンパイルするPyTorchパッケージを提案する。
遷移関数と一連の端末状態が与えられたパッケージは、前方通過がチューリングマシンの一ステップに対応するモデルを構成する。
論文 参考訳(メタデータ) (2026-05-03T21:06:25Z) - Tensor Decomposition Networks for Fast Machine Learning Interatomic Potential Computations [48.46721044282335]
テンソル分解ネットワーク(TDN)は、計算処理の劇的な高速化と競合する性能を実現する。
1億5500万のDFT計算スナップショットを含む分子緩和データセットPubChemQCRのTDNを評価した。
その結果,TDNは計算処理の劇的な高速化と競合する性能を示した。
論文 参考訳(メタデータ) (2025-07-01T18:46:27Z) - Learning to Add, Multiply, and Execute Algorithmic Instructions Exactly with Neural Networks [13.351162559710124]
無限幅限界における2層完全連結ネットワークのトレーニング力学について検討する。
このようなモデルの十分な大規模なアンサンブルが、高い確率で正確に実行するためにどのように訓練されるかを示す。
対数的に多くのトレーニングデータだけを用いて効率よく達成できることを示します。
論文 参考訳(メタデータ) (2025-02-24T00:50:02Z) - Symbolically integrating tensor networks over various random tensors by
the second version of Python RTNI [0.5439020425818999]
我々は、Haar分散ユニタリ行列上のテンソルネットワークを象徴的に統合するRTNIのPythonバージョンをアップグレードしている。
現在、PyRTNI2 はハール分布行列と実かつ複素正規ガウステンソルも扱うことができる。
本稿では,プログラムの背後にある数学を説明し,それを用いてどのようなテンソルネットワーク計算を行うことができるかを示す。
論文 参考訳(メタデータ) (2023-09-03T13:14:46Z) - Improved techniques for deterministic l2 robustness [63.34032156196848]
畳み込みニューラルネットワーク(CNN)を$l_2$ノルムの下で厳密な1-Lipschitz制約で訓練することは、対向的堅牢性、解釈可能な勾配、安定した訓練に有用である。
我々は,最後の線形層を1重層に置き換えることで,1-Lipschitz CNNのロバスト性を証明する手法を提案する。
我々は,CIFAR-10およびCIFAR-100における標準および証明可能な堅牢な精度の最先端化を図る。
論文 参考訳(メタデータ) (2022-11-15T19:10:12Z) - Cherry-Picking Gradients: Learning Low-Rank Embeddings of Visual Data
via Differentiable Cross-Approximation [53.95297550117153]
本稿では,大規模な視覚データテンソルの処理を行うエンドツーエンドのトレーニング可能なフレームワークを提案する。
提案手法は大規模多次元グリッドデータや,大規模受容領域上のコンテキストを必要とするタスクに特に有用である。
論文 参考訳(メタデータ) (2021-05-29T08:39:57Z) - Neural networks behave as hash encoders: An empirical study [79.38436088982283]
ReLUライクなアクティベーションを持つニューラルネットワークの入力空間は、複数の線形領域に分割される。
このパーティションは、さまざまなディープラーニングモデルで以下のエンコーディング特性を示すことを実証します。
K$-Means、$K$-NN、およびロジスティック回帰などの単純なアルゴリズムは、トレーニングデータとテストデータの両方でかなり優れたパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2021-01-14T07:50:40Z) - Beyond Lazy Training for Over-parameterized Tensor Decomposition [69.4699995828506]
過度なパラメータ化対象の勾配勾配は遅延学習体制を超え、データ中の特定の低ランク構造を利用する可能性があることを示す。
以上の結果から,過パラメータ化対象の勾配勾配は遅延学習体制を超え,データ中の特定の低ランク構造を利用する可能性が示唆された。
論文 参考訳(メタデータ) (2020-10-22T00:32:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。