論文の概要: Loom: A Scalable Analytical Neural Computer Architecture
- arxiv url: http://arxiv.org/abs/2604.08816v1
- Date: Thu, 09 Apr 2026 23:11:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.610615
- Title: Loom: A Scalable Analytical Neural Computer Architecture
- Title(参考訳): Loom: スケーラブルな分析型ニューラルネットワークアーキテクチャ
- Authors: Mehmet Kerem Turkcan,
- Abstract要約: ループ変換器内でCからコンパイルされたプログラムを実行するコンピュータアーキテクチャであるLoomを提案する。
各フォワードパスは1つの命令を実行し、プログラムカウンタがゼロになるまでモデルを反復的に適用する。
フルマシン状態は、mathbbRd の 1 つのテンソル $X の n$ の固定サイズに存在する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present Loom, a computer architecture that executes programs compiled from C inside a looped transformer whose weights are derived analytically. The architecture implements a 22-opcode instruction set in 8 transformer layers. Each forward pass executes one instruction; the model is applied iteratively until the program counter reaches zero. The full machine state resides in a single tensor $X \in \mathbb{R}^{d \times n}$ of fixed size, and every step has fixed cost for fixed $d$ and $n$, independent of program length or execution history. The default configuration uses $d = 155$ and $n = 1024$, yielding 4.7 million parameters and 928 instruction slots. A compact configuration at $d = 146$ and $n = 512$ suffices for a 9$\times$9 Sudoku solver (284 instructions). The weights are program-independent: programs live in the state tensor, and the same fixed-weight model executes any compiled program. We make Loom source code publicly available at https://github.com/mkturkcan/Loom.
- Abstract(参考訳): 重みを解析的に導出するループ変換器内でCからコンパイルされたプログラムを実行するコンピュータアーキテクチャであるLoomを提案する。
このアーキテクチャは、22オプコード命令セットを8層に実装している。
各フォワードパスは1つの命令を実行し、プログラムカウンタがゼロになるまでモデルを反復的に適用する。
フルマシン状態は、固定サイズのテンソル$X \in \mathbb{R}^{d \times n}$に存在し、各ステップは、プログラムの長さや実行履歴によらず、固定された$d$と$n$に対して固定コストを持つ。
デフォルト設定では$d = 155$と$n = 1024$を使用し、4.7百万のパラメータと928の命令スロットを生成する。
コンパクトな構成は$d = 146$、$n = 512$ suffices for a 9$\times$9 Sudoku solver (284 instructions)である。
プログラムは状態テンソルに存在し、同じ固定重みモデルはコンパイルされたプログラムを実行する。
Loomのソースコードはhttps://github.com/mkturkcan/Loom.comで公開しています。
関連論文リスト
- INC: An Indirect Neural Corrector for Auto-Regressive Hybrid PDE Solvers [61.84396402100827]
本稿では,学習した補正を支配方程式に統合する間接ニューラルコレクタ(mathrmINC$)を提案する。
$mathrmINC$は、$t-1 + L$の順番でエラー増幅を減らし、$t$はタイムステップ、$L$はリプシッツ定数である。
大規模なベンチマークで$mathrmINC$をテストし、1Dカオスシステムから3D乱流まで、多くの異なる解法、神経バックボーン、テストケースをカバーした。
論文 参考訳(メタデータ) (2025-11-16T20:14:28Z) - Realizable Circuit Complexity: Embedding Computation in Space-Time [0.2750124853532831]
物理的な$d$次元空間に埋め込まれた、実現可能な回路クラス $mathbfRC_d$ の族を紹介する。
このフレームワークでは、$nd/(d-1))$のアルゴリズムは$nd/(d-1))$の入力にスケールできない。
幾何、因果性、情報フローを統一することにより、$mathbfRC_d$は回路を物理領域に拡張する。
論文 参考訳(メタデータ) (2025-09-23T15:40:36Z) - BurTorch: Revisiting Training from First Principles by Coupling Autodiff, Math Optimization, and Systems [56.16884466478886]
BurTorchは、単一ノードワークステーション上でのディープラーニング(DL)トレーニングを最適化するために設計された、コンパクトな高性能フレームワークである。
BurTorchは最小限の設計を採用し、これらの状況下では、古典的なコンパイルされたプログラミング言語がDL研究において重要な役割を果たすことを証明している。
論文 参考訳(メタデータ) (2025-03-18T00:52:12Z) - Exact Synthesis of Multiqubit Clifford-Cyclotomic Circuits [0.8411424745913132]
n$ が 2 のパワーであるとき、多ビットユニタリ行列 $U$ は $mathcalG_n$ 上の回路で正確に表現できることを示す。
さらに、$log(n)-2$ ancillasは常に$U$の回路を構築するのに十分であることを示す。
論文 参考訳(メタデータ) (2023-11-13T20:46:51Z) - Geometric structure of shallow neural networks and constructive ${\mathcal L}^2$ cost minimization [1.189367612437469]
我々は、$O(delta_P)$のコスト関数の最小値上に、$delta_P$がトレーニングデータの信号対雑音比を測定することを証明した。
入力空間の特定の$Q$-次元部分空間を$mathbb RM$とすることを示す。
論文 参考訳(メタデータ) (2023-09-19T07:12:41Z) - The Approximate Degree of DNF and CNF Formulas [95.94432031144716]
すべての$delta>0に対して、$はCNFと近似次数$Omega(n1-delta)の式を構築し、基本的には$nの自明な上限に一致する。
すべての$delta>0$に対して、これらのモデルは$Omega(n1-delta)$、$Omega(n/4kk2)1-delta$、$Omega(n/4kk2)1-delta$が必要です。
論文 参考訳(メタデータ) (2022-09-04T10:01:39Z) - Near-Linear Time and Fixed-Parameter Tractable Algorithms for Tensor
Decompositions [51.19236668224547]
テンソルの低階近似について検討し,テンソルトレインとタッカー分解に着目した。
テンソル列車の分解には、小さなビクリテリアランクを持つビクリテリア$(1 + eps)$-approximationアルゴリズムと、O(q cdot nnz(A))$ランニングタイムを与える。
さらに、任意のグラフを持つテンソルネットワークにアルゴリズムを拡張します。
論文 参考訳(メタデータ) (2022-07-15T11:55:09Z) - Quantum Instruction Set Design for Performance [30.049549820997996]
量子命令セットは、量子ハードウェアとソフトウェアが交わる場所である。
我々は、異なる量子命令セットの設計を正確に評価するために、非クリフォードゲートの新たな特徴付けとコンパイル手法を開発した。
論文 参考訳(メタデータ) (2021-05-13T04:39:33Z) - Small Covers for Near-Zero Sets of Polynomials and Learning Latent
Variable Models [56.98280399449707]
我々は、s$ of cardinality $m = (k/epsilon)o_d(k1/d)$ に対して $epsilon$-cover が存在することを示す。
構造的結果に基づいて,いくつかの基本的高次元確率モデル隠れ変数の学習アルゴリズムを改良した。
論文 参考訳(メタデータ) (2020-12-14T18:14:08Z) - On the Modularity of Hypernetworks [103.1147622394852]
構造化対象関数の場合、ハイパーネットワークにおけるトレーニング可能なパラメータの総数は、標準ニューラルネットワークのトレーニング可能なパラメータの数や埋め込み法よりも桁違いに小さいことを示す。
論文 参考訳(メタデータ) (2020-02-23T22:51:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。