論文の概要: Hardware-Oriented Inference Complexity of Kolmogorov-Arnold Networks
- arxiv url: http://arxiv.org/abs/2604.03345v1
- Date: Fri, 03 Apr 2026 10:18:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.530342
- Title: Hardware-Oriented Inference Complexity of Kolmogorov-Arnold Networks
- Title(参考訳): Kolmogorov-Arnoldネットワークのハードウェア指向推論複雑性
- Authors: Bilal Khalid, Pedro Freire, Sergei K. Turitsyn, Jaroslaw E. Prilepsky,
- Abstract要約: Kolmogorov-Arnold Networks (KAN)は、さまざまな機械学習アプリケーションのための強力なアーキテクチャとして登場した。
彼らのユニークな構造は、計算オーバーヘッドに関する重要な懸念を提起する。
我々は、kansのハードウェア推論複雑性を評価するための一般化されたプラットフォームに依存しない公式を導出する。
- 参考スコア(独自算出の注目度): 1.2922773478749547
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Kolmogorov-Arnold Networks (KANs) have recently emerged as a powerful architecture for various machine learning applications. However, their unique structure raises significant concerns regarding their computational overhead. Existing studies primarily evaluate KAN complexity in terms of Floating-Point Operations (FLOPs) required for GPU-based training and inference. However, in many latency-sensitive and power-constrained deployment scenarios, such as neural network-driven non-linearity mitigation in optical communications or channel state estimation in wireless communications, training is performed offline and dedicated hardware accelerators are preferred over GPUs for inference. Recent hardware implementation studies report KAN complexity using platform-specific resource consumption metrics, such as Look-Up Tables, Flip-Flops, and Block RAMs. However, these metrics require a full hardware design and synthesis stage that limits their utility for early-stage architectural decisions and cross-platform comparisons. To address this, we derive generalized, platform-independent formulae for evaluating the hardware inference complexity of KANs in terms of Real Multiplications (RM), Bit Operations (BOP), and Number of Additions and Bit-Shifts (NABS). We extend our analysis across multiple KAN variants, including B-spline, Gaussian Radial Basis Function (GRBF), Chebyshev, and Fourier KANs. The proposed metrics can be computed directly from the network structure and enable a fair and straightforward inference complexity comparison between KAN and other neural network architectures.
- Abstract(参考訳): Kolmogorov-Arnold Networks (KAN)は、最近、さまざまな機械学習アプリケーションのための強力なアーキテクチャとして登場した。
しかし、そのユニークな構造は計算オーバーヘッドに関する重大な懸念を引き起こす。
既存の研究では、GPUベースのトレーニングと推論に必要な浮動小数点演算(FLOP)の観点から、カン複雑性を主に評価している。
しかし、光通信におけるニューラルネットワーク駆動の非線形性軽減や無線通信におけるチャネル状態推定といった、レイテンシに敏感で電力制約のあるデプロイメントシナリオでは、トレーニングはオフラインで行われ、推論のためにGPUよりも専用ハードウェアアクセラレータが好まれる。
最近のハードウェア実装研究では、Look-Up Tables、Flip-Flops、Block RAMといったプラットフォーム固有のリソース消費指標を用いて、Kenの複雑さを報告している。
しかし、これらのメトリクスはハードウェア設計と合成の完全な段階を必要とし、アーリーステージのアーキテクチャ決定とクロスプラットフォームの比較に限界がある。
これを解決するために、実際の乗算(RM)、ビット演算(BOP)、加算数およびビットシフト(NABS)の観点から、kansのハードウェア推論複雑性を評価するための一般化されたプラットフォームに依存しない公式を導出する。
我々は,B-spline,Gaussian Radial Basis Function (GRBF),Chebyshev,Fourier Kansなど多種多種多種多種多種多種多様の分析を行った。
提案するメトリクスはネットワーク構造から直接計算することができ、kanと他のニューラルネットワークアーキテクチャとの公正かつ直接的な推論複雑性の比較を可能にする。
関連論文リスト
- Data-Driven Deep MIMO Detection:Network Architectures and Generalization Analysis [50.20709408241935]
本稿では,ネットワーク・オブ・MLPにおける完全データ駆動型DeepSIC検出の検証を提案する。
このようなアーキテクチャでは、グラフニューラルネットワーク(GNN)を使用したグラフベースのメッセージパッシングプロセスとして、DeepSICをアップグレードすることができる。
GNNSICは、訓練可能なパラメータが大幅に少ないDeepSICに匹敵する優れた表現性を達成する。
論文 参考訳(メタデータ) (2026-02-13T04:38:51Z) - Shuttling Compiler for Trapped-Ion Quantum Computers Based on Large Language Models [27.588919587175543]
トラップイオン量子コンピュータは、量子処理ユニット内のサブレジスタ間の接続を確立するための接続操作に依存している。
本稿では,この課題に対処するために,言語増加モデルに基づくレイアウトコンパイル戦略を提案する。
分岐イオン量子コンピュータのためのLLMベースのコンパイラの開発基盤を提供することを実証する。
論文 参考訳(メタデータ) (2025-12-19T19:29:09Z) - Split-Et-Impera: A Framework for the Design of Distributed Deep Learning
Applications [8.434224141580758]
Split-Et-Imperaは、ディープネットワークの解釈可能性の原則に基づいて、ニューラルネットワークのベストスプリットポイントのセットを決定する。
異なるニューラルネットワーク再構成の迅速な評価のための通信認識シミュレーションを実行する。
これは、アプリケーションのサービス要件の品質と、正確性とレイテンシ時間の観点からのパフォーマンスのベストマッチを示唆している。
論文 参考訳(メタデータ) (2023-03-22T13:00:00Z) - h-analysis and data-parallel physics-informed neural networks [0.7614628596146599]
物理インフォームドニューラルネットワーク(PINN)に着目した機械学習スキームのデータ並列高速化について検討する。
我々はHorovodトレーニングフレームワークを通じて、$h$-analysisとデータ並列アクセラレーションに基づく新しいプロトコルを詳述する。
アクセラレーションは実装が簡単で、トレーニングを損なわず、非常に効率的で制御可能であることを示す。
論文 参考訳(メタデータ) (2023-02-17T12:15:18Z) - Tunable Complexity Benchmarks for Evaluating Physics-Informed Neural
Networks on Coupled Ordinary Differential Equations [64.78260098263489]
本研究では,より複雑に結合した常微分方程式(ODE)を解く物理インフォームドニューラルネットワーク(PINN)の能力を評価する。
PINNの複雑性が増大するにつれて,これらのベンチマークに対する正しい解が得られないことが示される。
PINN損失のラプラシアンは,ネットワーク容量の不足,ODEの条件の低下,局所曲率の高さなど,いくつかの理由を明らかにした。
論文 参考訳(メタデータ) (2022-10-14T15:01:32Z) - Complexity-Driven CNN Compression for Resource-constrained Edge AI [1.6114012813668934]
本稿では,CNNの層レベルでの複雑さを生かして,新しい,計算効率の高いプルーニングパイプラインを提案する。
パラメータ認識(PA)、FLOP認識(FA)、メモリ認識(MA)の3つのモードを定義し、CNNの汎用圧縮を導入する。
論文 参考訳(メタデータ) (2022-08-26T16:01:23Z) - Inducing Gaussian Process Networks [80.40892394020797]
本稿では,特徴空間と誘導点を同時に学習するシンプルなフレームワークであるGaussian Process Network (IGN)を提案する。
特に誘導点は特徴空間で直接学習され、複雑な構造化領域のシームレスな表現を可能にする。
実世界のデータセットに対する実験結果から,IGNは最先端の手法よりも大幅に進歩していることを示す。
論文 参考訳(メタデータ) (2022-04-21T05:27:09Z) - Hardware-Efficient Deconvolution-Based GAN for Edge Computing [1.5229257192293197]
Generative Adversarial Networks (GAN) は、学習したデータ分布に基づいて新しいデータサンプルを生成する最先端のアルゴリズムである。
我々は、スケーラブルなストリーミングデータフローアーキテクチャを用いてFPGA上に実装された量子化デコンボリューションGAN(QDCGAN)のトレーニングのためのHW/SW共同設計手法を提案する。
リソース制約のあるプラットフォーム上での低消費電力推論のために,様々な精度,データセット,ネットワークスケーラビリティを解析した。
論文 参考訳(メタデータ) (2022-01-18T11:16:59Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Statistically Meaningful Approximation: a Case Study on Approximating
Turing Machines with Transformers [50.85524803885483]
本研究は,統計的学習性を示すために近似ネットワークを必要とする統計有意(SM)近似の形式的定義を提案する。
回路とチューリングマシンの2つの機能クラスに対するSM近似について検討する。
論文 参考訳(メタデータ) (2021-07-28T04:28:55Z) - Fitting the Search Space of Weight-sharing NAS with Graph Convolutional
Networks [100.14670789581811]
サンプルサブネットワークの性能に適合するグラフ畳み込みネットワークを訓練する。
この戦略により、選択された候補集合において、より高いランク相関係数が得られる。
論文 参考訳(メタデータ) (2020-04-17T19:12:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。