Fugu-MT 論文翻訳(概要): SchoenbAt: Rethinking Attention with Polynomial basis

論文の概要: SchoenbAt: Rethinking Attention with Polynomial basis

arxiv url: http://arxiv.org/abs/2505.12252v1
Date: Sun, 18 May 2025 06:16:46 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-20 14:57:11.12165
Title: SchoenbAt: Rethinking Attention with Polynomial basis
Title（参考訳）: SchoenbAt: 多項式に基づく注意の再考
Authors: Yuhan Guo, Lizhong Ding, Yuwan Yang, Xuewei Guo,
Abstract要約: カーネル化アテンションは、カーネル関数によるシーケンス相関をモデル化することにより、アテンションメカニズムを拡張する。我々は、点積の核化された注意を基礎として近似するSchoenbergの定理に基づく注意(SchoenbAt)を提案する。 SchoenbAtの非バイアス性および濃度誤差境界の理論的証明は、その効率と精度をカーネル化された注意近似として支持する。
参考スコア（独自算出の注目度）: 2.319467677328129
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Kernelized attention extends the attention mechanism by modeling sequence correlations through kernel functions, making significant progresses in optimizing attention. Under the guarantee of harmonic analysis theory, kernel functions can be expanded with basis functions, inspiring random feature-based approaches to enhance the efficiency of kernelized attention while maintaining predictive performance. However, current random feature-based works are limited to the Fourier basis expansions under Bochner's theorem. We propose Schoenberg's theorem-based attention (SchoenbAt), which approximates dot-product kernelized attention with the polynomial basis under Schoenberg's theorem via random Maclaurin features and applies a two-stage regularization to constrain the input space and restore the output scale, acting as a drop-in replacement of dot-product kernelized attention. Our theoretical proof of the unbiasedness and concentration error bound of SchoenbAt supports its efficiency and accuracy as a kernelized attention approximation, which is also empirically validated under various random feature dimensions. Evaluations on real-world datasets demonstrate that SchoenbAt significantly enhances computational speed while preserving competitive performance in terms of precision, outperforming several efficient attention methods.
Abstract（参考訳）: カーネル化アテンションは、カーネル関数を通してシーケンス相関をモデル化することでアテンションメカニズムを拡張し、アテンションを最適化する上で大きな進歩をもたらす。調和解析理論の保証の下では、カーネル関数は基底関数で拡張することができ、予測性能を維持しながら、カーネル化された注意の効率を高めるためにランダムな特徴に基づくアプローチを誘発する。しかし、現在のランダムな特徴ベースの作品はボヒナーの定理の下でのフーリエ基底展開に限られている。 Schoenberg の定理に基づく注意 (SchoenbAt) は、ランダムなマクローリン特徴を通して、Schoenberg の定理に基づく多項式基底に基づくドット積の核化注意を近似し、入力空間を制約し出力スケールを復元するために2段階の正規化を適用し、ドット積の核化注意のドロップイン置換として機能する。 SchoenbAtの非バイアス性および濃度誤差境界の理論的証明は、その効率と精度を、様々なランダムな特徴次元で実験的に検証した、カーネル化された注意近似として支持する。実世界のデータセットの評価では、SchoenbAtは計算速度を大幅に向上し、精度の点で競争性能を保ち、いくつかの効率的な注意法よりも優れていた。

関連論文リスト

Transformers Learn Faster with Semantic Focus [57.97235825738412]
学習性と一般化の観点からスパース変圧器について検討する。入力依存のスパースアテンションモデルは、標準アテンションモデルよりも早く収束し、より一般化しているように見える。
論文参考訳（メタデータ） (2025-06-17T01:19:28Z)
Scalable Gaussian Processes with Low-Rank Deep Kernel Decomposition [7.532273334759435]
カーネルはガウス過程(GP)モデルにおいて、事前の信念とデータ構造を符号化する鍵である。ディープカーネル学習は、標準的なパラメトリック形式を適用する前に、ニューラルネットワークを介して入力を入力することで、カーネルの柔軟性を向上させる。我々は、ニューラルネットワークが直接低ランクカーネルを表現する、完全にデータ駆動でスケーラブルなディープカーネル表現を導入する。
論文参考訳（メタデータ） (2025-05-24T05:42:11Z)
Kernel-Based Function Approximation for Average Reward Reinforcement Learning: An Optimist No-Regret Algorithm [11.024396385514864]
無限水平平均報酬設定における近似RLのカーネル関数について考察する。本稿では,バンディットの特別な場合において,取得関数に基づくアルゴリズムと類似した楽観的なアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-10-30T23:04:10Z)
Variance-Reducing Couplings for Random Features [57.73648780299374]
ランダム機能(RF)は、機械学習においてカーネルメソッドをスケールアップする一般的なテクニックである。ユークリッド空間と離散入力空間の両方で定義されるRFを改善するための結合を求める。パラダイムとしての分散還元の利点と限界について、驚くほどの結論に達した。
論文参考訳（メタデータ） (2024-05-26T12:25:09Z)
Promises and Pitfalls of the Linearized Laplace in Bayesian Optimization [73.80101701431103]
線形化ラプラス近似(LLA)はベイズニューラルネットワークの構築に有効で効率的であることが示されている。ベイズ最適化におけるLLAの有用性について検討し,その性能と柔軟性を強調した。
論文参考訳（メタデータ） (2023-04-17T14:23:43Z)
Meta-Learning Hypothesis Spaces for Sequential Decision-making [79.73213540203389]
オフラインデータ(Meta-KeL)からカーネルをメタ学習することを提案する。穏やかな条件下では、推定されたRKHSが有効な信頼セットを得られることを保証します。また,ベイズ最適化におけるアプローチの有効性を実証的に評価した。
論文参考訳（メタデータ） (2022-02-01T17:46:51Z)
Convex Analysis of the Mean Field Langevin Dynamics [49.66486092259375]
平均場ランゲヴィン力学の収束速度解析について述べる。ダイナミックスに付随する$p_q$により、凸最適化において古典的な結果と平行な収束理論を開発できる。
論文参考訳（メタデータ） (2022-01-25T17:13:56Z)
A Robust Asymmetric Kernel Function for Bayesian Optimization, with Application to Image Defect Detection in Manufacturing Systems [2.4278445972594525]
我々は、ロバストなカーネル関数、非対称な弾性ネットラジアル基底関数(AEN-RBF)を提案する。理論的には、AEN-RBFは穏やかな条件下でより小さな平均2乗予測誤差を実現できることを示す。また、AEN-RBFカーネル関数は、外れ値に対する感度が低いことも示している。
論文参考訳（メタデータ） (2021-09-22T17:59:05Z)
Generalization Properties of Stochastic Optimizers via Trajectory Analysis [48.38493838310503]
本稿では,Fernique-Talagrand関数と局所パワーローの両方が一般化性能の予測可能であることを示す。本稿では,Fernique-Talagrand関数と局所パワーローの両方が一般化性能の予測可能であることを示す。
論文参考訳（メタデータ） (2021-08-02T10:58:32Z)
Advanced Stationary and Non-Stationary Kernel Designs for Domain-Aware Gaussian Processes [0.0]
再生カーネルヒルベルト空間(RKHS)の要素である所望の特性を持つ関数のみを許容する先進カーネル設計を提案する。いくつかの合成および2つの科学的データセットを用いて、先進的なカーネル設計がガウス過程に与える影響を示す。
論文参考訳（メタデータ） (2021-02-05T22:07:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。