Fugu-MT 論文翻訳(概要): IIET: Efficient Numerical Transformer via Implicit Iterative Euler Method

論文の概要: IIET: Efficient Numerical Transformer via Implicit Iterative Euler Method

arxiv url: http://arxiv.org/abs/2509.22463v1
Date: Fri, 26 Sep 2025 15:14:03 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-29 20:57:54.537954
Title: IIET: Efficient Numerical Transformer via Implicit Iterative Euler Method
Title（参考訳）: IIET: 命令反復オイラー法による効率的な数値変圧器
Authors: Xinyu Liu, Bei Li, Jiahao Liu, Junhao Ruan, Kechen Jiao, Hongyin Tang, Jingang Wang, Xiao Tong, Jingbo Zhu,
Abstract要約: 高次数値計算法は、NLPやCVのようなタスクにおけるトランスフォーマーの性能を向上させるが、計算オーバーヘッドの増加による性能-効率トレードオフを導入する。そこで本研究では,PCformerを例に,従来の蒸留技術はこれらのモデルの性能に悪影響を及ぼす可能性が示唆された。提案するtextbfIterative textbfImplicit textbfEuler textbfTransformer textbf(IIET)。
参考スコア（独自算出の注目度）: 59.02943805284446
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: High-order numerical methods enhance Transformer performance in tasks like NLP and CV, but introduce a performance-efficiency trade-off due to increased computational overhead. Our analysis reveals that conventional efficiency techniques, such as distillation, can be detrimental to the performance of these models, exemplified by PCformer. To explore more optimizable ODE-based Transformer architectures, we propose the \textbf{I}terative \textbf{I}mplicit \textbf{E}uler \textbf{T}ransformer \textbf{(IIET)}, which simplifies high-order methods using an iterative implicit Euler approach. This simplification not only leads to superior performance but also facilitates model compression compared to PCformer. To enhance inference efficiency, we introduce \textbf{I}teration \textbf{I}nfluence-\textbf{A}ware \textbf{D}istillation \textbf{(IIAD)}. Through a flexible threshold, IIAD allows users to effectively balance the performance-efficiency trade-off. On lm-evaluation-harness, IIET boosts average accuracy by 2.65\% over vanilla Transformers and 0.8\% over PCformer. Its efficient variant, E-IIET, significantly cuts inference overhead by 55\% while retaining 99.4\% of the original task accuracy. Moreover, the most efficient IIET variant achieves an average performance gain exceeding 1.6\% over vanilla Transformer with comparable speed.
Abstract（参考訳）: 高次数値計算法は、NLPやCVのようなタスクにおけるトランスフォーマーの性能を向上させるが、計算オーバーヘッドの増加による性能-効率トレードオフを導入する。そこで本研究では,PCformerを例に,従来の蒸留技術はこれらのモデルの性能に悪影響を及ぼす可能性が示唆された。より最適化可能なODEベースのトランスフォーマーアーキテクチャを探索するために、反復的暗黙的オイラーアプローチを用いて高階法を単純化する、 \textbf{I}terative \textbf{I}mplicit \textbf{E}uler \textbf{T}ransformer \textbf{T}ransformer \textbf{(IIET)}を提案する。この単純化によって性能が向上するだけでなく、PCformerに比べてモデル圧縮が容易になる。推論効率を高めるために, \textbf{I}teration \textbf{I}nfluence-\textbf{A}ware \textbf{D}istillation \textbf{(IIAD)}を紹介する。フレキシブルなしきい値によって、IIADはパフォーマンスと効率のトレードオフを効果的にバランスさせることができる。 lm評価ハーネスでは、IIETはバニラ変換器で平均精度を2.65 %、PCformerで0.8 %向上させる。効率的なE-IIETは推論のオーバーヘッドを55 %削減し、元のタスク精度の99.4 %を維持した。さらに、最も効率的なIIET変種は、同等の速度でバニラ変換器よりも1.6\%を超える平均的な性能向上を達成する。

論文の概要: IIET: Efficient Numerical Transformer via Implicit Iterative Euler Method

関連論文リスト