論文の概要: RoVE: Rotary Value Embeddings Attention for Relative Position-dependent Value Pathways
- arxiv url: http://arxiv.org/abs/2606.11275v1
- Date: Tue, 09 Jun 2026 09:56:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.104817
- Title: RoVE: Rotary Value Embeddings Attention for Relative Position-dependent Value Pathways
- Title(参考訳): RoVE: 相対的位置依存値経路に対するロータリーバリュー埋め込み
- Authors: Alejandro García-Castellanos, Maurice Weiler, Erik J Bekkers,
- Abstract要約: RoPE(Rotary Position Embeddings)は、位置相対的だが、位置盲点を残している。
本稿では,キーを同時に回転させることにより,パラメータフリーな値に感応性を持たせるRoVEを提案し,RoPEの注意を注意的畳み込みに変換することを示す。
- 参考スコア(独自算出の注目度): 52.94485753759119
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rotary Position Embeddings (RoPE) make attention scores position-relative but leave the value pathway position-blind: the message sent by a value token is the same regardless of its distance from the query. We propose RoVE, a parameter-free modification that makes values position-sensitive by rotating them simultaneously with keys, and show that it turns RoPE attention into attentive convolution. This new perspective unifies several independent formulations of the same operation across computer vision, robotics, and modern LLM architectures. Trained 124M and 354M GPT-2 models show consistent empirical gains over RoPE on few-shot in-context learning, out-of-distribution perplexity, and long-context retrieval, with the clearest improvements on tasks that require long-range aggregation.
- Abstract(参考訳): RoPE (Rotary Position Embeddings) は、位置相対性( position-relative)を示すが、値経路の位置盲点(value pathway position-blind)を残す: 値トークンによって送信されるメッセージは、クエリからの距離に関わらず、同じである。
本稿では,キーを同時に回転させることにより,パラメータフリーな値に感応性を持たせるRoVEを提案する。
この新たな視点は、コンピュータビジョン、ロボティクス、現代のLLMアーキテクチャをまたいだ、同じ操作のいくつかの独立した定式化を統一する。
トレーニングされた124Mと354MのGPT-2モデルでは、長い範囲の集約を必要とするタスクにおいて、数ショットのインコンテクスト学習、アウト・オブ・ディストリビューション・パープレキシティ、ロングコンテクスト検索において、RoPEよりも一貫した経験的ゲインを示す。
関連論文リスト
- Untwisting RoPE: Frequency Control for Shared Attention in DiTs [84.14005261938284]
位置符号化はトランスフォーマーベースの生成モデルに不可欠である。
ロータリー・ポジショナル・エンベディング (RoPE) は, 異なる位置感性を有する周波数成分に自然に分解されることを示す。
本稿では,厳密な位置アライメントよりも意味的類似性を反映するように,RoPE周波数帯域を選択的に変調する手法を提案する。
論文 参考訳(メタデータ) (2026-02-04T20:01:59Z) - Beyond Real: Imaginary Extension of Rotary Position Embeddings for Long-Context LLMs [72.8830548005884]
RoPE(Rotary Position Embeddings)は、大規模言語モデルにおけるシーケンスオーダの符号化の標準となっている。
標準実装では、注目スコア計算に複雑な値のドット積の実際のコンポーネントのみを利用する。
この想像的要素を再組み込む拡張を提案する。
論文 参考訳(メタデータ) (2025-12-08T12:59:54Z) - Selective Rotary Position Embedding [84.22998043041198]
テキストインプットに依存した回転型埋め込み機構であるtextitSelective RoPE を導入する。
我々は,問合せキー対上で,これらの回転の隠れ形式を,ソフトマックスアテンションがすでに実行していることを示す。
入力依存回転が言語モデルの性能を向上させることを実証し, ゲートトランスフォーマーにtextitSelective RoPE を組み込むことにより, 本手法の有効性を検証した。
論文 参考訳(メタデータ) (2025-11-21T16:50:00Z) - Positional Encoding via Token-Aware Phase Attention [45.855203550592734]
本研究は,Rotary Positional Embedding (RoPE) が注意点の内在的距離依存バイアスを導入し,RoPEが長期コンテキストをモデル化する能力を制限していることを示す。
本稿では,学習可能な位相関数をアテンション機構に組み込んだ新しい位置符号化手法であるToken-Aware Phase Attention (TAPA)を紹介する。
論文 参考訳(メタデータ) (2025-09-16T03:53:32Z) - Decoupling the "What" and "Where" With Polar Coordinate Positional Embeddings [29.421443764865003]
本稿では,RoPEの回転位置埋め込みにおいて,何とどこで絡み合っているのかを解析する。
本稿では,Polar Coordinate Position Embeddings(PoPE)と呼ばれるRoPEの改良を提案する。
論文 参考訳(メタデータ) (2025-09-05T14:22:27Z) - Context-aware Rotary Position Embedding [0.0]
RoPE(Rotary Positional Embeddings)は、相対的な位置符号化と計算効率との互換性から広く採用されている。
トークン埋め込みを前提とした頭部特異的な周波数パターンを動的に生成するRoPEの新たな一般化であるCARoPE(Context-Aware Rotary Positional Embedding)を提案する。
CaroPEは、RoPEや他の一般的な位置符号化ベースラインを一貫して上回り、より長いコンテキスト長でも非常に低いパープレキシティを実現している。
論文 参考訳(メタデータ) (2025-07-30T20:32:19Z) - PaTH Attention: Position Encoding via Accumulating Householder Transformations [56.32365080761523]
PaTHは、ハウステリア変換の累積積に基づいて、フレキシブルなデータ依存位置符号化方式である。
家庭用行列の積をコンパクトに表現することで,効率的な並列学習アルゴリズムを導出する。
論文 参考訳(メタデータ) (2025-05-22T08:36:09Z) - Conformer-based End-to-end Speech Recognition With Rotary Position
Embedding [11.428057887454008]
畳み込み強化変圧器(コンフォーマ)に回転位置埋め込み(RoPE)を導入する。
RoPEは、絶対位置情報を回転行列によって入力シーケンスにエンコードし、自然に明示的な相対位置情報を自己保持モジュールに組み込む。
提案モデルでは,LbriSpeechコーパスの試験クリーンおよびテスト他のセットに対して,コンバータの単語誤り率を8.70%,コンバータの7.27%削減する。
論文 参考訳(メタデータ) (2021-07-13T08:07:22Z) - RoFormer: Enhanced Transformer with Rotary Position Embedding [9.01819510933327]
位置情報を効果的に活用するためのRotary Position Embedding(RoPE)という新しい手法を提案する。
RoPEは絶対位置を回転行列でエンコードし、一方、自己アテンションの定式化に明示的な相対位置依存性を組み込む。
様々な長文分類ベンチマークデータセットを用いて、回転位置埋め込み(RoFormer)と呼ばれる拡張変換器の評価を行った。
論文 参考訳(メタデータ) (2021-04-20T09:54:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。