論文の概要: Analyzing Transformers in Embedding Space
- arxiv url: http://arxiv.org/abs/2209.02535v3
- Date: Sun, 24 Dec 2023 23:11:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 23:32:21.201087
- Title: Analyzing Transformers in Embedding Space
- Title(参考訳): 埋め込み空間におけるトランスフォーマーの解析
- Authors: Guy Dar, Mor Geva, Ankit Gupta, Jonathan Berant
- Abstract要約: 学習したトランスフォーマーの全てのパラメータを埋め込み空間に投影することで解釈する理論解析を提案する。
予め訓練されたモデルと微調整されたモデルの両方のパラメータを埋め込み空間で解釈できることを示す。
我々の発見は、少なくとも部分的には、モデル仕様から抽象化し、埋め込み空間でのみ動作する解釈手法への扉を開く。
- 参考スコア(独自算出の注目度): 59.434807802802105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding Transformer-based models has attracted significant attention,
as they lie at the heart of recent technological advances across machine
learning. While most interpretability methods rely on running models over
inputs, recent work has shown that a zero-pass approach, where parameters are
interpreted directly without a forward/backward pass is feasible for some
Transformer parameters, and for two-layer attention networks. In this work, we
present a theoretical analysis where all parameters of a trained Transformer
are interpreted by projecting them into the embedding space, that is, the space
of vocabulary items they operate on. We derive a simple theoretical framework
to support our arguments and provide ample evidence for its validity. First, an
empirical analysis showing that parameters of both pretrained and fine-tuned
models can be interpreted in embedding space. Second, we present two
applications of our framework: (a) aligning the parameters of different models
that share a vocabulary, and (b) constructing a classifier without training by
``translating'' the parameters of a fine-tuned classifier to parameters of a
different model that was only pretrained. Overall, our findings open the door
to interpretation methods that, at least in part, abstract away from model
specifics and operate in the embedding space only.
- Abstract(参考訳): Transformerベースのモデルを理解することは、機械学習における最近の技術進歩の中心にあるため、大きな注目を集めている。
ほとんどの解釈可能性法は入力上のモデルの実行に依存しているが、最近の研究は、パラメータが前方/後方のパスなしで直接解釈されるゼロパスアプローチがトランスフォーマーパラメータや2層アテンションネットワークで実現可能であることを示した。
本研究では,学習したトランスフォーマーのすべてのパラメータを,埋め込み空間,すなわち操作する語彙項目の空間に投影することで解釈する理論解析について述べる。
議論を支持するための単純な理論的枠組みを導き、その妥当性を示す十分な証拠を提供する。
第一に、事前学習と微調整の両方のモデルのパラメータが埋め込み空間で解釈できることを示す経験的解析である。
次に、フレームワークの2つの応用例を示す。
(a)語彙を共有する異なるモデルのパラメータを調整し、
b) " ``lating'' でトレーニングせずに分類器を、事前訓練された異なるモデルのパラメータに微調整分類器のパラメータを変換する。
全体としては、少なくとも部分的には、モデル仕様から抽象化し、埋め込み空間でのみ動作する解釈手法への扉を開く。
関連論文リスト
- Parameter-Efficient and Memory-Efficient Tuning for Vision Transformer: A Disentangled Approach [87.8330887605381]
本稿では,学習可能なパラメータをわずかに限定して,事前学習した視覚変換器を下流認識タスクに適用する方法を示す。
学習可能で軽量なモジュールを用いてタスク固有のクエリを合成する。
本手法はメモリ制約下での最先端性能を実現し,実環境における適用性を示す。
論文 参考訳(メタデータ) (2024-07-09T15:45:04Z) - In-Context Convergence of Transformers [63.04956160537308]
勾配降下法により訓練したソフトマックスアテンションを有する一層変圧器の学習力学について検討した。
不均衡な特徴を持つデータに対しては、学習力学が段階的に収束する過程をとることを示す。
論文 参考訳(メタデータ) (2023-10-08T17:55:33Z) - All Roads Lead to Rome? Exploring the Invariance of Transformers'
Representations [69.3461199976959]
本稿では, ビジェクション仮説を学習するために, 非可逆ニューラルネットワーク BERT-INN に基づくモデルを提案する。
BERT-INNの利点は理論上も広範な実験を通じても明らかである。
論文 参考訳(メタデータ) (2023-05-23T22:30:43Z) - On the Role of Bidirectionality in Language Model Pre-Training [85.14614350372004]
本研究では,次のトークン予測,テキスト入力,ゼロショットプライミング,微調整における双方向性の役割について検討する。
最大6.7Bのパラメータを持つモデルをトレーニングし、スケールで一貫性のある相違点を見つけます。
論文 参考訳(メタデータ) (2022-05-24T02:25:05Z) - Towards a Unified View of Parameter-Efficient Transfer Learning [108.94786930869473]
下流タスクにおける大規模事前学習言語モデルの微調整は、NLPにおけるデファクト学習パラダイムとなっている。
近年の研究では,少数の(外部)パラメータのみを微調整するだけで高い性能が得られるパラメータ効率の伝達学習法が提案されている。
我々は、最先端のパラメータ効率変換学習手法の設計を分解し、それらの相互接続を確立する統一的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-08T20:22:26Z) - On the Lack of Robust Interpretability of Neural Text Classifiers [14.685352584216757]
本研究では,事前学習したトランスフォーマーエンコーダをベースとしたニューラルテキスト分類器の解釈の堅牢性を評価する。
どちらのテストも、期待された行動から驚くほど逸脱しており、実践者が解釈から引き出す可能性のある洞察の程度について疑問を呈している。
論文 参考訳(メタデータ) (2021-06-08T18:31:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。