論文の概要: VISTA: Visualization of Token Attribution via Efficient Analysis
- arxiv url: http://arxiv.org/abs/2604.02217v1
- Date: Thu, 02 Apr 2026 16:09:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.910473
- Title: VISTA: Visualization of Token Attribution via Efficient Analysis
- Title(参考訳): VISTA:効率的な分析によるトークン属性の可視化
- Authors: Syed Ahmed, Bharathi Vokkaliga Ganesh, Jagadish Babu P, Karthick Selvaraj, Praneeth Talluri, Sanket Hingne, Anubhav Kumar, Anushka Yadav, Pratham Kumar Verma, Kiranmayee Janardhan, Mandanna A N,
- Abstract要約: 生成型AIシステムが入力テキストからどのように情報を知覚し、優先するかをよりよく理解するために、モデル非依存のトークン重要度可視化技術を導入する。
提案手法は,3つの行列解析フレームワークと組み合わされた摂動型戦略を利用して,関係マップを生成する。
トークンの重要度を微妙かつ数学的に基礎づけた尺度を提供する複合重要度スコアを導出する。
- 参考スコア(独自算出の注目度): 0.3227406536443669
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding how Large Language Models (LLMs) process information from prompts remains a significant challenge. To shed light on this "black box," attention visualization techniques have been developed to capture neuron-level perceptions and interpret how models focus on different parts of input data. However, many existing techniques are tailored to specific model architectures, particularly within the Transformer family, and often require backpropagation, resulting in nearly double the GPU memory usage and increased computational cost. A lightweight, model-agnostic approach for attention visualization remains lacking. In this paper, we introduce a model-agnostic token importance visualization technique to better understand how generative AI systems perceive and prioritize information from input text, without incurring additional computational cost. Our method leverages perturbation-based strategies combined with a three-matrix analytical framework to generate relevance maps that illustrate token-level contributions to model predictions. The framework comprises: (1) the Angular Deviation Matrix, which captures shifts in semantic direction; (2) the Magnitude Deviation Matrix, which measures changes in semantic intensity; and (3) the Dimensional Importance Matrix, which evaluates contributions across individual vector dimensions. By systematically removing each token and measuring the resulting impact across these three complementary dimensions, we derive a composite importance score that provides a nuanced and mathematically grounded measure of token significance. To support reproducibility and foster wider adoption, we provide open-source implementations of all proposed and utilized explainability techniques, with code and resources publicly available at https://github.com/Infosys/Infosys-Responsible-AI-Toolkit
- Abstract(参考訳): 大言語モデル(LLM)がプロンプトからどのように情報を処理しているかを理解することは、依然として大きな課題である。
この「ブラックボックス」に光を当てるために、ニューロンレベルの知覚を捉え、モデルがどのように入力データの異なる部分にフォーカスするかを理解するために、注意可視化技術が開発されている。
しかし、既存の多くの技術は、特にTransformerファミリー内の特定のモデルアーキテクチャに適合しており、バックプロパゲーションを必要とすることが多いため、GPUメモリの使用量が2倍近くなり、計算コストが増大する。
注目の可視化のための軽量でモデルに依存しないアプローチは、まだ不足している。
本稿では,新たな計算コストを伴わずに,生成AIシステムが入力テキストからどのように情報を知覚し,優先するかをよりよく理解するための,モデル非依存のトークン重要度可視化手法を提案する。
本手法は,3行列解析フレームワークと組み合わされた摂動型戦略を利用して,モデル予測に対するトークンレベルの寄与を示す関連マップを生成する。
本フレームワークは,(1)意味的方向の変化を捉えた角偏差行列,(2)意味的強度の変化を測定するマグニチュード偏差行列,(3)個々のベクトル次元にわたる寄与を評価する次元的重要度行列からなる。
それぞれのトークンを体系的に取り除き,これら3つの相補的な次元における影響を測定することで,トークンの重要度を数学的に微妙に測定する複合重要度スコアを導出する。
再現性をサポートし、より広範な採用を促進するため、提案および利用された説明可能性技術のオープンソース実装をhttps://github.com/Infosys/Infosys-Responsible-AI-Toolkitで公開しています。
関連論文リスト
- Trainable Dynamic Mask Sparse Attention [11.506985057671015]
トレーニング可能なダイナミックマスクスパースアテンション機構を導入し、位置認識とコンテンツ認識の両方のアプローチの利点を融合する手法を提案する。
導入したダイナミックマスクとスパースウェイトは勾配を阻害せず、エンドツーエンドのトレーニングを支援することを実証する。
論文 参考訳(メタデータ) (2025-08-04T07:05:15Z) - AIGI-Holmes: Towards Explainable and Generalizable AI-Generated Image Detection via Multimodal Large Language Models [78.08374249341514]
AI生成コンテンツ(AIGC)の急速な発展は、誤情報を拡散するAIGIの誤用につながった。
大規模で包括的なデータセットであるHolmes-Setを導入し、画像がAI生成されているかどうかを解説したインストラクションチューニングデータセットを含む。
本研究は,MLLMの構造化説明と品質管理によるデータ生成を効率化する,Multi-Expert Juryと呼ばれる効率的なデータアノテーション手法を提案する。
さらに,視覚専門家による事前学習,教師付き微調整,直接選好最適化を含む3段階学習フレームワークであるHolmes Pipelineを提案する。
論文 参考訳(メタデータ) (2025-07-03T14:26:31Z) - Token Reduction Should Go Beyond Efficiency in Generative Models -- From Vision, Language to Multimodality [29.531450446701175]
本稿では, トークン削減は, 大規模生成モデルの時代において, 従来の効率重視の役割を超越すべきであると主張する。
トークンの削減は、より深いマルチモーダル統合とアライメントを促進し、長い入力に対するコヒーレンスを維持し、トレーニングの安定性を高めることができると我々は主張する。
我々は、アルゴリズム設計、強化学習誘導トークン削減、文脈内学習のためのトークン最適化、より広範なMLおよび科学領域を含む将来的な方向性について概説する。
論文 参考訳(メタデータ) (2025-05-23T11:30:30Z) - Quantifying Memory Utilization with Effective State-Size [73.52115209375343]
「我々は、テキスト・メモリ利用の尺度を策定する。」
この計量は、textitinput-invariant および textitinput-variant linear operator を持つシステムの基本的なクラスに適合する。
論文 参考訳(メタデータ) (2025-04-28T08:12:30Z) - TokenUnify: Scaling Up Autoregressive Pretraining for Neuron Segmentation [65.65530016765615]
本稿では,3つの相補的な学習目標を通じて,大規模依存関係をキャプチャする階層型予測コーディングフレームワークを提案する。
TokenUnifyは、ランダムトークン予測、次のトークン予測、およびすべてのトークン予測を統合して、包括的な表現空間を作成する。
また,120億個の注釈付きボクセルを付加した大規模EMデータセットを導入し,空間連続性を持つ理想的な長周期視覚データを提供する。
論文 参考訳(メタデータ) (2024-05-27T05:45:51Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。