Fugu-MT 論文翻訳(概要): Words in Motion: Extracting Interpretable Control Vectors for Motion Transformers

論文の概要: Words in Motion: Extracting Interpretable Control Vectors for Motion Transformers

arxiv url: http://arxiv.org/abs/2406.11624v2
Date: Mon, 14 Oct 2024 22:39:55 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:33.744607
Title: Words in Motion: Extracting Interpretable Control Vectors for Motion Transformers
Title（参考訳）: 動作中の単語:動作変換器の解釈可能な制御ベクトルの抽出
Authors: Omer Sahin Tas, Royden Wagner,
Abstract要約: トランスフォーマーベースのモデルは、解釈が難しい隠された状態を生成する。我々は,ニューラルネットワークの崩壊現象を活用し,線形プローブを用いて隠れ状態の解釈可能な特徴を測定する。本手法では,解釈可能な特徴を持つ変圧器を用いた動き予測モデルを制御することができる。
参考スコア（独自算出の注目度）: 1.1510009152620668
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Transformer-based models generate hidden states that are difficult to interpret. In this work, we aim to interpret these hidden states and control them at inference, with a focus on motion forecasting. We leverage the phenomenon of neural collapse and use linear probes to measure interpretable features in hidden states. Our experiments reveal meaningful directions and distances between hidden states of opposing features, which we use to fit control vectors for activation steering. Consequently, our method enables controlling transformer-based motion forecasting models with interpretable features, providing a unique interface to interact with and understand these models. Our implementation is available at https://github.com/kit-mrt/future-motion
Abstract（参考訳）: トランスフォーマーベースのモデルは、解釈が難しい隠された状態を生成する。本研究では,これらの隠れ状態の解釈と推論による制御を目標とし,動き予測に焦点をあてる。我々は,ニューラルネットワークの崩壊現象を活用し,線形プローブを用いて隠れ状態の解釈可能な特徴を測定する。本実験では, 制御ベクトルを活性化ステアリングに適合させるために, 対立する特徴の隠れ状態間の有意義な方向と距離を明らかにした。そこで本手法では,解釈可能な特徴を持つトランスフォーマーに基づく動作予測モデルを制御可能とし,これらのモデルと対話し,理解するためのユニークなインターフェースを提供する。私たちの実装はhttps://github.com/kit-mrt/future-motionで利用可能です。

関連論文リスト

Unified Human Localization and Trajectory Prediction with Monocular Vision [64.19384064365431]
MonoTransmotionはトランスフォーマーベースのフレームワークで、モノクロカメラのみを使用して、ローカライゼーションと予測タスクを共同で解決する。両タスクを統合フレームワークで共同でトレーニングすることにより,ノイズの多い入力による実環境シナリオにおいて,我々の手法がより堅牢であることを示す。
論文参考訳（メタデータ） (2025-03-05T14:18:39Z)
Activation Scaling for Steering and Interpreting Language Models [55.59689963561315]
モデルにうまく介入することは、内部の動作を解釈するための前提条件である、と我々は主張する。成功した介入は、間違ったトークンで正しいことを正し、その逆を正すべきである。勾配に基づく最適化を用いることで、特定の種類の効率的かつ解釈可能な介入を学習(そして後で評価)することができる。
論文参考訳（メタデータ） (2024-10-07T12:01:32Z)
OOSTraj: Out-of-Sight Trajectory Prediction With Vision-Positioning Denoising [49.86409475232849]
軌道予測はコンピュータビジョンと自律運転の基本である。この分野における既存のアプローチは、しばしば正確で完全な観測データを仮定する。本稿では,視覚的位置決め技術を利用した視線外軌道予測手法を提案する。
論文参考訳（メタデータ） (2024-04-02T18:30:29Z)
Sparse Feature Circuits: Discovering and Editing Interpretable Causal Graphs in Language Models [55.19497659895122]
本稿ではスパース特徴回路の発見と適用方法を紹介する。これらは言語モデルの振る舞いを説明するための人間の解釈可能な特徴の因果関係の著作である。
論文参考訳（メタデータ） (2024-03-28T17:56:07Z)
Humanoid Locomotion as Next Token Prediction [84.21335675130021]
我々のモデルは感覚運動軌道の自己回帰予測によって訓練された因果変換器である。われわれのモデルでは、フルサイズのヒューマノイドがサンフランシスコでゼロショットで歩けることが示されている。われわれのモデルは、わずか27時間の歩行データで訓練された場合でも現実世界に移行でき、後方歩行のような訓練中に見えないコマンドを一般化することができる。
論文参考訳（メタデータ） (2024-02-29T18:57:37Z)
Social-Transmotion: Promptable Human Trajectory Prediction [65.80068316170613]
Social-Transmotionは、多種多様な視覚的手がかりを利用して人間の行動を予測する、汎用トランスフォーマーベースのモデルである。提案手法は,JTA,JRDB,歩行者,道路交通のサイクリスト,ETH-UCYなど,複数のデータセットで検証されている。
論文参考訳（メタデータ） (2023-12-26T18:56:49Z)
LeTFuser: Light-weight End-to-end Transformer-Based Sensor Fusion for Autonomous Driving with Multi-Task Learning [16.241116794114525]
本稿では,複数のRGB-Dカメラ表現を融合させるアルゴリズムであるLeTFuserを紹介する。認識と制御を同時に行うためには,マルチタスク学習を利用する。
論文参考訳（メタデータ） (2023-10-19T20:09:08Z)
MotionTrack: Learning Motion Predictor for Multiple Object Tracking [68.68339102749358]
本研究では,学習可能なモーション予測器を中心に,新しいモーショントラッカーであるMotionTrackを紹介する。実験結果から、MotionTrackはDancetrackやSportsMOTといったデータセット上での最先端のパフォーマンスを示す。
論文参考訳（メタデータ） (2023-06-05T04:24:11Z)
Backpack Language Models [108.65930795825416]
Backpacksは、強力なモデリング性能と、解釈可能性と制御のためのインターフェースを組み合わせた、新しいニューラルアーキテクチャである。学習のあと、感覚ベクトルが特殊化され、それぞれが単語の異なる側面を符号化することがわかった。本稿では,感覚ベクトルに介入し,制御可能なテキスト生成とデバイアスを行うシンプルなアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-05-26T09:26:23Z)
VISIT: Visualizing and Interpreting the Semantic Information Flow of Transformers [45.42482446288144]
近年の解釈可能性の進歩は、トランスフォーマーベース言語モデルの重みと隠れ状態を語彙に投影できることを示唆している。 LMアテンションヘッドとメモリ値、モデルが与えられた入力を処理しながら動的に生成し、リコールするベクトルについて検討する。対話型フローグラフとして生成事前学習変換器(GPT)の前方通過を可視化するツールを作成する。
論文参考訳（メタデータ） (2023-05-22T19:04:56Z)
STMT: A Spatial-Temporal Mesh Transformer for MoCap-Based Action Recognition [50.064502884594376]
本研究では、モーションキャプチャー(MoCap)シーケンスを用いた人間の行動認識の問題点について検討する。メッシュシーケンスを直接モデル化する新しい時空間メッシュ変換器(STMT)を提案する。提案手法は,スケルトンベースモデルやポイントクラウドベースモデルと比較して,最先端の性能を実現する。
論文参考訳（メタデータ） (2023-03-31T16:19:27Z)
Safe Control Transitions: Machine Vision Based Observable Readiness Index and Data-Driven Takeover Time Prediction [2.799896314754614]
2つのメトリクスを予測する機械学習モデルは、複数のカメラビューに対して堅牢であることを示す。また、テイクオーバイベント後の制御遷移の質を評価するための2つの指標も導入する。
論文参考訳（メタデータ） (2023-01-14T01:53:48Z)
Extracting Latent Steering Vectors from Pretrained Language Models [14.77762401765532]
本研究では,言語モデルデコーダから直接潜在ベクトルを抽出できることを示す。実験により、ステアリングベクトルが存在し、それが言語モデルの隠れ状態に追加されると、ほぼ完璧にターゲット文を生成することが示された。テキスト類似度ベンチマークで評価すると, ステアリングベクトル間の距離が文類似度を反映していることが分かる。
論文参考訳（メタデータ） (2022-05-10T19:04:37Z)
Control-Aware Prediction Objectives for Autonomous Driving [78.19515972466063]
本研究では,制御に対する予測の下流効果を評価するための制御認識予測目標(CAPOs)を提案する。本稿では,エージェント間の注意モデルを用いた重み付けと,予測軌跡を接地真実軌跡に交換する際の制御変動に基づく重み付けの2つの方法を提案する。
論文参考訳（メタデータ） (2022-04-28T07:37:21Z)
Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文参考訳（メタデータ） (2022-03-25T16:59:08Z)
Trajectory Forecasting from Detection with Uncertainty-Aware Motion Encoding [121.66374635092097]
物体検出と追跡から得られる軌道は、必然的にうるさい。本稿では, 明示的に形成された軌道に依存することなく, 直接検出結果に基づく軌道予測器を提案する。
論文参考訳（メタデータ） (2022-02-03T09:09:56Z)
Inverse reinforcement learning for autonomous navigation via differentiable semantic mapping and planning [20.66819092398541]
本稿では,距離と意味カテゴリー観測を用いた自律ナビゲーションのための逆強化学習について述べる。観測シーケンスから意味的カテゴリ確率を推測するマップエンコーダと、意味論的特徴に対するディープニューラルネットワークとして定義されるコストエンコーダを開発している。本研究では,建物,歩道,路面のセマンティックな観察に頼って,自律走行型CARLAシミュレータの交通ルールを追従する手法を提案する。
論文参考訳（メタデータ） (2021-01-01T07:41:08Z)
Positional Artefacts Propagate Through Masked Language Model Embeddings [16.97378491957158]
BERT と RoBERTa の隠れ状態ベクトル内で持続性外方ニューロンの症例が発見された。我々はRoBERTaベースモデルをスクラッチから事前訓練し、位置埋め込みを使わずに外れ値が消えることを見出した。
論文参考訳（メタデータ） (2020-11-09T12:49:39Z)
Learning Navigation Costs from Demonstration with Semantic Observations [24.457042947946025]
本稿では,自律型ロボットナビゲーションにおける意味的観察を用いた逆強化学習(IRL)に焦点を当てた。観測シーケンスからセマンティッククラス確率を推定するマップエンコーダと、セマンティックな特徴よりもディープニューラルネットワークとして定義されるコストエンコーダを開発する。提案手法は,自動車,歩道,道路路面のセマンティックな観察に頼って,自律走行CARLAシミュレータにおける交通ルールに従うことを学習していることを示す。
論文参考訳（メタデータ） (2020-06-09T04:35:57Z)
Prediction and Generalisation over Directed Actions by Grid Cells [6.7141720056953895]
指示された行動が新しい状況にどのように一般化されるかを知ることは、急速な一般化の鍵となる。近年の研究では、ニューラルネットワークコードによって状態空間の効率的な表現が提案されている。本研究では,一組の固有ベクトルが,アクション固有固有値を介して任意の指示行動に対する予測をサポートすることを示す。
論文参考訳（メタデータ） (2020-06-05T10:32:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。