Fugu-MT 論文翻訳(概要): ATHENA: Accelerated Multi-Task Heterogeneous Influence Functions for Robot Data Curation

論文の概要: ATHENA: Accelerated Multi-Task Heterogeneous Influence Functions for Robot Data Curation

arxiv url: http://arxiv.org/abs/2606.16208v1
Date: Mon, 15 Jun 2026 04:33:16 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-16 18:36:05.025133
Title: ATHENA: Accelerated Multi-Task Heterogeneous Influence Functions for Robot Data Curation
Title（参考訳）: AtheNA: ロボットデータキュレーションのための高速化マルチタスク不均一影響関数
Authors: Tao Xu, Jiaxin Wang, Runhao Zhang, Jiayi Guan, Xianchao Zeng, Weixi Song, Xinyu Zhou, Zhetao Chen, Guang Chen, Yong-Lu Li,
Abstract要約: 影響関数は、ロボットタスクの結果に対する各デモンストレーションの効果を定量化する、原則化されたアプローチを提供する。本稿ではマルチタスクVLAデータキュレーションに適した影響関数フレームワークであるAtheNAを提案する。 AtheNAはRandomTrncated Approximationで高密度ヘシアンを近似し、インバージョンで約313.4倍のスピードアップを達成する。
参考スコア（独自算出の注目度）: 22.819734321192026
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In robot imitation learning, influence functions provide a principled approach to quantify each demonstration's effect on robot task outcomes, yet scaling them to billion-parameter Vision-Language-Action (VLA) models is limited by computational and multitask bottlenecks. To this end, we propose ATHENA, an influence function framework tailored for multitask VLA data curation at a billion-parameter scale. Concretely, it leverages the Kronecker structure of linear-layer gradients to reduce projection cost, and approximates dense Hessian inversion with a rank-r Random Truncated Approximation, achieving about a 313.4x speedup in influence computation. Furthermore, ATHENA formulates global and local interactive influence to balance data curation across 50 jointly trained tasks. Extensive evaluations on RoboTwin 2.0 and real-robot deployment, covering 9.34 and 6.90 hours of demonstrations, respectively, show that ATHENA matches or exceeds full-data joint fine-tuning using only 50% of demonstrations in simulation and 66.7% of data across six real-robot tasks. Overall, ATHENA demonstrates its effectiveness for data curation in billion-parameter multitask VLA fine-tuning.
Abstract（参考訳）: ロボット模倣学習において、インフルエンス関数は、ロボットタスクの結果に対する各デモンストレーションの効果を定量化するための原則的なアプローチを提供するが、それを10億パラメータビジョン・ランゲージ・アクション(VLA)モデルにスケーリングすることは、計算とマルチタスクのボトルネックによって制限される。そこで本稿では,マルチタスクVLAデータキュレーションに適した影響関数フレームワークであるAtheNAを提案する。具体的には、線形層勾配のクロネッカー構造を利用してプロジェクションコストを低減し、ランクrのランダムトレンシド近似を用いて密度の高いヘッセン反転を近似し、影響計算において約313.4倍のスピードアップを達成する。さらに、AtheNAは、50の共同訓練タスク間でのデータキュレーションのバランスをとるために、グローバルおよびローカルなインタラクティブな影響を定式化します。 RoboTwin 2.0と6.90時間にわたる実ロボットの展開に関する大規模な評価は、ATHENAが6つの実ロボットタスクでわずか50%のデモと66.7%のデータしか使用せず、ATHENAが全データの関節の微調整に適合または超えることを示している。全体として、AtheNAは10億パラメータのマルチタスクVLAファインチューニングにおけるデータキュレーションの有効性を実証している。

論文の概要: ATHENA: Accelerated Multi-Task Heterogeneous Influence Functions for Robot Data Curation

関連論文リスト