論文の概要: JFAA: Technical Report for the EPIC-KITCHENS-100 Action Anticipation Challenge at EgoVis 2026
- arxiv url: http://arxiv.org/abs/2605.20904v1
- Date: Wed, 20 May 2026 08:47:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.578129
- Title: JFAA: Technical Report for the EPIC-KITCHENS-100 Action Anticipation Challenge at EgoVis 2026
- Title(参考訳): JFAA: EPIC-KITCHENS-100 Action Precipation Challenge at EgoVis 2026テクニカルレポート
- Authors: Qiaohui Chu, Haoyu Zhang, Yisen Feng, Meng Liu, Weili Guan, Dongmei Jiang, Liqiang Nie,
- Abstract要約: JFAAはEPIC-KITCHENS-100(EK-100)アクション予測タスクのためのJEPAベースのFuture Action Precipationメソッドである。
V-JEPA 2.1の表現学習と将来の予測能力に触発されて、JFAAは凍結エンコーダと予測器を使用して観測された文脈特徴を抽出する。
軽量な注意プローブは、別のタスククエリで動詞、名詞、アクションロジットを予測するために訓練される。
- 参考スコア(独自算出の注目度): 70.67609435035631
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose JFAA, a JEPA-based Future Action Anticipation method for the EPIC-KITCHENS-100 (EK-100) Action Anticipation task. Inspired by the representation learning and future prediction ability of V-JEPA 2.1, JFAA uses a frozen encoder and predictor to extract observed context features and near-future latent tokens. A lightweight attentive probe is then trained to predict verb, noun, and action logits with separate task queries. To improve robustness, we further build a field-aware ensemble over selected epoch-level predictions, allowing each output field to benefit from its most reliable candidates. Experimental results on the official challenge server show that JFAA achieves first place in the EgoVis 2026 EK-100 Action Anticipation Challenge. Our code will be released at https://github.com/CorrineQiu/JFAA.
- Abstract(参考訳): 本稿では,EPIC-KITCHENS-100(EK-100)アクション予測タスクのためのJEPAベースのFuture Action Precipation手法であるJFAAを提案する。
V-JEPA 2.1の表現学習と将来の予測能力に触発され、JFAAは凍結エンコーダと予測器を使用して観測されたコンテキスト特徴とほぼ将来の潜在トークンを抽出する。
軽量な注意プローブは、別のタスククエリで動詞、名詞、アクションロジットを予測するために訓練される。
強靭性を改善するために、選択したエポックレベルの予測に対してフィールド認識アンサンブルを更に構築し、各出力フィールドが最も信頼性の高い候補から恩恵を受けるようにする。
公式チャレンジサーバの実験結果は、JFAAがEgoVis 2026 EK-100 Action Precipation Challengeで1位を獲得したことを示している。
私たちのコードはhttps://github.com/CorrineQiu/JFAAで公開されます。
関連論文リスト
- VISTA: Technical Report for the Ego4D Short-Term Object Interaction Anticipation at EgoVis 2026 [70.67609435035631]
エゴセントリックなビデオタイムスタンプが与えられたら、次の人間と物体の相互作用を予測する必要がある。
ViSTAは、オブジェクト中心空間検出と短時間時間コンテキストを組み合わせたStillFastスタイルの設計に従う。
実験の結果、VISTAはEgoVis 2026 Ego4D STA Challengeで1位を獲得した。
論文 参考訳(メタデータ) (2026-05-20T08:42:56Z) - Openpi Comet: Competition Solution For 2025 BEHAVIOR Challenge [54.28288180330569]
2025 BEHAVIOR Challengeは、シミュレーション環境での物理エージェントによる長期タスクの解決に向けた進捗を厳格に追跡するように設計されている。
本報告では,2025 BEHAVIOR チャレンジを2位に近づき,残りの提案を著しく上回っている。
論文 参考訳(メタデータ) (2025-12-10T20:46:40Z) - Technical Report for Ego4D Long-Term Action Anticipation Challenge 2025 [77.414837862995]
Ego4D Long-Term Action Precipationタスクのために開発された新しい3段階フレームワークを提案する。
基礎モデルの最近の進歩に触発された本手法は,特徴抽出,行動認識,長期的行動予測の3段階からなる。
我々のフレームワークはCVPR 2025においてこの課題において第一位を達成し、長期的な行動予測における新たな最先端技術を確立した。
論文 参考訳(メタデータ) (2025-06-03T07:36:52Z) - NVIDIA-UNIBZ Submission for EPIC-KITCHENS-100 Action Anticipation
Challenge 2022 [13.603712913129506]
EPIC-Kitchen-100アクション予測課題の技術的詳細について述べる。
我々のモデリング、高次の時空変換器、エッジ学習を用いたメッセージパスニューラルネットワークはどちらも、2.5秒の推論コンテキストのみを観測し、アクション予測予測を形成するリカレントベースアーキテクチャである。
提案したトレーニングパイプラインでコンパイルされたモデルの予測スコアを平均化することにより、テストセット上で強力なパフォーマンスを実現しました。
論文 参考訳(メタデータ) (2022-06-22T06:34:58Z) - SAIC_Cambridge-HuPBA-FBK Submission to the EPIC-Kitchens-100 Action
Recognition Challenge 2021 [80.05652375838073]
本報告では,EPIC-Kitchens-100 Action Recognition Challenge 2021への提出の技術的詳細について述べる。
我々の提出は、公共のリーダーボードで見ることができ、RGBのみを使用して、44.82%のトップ1の行動認識精度を達成した。
論文 参考訳(メタデータ) (2021-10-06T16:29:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。