論文の概要: NMS Threshold matters for Ego4D Moment Queries -- 2nd place solution to
the Ego4D Moment Queries Challenge 2023
- arxiv url: http://arxiv.org/abs/2307.02025v1
- Date: Wed, 5 Jul 2023 05:23:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 15:01:36.902754
- Title: NMS Threshold matters for Ego4D Moment Queries -- 2nd place solution to
the Ego4D Moment Queries Challenge 2023
- Title(参考訳): ego4d moment queryのnmsしきい値問題 - ego4d moment query challenge 2023の2位ソリューション
- Authors: Lin Sui, Fangzhou Mu, Yin Li
- Abstract要約: 本報告では,Ego4D Moment Queries Challenge 2023について述べる。
私たちの提案では、時間的アクションローカライゼーションの最新のメソッドであるActionFormerを拡張しています。
私たちのソリューションは、平均mAPが26.62%、テストセットがtIoU=0.5で45.69%のRecall@1xで公開リーダボードで2位にランクされ、2023年の挑戦から強いベースラインをはるかに上回っている。
- 参考スコア(独自算出の注目度): 8.674624972031387
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This report describes our submission to the Ego4D Moment Queries Challenge
2023. Our submission extends ActionFormer, a latest method for temporal action
localization. Our extension combines an improved ground-truth assignment
strategy during training and a refined version of SoftNMS at inference time.
Our solution is ranked 2nd on the public leaderboard with 26.62% average mAP
and 45.69% Recall@1x at tIoU=0.5 on the test set, significantly outperforming
the strong baseline from 2023 challenge. Our code is available at
https://github.com/happyharrycn/actionformer_release.
- Abstract(参考訳): 本報告では,Ego4D Moment Queries Challenge 2023について述べる。
今回提案するactionformerは,時間的行動局所化のための最新の手法である。
本拡張では, 訓練時の接地配置戦略の改善と, 推定時間におけるsoftnmsの改良を組み合わせる。
平均26.62%のマップと45.69%のリコール@1xをテストセットのtiou=0.5で2位にランク付けし、2023年のチャレンジのベースラインを大きく上回っている。
私たちのコードはhttps://github.com/happyharrycn/actionformer_releaseで利用可能です。
関連論文リスト
- 1st Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation [81.50620771207329]
ビデオオブジェクトセグメンテーション(RVOS)における静的支配データとフレームサンプリングの有効性について検討する。
本手法は,競技段階でのJ&Fスコア0.5447を達成し,PVUWチャレンジのMeViSトラックで1位となった。
論文 参考訳(メタデータ) (2024-06-11T08:05:26Z) - NTIRE 2024 Challenge on Image Super-Resolution ($\times$4): Methods and Results [126.78130602974319]
画像の超高解像度化に関するNTIRE 2024の課題(4ドル)をレビューする。
この課題は、低解像度(LR)入力から4倍の倍率で対応する高解像度(HR)画像を生成することである。
この挑戦の目的は、最も先進的なSR性能を持つ設計/解決を得ることである。
論文 参考訳(メタデータ) (2024-04-15T13:45:48Z) - Lightweight Boosting Models for User Response Prediction Using
Adversarial Validation [2.4040470282119983]
ShareChatが主催するACM RecSys Challenge 2023は、アプリがインストールされる確率を予測することを目的としている。
本稿では,この課題に対する軽量な解決策について述べる。
論文 参考訳(メタデータ) (2023-10-05T13:57:05Z) - The 2nd Place Solution for 2023 Waymo Open Sim Agents Challenge [8.821526792549648]
本稿では,マルチエージェント動作をシミュレーションする簡易かつ効果的な自己回帰手法を提案する。
MTR+++は2023年のオープン・シム・エージェント・チャレンジ(WOSAC)において、リアリズム・メタ・メトリックの0.4697を達成しました。
また、MTR_Eと命名されたMTRに基づく改良モデルも提案されており、スコアは0.4911で、2023年6月25日現在、WOSACのリーダーボードで3位である。
論文 参考訳(メタデータ) (2023-06-28T04:33:12Z) - GroundNLQ @ Ego4D Natural Language Queries Challenge 2023 [73.12670280220992]
映像を正確にグラウンドするには、効果的なエゴセントリック特徴抽出器と強力なグラウンドモデルが必要である。
我々は,2段階の事前学習戦略を利用して,ビデオナレーションにおけるエゴセントリックな特徴抽出器とグラウンドングモデルを訓練する。
さらに,マルチモーダルなマルチスケールグラウンドモジュールを用いた新しいグラウンドグラウンドモデル GroundNLQ を提案する。
論文 参考訳(メタデータ) (2023-06-27T07:27:52Z) - Action Sensitivity Learning for the Ego4D Episodic Memory Challenge 2023 [41.10032280192564]
本稿では、CVPR 2023のEgo4D Episodic Memory Benchmarkの2つのトラックにReLERを提出する。
この手法は提案したASL(Action Sensitivity Learning framework)を継承し,フレームの分散情報をよりよく取得する。
論文 参考訳(メタデータ) (2023-06-15T14:50:17Z) - Where a Strong Backbone Meets Strong Features -- ActionFormer for Ego4D
Moment Queries Challenge [7.718326034763966]
私たちはActionFormerという、時間的アクションローカライゼーションのための最先端のバックボーンと、SlowFast、Omnivore、Egoの強力なビデオ機能をベースにしています。
私たちのソリューションは、テストセットの平均mAPが21.76%で、公開リーダボードで2位にランクされています。
論文 参考訳(メタデータ) (2022-11-16T17:43:26Z) - A Simple Transformer-Based Model for Ego4D Natural Language Queries
Challenge [8.674624972031387]
本報告では,Ego4D Natural Language Queries (NLQ) Challengeへの提案について述べる。
我々のソリューションは、時間的動作の局所化に関するこれまでの研究からポイントベースのイベント表現を継承し、ビデオグラウンド化のためのTransformerベースのモデルを開発する。
ベルとホイッスルがなければ、我々の1つのモデルに基づく提出は平均12.64%のR@1を獲得し、公共のリーダーボードで第2位にランクインする。
論文 参考訳(メタデータ) (2022-11-16T06:33:37Z) - NTIRE 2022 Challenge on Efficient Super-Resolution: Methods and Results [279.8098140331206]
NTIRE 2022の課題は、低解像度と対応する高解像度の画像のペアに基づいて、倍率$4の入力画像を超解凍することであった。
目的は、複数の測定基準に従って測定された効率を改善するために、単一画像超解像のためのネットワークを設計することであった。
論文 参考訳(メタデータ) (2022-05-11T17:58:54Z) - Top-1 Solution of Multi-Moments in Time Challenge 2019 [56.15819266653481]
一般的な画像に基づく行動認識手法であるTRN, TSN, TSMを用いて, 実験を行った。
高速かつ正確な認識に向けて,新しい時間的インターレースネットワークを提案する。
我々は上記の全てのモデルをアンサンブルし、検証セットで67.22%、テストセットで60.77%を獲得し、最終リーダーボードで1位となった。
論文 参考訳(メタデータ) (2020-03-12T15:11:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。