論文の概要: The End-of-End-to-End: A Video Understanding Pentathlon Challenge (2020)
- arxiv url: http://arxiv.org/abs/2008.00744v1
- Date: Mon, 3 Aug 2020 09:55:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 06:32:43.716104
- Title: The End-of-End-to-End: A Video Understanding Pentathlon Challenge (2020)
- Title(参考訳): The End-of-End-to-End: A Video Understanding Pentathlon Challenge (2020)
- Authors: Samuel Albanie, Yang Liu, Arsha Nagrani, Antoine Miech, Ernesto Coto,
Ivan Laptev, Rahul Sukthankar, Bernard Ghanem, Andrew Zisserman, Valentin
Gabeur, Chen Sun, Karteek Alahari, Cordelia Schmid, Shizhe Chen, Yida Zhao,
Qin Jin, Kaixu Cui, Hui Liu, Chen Wang, Yudong Jiang, Xiaoshuai Hao
- Abstract要約: 我々は、IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2020と共同で開かれたオープンコンペティションである、新しいビデオ理解ペンタトロンチャレンジを紹介する。
課題は,テキスト・ビデオ検索の新しい手法を探求し,評価することであった。
- 参考スコア(独自算出の注目度): 186.7816349401443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a new video understanding pentathlon challenge, an open
competition held in conjunction with the IEEE Conference on Computer Vision and
Pattern Recognition (CVPR) 2020. The objective of the challenge was to explore
and evaluate new methods for text-to-video retrieval-the task of searching for
content within a corpus of videos using natural language queries. This report
summarizes the results of the first edition of the challenge together with the
findings of the participants.
- Abstract(参考訳): 我々は、IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2020と共同で開かれたオープンコンペティションである、新しいビデオ理解ペンタトロンチャレンジを紹介する。
本課題は,自然言語クエリを用いたビデオコーパス内のコンテンツ検索タスクであるテキスト・ビデオ検索の新しい手法を探索し,評価することであった。
本報告では,課題の第1版の結果と参加者の調査結果を要約した。
関連論文リスト
- Perception Test 2023: A Summary of the First Challenge And Outcome [67.0525378209708]
最初のパーセプションテストは、IEEE/CVF International Conference on Computer Vision (ICCV) 2023と共に半日間のワークショップとして開催された。
目標は、最近提案されたPerception Testベンチマークで最先端のビデオモデルをベンチマークすることであった。
このレポートでは、タスク記述、メトリクス、ベースライン、結果について要約しています。
論文 参考訳(メタデータ) (2023-12-20T15:12:27Z) - VoxSRC 2022: The Fourth VoxCeleb Speaker Recognition Challenge [95.6159736804855]
VoxCeleb Speaker Recognition Challenge 2022 (VoxSRC-22)は、InterSPEECH 2022と共同で開催された。
この課題の目的は、最先端の話者認識システムが「野生」で得られた音声から話者を識別し、分類し、認識できるかどうかを評価することである。
論文 参考訳(メタデータ) (2023-02-20T19:27:14Z) - ViSeRet: A simple yet effective approach to moment retrieval via
fine-grained video segmentation [6.544437737391409]
本稿では,ICCV VALUE Challenge 2021のビデオ検索における第1位ソリューションを提案する。
本稿では,2つのビデオテキスト検索タスクを共同で行うための,シンプルかつ効果的な手法を提案する。
4つのデータセットで新しい最先端のパフォーマンスを実現するアンサンブルモデルを作成します。
論文 参考訳(メタデータ) (2021-10-11T10:39:13Z) - NTIRE 2021 Challenge on Quality Enhancement of Compressed Video: Dataset
and Study [95.36629866768999]
本稿では, NTIRE 2021チャレンジの最先端手法について, 映像強調のための新しいデータセットを提案する。
この課題は、3つのコンペティション、数百の参加者、数十のソリューションで、この方向の最初のNTIREチャレンジです。
NTIRE 2021の課題は圧縮ビデオの品質向上の最先端技術であることがわかった。
論文 参考訳(メタデータ) (2021-04-21T22:18:33Z) - Bridging Vision and Language from the Video-to-Text Perspective: A
Comprehensive Review [1.0520692160489133]
本稿では,ビデオ・トゥ・テキスト問題に対する最先端技術の分類と解説を行う。
主なvideo-to-textメソッドとそのパフォーマンス評価方法をカバーする。
最先端の技術は、ビデオ記述の生成または取得における人間のようなパフォーマンスを達成するには、まだ長い道のりです。
論文 参考訳(メタデータ) (2021-03-27T02:12:28Z) - VoxSRC 2020: The Second VoxCeleb Speaker Recognition Challenge [99.82500204110015]
第2回「VoxCeleb Speaker Recognition Challenge」をInterspeech 2020と共に開催しました。
この課題の目的は、現在のスピーカー認識技術が、制約のないデータまたは野生のデータでスピーカーをダイアライズして認識できるかどうかを評価することでした。
本稿では,その課題を概説し,ベースライン,使用方法,結果について述べる。
論文 参考訳(メタデータ) (2020-12-12T17:20:57Z) - Pre-training for Video Captioning Challenge 2020 Summary [118.45411524199164]
The Pre-Traiing for Video Captioning Challenge 2020概要
参加者の技術的報告に挑戦する。
2020年 - 放送開始。
論文 参考訳(メタデータ) (2020-07-27T15:31:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。