論文の概要: Investigating Memorability of Dynamic Media
- arxiv url: http://arxiv.org/abs/2012.15641v1
- Date: Thu, 31 Dec 2020 15:01:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-17 23:11:25.506964
- Title: Investigating Memorability of Dynamic Media
- Title(参考訳): 動的メディアの記憶力の調査
- Authors: Phuc H. Le-Khac and Ayush K. Rai and Graham Healy and Alan F. Smeaton
and Noel E. O'Connor
- Abstract要約: タスクのコア課題として,ビデオ中の高ダイナミックなコンテンツと限られたサイズのデータセットを識別する。
これらの課題のいくつかを克服し、最初の結果を提示する方向を提案する。
- 参考スコア(独自算出の注目度): 10.146540921829347
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Predicting Media Memorability task in MediaEval'20 has some challenging
aspects compared to previous years. In this paper we identify the high-dynamic
content in videos and dataset of limited size as the core challenges for the
task, we propose directions to overcome some of these challenges and we present
our initial result in these directions.
- Abstract(参考訳): MediaEval'20の予測メディアメモリビリティタスクは、前年と比べていくつかの難しい側面がある。
本稿では,タスクのコア課題として,ビデオ中の高ダイナミックなコンテンツと限られたサイズのデータセットを識別し,これらの課題を克服するための方向性を提案する。
関連論文リスト
- MultiVENT 2.0: A Massive Multilingual Benchmark for Event-Centric Video Retrieval [57.891157692501345]
$textbfMultiVENT 2.0$は、大規模かつ多言語なイベント中心のビデオ検索ベンチマークである。
218,000以上のニュースビデオと、特定の世界イベントを対象とした3,906のクエリが提供されている。
予備的な結果は、最先端のビジョン言語モデルは、この課題にかなり苦労していることを示している。
論文 参考訳(メタデータ) (2024-10-15T13:56:34Z) - The Robust Semantic Segmentation UNCV2023 Challenge Results [99.97867942388486]
本稿では,ICCV 2023で実施されたMUAD不確実性定量化問題に対処するために用いられる勝利解について概説する。
この課題は、都市環境におけるセマンティックセグメンテーションを中心に、特に自然の敵対的なシナリオに焦点を当てた。
本報告では, 最先端の不確実性定量化手法からインスピレーションを得た19件の論文を提示する。
論文 参考訳(メタデータ) (2023-09-27T08:20:03Z) - Overview of The MediaEval 2022 Predicting Video Memorability Task [5.032429663272684]
本稿では,MediaEval2022の一部として,Predicting Video Memorability Taskの第5版について述べる。
昨年と同様、一般化を容易にするために2つのデータセットが提供されている。
TRECVid 2019 Video-to-TextデータセットをVideoMemデータセットに置き換えました。
完全発生脳波(EEG)に基づく予測サブタスクが導入された。
論文 参考訳(メタデータ) (2022-12-13T12:02:21Z) - Low-Resolution Action Recognition for Tiny Actions Challenge [52.4358152877632]
Tiny Actions Challengeは、現実世界の監視における人間の活動を理解することに焦点を当てている。
このシナリオでは、アクティビティ認識には2つの大きな困難がある。
本稿では,包括的認識ソリューションを提案する。
論文 参考訳(メタデータ) (2022-09-28T00:49:13Z) - Multimedia Generative Script Learning for Task Planning [58.73725388387305]
我々は,テキストと視覚の両モードの履歴状態を追跡することによって,次のステップを生成するために,マルチメディア生成スクリプト学習という新しいタスクを提案する。
この課題は、画像中の視覚状態をキャプチャするマルチメディアチャレンジ、目に見えないタスクを実行するための誘導チャレンジ、個々のステップで異なる情報をカバーする多様性チャレンジの3つの側面において難しい。
実験の結果,本手法は強いベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2022-08-25T19:04:28Z) - NTIRE 2021 Challenge on Quality Enhancement of Compressed Video: Dataset
and Study [95.36629866768999]
本稿では, NTIRE 2021チャレンジの最先端手法について, 映像強調のための新しいデータセットを提案する。
この課題は、3つのコンペティション、数百の参加者、数十のソリューションで、この方向の最初のNTIREチャレンジです。
NTIRE 2021の課題は圧縮ビデオの品質向上の最先端技術であることがわかった。
論文 参考訳(メタデータ) (2021-04-21T22:18:33Z) - Multi-modal Ensemble Models for Predicting Video Memorability [3.8367329188121824]
本研究は,メディアの記憶可能性を予測するための特徴として,抽出音声埋め込みの有効性と高一般化性を紹介する。
論文 参考訳(メタデータ) (2021-02-01T21:16:52Z) - Overview of MediaEval 2020 Predicting Media Memorability Task: What
Makes a Video Memorable? [6.179004622699381]
本稿では,MediaEval 2020 textitPredicting Media Memorabilityタスクについて述べる。
短期的および長期的ビデオ記憶可能性(VM)の予測は依然として難しい課題である。
今年のビデオは、アクションリッチなビデオコンテンツを含む、TRECVid 2019 Video-to-Textデータセットのサブセットだ。
論文 参考訳(メタデータ) (2020-12-31T15:12:52Z) - Deep Learning Techniques for Future Intelligent Cross-Media Retrieval [58.20547387332133]
マルチメディア検索は、ビッグデータアプリケーションにおいて重要な役割を果たす。
マルチモーダルなディープラーニングアプローチが直面する課題に応じて,新しい分類法を提供する。
検索によく知られたクロスメディアデータセットを提示する。
論文 参考訳(メタデータ) (2020-07-21T09:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。