論文の概要: Kuaipedia: a Large-scale Multi-modal Short-video Encyclopedia
- arxiv url: http://arxiv.org/abs/2211.00732v2
- Date: Thu, 3 Nov 2022 08:51:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 14:38:07.776018
- Title: Kuaipedia: a Large-scale Multi-modal Short-video Encyclopedia
- Title(参考訳): Kuaipedia: 大規模マルチモーダルショートビデオ百科事典
- Authors: Haojie Pan, Yuzhou Zhang, Zepeng Zhai, Ruiji Fu, Ming Liu, Yangqiu
Song, Zhongyuan Wang and Bing Qin
- Abstract要約: Kuaipediaは、アイテム、アスペクト、ショートビデオからなる大規模なマルチモーダル百科事典である。
これは中国で有名なショートビデオプラットフォームKuaishouの何十億ものビデオから抽出されたものだ。
- 参考スコア(独自算出の注目度): 59.47639408597319
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online encyclopedias, such as Wikipedia, have been well-developed and
researched in the last two decades. One can find any attributes or other
information of a wiki item on a wiki page edited by a community of volunteers.
However, the traditional text, images and tables can hardly express some
aspects of an wiki item. For example, when we talk about ``Shiba Inu'', one may
care more about ``How to feed it'' or ``How to train it not to protect its
food''. Currently, short-video platforms have become a hallmark in the online
world. Whether you're on TikTok, Instagram, Kuaishou, or YouTube Shorts,
short-video apps have changed how we consume and create content today. Except
for producing short videos for entertainment, we can find more and more authors
sharing insightful knowledge widely across all walks of life. These short
videos, which we call knowledge videos, can easily express any aspects (e.g.
hair or how-to-feed) consumers want to know about an item (e.g. Shiba Inu), and
they can be systematically analyzed and organized like an online encyclopedia.
In this paper, we propose Kuaipedia, a large-scale multi-modal encyclopedia
consisting of items, aspects, and short videos lined to them, which was
extracted from billions of videos of Kuaishou (Kwai), a well-known short-video
platform in China. We first collected items from multiple sources and mined
user-centered aspects from millions of users' queries to build an item-aspect
tree. Then we propose a new task called ``multi-modal item-aspect linking'' as
an expansion of ``entity linking'' to link short videos into item-aspect pairs
and build the whole short-video encyclopedia. Intrinsic evaluations show that
our encyclopedia is of large scale and highly accurate. We also conduct
sufficient extrinsic experiments to show how Kuaipedia can help fundamental
applications such as entity typing and entity linking.
- Abstract(参考訳): Wikipediaのようなオンライン百科事典は過去20年間によく開発され研究されてきた。
ウィキアイテムの属性やその他の情報は、ボランティアのコミュニティによって編集されたウィキページで見つけることができる。
しかし、伝統的なテキスト、画像、テーブルはwiki項目のいくつかの側面を表現できない。
例えば、『芝犬』について語るとき、その食べ物を守らないよう『食べ方』や『食べ方』をもっと気にするかもしれない。
現在、ショートビデオプラットフォームはオンラインの世界では目玉となっている。
TikTok、Instagram、Kuaishou、YouTube Shortsでも、ショートビデオアプリは今日のコンテンツの消費方法を変えました。
エンターテイメントのために短いビデオを制作する以外に、あらゆる人生で洞察に富んだ知識を共有する作家が増えている。
これらの短いビデオはナレッジビデオと呼ばれ、消費者がアイテム(例えば芝犬)について知りたがるあらゆる側面(例えば、毛髪やハウツーフィード)を表現でき、それらを系統的に分析し、オンライン百科事典のように整理することができる。
本稿では,中国で有名なショートビデオプラットフォームであるKuaishou(Kwai)の数十億本のビデオから抽出した,アイテム,アスペクト,ショートビデオからなる大規模マルチモーダル百科事典であるKuaipediaを提案する。
まず、複数のソースからアイテムを収集し、数百万のユーザのクエリからユーザ中心のアスペクトをマイニングしてアイテムアスペクトツリーを構築しました。
そこで我々は,「マルチモーダルアイテム-アスペクトリンク」と呼ばれる新しいタスクを提案し,ショートビデオをアイテム-アスペクトペアにリンクし,ショートビデオ・百科事典全体を構築する。
内科的評価は,我々の百科事典は大規模かつ高精度であることを示している。
また、Kuaipediaがエンティティタイピングやエンティティリンクといった基本的なアプリケーションにどのように役立つかを示すために、十分な外部実験も行っています。
関連論文リスト
- Orphan Articles: The Dark Matter of Wikipedia [13.290424502717734]
われわれは,他のウィキペディア記事からのリンクを含まない記事である孤児記事について,最初の体系的な研究を行っている。
すべての記事の約15%(8.8M)の驚くほど多くのコンテンツが、ウィキペディアをナビゲートする読者には事実上見えない。
また, 孤児に新たなリンク(脱孤児化)を追加することで, 統計的に有意な可視性向上につながるという疑似実験を通じて因果的証拠を提供する。
論文 参考訳(メタデータ) (2023-06-06T18:04:33Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - TL;DW? Summarizing Instructional Videos with Task Relevance &
Cross-Modal Saliency [133.75876535332003]
我々は,ビデオ要約の未探索領域である指導ビデオの要約に焦点をあてる。
既存のビデオ要約データセットは、手動のフレームレベルのアノテーションに依存している。
本稿では,文脈対応の時間的ビデオエンコーダとセグメントスコアリング変換器を組み合わせた指導ビデオ要約ネットワークを提案する。
論文 参考訳(メタデータ) (2022-08-14T04:07:40Z) - Surfer100: Generating Surveys From Web Resources on Wikipedia-style [49.23675182917996]
先進言語モデリングの最近の進歩は、ウィキペディアのリード段落生成のための2段階の抽出的抽象的アプローチと組み合わせることができることを示す。
提案手法は,より長いウィキペディアスタイルの要約をセクションで生成するために拡張され,100件の人文調査による詳細な研究を通じて,このような手法が本アプリケーションでどのように苦しむかを検討する。
論文 参考訳(メタデータ) (2021-12-13T02:18:01Z) - A Large Scale Study of Reader Interactions with Images on Wikipedia [2.370481325034443]
この研究は、Wikipediaで画像とのインタラクションがどのように起きているかに関する、初めての大規模な分析である。
画像との総合的なエンゲージメントを定量化し、29人に1人が少なくとも1つの画像のクリック結果を得た。
画像のクリックは、あまり知られていない人々の視覚芸術、輸送、伝記に関する短い記事や記事でより頻繁に起こることを観察する。
論文 参考訳(メタデータ) (2021-12-03T12:02:59Z) - Slapping Cats, Bopping Heads, and Oreo Shakes: Understanding Indicators
of Virality in TikTok Short Videos [11.089339341624996]
我々は、TikTokに投稿された短いビデオの要素がバイラル性に与える影響について研究する。
我々の研究は、非ウイルスのTikTokビデオとウイルスを区別する特徴を強調している。
論文 参考訳(メタデータ) (2021-11-03T18:17:16Z) - Text Synopsis Generation for Egocentric Videos [72.52130695707008]
我々は、長い自我中心の動画の中で最も重要な出来事を記述したいくつかの文からなるテキスト合成を生成することを提案する。
ユーザーは短いテキストを読んでビデオについての洞察を得ることができ、さらに重要なのは、大きなビデオデータベースのコンテンツを効率的に検索できることだ。
論文 参考訳(メタデータ) (2020-05-08T00:28:00Z) - Architecture for a multilingual Wikipedia [0.0]
我々はこの問題にもっと効果的に取り組むために新しいアプローチが必要だと主張する。
本稿では,この目的を達成するシステムのためのアーキテクチャを提案する。
ゴールは2つの部分に分かれている: 抽象ウィキペディアと呼ばれるプロジェクト内の抽象的な表記法でコンテンツを作成し維持すること、そしてこの表記法を自然言語に翻訳できるWikilambdaと呼ばれるインフラストラクチャを作成する。
論文 参考訳(メタデータ) (2020-04-08T22:25:10Z) - Entity Extraction from Wikipedia List Pages [2.3605348648054463]
私たちは、DBpediaをバックボーンとして、カテゴリとリストページから大規模な分類を構築します。
遠隔監視により、リストページ内の新しいエンティティの識別のためのトレーニングデータを抽出する。
我々はDBpediaを7.5万の新しい型ステートメントと380万の高精度な新しい事実で拡張する。
論文 参考訳(メタデータ) (2020-03-11T07:48:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。