論文の概要: Micro-video Tagging via Jointly Modeling Social Influence and Tag
Relation
- arxiv url: http://arxiv.org/abs/2303.08318v1
- Date: Wed, 15 Mar 2023 02:13:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-16 15:05:58.351622
- Title: Micro-video Tagging via Jointly Modeling Social Influence and Tag
Relation
- Title(参考訳): 社会的影響とタグ関係の連成モデリングによるマイクロビデオタギング
- Authors: Xiao Wang, Tian Gan, Yinwei Wei, Jianlong Wu, Dai Meng, Liqiang Nie
- Abstract要約: 85.7%のマイクロビデオにはアノテーションがない。
既存の手法は、主にビデオコンテンツの分析、ユーザの社会的影響やタグ関係を無視することに焦点を当てている。
構築したヘテロジニアスネットワークにおけるリンク予測問題として,マイクロビデオタギングを定式化する。
- 参考スコア(独自算出の注目度): 56.23157334014773
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The last decade has witnessed the proliferation of micro-videos on various
user-generated content platforms. According to our statistics, around 85.7\% of
micro-videos lack annotation. In this paper, we focus on annotating
micro-videos with tags. Existing methods mostly focus on analyzing video
content, neglecting users' social influence and tag relation. Meanwhile,
existing tag relation construction methods suffer from either deficient
performance or low tag coverage. To jointly model social influence and tag
relation, we formulate micro-video tagging as a link prediction problem in a
constructed heterogeneous network. Specifically, the tag relation (represented
by tag ontology) is constructed in a semi-supervised manner. Then, we combine
tag relation, video-tag annotation, and user-follow relation to build the
network. Afterward, a better video and tag representation are derived through
Behavior Spread modeling and visual and linguistic knowledge aggregation.
Finally, the semantic similarity between each micro-video and all candidate
tags is calculated in this video-tag network. Extensive experiments on
industrial datasets of three verticals verify the superiority of our model
compared with several state-of-the-art baselines.
- Abstract(参考訳): 過去10年間、さまざまなユーザー生成コンテンツプラットフォームでマイクロビデオが急増している。
我々の統計によると、85.7%のマイクロビデオにはアノテーションがない。
本稿では,タグ付きマイクロビデオのアノテートに焦点をあてる。
既存の手法は、主にビデオコンテンツの分析、ユーザの社会的影響やタグ関係を無視している。
一方、既存のタグ関連構築手法は、性能の不足やタグカバレッジの低下に苦しむ。
社会的影響とタグ関係を共同でモデル化するために、構築された異種ネットワークにおけるリンク予測問題として、マイクロビデオタギングを定式化する。
具体的には、タグ関係(タグオントロジーで表現される)を半教師付きで構築する。
次に,タグ関係,ビデオタグアノテーション,ユーザフォロー関係を組み合わせてネットワークを構築する。
その後、より優れたビデオとタグの表現は、行動拡散モデリングと視覚および言語知識の集約によって導出される。
最後に、このビデオタグネットワークにおいて、各マイクロビデオと全ての候補タグのセマンティックな類似性を算出する。
3つの垂直の産業データセットに関する大規模な実験は、いくつかの最先端ベースラインと比較して、我々のモデルの優位性を検証する。
関連論文リスト
- Text-Video Retrieval via Variational Multi-Modal Hypergraph Networks [25.96897989272303]
テキストビデオ検索の主な障害は、クエリのテキストの性質とビデオコンテンツの視覚的豊かさとのセマンティックなギャップである。
本稿では,クエリチャンクを抽出して,特定の検索単位を記述するチャンクレベルのテキストビデオマッチングを提案する。
クェリの単語とビデオのフレーム間のn-ary相関モデルとしてチャンクレベルのマッチングを定式化する。
論文 参考訳(メタデータ) (2024-01-06T09:38:55Z) - Multi-Label Meta Weighting for Long-Tailed Dynamic Scene Graph
Generation [55.429541407920304]
対象と対象のペア間の述語認識は、本質的に不均衡であり、複数ラベルである。
最近の最先端の手法は、主に最も頻繁に発生する述語クラスに焦点を当てている。
偏りのある述語分布を扱うために,多言語メタラーニングフレームワークを導入する。
論文 参考訳(メタデータ) (2023-06-16T18:14:23Z) - Hate Speech and Offensive Language Detection using an Emotion-aware
Shared Encoder [1.8734449181723825]
ヘイトスピーチと攻撃的言語検出に関する既存の研究は、事前学習されたトランスフォーマーモデルに基づいて有望な結果をもたらす。
本稿では,他コーパスから抽出した外的感情特徴を組み合わせたマルチタスク共同学習手法を提案する。
以上の結果から,感情的な知識が,データセット間のヘイトスピーチや攻撃的言語をより確実に識別する上で有効であることが示唆された。
論文 参考訳(メタデータ) (2023-02-17T09:31:06Z) - The ComMA Dataset V0.2: Annotating Aggression and Bias in Multilingual
Social Media Discourse [1.465840097113565]
本稿では,異なるタイプの攻撃をマークした階層的,きめ細かなタグセットと,それらが発生する「コンテキスト」を付加した多言語データセットの開発について論じる。
最初のデータセットは4つの言語で合計15,000の注釈付きコメントで構成されている。
ソーシャルメディアのウェブサイトでは通常のように、これらのコメントの多くは多言語で、多くは英語と混在している。
論文 参考訳(メタデータ) (2021-11-19T19:03:22Z) - VLG-Net: Video-Language Graph Matching Network for Video Grounding [57.6661145190528]
ビデオにおける言語クエリのグラウンディングは、言語クエリに関連する時間間隔(またはモーメント)を特定することを目的としている。
我々はこの問題をアルゴリズム的なグラフマッチング問題に再キャストする。
広範に使用されている3つのデータセットに対して,最先端の接地手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-11-19T22:32:03Z) - Content-based Analysis of the Cultural Differences between TikTok and
Douyin [95.32409577885645]
ショートフォームのソーシャルメディアは、聴衆にダイナミックなストーリーを伝え、彼らの注意を引き付けることによって、伝統的なメディアパラダイムから遠ざかる。
特に、興味深く、理解しやすいユニークなシーンを表現するために、日常的なオブジェクトの異なる組み合わせを用いることができる。
同じ会社によって提供されたTikTokとDouyinは、近年人気になった新しいメディアの好例だ。
メディアファッションや社会的慣用性とともに文化的な違いを表現しているという仮説が,本研究の主目的である。
論文 参考訳(メタデータ) (2020-11-03T01:47:49Z) - Understanding YouTube Communities via Subscription-based Channel
Embeddings [0.0]
本稿では,YouTubeチャンネルの発見と分類を行う新しい手法を提案する。
これらの手法は、コメントの公開購読ページを活用する自己教師付き学習アプローチを使用する。
異なる政治コンテンツへのトラフィック量を分析するために、新しいデータセットを作成します。
論文 参考訳(メタデータ) (2020-10-19T22:00:04Z) - Labelling unlabelled videos from scratch with multi-modal
self-supervision [82.60652426371936]
ビデオデータセットの教師なしラベリングは、強力な機能エンコーダから解放されない。
人間のアノテーションを使わずにビデオデータセットの擬似ラベリングを可能にする新しいクラスタリング手法を提案する。
広範囲な分析により、結果として得られたクラスタは、真理の人間ラベルと高いセマンティックオーバーラップがあることが示されている。
論文 参考訳(メタデータ) (2020-06-24T12:28:17Z) - Comprehensive Information Integration Modeling Framework for Video
Titling [124.11296128308396]
エンド・ツー・エンド・エンド・モデリング・フレームワークにおいて、消費者生成ビデオの内容、消費者から提供される物語コメント文、製品属性などの包括的情報ソースを統合する。
この問題に対処するため,提案手法は,粒度レベルの相互作用モデリングと抽象レベルのストーリーライン要約という2つのプロセスから構成される。
グローバルなeコマースプラットフォームであるTaobaoの実際のデータから、大規模なデータセットを収集します。
論文 参考訳(メタデータ) (2020-06-24T10:38:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。