論文の概要: Rethinking movie genre classification with fine-grained semantic
clustering
- arxiv url: http://arxiv.org/abs/2012.02639v3
- Date: Wed, 20 Jan 2021 16:46:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-23 03:42:44.028296
- Title: Rethinking movie genre classification with fine-grained semantic
clustering
- Title(参考訳): 微粒なセマンティッククラスタリングによる映画ジャンル分類の再考
- Authors: Edward Fish, Jon Weinbren, Andrew Gilbert
- Abstract要約: 一つのジャンルの定義の中で映画間の大きな意味的バリエーションを見出す。
これらの「粗い」ジャンルのラベルは、「きめ細かい」意味情報を識別することで拡張する。
提案手法は,新たに導入された37,866,450フレーム,8,800本の映画トレーラーデータセット上で実証される。
- 参考スコア(独自算出の注目度): 5.54966601302758
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Movie genre classification is an active research area in machine learning.
However, due to the limited labels available, there can be large semantic
variations between movies within a single genre definition. We expand these
'coarse' genre labels by identifying 'fine-grained' semantic information within
the multi-modal content of movies. By leveraging pre-trained 'expert' networks,
we learn the influence of different combinations of modes for multi-label genre
classification. Using a contrastive loss, we continue to fine-tune this
'coarse' genre classification network to identify high-level intertextual
similarities between the movies across all genre labels. This leads to a more
'fine-grained' and detailed clustering, based on semantic similarities while
still retaining some genre information. Our approach is demonstrated on a newly
introduced multi-modal 37,866,450 frame, 8,800 movie trailer dataset,
MMX-Trailer-20, which includes pre-computed audio, location, motion, and image
embeddings.
- Abstract(参考訳): 映画ジャンル分類は機械学習の活発な研究分野である。
しかし、利用可能な限定ラベルのため、単一のジャンルの定義の中で映画間の意味的なバリエーションは大きい。
映画のマルチモーダルコンテンツ内の「きめ細かい」意味情報を識別することで、これらの「粗い」ジャンルラベルを拡張する。
事前学習した「エキスパート」ネットワークを利用することで、マルチラベルジャンル分類におけるモードの組み合わせの影響を学習する。
対照的な損失を用いて、この「クール」ジャンル分類ネットワークを微調整し、全ジャンルレーベルの映画間の高レベルなテキスト間類似性を特定する。
これにより、ジャンル情報を保持しながら、セマンティックな類似性に基づいた、より詳細な"きめ細かい"クラスタ化が可能になる。
提案手法は,新たに導入されたマルチモーダル37,866,450フレーム,8,800本のトレーラーデータセット,mmx-trailer-20を用いて実演する。
関連論文リスト
- Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models [88.07940818022468]
エンコーダのみの多言語言語モデル(mLM)におけるサブワード間の共有セマンティクスの役割を測る第一歩を踏み出した。
意味的に類似したサブワードとその埋め込みをマージして「意味トークン」を形成する。
グループ化されたサブワードの検査では 様々な意味的類似性を示します
論文 参考訳(メタデータ) (2024-11-07T08:38:32Z) - Beyond Labels: Leveraging Deep Learning and LLMs for Content Metadata [1.6574413179773761]
メタデータの分析は、ユーザの好みを理解して、パーソナライズされたレコメンデーションとアイテムのコールドスタートを生成するのに役立つ。
本稿では,ジャンルラベル情報の利用に関わる課題について紹介し,ジャンル情報を調べる新しい方法を提案する。
Genre Spectrumは、さまざまなジャンルをタイトルで捉えるのに役立ち、オフラインとオンラインの実験は、このアプローチの有効性を裏付けます。
論文 参考訳(メタデータ) (2023-09-15T22:11:29Z) - Description-Enhanced Label Embedding Contrastive Learning for Text
Classification [65.01077813330559]
モデル学習プロセスにおける自己監督型学習(SSL)と新しい自己監督型関係関係(R2)分類タスクの設計
テキスト分類とR2分類を最適化対象として扱うテキスト分類のための関係学習ネットワーク(R2-Net)の関係について検討する。
ラベルセマンティックラーニングのためのマルチアスペクト記述を得るためのWordNetからの外部知識。
論文 参考訳(メタデータ) (2023-06-15T02:19:34Z) - Reliable Representations Learning for Incomplete Multi-View Partial Multi-Label Classification [78.15629210659516]
本稿ではRANKという不完全なマルチビュー部分的マルチラベル分類ネットワークを提案する。
既存の手法に固有のビューレベルの重みを分解し、各サンプルのビューに品質スコアを動的に割り当てる品質対応サブネットワークを提案する。
我々のモデルは、完全なマルチビューマルチラベルデータセットを処理できるだけでなく、欠落したインスタンスやラベルを持つデータセットでも機能する。
論文 参考訳(メタデータ) (2023-03-30T03:09:25Z) - Complex Network-Based Approach for Feature Extraction and Classification
of Musical Genres [0.0]
本研究は,音楽ジャンルの自動分類のための特徴抽出手法を提案する。
提案手法はまずまず音符の列に変換し,その列を複雑なネットワークとしてマッピングする。
音楽ジャンルの分類に適用可能な特徴ベクトルを構成するネットワークトポロジを特徴付けるために、トポロジ測定を抽出する。
論文 参考訳(メタデータ) (2021-10-09T22:23:33Z) - Multilevel profiling of situation and dialogue-based deep networks for
movie genre classification using movie trailers [7.904790547594697]
我々は、状況、対話、メタデータに基づく映画ジャンル分類フレームワークという、新しいマルチモダリティを提案する。
我々は,5つのジャンルに属する2000本のハリウッド映画トレーラーを含むイギリス映画トレーラーデータセット(EMTD)を開発した。
論文 参考訳(メタデータ) (2021-09-14T07:33:56Z) - Multi-layered Semantic Representation Network for Multi-label Image
Classification [8.17894017454724]
マルチラベル画像分類(MLIC)は,複数の可能なラベルを画像に割り当てることを目的とした,基本的で実践的な課題である。
近年,多くのディープ畳み込みニューラルネットワーク(CNN)に基づく手法が提案され,ラベル相関がモデル化されている。
本稿では,ラベル相関のモデル化と意味表現の学習を改善することにより,この研究の方向性を推し進める。
論文 参考訳(メタデータ) (2021-06-22T08:04:22Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - A multimodal approach for multi-label movie genre classification [2.1342631813973507]
The Movie Databaseの152,622タイトルのトレーラービデオクリップ、サブタイトル、シナプス、映画のポスターからなるデータセットを作成しました。
データセットは慎重にキュレーションされ、整理され、この作業のコントリビューションとして利用可能になった。
論文 参考訳(メタデータ) (2020-06-01T00:51:39Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - Adaptive Semantic-Visual Tree for Hierarchical Embeddings [67.01307058209709]
本稿では,商品カテゴリのアーキテクチャを記述するために,階層型適応型セマンティックビジュアルツリーを提案する。
この木は、異なる意味レベルと同じ意味クラス内の視覚的類似度を同時に評価する。
各レベルにおいて、セマンティック階層に基づいて異なるマージンを設定し、それらを事前情報として組み込んで、きめ細かい機能埋め込みを学習する。
論文 参考訳(メタデータ) (2020-03-08T03:36:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。