論文の概要: N15News: A New Dataset for Multimodal News Classification
- arxiv url: http://arxiv.org/abs/2108.13327v1
- Date: Mon, 30 Aug 2021 15:46:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-31 14:46:15.226898
- Title: N15News: A New Dataset for Multimodal News Classification
- Title(参考訳): N15News: マルチモーダルニュース分類のための新しいデータセット
- Authors: Zhen Wang, Xu Shan, Jie Yang
- Abstract要約: 我々は、New York Timesから15のカテゴリで生成され、各ニュースにテキスト情報と画像情報の両方を含む新しいデータセット、N15Newsを提案する。
融合方式の異なる新しいマルチタスクマルチモーダルネットワークを設計し,テキストのみのニュース分類よりも多モーダルニュース分類が優れていることを示す実験を行った。
- 参考スコア(独自算出の注目度): 7.846107230241092
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current news datasets merely focus on text features on the news and rarely
leverage the feature of images, excluding numerous essential features for news
classification. In this paper, we propose a new dataset, N15News, which is
generated from New York Times with 15 categories and contains both text and
image information in each news. We design a novel multitask multimodal network
with different fusion methods, and experiments show multimodal news
classification performs better than text-only news classification. Depending on
the length of the text, the classification accuracy can be increased by up to
5.8%. Our research reveals the relationship between the performance of a
multimodal classifier and its sub-classifiers, and also the possible
improvements when applying multimodal in news classification. N15News is shown
to have great potential to prompt the multimodal news studies.
- Abstract(参考訳): 現在のニュースデータセットは単にニュースのテキスト機能にフォーカスするだけであり、ニュース分類に不可欠な多くの機能を除いて、画像の特徴を活用することは滅多にない。
本稿では,New York Timesが生成する15のカテゴリで,各ニュースにテキスト情報と画像情報の両方を含む新しいデータセットN15Newsを提案する。
本研究では,融合方式の異なる新しいマルチタスクマルチモーダルネットワークを設計し,テキストのみのニュース分類よりもマルチモーダルニュース分類が優れていることを示す。
テキストの長さによって、分類精度を最大5.8%向上させることができる。
本研究では,マルチモーダル分類器とそのサブ分類器の性能と,ニュース分類におけるマルチモーダルの適用による改善の可能性について明らかにする。
N15Newsはマルチモーダルニュース研究を促進する大きな可能性を秘めている。
関連論文リスト
- Entity-Aware Multimodal Alignment Framework for News Image Captioning [64.5433181220184]
ニュース画像キャプションタスクは、ニュース画像と関連するニュース記事のキャプションを生成するモデルを必要とする。
2つのマルチモーダルなエンティティ対応アライメントタスクとアライメントフレームワークを設計し、モデルをアライメントし、ニュース画像キャプションを生成する。
提案手法は,GoodNewsデータセットでは72.33 -> 86.29,NYTimes800kデータセットでは70.83 -> 85.61,CIDErスコアでは72.33 -> 86.29,NYTimes800kデータセットでは70.83 -> 85.61よりも優れた結果が得られる。
論文 参考訳(メタデータ) (2024-02-29T18:03:00Z) - SPICED: News Similarity Detection Dataset with Multiple Topics and
Complexity Levels [14.073585972409756]
犯罪と法、文化とエンターテイメント、災害と事故、経済とビジネス、政治と紛争、科学技術、スポーツの7つのトピックを含む、同様のニュースのデータセットSPICEDを提案する。
本稿では,ニュース類似度検出タスクに特化して設計されたデータセットの作成に使用される,ニュースペア生成のための4つのアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-21T10:55:26Z) - Designing and Evaluating Interfaces that Highlight News Coverage
Diversity Using Discord Questions [84.55145223950427]
本稿は,ニュース記事のための大規模なソースコレクションをナビゲートすることは,それ以上のガイダンスなしでは困難であることを示す。
本稿では,ニュース読者が読みながら範囲の多様性を発見することを目的とした,注釈記事,要約記事,質問表の3つのインタフェースを設計する。
論文 参考訳(メタデータ) (2023-02-17T16:59:31Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - Multimodal Fake News Detection with Adaptive Unimodal Representation
Aggregation [28.564442206829625]
AURAは、適応的な一助表現アグリゲーションを備えたマルチモーダルフェイクニュース検出ネットワークである。
我々は,一様および多様の表現に従って,粗いレベルの偽ニュース検出とクロスモーダルな共存学習を行う。
WeiboとGossipcopの実験は、AURAがいくつかの最先端のFNDスキームに勝つことを証明している。
論文 参考訳(メタデータ) (2022-06-12T14:06:55Z) - Supervised Contrastive Learning for Multimodal Unreliable News Detection
in COVID-19 Pandemic [16.43888233012092]
本稿では,BERTに基づくマルチモーダルな信頼できないニュース検出フレームワークを提案する。
信頼できない記事からテキスト情報と視覚情報をキャプチャする。
信頼性の低いニュース検出において,本モデルが多くの競争ベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2021-09-04T11:53:37Z) - Cross-Media Keyphrase Prediction: A Unified Framework with
Multi-Modality Multi-Head Attention and Image Wordings [63.79979145520512]
マルチメディア投稿におけるキーワード予測におけるテキストと画像の併用効果について検討する。
複雑なマルチメディアインタラクションを捉えるために,M3H-Att(Multi-Modality Multi-Head Attention)を提案する。
我々のモデルは,従来の注目ネットワークに基づいて,過去の技術状況よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-11-03T08:44:18Z) - LTIatCMU at SemEval-2020 Task 11: Incorporating Multi-Level Features for
Multi-Granular Propaganda Span Identification [70.1903083747775]
本稿では,新聞記事におけるプロパガンダ・スパン識別の課題について述べる。
本稿では,BERT-BiLSTMに基づくプロパガンダ分類モデルを提案する。
論文 参考訳(メタデータ) (2020-08-11T16:14:47Z) - Cross-media Structured Common Space for Multimedia Event Extraction [82.36301617438268]
マルチメディア文書からイベントとその引数を抽出することを目的とした,MultiMedia Event extract (M2E2) というタスクを導入する。
本稿では,意味情報の構造化表現を共通埋め込み空間にエンコードする新しい手法,Weakly Aligned Structured Embedding (WASE)を提案する。
画像を利用することで、従来のテキストのみの手法よりも21.4%多くのイベント参照を抽出する。
論文 参考訳(メタデータ) (2020-05-05T20:21:53Z) - SAFE: Similarity-Aware Multi-Modal Fake News Detection [8.572654816871873]
テキストや画像,あるいはその“ミスマッチ”に基づいて偽ニュースを検出する新しい手法を提案する。
このようなニューステキストと視覚情報の表現と関係性は共同で学習され、偽ニュースを予測するために使用される。
提案手法の有効性を実証した大規模実世界のデータについて広範な実験を行った。
論文 参考訳(メタデータ) (2020-02-19T02:51:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。