論文の概要: Dataset of News Articles with Provenance Metadata for Media Relevance Assessment
- arxiv url: http://arxiv.org/abs/2506.09847v1
- Date: Wed, 11 Jun 2025 15:21:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 06:35:03.091244
- Title: Dataset of News Articles with Provenance Metadata for Media Relevance Assessment
- Title(参考訳): メディア関連評価のための情報メタデータ付きニュース記事のデータセット
- Authors: Tomas Peterka, Matyas Bohacek,
- Abstract要約: アウト・オブ・コンテクスト(Out-of-context)と誤分布画像(disattributed image)は、現代の偽情報や偽情報の風景におけるメディア操作の先駆的な形態である。
本稿では,プロビデンスタグ付き画像を用いたニュース記事データセットであるNews Media Provenanceデータセットを紹介する。
本稿では,このデータセット上の2つのタスク,起点関連位置(LOR)と始点関連時刻(DTOR)を定式化し,6つの大言語モデル(LLM)のベースライン結果を示す。
LORのゼロショット性能は期待できるが、DTORのパフォーマンスは妨げられ、特殊なアーキテクチャや今後の作業のための余地を残している。
- 参考スコア(独自算出の注目度): 0.7366405857677227
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Out-of-context and misattributed imagery is the leading form of media manipulation in today's misinformation and disinformation landscape. The existing methods attempting to detect this practice often only consider whether the semantics of the imagery corresponds to the text narrative, missing manipulation so long as the depicted objects or scenes somewhat correspond to the narrative at hand. To tackle this, we introduce News Media Provenance Dataset, a dataset of news articles with provenance-tagged images. We formulate two tasks on this dataset, location of origin relevance (LOR) and date and time of origin relevance (DTOR), and present baseline results on six large language models (LLMs). We identify that, while the zero-shot performance on LOR is promising, the performance on DTOR hinders, leaving room for specialized architectures and future work.
- Abstract(参考訳): アウト・オブ・コンテクスト(Out-of-context)と誤分布画像(disattributed image)は、現代の偽情報や偽情報の風景におけるメディア操作の先駆的な形態である。
この慣習を検知しようとする既存の手法は、画像の意味が文章の物語と一致するかどうかのみを考慮し、描写された物や場面が手元にある物語と幾らか対応する限り、操作を欠いている。
そこで,本稿では,プロファイナンスタグ付き画像を用いたニュース記事データセットであるNews Media Provenance Datasetを紹介する。
本稿では,このデータセット上の2つのタスク,起点関連位置(LOR)と始点関連時刻(DTOR)を定式化し,6つの大言語モデル(LLM)のベースライン結果を示す。
LORのゼロショット性能は期待できるが、DTORのパフォーマンスは妨げられ、特殊なアーキテクチャや今後の作業のための余地を残している。
関連論文リスト
- Verifying Cross-modal Entity Consistency in News using Vision-language Models [6.870504041093726]
非一貫性のクロスモーダル情報の識別は、偽情報を検出するために重要である。
本稿では,ニュース記事中の画像とテキスト間のエンティティ一貫性を検証するためのフレームワークを提案する。
この結果から, クロスモーダルなエンティティ検証を自動化するためのLVLMの可能性が示唆された。
論文 参考訳(メタデータ) (2025-01-20T11:06:05Z) - Prompt me a Dataset: An investigation of text-image prompting for
historical image dataset creation using foundation models [0.9065034043031668]
基礎モデルを用いた歴史資料からの画像抽出のためのパイプラインを提案する。
我々は,テキスト画像のプロンプトと,それらが複雑度の異なる人文科学データセットに与える影響を評価する。
論文 参考訳(メタデータ) (2023-09-04T15:37:03Z) - Visually-Aware Context Modeling for News Image Captioning [54.31708859631821]
News Image Captioningは、ニュース記事や画像からキャプションを作成することを目的としている。
より優れた名前埋め込みを学習するための顔命名モジュールを提案する。
私たちはCLIPを使用して、画像にセマンティックに近い文を検索します。
論文 参考訳(メタデータ) (2023-08-16T12:39:39Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - AutoSplice: A Text-prompt Manipulated Image Dataset for Media Forensics [31.714342131823987]
本稿では,言語画像生成モデルがメディア法医学にもたらす課題のレベルを検討することを目的とする。
そこで本研究では,DALL-E2言語画像モデルを利用して,テキストプロンプトによって誘導されるマスキング領域を自動的に生成し,スプライスする手法を提案する。
このアプローチによってAutoSpliceと呼ばれる新しいイメージデータセットが作成され、5,894個の操作と認証されたイメージが含まれている。
論文 参考訳(メタデータ) (2023-04-14T00:14:08Z) - Focus! Relevant and Sufficient Context Selection for News Image
Captioning [69.36678144800936]
News Image Captioningは、ニュース記事から追加のコンテキストを活用することで、画像を記述する必要がある。
本稿では,事前学習された視覚・言語検索モデルであるCLIPを用いて,ニュース記事中の視覚的根拠を持つエンティティをローカライズすることを提案する。
我々の実験は、記事からより良いコンテキストを選択するだけで、既存のモデルの性能を大幅に改善できることを示した。
論文 参考訳(メタデータ) (2022-12-01T20:00:27Z) - News Article Retrieval in Context for Event-centric Narrative Creation [45.50837121213255]
不完全な物語を前提として,物語の継続を可能にする関連する出来事を議論するニュース記事の検索を目指す。
実験により、このタスクには最先端の語彙や意味的なランク付けが不十分であることが示されている。
記事のランク付けを逆時系列順で行うことで、これらのランク付けを単独で上回ることを示す。
論文 参考訳(メタデータ) (2021-06-30T13:27:54Z) - DORi: Discovering Object Relationship for Moment Localization of a
Natural-Language Query in Video [98.54696229182335]
本研究では,自然言語クエリを用いて,時間的モーメントローカライゼーションの課題について検討する。
私たちの重要なイノベーションは、言語で条件付きメッセージパッシングアルゴリズムを通じて、ビデオ機能の埋め込みを学ぶことです。
時間的なサブグラフは、時間を通してビデオ内のアクティビティをキャプチャする。
論文 参考訳(メタデータ) (2020-10-13T09:50:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。