論文の概要: Viral Images: Identifying Reprintings within 1.5 Million Photographs in Chronicling America
- arxiv url: http://arxiv.org/abs/2606.16209v1
- Date: Mon, 15 Jun 2026 04:34:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.082851
- Title: Viral Images: Identifying Reprintings within 1.5 Million Photographs in Chronicling America
- Title(参考訳): ウイルス画像:慢性アメリカにおける150万枚の写真から再プリントを特定
- Authors: Bruno Buccalon, Yueran Sun, Benjamin Charles Germain Lee,
- Abstract要約: 我々は,日系アメリカの150万枚の写真の中から再印刷を識別するプロジェクトであるViral Imagesを紹介した。
本分析では,日系アメリカの1600万ページ以上から抽出した画像のNewspaper Navigatorデータセットを採用した。
本稿では、コントラスト言語画像事前学習(CLIP)を利用して150万枚の写真を埋め込み、クラスタリングを適用して再印刷物を識別する、教師なしの手法を提案する。
- 参考スコア(独自算出の注目度): 1.1724961392643483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Within the millions of digitized historic American newspapers in the Chronicling America initiative are tens of millions of photographs, illustrations, cartoons, and advertisements. Much of this visual culture is shared across newspaper titles and issues. Just as reprinted texts within these newspapers speak to the virality of textual content, so too does this reprinted visual culture speak to newspapers as sites of constant information circulation and exchange. In this paper, we introduce Viral Images, a project to identify reprintings within 1.5 million photographs in Chronicling America. For our analysis, we adopt the Newspaper Navigator dataset of extracted photographs from over 16 million pages in Chronicling America. We introduce an unsupervised method of identifying reprintings by leveraging contrastive language-image pretraining (CLIP) to embed these 1.5 million photographs and applying clustering to identify re-printed content. We detail our public interface, https://viral-images.org, which we designed in order to enable humanists to interactively browse and study these identified clusters. In addition, we analyze the identified clusters, uncovering a diversity of photographs and advertisements that have been circulated across different newspapers over time.
- Abstract(参考訳): 日系アメリカのイニシアチブにおける何百万ものデジタル化されたアメリカの新聞の中には、何千万もの写真、イラスト、漫画、広告がある。
この視覚文化の多くは新聞のタイトルや問題で共有されている。
これらの新聞のリプリントされたテキストがテキストコンテンツのバイラルさを語るのと同じように、このリプリントされたビジュアルカルチャーも、常に情報の流れと交換の場として新聞に話す。
本稿では,日系米国における150万枚の写真から再印刷を識別するプロジェクトであるViral Imagesを紹介する。
本分析では,日系アメリカの1600万ページ以上から抽出した画像のNewspaper Navigatorデータセットを採用した。
本稿では、コントラスト言語画像事前学習(CLIP)を利用して150万枚の写真を埋め込み、クラスタリングを適用して再印刷したコンテンツを識別する、教師なしの手法を提案する。
私たちが設計した公開インターフェース https://viral-images.org について詳しく説明します。
さらに、識別されたクラスタを分析し、さまざまな新聞に掲載されている写真や広告の多様性を明らかにする。
関連論文リスト
- Analyzing Patterns and Influence of Advertising in Print Newspapers [7.779477387565033]
本稿では,インド全土の印刷新聞の広告実践について,新しいデータ駆動アプローチを用いて検討する。
我々は,画像処理とOCR技術を用いて,印刷新聞のデジタル版から記事や広告を高精度に抽出するパイプラインを開発した。
この手法を、複数の地域と3つの言語にまたがる5つの人気新聞に適用し、数十万の広告を含む12,000以上のエディションのデータセットを収集した。
論文 参考訳(メタデータ) (2025-05-16T02:05:53Z) - Temporal Image Caption Retrieval Competition -- Description and Results [0.9999629695552195]
本稿では,テキスト画像検索のマルチモーダル課題に対処し,時間的データを含むモーダル性を拡張する新しいタスクを提案する。
本論文は,274年にわたる歴史あるアメリカの新聞をデジタル化して収集する,日刊アメリカ・チャレニアングアメリカプロジェクトを基にした画像検索コンペティション(TICRC)である。
論文 参考訳(メタデータ) (2024-10-08T19:45:53Z) - Newswire: A Large-Scale Structured Database of a Century of Historical News [3.562368079040469]
歴史家は、ニュースワイヤーが国家のアイデンティティを創り、世界の理解を共有する上で重要な役割を果たしたと主張している。
数千の地方紙から数百テラバイトの原画像スキャンに、カスタマイズされたディープラーニングパイプラインを適用することで、そのようなアーカイブを再構築する。
結果として得られたデータセットには1878年から1977年の間に書かれた270万のアメリカ独自のパブリックドメインのニュースワイヤー記事が含まれている。
論文 参考訳(メタデータ) (2024-06-13T16:20:05Z) - An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance [53.974497865647336]
われわれは、画像の翻訳を文化的に意味のあるものにするための第一歩を踏み出した。
タスクを行うために、最先端の生成モデルからなる3つのパイプラインを構築します。
我々は,翻訳画像の人間による評価を行い,文化的意義と保存の意味を評価する。
論文 参考訳(メタデータ) (2024-04-01T17:08:50Z) - Unveiling Global Narratives: A Multilingual Twitter Dataset of News Media on the Russo-Ukrainian Conflict [5.0337106694127725]
ロシアとウクライナの紛争は世界中で激しいメディア報道の対象となっている。
ソーシャルメディア上でニュースやメディアが投稿したつぶやきを収集・処理することで,この話題に焦点を当てた新たなマルチメディアデータセットを提案する。
私たちは2022年2月から2023年5月までのツイートを収集し、60の言語で約150万のツイートとそれらの画像を取得しました。
論文 参考訳(メタデータ) (2023-06-22T13:52:31Z) - NewsStories: Illustrating articles with visual summaries [49.924916589209374]
我々は,3300万記事,2200万画像,100万ビデオを含む大規模マルチモーダルデータセットを提案する。
現状の画像テキストアライメント手法は、複数の画像を持つ長い物語に対して堅牢ではないことを示す。
本稿では,GoodNewsデータセット上で,ゼロショット画像セット検索において,これらの手法を10%向上させる直感的なベースラインを提案する。
論文 参考訳(メタデータ) (2022-07-26T17:34:11Z) - There is a Time and Place for Reasoning Beyond the Image [63.96498435923328]
画像は人間の目へのピクセルだけでなく、他のソースからのコンテキスト情報から推論、関連付け、推論して、推論することで、より完全な画像を確立することができる。
我々は、ニューヨーク・タイムズ(NYT)から自動的に抽出された16k画像と関連するニュース、時間、位置のデータセットTARAと、WITから離れた監視対象として追加で61k例を紹介した。
我々は、最先端のジョイントモデルと人間のパフォーマンスの間に70%のギャップがあることを示し、これは、セグメントワイズ推論を用いて高レベルな視覚言語ジョイントモデルを動機づける提案モデルによってわずかに満たされている。
論文 参考訳(メタデータ) (2022-03-01T21:52:08Z) - Cross-Media Keyphrase Prediction: A Unified Framework with
Multi-Modality Multi-Head Attention and Image Wordings [63.79979145520512]
マルチメディア投稿におけるキーワード予測におけるテキストと画像の併用効果について検討する。
複雑なマルチメディアインタラクションを捉えるために,M3H-Att(Multi-Modality Multi-Head Attention)を提案する。
我々のモデルは,従来の注目ネットワークに基づいて,過去の技術状況よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-11-03T08:44:18Z) - The Newspaper Navigator Dataset: Extracting And Analyzing Visual Content
from 16 Million Historic Newspaper Pages in Chronicling America [10.446473806802578]
写真,イラスト,地図,漫画,編集漫画のバウンディングボックスアノテーションに基づいて学習した視覚的コンテンツ認識モデルを提案する。
この深層学習モデルを用いて7種類の視覚コンテンツを抽出するパイプラインについて述べる。
我々は,日系アメリカのコーパスから1630万ページのパイプラインを運用した結果を報告する。
論文 参考訳(メタデータ) (2020-05-04T15:51:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。