論文の概要: GPT-Image-2 in the Wild: A Twitter Dataset of Self-Reported AI-Generated Images from the First Week of Deployment
- arxiv url: http://arxiv.org/abs/2604.25370v2
- Date: Tue, 05 May 2026 22:21:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-07 15:17:35.536252
- Title: GPT-Image-2 in the Wild: A Twitter Dataset of Self-Reported AI-Generated Images from the First Week of Deployment
- Title(参考訳): GPT-Image-2 in the Wild: Twitterが公開初週の自撮りAI画像のデータセットを公開
- Authors: Kidus Zewde, Simiao Ren, Xingyu Shen, Jiaqi Wu, Yuchen Zhou, Tommy Duong, Zikang Zhang, Ethan Traister, Kewen Xie,
- Abstract要約: OpenAIによるGPT-image-2は、AI生成画像の分岐点である。
このデータセットは、公開されたTwitter/XポストからソースされたGPT-image-2生成イメージの最初のデータセットである。
データセットを4つの分析で特徴づける。
- 参考スコア(独自算出の注目度): 8.173496305514893
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The release of GPT-image-2 by OpenAI marks a watershed moment in AI-generated imagery: the boundary between photographic reality and synthetic content has never been more difficult to discern. We introduce the GPT-Image-2 Twitter Dataset, the first published dataset of GPT-image-2 generated images, sourced from publicly available Twitter/X posts in the immediate aftermath of the model's April 21, 2026 release. Leveraging the Twitter API v2 and a multi-stage curation pipeline spanning multilingual text heuristics (English, Japanese, and Chinese), browser-automated Twitter "Made with AI" badge verification, and model name variant matching, we curate 10,217 confirmed GPT-image-2 images from 27,662 collected records over a six-day window. We characterize the dataset across four analyses: CLIP-based zero-shot subject taxonomy, OCR text legibility (82.0% of images contain detectable text), face detection (59.2% of images, 22,583 total faces), and semantic clustering (137 CLIP ViT-L/14 clusters). A key negative result is that C2PA content credentials are systematically stripped by Twitter's CDN on upload, rendering cryptographic provenance verification infeasible for social-media-sourced AI images. The dataset and all curation code are released publicly.
- Abstract(参考訳): OpenAI による GPT-image-2 のリリースは、AI 生成画像における水没の瞬間である。
GPT-Image-2 Twitter Datasetは、GPT-image-2生成画像の最初のデータセットであり、2026年4月21日のリリースの直後に公開されたTwitter/Xの投稿から得られたものである。
Twitter API v2と多言語テキストヒューリスティックス(英語、日本語、中国語)、ブラウザ自動化されたTwitter "Made with AI"バッジ検証、モデル名の変種マッチングにまたがるマルチステージキュレーションパイプラインを活用して、6日間のウィンドウ上で収集された27,662件のGPT-image-2イメージを10,217件をキュレートした。
CLIPベースのゼロショット対象分類、OCRテキストの正当性(82.0%の画像は検出可能なテキストを含む)、顔検出(59.2%の画像、22,583の顔)、セマンティッククラスタリング(137のCLIP ViT-L/14クラスタ)である。
重要なネガティブな結果として、C2PAコンテンツ認証は、アップロード時にTwitterのCDNによって体系的に取り除かれ、ソーシャルメディアソースのAIイメージでは不可能な暗号証明をレンダリングする。
データセットとすべてのキュレーションコードは公開されています。
関連論文リスト
- When the Forger Is the Judge: GPT-Image-2 Cannot Recognize Its Own Faked Documents [8.591475917096318]
OpenAIのGPT-Image-2は、本物とAIが編集した文書イメージの視覚的境界を効果的に消した。
AIForge-Doc v2は、3,066のGPT-Image-2ドキュメントフォージェリーのペアデータセットです。
論文 参考訳(メタデータ) (2026-04-28T04:33:26Z) - AIForge-Doc: A Benchmark for Detecting AI-Forged Tampering in Financial and Form Documents [7.014776899553499]
我々は,ファイナンシャルおよびフォーム文書にピクセルレベルのアノテーションを付加した拡散モデルベースの塗り絵のみを対象とする,最初の専用ベンチマークであるAIForge-Docを紹介する。
TruFor、DocTamper、ゼロショットGPT-4oの3つの代表検出器をベンチマークした結果、既存のメソッドはすべて大幅に劣化していることがわかった。
論文 参考訳(メタデータ) (2026-02-24T05:37:35Z) - Could AI Trace and Explain the Origins of AI-Generated Images and Text? [53.11173194293537]
AI生成コンテンツは、現実の世界ではますます普及している。
敵は、大規模なマルチモーダルモデルを利用して、倫理的または法的基準に違反した画像を作成するかもしれない。
ペーパーレビュアーは、大きな言語モデルを誤用して、真の知的努力なしにレビューを生成する。
論文 参考訳(メタデータ) (2025-04-05T20:51:54Z) - CO-SPY: Combining Semantic and Pixel Features to Detect Synthetic Images by AI [58.35348718345307]
実際の画像とAI生成画像を区別する現在の取り組みには、一般化が欠如している可能性がある。
既存のセマンティック機能を強化した新しいフレームワークCo-Spyを提案する。
また、5つの実画像データセットと22の最先端生成モデルからなる包括的データセットであるCo-Spy-Benchを作成します。
論文 参考訳(メタデータ) (2025-03-24T01:59:29Z) - D-Judge: How Far Are We? Assessing the Discrepancies Between AI-synthesized and Natural Images through Multimodal Guidance [19.760989919485894]
5000の自然画像と440,000以上のAIGIサンプルからなる大規模マルチモーダルデータセットD-ANIを構築した。
次に、AI生成画像(AIGI)が真に現実的なイメージからどこまで遠いのかという、重要な問題に対処するために、AI-Natural Image Discrepancy評価ベンチマーク(D-Judge)を導入します。
論文 参考訳(メタデータ) (2024-12-23T15:08:08Z) - LLaVAR: Enhanced Visual Instruction Tuning for Text-Rich Image
Understanding [85.39419609430453]
この作業は、テキストリッチなイメージで現在のビジュアルインストラクションチューニングパイプラインを強化する。
まず、公開されたOCRツールを使用して、LAIONデータセットから422Kテキストリッチイメージの結果を収集します。
我々は、認識されたテキストと画像キャプションを持つテキストのみのGPT-4に16Kの会話を生成するよう促す。
論文 参考訳(メタデータ) (2023-06-29T17:08:16Z) - TWIGMA: A dataset of AI-Generated Images with Metadata From Twitter [29.77283532841167]
TWIGMAは,2021年1月から2023年3月までに収集された800,000以上のgen-AI画像を含むデータセットである。
その結果,gen-AI画像には特徴があり,非gen-AI画像と比較すると,平均的,低変動性を示すことがわかった。
われわれは、Twitter上でAI生成画像のテーマの経年変化を観察し、ユーザーは芸術的に洗練されたコンテンツをますます共有している。
論文 参考訳(メタデータ) (2023-06-14T07:27:57Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。