論文の概要: WikiAutoGen: Towards Multi-Modal Wikipedia-Style Article Generation
- arxiv url: http://arxiv.org/abs/2503.19065v1
- Date: Mon, 24 Mar 2025 18:51:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-26 16:55:45.801735
- Title: WikiAutoGen: Towards Multi-Modal Wikipedia-Style Article Generation
- Title(参考訳): WikiAutoGen: マルチモーダルなウィキペディアスタイルの記事生成を目指して
- Authors: Zhongyu Yang, Jun Chen, Dannong Xu, Junjie Fei, Xiaoqian Shen, Liangbing Zhao, Chun-Mei Feng, Mohamed Elhoseiny,
- Abstract要約: ウィキオートジェン(WikiAutoGen)は、ウィキペディア形式の自動記事生成システムである。
従来のアプローチとは異なり、WikiAutoGenはテキストとともに関連する画像を検索して統合し、生成されたコンテンツの深さと視覚的魅力の両方を豊かにする。
事実の精度と包括性をさらに向上するため,多視点自己回帰機構を提案する。
- 参考スコア(独自算出の注目度): 29.386002986862568
- License:
- Abstract: Knowledge discovery and collection are intelligence-intensive tasks that traditionally require significant human effort to ensure high-quality outputs. Recent research has explored multi-agent frameworks for automating Wikipedia-style article generation by retrieving and synthesizing information from the internet. However, these methods primarily focus on text-only generation, overlooking the importance of multimodal content in enhancing informativeness and engagement. In this work, we introduce WikiAutoGen, a novel system for automated multimodal Wikipedia-style article generation. Unlike prior approaches, WikiAutoGen retrieves and integrates relevant images alongside text, enriching both the depth and visual appeal of generated content. To further improve factual accuracy and comprehensiveness, we propose a multi-perspective self-reflection mechanism, which critically assesses retrieved content from diverse viewpoints to enhance reliability, breadth, and coherence, etc. Additionally, we introduce WikiSeek, a benchmark comprising Wikipedia articles with topics paired with both textual and image-based representations, designed to evaluate multimodal knowledge generation on more challenging topics. Experimental results show that WikiAutoGen outperforms previous methods by 8%-29% on our WikiSeek benchmark, producing more accurate, coherent, and visually enriched Wikipedia-style articles. We show some of our generated examples in https://wikiautogen.github.io/ .
- Abstract(参考訳): 知識発見と収集は知能集約的な作業であり、伝統的に高品質なアウトプットを確保するのにかなりの人的努力を必要とする。
近年,インターネットから情報を検索,合成することで,ウィキペディア形式の記事生成を自動化するマルチエージェントフレームワークについて検討している。
しかし,これらの手法は主にテキストのみの生成に焦点が当てられており,情報性やエンゲージメントを高める上でのマルチモーダルコンテンツの重要性を見越している。
本稿では,ウィキオートジェン(WikiAutoGen)を紹介する。
従来のアプローチとは異なり、WikiAutoGenはテキストとともに関連する画像を検索して統合し、生成されたコンテンツの深さと視覚的魅力の両方を豊かにする。
事実の精度と包括性をさらに向上するため,多様な視点から検索したコンテンツを批判的に評価し,信頼性,幅,コヒーレンスなどを向上する多視点自己反映機構を提案する。
さらに、ウィキシーク(WikiSeek)という、ウィキペディアの記事と、テキストと画像ベースの表現を組み合わせたトピックからなるベンチマークも導入し、より困難なトピックに対してマルチモーダルな知識生成を評価するように設計されている。
実験の結果,WikiAutoGenは我々のWikiSeekベンチマークで従来の手法を8%-29%上回り,より正確で一貫性があり,ビジュアルにリッチなウィキペディアスタイルの記事を生成することがわかった。
生成された例をいくつか、https://wikiautogen.github.io/に示します。
関連論文リスト
- REVERSUM: A Multi-staged Retrieval-Augmented Generation Method to Enhance Wikipedia Tail Biographies through Personal Narratives [4.427603894929721]
本研究は,ウィキペディアのBとCカテゴリの伝記記事を強化するための新しいアプローチを提案する。
複数段階の検索拡張生成手法を用いて、より知られていない記事の情報内容の充実を図る。
論文 参考訳(メタデータ) (2025-02-17T18:53:42Z) - Automatic Quality Assessment of Wikipedia Articles -- A Systematic
Literature Review [0.8158530638728501]
ウィキペディアの記事の質を自動的に測定する既存の手法についてレビューする。
機械学習アルゴリズム、記事の特徴、品質指標、使用済みデータセットを特定し比較する。
私たちの分析が将来の研究者の現実を変えるのに役立つことを願っています。
論文 参考訳(メタデータ) (2023-10-03T17:45:39Z) - Open-domain Visual Entity Recognition: Towards Recognizing Millions of
Wikipedia Entities [54.26896306906937]
我々はOVEN-Wikiを提示する。そこでは、テキストクエリに関して、モデルをウィキペディアのエンティティにリンクする必要がある。
私たちは、微調整中に見たことのないWikipediaのエンティティでも、PaLIベースの自動回帰視覚認識モデルが驚くほどうまく機能していることを示します。
PaLIベースのモデルでは全体的なパフォーマンスが向上するが、CLIPベースのモデルはテールエンティティを認識するのに優れている。
論文 参考訳(メタデータ) (2023-02-22T05:31:26Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - Surfer100: Generating Surveys From Web Resources on Wikipedia-style [49.23675182917996]
先進言語モデリングの最近の進歩は、ウィキペディアのリード段落生成のための2段階の抽出的抽象的アプローチと組み合わせることができることを示す。
提案手法は,より長いウィキペディアスタイルの要約をセクションで生成するために拡張され,100件の人文調査による詳細な研究を通じて,このような手法が本アプリケーションでどのように苦しむかを検討する。
論文 参考訳(メタデータ) (2021-12-13T02:18:01Z) - Assessing the quality of sources in Wikidata across languages: a hybrid
approach [64.05097584373979]
いくつかの言語でラベルを持つWikidataのトリプルからサンプルした参照コーパスの大規模なコーパスを評価するために,一連のマイクロタスク実験を実施している。
クラウドソースアセスメントの統合されたバージョンを使用して、いくつかの機械学習モデルをトレーニングして、Wikidata全体の分析をスケールアップしています。
この結果はWikidataにおける参照の質の確認に役立ち、ユーザ生成多言語構造化データの品質をWeb上で定義し、取得する際の共通の課題を特定するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-20T10:06:46Z) - Wiki-Reliability: A Large Scale Dataset for Content Reliability on
Wikipedia [4.148821165759295]
我々は、幅広いコンテンツ信頼性の問題に注釈を付けた英語ウィキペディア記事の最初のデータセットを構築した。
このデータセットを構築するには、Wikipediaの「テンプレート」を利用します。
ウィキペディアで最も人気のある10の信頼性関連テンプレートを選択し、ウィキペディアの記事改訂のほぼ1Mのサンプルをポジティブまたはネガティブにラベル付ける効果的な方法を提案します。
論文 参考訳(メタデータ) (2021-05-10T05:07:03Z) - Generating Wikipedia Article Sections from Diverse Data Sources [57.23574577984244]
WikiTableTでいくつかのトレーニングとデコード戦略をベンチマークする。
我々の定性的な分析は、最良のアプローチは、流動的で高品質なテキストを生成することができるが、コヒーレンスに苦しむことがあることを示している。
論文 参考訳(メタデータ) (2020-12-29T19:35:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。