論文の概要: DeepWriter: A Fact-Grounded Multimodal Writing Assistant Based On Offline Knowledge Base
- arxiv url: http://arxiv.org/abs/2507.14189v2
- Date: Thu, 14 Aug 2025 08:14:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 15:52:16.97231
- Title: DeepWriter: A Fact-Grounded Multimodal Writing Assistant Based On Offline Knowledge Base
- Title(参考訳): DeepWriter: オフライン知識ベースに基づくFact-Grounded Multimodal Writing Assistant
- Authors: Song Mao, Lejun Cheng, Pinlong Cai, Guohang Yan, Ding Wang, Botian Shi,
- Abstract要約: 私たちはDeepWriterを紹介します。DeepWriterはカスタマイズ可能で、マルチモーダルで、長い形式の書き込みアシスタントで、キュレートされたオフラインの知識ベースで動作します。
構造化されたコーパスから情報を深く掘り下げることで、DeepWriterは一貫性があり、事実上基礎があり、専門レベルのドキュメントを生成する。
ファイナンシャルレポート生成実験は,DeepWriterが高品質で検証可能な記事を生成することを示す。
- 参考スコア(独自算出の注目度): 10.572896494190669
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) have demonstrated remarkable capabilities in various applications. However, their use as writing assistants in specialized domains like finance, medicine, and law is often hampered by a lack of deep domain-specific knowledge and a tendency to hallucinate. Existing solutions, such as Retrieval-Augmented Generation (RAG), can suffer from inconsistency across multiple retrieval steps, while online search-based methods often degrade quality due to unreliable web content. To address these challenges, we introduce DeepWriter, a customizable, multimodal, long-form writing assistant that operates on a curated, offline knowledge base. DeepWriter leverages a novel pipeline that involves task decomposition, outline generation, multimodal retrieval, and section-by-section composition with reflection. By deeply mining information from a structured corpus and incorporating both textual and visual elements, DeepWriter generates coherent, factually grounded, and professional-grade documents. We also propose a hierarchical knowledge representation to enhance retrieval efficiency and accuracy. Our experiments on financial report generation demonstrate that DeepWriter produces high-quality, verifiable articles that surpasses existing baselines in factual accuracy and generated content quality.
- Abstract(参考訳): 大規模言語モデル(LLM)は、様々なアプリケーションで顕著な機能を示している。
しかし、金融、医薬、法律などの専門分野の事務助手としての利用は、深い藩固有の知識の欠如や幻覚の傾向によってしばしば妨げられている。
Retrieval-Augmented Generation (RAG)のような既存のソリューションは、複数の検索ステップで不整合に悩まされるが、オンライン検索ベースの手法は、信頼性の低いWebコンテンツによって品質が低下することが多い。
これらの課題に対処するために、オフラインでキュレートされた知識ベースで動作する、カスタマイズ可能な、マルチモーダルで長い形式の書き込みアシスタントであるDeepWriterを紹介します。
DeepWriterは、タスクの分解、アウトライン生成、マルチモーダル検索、リフレクションによるセクションバイセクション合成を含む、新しいパイプラインを活用する。
構造化されたコーパスから情報を深くマイニングし、テキスト要素とビジュアル要素の両方を組み込むことで、DeepWriterは一貫性があり、事実上基礎があり、プロフェッショナルグレードのドキュメントを生成する。
また,検索効率と精度を向上させる階層的知識表現を提案する。
ファイナンシャルレポート生成実験により,DeepWriterは,既存のベースラインを超越した,高品質で検証可能な記事が生成され,コンテンツ品質が生成されることが実証された。
関連論文リスト
- Docopilot: Improving Multimodal Models for Document-Level Understanding [87.60020625241178]
マルチモーダル文書の詳細な理解を支援するために,高品質な文書レベルデータセットDoc-750Kを提案する。
このデータセットには、さまざまなドキュメント構造、広範なクロスページ依存関係、および元のドキュメントから派生した実際の質問と回答のペアが含まれている。
データセットに基づいて、RAGに頼ることなく、文書レベルの依存関係を正確に処理できるネイティブなマルチモーダルモデルであるDocopilotを開発する。
論文 参考訳(メタデータ) (2025-07-19T16:03:34Z) - Benchmarking Deep Search over Heterogeneous Enterprise Data [73.55304268238474]
検索強化生成(RAG)の形式を評価するための新しいベンチマークを提案する。
RAGは、多種多様な、しかし関連するソースに対して、ソースを意識したマルチホップ推論を必要とする。
製品計画、開発、サポートステージをまたいだビジネスをシミュレートする合成データパイプラインを使用して構築します。
論文 参考訳(メタデータ) (2025-06-29T08:34:59Z) - DeFine: A Decomposed and Fine-Grained Annotated Dataset for Long-form Article Generation [24.091769825963173]
DeFine(Decomposed and Fine-fine annotated dataset for long-form article generation)を紹介する。
DeFineは階層的な分解戦略とドメイン固有の知識とマルチレベルアノテーションの統合によって特徴付けられる。
実験結果から, テキスト品質, 特にトピックカバレッジ, 情報深度, 内容の忠実度が有意に向上した。
論文 参考訳(メタデータ) (2025-03-10T10:48:00Z) - A Library Perspective on Supervised Text Processing in Digital Libraries: An Investigation in the Biomedical Domain [3.9519587827662397]
本研究では,8つのバイオメディカルベンチマークを用いて,関係抽出とテキスト分類に焦点を当てた。
精度とアプリケーションコストのトレードオフを検討し、遠隔監視とChatGPT、LLama、Olmoといった大規模言語モデルを通じてデータ生成のトレーニングを行い、最終パイプラインの設計方法について論じる。
論文 参考訳(メタデータ) (2024-11-06T07:54:10Z) - Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models [11.597314728459573]
我々は、大きな言語モデルを用いて、ウィキペディアのページに匹敵する幅と深さの長い記事をスクラッチから書く方法を研究した。
本稿では,検索と複数パースペクティブ質問応答によるトピックアウトライン生成のための記述システムSTORMを提案する。
論文 参考訳(メタデータ) (2024-02-22T01:20:17Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - OCRBench: On the Hidden Mystery of OCR in Large Multimodal Models [122.27878464009181]
テキスト関連視覚タスクにおいて, GPT4V や Gemini などの大規模マルチモーダルモデルの包括的評価を行った。
OCRBenchには29のデータセットがあり、最も包括的なOCR評価ベンチマークが利用できる。
論文 参考訳(メタデータ) (2023-05-13T11:28:37Z) - Expository Text Generation: Imitate, Retrieve, Paraphrase [26.43857184008374]
本稿では,トピックに対して,正確かつスタイリスティックに一貫性のあるテキストを自動的に生成する,例示テキスト生成のタスクを提案する。
我々は、検索強化モデルの限界を克服し、コンテンツ計画、事実検索、言い換えを反復的に実行するIRPを開発する。
我々は、IRPが読者に正確に通知する実例と組織的な説明文を生成することを示す。
論文 参考訳(メタデータ) (2023-05-05T04:26:29Z) - TegTok: Augmenting Text Generation via Task-specific and Open-world
Knowledge [83.55215993730326]
本稿では,タスク固有およびオープンワールド知識(TegTok)によるTExt生成の統一化を提案する。
本モデルでは,2種類の知識ソースからの知識エントリを高密度検索により選択し,それぞれ入力エンコーディングと出力デコーディングの段階に注入する。
論文 参考訳(メタデータ) (2022-03-16T10:37:59Z) - Deep Latent-Variable Models for Text Generation [7.119436003155924]
ディープニューラルネットワークベースのエンドツーエンドアーキテクチャが広く採用されている。
エンドツーエンドのアプローチは、以前は複雑な手作りのルールで設計されていたすべてのサブモジュールを、全体的なエンコード・デコードアーキテクチャに融合させる。
この論文は、テキスト生成のための標準エンコーダデコーダモデルよりも、潜伏変数の深いモデルがいかに改善できるかを示す。
論文 参考訳(メタデータ) (2022-03-03T23:06:39Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - How to Train Your Agent to Read and Write [52.24605794920856]
研究論文の読み書きは、資格のある研究者が習得すべき最も特権のある能力の1つである。
読者が論文を読み、要約できるようにインテリジェントなエージェントを訓練し、おそらく新しい論文を書くための潜在的な知識の手がかりを発見し、活用できれば、それは魅力的です。
本研究では,入力段落から知識グラフ(KG)を抽出して潜在的な知識を発見できるtextitReader,新規段落を生成するgraph-to-text TextitWriter,およびtextitから構成されるDeep ReAder-Writer(DRAW)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-01-04T12:22:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。