論文の概要: An Answer is just the Start: Related Insight Generation for Open-Ended Document-Grounded QA
- arxiv url: http://arxiv.org/abs/2604.19685v1
- Date: Tue, 21 Apr 2026 17:07:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.893559
- Title: An Answer is just the Start: Related Insight Generation for Open-Ended Document-Grounded QA
- Title(参考訳): 答は単なる始まり:オープンエンディングドキュメンテーションを取り巻くQAのインサイト生成
- Authors: Saransh Sharma, Pritika Ramu, Aparna Garimella, Koyel Mukherjee,
- Abstract要約: オープンな質問に対する最初の回答を改善し、拡張し、再考するのに役立つドキュメントコレクションから、新たな洞察を生み出すための新しいタスクを導入します。
SCOpE-QAは、20の研究コレクションに3000のオープンエンド質問のデータセットである。
本稿では、まず、クラスタリングを用いて文書コレクションのテーマ表現を構築し、関連するコンテキストを選択する2段階のアプローチであるInsightGenを紹介する。
- 参考スコア(独自算出の注目度): 6.690221203207201
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Answering open-ended questions remains challenging for AI systems because it requires synthesis, judgment, and exploration beyond factual retrieval, and users often refine answers through multiple iterations rather than accepting a single response. Existing QA benchmarks do not explicitly support this refinement process. To address this gap, we introduce a new task, document-grounded related insight generation, where the goal is to generate additional insights from a document collection that help improve, extend, or rethink an initial answer to an open-ended question, ultimately supporting richer user interaction and a better overall question answering experience. We curate and release SCOpE-QA (Scientific Collections for Open-Ended QA), a dataset of 3,000 open-ended questions across 20 research collections. We present InsightGen, a two-stage approach that first constructs a thematic representation of the document collection using clustering, and then selects related context based on neighborhood selection from the thematic graph to generate diverse and relevant insights using LLMs. Extensive evaluation on 3,000 questions using two generation models and two evaluation settings shows that InsightGen consistently produces useful, relevant, and actionable insights, establishing a strong baseline for this new task.
- Abstract(参考訳): AIシステムには、事実検索以上の合成、判断、探索が必要であり、ユーザは単一の応答を受け入れるのではなく、複数のイテレーションを通じて回答を洗練する必要があるため、未解決の質問に答えることは依然として難しい。
既存のQAベンチマークは、この改善プロセスを明示的にサポートしていない。
このギャップに対処するために、我々は、文書コレクションから追加の洞察を生成し、オープンエンドの質問に対する最初の回答を改善し、拡張し、再考し、最終的にはよりリッチなユーザインタラクションをサポートし、より総合的な質問応答エクスペリエンスを向上させるという、ドキュメントグラウンド関連の洞察生成という新しいタスクを導入する。
SCOpE-QA(Scientific Collections for Open-Ended QA)は、20の研究コレクションに3000のオープンエンド質問のデータセットである。
本稿では,まずクラスタリングを用いて文書コレクションのテーマ表現を構築するための2段階のアプローチであるInsightGenについて述べる。
2つの世代モデルと2つの評価設定を用いた3,000の質問に対する広範囲な評価は、InsightGenが一貫して有用で関連性があり、実行可能な洞察を生成し、この新しいタスクの強力なベースラインを確立していることを示している。
関連論文リスト
- Retrieval-Augmented Visual Question Answering via Built-in Autoregressive Search Engines [17.803396998387665]
Retrieval-augmented Generation (RAG)は、知識集約型視覚質問応答(VQA)タスクに対処するために登場した。
本稿では,知識に基づくVQAタスクに対する従来のRAGモデルの代替としてReAuSEを提案する。
我々のモデルは生成型検索器と正確な回答生成器の両方として機能する。
論文 参考訳(メタデータ) (2025-02-23T16:39:39Z) - Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent [92.5712549836791]
マルチモーダル大規模言語モデル(MLLM)に固有の「ハロシン化」問題を緩和する上で,mRAG(Multimodal Retrieval Augmented Generation)が重要な役割を果たしている。
マルチモーダル検索のための自己適応型計画エージェントOmniSearchを提案する。
論文 参考訳(メタデータ) (2024-11-05T09:27:21Z) - Exploring Hint Generation Approaches in Open-Domain Question Answering [16.434748534272014]
HINTQAと呼ばれる新しいコンテキスト準備手法を導入する。
従来の方法とは異なり、HINTQA は LLM に対して質問に対する潜在的な答えのヒントを作成するよう促している。
提案手法は,検索した文脈や生成した文脈よりも解答の精度を高めるものである。
論文 参考訳(メタデータ) (2024-09-24T13:50:32Z) - From Local to Global: A Graph RAG Approach to Query-Focused Summarization [4.075260785658849]
GraphRAGは、プライベートテキストコーパスに対する質問応答のためのグラフベースのアプローチである。
我々は,GraphRAGが従来のRAGベースラインよりも大幅に改善され,生成した回答の包括性と多様性が向上することを示す。
論文 参考訳(メタデータ) (2024-04-24T18:38:11Z) - Boosting Conversational Question Answering with Fine-Grained Retrieval-Augmentation and Self-Check [25.63538452425097]
本稿では,対話型質問応答のための細粒度検索と自己チェックを組み込んだ対話レベルのRAG手法を提案する。
特に,本手法は,対話型質問精算器,きめ細かい検索器,自己チェックに基づく応答生成器の3つのコンポーネントから構成される。
論文 参考訳(メタデータ) (2024-03-27T04:20:18Z) - Allies: Prompting Large Language Model with Beam Search [107.38790111856761]
本研究では,ALIESと呼ばれる新しい手法を提案する。
入力クエリが与えられた場合、ALLIESはLLMを活用して、元のクエリに関連する新しいクエリを反復的に生成する。
元のクエリのスコープを反復的に精錬して拡張することにより、ALLIESは直接検索できない隠れた知識をキャプチャし、利用する。
論文 参考訳(メタデータ) (2023-05-24T06:16:44Z) - Self-Prompting Large Language Models for Zero-Shot Open-Domain QA [67.08732962244301]
Open-Domain Question Answering (ODQA)は、背景文書を明示的に提供せずに質問に答えることを目的としている。
このタスクは、調整済みの検索リーダーモデルをトレーニングするデータがないゼロショット設定で顕著に困難になる。
本稿では,大規模言語モデルのパラメータに符号化された膨大な知識を明示的に活用するセルフプロンプトフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-16T18:23:43Z) - Generate rather than Retrieve: Large Language Models are Strong Context
Generators [74.87021992611672]
本稿では,文書検索を大規模言語モデル生成器に置き換えることで,知識集約型タスクを解く新しい視点を提案する。
我々は,提案手法をgenRead (genRead) と呼び,まず大きな言語モデルに対して,与えられた質問に基づいて文脈文書を生成し,次に生成された文書を読み出して最終回答を生成する。
論文 参考訳(メタデータ) (2022-09-21T01:30:59Z) - Answering Any-hop Open-domain Questions with Iterative Document
Reranking [62.76025579681472]
オープンドメインの問に答える統合QAフレームワークを提案する。
提案手法は,シングルホップおよびマルチホップのオープンドメインQAデータセットにおいて,最先端技術に匹敵する性能を継続的に達成する。
論文 参考訳(メタデータ) (2020-09-16T04:31:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。