論文の概要: Knowledge-Aware Diverse Reranking for Cross-Source Question Answering
- arxiv url: http://arxiv.org/abs/2506.20476v1
- Date: Wed, 25 Jun 2025 14:23:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-26 21:00:42.781111
- Title: Knowledge-Aware Diverse Reranking for Cross-Source Question Answering
- Title(参考訳): クロスソース質問応答における知識認識の多元化
- Authors: Tong Zhou,
- Abstract要約: 本稿では,SIGIR 2025 LiveRAG コンペティションにおける Team Marikarp のソリューションについて述べる。
コンペティションの評価セットは、インターネットコーパスからDataMorganaによって自動生成され、幅広いターゲットトピックを含んでいた。
提案した知識対応多種多様なRAGパイプラインは,コンペで1位となった。
- 参考スコア(独自算出の注目度): 9.788039182463768
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents Team Marikarp's solution for the SIGIR 2025 LiveRAG competition. The competition's evaluation set, automatically generated by DataMorgana from internet corpora, encompassed a wide range of target topics, question types, question formulations, audience types, and knowledge organization methods. It offered a fair evaluation of retrieving question-relevant supporting documents from a 15M documents subset of the FineWeb corpus. Our proposed knowledge-aware diverse reranking RAG pipeline achieved first place in the competition.
- Abstract(参考訳): 本稿では,SIGIR 2025 LiveRAG コンペティションにおける Team Marikarp のソリューションについて述べる。
コンペティションの評価セットは、インターネットコーパスからDataMorganaによって自動生成され、幅広い対象トピック、質問タイプ、質問の定式化、オーディエンスタイプ、知識組織手法を含む。
FineWebコーパスの1500万のドキュメントサブセットから、質問関連のサポートドキュメントを取得するための公正な評価を提供する。
提案した知識対応多種多様なRAGパイプラインは,コンペで1位となった。
関連論文リスト
- PreQRAG -- Classify and Rewrite for Enhanced RAG [1.652907918484303]
検索および生成品質を改善するために設計された検索拡張型アーキテクチャであるPreQRAGを紹介する。
PreQRAGには、まず各入力質問を単一ドキュメントタイプまたは複数ドキュメントタイプに分類するパイプラインが組み込まれている。
単文書質問に対して,検索精度と生成関連性を改善するために質問書き直し手法を用いる。
複数文書の質問に対して、より効果的に処理できる集中サブクェリに複雑なクエリを分解する。
論文 参考訳(メタデータ) (2025-06-20T22:02:05Z) - NeurIPS 2023 Competition: Privacy Preserving Federated Learning Document VQA [49.74911193222192]
このコンペティションでは、関連する質問や回答とともに、本物の請求書文書のデータセットが導入された。
ベースモデルは多モード生成言語モデルであり、視覚的またはテキスト的入力モダリティによってセンシティブな情報を公開することができる。
参加者は最小限の効用閾値を維持しながら通信コストを削減するエレガントなソリューションを提案した。
論文 参考訳(メタデータ) (2024-11-06T07:51:19Z) - Do RAG Systems Cover What Matters? Evaluating and Optimizing Responses with Sub-Question Coverage [74.70255719194819]
サブクエストカバレッジに基づく新しいフレームワークを導入し、RAGシステムが質問の異なる面にどのように対処するかを計測する。
このフレームワークを使用して、You.com、Perplexity AI、Bing Chatの3つの商用生成応答エンジンを評価します。
すべての回答エンジンは、バックグラウンドやフォローアップよりも、コアサブクエストを頻繁にカバーしていますが、コアサブクエストの約50%を見逃しています。
論文 参考訳(メタデータ) (2024-10-20T22:59:34Z) - ELOQ: Resources for Enhancing LLM Detection of Out-of-Scope Questions [52.33835101586687]
本研究では,検索した文書が意味的に類似しているように見えるスコープ外質問について検討するが,答えるために必要な情報がない。
本稿では,閉経後の文書から多様なスコープ外質問を自動的に生成するための,幻覚に基づくELOQを提案する。
論文 参考訳(メタデータ) (2024-10-18T16:11:29Z) - Improving Health Question Answering with Reliable and Time-Aware Evidence Retrieval [5.69361786082969]
本研究は,オープンドメインのQA設定に焦点をあて,重要な課題は,まず大きな知識ベースで関連する証拠を明らかにすることである。
一般的な検索対象QAパイプラインとPubMedを信頼できる医療研究資料のコレクションとして活用することにより、3つの多様なデータセットからの健康問題に答える。
以上の結果から,検索した文書の量を削減し,最近かつ高度に引用された文書を優先することで,最終マクロF1スコアを最大10%向上させることができることがわかった。
論文 参考訳(メタデータ) (2024-04-12T09:56:12Z) - A Clarifying Question Selection System from NTES_ALONG in Convai3
Challenge [8.656503175492375]
本稿では,検索指向会話型AI (SCAI) EMNLPワークショップにおけるClariQチャレンジへのNetEase Game AI Labチームの参加について述べる。
この課題は、解明された質問を理解し、生成できる完全な会話情報検索システムを求めるものである。
本稿では,回答理解,質問のリコール,質問ランキングの明確化からなる質問選択システムを提案する。
論文 参考訳(メタデータ) (2020-10-27T11:22:53Z) - CAiRE-COVID: A Question Answering and Query-focused Multi-Document
Summarization System for COVID-19 Scholarly Information Management [48.251211691263514]
我々は、リアルタイム質問応答(QA)とマルチドキュメント要約システムであるCAiRE-COVIDを紹介し、Kaggle COVID-19 Open Researchデータセットチャレンジで10のタスクのうちの1つを勝ち取った。
本システムの目的は,コミュニティからの優先度の高い質問に答えることによって,新型コロナウイルスに関する数多くの学術論文をマイニングすることにある。
論文 参考訳(メタデータ) (2020-05-04T15:07:27Z) - Recognizing Families In the Wild: White Paper for the 4th Edition Data
Challenge [91.55319616114943]
本稿では,Recognizing Families In the Wild(RFIW)評価における支援課題(親族検証,三対象検証,行方不明児の検索・検索)を要約する。
本研究の目的は、2020年のRFIWチャレンジと、将来的な方向性の予測について述べることである。
論文 参考訳(メタデータ) (2020-02-15T02:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。