Fugu-MT 論文翻訳(概要): Exploring the Practicality of Generative Retrieval on Dynamic Corpora

論文の概要: Exploring the Practicality of Generative Retrieval on Dynamic Corpora

arxiv url: http://arxiv.org/abs/2305.18952v4
Date: Thu, 03 Oct 2024 15:08:07 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-05 18:06:35.398683
Title: Exploring the Practicality of Generative Retrieval on Dynamic Corpora
Title（参考訳）: 動的コーパスにおける生成検索の実用性を探る
Authors: Chaeeun Kim, Soyoung Yoon, Hyunji Lee, Joel Jang, Sohee Yang, Minjoon Seo,
Abstract要約: 本稿では,自己回帰型言語モデルをIR問題に適用する生成検索(GR)に焦点を当てる。我々はまた、IRシステムの実環境展開において重要な要素である計算効率とメモリ効率を広範囲に評価する。本稿では,動的環境における実用的な赤外線システムにおけるGRの可能性について述べる。
参考スコア（独自算出の注目度）: 41.223804434693875
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Benchmarking the performance of information retrieval (IR) is mostly conducted with a fixed set of documents (static corpora). However, in realistic scenarios, this is rarely the case and the documents to be retrieved are constantly updated and added. In this paper, we focus on Generative Retrievals (GR), which apply autoregressive language models to IR problems, and explore their adaptability and robustness in dynamic scenarios. We also conduct an extensive evaluation of computational and memory efficiency, crucial factors for real-world deployment of IR systems handling vast and ever-changing document collections. Our results on the StreamingQA benchmark demonstrate that GR is more adaptable to evolving knowledge (4 -- 11%), robust in learning knowledge with temporal information, and efficient in terms of inference FLOPs (x 2), indexing time (x 6), and storage footprint (x 4) compared to Dual Encoders (DE), which are commonly used in retrieval systems. Our paper highlights the potential of GR for future use in practical IR systems within dynamic environments.
Abstract（参考訳）: 情報検索(IR)の性能のベンチマークは、主に固定された文書(静的コーパス)を用いて行われる。しかし、現実的なシナリオでは、このようなケースはめったになく、取得するドキュメントは絶えず更新され、追加されます。本稿では,自己回帰型言語モデルをIR問題に適用する生成検索(GR)に注目し,動的シナリオにおける適応性と堅牢性について検討する。我々はまた、広範かつ絶え間なく変化する文書コレクションを扱うIRシステムの実環境展開における重要な要素である、計算とメモリ効率の広範な評価を行う。 StreamingQAベンチマークの結果、GRは進化的知識(4～11%)に適応し、時間的情報による学習知識が堅牢で、推論FLOPs(x2)、インデックス化時間(x6)、ストレージフットプリント(x4)の点で、検索システムで一般的に使用されるデュアルエンコーダ(DE)と比較して効率的であることが示されている。本稿では,動的環境における実用的な赤外線システムにおけるGRの可能性について述べる。

関連論文リスト

CREAM: Continual Retrieval on Dynamic Streaming Corpora with Adaptive Soft Memory [19.64051996386645]
CREAMは、メモリベースの連続検索のための自己教師型フレームワークである。教師なしの環境では、目に見えないトピックと見えないトピックの両方に適応します。 2つのベンチマークデータセットの実験は、CREAMが優れた適応性と精度を示すことを示した。
論文参考訳（メタデータ） (2026-01-06T04:47:49Z)
DynamicBench: Evaluating Real-Time Report Generation in Large Language Models [88.33301034147546]
提案するDynamicBenchは,大規模言語モデルのデータの保存と処理能力を評価するためのベンチマークである。外部文書の提供または保持のシナリオでモデルを評価することで、DynamicBenchは、最新の情報を独立して処理したり、コンテキスト拡張を利用する能力を効果的に測定する。 GPT4oを7.0%,GPT4oを5.8%,GPT4oを7.0%,GPT4oを5.8%で上回り,本手法の有効性を確認した。
論文参考訳（メタデータ） (2025-06-26T14:53:44Z)
RARE: Retrieval-Aware Robustness Evaluation for Retrieval-Augmented Generation Systems [35.47591417637136]
Retrieval-Augmented Generation (RAG)は、回答の正確性と事実性を高める。既存の評価では、これらのシステムが現実世界のノイズ、内部と外部の取得したコンテキストの衝突、あるいは急速に変化する事実にどのように対処するかを検査することはめったにない。本稿では,動的で時間に敏感なコーパス上でのストレステストクエリと文書摂動を共同で行う,統一されたフレームワークと大規模ベンチマークであるRetrieval-Aware Robustness Evaluation (RARE)を紹介する。
論文参考訳（メタデータ） (2025-06-01T02:42:36Z)
Context-Guided Dynamic Retrieval for Improving Generation Quality in RAG Models [2.9687381456164004]
意味理解と知識スケジューリングの効率化を図るための状態認識型動的知識検索機構を提案する。提案した構造は, GPT-4, GPT-4o, DeepSeek など,様々な大規模モデルで徹底的に評価されている。このアプローチはまた、意味的あいまいさとマルチドキュメント融合を含むタスクにおいて、強い堅牢性と生成一貫性を示す。
論文参考訳（メタデータ） (2025-04-28T02:50:45Z)
Efficient Dynamic Clustering-Based Document Compression for Retrieval-Augmented-Generation [16.6539993941399]
近年,大規模言語モデル(LLM)推論における知識注入手法として,検索・拡張生成(RAG)が広く採用されている。ドキュメント間関係のきめ細かい利用が制限されているため、現在のRAG実装では、取得したノイズと冗長性コンテンツに効果的に対処する上で、課題に直面している。本稿では,文書間関係を利用した動的クラスタリングに基づく文書圧縮フレームワーク(EDC2-RAG)を提案する。
論文参考訳（メタデータ） (2025-04-04T04:43:13Z)
Cross-Format Retrieval-Augmented Generation in XR with LLMs for Context-Aware Maintenance Assistance [6.16808916207942]
本稿では,大規模言語モデル(LLM)を統合した検索拡張生成システムの詳細な評価を行う。 BLEU と METEOR のスコアを用いて,応答速度や精度などの重要な指標を定量化する8つの LLM の性能評価を行った。その結果、システムがタイムリーかつ正確なレスポンスを提供する能力を評価し、メンテナンス操作を最適化するRAGフレームワークの可能性を強調した。
論文参考訳（メタデータ） (2025-02-21T17:19:39Z)
A Comprehensive Survey on Composed Image Retrieval [54.54527281731775]
Composed Image Retrieval (CIR)は、ユーザがマルチモーダルクエリを使ってターゲットイメージを検索できる、新しくて困難なタスクである。現在、この分野のタイムリーな概要を提供するため、CIRの包括的なレビューは行われていない。我々は、ACM TOIS、SIGIR、CVPRなど、トップカンファレンスやジャーナルで120以上の出版物から洞察を合成する。
論文参考訳（メタデータ） (2025-02-19T01:37:24Z)
Adapting to Non-Stationary Environments: Multi-Armed Bandit Enhanced Retrieval-Augmented Generation on Knowledge Graphs [23.357843519762483]
近年の研究では、検索-拡張生成フレームワークと知識グラフを組み合わせることで、大規模言語モデルの推論能力を強力に向上することが示されている。我々は多目的帯域拡張RAGフレームワークを導入し、多様な機能を持つ複数の検索手法をサポートする。本手法は,定常環境下での最先端性能を達成しつつ,非定常環境でのベースライン手法を著しく向上させる。
論文参考訳（メタデータ） (2024-12-10T15:56:03Z)
Developing Retrieval Augmented Generation (RAG) based LLM Systems from PDFs: An Experience Report [3.4632900249241874]
本稿では,PDF文書を主データ源とする検索拡張生成システム(RAG)の開発経験報告について述べる。 RAGアーキテクチャは、Large Language Models (LLM) の生成能力と情報検索の精度を組み合わせたものである。この研究の実際的な意味は、様々な分野における生成AIシステムの信頼性を高めることである。
論文参考訳（メタデータ） (2024-10-21T12:21:49Z)
Retriever-and-Memory: Towards Adaptive Note-Enhanced Retrieval-Augmented Generation [72.70046559930555]
本稿では,複雑なQAタスクに対する適応ノート拡張RAG(Adaptive Note-Enhanced RAG)と呼ばれる汎用RAGアプローチを提案する。具体的には、Adaptive-Noteは、知識の成長に関する包括的な視点を導入し、ノート形式で新しい情報を反復的に収集する。さらに,適切な知識探索を促進するために,適応的な音符ベースの停止探索戦略を用いて,「何を検索し,いつ停止するか」を判断する。
論文参考訳（メタデータ） (2024-10-11T14:03:29Z)
LightRAG: Simple and Fast Retrieval-Augmented Generation [12.86888202297654]
Retrieval-Augmented Generation (RAG) システムは、外部知識ソースを統合することで、大規模言語モデル(LLM)を強化する。既存のRAGシステムには、フラットなデータ表現への依存やコンテキスト認識の欠如など、大きな制限がある。テキストインデックスと検索プロセスにグラフ構造を組み込んだLightRAGを提案する。
論文参考訳（メタデータ） (2024-10-08T08:00:12Z)
From Matching to Generation: A Survey on Generative Information Retrieval [21.56093567336119]
生成情報検索(GenIR)は新たなパラダイムとして登場し,近年注目を集めている。本稿では,GenIRの最新研究動向を体系的にレビューすることを目的とする。
論文参考訳（メタデータ） (2024-04-23T09:05:37Z)
RAGGED: Towards Informed Design of Scalable and Stable RAG Systems [51.171355532527365]
Retrieval-augmented Generation (RAG)は、外部知識を統合することで言語モデルを強化する。 RAGGEDは、RAGシステムを体系的に評価するためのフレームワークである。
論文参考訳（メタデータ） (2024-03-14T02:26:31Z)
CorpusLM: Towards a Unified Language Model on Corpus for Knowledge-Intensive Tasks [20.390672895839757]
Retrieval-augmented Generation (RAG) は、事実精度を高めるための一般的なソリューションとして登場した。従来の検索モジュールは、大きなドキュメントインデックスと生成タスクとの切り離しに依存していることが多い。生成検索,クローズドブック生成,RAGを統合した統一言語モデルである textbfCorpusLM を提案する。
論文参考訳（メタデータ） (2024-02-02T06:44:22Z)
Analysis of the Memorization and Generalization Capabilities of AI Agents: Are Continual Learners Robust? [91.682459306359]
連続学習(CL)では、AIエージェントが動的環境下で非定常データストリームから学習する。本稿では,過去の知識を維持しつつ,動的環境への堅牢な一般化を実現するための新しいCLフレームワークを提案する。提案フレームワークの一般化と記憶性能を理論的に解析した。
論文参考訳（メタデータ） (2023-09-18T21:00:01Z)
Continual Learning for Generative Retrieval over Dynamic Corpora [115.79012933205756]
生成検索(GR)はパラメトリックモデルに基づいて関連文書の識別子(ドシデクス)を直接予測する。クエリに応答する能力を保ちながら、新しいドキュメントをインクリメンタルにインデックスする能力は、GRモデルを適用する上で不可欠である。我々は,CLEVERモデルのための新しい連続学習モデルを提案し,GRのための連続学習に2つの大きな貢献をした。
論文参考訳（メタデータ） (2023-08-29T01:46:06Z)
Building Interpretable and Reliable Open Information Retriever for New Domains Overnight [67.03842581848299]
情報検索は、オープンドメイン質問応答(QA)など、多くのダウンストリームタスクにとって重要な要素である。本稿では、エンティティ/イベントリンクモデルとクエリ分解モデルを用いて、クエリの異なる情報単位により正確にフォーカスする情報検索パイプラインを提案する。より解釈可能で信頼性が高いが,提案したパイプラインは,5つのIRおよびQAベンチマークにおける通過カバレッジと記述精度を大幅に向上することを示す。
論文参考訳（メタデータ） (2023-08-09T07:47:17Z)
Synergistic Interplay between Search and Large Language Models for Information Retrieval [141.18083677333848]
InteRにより、RMはLLM生成した知識コレクションを使用してクエリの知識を拡張することができる。 InteRは、最先端手法と比較して総合的に優れたゼロショット検索性能を実現する。
論文参考訳（メタデータ） (2023-05-12T11:58:15Z)
Incorporating Relevance Feedback for Information-Seeking Retrieval using Few-Shot Document Re-Ranking [56.80065604034095]
我々は,クエリとユーザが関連すると考えるドキュメントとの類似性に基づいて,文書を再参照するkNNアプローチを提案する。異なる統合戦略を評価するため、既存の4つの情報検索データセットを関連フィードバックシナリオに変換する。
論文参考訳（メタデータ） (2022-10-19T16:19:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。