論文の概要: Retrieval-Augmented Generation for AI-Generated Content: A Survey
- arxiv url: http://arxiv.org/abs/2402.19473v1
- Date: Thu, 29 Feb 2024 18:59:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-01 13:16:12.523035
- Title: Retrieval-Augmented Generation for AI-Generated Content: A Survey
- Title(参考訳): AI生成コンテンツの検索拡張生成:サーベイ
- Authors: Penghao Zhao, Hailin Zhang, Qinhan Yu, Zhengren Wang, Yunteng Geng,
Fangcheng Fu, Ling Yang, Wentao Zhang, Bin Cui
- Abstract要約: このような課題に対処するためのパラダイムとして,レトリーバル拡張生成(RAG)が登場している。
RAGは情報検索プロセスを導入し、利用可能なデータストアから関連オブジェクトを検索することでAIGC結果を強化する。
本稿では,RAG手法をAIGCシナリオに統合する既存の取り組みを概観的にレビューする。
- 参考スコア(独自算出の注目度): 36.577189818885486
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of Artificial Intelligence Generated Content (AIGC) has been
facilitated by advancements in model algorithms, scalable foundation model
architectures, and the availability of ample high-quality datasets. While AIGC
has achieved remarkable performance, it still faces challenges, such as the
difficulty of maintaining up-to-date and long-tail knowledge, the risk of data
leakage, and the high costs associated with training and inference.
Retrieval-Augmented Generation (RAG) has recently emerged as a paradigm to
address such challenges. In particular, RAG introduces the information
retrieval process, which enhances AIGC results by retrieving relevant objects
from available data stores, leading to greater accuracy and robustness. In this
paper, we comprehensively review existing efforts that integrate RAG technique
into AIGC scenarios. We first classify RAG foundations according to how the
retriever augments the generator. We distill the fundamental abstractions of
the augmentation methodologies for various retrievers and generators. This
unified perspective encompasses all RAG scenarios, illuminating advancements
and pivotal technologies that help with potential future progress. We also
summarize additional enhancements methods for RAG, facilitating effective
engineering and implementation of RAG systems. Then from another view, we
survey on practical applications of RAG across different modalities and tasks,
offering valuable references for researchers and practitioners. Furthermore, we
introduce the benchmarks for RAG, discuss the limitations of current RAG
systems, and suggest potential directions for future research. Project:
https://github.com/hymie122/RAG-Survey
- Abstract(参考訳): aigc(artificial intelligence generated content)の開発は、モデルアルゴリズムの進歩、スケーラブルな基盤モデルアーキテクチャ、豊富な高品質データセットの可用性によって促進されている。
AIGCは目覚ましいパフォーマンスを達成したが、最新知識と長期知識の維持の難しさ、データ漏洩のリスク、トレーニングと推論に関連する高コストなど、依然として課題に直面している。
Retrieval-Augmented Generation (RAG) はそのような課題に対処するためのパラダイムとして最近登場した。
特に、RAGは情報検索プロセスを導入し、関連するオブジェクトを利用可能なデータストアから取得することでAIGC結果を強化し、精度と堅牢性を高める。
本稿では,RAG手法をAIGCシナリオに統合する既存の取り組みを概観的にレビューする。
まず、RAGファウンデーションを、レトリバーがジェネレータをどのように拡張するかに応じて分類する。
各種レトリバーおよびジェネレータのための拡張手法の基礎的抽象化を蒸留する。
この統合された視点は、すべてのRAGシナリオを包含し、将来の進歩に役立つ進歩と重要な技術を示します。
また、RAGシステムの効率的なエンジニアリングと実装を容易にするため、RAGのさらなる拡張手法についても要約する。
また,異なるモダリティやタスクにまたがるragの実践的応用について検討し,研究者や実践者に貴重な資料を提供する。
さらに、RAGのベンチマークを導入し、現在のRAGシステムの限界について議論し、今後の研究の方向性を提案する。
プロジェクト:https://github.com/hymie122/RAG-Survey
関連論文リスト
- REAR: A Relevance-Aware Retrieval-Augmented Framework for Open-Domain
Question Answering [122.62012375722124]
既存の手法では,大規模言語モデル (LLM) は検索した文書の関連性を正確に評価することはできない。
Relevance-Aware Retrieval-augmented approach for open- domain question answering (QA)を提案する。
論文 参考訳(メタデータ) (2024-02-27T13:22:51Z) - Distillation Enhanced Generative Retrieval [96.69326099136289]
生成的検索はテキスト検索において有望な新しいパラダイムであり、関連する通路の識別子文字列を検索対象として生成する。
本研究は, 蒸留による生成的検索をさらに促進するための有効な方向を特定し, DGR という名称の実行可能なフレームワークを提案する。
本研究では,4つの公開データセットに対して実験を行い,DGRが生成的検索手法の最先端性能を達成することを示す。
論文 参考訳(メタデータ) (2024-02-16T15:48:24Z) - RAG-Fusion: a New Take on Retrieval-Augmented Generation [0.0]
Infineonは、エンジニア、アカウントマネージャ、顧客が迅速に製品情報を取得する必要性を特定している。
この研究は人工知能(AI)と自然言語処理(NLP)の応用において大きな進歩をみせている。
論文 参考訳(メタデータ) (2024-01-31T22:06:07Z) - CRUD-RAG: A Comprehensive Chinese Benchmark for Retrieval-Augmented
Generation of Large Language Models [55.47070014913373]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の能力を高める技術である。
本稿では,大規模かつ包括的なベンチマークを構築し,様々なRAGアプリケーションシナリオにおけるRAGシステムのすべてのコンポーネントを評価する。
論文 参考訳(メタデータ) (2024-01-30T14:25:32Z) - The Power of Noise: Redefining Retrieval for RAG Systems [20.22211173429561]
Retrieval-Augmented Generation (RAG) システムは従来のLarge Language Models (LLM) よりも大幅に進歩している。
本稿では,有効なRAGのプロンプト定式化のために,検索者が保持すべき特徴について分析する。
無関係な文書を含むと、予想外に30%以上の精度で性能を向上できることがわかった。
論文 参考訳(メタデータ) (2024-01-26T14:14:59Z) - From RAG to QA-RAG: Integrating Generative AI for Pharmaceutical
Regulatory Compliance Process [0.0]
製薬業界における規制の遵守は、複雑で明るいガイドラインを通じてナビゲートする必要がある。
これらの課題に対処するため,本研究では,生成型AIと検索型拡張生成(RAG)手法を紹介する。
本稿では,QA-RAGの構造と性能評価について詳述し,規制コンプライアンス領域の可能性を強調した。
論文 参考訳(メタデータ) (2024-01-26T08:23:29Z) - Retrieval-Augmented Generation for Large Language Models: A Survey [19.139461618363605]
大きな言語モデル(LLM)は重要な能力を示すが、幻覚、時代遅れの知識、不透明で追跡不能な推論プロセスといった課題に直面している。
Retrieval-Augmented Generation (RAG) は,外部データベースからの知識を取り入れた,有望なソリューションとして登場した。
論文 参考訳(メタデータ) (2023-12-18T07:47:33Z) - ARES: An Automated Evaluation Framework for Retrieval-Augmented
Generation Systems [50.82251875013377]
ARESは軽量LM判定器を微調整し、個々のRAG成分の品質を評価する。
予測駆動推論(PPI)のための人間アノテーション付きデータポイントの小さなセットの利用
ARESは、数百の人間のアノテーションを使用して、RAGシステムを正確に評価する。
論文 参考訳(メタデータ) (2023-11-16T00:39:39Z) - A Comprehensive Survey of AI-Generated Content (AIGC): A History of
Generative AI from GAN to ChatGPT [63.58711128819828]
ChatGPTおよびその他の生成AI(GAI)技術は、人工知能生成コンテンツ(AIGC)のカテゴリに属している。
AIGCの目標は、コンテンツ作成プロセスをより効率的かつアクセスしやすくし、高品質なコンテンツをより高速に生産できるようにすることである。
論文 参考訳(メタデータ) (2023-03-07T20:36:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。