論文の概要: A Retrieval-Augmented Generation Framework for Academic Literature Navigation in Data Science
- arxiv url: http://arxiv.org/abs/2412.15404v1
- Date: Thu, 19 Dec 2024 21:14:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-23 19:50:47.670686
- Title: A Retrieval-Augmented Generation Framework for Academic Literature Navigation in Data Science
- Title(参考訳): データサイエンスにおける学術文献ナビゲーションのための検索支援フレームワーク
- Authors: Ahmet Yasin Aytar, Kemal Kilic, Kamer Kaya,
- Abstract要約: 本稿では、データサイエンティストが正確な文脈に関連のある学術リソースにアクセスするのを支援するために設計された人工知能(AI)ベースの拡張検索・拡張生成アプリケーションを提案する。
このAIを利用したアプリケーションは、情報抽出のための書誌データ生成(GROBID)技術を含む高度な技術を統合している。
Retrieval-Augmented Generation Assessment System (RAGAS) フレームワークを用いた総合評価では,重要な指標の大幅な改善が示されている。
- 参考スコア(独自算出の注目度): 2.5398014196797614
- License:
- Abstract: In the rapidly evolving field of data science, efficiently navigating the expansive body of academic literature is crucial for informed decision-making and innovation. This paper presents an enhanced Retrieval-Augmented Generation (RAG) application, an artificial intelligence (AI)-based system designed to assist data scientists in accessing precise and contextually relevant academic resources. The AI-powered application integrates advanced techniques, including the GeneRation Of BIbliographic Data (GROBID) technique for extracting bibliographic information, fine-tuned embedding models, semantic chunking, and an abstract-first retrieval method, to significantly improve the relevance and accuracy of the retrieved information. This implementation of AI specifically addresses the challenge of academic literature navigation. A comprehensive evaluation using the Retrieval-Augmented Generation Assessment System (RAGAS) framework demonstrates substantial improvements in key metrics, particularly Context Relevance, underscoring the system's effectiveness in reducing information overload and enhancing decision-making processes. Our findings highlight the potential of this enhanced Retrieval-Augmented Generation system to transform academic exploration within data science, ultimately advancing the workflow of research and innovation in the field.
- Abstract(参考訳): データサイエンスの急速に発展する分野では、学術文学の幅広い分野を効率的にナビゲートすることが、情報的な意思決定と革新に不可欠である。
本稿では,データ科学者が精密で文脈的に関係のある学術資料にアクセスするのを支援するために,人工知能(AI)をベースとしたRAG(Retrieval-Augmented Generation)アプリケーションを提案する。
このAIを利用したアプリケーションは、書誌情報を抽出するGROBID(GeneRation of BIbliographic Data)技術、微調整された埋め込みモデル、セマンティックチャンキング、抽象ファースト検索方法など、高度な技術を統合し、検索された情報の妥当性と精度を大幅に向上させる。
このAIの実装は、学術文献ナビゲーションの課題に特に対処する。
Retrieval-Augmented Generation Assessment System (RAGAS) フレームワークを用いた総合評価では、特にコンテキスト関連性(Context Relevance)が大幅に改善され、情報過剰の低減と意思決定プロセスの強化においてシステムの有効性が強調されている。
我々の研究は、データサイエンスにおける学術的な探索を変革し、究極的にはこの分野における研究とイノベーションのワークフローを前進させるために、この強化された検索強化生成システムの可能性を強調した。
関連論文リスト
- Leveraging Retrieval-Augmented Generation for Persian University Knowledge Retrieval [2.749898166276854]
本稿では,Large Language Models (LLM) を用いたレトリーバル拡張生成(RAG)パイプラインを用いた革新的なアプローチを提案する。
大学公式Webページからデータを体系的に抽出することにより、ユーザクエリに対する正確で文脈的に関連する応答を生成する。
実験の結果, 生成した応答の精度と関連性に大きな改善が認められた。
論文 参考訳(メタデータ) (2024-11-09T17:38:01Z) - Deploying Large Language Models With Retrieval Augmented Generation [0.21485350418225244]
Retrieval Augmented Generationは、大規模言語モデルのトレーニングセット外のデータソースからの知識を統合するための重要なアプローチとして登場した。
本稿では,LLMとRAGを統合して情報検索を行うパイロットプロジェクトの開発とフィールドテストから得られた知見について述べる。
論文 参考訳(メタデータ) (2024-11-07T22:11:51Z) - Machine Learning Innovations in CPR: A Comprehensive Survey on Enhanced Resuscitation Techniques [52.71395121577439]
心肺蘇生(CPR)における機械学習(ML)と人工知能(AI)の変革的役割について検討する。
再現結果を改善する上で、予測モデリング、AI強化デバイス、リアルタイムデータ分析の影響を強調している。
本稿は、この新興分野における現在の応用、課題、今後の方向性に関する包括的概要、分類、および批判的分析を提供する。
論文 参考訳(メタデータ) (2024-11-03T18:01:50Z) - A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions [0.0]
RAGは、検索機構と生成言語モデルを組み合わせることで、出力の精度を高める。
近年の研究では, 検索効率向上のための新しい手法が注目されている。
RAGモデルの堅牢性向上に焦点をあてた今後の研究方向性が提案されている。
論文 参考訳(メタデータ) (2024-10-03T22:29:47Z) - DNS-Rec: Data-aware Neural Architecture Search for Recommender Systems [79.76519917171261]
本稿では,SRS(Sequential Recommender Systems)における計算オーバーヘッドと資源非効率性について述べる。
本稿では, プルーニング法と高度なモデル設計を組み合わせた革新的な手法を提案する。
我々の主な貢献は、リコメンダシステム(DNS-Rec)のためのデータ対応ニューラルアーキテクチャ検索の開発である。
論文 参考訳(メタデータ) (2024-02-01T07:22:52Z) - Harnessing Retrieval-Augmented Generation (RAG) for Uncovering Knowledge
Gaps [0.0]
本研究は,一貫した精度93%の関連提案を生成するためのRAGシステムの有効性を実証した。
その結果,知識ギャップを識別し,理解することの価値が強調され,今後の課題が導かれる。
論文 参考訳(メタデータ) (2023-12-12T23:22:57Z) - The Efficiency Spectrum of Large Language Models: An Algorithmic Survey [54.19942426544731]
LLM(Large Language Models)の急速な成長は、様々なドメインを変換する原動力となっている。
本稿では,LLMのエンドツーエンドのアルゴリズム開発に不可欠な多面的効率性について検討する。
論文 参考訳(メタデータ) (2023-12-01T16:00:25Z) - A Study on the Implementation of Generative AI Services Using an
Enterprise Data-Based LLM Application Architecture [0.0]
本研究では,Large Language Models (LLM) アプリケーションアーキテクチャを用いて生成AIサービスを実装する手法を提案する。
この研究は、不十分なデータの問題を軽減するための戦略を練り上げ、カスタマイズされたソリューションを提供している。
この研究の重要な貢献は、検索型拡張世代(RAG)モデルの開発である。
論文 参考訳(メタデータ) (2023-09-03T07:03:17Z) - Iterative Zero-Shot LLM Prompting for Knowledge Graph Construction [104.29108668347727]
本稿では,最新の生成型大規模言語モデルの可能性を活用する,革新的な知識グラフ生成手法を提案する。
このアプローチは、新しい反復的なゼロショットと外部知識に依存しない戦略を含むパイプラインで伝達される。
我々は、我々の提案がスケーラブルで多目的な知識グラフ構築に適したソリューションであり、異なる新しい文脈に適用できると主張している。
論文 参考訳(メタデータ) (2023-07-03T16:01:45Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Retrieval-Enhanced Machine Learning [110.5237983180089]
本稿では,いくつかの既存モデルを含む汎用的な検索強化機械学習フレームワークについて述べる。
REMLは情報検索の慣例に挑戦し、最適化を含む中核領域における新たな進歩の機会を提示している。
REMLリサーチアジェンダは、情報アクセス研究の新しいスタイルの基礎を築き、機械学習と人工知能の進歩への道を開く。
論文 参考訳(メタデータ) (2022-05-02T21:42:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。