論文の概要: Retrieval-Augmented Question Answering over Scientific Literature for the Electron-Ion Collider
- arxiv url: http://arxiv.org/abs/2604.02259v1
- Date: Thu, 02 Apr 2026 16:52:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.928608
- Title: Retrieval-Augmented Question Answering over Scientific Literature for the Electron-Ion Collider
- Title(参考訳): 電子イオン衝突型加速器の科学的研究を巡って
- Authors: Tina. J. Jat, T. Ghosh, Karthik Suresh,
- Abstract要約: 我々はRetrieval Augmented Generation (RAG)にインスパイアされたQ&Aアプリケーションを開発した。
それは、Electron-Ion Collider (EIC)実験に関連するarXivの記事にインデックスされた社内データベースで構成されている。
このセットアップはデータプライバシを促進し、公開前の科学データや情報をパブリックドメインに送ることを避ける。
- 参考スコア(独自算出の注目度): 0.2580765958706854
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: To harness the power of Language Models in answering domain specific specialized technical questions, Retrieval Augmented Generation (RAG) is been used widely. In this work, we have developed a Q\&A application inspired by the Retrieval Augmented Generation (RAG), which is comprised of an in-house database indexed on the arXiv articles related to the Electron-Ion Collider (EIC) experiment - one of the largest international scientific collaboration and incorporated an open-source LLaMA model for answer generation. This is an extension to it's proceeding application built on proprietary model and Cloud-hosted external knowledge-base for the EIC experiment. This locally-deployed RAG-system offers a cost-effective, resource-constraint alternative solution to build a RAG-assisted Q\&A application on answering domain-specific queries in the field of experimental nuclear physics. This set-up facilitates data-privacy, avoids sending any pre-publication scientific data and information to public domain. Future improvement will expand the knowledge base to encompass heterogeneous EIC-related publications and reports and upgrade the application pipeline orchestration to the LangGraph framework.
- Abstract(参考訳): ドメイン固有の専門的疑問に答える上で,言語モデルの力を利用するために,検索拡張生成(RAG)が広く利用されている。
本研究では,Electron-Ion Collider (EIC) 実験に関するarXivの論文にインデックス付けされた社内データベースから構築したRetrieval Augmented Generation (RAG) にインスパイアされたQ\&Aアプリケーションを開発し,回答生成のためのオープンソースのLLaMAモデルを組み込んだ。
これは、プロプライエタリなモデルとクラウドがホストする外部知識ベースのEIC実験上に構築された、進行中のアプリケーションの拡張である。
このローカルにデプロイされたRAGシステムは、実験核物理学の分野におけるドメイン固有クエリに応答するRAG支援Q\&Aアプリケーションを構築するための費用効率の良いリソース制約の代替ソリューションを提供する。
このセットアップはデータプライバシを促進し、公開前の科学データや情報をパブリックドメインに送ることを避ける。
今後、知識ベースを拡張して、異種EIC関連のパブリッシュとレポートを包含し、アプリケーションパイプラインオーケストレーションをLangGraphフレームワークにアップグレードする予定である。
関連論文リスト
- MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations [0.0]
大規模な科学的コラボレーションは、膨大な内部文書のコーパスを生み出している。
我々は、物理解析に関する特定の文脈対応の質問に答えるように設計された、レトリーバル拡張生成(RAG)ベースのシステムであるMITRAのプロトタイプを提案する。
MITRAは、内部データベースからの文書検索にSeleniumを使用した新しい自動パイプラインと、高忠実なテキスト抽出のためのレイアウト解析を備えたOCRを採用している。
論文 参考訳(メタデータ) (2026-03-10T15:28:35Z) - MARVEL: A Multi Agent-based Research Validator and Enabler using Large Language Models [2.0725712989738994]
本稿では,ドメイン認識型質問応答のためのフレームワークMARVELについて紹介する。
MARVELは、簡単なクエリのための高速パスと、より意図的なDeepSearchモードを組み合わせることで、検索拡張生成とMonte Carlo Tree Searchを統合している。
我々はこの枠組みをレーザー干渉計重力波観測に関する重力波研究の文脈に応用した。
論文 参考訳(メタデータ) (2026-01-06T21:47:22Z) - Helios: A Foundational Language Model for Smart Energy Knowledge Reasoning and Application [7.294864378911716]
Heliosは、スマートエネルギードメインに適した、大きな言語モデルである。
Enersysは、エンドツーエンドのデータセット構築のためのマルチエージェント協調フレームワークである。
スマートエネルギーシナリオでLLMを評価するためのベンチマークであるEnerBenchをリリースする。
論文 参考訳(メタデータ) (2025-12-22T11:43:35Z) - Domain-Specific Data Generation Framework for RAG Adaptation [58.20906914537952]
Retrieval-Augmented Generation (RAG)は、大規模言語モデルの言語理解と推論能力と外部検索を組み合わせ、ドメイン基底応答を可能にする。
本稿では,様々なRAG適応手法に合わせて,ドメイン基底型質問応答コンテキスト(QAC)トリプルを生成するフレームワークであるRAGenを提案する。
論文 参考訳(メタデータ) (2025-10-13T09:59:49Z) - Retrieval-Augmented Generation for Electrocardiogram-Language Models [27.75347676208195]
生成型心電図言語モデル(ELM)は、ECG信号に条件付きテキスト応答を生成することができる。
Retrieval-Augmented Generation (RAG)は幻覚の低減と自然言語生成の改善を支援する
論文 参考訳(メタデータ) (2025-09-30T20:32:34Z) - GeoGPT-RAG Technical Report [48.23789135946953]
GeoGPTは、地球科学の研究を進めるために開発されたオープンな大規模言語モデルシステムである。
RAGは、外部知識ソースから取得した関連情報を出力する。
RAGは、地質学的コンテンツ用にキュレーションされた特殊なコーパスであるGeoGPT Libraryから、RAGを使用して描画する。
論文 参考訳(メタデータ) (2025-08-18T08:29:22Z) - HiPerRAG: High-Performance Retrieval Augmented Generation for Scientific Insights [72.82973609312178]
HiPerRAGは360万以上の科学論文から知識をインデクシングし取り出すワークフローである。
コアとなるのはマルチモーダル文書解析のための高スループットモデルであるOreoと、クエリ対応エンコーダの微調整アルゴリズムであるColTrastだ。
HiPerRAGは、既存の科学的質問応答ベンチマークと、この研究で導入された2つの新しいベンチマークで堅牢なパフォーマンスを提供する。
論文 参考訳(メタデータ) (2025-05-07T22:50:23Z) - Developing Retrieval Augmented Generation (RAG) based LLM Systems from PDFs: An Experience Report [3.4632900249241874]
本稿では,PDF文書を主データ源とする検索拡張生成システム(RAG)の開発経験報告について述べる。
RAGアーキテクチャは、Large Language Models (LLM) の生成能力と情報検索の精度を組み合わせたものである。
この研究の実際的な意味は、様々な分野における生成AIシステムの信頼性を高めることである。
論文 参考訳(メタデータ) (2024-10-21T12:21:49Z) - Multi-Source Knowledge Pruning for Retrieval-Augmented Generation: A Benchmark and Empirical Study [45.69867169347836]
Retrieval-augmented Generation (RAG) は、大規模言語モデル(LLM)の幻覚を、外部知識の統合によって緩和するための効果的なアプローチである。
本稿では,多様な領域にまたがる構造化知識と非構造化知識を組み合わせたベンチマークデータセットを標準化する。
また,マルチグラニュラリティプルーニング戦略を主特徴とする,プラグアンドプレイのRAGフレームワークである textbfPruningRAG も開発している。
論文 参考訳(メタデータ) (2024-09-03T03:31:37Z) - REAR: A Relevance-Aware Retrieval-Augmented Framework for Open-Domain Question Answering [115.72130322143275]
REAR(Relevance-Aware Retrieval-augmented approach for open-domain Question answering, QA)
我々は,特殊な設計のアセスメントモジュールを組み込むことで,LLMベースのRAGシステムのための新しいアーキテクチャを開発する。
オープンドメインの4つのQAタスクの実験では、REARは以前の競争力のあるRAGアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-02-27T13:22:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。