論文の概要: SpectraQuery: A Hybrid Retrieval-Augmented Conversational Assistant for Battery Science
- arxiv url: http://arxiv.org/abs/2601.09036v1
- Date: Wed, 14 Jan 2026 00:01:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-15 18:59:20.199969
- Title: SpectraQuery: A Hybrid Retrieval-Augmented Conversational Assistant for Battery Science
- Title(参考訳): SpectraQuery: バッテリーサイエンスのためのハイブリッド検索拡張会話アシスタント
- Authors: Sreya Vangara, Jagjit Nanda, Yan-Kai Tzeng, Eric Darve,
- Abstract要約: 本稿では,ハイブリッド自然言語クエリフレームワークSpectraQueryを紹介する。
これはリレーショナルラマン分光データベースとベクトルインデクシングされた科学文献コーパスを統合している。
これは、数値的な証拠と機械的な説明を統一する引用された答えを生み出している。
- 参考スコア(独自算出の注目度): 2.228103176934598
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scientific reasoning increasingly requires linking structured experimental data with the unstructured literature that explains it, yet most large language model (LLM) assistants cannot reason jointly across these modalities. We introduce SpectraQuery, a hybrid natural-language query framework that integrates a relational Raman spectroscopy database with a vector-indexed scientific literature corpus using a Structured and Unstructured Query Language (SUQL)-inspired design. By combining semantic parsing with retrieval-augmented generation, SpectraQuery translates open-ended questions into coordinated SQL and literature retrieval operations, producing cited answers that unify numerical evidence with mechanistic explanation. Across SQL correctness, answer groundedness, retrieval effectiveness, and expert evaluation, SpectraQuery demonstrates strong performance: approximately 80 percent of generated SQL queries are fully correct, synthesized answers reach 93-97 percent groundedness with 10-15 retrieved passages, and battery scientists rate responses highly across accuracy, relevance, grounding, and clarity (4.1-4.6/5). These results show that hybrid retrieval architectures can meaningfully support scientific workflows by bridging data and discourse for high-volume experimental datasets.
- Abstract(参考訳): 科学的推論は、構造化された実験データと、それを説明する構造化されていない文献をリンクする必要があるが、ほとんどの大規模言語モデル(LLM)アシスタントは、これらのモダリティを合理化できない。
我々は、Relation Raman spectroscopyデータベースと、Structured and Unstructured Query Language (SUQL) にインスパイアされた設計を用いて、ベクトルインデックスの科学文献コーパスを統合するハイブリッド自然言語クエリフレームワークであるSpectraQueryを紹介した。
セマンティックパーシングと検索拡張生成を組み合わせることで、SpectraQueryはオープンな質問をコーディネートしたSQLと文献検索操作に変換し、数値的な証拠と機械的な説明を統一する引用された回答を生成する。
生成したSQLクエリの約80%が完全に正確で、合成された回答は10~15回検索されたパスで93~97%の基底性に達し、バッテリー科学者は精度、関連性、グラウンド化、明確度(4.1~4.6/5)にわたって応答を高く評価している。
これらの結果から,ハイブリッド検索アーキテクチャは,高ボリュームな実験データセットに対して,データと談話をブリッジすることで,科学的ワークフローを有意義に支援できることが示唆された。
関連論文リスト
- From Questions to Queries: An AI-powered Multi-Agent Framework for Spatial Text-to-SQL [0.4499833362998488]
単一エージェントアプローチは、空間的クエリのセマンティックおよび構文的複雑さにしばしば苦労する。
本稿では,自然言語質問を空間的クエリに正確に翻訳するためのマルチエージェントフレームワークを提案する。
我々は,非空間的KaggleDBQAベンチマークと包括的SpatialQAベンチマークを用いて,本システムの評価を行った。
論文 参考訳(メタデータ) (2025-10-23T22:58:17Z) - MetaboT: AI-based agent for natural language-based interaction with metabolomics knowledge graphs [3.8352874653625286]
ユーザ質問を知識グラフを操作するためのSPARQLセマンティッククエリ言語に翻訳するAIシステムを開発した。
植物天然物の大規模公開知識グラフである実験天然物知識グラフ(ENG)を用いて,その有効性を実証した。
論文 参考訳(メタデータ) (2025-10-02T07:05:29Z) - Who Gets Cited Most? Benchmarking Long-Context Language Models on Scientific Articles [81.89404347890662]
SciTrekは、科学論文を用いた大規模言語モデル(LLM)の長文推論能力を評価するために設計された、新しい質問応答ベンチマークである。
本分析により,モデルの基本的数値演算を行ない,特定の情報を長い文脈で正確に特定する能力において,系統的な欠点が明らかとなった。
論文 参考訳(メタデータ) (2025-09-25T11:36:09Z) - HyST: LLM-Powered Hybrid Retrieval over Semi-Structured Tabular Data [0.4779196219827507]
HyST(Hybrid search over Semi-structured Tabular data)は、構造化フィルタリングとセマンティック埋め込み検索を組み合わせたハイブリッド検索フレームワークである。
半構造化ベンチマークにおいてHySTがトラジショナルベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2025-08-25T14:06:27Z) - HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2480439325792]
HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。
システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文 参考訳(メタデータ) (2025-08-01T20:30:42Z) - RAISE: Reasoning Agent for Interactive SQL Exploration [47.77323087050061]
本稿では,スキーマリンク,クエリ生成,反復的改善を1つのエンドツーエンドコンポーネントに統一する新しいフレームワークを提案する。
本手法は、不慣れなデータベースを扱う際に、人間がどう答えるかをエミュレートする。
論文 参考訳(メタデータ) (2025-06-02T03:07:08Z) - BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval [54.54576644403115]
BRIGHTは、関係する文書を検索するために、集中的推論を必要とする最初のテキスト検索ベンチマークである。
私たちのデータセットは、経済学、心理学、数学、コーディングなど、さまざまな領域にまたがる1,384の現実世界のクエリで構成されています。
クエリに関する明示的な推論を取り入れることで、検索性能が最大12.2ポイント向上することを示す。
論文 参考訳(メタデータ) (2024-07-16T17:58:27Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。