論文の概要: A GenAI System for Improved FAIR Independent Biological Database Integration
- arxiv url: http://arxiv.org/abs/2506.17934v1
- Date: Sun, 22 Jun 2025 08:04:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.655802
- Title: A GenAI System for Improved FAIR Independent Biological Database Integration
- Title(参考訳): FAIR独立生物データベース統合のためのGenAIシステム
- Authors: Syed N. Sakib, Kallol Naha, Sajratul Y. Rubaiat, Hasan M. Jamil,
- Abstract要約: 実験的な自然言語に基づくクエリ処理システムを導入し,生物学データベースの発見,アクセス,クエリを可能にする。
FAIRBridgeは、クエリインテントを解釈し、関連するデータベースにマップし、実行可能なクエリを生成するAIの機能を活用する。
このシステムには、低品質のクエリ処理を緩和し、提供された情報の忠実度と応答性を確保するための堅牢なツールも含まれている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Life sciences research increasingly requires identifying, accessing, and effectively processing data from an ever-evolving array of information sources on the Linked Open Data (LOD) network. This dynamic landscape places a significant burden on researchers, as the quality of query responses depends heavily on the selection and semantic integration of data sources --processes that are often labor-intensive, error-prone, and costly. While the adoption of FAIR (Findable, Accessible, Interoperable, and Reusable) data principles has aimed to address these challenges, barriers to efficient and accurate scientific data processing persist. In this paper, we introduce FAIRBridge, an experimental natural language-based query processing system designed to empower scientists to discover, access, and query biological databases, even when they are not FAIR-compliant. FAIRBridge harnesses the capabilities of AI to interpret query intents, map them to relevant databases described in scientific literature, and generate executable queries via intelligent resource access plans. The system also includes robust tools for mitigating low-quality query processing, ensuring high fidelity and responsiveness in the information delivered. FAIRBridge's autonomous query processing framework enables users to explore alternative data sources, make informed choices at every step, and leverage community-driven crowd curation when needed. By providing a user-friendly, automated hypothesis-testing platform in natural English, FAIRBridge significantly enhances the integration and processing of scientific data, offering researchers a powerful new tool for advancing their inquiries.
- Abstract(参考訳): ライフサイエンスの研究はますます、Linked Open Data (LOD)ネットワーク上で進化し続ける情報ソースからのデータを特定し、アクセスし、効果的に処理する必要がある。
クエリ応答の質は、しばしば労働集約的でエラーが発生し、コストがかかるデータソース -- プロセス -- の選択とセマンティックな統合に大きく依存するためである。
FAIR(Findable、Accessible、Interoperable、Reusable)のデータ原則の採用は、これらの課題に対処することを目的としている。
本稿では、FAIR準拠でない場合でも、科学者が生物学的データベースを発見し、アクセスし、クエリすることを可能にするために設計された、実験的な自然言語ベースのクエリ処理システムであるFAIRBridgeを紹介する。
FAIRBridgeは、クエリインテントを解釈し、科学文献に記載された関連するデータベースにマッピングし、インテリジェントなリソースアクセス計画を通じて実行可能なクエリを生成するAIの機能を活用する。
このシステムには、低品質のクエリ処理を緩和し、提供された情報の忠実度と応答性を確保するための堅牢なツールも含まれている。
FAIRBridgeの自律的なクエリ処理フレームワークは、代替データソースを探索し、各ステップで情報選択を行い、必要に応じてコミュニティ主導のクラウドキュレーションを活用することを可能にする。
FAIRBridgeは、ユーザーフレンドリで自動化された仮説テストプラットフォームを自然言語で提供することによって、科学的データの統合と処理を大幅に強化し、研究者が質問を進めるための強力な新しいツールを提供する。
関連論文リスト
- ScIRGen: Synthesize Realistic and Large-Scale RAG Dataset for Scientific Research [15.983924435685553]
我々は科学的なQAと検索のためのデータセット生成フレームワークであるScrirGenを開発した。
私たちはこれを使って、現実的なクエリ、データセット、論文を備えた大規模科学的検索強化世代(RAG)データセットを作成します。
論文 参考訳(メタデータ) (2025-06-09T11:47:13Z) - InfoDeepSeek: Benchmarking Agentic Information Seeking for Retrieval-Augmented Generation [63.55258191625131]
InfoDeepSeekは、現実世界の動的Web環境でエージェント情報を求めるための新しいベンチマークである。
本稿では,決定性,難易度,多様性の基準を満たす課題クエリを構築するための体系的手法を提案する。
本研究では,情報探索結果の正確性,有用性,コンパクト性に関する詳細な指標を含む,動的エージェント情報探索に適した最初の評価フレームワークを開発する。
論文 参考訳(メタデータ) (2025-05-21T14:44:40Z) - iTRI-QA: a Toolset for Customized Question-Answer Dataset Generation Using Language Models for Enhanced Scientific Research [1.2411445143550854]
本稿では,iTRI (Interactive Trained Research Innovator) - QA (Interactive Trained Research Innovator) と呼ばれる,カスタマイズされた質問応答(QA)データセットの開発のためのツールを提案する。
提案手法は,キュレートされたQAデータセットと特殊な研究論文データセットを統合し,微調整されたLMを用いて応答の文脈的関連性と精度を向上させる。
このパイプラインは動的でドメイン固有のQAシステムを提供し、将来のLMデプロイメントに適用される。
論文 参考訳(メタデータ) (2025-01-27T23:38:39Z) - Agentic AI-Driven Technical Troubleshooting for Enterprise Systems: A Novel Weighted Retrieval-Augmented Generation Paradigm [0.0]
本稿では,企業の技術的トラブルシューティングに適したRAG(Weighted Retrieval-Augmented Generation)フレームワーク上に構築されたエージェントAIソリューションを提案する。
製品マニュアル、内部知識ベース、FAQ、トラブルシューティングガイドなどの検索ソースを動的に重み付けすることで、最も関連性の高いデータを優先順位付けする。
大規模エンタープライズデータセットに関する予備評価では、トラブルシューティングの精度を改善し、解決時間を短縮し、さまざまな技術的課題に適応する上で、フレームワークの有効性が示されている。
論文 参考訳(メタデータ) (2024-12-16T17:32:38Z) - Synthetic Data Generation with Large Language Models for Personalized Community Question Answering [47.300506002171275]
既存のデータセットであるSE-PQAに基づいてSy-SE-PQAを構築します。
以上の結果から,LCMはユーザのニーズに合わせてデータを生成する可能性が高いことが示唆された。
合成データは、たとえ生成されたデータが誤った情報を含むとしても、人書きのトレーニングデータを置き換えることができる。
論文 参考訳(メタデータ) (2024-10-29T16:19:08Z) - Enhancing Knowledge Retrieval with In-Context Learning and Semantic Search through Generative AI [3.9773527114058855]
本稿では,大規模言語モデルの生成能力とベクトルデータベースの高速かつ正確な検索能力を組み合わせた新しい手法を提案する。
開発したGTR(Generative Text Retrieval)は,非構造化データと構造化データの両方に適用可能である。
改良されたモデルであるGenerative Tabular Text Retrieval (GTR-T) は、大規模データベースクエリの効率を実証した。
論文 参考訳(メタデータ) (2024-06-13T23:08:06Z) - Large Language Models for Information Retrieval: A Survey [58.30439850203101]
情報検索は、項ベースの手法から高度なニューラルモデルとの統合へと進化してきた。
近年の研究では、大規模言語モデル(LLM)を活用してIRシステムの改善が試みられている。
LLMとIRシステムの合流点を探索し、クエリリライト、リトリバー、リランカー、リーダーといった重要な側面を含む。
論文 参考訳(メタデータ) (2023-08-14T12:47:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。