論文の概要: eSapiens: A Real-World NLP Framework for Multimodal Document Understanding and Enterprise Knowledge Processing
- arxiv url: http://arxiv.org/abs/2506.16768v1
- Date: Fri, 20 Jun 2025 06:07:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.35356
- Title: eSapiens: A Real-World NLP Framework for Multimodal Document Understanding and Enterprise Knowledge Processing
- Title(参考訳): eSapiens: マルチモーダル文書理解と企業知識処理のための実世界のNLPフレームワーク
- Authors: Isaac Shi, Zeyuan Li, Wenli Wang, Lewei He, Yang Yang, Tianyu Shi,
- Abstract要約: 企業環境での質問応答システムeSapiensを紹介する。
eSapiensは、二重モジュールアーキテクチャを介して構造化データベースと非構造化コーパスをブリッジする。
我々は、RAGTruthベンチマークでeSapiensを評価し、完全性、幻覚、文脈利用といった重要な側面における性能を分析した。
- 参考スコア(独自算出の注目度): 6.450269621190948
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce eSapiens, a unified question-answering system designed for enterprise settings, which bridges structured databases and unstructured textual corpora via a dual-module architecture. The system combines a Text-to-SQL planner with a hybrid Retrieval-Augmented Generation (RAG) pipeline, enabling natural language access to both relational data and free-form documents. To enhance answer faithfulness, the RAG module integrates dense and sparse retrieval, commercial reranking, and a citation verification loop that ensures grounding consistency. We evaluate eSapiens on the RAGTruth benchmark across five leading large language models (LLMs), analyzing performance across key dimensions such as completeness, hallucination, and context utilization. Results demonstrate that eSapiens outperforms a FAISS baseline in contextual relevance and generation quality, with optional strict-grounding controls for high-stakes scenarios. This work provides a deployable framework for robust, citation-aware question answering in real-world enterprise applications.
- Abstract(参考訳): eSapiensはエンタープライズ環境向けに設計された,構造化データベースと非構造化テキストコーパスをデュアルモジュールアーキテクチャを介してブリッジする統合質問応答システムである。
このシステムは、Text-to-SQLプランナとハイブリッドのRetrieval-Augmented Generation (RAG)パイプラインを組み合わせることで、リレーショナルデータとフリーフォームドキュメントの両方への自然言語アクセスを可能にする。
回答の忠実性を高めるため、RAGモジュールは密集したスパース検索、商業的な再ランク、基底一貫性を保証する引用検証ループを統合している。
RAGTruthベンチマークのeSapiensを5つの主要言語モデル(LLM)で評価し、完全性、幻覚、文脈利用といった重要な側面における性能を分析した。
その結果、eSapiensはFAISSのベースラインを文脈的関連性および生成品質で上回り、ハイテイクシナリオの厳格な接地制御をオプションで行うことができた。
この作業は、実世界のエンタープライズアプリケーションで堅牢で引用対応の質問応答のためのデプロイ可能なフレームワークを提供する。
関連論文リスト
- HM-RAG: Hierarchical Multi-Agent Multimodal Retrieval Augmented Generation [11.53083922927901]
HM-RAGは階層型マルチエージェントマルチモーダルRAGフレームワークである。
構造化、非構造化、グラフベースのデータ間での動的知識合成のための協調知能の先駆者である。
論文 参考訳(メタデータ) (2025-04-13T06:55:33Z) - OmniParser V2: Structured-Points-of-Thought for Unified Visual Text Parsing and Its Generality to Multimodal Large Language Models [58.45517851437422]
VsTP(Visually-situated text parsing)は、自動化された文書理解の需要が高まり、最近顕著な進歩を遂げている。
既存のソリューションは、タスク固有のアーキテクチャと個々のタスクの目的に依存していることが多い。
本稿では,テキストスポッティング,キー情報抽出,テーブル認識,レイアウト解析など,VsTPの典型的なタスクを統一する汎用モデルであるOmni V2を紹介する。
論文 参考訳(メタデータ) (2025-02-22T09:32:01Z) - Transparent NLP: Using RAG and LLM Alignment for Privacy Q&A [15.86510147965235]
一般データ保護規則では、正確な処理情報を明確でアクセスしやすいものにする必要がある。
本稿では,その義務を果たすためのアライメント技術によって強化された,最先端の検索生成システムについて検討する。
論文 参考訳(メタデータ) (2025-02-10T16:42:00Z) - Adaptive Two-Phase Finetuning LLMs for Japanese Legal Text Retrieval [6.058427379240698]
本稿では,日本語の法的文脈に特化して設計された新しいデータセットを提案する。
第一段階では、このモデルはグローバルな文脈を広く理解し、その一般化を強化する。
第2段階では、モデルは法的なシナリオに特有の複雑なクエリに対処するように微調整される。
我々のパイプラインは英語の文脈で有効であることが証明され、MS MARCOデータセットのベースラインに匹敵する。
論文 参考訳(メタデータ) (2024-12-03T10:52:49Z) - ACE: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
我々は、エンドツーエンドのクロスモーダル検索のための先駆的なジェネリッククロスモーダル rEtrieval framework (ACE) を提案する。
ACEは、クロスモーダル検索における最先端のパフォーマンスを達成し、Recall@1の強いベースラインを平均15.27%上回る。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - SRFUND: A Multi-Granularity Hierarchical Structure Reconstruction Benchmark in Form Understanding [55.48936731641802]
階層的に構造化されたマルチタスク形式理解ベンチマークであるSRFUNDを提案する。
SRFUNDはオリジナルのFUNSDとXFUNDデータセットの上に洗練されたアノテーションを提供する。
データセットには、英語、中国語、日本語、ドイツ語、フランス語、スペイン語、イタリア語、ポルトガル語を含む8つの言語が含まれている。
論文 参考訳(メタデータ) (2024-06-13T02:35:55Z) - STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [93.96463520716759]
テキストと知識ベースを用いた大規模半構造検索ベンチマークSTARKを開発した。
本ベンチマークでは, 製品検索, 学術論文検索, 精密医療におけるクエリの3分野について検討した。
多様なリレーショナル情報と複雑なテキスト特性を統合した,現実的なユーザクエリを合成する,新しいパイプラインを設計する。
論文 参考訳(メタデータ) (2024-04-19T22:54:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。