論文の概要: Exploring Structural Complexity in Normative RAG with Graph-based approaches: A case study on the ETSI Standards
- arxiv url: http://arxiv.org/abs/2604.09868v1
- Date: Sat, 31 Jan 2026 17:00:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.625993
- Title: Exploring Structural Complexity in Normative RAG with Graph-based approaches: A case study on the ETSI Standards
- Title(参考訳): グラフベースアプローチによるノルミティブRAGの構造複雑性の探索:ETSI標準を事例として
- Authors: Aiman Al Masoud, Marco Arazzi, Simone Germani, Antonino Nocera,
- Abstract要約: 本稿では,標準文書,標準文書,規制文書に対する高性能RAGソリューション構築のためのグラフRAGアーキテクチャの有効性について検討する。
この知識ギャップを解決するために,標準文書と規制文書のユニークな構造と語彙的特徴に合わせた特殊なRAG手法を提案する。
- 参考スコア(独自算出の注目度): 3.4765379241536465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Industrial standards and normative documents exhibit intricate hierarchical structures, domain-specific lexicons, and extensive cross-referential dependencies, which making it challenging to process them directly by Large Language Models (LLMs). While Retrieval-Augmented Generation (RAG) provides a computationally efficient alternative to LLM fine-tuning, standard "vanilla" vector-based retrieval may fail to capture the latent structural and relational features intrinsic in normative documents. With the objective of shedding light on the most promising technique for building high-performance RAG solutions for normative, standards, and regulatory documents, this paper investigates the efficacy of Graph RAG architectures, which represent information as interconnected nodes, thus moving from simple semantic similarity toward a more robust, relation-aware retrieval mechanism. Despite the promise of graph-based techniques, there is currently a lack of empirical evidence as to which is the optimal indexing strategy for technical standards. Therefore, to help solve this knowledge gap, we propose a specialized RAG methodology tailored to the unique structure and lexical characteristics of standards and regulatory documents. Moreover, to keep our investigation grounded, we focus on well-known public standards, such as the ETSI EN 301 489 series. We evaluate several lightweight and low-latency strategies designed to embed document structure directly into the retrieval workflow. The considered approaches are rigorously tested against a custom synthesized Q&A dataset, facilitating a quantitative performance analysis. Our experimental results demonstrate that the incorporation of structural and lexical information into the index can enhance, at least to some extent, retrieval performance, providing a scalable framework for automated normative and standards elaboration.
- Abstract(参考訳): 産業標準と規範文書は、複雑な階層構造、ドメイン固有のレキシコン、および広範な相互参照依存関係を示しており、それらを直接LLM(Large Language Models)で処理することは困難である。
Retrieval-Augmented Generation (RAG) は LLM の微調整に代わる計算効率の良い代替手段を提供するが、標準的な "vanilla" ベクトルベースの検索は、標準文書に固有の潜在構造的・関係的特徴を捉えるのに失敗する可能性がある。
本稿では,標準,標準,規制文書のための高性能RAGソリューションを構築するための最も有望な技術に光を当てることを目的として,情報を相互接続ノードとして表現するグラフRAGアーキテクチャの有効性について検討する。
グラフベースの技術が約束されているにもかかわらず、現在、技術標準の最適な索引付け戦略がどれであるかに関する実証的な証拠が不足している。
そこで我々は,この知識ギャップを解決するために,標準文書と規制文書のユニークな構造と語彙的特徴に合わせた特殊なRAG手法を提案する。
また、調査を根底から進めるために、ETSI EN 301 489シリーズなど、よく知られた公開標準に焦点を当てている。
文書構造を直接検索ワークフローに埋め込むために設計された軽量で低レイテンシな戦略を評価した。
検討されたアプローチは、独自の合成されたQ&Aデータセットに対して厳格にテストされ、定量的なパフォーマンス分析が容易になる。
実験の結果、構造情報や語彙情報をインデックスに組み込むことによって、少なくともある程度の検索性能が向上し、自動化規範や標準作成のためのスケーラブルなフレームワークを提供することが示された。
関連論文リスト
- Beyond the Academic Monoculture: A Unified Framework and Industrial Perspective for Attributed Graph Clustering [75.50670592447219]
分散グラフクラスタリング(AGC)は、構造トポロジとノード属性を共同でモデル化することによって、ノードを凝集性グループに分割する基本的な教師なしタスクである。
この調査は、3つの相補的な視点からAGCを包括的かつ工業的に基礎づけたレビューを提供する。
論文 参考訳(メタデータ) (2026-03-21T14:15:34Z) - Ontology-Based Knowledge Graph Framework for Industrial Standard Documents via Hierarchical and Propositional Structuring [8.759087891756069]
オントロジーに基づく知識グラフ(KG)構築は、ドメイン知識に対する多次元的理解と高度な推論を可能にする中核技術である。
本研究では,このような文書を階層的な意味構造に整理する手法を提案する。
我々の手法は文書の階層構造と論理構造の両方を捉え、ドメイン固有の意味論を効果的に表現する。
論文 参考訳(メタデータ) (2025-12-09T09:26:37Z) - Chained Prompting for Better Systematic Review Search Strategies [0.6633201258809686]
本稿では,システムレビューにおいて,検索戦略の自動開発のための大規模言語モデルに基づく連鎖型プロンプトエンジニアリングフレームワークを提案する。
このフレームワークは、手動検索設計の手続き的構造を再現し、LLMを活用して、レビュー対象を分解し、PICO要素を抽出し、概念表現を生成し、用語を拡張し、クエリを合成する。
論文 参考訳(メタデータ) (2025-11-28T12:12:38Z) - Scaling Beyond Context: A Survey of Multimodal Retrieval-Augmented Generation for Document Understanding [61.36285696607487]
文書理解は、財務分析から科学的発見への応用に不可欠である。
現在のアプローチでは、OCRベースのパイプラインがLarge Language Models(LLM)やネイティブのMultimodal LLMs(MLLM)に制限されている。
Retrieval-Augmented Generation (RAG)は、外部データの基底モデルを支援するが、文書のマルチモーダルな性質は、テキスト、テーブル、チャート、レイアウトを組み合わせることで、より高度なパラダイムを必要とする。
論文 参考訳(メタデータ) (2025-10-17T02:33:16Z) - Grounding Long-Context Reasoning with Contextual Normalization for Retrieval-Augmented Generation [57.97548022208733]
キー値抽出における表面的選択が精度と安定性のシフトを引き起こすことを示す。
生成前の文脈表現を適応的に標準化する戦略であるコンテキスト正規化を導入する。
論文 参考訳(メタデータ) (2025-10-15T06:28:25Z) - Dynamic Generation of Multi-LLM Agents Communication Topologies with Graph Diffusion Models [99.85131798240808]
我々はtextitGuided Topology Diffusion (GTD) と呼ばれる新しい生成フレームワークを導入する。
条件付き離散グラフ拡散モデルにインスパイアされたGTD式は、反復的な構成過程としてトポロジー合成を行う。
各ステップで生成は、多目的報酬を予測する軽量プロキシモデルによって制御される。
実験により、GTDは高いタスク適応性、スパース、効率的な通信トポロジを生成できることが示されている。
論文 参考訳(メタデータ) (2025-10-09T05:28:28Z) - Beyond Isolated Dots: Benchmarking Structured Table Construction as Deep Knowledge Extraction [80.88654868264645]
Arranged and Organized extract Benchmarkは、断片化された文書を理解するための大規模言語モデルの能力を評価するために設計された。
AOEには3つの異なるドメインにまたがる11のタスクが含まれており、さまざまな入力クエリに適したコンテキスト固有のスキーマを生成するモデルが必要である。
結果は、最も先進的なモデルでさえ、かなり苦労したことを示している。
論文 参考訳(メタデータ) (2025-07-22T06:37:51Z) - Tree-Based Text Retrieval via Hierarchical Clustering in RAGFrameworks: Application on Taiwanese Regulations [0.0]
階層的なクラスタリングに基づく検索手法を提案する。
本手法は,意味的関連コンテンツを適応的に選択しながら,システム応答の精度と関連性を維持する。
我々のフレームワークは実装が簡単で、既存のRAGパイプラインと簡単に統合できます。
論文 参考訳(メタデータ) (2025-06-16T15:34:29Z) - An Ontology-Driven Graph RAG for Legal Norms: A Structural, Temporal, and Deterministic Approach [0.0]
標準、平文検索は、法の階層的、横行的、因果的構造に盲目である。
本稿では,法則の形式構造とダイアクロニックな性質を明示的にモデル化することにより,これらの制約を克服するためのオントロジー駆動型フレームワークSAT-Graph RAGを紹介する。
論文 参考訳(メタデータ) (2025-04-29T18:36:57Z) - StructTest: Benchmarking LLMs' Reasoning through Compositional Structured Outputs [78.84060166851805]
StructTestは、大規模な言語モデル(LLM)を合成命令に従って構造化出力を生成する能力に基づいて評価する、新しいベンチマークである。
評価はルールベースの評価器を用いて決定的に行われ、新しいタスクやデータセットに容易に拡張できる。
StructTestは、Deepseek-V3/R1やGPT-4oといったトップパフォーマンスモデルでも、依然として難しいままです。
論文 参考訳(メタデータ) (2024-12-23T22:08:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。