論文の概要: Structuring the Unstructured: A Systematic Review of Text-to-Structure Generation for Agentic AI with a Universal Evaluation Framework
- arxiv url: http://arxiv.org/abs/2508.12257v1
- Date: Sun, 17 Aug 2025 06:41:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.638612
- Title: Structuring the Unstructured: A Systematic Review of Text-to-Structure Generation for Agentic AI with a Universal Evaluation Framework
- Title(参考訳): 非構造化構造:ユニバーサル評価フレームワークを用いたエージェントAIのためのテキスト・構造生成の体系的レビュー
- Authors: Zheye Deng, Chunkit Chan, Tianshi Zheng, Wei Fan, Weiqi Wang, Yangqiu Song,
- Abstract要約: 本稿では,テキスト・ツー・ストラクチャの手法と課題について考察する。
我々は、構造化された出力に対する普遍的な評価フレームワークを導入し、次世代AIシステムの基盤基盤としてテキスト・ツー・ストラクチャを確立する。
- 参考スコア(独自算出の注目度): 39.83132604513921
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The evolution of AI systems toward agentic operation and context-aware retrieval necessitates transforming unstructured text into structured formats like tables, knowledge graphs, and charts. While such conversions enable critical applications from summarization to data mining, current research lacks a comprehensive synthesis of methodologies, datasets, and metrics. This systematic review examines text-to-structure techniques and the encountered challenges, evaluates current datasets and assessment criteria, and outlines potential directions for future research. We also introduce a universal evaluation framework for structured outputs, establishing text-to-structure as foundational infrastructure for next-generation AI systems.
- Abstract(参考訳): AIシステムのエージェント操作とコンテキスト認識検索への進化は、構造化されていないテキストをテーブル、ナレッジグラフ、チャートなどの構造化フォーマットに変換する必要がある。
このような変換は、要約からデータマイニングまで重要なアプリケーションを可能にするが、現在の研究は方法論、データセット、メトリクスの包括的な合成を欠いている。
本稿では,テキスト・ツー・ストラクチャーの手法と課題を整理し,現在のデータセットと評価基準を評価し,今後の研究の方向性を概説する。
また、構造化された出力に対する普遍的な評価フレームワークを導入し、次世代AIシステムの基盤基盤としてテキスト・ツー・ストラクチャを確立する。
関連論文リスト
- AI4Contracts: LLM & RAG-Powered Encoding of Financial Derivative Contracts [1.3060230641655135]
大規模言語モデル(LLM)と検索拡張生成(RAG)は、AIシステムが構造化されていないテキストから情報を抽出し整理する方法を再構築している。
本稿では,テンプレート駆動型LLMフレームワークであるCDMizerと,構造化テキスト変換のためのRAGベースのフレームワークを紹介する。
論文 参考訳(メタデータ) (2025-06-01T16:05:00Z) - Mixture of Structural-and-Textual Retrieval over Text-rich Graph Knowledge Bases [78.62158923194153]
テキストリッチなグラフ知識ベース(TG-KB)は、テキストおよび構造的知識を提供することで、クエリに応答する上でますます重要になっている。
本研究では,これら2種類の知識を計画・推論・組織化フレームワークを用いて検索するための構造・テキスト検索(MoR)の混合を提案する。
論文 参考訳(メタデータ) (2025-02-27T17:42:52Z) - Customized Information and Domain-centric Knowledge Graph Construction with Large Language Models [0.0]
本稿では,構造化情報へのタイムリーなアクセスを実現するための知識グラフに基づく新しいアプローチを提案する。
本フレームワークは,情報検索,キーフレーズ抽出,セマンティックネットワーク生成,トピックマップ可視化などを含むテキストマイニングプロセスを含む。
当社の方法論を自動車電気システムの領域に適用して,スケーラブルなアプローチを実証する。
論文 参考訳(メタデータ) (2024-09-30T07:08:28Z) - A Systematic Review of Data-to-Text NLG [2.4769539696439677]
高品質なテキストを生成する手法を探索し、テキスト生成における幻覚の課題に対処する。
テキスト品質の進歩にもかかわらず、このレビューは低リソース言語における研究の重要性を強調している。
論文 参考訳(メタデータ) (2024-02-13T14:51:45Z) - Advanced Unstructured Data Processing for ESG Reports: A Methodology for
Structured Transformation and Enhanced Analysis [20.038120319271773]
本研究では,ESGレポートを構造化解析可能な形式に変換する革新的な手法を提案する。
提案手法は,高精度なテキストクリーニング,画像からのテキストの適切な識別と抽出,およびこれらのレポート内の表の標準化を実現する。
この研究は、産業生態学と企業持続可能性評価の分野に多大な貢献をしている。
論文 参考訳(メタデータ) (2024-01-04T06:26:59Z) - Evaluating Generative Ad Hoc Information Retrieval [58.800799175084286]
生成検索システムは、しばしばクエリに対する応答として、接地された生成されたテキストを直接返す。
このような生成的アドホック検索を適切に評価するには,テキスト応答の有用性の定量化が不可欠である。
論文 参考訳(メタデータ) (2023-11-08T14:05:00Z) - Does Structure Matter? Leveraging Data-to-Text Generation for Answering
Complex Information Needs [3.5331191621809794]
データ・テキスト・ジェネレーションの観点から,生成モデルの利用を想定する。
中間計画を生成することで回答を構造化することを目的とした,コンテンツ選択計画パイプラインの利用を提案する。
TREC Complex Answer Retrieval (CAR) データセットを用いて実験評価を行った。
論文 参考訳(メタデータ) (2021-12-08T15:51:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。