論文の概要: Schema as Parameterized Tools for Universal Information Extraction
- arxiv url: http://arxiv.org/abs/2506.01276v1
- Date: Mon, 02 Jun 2025 03:12:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 04:22:50.718434
- Title: Schema as Parameterized Tools for Universal Information Extraction
- Title(参考訳): ユニバーサル情報抽出のためのパラメータ化ツールとしてのスキーマ
- Authors: Sheng Liang, Yongyue Zhang, Yaxiong Wu, Ruiming Tang, Yong Liu,
- Abstract要約: ユニバーサル情報抽出(UIE)は、主に大言語モデル(LLM)を用いた抽出生成手法を用いる。
構造化IEツール(SPT)と呼ばれる適応型テキスト・構造生成フレームワークを提案する。
- 参考スコア(独自算出の注目度): 27.4621163733051
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Universal information extraction (UIE) primarily employs an extractive generation approach with large language models (LLMs), typically outputting structured information based on predefined schemas such as JSON or tables. UIE suffers from a lack of adaptability when selecting between predefined schemas and on-the-fly schema generation within the in-context learning paradigm, especially when there are numerous schemas to choose from. In this paper, we propose a unified adaptive text-to-structure generation framework, called Schema as Parameterized Tools (SPT), which reimagines the tool-calling capability of LLMs by treating predefined schemas as parameterized tools for tool selection and parameter filling. Specifically, our SPT method can be applied to unify closed, open, and on-demand IE tasks by adopting Schema Retrieval by fetching the relevant schemas from a predefined pool, Schema Filling by extracting information and filling slots as with tool parameters, or Schema Generation by synthesizing new schemas with uncovered cases. Experiments show that the SPT method can handle four distinct IE tasks adaptively, delivering robust schema retrieval and selection performance. SPT also achieves comparable extraction performance to LoRA baselines and current leading UIE systems with significantly fewer trainable parameters.
- Abstract(参考訳): ユニバーサル情報抽出(UIE)は、主に大きな言語モデル(LLM)による抽出生成アプローチを採用し、JSONやテーブルなどの事前定義されたスキーマに基づいて構造化された情報を出力する。
UIEは、事前定義されたスキーマとオンザフライスキーマの生成を、コンテキスト内学習パラダイム内で選択する場合、特に選択すべきスキーマが多数存在する場合、適応性の欠如に悩まされる。
本稿では,Schema as Parameterized Tools (SPT) と呼ばれる適応型テキスト・構造生成フレームワークを提案する。
具体的には、事前定義されたプールから関連するスキーマをフェッチし、Schema Retrieval、ツールパラメータとともに情報を取り出してスロットを埋めることによるSchema Filling、未発見ケースで新しいスキーマを合成することによってSchema Generationを適用すれば、クローズドでオープンでオンデマンドなIEタスクを統一するためにSPTメソッドを適用することができる。
実験により、SPT法は、4つの異なるIEタスクを適応的に処理でき、堅牢なスキーマ検索と選択性能を提供できることが示された。
SPTはまた、LoRAベースラインや、トレーニング可能なパラメータが大幅に少ない現在のUIEシステムに匹敵する性能を達成している。
関連論文リスト
- SchemaGraphSQL: Efficient Schema Linking with Pathfinding Graph Algorithms for Text-to-SQL on Large-Scale Databases [1.6544167074080365]
本稿では、まず、外部キー関係に基づくスキーマグラフを構築する、ゼロショットでトレーニング不要なスキーマリンク手法を提案する。
我々は、結合すべきテーブルや列の最適なシーケンスを特定するために、古典的なパスフィニングアルゴリズムと後処理を適用する。
提案手法はBIRDベンチマークの最先端結果を実現し,従来の特殊化,微調整,複雑な多段階LCMに基づくアプローチよりも優れていた。
論文 参考訳(メタデータ) (2025-05-23T20:42:36Z) - Adaptive Schema-aware Event Extraction with Retrieval-Augmented Generation [16.423791691552665]
イベント抽出(EE)は自然言語処理(NLP)の基本課題であり、構造化されていないテキストからイベント情報を識別して抽出する。
既存の研究では,(1)既存のパイプラインシステムにおける厳密なスキーマ固定,(2)共同スキーママッチングと抽出のためのベンチマークの欠如という2つの重要なギャップが示されている。
本稿では,適応認識イベント抽出(ASEE)を提案する。
論文 参考訳(メタデータ) (2025-05-13T15:47:54Z) - Advancing and Benchmarking Personalized Tool Invocation for LLMs [66.39214525683425]
パーソナライズされたツール呼び出しの概念を導入し、ツールの優先度とプロファイルに依存したクエリという2つの重要なタスクを定義します。
これらの課題に対処するために、パーソナライズされたツール呼び出し用に設計されたデータ合成フレームワークであるPToolを提案する。
パーソナライズされたツール呼び出しを評価するための最初のベンチマークである textbfPTBench を構築した。
論文 参考訳(メタデータ) (2025-05-07T02:25:20Z) - SchemaAgent: A Multi-Agents Framework for Generating Relational Database Schema [35.57815867567431]
既存の取り組みは主に、カスタマイズされたルールや従来のディープラーニングモデルに基づいており、しばしばリレーショナルスキーマを生成する。
高品質データベーススキーマの自動生成のための統一LLMベースのマルチエージェントフレームワークを提案する。
我々は、様々な段階にわたる問題の正当性を特定するために、リフレクションとインスペクションのための専用の役割と、革新的なエラー検出と修正機構を組み込んだ。
論文 参考訳(メタデータ) (2025-03-31T09:39:19Z) - Matchmaker: Self-Improving Large Language Model Programs for Schema Matching [60.23571456538149]
本稿では,スキーママッチングのための合成言語モデルプログラムを提案する。
Matchmakerは、ラベル付きデモを必要とせずに、ゼロショットで自己改善する。
実証的に、Matchmakerが以前のMLベースのアプローチより優れている実世界の医療スキーママッチングベンチマークを実証する。
論文 参考訳(メタデータ) (2024-10-31T16:34:03Z) - ReMatch: Retrieval Enhanced Schema Matching with LLMs [0.874967598360817]
本稿では,検索強化大言語モデル(LLM)を用いたスキーママッチングのためのReMatchという新しい手法を提案する。
大規模な実世界のスキーマに対する実験結果から,ReMatchが効果的なマーカであることが示された。
論文 参考訳(メタデータ) (2024-03-03T17:14:40Z) - FIPO: Free-form Instruction-oriented Prompt Optimization with Preference Dataset and Modular Fine-tuning Schema [36.65009632307124]
大規模言語モデル(LLM)のタスク性能向上のためのFIPO(Free-from Instruction-oriented Prompt Optimization)を提案する。
FIPOはモジュール型のAPOテンプレートを使用して、単純で最適化されたプロンプトを生成するために、ナイーブなタスク命令、オプションの命令応答、オプションの接地真理を動的に統合する。
5つの公開ベンチマークと6つのテストモデルでFIPOフレームワークを検証する。
論文 参考訳(メタデータ) (2024-02-19T03:56:44Z) - Schema-adaptable Knowledge Graph Construction [47.772335354080795]
従来の知識グラフ構築(KGC)アプローチは、通常、事前定義されたスキーマの閉じたセットで静的情報抽出パラダイムに従う。
我々は,スキーマ適応型KGCと呼ばれる新しいタスクを提案する。このタスクは,動的に変化するスキーマグラフに基づいて,再学習せずにエンティティ,リレーション,イベントを継続的に抽出することを目的としている。
論文 参考訳(メタデータ) (2023-05-15T15:06:20Z) - RexUIE: A Recursive Method with Explicit Schema Instructor for Universal
Information Extraction [47.89362854989252]
ユニバーサル情報抽出(Universal Information extract)は、さまざまなターゲット、異種構造、要求固有のスキーマによって引き起こされる課題によって、関心のある分野である。
これまでは、名前付きエンティティ認識(NER)や関係抽出(RE)など、いくつかのタスクを統合することで、限られた成功しか達成できなかった。
本稿では,ほぼすべての抽出スキーマを含む公式な定式化により,認証UIEを再定義する。
論文 参考訳(メタデータ) (2023-04-28T11:28:56Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。