Fugu-MT 論文翻訳(概要): A Survey on Open Information Extraction from Rule-based Model to Large Language Model

論文の概要: A Survey on Open Information Extraction from Rule-based Model to Large Language Model

arxiv url: http://arxiv.org/abs/2208.08690v7
Date: Wed, 23 Oct 2024 19:36:50 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-05 23:52:24.33486
Title: A Survey on Open Information Extraction from Rule-based Model to Large Language Model
Title（参考訳）: ルールベースモデルから大規模言語モデルへのオープン情報抽出に関する調査
Authors: Pai Liu, Wenyang Gao, Wenjie Dong, Lin Ai, Ziwei Gong, Songfang Huang, Zongsheng Li, Ehsan Hoque, Julia Hirschberg, Yue Zhang,
Abstract要約: オープン情報抽出(OpenIE)は、構造化されていないテキストから構造化情報を引き出すための重要なNLPタスクである。本調査では,2007年から2024年までのOpenIE技術の概要を概説し,時系列的視点を強調した。この記事では、OpenIEアプローチをルールベース、ニューラル、トレーニング済みの大規模言語モデルに分類し、時系列フレームワーク内でそれぞれについて議論する。
参考スコア（独自算出の注目度）: 29.017823043117144
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Open Information Extraction (OpenIE) represents a crucial NLP task aimed at deriving structured information from unstructured text, unrestricted by relation type or domain. This survey paper provides an overview of OpenIE technologies spanning from 2007 to 2024, emphasizing a chronological perspective absent in prior surveys. It examines the evolution of task settings in OpenIE to align with the advances in recent technologies. The paper categorizes OpenIE approaches into rule-based, neural, and pre-trained large language models, discussing each within a chronological framework. Additionally, it highlights prevalent datasets and evaluation metrics currently in use. Building on this extensive review, the paper outlines potential future directions in terms of datasets, information sources, output formats, methodologies, and evaluation metrics.
Abstract（参考訳）: オープン情報抽出(OpenIE)は、構造化されていないテキストから構造化情報を引き出すための重要なNLPタスクであり、関係タイプやドメインによって制限されない。本調査では,2007年から2024年にかけてのOpenIE技術の概観を概説し,前回の調査で欠落した時系列的視点を強調した。近年の技術の進歩に合わせて,OpenIEにおけるタスク設定の進化を考察する。この記事では、OpenIEアプローチをルールベース、ニューラル、トレーニング済みの大規模言語モデルに分類し、時系列フレームワーク内でそれぞれについて議論する。さらに、現在使用されている一般的なデータセットと評価指標も強調する。この広範なレビューに基づいて、本論文は、データセット、情報ソース、出力フォーマット、方法論、評価指標の観点から、将来的な方向性を概説する。

関連論文リスト

Scaling Beyond Context: A Survey of Multimodal Retrieval-Augmented Generation for Document Understanding [61.36285696607487]
文書理解は、財務分析から科学的発見への応用に不可欠である。現在のアプローチでは、OCRベースのパイプラインがLarge Language Models(LLM)やネイティブのMultimodal LLMs(MLLM)に制限されている。 Retrieval-Augmented Generation (RAG)は、外部データの基底モデルを支援するが、文書のマルチモーダルな性質は、テキスト、テーブル、チャート、レイアウトを組み合わせることで、より高度なパラダイムを必要とする。
論文参考訳（メタデータ） (2025-10-17T02:33:16Z)
Challenges in Expanding Portuguese Resources: A View from Open Information Extraction [0.774971301405295]
ポルトガル語におけるオープン情報抽出のための高品質な注釈付きコーパスを提案する。アノテーションプロセスで直面する課題について議論し、構造的および文脈的アノテーションルールのセットを提案し、コーパスを検証する。
論文参考訳（メタデータ） (2025-01-21T03:08:37Z)
Towards Robust Evaluation: A Comprehensive Taxonomy of Datasets and Metrics for Open Domain Question Answering in the Era of Large Language Models [0.0]
自然言語処理におけるオープンドメイン質問回答(ODQA)は,大規模知識コーパスを用いて,事実質問に回答するシステムを構築する。高品質なデータセットは、現実的なシナリオでモデルをトレーニングするために使用されます。標準化されたメトリクスは、異なるODQAシステム間の比較を容易にする。
論文参考訳（メタデータ） (2024-06-19T05:43:02Z)
From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models [98.41645229835493]
グラフ形式のデータの可視化は、データ分析において重要な役割を担い、重要な洞察を提供し、情報的な意思決定を支援する。大規模言語モデルのような大規模な基盤モデルは、様々な自然言語処理タスクに革命をもたらした。本研究は,自然言語処理,コンピュータビジョン,データ解析の分野における研究者や実践者の包括的資源として機能する。
論文参考訳（メタデータ） (2024-03-18T17:57:09Z)
Large Language Models for Generative Information Extraction: A Survey [89.71273968283616]
大規模言語モデル(LLM)は、テキスト理解と生成において顕著な能力を示した。各種IEサブタスクと技術の観点から,これらの作品を分類して概観する。我々は,最も先進的な手法を実証的に分析し,LLMによるIEタスクの出現傾向を明らかにする。
論文参考訳（メタデータ） (2023-12-29T14:25:22Z)
Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文参考訳（メタデータ） (2022-11-15T19:42:27Z)
A Survey on Neural Open Information Extraction: Current Status and Future Directions [87.30702606041407]
Open Information extract (OpenIE) は、大規模コーパスからの関係事実のドメインに依存しない発見を容易にする。我々は、最先端のニューラルなOpenIEモデル、その設計決定、強み、弱点について概観する。
論文参考訳（メタデータ） (2022-05-24T02:24:55Z)
Document AI: Benchmarks, Models and Applications [35.46858492311289]
ドキュメントAI(Document AI)とは、ビジネス文書を自動的に読み、理解し、分析する技術である。近年、ディープラーニング技術の人気は、Document AIの開発を大きく進めている。本稿では,代表モデル,タスク,ベンチマークデータセットについて概説する。
論文参考訳（メタデータ） (2021-11-16T16:43:07Z)
Deep Learning Schema-based Event Extraction: Literature Review and Current Trends [60.29289298349322]
ディープラーニングに基づくイベント抽出技術が研究ホットスポットとなっている。本稿では,ディープラーニングモデルに焦点をあて,最先端のアプローチを見直し,そのギャップを埋める。
論文参考訳（メタデータ） (2021-07-05T16:32:45Z)
Retrieving and Reading: A Comprehensive Survey on Open-domain Question Answering [62.88322725956294]
OpenQAの最近の研究動向を概観し、特にニューラルMSC技術を導入したシステムに注目した。 Retriever-Reader' と呼ばれる最新の OpenQA アーキテクチャを導入し、このアーキテクチャに従うさまざまなシステムを分析します。次に、OpenQAシステムの開発における主要な課題について議論し、一般的に使用されるベンチマークの分析を提供する。
論文参考訳（メタデータ） (2021-01-04T04:47:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。