論文の概要: A Systematic Review of Data-to-Text NLG
- arxiv url: http://arxiv.org/abs/2402.08496v2
- Date: Tue, 20 Feb 2024 07:26:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 19:15:04.908236
- Title: A Systematic Review of Data-to-Text NLG
- Title(参考訳): Data-to-Text NLGのシステムレビュー
- Authors: Chinonso Cynthia Osuji, Thiago Castro Ferreira, Brian Davis
- Abstract要約: この体系的なレビューは、データ・テキスト・ジェネレーションに関する最先端の研究を包括的に分析する。
評価指標とともに、データセットの使用状況、人気度、影響について光を当てました。
インクリシティに焦点をあてて、低リソース言語における研究の重要性を強調します。
- 参考スコア(独自算出の注目度): 2.4769539696439677
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This systematic review provides a comprehensive analysis of the
state-of-the-art research on data-to-text generation, addressing gaps,
highlighting challenges, and proposing future directions. We examined various
approaches in this field, assessing their effectiveness and limitations, while
surveying literature on datasets, evaluation metrics, application areas,
multilingualism, and methods for mitigating hallucinations. We shed light on
the usage, popularity, and impact of datasets, alongside evaluation metrics,
emphasizing both automatic and human assessment. Additionally, we explore the
evolution of data-to-text models, emphasizing the widespread adoption of
transformer models. With a focus on inclusivity, we stress the importance of
research in low-resourced languages. Despite notable advancements in text
quality, we examine strategies utilized to tackle hallucinations in models and
advocate for universally applicable techniques. This review serves as a roadmap
to inspire innovation, establish evaluation benchmarks, and drive progress in
data-to-text generation.
- Abstract(参考訳): この体系的なレビューは、データからテキストへの生成、ギャップへの対処、課題の強調、今後の方向性の提案に関する最先端の研究の包括的な分析を提供する。
本研究は,データセット,評価指標,応用領域,多言語主義,幻覚緩和法について文献調査を行い,その効果と限界について検討した。
私たちは、自動評価と人的評価の両方を強調する評価指標とともに、データセットの使用、人気、および影響について光を当てました。
さらに, トランスフォーマーモデルの普及を強調し, データ・ツー・テキストモデルの進化を探究する。
排他性を重視して、低リソース言語における研究の重要性を強調している。
テキスト品質の顕著な進歩にもかかわらず、モデルにおける幻覚に取り組み、普遍的な手法を提唱する戦略を検討する。
このレビューは、イノベーションを刺激し、評価ベンチマークを確立し、データ-テキスト生成の進歩を促進するロードマップとして役立ちます。
関連論文リスト
- Analysis of Plan-based Retrieval for Grounded Text Generation [78.89478272104739]
幻覚は、言語モデルがそのパラメトリック知識の外で生成タスクが与えられるときに起こる。
この制限に対処するための一般的な戦略は、言語モデルに検索メカニズムを注入することである。
我々は,幻覚の頻度をさらに減少させるために,探索のガイドとして計画をどのように利用できるかを分析する。
論文 参考訳(メタデータ) (2024-08-20T02:19:35Z) - A Survey on Recent Advances in Conversational Data Generation [14.237954885530396]
マルチターン対話型データ生成の体系的・包括的レビューを行う。
オープンドメイン,タスク指向,情報検索の3種類の対話システムに注目した。
合成会話データを評価するための評価指標と手法について検討する。
論文 参考訳(メタデータ) (2024-05-12T10:11:12Z) - Large Language Models(LLMs) on Tabular Data: Prediction, Generation, and Understanding -- A Survey [17.19337964440007]
現在、この研究領域における主要なテクニック、メトリクス、データセット、モデル、最適化アプローチを要約し比較する包括的なレビューが欠如しています。
この調査は、これらの領域における最近の進歩を集約し、使用するデータセット、メトリクス、方法論の詳細な調査と分類を提供することによって、このギャップに対処することを目的としている。
既存の文献の強さ、限界、未探索領域、ギャップを識別し、この重要かつ急速に発展する分野における将来の研究の方向性についていくつかの洞察を提供する。
論文 参考訳(メタデータ) (2024-02-27T23:59:01Z) - Exploring Precision and Recall to assess the quality and diversity of LLMs [82.21278402856079]
我々はtextscLlama-2 や textscMistral のような大規模言語モデル (LLM) のための新しい評価フレームワークを提案する。
このアプローチにより、コーパスの整合を必要とせず、生成したテキストの品質と多様性を微妙に評価できる。
論文 参考訳(メタデータ) (2024-02-16T13:53:26Z) - Multi-Dimensional Evaluation of Text Summarization with In-Context
Learning [79.02280189976562]
本稿では,テキスト内学習を用いた多次元評価器として,大規模言語モデルの有効性について検討する。
実験の結果,テキスト要約作業において,文脈内学習に基づく評価手法が学習評価フレームワークと競合していることが判明した。
次に、テキスト内サンプルの選択や数などの要因がパフォーマンスに与える影響を分析する。
論文 参考訳(メタデータ) (2023-06-01T23:27:49Z) - Controllable Data Generation by Deep Learning: A Review [22.582082771890974]
制御可能な深層データ生成は有望な研究領域であり、一般に制御可能な深部データ生成として知られている。
本稿では、制御可能な深層データ生成のエキサイティングな応用を紹介し、既存の研究を実験的に分析し比較する。
論文 参考訳(メタデータ) (2022-07-19T20:44:42Z) - Faithfulness in Natural Language Generation: A Systematic Survey of
Analysis, Evaluation and Optimization Methods [48.47413103662829]
自然言語生成(NLG)は,事前学習型言語モデルなどの深層学習技術の発展により,近年大きく進歩している。
しかし、生成したテキストが通常不信または非実情報を含むという忠実性問題は、最大の課題となっている。
論文 参考訳(メタデータ) (2022-03-10T08:28:32Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。