論文の概要: A Comprehensive Survey of Natural Language Generation Advances from the
Perspective of Digital Deception
- arxiv url: http://arxiv.org/abs/2208.05757v1
- Date: Thu, 11 Aug 2022 11:27:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-12 13:13:17.080724
- Title: A Comprehensive Survey of Natural Language Generation Advances from the
Perspective of Digital Deception
- Title(参考訳): デジタル・ディセプションからみた自然言語生成の進展に関する総合的調査
- Authors: Keenan Jones, Enes Altuncu, Virginia N. L. Franqueira, Yichao Wang and
Shujun Li
- Abstract要約: 自然言語生成(NLG)の分野について概観する。
NLGを構成する中心概念の高レベル分類について概説する。
我々は、既存のテキスト生成システムでしばしば現れるバイアスのリスクを含む、NLGの幅広い課題について論じる。
- 参考スコア(独自算出の注目度): 1.557442325082254
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In recent years there has been substantial growth in the capabilities of
systems designed to generate text that mimics the fluency and coherence of
human language. From this, there has been considerable research aimed at
examining the potential uses of these natural language generators (NLG) towards
a wide number of tasks. The increasing capabilities of powerful text generators
to mimic human writing convincingly raises the potential for deception and
other forms of dangerous misuse. As these systems improve, and it becomes ever
harder to distinguish between human-written and machine-generated text,
malicious actors could leverage these powerful NLG systems to a wide variety of
ends, including the creation of fake news and misinformation, the generation of
fake online product reviews, or via chatbots as means of convincing users to
divulge private information. In this paper, we provide an overview of the NLG
field via the identification and examination of 119 survey-like papers focused
on NLG research. From these identified papers, we outline a proposed high-level
taxonomy of the central concepts that constitute NLG, including the methods
used to develop generalised NLG systems, the means by which these systems are
evaluated, and the popular NLG tasks and subtasks that exist. In turn, we
provide an overview and discussion of each of these items with respect to
current research and offer an examination of the potential roles of NLG in
deception and detection systems to counteract these threats. Moreover, we
discuss the broader challenges of NLG, including the risks of bias that are
often exhibited by existing text generation systems. This work offers a broad
overview of the field of NLG with respect to its potential for misuse, aiming
to provide a high-level understanding of this rapidly developing area of
research.
- Abstract(参考訳): 近年,人間の言葉の流布やコヒーレンスを模倣するテキストを生成するように設計されたシステムの能力が著しく成長している。
このことから、これらの自然言語生成器(nlg)の様々なタスクへの潜在的な利用を調べることを目的とした研究が数多く行われている。
人間の文章を模倣する強力なテキスト生成器の能力の増大は、騙しやその他の危険な誤用の可能性を高める。
これらのシステムが改良され、人書きテキストと機械生成テキストの区別がさらに難しくなるにつれ、悪意のあるアクターは、偽ニュースや誤報の作成、偽のオンライン製品レビューの生成、あるいはユーザーが個人情報を漏らし出すためのチャットボットなど、これらの強力なNLGシステムを広範囲に活用することができる。
本稿では,NLG研究に焦点をあてた119のサーベイライクな論文の同定と検証を通じて,NLG分野の概要を述べる。
これらの特定論文から,汎用NLGシステムの開発に使用される手法,これらのシステムの評価方法,一般的なNLGタスクやサブタスクなどを含む,NLGを構成する中心概念の高レベルな分類について概説する。
そこで本研究では,これら各項目の概要と議論を行い,これらの脅威に対処する詐欺・検知システムにおけるNLGの潜在的な役割について検討する。
さらに,既存のテキスト生成システムでしばしば現れるバイアスのリスクを含む,NLGの広範な課題についても論じる。
この研究は、この急速に発展する研究領域の高レベルな理解を提供することを目的として、その誤用の可能性に関して、NLGの分野の幅広い概要を提供する。
関連論文リスト
- A Survey of AI-generated Text Forensic Systems: Detection, Attribution,
and Characterization [13.44566185792894]
AI生成テキスト鑑定は、LLMの誤用に対処する新たな分野である。
本稿では,検出,帰属,特性の3つの主要な柱に着目した詳細な分類法を紹介する。
我々は、AI生成テキスト法医学研究の利用可能なリソースを探究し、AI時代の法医学システムの進化的課題と今後の方向性について論じる。
論文 参考訳(メタデータ) (2024-03-02T09:39:13Z) - Leveraging Large Language Models for NLG Evaluation: Advances and Challenges [57.88520765782177]
大規模言語モデル(LLM)は、コヒーレンス、クリエイティビティ、コンテキスト関連など、生成されたコンテンツ品質を評価するための新たな道を開いた。
既存のLCMに基づく評価指標を整理し、これらの手法を理解し比較するための構造化された枠組みを提供する。
本稿では, 偏見, 堅牢性, ドメイン固有性, 統一評価などの未解決課題を議論することによって, 研究者に洞察を提供し, より公平で高度なNLG評価手法を提唱することを目的とする。
論文 参考訳(メタデータ) (2024-01-13T15:59:09Z) - Towards Possibilities & Impossibilities of AI-generated Text Detection:
A Survey [97.33926242130732]
大規模言語モデル(LLM)は、自然言語処理(NLP)の領域に革命をもたらし、人間のようなテキスト応答を生成する能力を持つ。
これらの進歩にもかかわらず、既存の文献のいくつかは、LLMの潜在的な誤用について深刻な懸念を提起している。
これらの懸念に対処するために、研究コミュニティのコンセンサスは、AI生成テキストを検出するアルゴリズムソリューションを開発することである。
論文 参考訳(メタデータ) (2023-10-23T18:11:32Z) - Large Language Models for Information Retrieval: A Survey [58.30439850203101]
情報検索は、項ベースの手法から高度なニューラルモデルとの統合へと進化してきた。
近年の研究では、大規模言語モデル(LLM)を活用してIRシステムの改善が試みられている。
LLMとIRシステムの合流点を探索し、クエリリライト、リトリバー、リランカー、リーダーといった重要な側面を含む。
論文 参考訳(メタデータ) (2023-08-14T12:47:22Z) - Machine Generated Text: A Comprehensive Survey of Threat Models and
Detection Methods [6.978441815839558]
この調査は、機械が生成したテキストをサイバーセキュリティと社会的コンテキストの中に配置する。
現代のNLGシステムによる脅威モデルの解析を含む。
これは、最も重要な脅威モデルに対処する将来の作業のためのガイダンスを提供する。
論文 参考訳(メタデータ) (2022-10-13T19:46:14Z) - Innovations in Neural Data-to-text Generation: A Survey [10.225452376884233]
このサーベイは、アプローチ、ベンチマークデータセット、評価プロトコルの構造化された検証によって、ニューラルDTGパラダイムの総合的なビューを提供する。
我々は,言語的に有能なシステムの設計だけでなく,公平性と説明責任を示すシステムにも焦点をあてる,DTG研究の有望な道のりを強調した。
論文 参考訳(メタデータ) (2022-07-25T23:21:48Z) - Recent Advances in Neural Text Generation: A Task-Agnostic Survey [20.932460734129585]
本稿では,ニューラルテキスト生成の最近の進歩を包括的かつタスク依存的に調査する。
これらの進歩は、データ構築、ニューラルネットワーク、トレーニングと推論戦略、評価指標の4つの重要な領域に分類します。
本稿では,ニューラルネットワークの利用と背景知識の導入を含む,ニューラルテキスト生成の進歩に向けた今後の方向性について検討する。
論文 参考訳(メタデータ) (2022-03-06T20:47:49Z) - Survey of Hallucination in Natural Language Generation [69.9926849848132]
近年,シーケンス間深層学習技術の発展により,自然言語生成(NLG)は指数関数的に向上している。
深層学習に基づく生成は意図しないテキストを幻覚させる傾向があるため、システム性能は低下する。
この調査は、NLGにおける幻覚テキストの課題に取り組む研究者の協力活動を促進するのに役立つ。
論文 参考訳(メタデータ) (2022-02-08T03:55:01Z) - A Survey of Natural Language Generation [30.134226859027642]
本稿では,過去20年間の自然言語生成(NLG)研究を包括的に概観する。
データ・ツー・テキスト・ジェネレーションとテキスト・ツー・テキスト・テキスト・ジェネレーション・ディープ・ラーニングの手法、およびNLG技術の新たな応用に焦点を当てている。
論文 参考訳(メタデータ) (2021-12-22T09:08:00Z) - A Survey of Knowledge-Enhanced Text Generation [81.24633231919137]
テキスト生成の目標は、機械を人間の言語で表現できるようにすることである。
入力テキストを出力テキストにマッピングすることを学ぶことで、目的を達成するために、様々なニューラルエンコーダデコーダモデルが提案されている。
この問題に対処するために、研究者は入力テキスト以外の様々な種類の知識を生成モデルに組み込むことを検討してきた。
論文 参考訳(メタデータ) (2020-10-09T06:46:46Z) - Evaluation of Text Generation: A Survey [107.62760642328455]
本稿は,ここ数年で開発された自然言語生成システムの評価手法について調査する。
我々は,NLG評価手法を,(1)人間中心評価指標,(2)訓練を必要としない自動評価指標,(3)機械学習指標の3つのカテゴリに分類した。
論文 参考訳(メタデータ) (2020-06-26T04:52:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。