論文の概要: ARTIST: ARTificial Intelligence for Simplified Text
- arxiv url: http://arxiv.org/abs/2308.13458v1
- Date: Fri, 25 Aug 2023 16:06:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-28 13:22:13.271888
- Title: ARTIST: ARTificial Intelligence for Simplified Text
- Title(参考訳): ARTIST: シンプルテキストのための人工知能
- Authors: Lorenzo Corti and Jie Yang
- Abstract要約: テキスト単純化は、テキストの言語的複雑さを減らすことを目的とした、自然言語処理の重要なタスクである。
生成人工知能(AI)の最近の進歩により、語彙レベルと構文レベルの両方で自動テキストの簡略化が可能になった。
- 参考スコア(独自算出の注目度): 5.095775294664102
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Complex text is a major barrier for many citizens when accessing public
information and knowledge. While often done manually, Text Simplification is a
key Natural Language Processing task that aims for reducing the linguistic
complexity of a text while preserving the original meaning. Recent advances in
Generative Artificial Intelligence (AI) have enabled automatic text
simplification both on the lexical and syntactical levels. However, as
applications often focus on English, little is understood about the
effectiveness of Generative AI techniques on low-resource languages such as
Dutch. For this reason, we carry out empirical studies to understand the
benefits and limitations of applying generative technologies for text
simplification and provide the following outcomes: 1) the design and
implementation for a configurable text simplification pipeline that
orchestrates state-of-the-art generative text simplification models, domain and
reader adaptation, and visualisation modules; 2) insights and lessons learned,
showing the strengths of automatic text simplification while exposing the
challenges in handling cultural and commonsense knowledge. These outcomes
represent a first step in the exploration of Dutch text simplification and shed
light on future endeavours both for research and practice.
- Abstract(参考訳): 複雑なテキストは、多くの市民が公開情報や知識にアクセスする際に大きな障壁となる。
しばしば手作業で行われるが、テキストの単純化は、本来の意味を維持しながら、テキストの言語的複雑さを減らすことを目的とした、重要な自然言語処理タスクである。
生成人工知能(AI)の最近の進歩により、語彙レベルと構文レベルの両方で自動テキストの簡略化が可能になった。
しかし、アプリケーションはしばしば英語にフォーカスするため、オランダ語のような低リソース言語におけるジェネレーティブAI技術の有効性についてはほとんど理解されていない。
このため,テキスト簡易化のための生成技術の適用のメリットと限界を理解するために,経験的研究を行い,以下の結果を提供する。
1) 最先端生成テキスト簡易化モデル,ドメイン及びリーダ適応モデル,可視化モジュールを編成する構成可能なテキスト簡易化パイプラインの設計及び実装
2)文化や常識の知識を扱う上での課題を露呈しながら,テキストの自動単純化の強みを示す洞察と教訓。
これらの結果は、オランダ語テキストの単純化を探求する第一歩であり、研究と実践の両方の将来の努力に光を当てた。
関連論文リスト
- Exploring Large Language Models to generate Easy to Read content [1.474723404975345]
読みやすく、平易な言語ガイドラインは、複雑なテキストを簡単にすることを目的としている。
これらのガイドラインの標準化は依然として困難であり、しばしば手作業によるプロセスが伴う。
この研究は、スペイン語のテキストを体系的に簡単読みやすい形式に単純化するために、人工知能(AI)と自然言語処理(NLP)アプローチを活用するための探索的な調査である。
論文 参考訳(メタデータ) (2024-07-29T14:30:39Z) - ARTiST: Automated Text Simplification for Task Guidance in Augmented
Reality [11.23591724305816]
ARTiSTは、数発のプロンプトとGPT-3モデルを使用して、拡張現実のためのテキストの長さとセマンティックコンテンツを最適化する自動テキスト単純化システムである。
16ユーザを対象にした実証実験の結果,ARTiSTは認知負荷を軽減し,従来の手法で修正した未修正テキストとテキストの両方よりも性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2024-02-29T01:58:49Z) - Text2Data: Low-Resource Data Generation with Textual Control [104.38011760992637]
自然言語は、人間が機械とシームレスに対話するための共通かつ直接的な制御信号として機能する。
ラベルのないデータを用いて教師なし拡散モデルを用いて基礎となるデータ分布を理解する新しいアプローチであるText2Dataを提案する。
制御性を確保し、破滅的な忘れを効果的に防止する、新しい制約最適化ベースの学習目標を通じて制御可能な微調整を行う。
論文 参考訳(メタデータ) (2024-02-08T03:41:39Z) - Automatic and Human-AI Interactive Text Generation [27.05024520190722]
本チュートリアルは、最先端の自然言語生成研究の概要を提供する。
テキストからテキストへの生成タスクは、セマンティック一貫性とターゲット言語スタイルの観点からより制約される。
論文 参考訳(メタデータ) (2023-10-05T20:26:15Z) - Multilingual Simplification of Medical Texts [49.469685530201716]
4つの言語で医療領域のための文章整列型多言語テキスト単純化データセットであるMultiCochraneを紹介する。
これらの言語にまたがる微調整およびゼロショットモデルの評価を行い,人間による評価と分析を行った。
モデルは、実行可能な単純化されたテキストを生成することができるが、このデータセットが扱う可能性のある、卓越した課題を特定する。
論文 参考訳(メタデータ) (2023-05-21T18:25:07Z) - Elaborative Simplification as Implicit Questions Under Discussion [51.17933943734872]
本稿では,QUD フレームワークのレンズによる共同作業の簡略化について考察する。
本研究は,QUDを明示的にモデル化することで,作業の単純化と,作業内容と作業内容の関連性について,重要な理解が得られていることを示す。
論文 参考訳(メタデータ) (2023-05-17T17:26:16Z) - Automatic Lexical Simplification for Turkish [0.0]
トルコ語に対する最初の自動語彙単純化システムを提案する。
近年のテキスト単純化の取り組みは、手作業による簡易コーパスと包括的NLPツールに依存している。
本稿では,事前学習された表現モデル BERT に基づく新しいテキスト単純化パイプラインと形態的特徴を併用して,文法的に正しい意味論的に適切な単語レベルの単純化を生成する。
論文 参考訳(メタデータ) (2022-01-15T15:58:44Z) - Elaborative Simplification: Content Addition and Explanation Generation
in Text Simplification [33.08519864889526]
テキスト単純化におけるコンテンツ追加に関する最初のデータ駆動型研究について述べる。
我々は、文脈的特異性のレンズを通して、エンティティ、アイデア、概念がどのように精巧化されているかを分析する。
本研究は, 作業の複雑さを概説し, 今後の課題について多くの興味深い方向性を示唆するものである。
論文 参考訳(メタデータ) (2020-10-20T05:06:23Z) - A Survey of Knowledge-Enhanced Text Generation [81.24633231919137]
テキスト生成の目標は、機械を人間の言語で表現できるようにすることである。
入力テキストを出力テキストにマッピングすることを学ぶことで、目的を達成するために、様々なニューラルエンコーダデコーダモデルが提案されている。
この問題に対処するために、研究者は入力テキスト以外の様々な種類の知識を生成モデルに組み込むことを検討してきた。
論文 参考訳(メタデータ) (2020-10-09T06:46:46Z) - Improving Disentangled Text Representation Learning with
Information-Theoretic Guidance [99.68851329919858]
自然言語の独特な性質は、テキスト表現の分離をより困難にする。
情報理論にインスパイアされた本研究では,テキストの不整合表現を効果的に表現する手法を提案する。
条件付きテキスト生成とテキストスタイル転送の両方の実験は、不整合表現の質を実証する。
論文 参考訳(メタデータ) (2020-06-01T03:36:01Z) - TRIE: End-to-End Text Reading and Information Extraction for Document
Understanding [56.1416883796342]
本稿では,統合されたエンドツーエンドのテキスト読解と情報抽出ネットワークを提案する。
テキスト読解のマルチモーダル視覚的特徴とテキスト的特徴は、情報抽出のために融合される。
提案手法は, 精度と効率の両面において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-05-27T01:47:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。