論文の概要: Unsupervised Sentence Simplification via Dependency Parsing
- arxiv url: http://arxiv.org/abs/2206.12261v1
- Date: Fri, 10 Jun 2022 07:55:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-04 04:11:58.929137
- Title: Unsupervised Sentence Simplification via Dependency Parsing
- Title(参考訳): 依存構文解析による教師なし文の単純化
- Authors: Vy Vo, Weiqing Wang and Wray Buntine
- Abstract要約: 本稿では,単純だが教師なしの文簡略化システムを提案する。
構文解析と文の埋め込みを利用して言語学的に効果的な単純化を生成する。
我々は、テュルクコルプスの39.13 SARIにおいて、教師なしの最先端を定め、様々な品質指標の教師なしベースラインに対して競争的に行動する。
- 参考スコア(独自算出の注目度): 4.337513096197002
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text simplification is the task of rewriting a text so that it is readable
and easily understood. In this paper, we propose a simple yet novel
unsupervised sentence simplification system that harnesses parsing structures
together with sentence embeddings to produce linguistically effective
simplifications. This means our model is capable of introducing substantial
modifications to simplify a sentence while maintaining its original semantics
and adequate fluency. We establish the unsupervised state-of-the-art at 39.13
SARI on TurkCorpus set and perform competitively against supervised baselines
on various quality metrics. Furthermore, we demonstrate our framework's
extensibility to other languages via a proof-of-concept on Vietnamese data.
Code for reproduction is published at \url{https://github.com/isVy08/USDP}.
- Abstract(参考訳): テキストの簡易化は、読みやすく理解しやすいようにテキストを書き換える作業である。
本稿では,構文解析構造と文埋め込みを併用し,言語的に効果的な単純化を実現する,単純かつ教師なし文簡易化システムを提案する。
つまり,本モデルでは,文の意味性を維持しつつ,文章を単純化するための大幅な修正が可能となる。
我々はテュルクコープスの39.13サリーに教師なしの最先端技術を確立し,様々な品質指標の教師なしベースラインと競合して実行する。
さらに,ベトナム語データに対する概念実証を通じて,他言語への拡張性を示す。
再生コードは \url{https://github.com/isVy08/USDP} で公開されている。
関連論文リスト
- A New Dataset and Empirical Study for Sentence Simplification in Chinese [50.0624778757462]
本稿では,中国語で文の単純化を評価するための新しいデータセットであるCSSを紹介する。
我々は、人間のアノテーションから手作業による単純化を収集し、英語と中国語の文の簡易化の違いを示すデータ解析を行う。
最後に,CSS上で評価することで,大言語モデルが高品質な中国語文の簡易化システムとして機能するかどうかを考察する。
論文 参考訳(メタデータ) (2023-06-07T06:47:34Z) - Elaborative Simplification as Implicit Questions Under Discussion [51.17933943734872]
本稿では,QUD フレームワークのレンズによる共同作業の簡略化について考察する。
本研究は,QUDを明示的にモデル化することで,作業の単純化と,作業内容と作業内容の関連性について,重要な理解が得られていることを示す。
論文 参考訳(メタデータ) (2023-05-17T17:26:16Z) - Context-Aware Document Simplification [3.2880869992413237]
単純化プロセス自体で文書コンテキストを使用するシステムについて検討する。
我々は,計画指導に頼らずとも,文書の簡略化作業における最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-05-10T16:06:36Z) - Syntactic Complexity Identification, Measurement, and Reduction Through
Controlled Syntactic Simplification [0.0]
本稿では,複合文と複合文を簡易文の集合に分割・言い換える,古典的な構文的依存性に基づく手法を提案する。
また,文の構文的複雑さを同定し,測定するアルゴリズムも導入した。
この研究は、WSDM-2023 Conferenceにおいて、Learning with Knowledge Graphs (IWLKG) に関する国際ワークショップで受け入れられ、発表された。
論文 参考訳(メタデータ) (2023-04-16T13:13:58Z) - Text Revision by On-the-Fly Representation Optimization [76.11035270753757]
現在の最先端手法は、これらのタスクをシーケンスからシーケンスまでの学習問題として定式化している。
並列データを必要としないテキストリビジョンのための反復的なインプレース編集手法を提案する。
テキストの単純化に関する最先端の教師付き手法よりも、競争力があり、パフォーマンスも向上する。
論文 参考訳(メタデータ) (2022-04-15T07:38:08Z) - Automatic Lexical Simplification for Turkish [0.0]
トルコ語に対する最初の自動語彙単純化システムを提案する。
近年のテキスト単純化の取り組みは、手作業による簡易コーパスと包括的NLPツールに依存している。
本稿では,事前学習された表現モデル BERT に基づく新しいテキスト単純化パイプラインと形態的特徴を併用して,文法的に正しい意味論的に適切な単語レベルの単純化を生成する。
論文 参考訳(メタデータ) (2022-01-15T15:58:44Z) - Text Simplification for Comprehension-based Question-Answering [7.144235435987265]
広く使われているSQuADデータセットの簡易バージョンであるSimple-SQuADをリリースする。
新たに作成したコーパスをベンチマークし,SQuADに基づく質問応答課題における単純化プロセスの効果を検討するためのアブレーション研究を行った。
論文 参考訳(メタデータ) (2021-09-28T18:48:00Z) - Dependency Induction Through the Lens of Visual Perception [81.91502968815746]
本稿では,単語の具体性を利用した教師なし文法帰納モデルと,構成的視覚に基づく構成的文法を共同学習する手法を提案する。
実験により,提案した拡張は,文法的サイズが小さい場合でも,現在最先端の視覚的接地モデルよりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-09-20T18:40:37Z) - Controllable Text Simplification with Explicit Paraphrasing [88.02804405275785]
テキストの単純化は、語彙パラフレーズ、削除、分割など、いくつかの書き換え変換を通じて文の可読性を向上させる。
現在の単純化システムは、主にシーケンス・ツー・シーケンスのモデルであり、これらすべての操作を同時に実行するためにエンドツーエンドで訓練されている。
そこで我々は,言語的に動機づけられた規則を用いて分割と削除を行い,それらをニューラルパラフレーズモデルと組み合わせて様々な書き直しスタイルを創出するハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2020-10-21T13:44:40Z) - Elaborative Simplification: Content Addition and Explanation Generation
in Text Simplification [33.08519864889526]
テキスト単純化におけるコンテンツ追加に関する最初のデータ駆動型研究について述べる。
我々は、文脈的特異性のレンズを通して、エンティティ、アイデア、概念がどのように精巧化されているかを分析する。
本研究は, 作業の複雑さを概説し, 今後の課題について多くの興味深い方向性を示唆するものである。
論文 参考訳(メタデータ) (2020-10-20T05:06:23Z) - ASSET: A Dataset for Tuning and Evaluation of Sentence Simplification
Models with Multiple Rewriting Transformations [97.27005783856285]
本稿では,英語で文の単純化を評価するための新しいデータセットであるASSETを紹介する。
ASSETの単純化は、タスクの他の標準評価データセットと比較して、単純さの特徴を捉えるのに優れていることを示す。
論文 参考訳(メタデータ) (2020-05-01T16:44:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。