論文の概要: Discourse-Aware Text Simplification: From Complex Sentences to Linked
Propositions
- arxiv url: http://arxiv.org/abs/2308.00425v1
- Date: Tue, 1 Aug 2023 10:10:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-02 14:42:35.754817
- Title: Discourse-Aware Text Simplification: From Complex Sentences to Linked
Propositions
- Title(参考訳): 談話認識テキストの簡易化:複雑な文から連結命題へ
- Authors: Christina Niklaus, Matthias Cetto, Andr\'e Freitas, Siegfried
Handschuh
- Abstract要約: Text Simplification (TS)は、テキストの処理を容易にするために文を変更することを目的としている。
本稿では、複雑な英語文を分割し、言い換える、談話対応のTSアプローチを提案する。
単純化された文の上に意味層を置く最小命題のセマンティック階層を生成する。
- 参考スコア(独自算出の注目度): 11.335080241393191
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sentences that present a complex syntax act as a major stumbling block for
downstream Natural Language Processing applications whose predictive quality
deteriorates with sentence length and complexity. The task of Text
Simplification (TS) may remedy this situation. It aims to modify sentences in
order to make them easier to process, using a set of rewriting operations, such
as reordering, deletion, or splitting. State-of-the-art syntactic TS approaches
suffer from two major drawbacks: first, they follow a very conservative
approach in that they tend to retain the input rather than transforming it, and
second, they ignore the cohesive nature of texts, where context spread across
clauses or sentences is needed to infer the true meaning of a statement. To
address these problems, we present a discourse-aware TS approach that splits
and rephrases complex English sentences within the semantic context in which
they occur. Based on a linguistically grounded transformation stage that uses
clausal and phrasal disembedding mechanisms, complex sentences are transformed
into shorter utterances with a simple canonical structure that can be easily
analyzed by downstream applications. With sentence splitting, we thus address a
TS task that has hardly been explored so far. Moreover, we introduce the notion
of minimality in this context, as we aim to decompose source sentences into a
set of self-contained minimal semantic units. To avoid breaking down the input
into a disjointed sequence of statements that is difficult to interpret because
important contextual information is missing, we incorporate the semantic
context between the split propositions in the form of hierarchical structures
and semantic relationships. In that way, we generate a semantic hierarchy of
minimal propositions that leads to a novel representation of complex assertions
that puts a semantic layer on top of the simplified sentences.
- Abstract(参考訳): 複雑な構文を示す文は、文の長さと複雑さによって予測品質が劣化する下流自然言語処理アプリケーションの大きな障害となる。
text simplification(ts)のタスクは、この状況を改善する可能性がある。
リオーダリング、削除、分割といった一連の書き換え操作を使用して、処理を容易にするために文を修正することを目的としている。
第一に、彼らはそれを変換するよりも入力を保持する傾向があるという非常に保守的なアプローチに従い、第二に、文の真の意味を推測するために文節や文にまたがるコンテキストが必要とされるテキストの凝集性を無視します。
そこで本研究では,これらの問題に対処するために,複雑な英語文を意味的文脈内で分割し,再現する,談話認識型tsアプローチを提案する。
言語的に接地された変換段階に基づき、複雑な文は下流のアプリケーションで容易に分析できる単純な正準構造を持つ短い発話に変換される。
文分割では,これまでほとんど検討されていないTSタスクに対処する。
さらに,この文脈では,ソース文を自己完結した最小意味単位に分解することを目的として,最小性の概念を導入する。
重要な文脈情報が欠落しているために解釈が難しい文列に入力を分解するのを避けるため、分割命題間の意味的文脈を階層構造と意味的関係の形で組み込む。
このようにして、最小命題のセマンティック階層を生成して、単純化された文の上にセマンティック層を置く複雑なアサーションの新たな表現を生み出す。
関連論文リスト
- A Unified View on Forgetting and Strong Equivalence Notions in Answer
Set Programming [14.342696862884704]
文献からすべての関連概念を捉えることができる新しい相対同値概念を導入する。
次に、プロジェクションと(SP)鍛造の緩和を組み合わせた演算子を導入し、相対化単純化を求める。
論文 参考訳(メタデータ) (2023-12-13T09:05:48Z) - Conjunct Resolution in the Face of Verbal Omissions [51.220650412095665]
本稿では,テキスト上で直接動作する接続分解タスクを提案し,コーディネーション構造に欠けている要素を復元するために,分割・言い換えパラダイムを利用する。
クラウドソースアノテーションによる自然に発生する動詞の省略例を10万件以上を含む,大規模なデータセットをキュレートする。
我々は、このタスクのために様々な神経ベースラインをトレーニングし、最良の手法が適切なパフォーマンスを得る一方で、改善のための十分なスペースを残していることを示す。
論文 参考訳(メタデータ) (2023-05-26T08:44:02Z) - Bridging Continuous and Discrete Spaces: Interpretable Sentence
Representation Learning via Compositional Operations [80.45474362071236]
文の合成意味論が埋め込み空間における構成操作として直接反映できるかどうかは不明である。
文埋め込み学習のためのエンドツーエンドフレームワークであるInterSentを提案する。
論文 参考訳(メタデータ) (2023-05-24T00:44:49Z) - Elaborative Simplification as Implicit Questions Under Discussion [51.17933943734872]
本稿では,QUD フレームワークのレンズによる共同作業の簡略化について考察する。
本研究は,QUDを明示的にモデル化することで,作業の単純化と,作業内容と作業内容の関連性について,重要な理解が得られていることを示す。
論文 参考訳(メタデータ) (2023-05-17T17:26:16Z) - Syntactic Complexity Identification, Measurement, and Reduction Through
Controlled Syntactic Simplification [0.0]
本稿では,複合文と複合文を簡易文の集合に分割・言い換える,古典的な構文的依存性に基づく手法を提案する。
また,文の構文的複雑さを同定し,測定するアルゴリズムも導入した。
この研究は、WSDM-2023 Conferenceにおいて、Learning with Knowledge Graphs (IWLKG) に関する国際ワークショップで受け入れられ、発表された。
論文 参考訳(メタデータ) (2023-04-16T13:13:58Z) - Context-Preserving Text Simplification [11.830061911323025]
本稿では、複雑な英語文を単純化された文のセマンティックな階層に分割し、言い換える、文脈保存型テキスト単純化(TS)アプローチを提案する。
言語学的に原則化された変換パターンの集合を用いて、入力文は、修辞的関係を通じてリンクされる中心文と付随する文脈の形式で階層的な表現に変換される。
RST-DTに含まれるアノテーションとの比較分析により,分割文間の文脈的階層を89%の精度で捉え,それらの間に保持される修辞関係の分類において平均69%の精度で到達できることが示された。
論文 参考訳(メタデータ) (2021-05-24T09:54:56Z) - Controllable Text Simplification with Explicit Paraphrasing [88.02804405275785]
テキストの単純化は、語彙パラフレーズ、削除、分割など、いくつかの書き換え変換を通じて文の可読性を向上させる。
現在の単純化システムは、主にシーケンス・ツー・シーケンスのモデルであり、これらすべての操作を同時に実行するためにエンドツーエンドで訓練されている。
そこで我々は,言語的に動機づけられた規則を用いて分割と削除を行い,それらをニューラルパラフレーズモデルと組み合わせて様々な書き直しスタイルを創出するハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2020-10-21T13:44:40Z) - XTE: Explainable Text Entailment [8.036150169408241]
あるテキストが論理的に他のテキストから続くかどうかを判断する作業である。
XTE (Explainable Text Entailment) は、テキストエンターメントを認識するための新しい複合アプローチである。
論文 参考訳(メタデータ) (2020-09-25T20:49:07Z) - Explainable Prediction of Text Complexity: The Missing Preliminaries for
Text Simplification [13.447565774887215]
テキストの単純化により、アクセシビリティーのためにプロのコンテンツが複雑になる。
入力テキストの簡易版を直接生成するために、エンドツーエンドのニューラルネットワークモデルが広く採用されている。
テキストの単純化をタスクのコンパクトなパイプラインに分解することで、プロセスの透明性と説明可能性を確保することができることを示す。
論文 参考訳(メタデータ) (2020-07-31T03:33:37Z) - ASSET: A Dataset for Tuning and Evaluation of Sentence Simplification
Models with Multiple Rewriting Transformations [97.27005783856285]
本稿では,英語で文の単純化を評価するための新しいデータセットであるASSETを紹介する。
ASSETの単純化は、タスクの他の標準評価データセットと比較して、単純さの特徴を捉えるのに優れていることを示す。
論文 参考訳(メタデータ) (2020-05-01T16:44:54Z) - Syn-QG: Syntactic and Shallow Semantic Rules for Question Generation [49.671882751569534]
我々は、宣言文を質問応答対に変換する透明な統語規則であるSynQGを開発した。
PropBankの引数記述とVerbNet状態述語を利用して、浅いセマンティックコンテンツを組み込む。
文法的不正確な質問を排除し,構文の流布性を改善するために,これらの構文規則のアウトプットを逆翻訳する。
論文 参考訳(メタデータ) (2020-04-18T19:57:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。