論文の概要: Revision for Concision: A Constrained Paraphrase Generation Task
- arxiv url: http://arxiv.org/abs/2210.14257v1
- Date: Tue, 25 Oct 2022 18:20:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 14:04:13.853568
- Title: Revision for Concision: A Constrained Paraphrase Generation Task
- Title(参考訳): 簡潔化のためのリビジョン:制約付きパラフレーズ生成タスク
- Authors: Wenchuan Mu and Kwan Hui Lim
- Abstract要約: 簡潔化のための修正は、文レベルでの自然言語処理タスクである。
簡潔化のためには、アルゴリズムは文を書き換えるために必要な単語のみを使用する必要がある。
我々は、精度向上のための修正を描写できるベンチマーク並列データセットをキュレートし、利用可能にします。
- 参考スコア(独自算出の注目度): 0.3121997724420106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Academic writing should be concise as concise sentences better keep the
readers' attention and convey meaning clearly. Writing concisely is
challenging, for writers often struggle to revise their drafts. We introduce
and formulate revising for concision as a natural language processing task at
the sentence level. Revising for concision requires algorithms to use only
necessary words to rewrite a sentence while preserving its meaning. The revised
sentence should be evaluated according to its word choice, sentence structure,
and organization. The revised sentence also needs to fulfil semantic retention
and syntactic soundness. To aide these efforts, we curate and make available a
benchmark parallel dataset that can depict revising for concision. The dataset
contains 536 pairs of sentences before and after revising, and all pairs are
collected from college writing centres. We also present and evaluate the
approaches to this problem, which may assist researchers in this area.
- Abstract(参考訳): 簡潔な文は読者の注意を引かせ、意味を明確に伝えるのがよいので、学術的な文章は簡潔であるべきだ。
作家はしばしば草稿の改訂に苦労するので、簡潔に書くことは難しい。
文レベルでの自然言語処理タスクとして、決定の修正を導入し、定式化する。
決定の修正は、アルゴリズムが意味を維持しながら文を書き換えるために必要な単語のみを使用する必要がある。
修正文は、単語の選択、文構造、組織に応じて評価されるべきである。
改訂された文は意味的保持と構文的健全性も満たす必要がある。
これらの取り組みを支援するため、精度向上のための修正を図示できるベンチマーク並列データセットをキュレートし、利用可能にします。
データセットは、修正前後の536対の文を含み、全てのペアは大学の筆記センターから収集される。
また,本領域の研究者を支援するために,この問題に対するアプローチを提示し,評価する。
関連論文リスト
- Analysing Zero-Shot Readability-Controlled Sentence Simplification [54.09069745799918]
本研究では,異なる種類の文脈情報が,所望の可読性を持つ文を生成するモデルの能力に与える影響について検討する。
結果から,全ての試験されたモデルは,原文の制限や特徴のため,文の簡略化に苦慮していることがわかった。
実験では、RCTSに合わせたより良い自動評価指標の必要性も強調した。
論文 参考訳(メタデータ) (2024-09-30T12:36:25Z) - Fine-grained Controllable Text Generation through In-context Learning with Feedback [57.396980277089135]
本稿では,依存度などの非自明な言語的特徴の特定の値に一致させるために,入力文を書き換える手法を提案する。
従来の研究とは対照的に、本手法は微調整ではなく文脈内学習を用いており、データが少ないユースケースに適用できる。
論文 参考訳(メタデータ) (2024-06-17T08:55:48Z) - To Revise or Not to Revise: Learning to Detect Improvable Claims for
Argumentative Writing Support [20.905660642919052]
特定の修正が必要な議論的クレームを特定するための主な課題について検討する。
本稿では,リビジョン距離に基づく新しいサンプリング戦略を提案する。
文脈情報とドメイン知識を用いることで、予測結果をさらに改善できることを示す。
論文 参考訳(メタデータ) (2023-05-26T10:19:54Z) - Conjunct Resolution in the Face of Verbal Omissions [51.220650412095665]
本稿では,テキスト上で直接動作する接続分解タスクを提案し,コーディネーション構造に欠けている要素を復元するために,分割・言い換えパラダイムを利用する。
クラウドソースアノテーションによる自然に発生する動詞の省略例を10万件以上を含む,大規模なデータセットをキュレートする。
我々は、このタスクのために様々な神経ベースラインをトレーニングし、最良の手法が適切なパフォーマンスを得る一方で、改善のための十分なスペースを残していることを示す。
論文 参考訳(メタデータ) (2023-05-26T08:44:02Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - SNaC: Coherence Error Detection for Narrative Summarization [73.48220043216087]
SNaCは長文の微粒化アノテーションに根ざした物語コヒーレンス評価フレームワークである。
本稿では,生成した物語要約におけるコヒーレンスエラーの分類法を開発し,150冊の本や映画の脚本要約にまたがる6.6k文のスパンレベルアノテーションを収集する。
我々の研究は、最先端の要約モデルによって生成されるコヒーレンスエラーの最初の特徴と、群衆アノテータからコヒーレンス判断を引き出すためのプロトコルを提供する。
論文 参考訳(メタデータ) (2022-05-19T16:01:47Z) - A Dataset for Discourse Structure in Peer Review Discussions [33.621647816641925]
反感からの言論の手がかりは、レビューの品質と解釈に光を当てることができることを示す。
本稿では,20k文のラベル付きデータセットを英語で506対のレビュー・リビュー・ペアに収録し,専門家が注釈を付けた。
論文 参考訳(メタデータ) (2021-10-16T09:18:12Z) - Reformulating Sentence Ordering as Conditional Text Generation [17.91448517871621]
文順序フレームワークであるReorder-BART(RE-BART)を紹介します。
タスクを条件付きテキスト-マーカー生成設定として再構成します。
私たちのフレームワークは、Perfect Match Ratio(PMR)とKendallのtau($tau$)メトリックの6つのデータセットにわたる最先端のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-04-14T18:16:47Z) - Narrative Incoherence Detection [76.43894977558811]
本稿では,文間セマンティック理解のための新たなアリーナとして,物語不整合検出の課題を提案する。
複数文の物語を考えると、物語の流れに意味的な矛盾があるかどうかを決定します。
論文 参考訳(メタデータ) (2020-12-21T07:18:08Z) - Rewriting Meaningful Sentences via Conditional BERT Sampling and an
application on fooling text classifiers [11.49508308643065]
テキスト分類器を欺くように設計された敵攻撃法は、いくつかの単語や文字を変更することで、テキスト分類器の予測を変更する。
文レベルの言い直しに固有の難しさや、正統な書き直し基準を設定することの難しさから、文全体を書き換えて分類子を攻撃しようとする者はほとんどいない。
本稿では,文レベルの書き換えによる逆例作成の問題について検討する。
我々は文レベルの脅威モデルと呼ばれる新しい修正基準を提案し、この基準は単語レベルの変更と文レベルの変更の両方を可能にし、意味的類似性と2つの次元で独立に調整できる。
論文 参考訳(メタデータ) (2020-10-22T17:03:13Z) - Understanding Points of Correspondence between Sentences for Abstractive
Summarization [39.7404761923196]
本稿では,文書から引き出された文の融合について,対応点の概念を導入して検討する。
我々は、文書、ソースおよび融合文、および文間の対応点の人間のアノテーションを含むデータセットを作成する。
論文 参考訳(メタデータ) (2020-06-10T02:42:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。