論文の概要: Quantitative Discourse Cohesion Analysis of Scientific Scholarly Texts
using Multilayer Networks
- arxiv url: http://arxiv.org/abs/2205.07532v1
- Date: Mon, 16 May 2022 09:10:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-17 21:58:10.078861
- Title: Quantitative Discourse Cohesion Analysis of Scientific Scholarly Texts
using Multilayer Networks
- Title(参考訳): 多層ネットワークを用いた学術論文の量的談話結合解析
- Authors: Vasudha Bhatnagar, Swagata Duari, S.K. Gupta
- Abstract要約: 本研究の目的は,多層ネットワーク表現を用いた学術文献における談話の凝集度を計算学的に解析することである。
テキストにおける語彙的凝集度を評価するために,セクションレベルおよび文書レベルのメトリクスを設計する。
本稿では、著者に原稿の潜在的な改善のためのポインタを提供するための分析フレームワークCHIAA(CHeck It Again, Author)を提案する。
- 参考スコア(独自算出の注目度): 10.556468838821338
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discourse cohesion facilitates text comprehension and helps the reader form a
coherent narrative. In this study, we aim to computationally analyze the
discourse cohesion in scientific scholarly texts using multilayer network
representation and quantify the writing quality of the document. Exploiting the
hierarchical structure of scientific scholarly texts, we design section-level
and document-level metrics to assess the extent of lexical cohesion in text. We
use a publicly available dataset along with a curated set of contrasting
examples to validate the proposed metrics by comparing them against select
indices computed using existing cohesion analysis tools. We observe that the
proposed metrics correlate as expected with the existing cohesion indices.
We also present an analytical framework, CHIAA (CHeck It Again, Author), to
provide pointers to the author for potential improvements in the manuscript
with the help of the section-level and document-level metrics. The proposed
CHIAA framework furnishes a clear and precise prescription to the author for
improving writing by localizing regions in text with cohesion gaps. We
demonstrate the efficacy of CHIAA framework using succinct examples from
cohesion-deficient text excerpts in the experimental dataset.
- Abstract(参考訳): 談話の結束はテキスト理解を促進し、読者が一貫性のある物語を作るのを助ける。
本研究では,多層ネットワーク表現を用いた学術文献の談話凝集度を計算学的に解析し,文書の書字品質を定量化する。
学術文献の階層構造を生かして,節レベルと文書レベルのメトリクスを設計・評価し,テキストの語彙結合度を評価する。
既存のコヒーション分析ツールを用いて計算した指標と比較することにより,提案する指標を検証するために,公開データセットとコントラストサンプルのキュレーションセットを使用する。
提案指標は既存の凝集指標と一致している。
また、セクションレベルおよびドキュメントレベルのメトリクスの助けを借りて、原稿の改善の可能性について著者にポインタを提供するために、分析フレームワークchiaa (check it again, author) も提示します。
提案したCHIAAフレームワークは,テキスト中の領域を凝集ギャップでローカライズすることで書き方を改善するために,著者に対して明確かつ正確な処方料を付与する。
実験データセットにおける凝集欠陥テキストからの簡潔な例を用いて,CHIAAフレームワークの有効性を示す。
関連論文リスト
- Pointer-Guided Pre-Training: Infusing Large Language Models with Paragraph-Level Contextual Awareness [3.2925222641796554]
ポインター誘導セグメントオーダリング(SO)は,段落レベルのテキスト表現の文脈的理解を高めることを目的とした,新しい事前学習手法である。
実験の結果,ポインタ誘導型事前学習は複雑な文書構造を理解する能力を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2024-06-06T15:17:51Z) - Re3: A Holistic Framework and Dataset for Modeling Collaborative Document Revision [62.12545440385489]
共同文書リビジョンを共同で分析するためのフレームワークであるRe3を紹介する。
本稿では,Re3-Sciについて紹介する。Re3-Sciは,その行動と意図に応じて手動でラベル付けされた科学的論文の大規模なコーパスである。
我々は,新しいデータを用いて,学術領域における共同文書改訂に関する実証的研究を行った。
論文 参考訳(メタデータ) (2024-05-31T21:19:09Z) - BBScore: A Brownian Bridge Based Metric for Assessing Text Coherence [20.507596002357655]
コヒーレントテキストは本質的に文間の連続的かつ密着的な相互作用を示す。
BBScore(英: BBScore)は、ブラウン橋理論において、テキストコヒーレンスを評価するための基準のない計量である。
論文 参考訳(メタデータ) (2023-12-28T08:34:17Z) - Multi-Dimensional Evaluation of Text Summarization with In-Context
Learning [79.02280189976562]
本稿では,テキスト内学習を用いた多次元評価器として,大規模言語モデルの有効性について検討する。
実験の結果,テキスト要約作業において,文脈内学習に基づく評価手法が学習評価フレームワークと競合していることが判明した。
次に、テキスト内サンプルの選択や数などの要因がパフォーマンスに与える影響を分析する。
論文 参考訳(メタデータ) (2023-06-01T23:27:49Z) - Improve Discourse Dependency Parsing with Contextualized Representations [28.916249926065273]
本稿では,異なるレベルの単位の文脈化表現を符号化するトランスフォーマーの活用を提案する。
記事間で共通に共有される記述パターンの観察に動機付けられ,談話関係の識別をシーケンスラベリングタスクとして扱う新しい手法を提案する。
論文 参考訳(メタデータ) (2022-05-04T14:35:38Z) - Revise and Resubmit: An Intertextual Model of Text-based Collaboration
in Peer Review [52.359007622096684]
ピアレビューは、ほとんどの科学分野における出版プロセスの重要な要素である。
既存のNLP研究は個々のテキストの分析に重点を置いている。
編集補助は、しばしばテキストのペア間の相互作用をモデル化する必要がある。
論文 参考訳(メタデータ) (2022-04-22T16:39:38Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - TextEssence: A Tool for Interactive Analysis of Semantic Shifts Between
Corpora [14.844685568451833]
TextEssenceは、埋め込みを用いたコーポラの比較分析を可能にするインタラクティブなシステムです。
TextEssenceには、軽量なWebベースのインターフェイスに、ビジュアル、隣り合わせ、および類似性ベースの組み込み分析モードが含まれています。
論文 参考訳(メタデータ) (2021-03-19T21:26:28Z) - Hierarchical Bi-Directional Self-Attention Networks for Paper Review
Rating Recommendation [81.55533657694016]
本稿では,階層型双方向自己注意ネットワークフレームワーク(HabNet)を提案する。
具体的には、文エンコーダ(レベル1)、レビュー内エンコーダ(レベル2)、レビュー間エンコーダ(レベル3)の3つのレベルで、論文レビューの階層構造を利用する。
我々は、最終的な受理決定を行う上で有用な予測者を特定することができ、また、数値的なレビュー評価とレビュアーが伝えるテキストの感情の不整合を発見するのに役立てることができる。
論文 参考訳(メタデータ) (2020-11-02T08:07:50Z) - Improving Text Generation Evaluation with Batch Centering and Tempered
Word Mover Distance [24.49032191669509]
類似度指標の符号化表現を改善するための2つの手法を提案する。
さまざまなBERTバックボーンの学習指標について結果を示し、複数のベンチマークでヒトのレーティングとアート相関の状態を達成した。
論文 参考訳(メタデータ) (2020-10-13T03:46:25Z) - Multilevel Text Alignment with Cross-Document Attention [59.76351805607481]
既存のアライメントメソッドは、1つの事前定義されたレベルで動作します。
本稿では,文書を文書間注目要素で表現するための階層的アテンションエンコーダを予め確立した新しい学習手法を提案する。
論文 参考訳(メタデータ) (2020-10-03T02:52:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。