論文の概要: Treebanking User-Generated Content: a UD Based Overview of Guidelines,
Corpora and Unified Recommendations
- arxiv url: http://arxiv.org/abs/2011.02063v1
- Date: Tue, 3 Nov 2020 23:34:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 05:01:39.006423
- Title: Treebanking User-Generated Content: a UD Based Overview of Guidelines,
Corpora and Unified Recommendations
- Title(参考訳): ツリーバンクによるユーザ生成コンテンツ: UDによるガイドライン・コーパス・統一勧告の概要
- Authors: Manuela Sanguinetti, Lauren Cassidy, Cristina Bosco, \"Ozlem
\c{C}etino\u{g}lu, Alessandra Teresa Cignarella, Teresa Lynn, Ines Rehbein,
Josef Ruppenhofer, Djam\'e Seddah, Amir Zeldes
- Abstract要約: 本稿では、ウェブやソーシャルメディアで見られるユーザ生成テキストの分析に困難をもたらす主要な言語現象について論じる。
本研究は,これらのテキストの特定の現象を一貫した処理を促進するための,一時的UDベースのガイドラインのセットを提案する。
- 参考スコア(独自算出の注目度): 58.50167394354305
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This article presents a discussion on the main linguistic phenomena which
cause difficulties in the analysis of user-generated texts found on the web and
in social media, and proposes a set of annotation guidelines for their
treatment within the Universal Dependencies (UD) framework of syntactic
analysis. Given on the one hand the increasing number of treebanks featuring
user-generated content, and its somewhat inconsistent treatment in these
resources on the other, the aim of this article is twofold: (1) to provide a
condensed, though comprehensive, overview of such treebanks -- based on
available literature -- along with their main features and a comparative
analysis of their annotation criteria, and (2) to propose a set of tentative
UD-based annotation guidelines, to promote consistent treatment of the
particular phenomena found in these types of texts. The overarching goal of
this article is to provide a common framework for researchers interested in
developing similar resources in UD, thus promoting cross-linguistic
consistency, which is a principle that has always been central to the spirit of
UD.
- Abstract(参考訳): 本稿では,Web やソーシャルメディアにおけるユーザ生成テキストの分析に困難をもたらす主要な言語現象について論じるとともに,構文解析のユニバーサル依存(UD)フレームワーク内での扱いに関するガイドラインのセットを提案する。
Given on the one hand the increasing number of treebanks featuring user-generated content, and its somewhat inconsistent treatment in these resources on the other, the aim of this article is twofold: (1) to provide a condensed, though comprehensive, overview of such treebanks -- based on available literature -- along with their main features and a comparative analysis of their annotation criteria, and (2) to propose a set of tentative UD-based annotation guidelines, to promote consistent treatment of the particular phenomena found in these types of texts.
本稿の総括目標は、UDの精神の中心にある原則である言語間整合性を促進するために、UDで類似のリソースを開発することに関心を持つ研究者に共通のフレームワークを提供することである。
関連論文リスト
- A Literature Review of Literature Reviews in Pattern Analysis and
Machine Intelligence [62.90682521144006]
この分析は、様々な観点からPAMI分野のレビューを徹底的にレビューすることを目的としている。
書評を自動評価するために,大規模言語モデルを用いた書評指標を提案する。
新たに登場したAI生成の文献レビューも評価されている。
論文 参考訳(メタデータ) (2024-02-20T11:28:50Z) - Document-Level Supervision for Multi-Aspect Sentiment Analysis Without
Fine-grained Labels [14.187425779776204]
本稿では,文書レベルの監視を用いてABSAを実行するVAEベースのトピックモデリング手法を提案する。
この手法により、文書内の複数の側面を検知し、複数の側面を通して表現された感情がどのように集まって、観察可能な文書レベルの感情を形成するのかを推論することが可能になる。
論文 参考訳(メタデータ) (2023-10-10T18:53:21Z) - A semantically enhanced dual encoder for aspect sentiment triplet
extraction [0.7291396653006809]
アスペクト・センチメント・トリプルト抽出(ASTE)はアスペクト・ベースの感情分析(ABSA)の重要なサブタスクである
従来の研究は、革新的なテーブル充填戦略によるASTEの強化に重点を置いてきた。
本稿では,BERTをベースとした基本エンコーダと,Bi-LSTMネットワークとGCN(Graph Convolutional Network)で構成される特定のエンコーダの両方を利用するフレームワークを提案する。
ベンチマークデータセットを用いた実験により,提案フレームワークの最先端性能を実証した。
論文 参考訳(メタデータ) (2023-06-14T09:04:14Z) - Advancing Topic Segmentation and Outline Generation in Chinese Texts:
The Paragraph-level Topic Representation, Corpus, and Benchmark [68.37789691077892]
タイトル,サブヘッダ,段落を含む階層的な段落レベルのトピック構造表現を導入する。
我々は,これまでで最大であった4倍の大きさの中国段落レベルのトピック構造コーパス(CPTS)を構築した。
我々は,2つの基本課題(トピックセグメンテーションとアウトライン生成)におけるCPTSの計算可能性について,いくつかの強いベースラインで検証し,その有効性は下流タスクにおいて予め確認されている:談話解析である。
論文 参考訳(メタデータ) (2023-05-24T06:43:23Z) - Transition-based Abstract Meaning Representation Parsing with Contextual
Embeddings [0.0]
本研究では,意味解析のタスクにおいて,言語モデルと記号意味論の定式化という,言語の意味への最も成功したルートを2つ組み合わせる手法について検討する。
本稿では,事前学習した文脈認識単語の埋め込み(BERTやRoBERTaなど)を解析問題に組み込むことの有用性について検討する。
論文 参考訳(メタデータ) (2022-06-13T15:05:24Z) - Revise and Resubmit: An Intertextual Model of Text-based Collaboration
in Peer Review [52.359007622096684]
ピアレビューは、ほとんどの科学分野における出版プロセスの重要な要素である。
既存のNLP研究は個々のテキストの分析に重点を置いている。
編集補助は、しばしばテキストのペア間の相互作用をモデル化する必要がある。
論文 参考訳(メタデータ) (2022-04-22T16:39:38Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Deep Context- and Relation-Aware Learning for Aspect-based Sentiment
Analysis [3.7175198778996483]
本研究では,深い文脈情報を持つサブタスク間での対話的関係を実現するディープ・コンテクスチュアライズド・リレーア・アウェア・ネットワーク(DCRAN)を提案する。
DCRANは3つの広く使用されているベンチマークにおいて、従来の最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2021-06-07T17:16:15Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。