論文の概要: Treebanking User-Generated Content: a UD Based Overview of Guidelines,
Corpora and Unified Recommendations
- arxiv url: http://arxiv.org/abs/2011.02063v1
- Date: Tue, 3 Nov 2020 23:34:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 05:01:39.006423
- Title: Treebanking User-Generated Content: a UD Based Overview of Guidelines,
Corpora and Unified Recommendations
- Title(参考訳): ツリーバンクによるユーザ生成コンテンツ: UDによるガイドライン・コーパス・統一勧告の概要
- Authors: Manuela Sanguinetti, Lauren Cassidy, Cristina Bosco, \"Ozlem
\c{C}etino\u{g}lu, Alessandra Teresa Cignarella, Teresa Lynn, Ines Rehbein,
Josef Ruppenhofer, Djam\'e Seddah, Amir Zeldes
- Abstract要約: 本稿では、ウェブやソーシャルメディアで見られるユーザ生成テキストの分析に困難をもたらす主要な言語現象について論じる。
本研究は,これらのテキストの特定の現象を一貫した処理を促進するための,一時的UDベースのガイドラインのセットを提案する。
- 参考スコア(独自算出の注目度): 58.50167394354305
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This article presents a discussion on the main linguistic phenomena which
cause difficulties in the analysis of user-generated texts found on the web and
in social media, and proposes a set of annotation guidelines for their
treatment within the Universal Dependencies (UD) framework of syntactic
analysis. Given on the one hand the increasing number of treebanks featuring
user-generated content, and its somewhat inconsistent treatment in these
resources on the other, the aim of this article is twofold: (1) to provide a
condensed, though comprehensive, overview of such treebanks -- based on
available literature -- along with their main features and a comparative
analysis of their annotation criteria, and (2) to propose a set of tentative
UD-based annotation guidelines, to promote consistent treatment of the
particular phenomena found in these types of texts. The overarching goal of
this article is to provide a common framework for researchers interested in
developing similar resources in UD, thus promoting cross-linguistic
consistency, which is a principle that has always been central to the spirit of
UD.
- Abstract(参考訳): 本稿では,Web やソーシャルメディアにおけるユーザ生成テキストの分析に困難をもたらす主要な言語現象について論じるとともに,構文解析のユニバーサル依存(UD)フレームワーク内での扱いに関するガイドラインのセットを提案する。
Given on the one hand the increasing number of treebanks featuring user-generated content, and its somewhat inconsistent treatment in these resources on the other, the aim of this article is twofold: (1) to provide a condensed, though comprehensive, overview of such treebanks -- based on available literature -- along with their main features and a comparative analysis of their annotation criteria, and (2) to propose a set of tentative UD-based annotation guidelines, to promote consistent treatment of the particular phenomena found in these types of texts.
本稿の総括目標は、UDの精神の中心にある原則である言語間整合性を促進するために、UDで類似のリソースを開発することに関心を持つ研究者に共通のフレームワークを提供することである。
関連論文リスト
- Annotator in the Loop: A Case Study of In-Depth Rater Engagement to Create a Bridging Benchmark Dataset [1.825224193230824]
本稿では,アノテーションのための新規かつ協調的かつ反復的なアノテーション手法について述べる。
以上の結果から,アノテータとの連携によりアノテーションの手法が強化されることが示唆された。
論文 参考訳(メタデータ) (2024-08-01T19:11:08Z) - Augmenting Textual Generation via Topology Aware Retrieval [30.933176170660683]
トポロジを意識した検索型検索生成フレームワークを開発した。
このフレームワークは、トポロジ的関係に基づいてテキストを選択する検索モジュールを含む。
我々は,確立したテキスト配信ネットワークをキュレートし,本フレームワークの有効性を検証するための総合的な実験を行った。
論文 参考訳(メタデータ) (2024-05-27T19:02:18Z) - A Note on an Inferentialist Approach to Resource Semantics [48.65926948745294]
「推論主義」とは、推論行動の観点で意味が与えられるという考え方である。
本稿では,「推論主義」が資源意味論の汎用的で表現力豊かな枠組みを実現する方法を示す。
論文 参考訳(メタデータ) (2024-05-10T14:13:21Z) - A Literature Review of Literature Reviews in Pattern Analysis and Machine Intelligence [58.6354685593418]
本稿では, レビューを評価するために, 記事レベル, フィールド正規化, 大規模言語モデルを用いた書誌指標を提案する。
新たに登場したAI生成の文献レビューも評価されている。
この研究は、文学レビューの現在の課題についての洞察を与え、彼らの開発に向けた今後の方向性を思い起こさせる。
論文 参考訳(メタデータ) (2024-02-20T11:28:50Z) - A semantically enhanced dual encoder for aspect sentiment triplet
extraction [0.7291396653006809]
アスペクト・センチメント・トリプルト抽出(ASTE)はアスペクト・ベースの感情分析(ABSA)の重要なサブタスクである
従来の研究は、革新的なテーブル充填戦略によるASTEの強化に重点を置いてきた。
本稿では,BERTをベースとした基本エンコーダと,Bi-LSTMネットワークとGCN(Graph Convolutional Network)で構成される特定のエンコーダの両方を利用するフレームワークを提案する。
ベンチマークデータセットを用いた実験により,提案フレームワークの最先端性能を実証した。
論文 参考訳(メタデータ) (2023-06-14T09:04:14Z) - Transition-based Abstract Meaning Representation Parsing with Contextual
Embeddings [0.0]
本研究では,意味解析のタスクにおいて,言語モデルと記号意味論の定式化という,言語の意味への最も成功したルートを2つ組み合わせる手法について検討する。
本稿では,事前学習した文脈認識単語の埋め込み(BERTやRoBERTaなど)を解析問題に組み込むことの有用性について検討する。
論文 参考訳(メタデータ) (2022-06-13T15:05:24Z) - Revise and Resubmit: An Intertextual Model of Text-based Collaboration
in Peer Review [52.359007622096684]
ピアレビューは、ほとんどの科学分野における出版プロセスの重要な要素である。
既存のNLP研究は個々のテキストの分析に重点を置いている。
編集補助は、しばしばテキストのペア間の相互作用をモデル化する必要がある。
論文 参考訳(メタデータ) (2022-04-22T16:39:38Z) - Cross-linguistically Consistent Semantic and Syntactic Annotation of Child-directed Speech [27.657676278734534]
本稿では,子指向音声のこのようなコーパスを,感性論理形式と組み合わせて構築する手法を提案する。
このアプローチは言語間一貫した表現を強制し、依存関係表現とセマンティック解析の最近の進歩に基づいている。
論文 参考訳(メタデータ) (2021-09-22T18:17:06Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。