Fugu-MT 論文翻訳(概要): Treebanking User-Generated Content: a UD Based Overview of Guidelines, Corpora and Unified Recommendations

論文の概要: Treebanking User-Generated Content: a UD Based Overview of Guidelines, Corpora and Unified Recommendations

arxiv url: http://arxiv.org/abs/2011.02063v1
Date: Tue, 3 Nov 2020 23:34:42 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-30 05:01:39.006423
Title: Treebanking User-Generated Content: a UD Based Overview of Guidelines, Corpora and Unified Recommendations
Title（参考訳）: ツリーバンクによるユーザ生成コンテンツ: UDによるガイドライン・コーパス・統一勧告の概要
Authors: Manuela Sanguinetti, Lauren Cassidy, Cristina Bosco, \"Ozlem \c{C}etino\u{g}lu, Alessandra Teresa Cignarella, Teresa Lynn, Ines Rehbein, Josef Ruppenhofer, Djam\'e Seddah, Amir Zeldes
Abstract要約: 本稿では、ウェブやソーシャルメディアで見られるユーザ生成テキストの分析に困難をもたらす主要な言語現象について論じる。本研究は,これらのテキストの特定の現象を一貫した処理を促進するための,一時的UDベースのガイドラインのセットを提案する。
参考スコア（独自算出の注目度）: 58.50167394354305
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This article presents a discussion on the main linguistic phenomena which cause difficulties in the analysis of user-generated texts found on the web and in social media, and proposes a set of annotation guidelines for their treatment within the Universal Dependencies (UD) framework of syntactic analysis. Given on the one hand the increasing number of treebanks featuring user-generated content, and its somewhat inconsistent treatment in these resources on the other, the aim of this article is twofold: (1) to provide a condensed, though comprehensive, overview of such treebanks -- based on available literature -- along with their main features and a comparative analysis of their annotation criteria, and (2) to propose a set of tentative UD-based annotation guidelines, to promote consistent treatment of the particular phenomena found in these types of texts. The overarching goal of this article is to provide a common framework for researchers interested in developing similar resources in UD, thus promoting cross-linguistic consistency, which is a principle that has always been central to the spirit of UD.
Abstract（参考訳）: 本稿では,Web やソーシャルメディアにおけるユーザ生成テキストの分析に困難をもたらす主要な言語現象について論じるとともに,構文解析のユニバーサル依存(UD)フレームワーク内での扱いに関するガイドラインのセットを提案する。 Given on the one hand the increasing number of treebanks featuring user-generated content, and its somewhat inconsistent treatment in these resources on the other, the aim of this article is twofold: (1) to provide a condensed, though comprehensive, overview of such treebanks -- based on available literature -- along with their main features and a comparative analysis of their annotation criteria, and (2) to propose a set of tentative UD-based annotation guidelines, to promote consistent treatment of the particular phenomena found in these types of texts. 本稿の総括目標は、UDの精神の中心にある原則である言語間整合性を促進するために、UDで類似のリソースを開発することに関心を持つ研究者に共通のフレームワークを提供することである。

関連論文リスト

SECite: Analyzing and Summarizing Citations in Software Engineering Literature [0.13999481573773073]
SECiteは、引用文脈の感情分析を通じて学術的影響を評価するための新しいアプローチである。我々は,9つの研究論文を参照して引用を抽出する半自動パイプラインを開発した。我々は、教師なし機械学習を用いた高度な自然言語処理(NLP)技術を用いて、これらの引用文を正あるいは負のものとして分類する。
論文参考訳（メタデータ） (2026-01-12T19:10:01Z)
OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment [63.662126457336534]
OpenNoveltyは、透明で証拠に基づく新規性分析のためのエージェントシステムである。回収された実論文のすべての評価を根拠にし、検証可能な判断を確実にする。 OpenNoveltyは、公正で一貫性があり、エビデンスに支えられたピアレビューを促進するスケーラブルなツールで、研究コミュニティに力を与えることを目指している。
論文参考訳（メタデータ） (2026-01-04T15:48:51Z)
Improving Scientific Document Retrieval with Academic Concept Index [47.95234352955763]
汎用ドメインレトリバーを科学領域に適用することは、大規模ドメイン固有の関連アノテーションが不足しているため困難である。最近のアプローチでは、これらの問題を2つの独立した方向で解決している。本稿では,論文から重要な概念を抽出し,学術分類学に導かれる概念を整理する学術概念索引を紹介する。
論文参考訳（メタデータ） (2026-01-02T04:47:49Z)
Contextual Embedding-based Clustering to Identify Topics for Healthcare Service Improvement [3.9726806016869936]
本研究では,米国ウィスコンシン州の医療システムから収集した439件のアンケート結果から,意味のあるトピックを抽出するための教師なし手法について検討した。キーワードに基づくフィルタリング手法を,ドメイン固有辞書を用いた苦情関連フィードバックの分離に適用した。データが不足していて、短文からなるコヒーレンスと解釈可能性を改善するため、kBERTを提案する。
論文参考訳（メタデータ） (2025-04-18T20:38:24Z)
Evaluating LLM-based Agents for Multi-Turn Conversations: A Survey [64.08485471150486]
本研究では,大規模言語モデル(LLM)に基づくマルチターン対話環境におけるエージェントの評価手法について検討する。我々は250近い学術資料を体系的にレビューし、様々な出版場所から芸術の状態を捉えた。
論文参考訳（メタデータ） (2025-03-28T14:08:40Z)
Annotator in the Loop: A Case Study of In-Depth Rater Engagement to Create a Bridging Benchmark Dataset [1.825224193230824]
本稿では,アノテーションのための新規かつ協調的かつ反復的なアノテーション手法について述べる。以上の結果から,アノテータとの連携によりアノテーションの手法が強化されることが示唆された。
論文参考訳（メタデータ） (2024-08-01T19:11:08Z)
Augmenting Textual Generation via Topology Aware Retrieval [30.933176170660683]
トポロジを意識した検索型検索生成フレームワークを開発した。このフレームワークは、トポロジ的関係に基づいてテキストを選択する検索モジュールを含む。我々は,確立したテキスト配信ネットワークをキュレートし,本フレームワークの有効性を検証するための総合的な実験を行った。
論文参考訳（メタデータ） (2024-05-27T19:02:18Z)
A Note on an Inferentialist Approach to Resource Semantics [48.65926948745294]
「推論主義」とは、推論行動の観点で意味が与えられるという考え方である。本稿では,「推論主義」が資源意味論の汎用的で表現力豊かな枠組みを実現する方法を示す。
論文参考訳（メタデータ） (2024-05-10T14:13:21Z)
A Literature Review of Literature Reviews in Pattern Analysis and Machine Intelligence [58.6354685593418]
本稿では, レビューを評価するために, 記事レベル, フィールド正規化, 大規模言語モデルを用いた書誌指標を提案する。新たに登場したAI生成の文献レビューも評価されている。この研究は、文学レビューの現在の課題についての洞察を与え、彼らの開発に向けた今後の方向性を思い起こさせる。
論文参考訳（メタデータ） (2024-02-20T11:28:50Z)
A semantically enhanced dual encoder for aspect sentiment triplet extraction [0.7291396653006809]
アスペクト・センチメント・トリプルト抽出(ASTE)はアスペクト・ベースの感情分析(ABSA)の重要なサブタスクである従来の研究は、革新的なテーブル充填戦略によるASTEの強化に重点を置いてきた。本稿では,BERTをベースとした基本エンコーダと,Bi-LSTMネットワークとGCN(Graph Convolutional Network)で構成される特定のエンコーダの両方を利用するフレームワークを提案する。ベンチマークデータセットを用いた実験により,提案フレームワークの最先端性能を実証した。
論文参考訳（メタデータ） (2023-06-14T09:04:14Z)
Transition-based Abstract Meaning Representation Parsing with Contextual Embeddings [0.0]
本研究では,意味解析のタスクにおいて,言語モデルと記号意味論の定式化という,言語の意味への最も成功したルートを2つ組み合わせる手法について検討する。本稿では,事前学習した文脈認識単語の埋め込み(BERTやRoBERTaなど)を解析問題に組み込むことの有用性について検討する。
論文参考訳（メタデータ） (2022-06-13T15:05:24Z)
A Decomposition-Based Approach for Evaluating and Analyzing Inter-Annotator Disagreement [1.8416014644193066]
本稿では,既存のアノテーションを概念的に別のレベルに分解する手法を提案する。このアプローチを実現するために,2つの異なる戦略を提案する。我々は、アプローチを拡張して一般化する方法を提案するとともに、他の目的のためにそれを使う方法を提案することで締めくくります。
論文参考訳（メタデータ） (2022-06-11T07:02:50Z)
Revise and Resubmit: An Intertextual Model of Text-based Collaboration in Peer Review [52.359007622096684]
ピアレビューは、ほとんどの科学分野における出版プロセスの重要な要素である。既存のNLP研究は個々のテキストの分析に重点を置いている。編集補助は、しばしばテキストのペア間の相互作用をモデル化する必要がある。
論文参考訳（メタデータ） (2022-04-22T16:39:38Z)
Cross-linguistically Consistent Semantic and Syntactic Annotation of Child-directed Speech [27.657676278734534]
本稿では,子指向音声のこのようなコーパスを,感性論理形式と組み合わせて構築する手法を提案する。このアプローチは言語間一貫した表現を強制し、依存関係表現とセマンティック解析の最近の進歩に基づいている。
論文参考訳（メタデータ） (2021-09-22T18:17:06Z)
Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文参考訳（メタデータ） (2021-06-15T20:55:55Z)
Weakly-Supervised Aspect-Based Sentiment Analysis via Joint Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。 We learn sentiment, aspects> joint topic embeddeds in the word embedding space。次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文参考訳（メタデータ） (2020-10-13T21:33:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。