論文の概要: MaiBaam Annotation Guidelines
- arxiv url: http://arxiv.org/abs/2403.05902v2
- Date: Fri, 18 Oct 2024 09:39:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-21 14:22:37.728728
- Title: MaiBaam Annotation Guidelines
- Title(参考訳): MaiBaamアノテーションガイドライン
- Authors: Verena Blaschke, Barbara Kovačić, Siyao Peng, Barbara Plank,
- Abstract要約: この文書は、バイエルンのコーパスであるMaiBaamのアノテーションガイドラインを提供する。
MaiBaamは、Universal Dependencies (UD)プロジェクトに属しており、一般およびドイツのUDバージョン2ガイドラインを詳述しています。
- 参考スコア(独自算出の注目度): 21.10847426724405
- License:
- Abstract: This document provides the annotation guidelines for MaiBaam, a Bavarian corpus manually annotated with part-of-speech (POS) tags, syntactic dependencies, and German lemmas. MaiBaam belongs to the Universal Dependencies (UD) project, and our annotations elaborate on the general and German UD version 2 guidelines. In this document, we detail how to preprocess and tokenize Bavarian data, provide an overview of the POS tags and dependencies we use, explain annotation decisions that would also apply to closely related languages like German, and lastly we introduce and motivate decisions that are specific to Bavarian grammar.
- Abstract(参考訳): この文書は、バイエルンのコーパスであるMaiBaamのアノテーションガイドラインを提供する。
MaiBaamは、Universal Dependencies (UD)プロジェクトに属しており、一般およびドイツのUDバージョン2ガイドラインを詳述しています。
本稿では,バイエルン語のデータの事前処理とトークン化方法,使用するPOSタグと依存関係の概要,ドイツ語などの近縁な言語にも適用可能なアノテーション決定の説明,さらにバイエルン語の文法に特有の決定の導入と動機付けについて述べる。
関連論文リスト
- MaiBaam: A Multi-Dialectal Bavarian Universal Dependency Treebank [56.810282574817414]
We present the first multi-dialect Bavarian treebank (MaiBaam) based with part-of-speech and syntactic dependency information in Universal Dependencies (UD)。
我々は、近縁なバイエルン語とドイツ語のモルフォシンタクティックな相違を強調し、話者の正書法の豊富な多様性を示す。
私たちのコーパスには15kのトークンが含まれており、3つの国にまたがるバイエルン語を話すすべての地域の方言をカバーしています。
論文 参考訳(メタデータ) (2024-03-15T13:33:10Z) - FRACAS: A FRench Annotated Corpus of Attribution relations in newS [0.0]
引用抽出と情報源帰属のために,フランス語で1676年のニュースワイヤテキストを手作業で注釈付けしたコーパスを提示する。
まず,データ選択時のコーパスの構成と選択について述べる。
次に、手動ラベリングに取り組んでいる8つのアノテータ間のアノテータ間合意について詳述する。
論文 参考訳(メタデータ) (2023-09-19T13:19:54Z) - Quotations, Coreference Resolution, and Sentiment Annotations in
Croatian News Articles: An Exploratory Study [0.0]
本論文はクロアチアのSETimesニュースコーパスにおける引用,共参照解決,感情アノテーションのアノテーションに焦点を当てている。
引用機能アノテーションを備えた生成されたコーパスは、自然言語処理の分野における複数のタスクに使用できる。
論文 参考訳(メタデータ) (2022-12-14T11:54:12Z) - Multilingual Word Sense Disambiguation with Unified Sense Representation [55.3061179361177]
本稿では,知識と教師付き多言語単語センス曖昧化(MWSD)システムを提案する。
我々は複数の言語に統一されたセンス表現を構築し、リッチソース言語から貧しい言語へアノテーションを転送することでMWSDのアノテーション不足問題に対処する。
SemEval-13およびSemEval-15データセットの評価により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-10-14T01:24:03Z) - Discourse Analysis via Questions and Answers: Parsing Dependency
Structures of Questions Under Discussion [57.43781399856913]
この研究は、談話分析にQUD(Language framework of Questions Under discussion)を採用する。
我々は、文間の関係を、徹底的なきめ細かい質問とは対照的に、自由形式の質問として特徴づける。
完全文書上の質問の依存関係構造を導出する第一種QUDを開発する。
論文 参考訳(メタデータ) (2022-10-12T03:53:12Z) - Chinese Discourse Annotation Reference Manual [9.367612782346207]
この文書は、中国語における修辞構造論(RST)の注釈に関する広範なガイドラインと例を提供している。
まず、RSTアノテーションのためのデータ準備のための前処理手順を紹介する。
第二に、テキストを初等談話単位(EDU)に分割するための統語的基準について議論する。
最後に、異なるジャンルにおける談話関係を定義し、区別する例を示す。
論文 参考訳(メタデータ) (2022-10-11T11:02:42Z) - BERT-Assisted Semantic Annotation Correction for Emotion-Related
Questions [0.0]
EMO20Q(Emotion Twenty Questions)と呼ばれる質問ゲームにおいて,BERTニューラルネットワークモデルを用いてアノテーションタスクに情報をフィードバックする。
本手法は,テキストユーザデータのアノテーションを,複雑な発話レベルのセマンティックラベルで評価・修正する有効な方法であることを示す。
論文 参考訳(メタデータ) (2022-04-02T18:00:49Z) - Looking for Clues of Language in Multilingual BERT to Improve
Cross-lingual Generalization [56.87201892585477]
多言語BERT (m-BERT) には、言語情報と意味情報の両方が含まれている。
トークン埋め込みを操作することで多言語BERTの出力言語を制御する。
論文 参考訳(メタデータ) (2020-10-20T05:41:35Z) - Automatic Extraction of Rules Governing Morphological Agreement [103.78033184221373]
原文から第一パス文法仕様を抽出する自動フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
我々のフレームワークはUniversal Dependenciesプロジェクトに含まれるすべての言語に適用され、有望な結果が得られます。
論文 参考訳(メタデータ) (2020-10-02T18:31:45Z) - A Corpus Study and Annotation Schema for Named Entity Recognition and
Relation Extraction of Business Products [68.26059718611914]
製品エンティティのアノテーションと企業-製品関係の言及のためのコーパススタディ、アノテーションスキーマおよび関連ガイドラインを提示する。
積の言及はしばしば名詞句として認識されるが、境界の曖昧さのため、その正確な範囲を定義することは困難である。
提案ガイドラインに準じて,英文Webおよびソーシャルメディア文書の事前コーパスを提示する。
論文 参考訳(メタデータ) (2020-04-07T11:45:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。