論文の概要: PASTRIE: A Corpus of Prepositions Annotated with Supersense Tags in
Reddit International English
- arxiv url: http://arxiv.org/abs/2110.12243v1
- Date: Sat, 23 Oct 2021 15:22:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-26 15:44:01.986356
- Title: PASTRIE: A Corpus of Prepositions Annotated with Supersense Tags in
Reddit International English
- Title(参考訳): pastrie: reddit international englishのsupersenseタグでアノテートされた前置詞のコーパス
- Authors: Michael Kranzlein, Emma Manning, Siyao Peng, Shira Wein, Aryaman
Arora, Bradford Salen, Nathan Schneider
- Abstract要約: 本稿では,4つのL1(英語,フランス語,ドイツ語,スペイン語)から得られた英語データについて,手動で注釈付プレポジション・スーパーセンスを含む新しいデータセットを提案する。
アノテーションは包括的で、サンプル内のすべてのプリポジションタイプとトークンをカバーしています。
- 参考スコア(独自算出の注目度): 11.006321791711175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present the Prepositions Annotated with Supersense Tags in Reddit
International English ("PASTRIE") corpus, a new dataset containing manually
annotated preposition supersenses of English data from presumed speakers of
four L1s: English, French, German, and Spanish. The annotations are
comprehensive, covering all preposition types and tokens in the sample. Along
with the corpus, we provide analysis of distributional patterns across the
included L1s and a discussion of the influence of L1s on L2 preposition choice.
- Abstract(参考訳): 提案するPrepositions Annotated with Supersense Tags in Reddit International English(PASTRIE) corpusは、4つのL1話者(英語、フランス語、ドイツ語、スペイン語)の想定話者からの英語データの手動注釈付きPreposition Supersenseを含む新しいデータセットである。
アノテーションは包括的で、サンプル内のすべての前置型とトークンをカバーする。
コーパスとともに,L1sに含まれる分布パターンの解析を行い,L1sがL2の前置詞選択に与える影響について考察する。
関連論文リスト
- FRACAS: A FRench Annotated Corpus of Attribution relations in newS [0.0]
引用抽出と情報源帰属のために,フランス語で1676年のニュースワイヤテキストを手作業で注釈付けしたコーパスを提示する。
まず,データ選択時のコーパスの構成と選択について述べる。
次に、手動ラベリングに取り組んでいる8つのアノテータ間のアノテータ間合意について詳述する。
論文 参考訳(メタデータ) (2023-09-19T13:19:54Z) - X-PARADE: Cross-Lingual Textual Entailment and Information Divergence across Paragraphs [55.80189506270598]
X-PARADEは、段落レベルの情報の分岐の最初の言語間データセットである。
アノテーションは、対象言語における段落をスパンレベルでラベル付けし、ソース言語における対応する段落に対して評価する。
アライメントされた段落は、異なる言語のウィキペディアページから引用される。
論文 参考訳(メタデータ) (2023-09-16T04:34:55Z) - Improving Mandarin Prosodic Structure Prediction with Multi-level
Contextual Information [68.89000132126536]
本研究は,音声間言語情報を用いて韻律構造予測(PSP)の性能を向上させることを提案する。
提案手法は,韻律語(PW),韻律語(PPH),国際語句(IPH)の予測におけるF1スコアの向上を実現する。
論文 参考訳(メタデータ) (2023-08-31T09:19:15Z) - Is Argument Structure of Learner Chinese Understandable: A Corpus-Based
Analysis [8.883799596036484]
本稿では,中国語学習者における議論構造誤りのコーパスに基づく解析について述べる。
分析用データには、言語学習者が生成した文と、母語話者による補正が含まれている。
2人の高校生が手作業で作成したセマンティックロールラベリングアノテーションとデータを結合する。
論文 参考訳(メタデータ) (2023-08-17T21:10:04Z) - A Corpus for Sentence-level Subjectivity Detection on English News Articles [49.49218203204942]
我々はこのガイドラインを用いて、議論を呼んだ話題に関する英ニュース記事から抽出した638の目的語と411の主観的な文からなるNewsSD-ENGを収集する。
我々のコーパスは、語彙や機械翻訳といった言語固有のツールに頼ることなく、英語で主観的検出を行う方法を舗装している。
論文 参考訳(メタデータ) (2023-05-29T11:54:50Z) - Translate to Disambiguate: Zero-shot Multilingual Word Sense
Disambiguation with Pretrained Language Models [67.19567060894563]
事前訓練された言語モデル(PLM)は、豊富な言語間知識を学習し、多様なタスクでうまく機能するように微調整することができる。
C-WLT(Contextual Word-Level Translation)を用いた言語間単語感覚の捉え方の検討を行った。
モデルのサイズが大きくなるにつれて、PLMはより言語間単語認識の知識をエンコードし、WLT性能を改善するためのコンテキストを良くする。
論文 参考訳(メタデータ) (2023-04-26T19:55:52Z) - Models and Datasets for Cross-Lingual Summarisation [78.56238251185214]
対象言語における多文要約に関連付けられたソース言語において,長い文書を含む言語間要約コーパスを提案する。
コーパスは、チェコ語、英語、フランス語、ドイツ語の4つの言語について、12の言語対と指示をカバーしている。
言語対応のウィキペディアのタイトルから、主節と記事の本体を組み合わせることで、ウィキペディアから言語横断的な文書要約インスタンスを導出する。
論文 参考訳(メタデータ) (2022-02-19T11:55:40Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - Multilingual Neural RST Discourse Parsing [24.986030179701405]
本稿では,多言語ベクトル表現とセグメントレベルの翻訳によるニューラル言語間対話を確立するための2つの手法について検討する。
実験結果から,両手法は訓練データに制限があっても有効であり,言語横断的,文書レベルの談話解析における最先端性能を実現することができることがわかった。
論文 参考訳(メタデータ) (2020-12-03T05:03:38Z) - An Annotated Corpus of Emerging Anglicisms in Spanish Newspaper
Headlines [0.0]
我々はスペイン語で書かれた21,570の新聞の見出しのコーパスを、緊急のアングリシズムで注釈付けした。
この論文は、スペイン語ニュースワイヤのためのアングリシズム抽出器の作成に向けた第一歩である。
論文 参考訳(メタデータ) (2020-04-06T18:41:43Z) - A Corpus of Adpositional Supersenses for Mandarin Chinese [15.757892250956715]
マンダリン中国語ですべての表記が意味論的に注釈付けされたコーパスについて述べる。
提案手法は, 言語に依存しない意味的基準に従って, 超感覚の一般的な集合を定義する枠組みに適応する。
このスーパーセンスカテゴリーは、英語と構文的差異があるにもかかわらず、中国語の表記に適していることがわかった。
論文 参考訳(メタデータ) (2020-03-18T18:59:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。