論文の概要: CGELBank: CGEL as a Framework for English Syntax Annotation
- arxiv url: http://arxiv.org/abs/2210.00394v1
- Date: Sat, 1 Oct 2022 23:44:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 14:57:32.122327
- Title: CGELBank: CGEL as a Framework for English Syntax Annotation
- Title(参考訳): CGELBank: CGELは英語の構文アノテーションのためのフレームワーク
- Authors: Brett Reynolds, Aryaman Arora, Nathan Schneider
- Abstract要約: 本稿では,CGELBank プロジェクトを通じて木バンクの世界に,CGEL (TextitCambridge Grammar of the English Language) の構文形式について紹介する。
コーパスアノテーションにフォーマリズムを適用する際に生じた言語分析の諸問題について論じ,次いで並列UDやTBツリーバンクと比較した定量的および定性的な比較を行った。
- 参考スコア(独自算出の注目度): 11.042037758273226
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce the syntactic formalism of the \textit{Cambridge Grammar of the
English Language} (CGEL) to the world of treebanking through the CGELBank
project. We discuss some issues in linguistic analysis that arose in adapting
the formalism to corpus annotation, followed by quantitative and qualitative
comparisons with parallel UD and PTB treebanks. We argue that CGEL provides a
good tradeoff between comprehensiveness of analysis and usability for
annotation, which motivates expanding the treebank with automatic conversion in
the future.
- Abstract(参考訳): 本稿では,CGELBankプロジェクトを通じて,木バンクの世界でのCGEL (textit{Cambridge Grammar of the English Language}) の構文形式について紹介する。
本稿では,コーパスアノテーションへの形式的適応に起因した言語分析における諸問題と,並列udとptb木バンクとの定量的・質的比較について論じる。
CGELは分析の包括性とアノテーションのユーザビリティとの間に良いトレードオフをもたらしており、将来ツリーバンクを自動変換して拡張する動機となる。
関連論文リスト
- Scalable Frame-based Construction of Sociocultural NormBases for Socially-Aware Dialogues [66.69453609603875]
社会文化的規範は、社会的相互作用における個人的行為の指針となる。
大規模言語モデル(LLM)を用いた社会文化的ノルム(SCN)ベース構築のためのスケーラブルなアプローチを提案する。
我々は、包括的で広くアクセス可能な中国社会文化ノルムベースを構築した。
論文 参考訳(メタデータ) (2024-10-04T00:08:46Z) - Multi-perspective Improvement of Knowledge Graph Completion with Large
Language Models [95.31941227776711]
我々は,文脈知識の不足を補うMPIKGCを提案し,大規模言語モデル(LLM)をクエリすることでKGCを改善する。
我々は4つの記述に基づくKGCモデルと4つのデータセットに基づくフレームワークの広範囲な評価を行い、リンク予測とトリプルト分類のタスクについて検討した。
論文 参考訳(メタデータ) (2024-03-04T12:16:15Z) - CGELBank Annotation Manual v1.1 [8.78380676369991]
CGELBankは、ケンブリッジ・グラマー・オブ・イングリッシュ(Cambridge Grammar of the English)から派生した英語の構文形式に基づくツリーバンクおよび関連ツールである。
この文書はCGELBankアノテーションスキームの特異性を概説している。
論文 参考訳(メタデータ) (2023-05-27T03:01:53Z) - Is Japanese CCGBank empirically correct? A case study of passive and
causative constructions [18.021287677546958]
我が国のCCGBankにおける受動的・因果的構造の分析に焦点をあてる。
セマンティック解析システムであるccg2lambdaの構成的意味論とともに、受動的および因果関係のネストされた構成について、経験的に間違った予測を下すことを示した。
論文 参考訳(メタデータ) (2023-02-28T16:19:24Z) - Multilingual Extraction and Categorization of Lexical Collocations with
Graph-aware Transformers [86.64972552583941]
我々は,グラフ対応トランスフォーマアーキテクチャにより拡張されたBERTに基づくシーケンスタグ付けモデルを提案し,コンテキストにおけるコロケーション認識の課題について評価した。
以上の結果から, モデルアーキテクチャにおける構文的依存関係を明示的に符号化することは有用であり, 英語, スペイン語, フランス語におけるコロケーションのタイプ化の差異について考察する。
論文 参考訳(メタデータ) (2022-05-23T16:47:37Z) - LyS_ACoru\~na at SemEval-2022 Task 10: Repurposing Off-the-Shelf Tools
for Sentiment Analysis as Semantic Dependency Parsing [10.355938901584567]
本稿では,バイファイン・セマンティック・依存性を用いた構造化感情分析の課題に対処する。
i)1つのツリーバンクでのトレーニング、(ii)異なる言語から来るツリーバンクのトレーニングによってセットアップを緩和する。
i) 他の言語で利用可能なツリーバンクを単語レベルで翻訳して、騒々しく、文法的にも、注釈付きのデータを得る。
評価後の段階では、英語のすべてのツリーを単純にマージする言語間モデルも訓練した。
論文 参考訳(メタデータ) (2022-04-27T10:21:28Z) - From Sentiment Annotations to Sentiment Prediction through Discourse
Augmentation [30.615883375573432]
本稿では,感情分析の課題にタスク関連談話を利用する新しい枠組みを提案する。
具体的には、大規模で感情に依存したMEGA-DTツリーバンクと、感情予測のための新しいニューラルアーキテクチャを組み合わせています。
実験により,感情関連談話拡張を用いた感情予測により,長期文書の全体的な性能が向上することが確認された。
論文 参考訳(メタデータ) (2020-11-05T18:28:13Z) - MEGA RST Discourse Treebanks with Structure and Nuclearity from Scalable
Distant Sentiment Supervision [30.615883375573432]
本稿では,感情アノテートされたデータセットから遠方からの監視を用いて,談話木バンクを自動的に生成する新しい手法を提案する。
提案手法は,効率的なビーム探索手法を用いて,任意の長さの文書に構造と核性を取り入れた木を生成する。
実験により、MEGA-DTツリーバンクでトレーニングされた談話が、ドメイン間パフォーマンスの有望な向上をもたらすことが示された。
論文 参考訳(メタデータ) (2020-11-05T18:22:38Z) - Treebanking User-Generated Content: a UD Based Overview of Guidelines,
Corpora and Unified Recommendations [58.50167394354305]
本稿では、ウェブやソーシャルメディアで見られるユーザ生成テキストの分析に困難をもたらす主要な言語現象について論じる。
本研究は,これらのテキストの特定の現象を一貫した処理を促進するための,一時的UDベースのガイドラインのセットを提案する。
論文 参考訳(メタデータ) (2020-11-03T23:34:42Z) - Recursive Top-Down Production for Sentence Generation with Latent Trees [77.56794870399288]
自然および合成言語に対する文脈自由文法の生成特性をモデル化する。
潜伏二分木構造にN$の葉を持つ動的プログラミングアルゴリズムを提案する。
また,Multi30kデータセットを用いたドイツ語と英語の翻訳実験を行った。
論文 参考訳(メタデータ) (2020-10-09T17:47:16Z) - Multilingual Alignment of Contextual Word Representations [49.42244463346612]
BERTはXNLIのゼロショット性能をベースモデルに比べて大幅に改善した。
単語検索の文脈バージョンを導入し、下流のゼロショット転送とよく相関していることを示す。
これらの結果は、大規模多言語事前学習モデルの理解に有用な概念としてコンテキストアライメントをサポートする。
論文 参考訳(メタデータ) (2020-02-10T03:27:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。