論文の概要: Is Japanese CCGBank empirically correct? A case study of passive and
causative constructions
- arxiv url: http://arxiv.org/abs/2302.14708v1
- Date: Tue, 28 Feb 2023 16:19:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 15:41:25.459087
- Title: Is Japanese CCGBank empirically correct? A case study of passive and
causative constructions
- Title(参考訳): 日本のCCGBankは実証的に正しいか?
受動的・因果的構成の事例研究
- Authors: Daisuke Bekki and Hitomi Yanaka
- Abstract要約: 我が国のCCGBankにおける受動的・因果的構造の分析に焦点をあてる。
セマンティック解析システムであるccg2lambdaの構成的意味論とともに、受動的および因果関係のネストされた構成について、経験的に間違った予測を下すことを示した。
- 参考スコア(独自算出の注目度): 18.021287677546958
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Japanese CCGBank serves as training and evaluation data for developing
Japanese CCG parsers. However, since it is automatically generated from the
Kyoto Corpus, a dependency treebank, its linguistic validity still needs to be
sufficiently verified. In this paper, we focus on the analysis of
passive/causative constructions in the Japanese CCGBank and show that, together
with the compositional semantics of ccg2lambda, a semantic parsing system, it
yields empirically wrong predictions for the nested construction of passives
and causatives.
- Abstract(参考訳): 日本のCCGBankは、日本のCCGパーサー開発のためのトレーニングおよび評価データを提供する。
しかし、依存木バンクである京都コーポレーションから自動生成されるため、その言語的妥当性を十分に検証する必要がある。
本稿では,日本語ccgバンクにおける受動的/因果的構成の分析に着目し,意味的構文解析システムであるccg2lambdaの構成意味論とともに,受動的/因果的構成の入れ子的予測を経験的に誤ったものにすることを示す。
関連論文リスト
- Computational Semantics and Evaluation Benchmark for Interrogative
Sentences via Combinatory Categorial Grammar [8.666172545138275]
我々は,コンビニティ・カテゴリ・文法(CCG)の枠組みの中で,多種多様な極性質問と難問に関する構成意味論を提示する。
本稿では,質問文の意味性を評価するための質問応答データセットQSEMを提案する。
論文 参考訳(メタデータ) (2023-12-22T14:46:02Z) - FlaCGEC: A Chinese Grammatical Error Correction Dataset with
Fine-grained Linguistic Annotation [11.421545095092815]
FlaCGECは、粒度の細かい言語アノテーションを備えた新しいCGECデータセットである。
中国語の専門家が定義した言語スキーマから生のコーパスを収集し,ルールを用いて文の編集を行い,手作業で生成したサンプルを精査する。
提案したFraCGECデータセットを用いて,様々な最先端CGEC手法の評価を行った。
論文 参考訳(メタデータ) (2023-09-26T10:22:43Z) - CSED: A Chinese Semantic Error Diagnosis Corpus [52.92010408053424]
関連するデータセットが欠如している中国の意味的誤り診断(CSED)の複雑な問題について検討する。
意味的誤りの研究は、それらが非常に一般的であり、統語的不規則や理解の問題に繋がる可能性があるため重要である。
本稿では,CSEDタスクに適応する構文認識モデルを提案する。
論文 参考訳(メタデータ) (2023-05-09T05:33:31Z) - Improving Chinese Spelling Check by Character Pronunciation Prediction:
The Effects of Adaptivity and Granularity [76.20568599642799]
中国語のスペルチェック(英語: Chinese spelling check, CSC)は、中国語のテキスト中のスペルエラーを検出し修正する基本的なNLPタスクである。
本稿では,CSCを改善するために中国語発音予測(CPP)の補助的タスクを導入することを検討する。
本稿では,共有エンコーダの2つの並列デコーダ上に構築したSCOPEを提案する。
論文 参考訳(メタデータ) (2022-10-20T03:42:35Z) - CGELBank: CGEL as a Framework for English Syntax Annotation [11.042037758273226]
本稿では,CGELBank プロジェクトを通じて木バンクの世界に,CGEL (TextitCambridge Grammar of the English Language) の構文形式について紹介する。
コーパスアノテーションにフォーマリズムを適用する際に生じた言語分析の諸問題について論じ,次いで並列UDやTBツリーバンクと比較した定量的および定性的な比較を行った。
論文 参考訳(メタデータ) (2022-10-01T23:44:06Z) - MuCGEC: a Multi-Reference Multi-Source Evaluation Dataset for Chinese
Grammatical Error Correction [51.3754092853434]
MuCGECは中国語文法誤り訂正(CGEC)のためのマルチ参照評価データセットである
3つの中国語-as-a-Second-Language(CSL)学習資料から収集された7,063文からなる。
各文は3つのアノテータによって修正され、その修正は専門家によって慎重にレビューされ、1文あたりの参照数は2.3である。
論文 参考訳(メタデータ) (2022-04-23T05:20:38Z) - Improving Pre-trained Language Models with Syntactic Dependency
Prediction Task for Chinese Semantic Error Recognition [52.55136323341319]
既存の中国語のテキスト誤り検出は主にスペルと単純な文法的誤りに焦点を当てている。
中国の意味的誤りは、人間が容易に認識できないほど過小評価され、複雑である。
論文 参考訳(メタデータ) (2022-04-15T13:55:32Z) - Semantic Construction Grammar: Bridging the NL / Logic Divide [3.245535754791156]
本稿では,自然言語と論理表現の翻訳を容易にするシステムであるセマンティック・コンストラクション・文法(SCG)について論じる。
SCGは、NL構造にかなり近いものからNL構造と全く異なるものまで、様々な表現方法をサポートするように設計されている。
論文 参考訳(メタデータ) (2021-12-10T00:02:40Z) - A Syntax-Guided Grammatical Error Correction Model with Dependency Tree
Correction [83.14159143179269]
文法的誤り訂正(英: Grammatical Error Correction, GEC)は、文中の文法的誤りを検出し、訂正するタスクである。
本稿では,依存木の構文知識を利用するためのグラフアテンション機構を採用した構文誘導型GECモデル(SG-GEC)を提案する。
我々は、GECタスクの公開ベンチマークでモデルを評価し、競争結果を得る。
論文 参考訳(メタデータ) (2021-11-05T07:07:48Z) - Co-training an Unsupervised Constituency Parser with Weak Supervision [33.63314110665062]
本稿では,あるノードが文中の特定のスパンを支配しているかどうかを識別するために,ブートストラップ分類器に依存する教師なし解析手法を提案する。
両者の相互作用が両者の精度の向上に役立ち、その結果、効果的に解析できることが示される。
論文 参考訳(メタデータ) (2021-10-05T18:45:06Z) - Constructing a Family Tree of Ten Indo-European Languages with
Delexicalized Cross-linguistic Transfer Patterns [57.86480614673034]
我々は,デレクシカル化転送を,解釈可能なツリー・ツー・ストリングパターンとツリー・ツー・ツリーパターンとして定式化する。
これにより、言語間移動を定量的に探索し、第二言語習得の問い合わせを拡張することができる。
論文 参考訳(メタデータ) (2020-07-17T15:56:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。