論文の概要: Is Argument Structure of Learner Chinese Understandable: A Corpus-Based
Analysis
- arxiv url: http://arxiv.org/abs/2308.09186v1
- Date: Thu, 17 Aug 2023 21:10:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 15:27:36.225146
- Title: Is Argument Structure of Learner Chinese Understandable: A Corpus-Based
Analysis
- Title(参考訳): 中国語学習者の理解可能な論拠構造 : コーパスに基づく分析
- Authors: Yuguang Duan, Zi Lin, Weiwei Sun
- Abstract要約: 本稿では,中国語学習者における議論構造誤りのコーパスに基づく解析について述べる。
分析用データには、言語学習者が生成した文と、母語話者による補正が含まれている。
2人の高校生が手作業で作成したセマンティックロールラベリングアノテーションとデータを結合する。
- 参考スコア(独自算出の注目度): 8.883799596036484
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a corpus-based analysis of argument structure errors in
learner Chinese. The data for analysis includes sentences produced by language
learners as well as their corrections by native speakers. We couple the data
with semantic role labeling annotations that are manually created by two senior
students whose majors are both Applied Linguistics. The annotation procedure is
guided by the Chinese PropBank specification, which is originally developed to
cover first language phenomena. Nevertheless, we find that it is quite
comprehensive for handling second language phenomena. The inter-annotator
agreement is rather high, suggesting the understandability of learner texts to
native speakers. Based on our annotations, we present a preliminary analysis of
competence errors related to argument structure. In particular, speech errors
related to word order, word selection, lack of proposition, and
argument-adjunct confounding are discussed.
- Abstract(参考訳): 本稿では,中国語学習者の議論構造誤りのコーパスベース分析を行う。
分析用データには、言語学習者が生成した文と、母語話者による補正が含まれている。
このデータを意味的役割ラベル付けアノテーションと組み合わせて,2人の上級生による手作業で作成した。
このアノテーション手順は、もともと第一言語現象をカバーするために開発された中国のpropbank仕様に導かれている。
それにもかかわらず、第二言語現象を扱う上では非常に包括的であることが分かっています。
注釈間の合意はかなり高く、学習者のテキストが母語話者に理解できることを示唆している。
本稿では,このアノテーションに基づいて,議論構造に関連する能力的誤りを予備解析する。
特に、単語の順序、単語の選択、命題の欠如、引数の共起に関する音声誤りについて議論する。
関連論文リスト
- To Drop or Not to Drop? Predicting Argument Ellipsis Judgments: A Case Study in Japanese [26.659122101710068]
本研究では,日本語のバランスコーパスにおいて,2000以上のデータポイントで特定の議論を省略すべきか否かについて検討する。
データは、ネイティブ話者がこうした判断に対して共通の基準を共有していることを示している。
システムの予測と特定の言語的側面における人間の判断とのギャップが明らかになる。
論文 参考訳(メタデータ) (2024-04-17T12:26:52Z) - Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language
Modelling [70.23876429382969]
本研究では,多種多様なNLPタスクに対して,文内談話特性を評価できるベンチマークを提案する。
ディスコ・ベンチは文学領域における9つの文書レベルのテストセットから構成されており、豊富な談話現象を含んでいる。
また,言語分析のために,対象モデルが談話知識を学習するかどうかを検証できる診断テストスイートを設計する。
論文 参考訳(メタデータ) (2023-07-16T15:18:25Z) - Natural Language Decompositions of Implicit Content Enable Better Text
Representations [56.85319224208865]
本稿では,暗黙的に伝達されたコンテンツを明示的に考慮したテキスト分析手法を提案する。
我々は大きな言語モデルを用いて、観察されたテキストと推論的に関係する命題の集合を生成する。
本研究は,NLPにおいて,文字のみではなく,観察された言語の背景にある意味をモデル化することが重要であることを示唆する。
論文 参考訳(メタデータ) (2023-05-23T23:45:20Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - A Linguistic Investigation of Machine Learning based Contradiction
Detection Models: An Empirical Analysis and Future Perspectives [0.34998703934432673]
本稿では,2つの自然言語推論データセットについて,その言語的特徴について分析する。
目標は、特に機械学習モデルを理解するのが難しい、構文的および意味的特性を特定することである。
論文 参考訳(メタデータ) (2022-10-19T10:06:03Z) - Improving Pre-trained Language Models with Syntactic Dependency
Prediction Task for Chinese Semantic Error Recognition [52.55136323341319]
既存の中国語のテキスト誤り検出は主にスペルと単純な文法的誤りに焦点を当てている。
中国の意味的誤りは、人間が容易に認識できないほど過小評価され、複雑である。
論文 参考訳(メタデータ) (2022-04-15T13:55:32Z) - AUTOLEX: An Automatic Framework for Linguistic Exploration [93.89709486642666]
本稿では言語学者による言語現象の簡潔な記述の発見と抽出を容易にするための自動フレームワークを提案する。
具体的には、この枠組みを用いて、形態的一致、ケースマーキング、単語順序の3つの現象について記述を抽出する。
本研究では,言語専門家の助けを借りて記述を評価し,人間の評価が不可能な場合に自動評価を行う手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T20:37:30Z) - Controlled Evaluation of Grammatical Knowledge in Mandarin Chinese
Language Models [22.57309958548928]
構造的監督が言語モデルの文法的依存の学習能力を向上させるかどうかを検討する。
LSTM、リカレントニューラルネットワーク文法、トランスフォーマー言語モデル、および異なるサイズのデータセットに対する生成解析モデルをトレーニングする。
構造的監督がコンテンツ間のシナティクス状態の表現に役立ち、低データ設定における性能向上に役立つという示唆的な証拠が得られます。
論文 参考訳(メタデータ) (2021-09-22T22:11:30Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - Multilingual Neural RST Discourse Parsing [24.986030179701405]
本稿では,多言語ベクトル表現とセグメントレベルの翻訳によるニューラル言語間対話を確立するための2つの手法について検討する。
実験結果から,両手法は訓練データに制限があっても有効であり,言語横断的,文書レベルの談話解析における最先端性能を実現することができることがわかった。
論文 参考訳(メタデータ) (2020-12-03T05:03:38Z) - A Linguistic Analysis of Visually Grounded Dialogues Based on Spatial
Expressions [35.24301299033675]
本稿では,視覚的対話における言語理解の微粒化を調査するための枠組みを提案する。
われわれはOneCommon Corpus citepudgawa 2019natural,udgawa 2020annotatedに注目する。
我々は,それらの言語構造をテクスト空間表現に基づいて分析し,600の対話に対して包括的で信頼性の高いアノテーションを提供する。
論文 参考訳(メタデータ) (2020-10-07T02:50:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。