論文の概要: Machine learning approach of Japanese composition scoring and writing
aided system's design
- arxiv url: http://arxiv.org/abs/2008.11488v1
- Date: Wed, 26 Aug 2020 11:01:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 21:27:54.255616
- Title: Machine learning approach of Japanese composition scoring and writing
aided system's design
- Title(参考訳): 日本語コンポジションスコアリングと筆記システム設計の機械学習的アプローチ
- Authors: Wanhong Huang
- Abstract要約: 合成スコアシステムは、言語学習者を支援することができる。
何かを出力するプロセスにおいて、言語をリーン化するのです。
特に外国語学習者にとって、語彙内容と構文内容は、通常、彼らがより関心を持っているものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic scoring system is extremely complex for any language. Because
natural language itself is a complex model. When we evaluate articles generated
by natural language, we need to view the articles from many dimensions such as
word features, grammatical features, semantic features, text structure and so
on. Even human beings sometimes can't accurately grade a composition because
different people have different opinions about the same article. But a
composition scoring system can greatly assist language learners. It can make
language leaner improve themselves in the process of output something. Though
it is still difficult for machines to directly evaluate a composition at the
semantic and pragmatic levels, especially for Japanese, Chinese and other
language in high context cultures, we can make machine evaluate a passage in
word and grammar levels, which can as an assistance of composition rater or
language learner. Especially for foreign language learners, lexical and
syntactic content are usually what they are more concerned about. In our
experiments, we did the follows works: 1) We use word segmentation tools and
dictionaries to achieve word segmentation of an article, and extract word
features, as well as generate a words' complexity feature of an article. And
Bow technique are used to extract the theme features. 2) We designed a
Turing-complete automata model and create 300+ automatons for the grammars that
appear in the JLPT examination. And extract grammars features by using these
automatons. 3) We propose a statistical approach for scoring a specify theme of
composition, the final score will depend on all the writings that submitted to
the system. 4) We design an grammar hint function for language leaner, so that
they can know currently what grammars they can use.
- Abstract(参考訳): 自動スコアリングシステムはどんな言語でも非常に複雑である。
自然言語自体が複雑なモデルだからです。
自然言語で生成された記事を評価する際には,単語の特徴,文法的特徴,意味的特徴,テキスト構造など,さまざまな側面から記事を見る必要がある。
人間でさえも、同じ記事について異なる意見を持っているため、構成を正しく評価できないことがある。
しかし、合成スコアリングシステムは言語学習者を支援することができる。
何かを出力するプロセスにおいて、言語をリーン化するのです。
日本語,中国語,その他の言語において,意味的・実用的レベルでの構図を直接評価することはいまだに難しいが,構音率や言語学習者の補助となる単語・文法レベルの構図を機械に評価させることが可能である。
特に外国語学習者にとって、語彙内容と構文内容は、通常、彼らがより関心を持っているものである。
実験では、以下の研究を行いました。
1) 単語セグメンテーションツールと辞書を用いて, 記事の単語セグメンテーションを実現し, 単語の特徴を抽出するとともに, 記事の単語の複雑さ特性を生成する。
また,ボウテクニックを用いてテーマの特徴を抽出する。
2) チューリング完全オートマトンモデルを設計し, JLPT試験に現れる文法のための300以上のオートマトンを作成した。
これらのオートマトンを使って文法を抽出できます
3) 構成の特定の主題を評価する統計的手法を提案し, 最終的なスコアはシステムに提出されたすべての文章に依存する。
4) 言語学習のための文法ヒント関数を設計することで,現在どのような文法が利用できるかを知ることができる。
関連論文リスト
- Learning Language Structures through Grounding [8.437466837766895]
言語構造を基礎として学習することを目的とした機械学習タスクのファミリーを考察する。
パートIでは,視覚的接地を通して構文解析を学習することを検討する。
第2部では文を対応する意味構造にマッピングする2つの実行対応手法を提案する。
パートIIIでは、他の言語のアノテーションから言語構造を学習する手法を提案する。
論文 参考訳(メタデータ) (2024-06-14T02:21:53Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - Identifying concept libraries from language about object structure [56.83719358616503]
自然言語記述を2Kプロシージャ生成オブジェクトの多種多様なセットに利用して,ユーザが使用する部分を特定する。
我々は、異なる部分概念を含むプログラムライブラリの空間の探索として、この問題を形式化する。
自然言語と構造化されたプログラム表現を組み合わせることで、人々が名前をつける部分概念を規定する基本的な情報理論的なトレードオフを発見する。
論文 参考訳(メタデータ) (2022-05-11T17:49:25Z) - AUTOLEX: An Automatic Framework for Linguistic Exploration [93.89709486642666]
本稿では言語学者による言語現象の簡潔な記述の発見と抽出を容易にするための自動フレームワークを提案する。
具体的には、この枠組みを用いて、形態的一致、ケースマーキング、単語順序の3つの現象について記述を抽出する。
本研究では,言語専門家の助けを借りて記述を評価し,人間の評価が不可能な場合に自動評価を行う手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T20:37:30Z) - VLGrammar: Grounded Grammar Induction of Vision and Language [86.88273769411428]
共同学習枠組みにおける視覚と言語の基底文法誘導について検討する。
本稿では,複合確率文脈自由文法(pcfgs)を用いて言語文法と画像文法を同時に誘導する手法であるvlgrammarを提案する。
論文 参考訳(メタデータ) (2021-03-24T04:05:08Z) - Challenges Encountered in Turkish Natural Language Processing Studies [1.52292571922932]
自然言語処理は、人工知能と言語学を組み合わせたコンピュータサイエンスの分野です。
本研究では,トルコ語の自然言語処理における興味深い特徴について述べる。
論文 参考訳(メタデータ) (2021-01-21T08:30:33Z) - Curious Case of Language Generation Evaluation Metrics: A Cautionary
Tale [52.663117551150954]
イメージキャプションや機械翻訳などのタスクを評価するデファクトメトリクスとして、いくつかの一般的な指標が残っている。
これは、使いやすさが原因でもあり、また、研究者がそれらを見て解釈する方法を知りたがっているためでもある。
本稿では,モデルの自動評価方法について,コミュニティにより慎重に検討するよう促す。
論文 参考訳(メタデータ) (2020-10-26T13:57:20Z) - Automatic Extraction of Rules Governing Morphological Agreement [103.78033184221373]
原文から第一パス文法仕様を抽出する自動フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
我々のフレームワークはUniversal Dependenciesプロジェクトに含まれるすべての言語に適用され、有望な結果が得られます。
論文 参考訳(メタデータ) (2020-10-02T18:31:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。