論文の概要: Sentiment Analysis and Emotion Classification using Machine Learning Techniques for Nagamese Language - A Low-resource Language
- arxiv url: http://arxiv.org/abs/2512.01256v1
- Date: Mon, 01 Dec 2025 04:01:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.679615
- Title: Sentiment Analysis and Emotion Classification using Machine Learning Techniques for Nagamese Language - A Low-resource Language
- Title(参考訳): 機械学習を用いた低リソース言語「ながめえ」の感性分析と感情分類
- Authors: Ekha Morang, Surhoni A. Ngullie, Sashienla Longkumer, Teisovi Angami,
- Abstract要約: 本研究の目的は,長染語に含まれる極性(肯定的,否定的,中立的)と基本的な感情から感情を検出することである。
我々は1,195語からなる感情極性レキシコンを構築し、これらを用いて教師付き機械学習技術のための機能を構築する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The Nagamese language, a.k.a Naga Pidgin, is an Assamese-lexified creole language developed primarily as a means of communication in trade between the people from Nagaland and people from Assam in the north-east India. Substantial amount of work in sentiment analysis has been done for resource-rich languages like English, Hindi, etc. However, no work has been done in Nagamese language. To the best of our knowledge, this is the first attempt on sentiment analysis and emotion classification for the Nagamese Language. The aim of this work is to detect sentiments in terms of polarity (positive, negative and neutral) and basic emotions contained in textual content of Nagamese language. We build sentiment polarity lexicon of 1,195 nagamese words and use these to build features along with additional features for supervised machine learning techniques using Na"ive Bayes and Support Vector Machines. Keywords: Nagamese, NLP, sentiment analysis, machine learning
- Abstract(参考訳): ナガメス語(英: Nagamese language)またはナガメス語(英: Nagamese language)は、主にナガランドとインド北東部のアサムの人々の交易におけるコミュニケーション手段として開発されたアサメ系クレオール言語である。
感情分析における実質的な作業量は、英語、ヒンディー語などのリソース豊富な言語に対して行われてきた。
しかし、長染国語での研究は行われていない。
我々の知る限りでは、長染語における感情分析と感情分類のための最初の試みである。
本研究の目的は,長目言語の文章内容に含まれる極性(肯定的,否定的,中立的)と基本的な感情から感情を検出することである。
我々は,1,195個のナガメ語からなる感情極性レキシコンを構築し,それらを用いて,Na"ive Bayes"とSupport Vector Machinesを用いた教師付き機械学習技術のための追加機能と機能を構築する。
キーワード:ナガメ、NLP、感情分析、機械学習
関連論文リスト
- Part-of-speech tagging for Nagamese Language using CRF [0.0]
本稿では,ナガメ語における自然言語処理(NLP)の重要な課題である音声タグ付けについて検討する。
16,112個のトークンの注釈付きコーパスを作成し、条件ランダムフィールド(Conditional Random Fields, CRF)として知られる機械学習技術を適用した。
CRFを用いて、全体のタグ付け精度は85.70%、精度は86%、f1スコアは85%である。
論文 参考訳(メタデータ) (2025-09-16T12:59:55Z) - Teacher Perception of Automatically Extracted Grammar Concepts for L2
Language Learning [66.79173000135717]
本研究は、カンナダ語とマラティ語という2つのインドの言語教育に適用する。
我々は、形態素構文(単語順、一致、ケースマーキング、または単語形成の学習)と意味論(語彙の学習)に関する疑問に答える自然なテキストコーパスから記述を抽出する。
我々は,北米の学校から言語教育者の助けを借りて手作業による評価を行い,教材が授業の準備や学習者評価に利用できる可能性を見出した。
論文 参考訳(メタデータ) (2023-10-27T18:17:29Z) - Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z) - Informative Language Representation Learning for Massively Multilingual
Neural Machine Translation [47.19129812325682]
多言語ニューラルマシン翻訳モデルでは、通常、人工言語トークンを使用して、所望のターゲット言語への翻訳をガイドする。
近年の研究では、先行する言語トークンは、多言語ニューラルマシン翻訳モデルから正しい翻訳方向へのナビゲートに失敗することがある。
本稿では,言語埋め込み型エンボディメントと言語認識型マルチヘッドアテンションという2つの手法を提案する。
論文 参考訳(メタデータ) (2022-09-04T04:27:17Z) - Utilizing Wordnets for Cognate Detection among Indian Languages [50.83320088758705]
ヒンディー語と10のインド諸語間の単語対を検出する。
深層学習手法を用いて単語対が共生か否かを予測する。
性能は最大26%向上した。
論文 参考訳(メタデータ) (2021-12-30T16:46:28Z) - Harnessing Cross-lingual Features to Improve Cognate Detection for
Low-resource Languages [50.82410844837726]
言語間単語埋め込みを用いた14言語間のコニャートの検出を実証する。
インドの12言語からなる挑戦的データセットを用いて,コニャート検出手法の評価を行った。
我々は,コグネート検出のためのFスコアで最大18%の改善点を観察した。
論文 参考訳(メタデータ) (2021-12-16T11:17:58Z) - Attention based Sequence to Sequence Learning for Machine Translation of
Low Resourced Indic Languages -- A case of Sanskrit to Hindi [0.0]
この論文は、10K近いサンプルと178,000個のトークンを持つサンスクリットからヒンディー語バイリンガル並列コーパスの構築を示す。
注意機構に基づく神経翻訳は、人間の評価において88%の精度を達成し、サンスクリットからヒンディー語への翻訳におけるBLEUスコアは0.92である。
論文 参考訳(メタデータ) (2021-09-07T04:55:48Z) - Towards Zero-shot Language Modeling [90.80124496312274]
人間の言語学習に誘導的に偏りを持つニューラルモデルを構築した。
類型的に多様な訓練言語のサンプルからこの分布を推測する。
我々は、保留言語に対する遠隔監視として、追加の言語固有の側情報を利用する。
論文 参考訳(メタデータ) (2021-08-06T23:49:18Z) - A Finite State Transducer Based Morphological Analyzer of Maithili
Language [2.752817022620644]
有限状態トランスデューサをベースとしたインドにおける資源不足言語であるMaithiliに対する屈折形態解析器を提案する。
マイティリ語(Maithili)は、インド・ビハール州東部と北部で話されるインド・アーリア東部の言語で、ネパールのタライ(Tarai)として知られている。
論文 参考訳(メタデータ) (2020-02-29T11:00:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。