Fugu-MT 論文翻訳(概要): Development of a General Purpose Sentiment Lexicon for Igbo Language

論文の概要: Development of a General Purpose Sentiment Lexicon for Igbo Language

arxiv url: http://arxiv.org/abs/2004.14176v1
Date: Fri, 24 Apr 2020 22:10:34 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-10 03:07:59.924149
Title: Development of a General Purpose Sentiment Lexicon for Igbo Language
Title（参考訳）: igbo言語のための汎用感情語彙の開発
Authors: Emeka Ogbuju and Moses Onyesolu
Abstract要約: この研究は、Igbo言語に対する汎用的な感情のレキシコンを生み出している。英語に翻訳することなく、イグボ語で書かれた文書の感情を決定することができる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: There are publicly available general purpose sentiment lexicons in some high resource languages but very few exist in the low resource languages. This makes it difficult to directly perform sentiment analysis tasks in such languages. The objective of this work is to create a general purpose sentiment lexicon for the Igbo language that can determine the sentiment of documents written in the Igbo language without having to translate it to the English language. The material used was an automatically translated lexicon by Liu and the manual addition of Igbo native words. The result of this work is a general purpose lexicon called IgboSentilex. The performance was tested on the BBC Igbo news channel. It returned an average polarity agreement of 95.75 percent with other general purpose sentiment lexicons.
Abstract（参考訳）: 高資源言語には公に利用可能な汎用感情語彙が存在するが、低資源言語にはほとんど存在しない。これにより、このような言語で感情分析タスクを直接実行するのが難しくなる。本研究の目的は、Igbo言語に翻訳することなく、Igbo言語で書かれた文書の感情を決定できる汎用的な感情辞書を作ることである。使用された資料は、liuが自動翻訳した辞書と、igboのネイティブワードを手作業で追加したものである。この研究の結果はIgboSentilexと呼ばれる汎用の辞書である。パフォーマンスはBBCのIgboニュースチャンネルでテストされた。他の汎用的な感情レキシコンと95.75パーセントの平均的な極性合意を返した。

関連論文リスト

CommonLID: Re-evaluating State-of-the-Art Language Identification Performance on Web Data [56.043078390377076]
我々はコミュニティ主導のウェブドメイン向けLIDベンチマークであるCommonLIDを紹介する。我々は,他の5つの共通評価セットと合わせて,CommonLIDの価値を示し,8つのLIDモデルを検証した。既存の評価では、Webドメイン内の多くの言語に対して、LIDの精度を過大評価している。
論文参考訳（メタデータ） (2026-01-25T22:49:30Z)
Sentiment Analysis and Emotion Classification using Machine Learning Techniques for Nagamese Language - A Low-resource Language [0.0]
本研究の目的は,長染語に含まれる極性(肯定的,否定的,中立的)と基本的な感情から感情を検出することである。我々は1,195語からなる感情極性レキシコンを構築し、これらを用いて教師付き機械学習技術のための機能を構築する。
論文参考訳（メタデータ） (2025-12-01T04:01:29Z)
Cross-lingual Opinions and Emotions Mining in Comparable Documents [0.0]
本研究は、英語とアラビア語に匹敵する文書における感情と感情の相違について研究する。我々は、英語のWordNet-Affect(WNA)レキシコンをアラビア語に手動で翻訳し、それに匹敵するコーパスをラベル付けするバイリンガル感情レキシコンを作成する。その結果、感情と感情のアノテーションは、記事が同一の報道機関から来たときに一致し、異なる記事から来たときに発散することがわかった。
論文参考訳（メタデータ） (2025-08-05T05:44:28Z)
BRIGHTER: BRIdging the Gap in Human-Annotated Textual Emotion Recognition Datasets for 28 Languages [93.92804151830744]
BRIGHTER - 28の異なる言語のマルチラベルデータセットのコレクション。データ収集とアノテーションプロセスとこれらのデータセット構築の課題について説明する。 BRIGHTERデータセットは、テキストベースの感情認識のギャップを埋めるためのステップであることを示す。
論文参考訳（メタデータ） (2025-02-17T15:39:50Z)
Human-LLM Collaborative Construction of a Cantonese Emotion Lexicon [1.3074442742310615]
本研究では,低リソース言語であるCantoneseのための感情辞書を開発することを提案する。 LLM(Large Language Models)と人間のアノテータによって提供される感情ラベルを統合することで、既存の言語資源を活用している。感情抽出における感情レキシコンの整合性は、3つの異なる感情テキストデータセットの修正と利用によって評価された。
論文参考訳（メタデータ） (2024-10-15T11:57:34Z)
Decoupled Vocabulary Learning Enables Zero-Shot Translation from Unseen Languages [55.157295899188476]
ニューラルマシン翻訳システムは、異なる言語の文を共通の表現空間にマッピングすることを学ぶ。本研究では、この仮説を未知の言語からのゼロショット翻訳により検証する。この設定により、全く見えない言語からのゼロショット翻訳が可能になることを実証する。
論文参考訳（メタデータ） (2024-08-05T07:58:58Z)
Breaking the Script Barrier in Multilingual Pre-Trained Language Models with Transliteration-Based Post-Training Alignment [50.27950279695363]
転送性能は、低リソースのターゲット言語が高リソースのソース言語とは異なるスクリプトで書かれている場合、しばしば妨げられる。本論文は,この問題に対処するために翻訳を用いた最近の研究に触発されて,翻訳に基づくポストプレトレーニングアライメント(PPA)手法を提案する。
論文参考訳（メタデータ） (2024-06-28T08:59:24Z)
The IgboAPI Dataset: Empowering Igbo Language Technologies through Multi-dialectal Enrichment [3.087699704782493]
2025年のユネスコの研究によると、イグボ語は絶滅の危機に直面している。 Igboの堅牢で、影響力があり、広く採用されている言語技術を開発するためには、言語の多言語性を統合することが不可欠である。 IgboAPIデータセットは,Igbo方言の表現性の向上を目的とした多方言Igbo- English辞書データセットである。
論文参考訳（メタデータ） (2024-05-02T04:27:35Z)
Zero-shot Sentiment Analysis in Low-Resource Languages Using a Multilingual Sentiment Lexicon [78.12363425794214]
私たちは、34の言語にまたがるゼロショットの感情分析タスクに重点を置いています。文レベルの感情データを使用しない多言語語彙を用いた事前学習は、英語の感情データセットに微調整されたモデルと比較して、ゼロショット性能が優れていることを示す。
論文参考訳（メタデータ） (2024-02-03T10:41:05Z)
NusaWrites: Constructing High-Quality Corpora for Underrepresented and Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文参考訳（メタデータ） (2023-09-19T14:42:33Z)
No Language Left Behind: Scaling Human-Centered Machine Translation [69.28110770760506]
低レベルの言語と高レベルの言語のパフォーマンスギャップを狭めるためのデータセットとモデルを作成します。何千ものタスクをトレーニングしながらオーバーフィッティングに対処するために,複数のアーキテクチャとトレーニングの改善を提案する。本モデルでは,従来の最先端技術と比較して,BLEUの44%の改善を実現している。
論文参考訳（メタデータ） (2022-07-11T07:33:36Z)
NaijaSenti: A Nigerian Twitter Sentiment Corpus for Multilingual Sentiment Analysis [5.048355865260207]
ナイジェリアでもっとも広く話されている4言語に対して、人手によるTwitter感情データセットを初めて導入する。データセットは1言語あたり約30,000の注釈付きツイートで構成されている。私たちは、データセット、訓練されたモデル、感情レキシコン、コードをリリースし、表現不足言語における感情分析の研究にインセンティブを与えます。
論文参考訳（メタデータ） (2022-01-20T16:28:06Z)
When Word Embeddings Become Endangered [0.685316573653194]
本稿では,異なる資源豊富な言語の単語埋め込みとリソース不足言語の翻訳辞書を用いて,絶滅危惧言語の単語埋め込みを構築する手法を提案する。言語間の単語埋め込みと感情分析モデルはすべて、簡単に使えるPythonライブラリを通じて公開されています。
論文参考訳（メタデータ） (2021-03-24T15:42:53Z)
Learning and Evaluating Emotion Lexicons for 91 Languages [10.06987680744477]
本稿では,任意の対象言語に対して,ほぼ任意に大きな感情辞書を作成する手法を提案する。我々は8つの感情変数と100k以上の語彙エントリからなる表現に富んだ高被覆語彙を生成する。我々の手法は、辞書作成に対する最先端のモノリンガルなアプローチと一致し、一部の言語や変数に対する人間の信頼性を超越した結果をもたらす。
論文参考訳（メタデータ） (2020-05-12T10:32:03Z)
Design Challenges in Low-resource Cross-lingual Entity Linking [56.18957576362098]
言語間エンティティリンク (XEL) は、外国語テキスト中のエンティティの言及をウィキペディアのような英語の知識ベースに根拠付ける問題である。本稿は、英語のウィキペディアの候補タイトルを、特定の外国語の言及に対応付けて識別する重要なステップに焦点を当てる。本稿では,検索エンジンのクエリログを利用した簡易で効果的なゼロショットXELシステムQuELを提案する。
論文参考訳（メタデータ） (2020-05-02T04:00:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。