Fugu-MT 論文翻訳(概要): yosm: A new yoruba sentiment corpus for movie reviews

論文の概要: yosm: A new yoruba sentiment corpus for movie reviews

arxiv url: http://arxiv.org/abs/2204.09711v1
Date: Wed, 20 Apr 2022 18:00:37 GMT
ステータス: 翻訳完了
システム内更新日: 2022-04-23 05:41:26.159764
Title: yosm: A new yoruba sentiment corpus for movie reviews
Title（参考訳）: yosm:映画レビューのための新しいヨルバ感情コーパス
Authors: Iyanuoluwa Shode, David Ifeoluwa Adelani, and Anna Feldman
Abstract要約: ナイジェリア映画レビューにおける感情分析について考察する。データにはIMDB、Rotten Tomatoes、Realboxd、Cinemapointer、Nollyratedなど1500本の映画レビューが含まれている。我々は、mBERTやAfriBERTaといった最先端の事前訓練言語モデルを用いて、感情分類モデルを開発する。
参考スコア（独自算出の注目度）: 2.3513645401551337
License: http://creativecommons.org/licenses/by/4.0/
Abstract: A movie that is thoroughly enjoyed and recommended by an individual might be hated by another. One characteristic of humans is the ability to have feelings which could be positive or negative. To automatically classify and study human feelings, an aspect of natural language processing, sentiment analysis and opinion mining were designed to understand human feelings regarding several issues which could affect a product, a social media platforms, government, or societal discussions or even movies. Several works on sentiment analysis have been done on high resource languages while low resources languages like Yoruba have been sidelined. Due to the scarcity of datasets and linguistic architectures that will suit low resource languages, African languages "low resource languages" have been ignored and not fully explored. For this reason, our attention is placed on Yoruba to explore sentiment analysis on reviews of Nigerian movies. The data comprised 1500 movie reviews that were sourced from IMDB, Rotten Tomatoes, Letterboxd, Cinemapointer and Nollyrated. We develop sentiment classification models using the state-of-the-art pre-trained language models like mBERT and AfriBERTa to classify the movie reviews.
Abstract（参考訳）: 個人によって徹底的に楽しまれ、推奨される映画は、他の人に嫌われるかもしれない。人間の特徴の1つは、肯定的あるいは否定的な感情を持つ能力である。人間の感情を自動的に分類し研究するために、自然言語処理、感情分析、意見マイニングの側面は、製品、ソーシャルメディアプラットフォーム、政府、社会的議論、さらには映画に影響を及ぼす可能性のあるいくつかの問題に関する人間の感情を理解するように設計された。感情分析に関するいくつかの研究は高リソース言語で行われており、yorubaのような低リソース言語は横行している。低リソース言語に適合するデータセットや言語アーキテクチャの不足のため、アフリカの言語"低リソース言語"は無視され、完全には検討されていない。そのため、ナイジェリア映画の評価に関する感情分析を探究するため、ヨルバに注目が集まっている。データにはIMDB、Rotten Tomatoes、Realboxd、Cinemapointer、Nollyratedなど1500本の映画レビューが含まれている。我々は、mBERTやAfriBERTaといった最先端の事前学習言語モデルを用いて感情分類モデルを構築し、映画レビューを分類する。

関連論文リスト

AVMeme Exam: A Multimodal Multilingual Multicultural Benchmark for LLMs' Contextual and Cultural Knowledge and Thinking [59.15472057710525]
AVMeme Examは、音声、歌、音楽、サウンドエフェクトにまたがる、1000以上の象徴的なインターネットの音とビデオの人間による評価ベンチマークである。各ミームは、表面コンテンツからコンテキスト、感情、使用法、世界知識への理解レベルを評価するユニークなQ&Aと組み合わせられる。このベンチマークを用いて,最先端のマルチモーダル言語モデル (MLLM) を人間の参加者とともに体系的に評価した。
論文参考訳（メタデータ） (2026-01-25T01:40:15Z)
CURVE: A Benchmark for Cultural and Multilingual Long Video Reasoning [58.73855961335903]
CURVE(Cultural Understanding and Reasoning in Video Evaluation)は、多言語・多言語ビデオ推論のための挑戦的なベンチマークである。 18のグローバルローカライズされた、地域固有の文化的ビデオから、高品質で完全な人為的なアノテーションを含んでいる。以上の結果から, SoTA Video-LLM は人間レベルの精度よりもかなり低い精度で動作していることが明らかとなった。
論文参考訳（メタデータ） (2026-01-15T18:15:06Z)
Oogiri-Master: Benchmarking Humor Understanding via Oogiri [53.060893644603844]
参加者が与えられたプロンプトに対して機知に富む応答を生成できる,日本の創造的反応ゲーム「おぎり」を用いてユーモアを学習する。既存のデータセットには、プロンプト毎の候補応答がほとんどなく、評価中に人気信号が露出し、客観性と同等の指標が欠如している。 Oogiri-Master と Oogiri-Corpus は,大規模言語モデルにおけるユーモア理解の厳密な評価を可能にするためのベンチマークとデータセットである。
論文参考訳（メタデータ） (2025-12-25T03:59:20Z)
Sentiment Analysis and Emotion Classification using Machine Learning Techniques for Nagamese Language - A Low-resource Language [0.0]
本研究の目的は,長染語に含まれる極性(肯定的,否定的,中立的)と基本的な感情から感情を検出することである。我々は1,195語からなる感情極性レキシコンを構築し、これらを用いて教師付き機械学習技術のための機能を構築する。
論文参考訳（メタデータ） (2025-12-01T04:01:29Z)
On the Thinking-Language Modeling Gap in Large Language Models [68.83670974539108]
言語と思考のモデリングには大きなギャップがあることが示される。本稿では,このギャップを実証し緩和するために,Language-of-Thoughts (LoT) と呼ばれる新しいプロンプト手法を提案する。
論文参考訳（メタデータ） (2025-05-19T09:31:52Z)
All-in-one: Understanding and Generation in Multimodal Reasoning with the MAIA Benchmark [74.4821011648997]
MAIAはビデオにおける視覚言語モデルの推論能力の詳細な調査のために設計されたベンチマークである。視覚言語モデル(VLM)を2つのタスクで評価する。言語と視覚の関係を混乱させようとする12の推論カテゴリを考察する。
論文参考訳（メタデータ） (2025-02-24T09:25:51Z)
You Shall Know a Tool by the Traces it Leaves: The Predictability of Sentiment Analysis Tools [74.98850427240464]
感情分析ツールが同じデータセットで一致しないことを示す。感傷的アノテーションに使用される感情ツールは,その結果から予測できることを示す。
論文参考訳（メタデータ） (2024-10-18T17:27:38Z)
See It from My Perspective: Diagnosing the Western Cultural Bias of Large Vision-Language Models in Image Understanding [78.88461026069862]
視覚言語モデル(VLM)は、多くの言語における画像に関するクエリに応答することができる。我々は、画像理解における西洋の偏見を実証し、局所化する新しい研究を提案する。
論文参考訳（メタデータ） (2024-06-17T15:49:51Z)
LFED: A Literary Fiction Evaluation Dataset for Large Language Models [58.85989777743013]
元々は中国語で書かれたか、中国語に翻訳された95の文学小説を収集し、数世紀にわたって幅広い話題を扱っている。質問分類を8つのカテゴリーで定義し,1,304の質問の作成を導く。我々は、小説の特定の属性(小説の種類、文字番号、出版年など)がLLMのパフォーマンスに与える影響を詳細に分析する。
論文参考訳（メタデータ） (2024-05-16T15:02:24Z)
SOUL: Towards Sentiment and Opinion Understanding of Language [96.74878032417054]
我々は、言語感覚とオピニオン理解(SOUL)と呼ばれる新しいタスクを提案する。 SOULは2つのサブタスクを通して感情理解を評価することを目的としている:レビュー(RC)と正当化生成(JG)。
論文参考訳（メタデータ） (2023-10-27T06:48:48Z)
NusaWrites: Constructing High-Quality Corpora for Underrepresented and Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文参考訳（メタデータ） (2023-09-19T14:42:33Z)
AlbMoRe: A Corpus of Movie Reviews for Sentiment Analysis in Albanian [0.0]
AlbMoRe(アルブモレ)は、アルバニアの映画レビュー800のコーパス。各テキストは肯定的あるいは否定的にラベル付けされ、感情分析研究に使用することができる。
論文参考訳（メタデータ） (2023-06-14T14:21:55Z)
NollySenti: Leveraging Transfer Learning and Machine Translation for Nigerian Movie Sentiment Classification [10.18858070640917]
アフリカには2000以上の先住民族の言語があるが、データセットが不足しているため、NLPの研究では不足している。私たちは、ナイジェリアで広く話されている5つの言語(英語、ハウサ語、イグボ語、ナイジェリア・ピジン語、ヨルバ語)のノリーウッド映画レビューに基づいて、新しいデータセット、NollySentiを作成しました。
論文参考訳（メタデータ） (2023-05-18T13:38:36Z)
No Language Left Behind: Scaling Human-Centered Machine Translation [69.28110770760506]
低レベルの言語と高レベルの言語のパフォーマンスギャップを狭めるためのデータセットとモデルを作成します。何千ものタスクをトレーニングしながらオーバーフィッティングに対処するために,複数のアーキテクチャとトレーニングの改善を提案する。本モデルでは,従来の最先端技術と比較して,BLEUの44%の改善を実現している。
論文参考訳（メタデータ） (2022-07-11T07:33:36Z)
Sentiment Classification in Swahili Language Using Multilingual BERT [0.04297070083645048]
本研究は、現在の最新モデルである多言語BERTを用いて、スワヒリデータセットの感情分類を行う。このデータは、異なるソーシャルメディアプラットフォームとisear emotionデータセットで8.2kのレビューとコメントを抽出、注釈付けすることで作成された。モデルは微調整され、最高の精度は87.59%に達した。
論文参考訳（メタデータ） (2021-04-19T01:47:00Z)
Multilingual, Temporal and Sentimental Distant-Reading of City Events [0.0]
この分析は、祭りの期間中に収集されたベルリンのツイートに遠くから読むことを目的としている。我々は多言語埋め込みによる深層感情ネットワークを訓練した。トレーニングされたアルゴリズムは0.78のテストスコアを持ち、フェスティバル中にBerlinaleハッシュタグでツイートに適用される。
論文参考訳（メタデータ） (2021-01-04T10:57:11Z)
Corpus Creation for Sentiment Analysis in Code-Mixed Tamil-English Text [0.9235531183915556]
YouTubeのコメント投稿15,744件を含む,コード変更による感情注釈付きコーパスを作成します。本稿では,コーパスの作成と極性を割り当てるプロセスについて述べる。本稿では,このコーパスでトレーニングした感情分析の結果をベンチマークとして,アノテーション間の合意を提示する。
論文参考訳（メタデータ） (2020-05-30T07:17:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。