論文の概要: 100,000+ Movie Reviews from Kazakhstan: Russian, Kazakh, and Code-Switched Texts
- arxiv url: http://arxiv.org/abs/2605.08600v2
- Date: Tue, 12 May 2026 03:18:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 18:21:06.92308
- Title: 100,000+ Movie Reviews from Kazakhstan: Russian, Kazakh, and Code-Switched Texts
- Title(参考訳): カザフスタンの10万以上の映画レビュー:ロシア、カザフスタン、コード変換されたテキスト
- Authors: Rustem Yeshpanov,
- Abstract要約: 我々は、Kino.kzから集められたカザフスタンの映画レビュー100,502件の新しい公開コーパスを提示する。
データセットは多言語で、主にカザフスタンのレビューとコード変更されたテキストで構成されている。
3方向の極性分類と5クラススコア分類という2つの感情タスクを定義し、マルチリンガルトランスフォーマーモデルに対する古典的なBoW/TF-IDFベースラインをベンチマークする。
- 参考スコア(独自算出の注目度): 2.2505457850833284
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a new publicly available corpus of 100,502 movie reviews from Kazakhstan collected from kino.kz, spanning 2001-2025 and covering 4,943 unique titles. The dataset is multilingual, consisting mainly of Russian reviews alongside Kazakh and code-switched texts. Reviews are manually annotated for language and sentiment polarity, and 11,309 reviews additionally contain explicit user-provided ratings. We define two sentiment tasks -- three-way polarity classification and five-class score classification -- and benchmark classical BoW/TF-IDF baselines against multilingual transformer models (mBERT, XLM-RoBERTa, RemBERT). Experimental results show that transformer models consistently outperform classical baselines on polarity classification, while score classification remains challenging under leakage-controlled evaluation due to severe class imbalance and subtle distinctions between adjacent rating levels.
- Abstract(参考訳): 我々は2001年から2025年にかけて、Kino.kzから収集した100,502本の映画レビューを新たに公開し、4,943タイトルをカバーした。
データセットは多言語で、主にカザフスタンのレビューとコード変更されたテキストで構成されている。
レビューは、言語と感情の極性のために手動で注釈付けされ、さらに11,309のレビューには、明示的なユーザ提供評価が含まれている。
3方向の極性分類と5クラススコア分類という2つの感情タスクを定義し、マルチリンガルトランスフォーマーモデル(mBERT, XLM-RoBERTa, RemBERT)に対して古典的なBoW/TF-IDFベースラインをベンチマークする。
実験結果から, 変圧器モデルでは, 極性分類における古典的基準線を常に上回りながら, 急激なクラス不均衡と, 隣接する評価レベルの微妙な区別により, スコア分類は漏洩制御による評価下では困難なままであることがわかった。
関連論文リスト
- Benchmarking Bengali Dialectal Bias: A Multi-Stage Framework Integrating RAG-Based Translation and Human-Augmented RLAIF [0.3227658251731014]
大規模言語モデル(LLM)は、低リソース言語の方言に対する性能バイアスを頻繁に示している。
ベンガル方言9方言を対象に,LLM質問応答における方言バイアスを評価するための2段階の枠組みを提案する。
論文 参考訳(メタデータ) (2026-03-22T18:44:57Z) - KAConvText: Novel Approach to Burmese Sentence Classification using Kolmogorov-Arnold Convolution [0.16874375111244325]
本稿では,Kolmogorov-Arnold Convolution for Text(KAConvText)の文分類への応用について述べる。
静的な設定と微調整された設定の両方において、ランダムと高速テキストの埋め込みを比較して、様々な埋め込み構成について検討する。
その結果、KAConvText-MLPは、ヘイトスピーチ検出に9123%の精度(F1-score = 0.9109)、ニュース分類に92.66%の精度(F1-score = 0.9267)、言語識別に99.82%の精度(F1-score = 0.9982)を達成した。
論文 参考訳(メタデータ) (2025-07-09T11:25:35Z) - KazSAnDRA: Kazakh Sentiment Analysis Dataset of Reviews and Attitudes [3.4975081145096665]
KazSAnDRAは、様々な情報源から得られた180,064のレビューを幅広く収集し、1から5までの数値評価を含んでいる。
この研究は、4つの機械学習モデルの開発と評価を通じて、カザフ語感情分類の自動化も追求した。
論文 参考訳(メタデータ) (2024-03-28T11:51:11Z) - Using Natural Language Explanations to Rescale Human Judgments [81.66697572357477]
大規模言語モデル(LLM)を用いて順序付けアノテーションと説明を再スケールする手法を提案する。
我々は、アノテータのLikert評価とそれに対応する説明をLLMに入力し、スコア付けルーリックに固定された数値スコアを生成する。
提案手法は,合意に影響を及ぼさずに生の判断を再スケールし,そのスコアを同一のスコア付けルーリックに接する人間の判断に近づける。
論文 参考訳(メタデータ) (2023-05-24T06:19:14Z) - Perception Test: A Diagnostic Benchmark for Multimodal Video Models [78.64546291816117]
本稿では,事前学習したマルチモーダルモデルの知覚と推論能力を評価するために,新しいマルチモーダルビデオベンチマークを提案する。
知覚テストは、スキル(記憶、抽象化、物理学、セマンティックス)と、ビデオ、オーディオ、テキストモダリティ間の推論(記述的、説明的、予測的、反ファクト的)のタイプに焦点を当てている。
このベンチマークは、ゼロショット/少数ショットまたは限定的な微調整方式で、転送機能の事前訓練されたモデルを探索する。
論文 参考訳(メタデータ) (2023-05-23T07:54:37Z) - Russian SuperGLUE 1.1: Revising the Lessons not Learned by Russian NLP
models [53.95094814056337]
本稿では,ロシアNLPモデルのGLUEを改良したベンチマークである,ロシアのSuperGLUE 1.1を提案する。
新バージョンには、技術的、ユーザエクスペリエンス、方法論的改善が多数含まれている。
我々は,ロシアのSuperGLUEをオープンソースモデルMOROCCOの産業的評価のためのフレームワークに統合する。
論文 参考訳(メタデータ) (2022-02-15T23:45:30Z) - The Multilingual Amazon Reviews Corpus [46.84980931183582]
我々は、多言語テキスト分類のための大規模なAmazonレビューコレクションであるMultilingual Amazon Reviews Corpus (MARC)を提示する。
MARCは2015年から2019年にかけて収集された英語、日本語、ドイツ語、フランス語、スペイン語、中国語のレビューを含んでいる。
コーパスは5つの星のレーティングでバランスが取れており、それぞれのレーティングは各言語のレビューの20%を占めている。
論文 参考訳(メタデータ) (2020-10-06T09:34:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。