Fugu-MT 論文翻訳(概要): Benchmarking PyCaret AutoML Against IndoBERT Fine-Tuning for Sentiment Analysis on Indonesian IKN Twitter Data

論文の概要: Benchmarking PyCaret AutoML Against IndoBERT Fine-Tuning for Sentiment Analysis on Indonesian IKN Twitter Data

arxiv url: http://arxiv.org/abs/2604.25392v1
Date: Tue, 28 Apr 2026 09:02:24 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-29 16:49:17.788545
Title: Benchmarking PyCaret AutoML Against IndoBERT Fine-Tuning for Sentiment Analysis on Indonesian IKN Twitter Data
Title（参考訳）: インドネシアのIKN Twitterデータにおける知覚分析のためのIndoBERTファインチューニングに対するPyCaret AutoMLのベンチマーク
Authors: Mutia Alfi Mayzaroh, Dwi Fitria Ningsih, Nindi Destriani, Martin C. T. Manullang,
Abstract要約: 本稿では、PyCaret AutoMLに基づく古典的な機械学習アプローチと、IndoBERTに基づくディープラーニングアプローチをベンチマークする。データセットには1,472個の手作業によるラベル付きサンプルが含まれており、780個の否定的なコメントと692個の肯定的なコメントで構成されている。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper benchmarks a classical machine learning approach based on PyCaret AutoML against a deep learning approach based on IndoBERT fine-tuning for binary sentiment analysis of Indonesian-language Twitter comments related to Ibu Kota Nusantara (IKN). The dataset contains 1,472 manually labeled samples, consisting of 780 negative and 692 positive comments. In the machine learning setting, Logistic Regression, Naive Bayes, and Support Vector Machine were evaluated using 10-fold cross-validation, with Logistic Regression achieving the best performance among the classical models at 77.57% accuracy and 77.17% F1-score. In the deep learning setting, the indobenchmark/indobert-base-p1 model was fine-tuned for five epochs and achieved 89.59% test accuracy and 89.37% F1-score. The results show that IndoBERT substantially outperforms the machine learning baselines, highlighting the effectiveness of Transformer-based contextual representations for informal Indonesian social media text.
Abstract（参考訳）: 本稿では,Ibu Kota Nusantara(IKN)に関連するインドネシア語Twitterコメントのバイナリ感情分析のためのIndoBERTファインタニングに基づくディープラーニングアプローチに対して,PyCaret AutoMLに基づく古典的な機械学習アプローチをベンチマークする。データセットには1,472個の手作業によるラベル付きサンプルが含まれており、780個の否定的なコメントと692個の肯定的なコメントで構成されている。機械学習環境では、ロジスティック回帰、ネイブベイズ、サポートベクトルマシンを10倍のクロスバリデーションを用いて評価し、ロジスティック回帰は古典モデルの77.57%の精度と77.17%のF1スコアで最高のパフォーマンスを達成した。ディープラーニング環境では、indobenchmark/indobert-base-p1モデルは5つのエポックで微調整され、89.59%のテスト精度と89.37%のF1スコアを達成した。その結果、IndoBERTは機械学習のベースラインを大幅に上回り、インドネシアの非公式なソーシャルメディアテキストに対するTransformerベースの文脈表現の有効性を強調した。

関連論文リスト

Benchmarking Logistic Regression, SVM, and LightGBM Against BiLSTM with Attention for Sentiment Analysis on Indonesian Product Reviews [0.0]
本稿では、PyCaret AutoMLフレームワークによる機械学習(ML)アプローチと、双方向長短期記憶(BiLSTM)アーキテクチャに基づくディープラーニング(DL)アプローチを比較し、インドネシア製品レビューのバイナリ感情分類のためのアテンションメカニズムと比較する。ロジスティック回帰は97.26%、F1スコア97.26%で最高のML性能を達成した。
論文参考訳（メタデータ） (2026-04-28T10:00:42Z)
HausaMovieReview: A Benchmark Dataset for Sentiment Analysis in Low-Resource African Language [1.3465808629549525]
本稿では,Hausaにおける5000のYouTubeコメントとコードスイッチによる英語を含む新しいベンチマークデータセットを提案する。このデータセットを用いて、古典モデルと微調整変換器モデルの比較分析を行う。精度が89.72%、F1スコアが89.60%のDecision Tree分類器は、ディープラーニングモデルよりも大幅に優れていた。
論文参考訳（メタデータ） (2025-09-17T22:57:21Z)
Logits-Based Finetuning [48.18151583153572]
本稿では,教師付き学習と知識蒸留の強みを統合したロジットに基づく微調整フレームワークを提案する。提案手法は,教師のロジットと地上の真理ラベルを組み合わせ,正確性と言語的多様性を両立させることにより,充実した訓練目標を構築する。
論文参考訳（メタデータ） (2025-05-30T10:57:09Z)
RideKE: Leveraging Low-Resource, User-Generated Twitter Content for Sentiment and Emotion Detection in Kenyan Code-Switched Dataset [4.142287865325998]
我々は、ケニアのコード変更データを分析し、感情分類と感情分類のための4つの最先端トランスフォーマー(SOTA)モデルを評価する。感情分析では、XLM-Rは最高精度(69.2%)、F1スコア(66.1%)、XLM-R半教師(67.2%、64.1%)を達成する。感情分析では、DistilBERTは精度59.8%、F1は31%、mBERTは半監督的(精度59%、F1は26.5)である。
論文参考訳（メタデータ） (2025-02-10T06:18:07Z)
Implicit Sentiment Analysis Based on Chain of Thought Prompting [1.4582633500696451]
本稿では,思考の感覚分析(SAoT)フレームワークを紹介する。このフレームワークはまず、常識と思考連鎖能力を用いてテキストの暗黙的な側面と意見を分析する。このモデルは、レストランレビュー1120とラップトップレビュー638からなるSemEval 2014データセットで評価されている。
論文参考訳（メタデータ） (2024-08-22T06:55:29Z)
VisIT-Bench: A Benchmark for Vision-Language Instruction Following Inspired by Real-World Use [49.574651930395305]
VisIT-Benchは、命令追従型視覚言語モデルの評価のためのベンチマークである。提案データセットは592個のテストクエリからなり,それぞれに人手による指示条件付きキャプションを付与した。人的評価と自動評価の両方を用いて,モデルと参照間の品質ギャップを定量化する。
論文参考訳（メタデータ） (2023-08-12T15:27:51Z)
BERT Fine-Tuning for Sentiment Analysis on Indonesian Mobile Apps Reviews [1.5749416770494706]
本研究では,2種類の事前学習モデルを用いた感情分析における細調整BERTの有効性について検討した。使用されるデータセットは、インドネシアのGoogle Playサイトで2020年のトップ10アプリのユーザーレビューである。また,2つのトレーニングデータラベリング手法を用いて,スコアベースとレキシコンベースのモデルの有効性を検証した。
論文参考訳（メタデータ） (2021-07-14T16:00:15Z)
DeBERTa: Decoding-enhanced BERT with Disentangled Attention [119.77305080520718]
2つの新しい手法を用いてBERTモデルとRoBERTaモデルを改善する新しいモデルアーキテクチャDeBERTaを提案する。これらの手法により,モデル事前学習の効率化と,自然言語理解(NLU)と自然言語生成(NLG)の両方の性能向上が期待できる。
論文参考訳（メタデータ） (2020-06-05T19:54:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。