論文の概要: Benchmarking Logistic Regression, SVM, Naive Bayes, and IndoBERT Fine-Tuning for Sentiment Analysis on Indonesian Product Reviews
- arxiv url: http://arxiv.org/abs/2605.03439v1
- Date: Tue, 05 May 2026 07:20:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.816034
- Title: Benchmarking Logistic Regression, SVM, Naive Bayes, and IndoBERT Fine-Tuning for Sentiment Analysis on Indonesian Product Reviews
- Title(参考訳): インドネシア製品レビューにおける評価分析のためのベンチマークロジスティック回帰, SVM, Naive Bayes, IndoBERTファインチューニング
- Authors: Nabila Zakiyah Zahra, Salwa Farhanatussaidah, Nasywa Nur Afifah, Luluk Muthoharoh, Ardika Satria, Martin C. T. Manullang,
- Abstract要約: 本稿では,3段階の感情分析タスクにおいて,トランスフォーマーに基づくディープラーニングモデルに対して従来の機械学習アプローチをベンチマークする。
IndoBERTモデルをコンテキストシーケンス分類のために微調整した。
対話型Gradio Webアプリケーションとして最終的な感情分類モデルをデプロイすることで,パイプラインの実用性を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The exponential growth of e-commerce platforms in Indonesia has generated a massive volume of user-generated product reviews. Analyzing the sentiment of these reviews is critical for measuring customer satisfaction and identifying product issues at scale. This paper benchmarks traditional Machine Learning (ML) approaches against a Transformer-based Deep Learning model for a three-class sentiment analysis task (positive, neutral, negative) on the Tokopedia Product Reviews 2025 dataset. We implemented Term Frequency-Inverse Document Frequency (TF-IDF) feature extraction coupled with three algorithms: Logistic Regression, Linear Support Vector Machine (SVM), and Multinomial Naive Bayes as robust baselines. Subsequently, we fine-tuned the IndoBERT model (indobenchmark/indobert-base-p1) for contextual sequence classification. To computationally address the severe class imbalance inherent in e-commerce feedback, we applied balanced class weights for the baseline models and engineered a custom weighted cross-entropy loss function within the IndoBERT training loop, following the broader motivation of imbalanced-learning research. Our comprehensive evaluation using Accuracy, Macro F1-score, and Weighted F1-score revealed that the traditional Linear SVC model significantly outperformed the IndoBERT model in our experimental setup, achieving an Accuracy of 97.60% and a Macro F1-score of 0.5510, compared to IndoBERT's 88.70% and 0.5088. Detailed analysis indicates that this performance gap was primarily driven by discrepancies in the data sampling regimes, where baselines utilized the full corpus while the Transformer was constrained to a sampled subset. Finally, we demonstrate the practical viability of our pipeline by deploying the final sentiment classification model as an interactive Gradio web application.
- Abstract(参考訳): インドネシアにおけるeコマースプラットフォームの指数的な成長は、ユーザー生成製品レビューを大量に生み出している。
これらのレビューの感情を分析することは、顧客の満足度を測定し、大規模な製品問題を特定するために重要です。
本稿では,Tokopedia Product Reviews 2025データセットの3クラス感情分析タスク(肯定的,中立的,否定的)に対して,トランスフォーマーに基づくディープラーニングモデルに対する従来の機械学習(ML)アプローチをベンチマークする。
我々は、ロジスティック回帰、線形サポートベクトルマシン(SVM)、マルチノードニーブベイズという3つのアルゴリズムと組み合わせて、TF-IDF(Term Frequency-Inverse Document Frequency)機能抽出を実装した。
その後,IndoBERTモデル(Indobenchmark/Indobert-base-p1)を文脈的シーケンス分類のために微調整した。
電子商取引のフィードバックに固有の厳密なクラス不均衡を計算的に解決するため,ベースラインモデルにバランスの取れたクラス重みを適用し,IndoBERTトレーニングループ内に独自の重み付きクロスエントロピー損失関数を設計した。
従来の線形SVCモデルでは精度97.60%、マクロF1スコア0.5510、IndoBERT88.70%、および0.5088よりも大幅に優れていた。
詳細な分析によると、このパフォーマンスギャップは主にデータサンプリング方式の相違によるもので、ベースラインは全コーパスを利用しており、トランスフォーマーはサンプリングされたサブセットに制約されていた。
最後に、最終的な感情分類モデルを対話型Gradio Webアプリケーションとしてデプロイすることで、パイプラインの実用性を示す。
関連論文リスト
- Benchmarking Logistic Regression, SVM, and LightGBM Against BiLSTM with Attention for Sentiment Analysis on Indonesian Product Reviews [0.0]
本稿では、PyCaret AutoMLフレームワークによる機械学習(ML)アプローチと、双方向長短期記憶(BiLSTM)アーキテクチャに基づくディープラーニング(DL)アプローチを比較し、インドネシア製品レビューのバイナリ感情分類のためのアテンションメカニズムと比較する。
ロジスティック回帰は97.26%、F1スコア97.26%で最高のML性能を達成した。
論文 参考訳(メタデータ) (2026-04-28T10:00:42Z) - Benchmarking PyCaret AutoML Against IndoBERT Fine-Tuning for Sentiment Analysis on Indonesian IKN Twitter Data [0.0]
本稿では、PyCaret AutoMLに基づく古典的な機械学習アプローチと、IndoBERTに基づくディープラーニングアプローチをベンチマークする。
データセットには1,472個の手作業によるラベル付きサンプルが含まれており、780個の否定的なコメントと692個の肯定的なコメントで構成されている。
論文 参考訳(メタデータ) (2026-04-28T09:02:24Z) - The GT-Score: A Robust Objective Function for Reducing Overfitting in Data-Driven Trading Strategies [51.56484100374058]
GT-Scoreは、パフォーマンス、統計的重要性、一貫性、ダウンサイドリスクを統合する複合目的関数である。
GT-Scoreは、歩行前向きの検証において、ベースライン目的関数に対して、一般化比を98%改善する。
これらの結果から, 抗オーバーフィッティング構造を組み込むことにより, 定量的研究におけるバックテストの信頼性を向上させることが示唆された。
論文 参考訳(メタデータ) (2026-01-22T05:16:47Z) - Sentiment Analysis Of Shopee Product Reviews Using Distilbert [0.0]
本研究では,Shopee製品レビューにおける感情分類に,軽量なトランスフォーマーベースディープラーニングモデルであるDistilBERTを用いて検討した。
使用されるデータセットは、約100万の英語レビューで構成され、前処理とトレーニングが行われた。
DistilBERTは94.8%の精度を達成し、BERT (95.3%) をわずかに下回ったが、SVM (90.2%) よりもかなり高く、計算時間を55%以上削減した。
論文 参考訳(メタデータ) (2025-11-27T10:43:51Z) - Reliable and Reproducible Demographic Inference for Fairness in Face Analysis [63.46525489354455]
本稿では、従来のエンドツーエンドトレーニングをモジュラートランスファー学習アプローチで置き換える、完全に再現可能なDAIパイプラインを提案する。
このパイプラインは、正確性、公正性、そしてアイデンティティ内整合性によって定義される、新たに導入された堅牢性の概念の3つの次元にわたって監査する。
以上の結果から,提案手法は特に民族性において,強い基準線を上回り,その特性はより困難であることが示唆された。
論文 参考訳(メタデータ) (2025-10-23T12:22:02Z) - Prismatic Synthesis: Gradient-based Data Diversification Boosts Generalization in LLM Reasoning [77.120955854093]
我々は,データ多様性が言語モデルにおける一般化の強力な予測因子であることを示す。
モデル誘起勾配のエントロピーを通して多様性を定量化する計量であるG-Vendiを導入する。
多様な合成データを生成するためのフレームワークであるPrismatic Synthesisを提案する。
論文 参考訳(メタデータ) (2025-05-26T16:05:10Z) - Sentiment Analysis in Software Engineering: Evaluating Generative Pre-trained Transformers [0.0]
本研究は,SE感情分析において, BERT などの双方向トランスフォーマー, 特に GPT-4o-mini に対する性能を系統的に評価する。
その結果、微調整のGPT-4o-miniは、GitHubやJiraのような構造化およびバランスの取れたデータセット上でBERTや他の双方向モデルに匹敵するパフォーマンスを示した。
Stack Overflowのような不均衡な感情分布を持つ言語的に複雑なデータセットでは、デフォルトのGPT-4o-miniモデルはより優れた一般化を示し、微調整モデルの13.1%と比べて85.3%の精度を実現している。
論文 参考訳(メタデータ) (2025-04-22T14:19:25Z) - Instruct-DeBERTa: A Hybrid Approach for Aspect-based Sentiment Analysis on Textual Reviews [2.0143010051030417]
Aspect-based Sentiment Analysis (ABSA)は自然言語処理(NLP)における重要な課題である
従来の感情分析手法は、全体的な感情を決定するのに有用だが、特定の製品やサービス機能に関する暗黙の意見を見逃すことが多い。
本稿では、レキシコンベースのアプローチから機械学習まで、ABSA方法論の進化を包括的に概観する。
論文 参考訳(メタデータ) (2024-08-23T16:31:07Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Preserving Knowledge Invariance: Rethinking Robustness Evaluation of Open Information Extraction [49.15931834209624]
実世界におけるオープン情報抽出モデルの評価をシミュレートする最初のベンチマークを示す。
我々は、それぞれの例が知識不変のcliqueである大規模なテストベッドを設計し、注釈付けする。
さらにロバスト性計量を解明することにより、その性能が全体の傾きに対して一貫して正確であるならば、モデルはロバストであると判断される。
論文 参考訳(メタデータ) (2023-05-23T12:05:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。