論文の概要: IndoBERT-Sentiment: Context-Conditioned Sentiment Classification for Indonesian Text
- arxiv url: http://arxiv.org/abs/2604.07057v1
- Date: Wed, 08 Apr 2026 13:08:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.546154
- Title: IndoBERT-Sentiment: Context-Conditioned Sentiment Classification for Indonesian Text
- Title(参考訳): IndoBERT-Sentiment: インドネシア語テキストの文脈記述型感性分類
- Authors: Muhammad Apriandito Arya Saputra, Andry Alamsyah, Dian Puteri Ramadhani, Thomhert Suprapto Siadari, Hanif Fakhrurroja,
- Abstract要約: 既存のインドネシアの感情分析モデルは、文が肯定的、否定的、中立的であるかどうかをしばしば決定する話題の文脈を無視して、テキストを分離して分類する。
IndoBERT-Sentimentは、話題の文脈とテキストの両方を入力として扱う文脈条件の感情分類器であり、議論されている話題に根ざした感情予測を生成する。
関連性分類に先立って実証された文脈条件付けは、感情分析に効果的に移行し、文脈自由アプローチによって体系的に誤って分類されたテキストを正しく分類することができることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing Indonesian sentiment analysis models classify text in isolation, ignoring the topical context that often determines whether a statement is positive, negative, or neutral. We introduce IndoBERT-Sentiment, a context-conditioned sentiment classifier that takes both a topical context and a text as input, producing sentiment predictions grounded in the topic being discussed. Built on IndoBERT Large (335M parameters) and trained on 31,360 context-text pairs labeled across 188 topics, the model achieves an F1 macro of 0.856 and accuracy of 88.1%. In a head-to-head evaluation against three widely used general-purpose Indonesian sentiment models on the same test set, IndoBERT-Sentiment outperforms the best baseline by 35.6 F1 points. We show that context-conditioning, previously demonstrated for relevancy classification, transfers effectively to sentiment analysis and enables the model to correctly classify texts that are systematically misclassified by context-free approaches.
- Abstract(参考訳): 既存のインドネシアの感情分析モデルは、文が肯定的、否定的、中立的であるかどうかをしばしば決定する話題の文脈を無視して、テキストを分離して分類する。
IndoBERT-Sentimentは、話題の文脈とテキストの両方を入力として扱う文脈条件の感情分類器であり、議論されている話題に根ざした感情予測を生成する。
IndoBERT Large (335Mパラメータ)上に構築され、188のトピックにラベル付けされた31,360のコンテキストテキストペアでトレーニングされたモデルでは、F1マクロは0.856、精度は88.1%である。
同じテストセットで広く使用されている3つの汎用的なインドネシアの感情モデルに対して、IndoBERT-Sentimentは35.6F1ポイントで最高のベースラインを上回っている。
関連性分類に先立って実証された文脈条件付けは、感情分析に効果的に移行し、文脈自由アプローチによって体系的に誤って分類されたテキストを正しく分類することができることを示す。
関連論文リスト
- IndoBERT-Relevancy: A Context-Conditioned Relevancy Classifier for Indonesian Text [0.0]
IndoBERT-Relevancyは、IndoBERT Largeパラメータ上に構築されたコンテキスト条件の関連性分類器である。
私たちは188のトピックにまたがる31,360のラベル付きペアのデータセットをトレーニングしました。
最終モデルはF1スコア0.948、精度96.5%であり、インドネシアの形式テキストと非公式テキストの両方を扱う。
論文 参考訳(メタデータ) (2026-03-27T05:58:15Z) - Context is Enough: Empirical Validation of $\textit{Sequentiality}$ on Essays [1.338174941551702]
コンテクスト版の連続性は, 談話レベルの特徴の人間による評価とより密接に一致していることを示す。
本研究は,自動エッセイ評価および関連するNLPタスクの検証,解釈,補完機能としてコンテキストベースのシーケンシャル性の利用を支援する。
論文 参考訳(メタデータ) (2025-11-12T10:31:07Z) - Emotion Classification In-Context in Spanish [0.0]
顧客からのフィードバックを,肯定的,中立的,否定的という3つの感情カテゴリーに分類する。
伝統的な方法では、広く話される言語からのフィードバックをあまり一般的でない言語に翻訳し、意味的整合性が失われる。
本稿では,TF-IDFとBERTの埋め込みを組み合わせたハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2025-05-26T23:09:41Z) - Bias in Language Models: Beyond Trick Tests and Toward RUTEd Evaluation [49.3814117521631]
大規模言語モデル(LLM)におけるバイアスと公平性の標準ベンチマークは、プロンプトによって記述されたユーザー属性とインプットの関係を測定する。
本研究では, 子どもの就寝時間, ユーザ・ペルソナ, 英語学習演習の3つの文脈から, RUTEdの類似性を評価する。
標準偏差指標は、より現実的な偏差指標と有意な相関関係がないことがわかった。
論文 参考訳(メタデータ) (2024-02-20T01:49:15Z) - How Well Do Text Embedding Models Understand Syntax? [50.440590035493074]
テキスト埋め込みモデルが幅広い構文的文脈にまたがって一般化する能力は、まだ解明されていない。
その結果,既存のテキスト埋め込みモデルは,これらの構文的理解課題に十分対応していないことが明らかとなった。
多様な構文シナリオにおけるテキスト埋め込みモデルの一般化能力を高めるための戦略を提案する。
論文 参考訳(メタデータ) (2023-11-14T08:51:00Z) - Beyond Sentiment: Leveraging Topic Metrics for Political Stance
Classification [1.0878040851638]
本研究では,抽出されたトピックから変換されたダミー変数であるトピックメトリクスを,スタンス分類における感情指標の代替と補完の両方として紹介する。
実験の結果、BERTopicは従来のアプローチと比較してコヒーレンススコアを17.07%から54.20%改善していることがわかった。
本研究は, 文脈に富むテキストやコーパスにおいて, 姿勢と感情の相関が弱いトピックメトリクスが特に有効であることが示唆された。
論文 参考訳(メタデータ) (2023-10-24T00:50:33Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - RuArg-2022: Argument Mining Evaluation [69.87149207721035]
本稿は、ロシア語テキストを扱う議論分析システムの最初のコンペティションの主催者の報告である。
新型コロナウイルスの感染拡大に伴う3つの話題について、9,550文(ソーシャルメディア投稿記事)のコーパスを用意した。
両タスクで第一位を獲得したシステムは、BERTアーキテクチャのNLI(Natural Language Inference)変種を使用した。
論文 参考訳(メタデータ) (2022-06-18T17:13:37Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - A computational model implementing subjectivity with the 'Room Theory'.
The case of detecting Emotion from Text [68.8204255655161]
本研究は,テキスト分析における主観性と一般的文脈依存性を考慮した新しい手法を提案する。
単語間の類似度を用いて、ベンチマーク中の要素の相対的関連性を抽出することができる。
この方法は、主観的評価がテキストの相対値や意味を理解するために関係しているすべてのケースに適用できる。
論文 参考訳(メタデータ) (2020-05-12T21:26:04Z) - Contextualized Embeddings in Named-Entity Recognition: An Empirical
Study on Generalization [14.47381093162237]
文脈適応型埋め込みは、教師なし言語モデルを用いて、文脈に応じて単語表現を計算する。
標準英語ベンチマークは、列車とテストの言及の間に非現実的な語彙的重複があるため、文脈的特徴よりも語彙的の重要性を過大評価している。
私たちは、特にドメイン外において、見知らぬ参照の検出に特に有益であることが示しています。
論文 参考訳(メタデータ) (2020-01-22T15:15:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。