論文の概要: Unveiling factors influencing judgment variation in Sentiment Analysis with Natural Language Processing and Statistics
- arxiv url: http://arxiv.org/abs/2405.12055v1
- Date: Mon, 20 May 2024 14:24:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-21 13:05:04.710096
- Title: Unveiling factors influencing judgment variation in Sentiment Analysis with Natural Language Processing and Statistics
- Title(参考訳): 自然言語処理による感性分析における判断変動に影響を与える要因の解明と統計
- Authors: Olga Kellert, Carlos Gómez-Rodríguez, Mahmud Uz Zaman,
- Abstract要約: 1語タイトルの形容詞は、他の単語タイプや音声の一部(POS)と比べて判断のばらつきが低い傾向にある
感性語は、偏極性判定の研究における感情語の重要性を強調するとともに、判断の変動の低さにも寄与する。
中立な言葉は 予想したほど 高い判断のバリエーションに結びついている
- 参考スコア(独自算出の注目度): 11.435933811730106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: TripAdvisor reviews and comparable data sources play an important role in many tasks in Natural Language Processing (NLP), providing a data basis for the identification and classification of subjective judgments, such as hotel or restaurant reviews, into positive or negative polarities. This study explores three important factors influencing variation in crowdsourced polarity judgments, focusing on TripAdvisor reviews in Spanish. Three hypotheses are tested: the role of Part Of Speech (POS), the impact of sentiment words such as "tasty", and the influence of neutral words like "ok" on judgment variation. The study's methodology employs one-word titles, demonstrating their efficacy in studying polarity variation of words. Statistical tests on mean equality are performed on word groups of our interest. The results of this study reveal that adjectives in one-word titles tend to result in lower judgment variation compared to other word types or POS. Sentiment words contribute to lower judgment variation as well, emphasizing the significance of sentiment words in research on polarity judgments, and neutral words are associated with higher judgment variation as expected. However, these effects cannot be always reproduced in longer titles, which suggests that longer titles do not represent the best data source for testing the ambiguity of single words due to the influence on word polarity by other words like negation in longer titles. This empirical investigation contributes valuable insights into the factors influencing polarity variation of words, providing a foundation for NLP practitioners that aim to capture and predict polarity judgments in Spanish and for researchers that aim to understand factors influencing judgment variation.
- Abstract(参考訳): TripAdvisorのレビューと同等のデータソースは、自然言語処理(NLP)における多くのタスクにおいて重要な役割を担い、ホテルやレストランのレビューのような主観的判断を正あるいは負の極性に識別し分類するためのデータ基盤を提供する。
本研究では,スペイン語のTripAdvisorレビューに焦点をあて,クラウドソースによる極性判断の変動に影響を与える3つの重要な要因について検討した。
音声の一部(POS)の役割、「味」のような感情語の影響、および「ok」のような中立語の影響の3つの仮説が検証されている。
研究の方法論はワンワードのタイトルを使用し、単語の極性の変化を研究する上での有効性を実証している。
平均等式に関する統計的試験は、我々の興味のある単語群に対して行われる。
本研究の結果から, 1語タイトルの形容詞は, 他の語型やPOSに比べて, 判断のばらつきが低い傾向にあることが明らかとなった。
感性語は、偏極性判断の研究における感情語の重要性を強調し、中性語は、期待するほど高い判断変異に関連付けられる。
しかし、これらの効果は長いタイトルで常に再現できないため、長いタイトルは長いタイトルにおける否定のような他の単語による単語の極性への影響から、単一の単語のあいまいさをテストするのに最適なデータソースではないことを示唆している。
この経験的調査は、単語の極性変化に影響を与える要因についての貴重な洞察を提供し、スペイン語の極性判断を捉え予測することを目的としたNLP実践者や、判断変動に影響を与える要因を理解することを目的とした研究者の基盤を提供する。
関連論文リスト
- The Lou Dataset -- Exploring the Impact of Gender-Fair Language in German Text Classification [57.06913662622832]
ジェンダーフェア言語は、すべての性別に対処したり、中立形を使用することによって包摂性を促進する。
ジェンダーフェア言語はラベルを反転させ、確実性を減らし、注意パターンを変化させることで予測に大きな影響を及ぼす。
ドイツ語のテキスト分類への影響について最初の知見を提供する一方で、他の言語にもその知見が当てはまる可能性が高い。
論文 参考訳(メタデータ) (2024-09-26T15:08:17Z) - Comparing Biases and the Impact of Multilingual Training across Multiple
Languages [70.84047257764405]
ダウンストリーム感情分析タスクにおいて,イタリア語,中国語,英語,ヘブライ語,スペイン語のバイアス分析を行う。
我々は、既存の感情バイアスのテンプレートを、人種、宗教、国籍、性別の4つの属性で、イタリア語、中国語、ヘブライ語、スペイン語に適応させる。
以上の結果から,各言語の文化に支配的な集団の嗜好など,バイアス表現の類似性を明らかにした。
論文 参考訳(メタデータ) (2023-05-18T18:15:07Z) - Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。
近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。
本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2023-05-04T09:50:25Z) - Discourse Context Predictability Effects in Hindi Word Order [14.88833412862455]
文中の単語と構文構造が次の文の語順にどのように影響するかを検討する。
我々は,言論に基づく多くの特徴と認知的特徴を用いて,依存関係の長さ,前提,情報状態などの予測を行う。
情報ステータスとLSTMに基づく談話予測が単語の順序選択に影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2022-10-25T11:53:01Z) - Naturalistic Causal Probing for Morpho-Syntax [76.83735391276547]
スペインにおける実世界のデータに対する入力レベルの介入に対する自然主義的戦略を提案する。
提案手法を用いて,共同設立者から文章中の形態・症状の特徴を抽出する。
本研究では,事前学習したモデルから抽出した文脈化表現に対する性別と数字の因果効果を解析するために,本手法を適用した。
論文 参考訳(メタデータ) (2022-05-14T11:47:58Z) - Identification of Biased Terms in News Articles by Comparison of
Outlet-specific Word Embeddings [9.379650501033465]
我々は2つの単語埋め込みモデルを訓練し、1つは左翼のテキストで、もう1つは右翼のニュースメディアで訓練する。
我々の仮説は、単語の埋め込み空間における表現は、偏りのある単語よりも非偏りのある単語に類似している、というものである。
本稿では,単語の埋め込みによって測定されたバイアス語の文脈を詳細に考察する。
論文 参考訳(メタデータ) (2021-12-14T13:23:49Z) - Quantifying Cognitive Factors in Lexical Decline [2.4424095531386234]
我々は、語彙の減少を予測できる様々な心理言語学的要因(意味論、分布論、音韻論)を提案する。
その結果,提案する因子のほとんどが,各単語の硬化したセットと一致した安定な単語との予測方向に有意な差があることが判明した。
さらにダイアクロニック分析により、単語の減少は時間とともに語彙文脈の多様性を減少させ、徐々に「生態的ニッチ」を狭める傾向があることが明らかになった。
論文 参考訳(メタデータ) (2021-10-12T07:12:56Z) - Characterizing the Effect of Sentence Context on Word Meanings: Mapping
Brain to Behavior [0.0]
本論文は,被験者がこのような変化を認識しているかどうかに答えることを目的としている。
被験者は、単語が特定の文で使用されるとき、その単語が汎用的な意味からどのように変化するかを判断するよう求められた。
結果は、単語の意味が文の文脈によって体系的に変化するという仮説を支持する。
論文 参考訳(メタデータ) (2020-07-27T20:12:30Z) - Sentiment Analysis Based on Deep Learning: A Comparative Study [69.09570726777817]
世論の研究は我々に貴重な情報を提供することができる。
感情分析の効率性と正確性は、自然言語処理で直面する課題によって妨げられている。
本稿では、感情分析の問題を解決するためにディープラーニングを用いた最新の研究をレビューする。
論文 参考訳(メタデータ) (2020-06-05T16:28:10Z) - Where New Words Are Born: Distributional Semantic Analysis of Neologisms
and Their Semantic Neighborhoods [51.34667808471513]
分散意味論のパラダイムで定式化されたセマンティック隣人のセマンティック・スパシティと周波数成長率という2つの要因の重要性について検討する。
いずれの因子も単語の出現を予測できるが,後者の仮説はより支持される。
論文 参考訳(メタデータ) (2020-01-21T19:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。