論文の概要: A Case Study and Qualitative Analysis of Simple Cross-Lingual Opinion
Mining
- arxiv url: http://arxiv.org/abs/2111.02259v1
- Date: Wed, 3 Nov 2021 14:49:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-04 13:45:07.920219
- Title: A Case Study and Qualitative Analysis of Simple Cross-Lingual Opinion
Mining
- Title(参考訳): 単純言語横断的意見マイニングの事例研究と質的分析
- Authors: Gerhard Hagerer, Wing Sheung Leung, Qiaoxi Liu, Hannah Danner, Georg
Groh
- Abstract要約: 本稿では,複数の言語をシミュレート可能な感情分析を用いた1つのトピックモデルの構築手法を提案する。
このモデルを,特定のドメイン,すなわち有機食品のユーザコメントに応用する。
安定・ドメイン関連トピックの比率が高く,トピックとその内容間の有意義な関係,ソーシャルメディア文書の解釈可能な表現が得られている。
- 参考スコア(独自算出の注目度): 1.3352005550986064
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: User-generated content from social media is produced in many languages,
making it technically challenging to compare the discussed themes from one
domain across different cultures and regions. It is relevant for domains in a
globalized world, such as market research, where people from two nations and
markets might have different requirements for a product. We propose a simple,
modern, and effective method for building a single topic model with sentiment
analysis capable of covering multiple languages simultanteously, based on a
pre-trained state-of-the-art deep neural network for natural language
understanding. To demonstrate its feasibility, we apply the model to newspaper
articles and user comments of a specific domain, i.e., organic food products
and related consumption behavior. The themes match across languages.
Additionally, we obtain an high proportion of stable and domain-relevant
topics, a meaningful relation between topics and their respective textual
contents, and an interpretable representation for social media documents.
Marketing can potentially benefit from our method, since it provides an
easy-to-use means of addressing specific customer interests from different
market regions around the globe. For reproducibility, we provide the code,
data, and results of our study.
- Abstract(参考訳): ソーシャルメディアからのユーザ生成コンテンツは多くの言語で作られており、異なる文化や地域にわたってあるドメインから議論されたテーマを比較することは技術的に困難である。
これは、市場調査のようなグローバル化した世界のドメインに関係しており、2つの国と市場の人々が製品に対して異なる要件を持つ可能性がある。
本稿では,自然言語理解のための事前学習された最先端ニューラルネットワークに基づいて,複数の言語を同時にカバー可能な感情分析を用いた単一トピックモデルの構築方法を提案する。
その実現可能性を示すために,本モデルは新聞記事や特定のドメイン,すなわち有機食品および関連する消費行動のユーザコメントに適用する。
テーマは言語間で一致している。
また,安定的かつドメイン関連性の高い話題の比率が高いこと,トピックとそれぞれのテキスト内容の有意義な関係,ソーシャルメディア文書の解釈可能な表現が得られる。
マーケティングは、世界中の異なる市場地域から特定の顧客の興味に対処するための使いやすい手段を提供するので、当社の手法の恩恵を受ける可能性がある。
再現性のために、我々は研究のコード、データ、結果を提供する。
関連論文リスト
- Multilingual Topic Classification in X: Dataset and Analysis [19.725017254962918]
X-Topicは4つの異なる言語(英語、スペイン語、日本語、ギリシャ語)のコンテンツを含む多言語データセットである。
私たちのデータセットには、ソーシャルメディアコンテンツに適した幅広いトピックが含まれています。
論文 参考訳(メタデータ) (2024-10-04T01:37:26Z) - Combining Objective and Subjective Perspectives for Political News Understanding [5.741243797283764]
本稿では、両視点を統合し、主観的側面のきめ細かい処理を提供するテキスト分析フレームワークを提案する。
本稿では、ニュースメディア、政治的指向、トピック、個々のエンティティ、人口構成に関する洞察とともに、その機能について説明する。
論文 参考訳(メタデータ) (2024-08-20T20:13:19Z) - Large Language Models Meet Text-Centric Multimodal Sentiment Analysis: A Survey [66.166184609616]
ChatGPTは、テキスト中心のマルチモーダルタスクに大規模言語モデル(LLM)を適用する大きな可能性を開く。
既存のLLMがテキスト中心のマルチモーダル感情分析タスクにどのように適応できるかは、まだ不明である。
論文 参考訳(メタデータ) (2024-06-12T10:36:27Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - A Comprehensive Review on Sentiment Analysis: Tasks, Approaches and
Applications [0.2717221198324361]
感性分析(SA)はテキストマイニングにおける新たな分野である。
これは、異なるソーシャルメディアプラットフォーム上でテキストで表現された意見を計算的に識別し、分類するプロセスである。
論文 参考訳(メタデータ) (2023-11-19T06:29:41Z) - Adapting Large Language Models to Domains via Reading Comprehension [86.24451681746676]
ドメイン固有コーパスの事前学習が大規模言語モデルに与える影響について検討する。
生のコーパスでのトレーニングはドメイン知識でモデルを養うが、問合せ能力を大幅に損なう。
生コーパスを可読テキストに変換する簡単な方法を提案する。
論文 参考訳(メタデータ) (2023-09-18T07:17:52Z) - Cross-domain Sentiment Classification in Spanish [18.563342761346608]
商品レビューの大規模なデータベースで訓練された分類システムを用いて、異なるスペインドメインに一般化する能力について検討する。
結果として、これらの製品レビューをトレーニングすると、ドメイン間の一般化は実現可能であるが、非常に難しいことが示唆される。
論文 参考訳(メタデータ) (2023-03-15T23:11:30Z) - An Inclusive Notion of Text [69.36678873492373]
テキストの概念の明確さは再現可能で一般化可能なNLPにとって不可欠である,と我々は主張する。
言語的および非言語的要素の2層分類を導入し,NLPモデリングに使用することができる。
論文 参考訳(メタデータ) (2022-11-10T14:26:43Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - An NLP approach to quantify dynamic salience of predefined topics in a
text corpus [0.0]
我々は自然言語処理技術を用いて、テキストの大規模なコーパスを通して、ある定義済みの関心トピックの集合が時間とともにどのように変化するかの定量化を行う。
事前定義されたトピックが与えられたら、それらのトピックにマップされ、通常のベースラインから逸脱する利用パターンを持つ、用語の集合(n-gram)を識別してランク付けできる。
論文 参考訳(メタデータ) (2021-08-16T21:00:06Z) - FDMT: A Benchmark Dataset for Fine-grained Domain Adaptation in Machine
Translation [53.87731008029645]
機械翻訳(FDMT)における実世界のきめ細かいドメイン適応タスクを提案する。
FDMTデータセットは、自動運転車、AI教育、リアルタイムネットワーク、スマートフォンの4つのサブドメインで構成されている。
この新しい設定で定量的な実験と深い分析を行い、きめ細かいドメイン適応タスクをベンチマークします。
論文 参考訳(メタデータ) (2020-12-31T17:15:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。