論文の概要: A Case Study and Qualitative Analysis of Simple Cross-Lingual Opinion
Mining
- arxiv url: http://arxiv.org/abs/2111.02259v2
- Date: Thu, 4 Nov 2021 12:48:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-05 10:31:35.296920
- Title: A Case Study and Qualitative Analysis of Simple Cross-Lingual Opinion
Mining
- Title(参考訳): 単純言語横断的意見マイニングの事例研究と質的分析
- Authors: Gerhard Hagerer, Wing Sheung Leung, Qiaoxi Liu, Hannah Danner, Georg
Groh
- Abstract要約: 本稿では,複数の言語をシミュレート可能な感情分析を用いた1つのトピックモデルの構築手法を提案する。
このモデルを,特定のドメイン,すなわち有機食品のユーザコメントに応用する。
安定・ドメイン関連トピックの比率が高く,トピックとその内容間の有意義な関係,ソーシャルメディア文書の解釈可能な表現が得られている。
- 参考スコア(独自算出の注目度): 1.3352005550986064
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: User-generated content from social media is produced in many languages,
making it technically challenging to compare the discussed themes from one
domain across different cultures and regions. It is relevant for domains in a
globalized world, such as market research, where people from two nations and
markets might have different requirements for a product. We propose a simple,
modern, and effective method for building a single topic model with sentiment
analysis capable of covering multiple languages simultanteously, based on a
pre-trained state-of-the-art deep neural network for natural language
understanding. To demonstrate its feasibility, we apply the model to newspaper
articles and user comments of a specific domain, i.e., organic food products
and related consumption behavior. The themes match across languages.
Additionally, we obtain an high proportion of stable and domain-relevant
topics, a meaningful relation between topics and their respective textual
contents, and an interpretable representation for social media documents.
Marketing can potentially benefit from our method, since it provides an
easy-to-use means of addressing specific customer interests from different
market regions around the globe. For reproducibility, we provide the code,
data, and results of our study.
- Abstract(参考訳): ソーシャルメディアからのユーザ生成コンテンツは多くの言語で作られており、異なる文化や地域にわたってあるドメインから議論されたテーマを比較することは技術的に困難である。
これは、市場調査のようなグローバル化した世界のドメインに関係しており、2つの国と市場の人々が製品に対して異なる要件を持つ可能性がある。
本稿では,自然言語理解のための事前学習された最先端ニューラルネットワークに基づいて,複数の言語を同時にカバー可能な感情分析を用いた単一トピックモデルの構築方法を提案する。
その実現可能性を示すために,本モデルは新聞記事や特定のドメイン,すなわち有機食品および関連する消費行動のユーザコメントに適用する。
テーマは言語間で一致している。
また,安定的かつドメイン関連性の高い話題の比率が高いこと,トピックとそれぞれのテキスト内容の有意義な関係,ソーシャルメディア文書の解釈可能な表現が得られる。
マーケティングは、世界中の異なる市場地域から特定の顧客の興味に対処するための使いやすい手段を提供するので、当社の手法の恩恵を受ける可能性がある。
再現性のために、我々は研究のコード、データ、結果を提供する。
関連論文リスト
- Dialogue Quality and Emotion Annotations for Customer Support
Conversations [7.218791626731783]
本稿では、二言語的顧客サポート会話の文脈における感情と会話品質に対する全体論的アノテーションアプローチを提案する。
これは、テキスト分類モデルの開発に、ユニークで価値のあるリソースを提供する。
論文 参考訳(メタデータ) (2023-11-23T10:56:14Z) - A Comprehensive Review on Sentiment Analysis: Tasks, Approaches and
Applications [0.2717221198324361]
感性分析(SA)はテキストマイニングにおける新たな分野である。
これは、異なるソーシャルメディアプラットフォーム上でテキストで表現された意見を計算的に識別し、分類するプロセスである。
論文 参考訳(メタデータ) (2023-11-19T06:29:41Z) - Adapting Large Language Models via Reading Comprehension [96.9301939197567]
ドメイン固有コーパスの事前学習が大規模言語モデルに与える影響について検討する。
生のコーパスでのトレーニングはドメイン知識でモデルを養うが、問合せ能力を大幅に損なう。
生コーパスを可読テキストに変換する簡単な方法を提案する。
論文 参考訳(メタデータ) (2023-09-18T07:17:52Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Cross-domain Sentiment Classification in Spanish [18.563342761346608]
商品レビューの大規模なデータベースで訓練された分類システムを用いて、異なるスペインドメインに一般化する能力について検討する。
結果として、これらの製品レビューをトレーニングすると、ドメイン間の一般化は実現可能であるが、非常に難しいことが示唆される。
論文 参考訳(メタデータ) (2023-03-15T23:11:30Z) - What A Situated Language-Using Agent Must be Able to Do: A Top-Down
Analysis [16.726800816202033]
テキストが集中する時代になっても、言語の使用の第一の場所は、対話の場であり、共同表現である。
本稿では,非制限位置相互作用が関与エージェントに与える要求について,トップダウン解析を試みる。
論文 参考訳(メタデータ) (2023-02-16T21:30:26Z) - An Inclusive Notion of Text [69.36678873492373]
テキストの概念の明確さは再現可能で一般化可能なNLPにとって不可欠である,と我々は主張する。
言語的および非言語的要素の2層分類を導入し,NLPモデリングに使用することができる。
論文 参考訳(メタデータ) (2022-11-10T14:26:43Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - An NLP approach to quantify dynamic salience of predefined topics in a
text corpus [0.0]
我々は自然言語処理技術を用いて、テキストの大規模なコーパスを通して、ある定義済みの関心トピックの集合が時間とともにどのように変化するかの定量化を行う。
事前定義されたトピックが与えられたら、それらのトピックにマップされ、通常のベースラインから逸脱する利用パターンを持つ、用語の集合(n-gram)を識別してランク付けできる。
論文 参考訳(メタデータ) (2021-08-16T21:00:06Z) - FDMT: A Benchmark Dataset for Fine-grained Domain Adaptation in Machine
Translation [53.87731008029645]
機械翻訳(FDMT)における実世界のきめ細かいドメイン適応タスクを提案する。
FDMTデータセットは、自動運転車、AI教育、リアルタイムネットワーク、スマートフォンの4つのサブドメインで構成されている。
この新しい設定で定量的な実験と深い分析を行い、きめ細かいドメイン適応タスクをベンチマークします。
論文 参考訳(メタデータ) (2020-12-31T17:15:09Z) - DomBERT: Domain-oriented Language Model for Aspect-based Sentiment
Analysis [71.40586258509394]
本研究では、ドメイン内コーパスと関連するドメインコーパスの両方から学習するためのBERTの拡張であるDomBERTを提案する。
アスペクトベース感情分析における課題の整理実験を行い、有望な結果を示す。
論文 参考訳(メタデータ) (2020-04-28T21:07:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。