論文の概要: A Topical Approach to Capturing Customer Insight In Social Media
- arxiv url: http://arxiv.org/abs/2307.11775v1
- Date: Fri, 14 Jul 2023 11:15:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-30 04:05:02.460831
- Title: A Topical Approach to Capturing Customer Insight In Social Media
- Title(参考訳): ソーシャルメディアにおける顧客インサイト獲得のためのトピック的アプローチ
- Authors: Miguel Palencia-Olivar
- Abstract要約: この研究は、ノイズの多いビッグデータコンテキストにおいて、完全に教師なしのトピック抽出の課題に対処する。
本稿では,変分オートエンコーダフレームワーク上に構築した3つのアプローチを提案する。
我々のモデルは最先端の手法よりも優れた性能が得られることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The age of social media has opened new opportunities for businesses. This
flourishing wealth of information is outside traditional channels and
frameworks of classical marketing research, including that of Marketing Mix
Modeling (MMM). Textual data, in particular, poses many challenges that data
analysis practitioners must tackle. Social media constitute massive,
heterogeneous, and noisy document sources. Industrial data acquisition
processes include some amount of ETL. However, the variability of noise in the
data and the heterogeneity induced by different sources create the need for
ad-hoc tools. Put otherwise, customer insight extraction in fully unsupervised,
noisy contexts is an arduous task. This research addresses the challenge of
fully unsupervised topic extraction in noisy, Big Data contexts. We present
three approaches we built on the Variational Autoencoder framework: the
Embedded Dirichlet Process, the Embedded Hierarchical Dirichlet Process, and
the time-aware Dynamic Embedded Dirichlet Process. These nonparametric
approaches concerning topics present the particularity of determining word
embeddings and topic embeddings. These embeddings do not require transfer
learning, but knowledge transfer remains possible. We test these approaches on
benchmark and automotive industry-related datasets from a real-world use case.
We show that our models achieve equal to better performance than
state-of-the-art methods and that the field of topic modeling would benefit
from improved evaluation metrics.
- Abstract(参考訳): ソーシャルメディアの時代は、ビジネスに新たな機会をもたらした。
この豊富な情報は、マーケティングミックスモデリング(MMM)を含む古典的なマーケティング研究の伝統的なチャンネルやフレームワークの外にある。
特にテキストデータは、データ分析の実践者が取り組むべき多くの課題をもたらす。
ソーシャルメディアは、巨大で異質で、騒がしい文書ソースである。
産業データ取得プロセスには、ある程度のetlが含まれている。
しかし、データ中のノイズの変動と異なるソースによって誘導される異質性は、アドホックツールの必要性を生んでいる。
さもなくば、完全に教師なしで騒がしいコンテキストにおける顧客洞察の抽出は大変な作業です。
この研究は、ノイズの多いビッグデータコンテキストにおける、完全に教師なしのトピック抽出の課題に対処する。
本稿では,組込みディリクレプロセス,組込み階層ディリクレプロセス,動的組込みディリクレプロセスという,変分自動エンコーダフレームワーク上に構築した3つのアプローチを提案する。
これらのトピックに関する非パラメトリックなアプローチは、単語埋め込みとトピック埋め込みを決定する特殊性を示している。
これらの埋め込みは転送学習を必要としないが、知識の転送は可能である。
これらのアプローチを,実世界のユースケースからベンチマークおよび自動車産業関連データセットでテストする。
提案手法は最先端手法と同等の性能を達成し,トピックモデリングの分野は評価指標の改善の恩恵を受けることを示した。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - What are the Essential Factors in Crafting Effective Long Context Multi-Hop Instruction Datasets? Insights and Best Practices [91.71951459594074]
拡張コンテキストウィンドウを持つLong Language Model (LLM) は、情報抽出、質問応答、複雑な計画シナリオなどのタスクを大幅に改善した。
既存のメソッドは通常、Self-Instructフレームワークを使用して、長いコンテキスト能力を改善するために命令チューニングデータを生成する。
本稿では,品質検証エージェント,シングルホップ質問生成エージェント,複数質問サンプリング戦略,マルチホップ質問マーガーエージェントを組み込んだマルチエージェント対話型マルチホップ生成フレームワークを提案する。
以上の結果から,我々の合成高品位長文指導データにより,多量の人体で訓練したモデルよりも,モデル性能が著しく向上することが示唆された。
論文 参考訳(メタデータ) (2024-09-03T13:30:00Z) - Learning From Crowdsourced Noisy Labels: A Signal Processing Perspective [42.24248330317496]
本記事では,ノイズの多いクラウドソースラベルから学ぶことの進歩を紹介する。
その焦点は、古典的な統計モデルから最近のディープラーニングベースのアプローチまで、主要なクラウドソーシングモデルとその方法論的治療である。
特に、テンソルの識別可能性や非負行列分解など、信号処理(SP)理論と手法の関連性について概説する。
論文 参考訳(メタデータ) (2024-07-09T14:34:40Z) - Adapting Large Language Models for Content Moderation: Pitfalls in Data
Engineering and Supervised Fine-tuning [79.53130089003986]
大規模言語モデル(LLM)は、様々なドメインでタスクを処理するための実現可能なソリューションとなっている。
本稿では、コンテンツモデレーションのためにプライベートにデプロイ可能なLLMモデルを微調整する方法を紹介する。
論文 参考訳(メタデータ) (2023-10-05T09:09:44Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Analytical Engines With Context-Rich Processing: Towards Efficient
Next-Generation Analytics [12.317930859033149]
我々は、文脈に富む分析を可能にするコンポーネントと協調して最適化された分析エンジンを構想する。
我々は、リレーショナルおよびモデルベース演算子間の総括的なパイプラインコストとルールベースの最適化を目指している。
論文 参考訳(メタデータ) (2022-12-14T21:46:33Z) - Explainable Artificial Intelligence for Improved Modeling of Processes [6.29494485203591]
我々は,現代的なトランスフォーマーアーキテクチャと,より古典的なプロセス規則性モデリングの機械学習技術の性能を評価する。
MLモデルは重要な結果を予測することができ、注意機構やXAIコンポーネントが基礎となるプロセスに新たな洞察を与えることを示す。
論文 参考訳(メタデータ) (2022-12-01T17:56:24Z) - Generating Hidden Markov Models from Process Models Through Nonnegative Tensor Factorization [0.0]
我々は,理論的プロセスモデルと関連する最小隠れマルコフモデルを統合する,数学的に新しい手法を提案する。
提案手法は, (a) 理論的プロセスモデル, (b) HMM, (c) 結合非負行列テンソル因子分解, (d) カスタムモデル選択を集約する。
論文 参考訳(メタデータ) (2022-10-03T16:19:27Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Principles and Practice of Explainable Machine Learning [12.47276164048813]
本稿では、特に機械学習(ML)とパターン認識モデルに関するデータ駆動手法に焦点を当てる。
メソッドの頻度と複雑さが増すにつれて、少なくともビジネスの利害関係者はモデルの欠点に懸念を抱いている。
我々は、業界実践者が説明可能な機械学習の分野をよりよく理解するための調査を実施した。
論文 参考訳(メタデータ) (2020-09-18T14:50:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。