論文の概要: A Topical Approach to Capturing Customer Insight In Social Media
- arxiv url: http://arxiv.org/abs/2307.11775v1
- Date: Fri, 14 Jul 2023 11:15:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-30 04:05:02.460831
- Title: A Topical Approach to Capturing Customer Insight In Social Media
- Title(参考訳): ソーシャルメディアにおける顧客インサイト獲得のためのトピック的アプローチ
- Authors: Miguel Palencia-Olivar
- Abstract要約: この研究は、ノイズの多いビッグデータコンテキストにおいて、完全に教師なしのトピック抽出の課題に対処する。
本稿では,変分オートエンコーダフレームワーク上に構築した3つのアプローチを提案する。
我々のモデルは最先端の手法よりも優れた性能が得られることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The age of social media has opened new opportunities for businesses. This
flourishing wealth of information is outside traditional channels and
frameworks of classical marketing research, including that of Marketing Mix
Modeling (MMM). Textual data, in particular, poses many challenges that data
analysis practitioners must tackle. Social media constitute massive,
heterogeneous, and noisy document sources. Industrial data acquisition
processes include some amount of ETL. However, the variability of noise in the
data and the heterogeneity induced by different sources create the need for
ad-hoc tools. Put otherwise, customer insight extraction in fully unsupervised,
noisy contexts is an arduous task. This research addresses the challenge of
fully unsupervised topic extraction in noisy, Big Data contexts. We present
three approaches we built on the Variational Autoencoder framework: the
Embedded Dirichlet Process, the Embedded Hierarchical Dirichlet Process, and
the time-aware Dynamic Embedded Dirichlet Process. These nonparametric
approaches concerning topics present the particularity of determining word
embeddings and topic embeddings. These embeddings do not require transfer
learning, but knowledge transfer remains possible. We test these approaches on
benchmark and automotive industry-related datasets from a real-world use case.
We show that our models achieve equal to better performance than
state-of-the-art methods and that the field of topic modeling would benefit
from improved evaluation metrics.
- Abstract(参考訳): ソーシャルメディアの時代は、ビジネスに新たな機会をもたらした。
この豊富な情報は、マーケティングミックスモデリング(MMM)を含む古典的なマーケティング研究の伝統的なチャンネルやフレームワークの外にある。
特にテキストデータは、データ分析の実践者が取り組むべき多くの課題をもたらす。
ソーシャルメディアは、巨大で異質で、騒がしい文書ソースである。
産業データ取得プロセスには、ある程度のetlが含まれている。
しかし、データ中のノイズの変動と異なるソースによって誘導される異質性は、アドホックツールの必要性を生んでいる。
さもなくば、完全に教師なしで騒がしいコンテキストにおける顧客洞察の抽出は大変な作業です。
この研究は、ノイズの多いビッグデータコンテキストにおける、完全に教師なしのトピック抽出の課題に対処する。
本稿では,組込みディリクレプロセス,組込み階層ディリクレプロセス,動的組込みディリクレプロセスという,変分自動エンコーダフレームワーク上に構築した3つのアプローチを提案する。
これらのトピックに関する非パラメトリックなアプローチは、単語埋め込みとトピック埋め込みを決定する特殊性を示している。
これらの埋め込みは転送学習を必要としないが、知識の転送は可能である。
これらのアプローチを,実世界のユースケースからベンチマークおよび自動車産業関連データセットでテストする。
提案手法は最先端手法と同等の性能を達成し,トピックモデリングの分野は評価指標の改善の恩恵を受けることを示した。
関連論文リスト
- Seeking Neural Nuggets: Knowledge Transfer in Large Language Models from
a Parametric Perspective [114.70886320845715]
大規模言語モデル(LLM)は本質的に、広範囲なコーパスの事前学習を通じて、パラメータ内の豊富な知識を符号化する。
本稿では,パラメトリックの観点から,大規模モデルから小規模モデルへの知識伝達を実証的に検討する。
論文 参考訳(メタデータ) (2023-10-17T17:58:34Z) - Adapting Large Language Models for Content Moderation: Pitfalls in Data
Engineering and Supervised Fine-tuning [79.53130089003986]
大規模言語モデル(LLM)は、様々なドメインでタスクを処理するための実現可能なソリューションとなっている。
本稿では、コンテンツモデレーションのためにプライベートにデプロイ可能なLLMモデルを微調整する方法を紹介する。
論文 参考訳(メタデータ) (2023-10-05T09:09:44Z) - Bias and Fairness in Large Language Models: A Survey [76.65471160523444]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Transferring Annotator- and Instance-dependent Transition Matrix for
Learning from Crowds [94.48066787595029]
現実のクラウドソーシングシナリオでは、ノイズ遷移行列はアノテータとインスタンスに依存します。
まず、すべてのアノテータによるノイズパターンの混合をモデル化し、その後、個々のアノテータにこのモデリングを転送する。
実験により、合成および実世界のクラウドソーシングデータに対する提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2023-06-05T13:43:29Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Analytical Engines With Context-Rich Processing: Towards Efficient
Next-Generation Analytics [12.317930859033149]
我々は、文脈に富む分析を可能にするコンポーネントと協調して最適化された分析エンジンを構想する。
我々は、リレーショナルおよびモデルベース演算子間の総括的なパイプラインコストとルールベースの最適化を目指している。
論文 参考訳(メタデータ) (2022-12-14T21:46:33Z) - Explainable Artificial Intelligence for Improved Modeling of Processes [6.29494485203591]
我々は,現代的なトランスフォーマーアーキテクチャと,より古典的なプロセス規則性モデリングの機械学習技術の性能を評価する。
MLモデルは重要な結果を予測することができ、注意機構やXAIコンポーネントが基礎となるプロセスに新たな洞察を与えることを示す。
論文 参考訳(メタデータ) (2022-12-01T17:56:24Z) - Process Modeling, Hidden Markov Models, and Non-negative Tensor
Factorization with Model Selection [0.15658704610960567]
プロセス監視は、ユーザーが産業プロセスにおける組織の関与を計測することを可能にする。
データ不足に対処するために、我々はそのプロセスに精通している課題の専門家(SME)の知識を活用する。
本稿では,理論的プロセスモデルと関連する最小隠れマルコフモデルを統合する,数学的に健全な新しい手法を提案する。
論文 参考訳(メタデータ) (2022-10-03T16:19:27Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Extracting Semantic Process Information from the Natural Language in
Event Logs [0.1827510863075184]
本稿では、イベントデータの意味的役割ラベリングという手法を提案する。
この方法では,イベント毎に最大8つの意味的役割に関する情報を抽出する。
論文 参考訳(メタデータ) (2021-03-06T08:39:04Z) - Principles and Practice of Explainable Machine Learning [12.47276164048813]
本稿では、特に機械学習(ML)とパターン認識モデルに関するデータ駆動手法に焦点を当てる。
メソッドの頻度と複雑さが増すにつれて、少なくともビジネスの利害関係者はモデルの欠点に懸念を抱いている。
我々は、業界実践者が説明可能な機械学習の分野をよりよく理解するための調査を実施した。
論文 参考訳(メタデータ) (2020-09-18T14:50:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。