論文の概要: Modelling Grocery Retail Topic Distributions: Evaluation,
Interpretability and Stability
- arxiv url: http://arxiv.org/abs/2005.10125v2
- Date: Wed, 24 Feb 2021 15:29:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 01:21:49.363405
- Title: Modelling Grocery Retail Topic Distributions: Evaluation,
Interpretability and Stability
- Title(参考訳): 食料品小売業のトピック分布のモデル化 : 評価・解釈・安定性
- Authors: Mariflor Vega-Carrasco, Jason O'sullivan, Rosie Prior, Ioanna
Manolopoulou, Mirco Musolesi
- Abstract要約: Latent Dirichlet Allocation (LDA)は、食料品取引を処理するのに適したフレームワークを提供する。
クラスタリング手法を導入し、後続の分布全体を要約し、再帰的なトピックとして表現されるセマンティックモードを識別する。
提案手法は,標準ラベルスイッチング手法の代替であり,トピックの1つの後続サマリーセットを提供する。
- 参考スコア(独自算出の注目度): 1.7529945239886304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding the shopping motivations behind market baskets has high
commercial value in the grocery retail industry. Analyzing shopping
transactions demands techniques that can cope with the volume and
dimensionality of grocery transactional data while keeping interpretable
outcomes. Latent Dirichlet Allocation (LDA) provides a suitable framework to
process grocery transactions and to discover a broad representation of
customers' shopping motivations. However, summarizing the posterior
distribution of an LDA model is challenging, while individual LDA draws may not
be coherent and cannot capture topic uncertainty. Moreover, the evaluation of
LDA models is dominated by model-fit measures which may not adequately capture
the qualitative aspects such as interpretability and stability of topics.
In this paper, we introduce clustering methodology that post-processes
posterior LDA draws to summarise the entire posterior distribution and identify
semantic modes represented as recurrent topics. Our approach is an alternative
to standard label-switching techniques and provides a single posterior summary
set of topics, as well as associated measures of uncertainty. Furthermore, we
establish a more holistic definition for model evaluation, which assesses topic
models based not only on their likelihood but also on their coherence,
distinctiveness and stability. By means of a survey, we set thresholds for the
interpretation of topic coherence and topic similarity in the domain of grocery
retail data. We demonstrate that the selection of recurrent topics through our
clustering methodology not only improves model likelihood but also outperforms
the qualitative aspects of LDA such as interpretability and stability. We
illustrate our methods on an example from a large UK supermarket chain.
- Abstract(参考訳): マーケットバスケットの背後にあるショッピングモチベーションを理解することは、食品小売業界において高い商業価値を持つ。
ショッピング取引の分析は、解釈可能な結果を維持しながら、食料品取引データの量と次元に対処できる技術を要求する。
Latent Dirichlet Allocation (LDA)は、食料品の取引を処理し、顧客のショッピングモチベーションの広範な表現を見つけるのに適したフレームワークを提供する。
しかし、LDAモデルの後部分布の要約は困難であり、個々のLDA描画は一貫性がなく、トピックの不確実性を捉えることができない。
さらに、LDAモデルの評価は、トピックの解釈可能性や安定性といった質的な側面を適切に捉えないモデル適合度尺度に支配されている。
本稿では,後処理後LDAが引き出すクラスタリング手法を紹介し,後処理後分布全体を要約し,再帰的トピックとして表現される意味的モードを特定する。
提案手法は,標準ラベルスイッチング手法に代わるもので,トピックの1つの後続サマリーセットと関連する不確実性の尺度を提供する。
さらに,モデル評価のより包括的定義を確立し,その可能性だけでなく,その一貫性,特徴性,安定性にも基いてトピックモデルを評価する。
調査により、食品小売データの領域におけるトピックコヒーレンスとトピック類似性の解釈のしきい値を設定した。
クラスタ化手法による再帰的トピックの選択は,モデルの可能性を向上させるだけでなく,解釈可能性や安定性といったldaの質的側面を上回っていることを実証する。
本稿では,イギリスの大型スーパーマーケットチェーンの例を例に紹介する。
関連論文リスト
- On-Road Object Importance Estimation: A New Dataset and A Model with Multi-Fold Top-Down Guidance [70.80612792049315]
本稿では,交通オブジェクト重要度(TOI)という,新しい大規模データセットを提案する。
ボトムアップ機能とマルチフォールドトップダウンガイダンスを統合するモデルを提案する。
我々のモデルは最先端の手法を大きなマージンで上回る。
論文 参考訳(メタデータ) (2024-11-26T06:37:10Z) - MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。
本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文 参考訳(メタデータ) (2024-10-12T07:02:33Z) - A Novel Method of Fuzzy Topic Modeling based on Transformer Processing [1.4597673707346286]
本研究では, ソフトクラスタリングに基づくファジィトピックモデリングと, 最先端のトランスフォーマーモデルを用いた文書埋め込みを提案する。
このファジィトピックモデリングはLDAの従来の出力よりも自然な結果をもたらす。
論文 参考訳(メタデータ) (2023-09-18T10:52:54Z) - Model-based Offline Policy Optimization with Adversarial Network [0.36868085124383626]
本稿では,新たなモデルベースオフラインポリシー最適化フレームワーク(MOAN)を提案する。
主なアイデアは、敵の学習を使って、より良い一般化を伴う遷移モデルを構築することである。
我々の手法は、広く研究されているオフラインRLベンチマークにおいて、最先端のベースラインよりも優れている。
論文 参考訳(メタデータ) (2023-09-05T11:49:33Z) - Incorporating Domain Knowledge in Deep Neural Networks for Discrete
Choice Models [0.5801044612920815]
本稿では,DCMにおけるデータ駆動型アプローチの可能性を拡張するフレームワークを提案する。
これには、必要な関係を表す擬似データサンプルと、その実現度を測定する損失関数が含まれる。
ケーススタディは、このフレームワークの個別選択分析の可能性を示している。
論文 参考訳(メタデータ) (2023-05-30T12:53:55Z) - Exploring the Trade-off between Plausibility, Change Intensity and
Adversarial Power in Counterfactual Explanations using Multi-objective
Optimization [73.89239820192894]
自動対物生成は、生成した対物インスタンスのいくつかの側面を考慮すべきである。
本稿では, 対実例生成のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2022-05-20T15:02:53Z) - Learning Conditional Invariance through Cycle Consistency [60.85059977904014]
本稿では,データセットの変動の有意義な要因と独立な要因を識別する新しい手法を提案する。
提案手法は,対象プロパティと残りの入力情報に対する2つの別個の潜在部分空間を含む。
我々は,より意味のある因子を同定し,よりスペーサーや解釈可能なモデルに導く合成および分子データについて実証する。
論文 参考訳(メタデータ) (2021-11-25T17:33:12Z) - Uncertainty as a Form of Transparency: Measuring, Communicating, and
Using Uncertainty [66.17147341354577]
我々は,モデル予測に関連する不確実性を推定し,伝達することにより,相補的な透明性の形式を考えることについて議論する。
モデルの不公平性を緩和し、意思決定を強化し、信頼できるシステムを構築するために不確実性がどのように使われるかを説明する。
この研究は、機械学習、可視化/HCI、デザイン、意思決定、公平性にまたがる文学から引き出された学際的レビューを構成する。
論文 参考訳(メタデータ) (2020-11-15T17:26:14Z) - Active Feature Acquisition with Generative Surrogate Models [11.655069211977464]
本研究では,アクティブ機能獲得(AFA)を行うモデルについて検討し,未観測機能に対する環境問合せを行う。
我々の研究は、AFA問題を生成的モデリングタスクとして根底にあるマルコフ決定プロセス(MDP)を再構築する。
本稿では,入力特徴間の依存関係を捕捉し,取得から得られる潜在的な情報を評価する生成代理モデル(GSM)の学習を提案する。
論文 参考訳(メタデータ) (2020-10-06T02:10:06Z) - Shopping in the Multiverse: A Counterfactual Approach to In-Session
Attribution [6.09170287691728]
我々は,eコマースにおける現場検索エンジンのインセッション帰属の課題に対処する。
我々は、この問題を因果的反事実推論と表現し、そのアプローチをルールベースのシステムと対比する。
本研究では, 自然言語クエリを同じ空間で効果的に表現し, 因果的寄与を評価するために「探索介入」をどのように行うかを示す。
論文 参考訳(メタデータ) (2020-07-20T13:32:02Z) - Towards Inheritable Models for Open-Set Domain Adaptation [56.930641754944915]
本稿では、将来、ソースデータセットが存在しない場合の適応を容易にするために、ソース学習モデルを用いた実用的なドメイン適応パラダイムを提案する。
本稿では,ソースデータがない場合でも,対象領域に対して最適なソースモデルの選択を可能にするために,継承可能性の定量化を目的とする手法を提案する。
論文 参考訳(メタデータ) (2020-04-09T07:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。