論文の概要: From Reviews to Actionable Insights: An LLM-Based Approach for Attribute and Feature Extraction
- arxiv url: http://arxiv.org/abs/2510.16551v1
- Date: Sat, 18 Oct 2025 15:46:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.034145
- Title: From Reviews to Actionable Insights: An LLM-Based Approach for Attribute and Feature Extraction
- Title(参考訳): レビューからActionable Insightsへ: 属性と特徴抽出のためのLCMベースのアプローチ
- Authors: Khaled Boughanmi, Kamel Jedidi, Nour Jedidi,
- Abstract要約: 本研究では,顧客レビューから製品属性とサービス属性を抽出するための体系的,大規模言語モデル(LLM)アプローチを提案する。
この手法を、スターバックスストアの2万件のYelpレビューに適用し、ランダムなレビューのサブセットに対して8つのプロンプト変種を評価する。
- 参考スコア(独自算出の注目度): 1.5803208833562958
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This research proposes a systematic, large language model (LLM) approach for extracting product and service attributes, features, and associated sentiments from customer reviews. Grounded in marketing theory, the framework distinguishes perceptual attributes from actionable features, producing interpretable and managerially actionable insights. We apply the methodology to 20,000 Yelp reviews of Starbucks stores and evaluate eight prompt variants on a random subset of reviews. Model performance is assessed through agreement with human annotations and predictive validity for customer ratings. Results show high consistency between LLMs and human coders and strong predictive validity, confirming the reliability of the approach. Human coders required a median of six minutes per review, whereas the LLM processed each in two seconds, delivering comparable insights at a scale unattainable through manual coding. Managerially, the analysis identifies attributes and features that most strongly influence customer satisfaction and their associated sentiments, enabling firms to pinpoint "joy points," address "pain points," and design targeted interventions. We demonstrate how structured review data can power an actionable marketing dashboard that tracks sentiment over time and across stores, benchmarks performance, and highlights high-leverage features for improvement. Simulations indicate that enhancing sentiment for key service features could yield 1-2% average revenue gains per store.
- Abstract(参考訳): 本研究では,顧客レビューから製品属性やサービス属性,特徴,関連する感情を抽出するための,体系的かつ大規模な言語モデル(LLM)アプローチを提案する。
マーケティング理論に基づくこのフレームワークは、知覚特性と行動可能な特徴を区別し、解釈可能かつ管理可能な洞察を生み出す。
この手法を、スターバックスストアの2万件のYelpレビューに適用し、ランダムなレビューのサブセットに対して8つのプロンプト変種を評価する。
モデルパフォーマンスは、人間のアノテーションとの一致と顧客評価の予測妥当性によって評価される。
その結果,LLMと人間のコーダの整合性が高く,高い予測精度を示し,アプローチの信頼性を確認した。
人間のコーダーはレビュー毎に中央値6分を必要としたが、LLMは2秒でそれぞれを処理し、手動のコーディングで達成不可能なスケールで同等の洞察を提供する。
この分析は、顧客満足度と関連する感情に最も強く影響を及ぼす属性や特徴を特定し、企業が"喜びのポイント"を指摘し、"痛みのポイント"に対処し、ターゲットとする介入を設計できるようにする。
構造化されたレビューデータが、時間と店舗間の感情をトラッキングし、パフォーマンスをベンチマークし、改善のための高平均機能を強調する、実行可能なマーケティングダッシュボードをいかに活用できるかを実証する。
シミュレーションでは、主要なサービス機能に対する感情を高めることで、1店舗あたりの平均収入が1-2%増加する可能性がある。
関連論文リスト
- SCAN: Structured Capability Assessment and Navigation for LLMs [54.54085382131134]
textbfSCAN (Structured Capability Assessment and Navigation) は、大規模言語モデルの詳細な特徴付けを可能にする実用的なフレームワークである。
SCANには4つの重要なコンポーネントが含まれている。
TaxBuilder – クエリから機能表示タグを抽出して階層的な分類構造を構築する。
RealMixは、各機能タグに対する十分な評価データを保証するクエリ合成とフィルタリングのメカニズムである。
PC$2$ベースのLCM-as-a-Judge法は従来のLCM-as-a-Judge法と比較して大幅に精度が向上する
論文 参考訳(メタデータ) (2025-05-10T16:52:40Z) - On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。
推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。
本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - CompassJudger-1: All-in-one Judge Model Helps Model Evaluation and Evolution [74.41064280094064]
textbfJudger-1は、最初のオープンソースのtextbfall-in-one judge LLMである。
CompassJudger-1は、優れた汎用性を示す汎用LLMである。
textbfJudgerBenchは、様々な主観評価タスクを含む新しいベンチマークである。
論文 参考訳(メタデータ) (2024-10-21T17:56:51Z) - InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation [79.09622602860703]
3つの重要な特徴を持つベンチマークデータセットであるInsightBenchを紹介します。
財務やインシデント管理といったさまざまなビジネスユースケースを表す100のデータセットで構成されている。
単一のクエリに回答することに焦点を当てた既存のベンチマークとは異なり、InsightBenchは、エンドツーエンドのデータ分析を実行する能力に基づいてエージェントを評価する。
論文 参考訳(メタデータ) (2024-07-08T22:06:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。