論文の概要: From Reviews to Actionable Insights: An LLM-Based Approach for Attribute and Feature Extraction
- arxiv url: http://arxiv.org/abs/2510.16551v3
- Date: Wed, 22 Oct 2025 12:15:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:11.830574
- Title: From Reviews to Actionable Insights: An LLM-Based Approach for Attribute and Feature Extraction
- Title(参考訳): レビューからActionable Insightsへ: 属性と特徴抽出のためのLCMベースのアプローチ
- Authors: Khaled Boughanmi, Kamel Jedidi, Nour Jedidi,
- Abstract要約: 本研究では,顧客レビューから製品属性とサービス属性を抽出するための体系的,大規模言語モデル(LLM)アプローチを提案する。
この手法を、スターバックスストアの2万件のYelpレビューに適用し、ランダムなレビューのサブセットに対して8つのプロンプト変種を評価する。
- 参考スコア(独自算出の注目度): 1.5803208833562958
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This research proposes a systematic, large language model (LLM) approach for extracting product and service attributes, features, and associated sentiments from customer reviews. Grounded in marketing theory, the framework distinguishes perceptual attributes from actionable features, producing interpretable and managerially actionable insights. We apply the methodology to 20,000 Yelp reviews of Starbucks stores and evaluate eight prompt variants on a random subset of reviews. Model performance is assessed through agreement with human annotations and predictive validity for customer ratings. Results show high consistency between LLMs and human coders and strong predictive validity, confirming the reliability of the approach. Human coders required a median of six minutes per review, whereas the LLM processed each in two seconds, delivering comparable insights at a scale unattainable through manual coding. Managerially, the analysis identifies attributes and features that most strongly influence customer satisfaction and their associated sentiments, enabling firms to pinpoint "joy points," address "pain points," and design targeted interventions. We demonstrate how structured review data can power an actionable marketing dashboard that tracks sentiment over time and across stores, benchmarks performance, and highlights high-leverage features for improvement. Simulations indicate that enhancing sentiment for key service features could yield 1-2% average revenue gains per store.
- Abstract(参考訳): 本研究では,顧客レビューから製品属性やサービス属性,特徴,関連する感情を抽出するための,体系的かつ大規模な言語モデル(LLM)アプローチを提案する。
マーケティング理論に基づくこのフレームワークは、知覚特性と行動可能な特徴を区別し、解釈可能かつ管理可能な洞察を生み出す。
この手法を、スターバックスストアの2万件のYelpレビューに適用し、ランダムなレビューのサブセットに対して8つのプロンプト変種を評価する。
モデルパフォーマンスは、人間のアノテーションとの一致と顧客評価の予測妥当性によって評価される。
その結果,LLMと人間のコーダの整合性が高く,高い予測精度を示し,アプローチの信頼性を確認した。
人間のコーダーはレビュー毎に中央値6分を必要としたが、LLMは2秒でそれぞれを処理し、手動のコーディングで達成不可能なスケールで同等の洞察を提供する。
この分析は、顧客満足度と関連する感情に最も強く影響を及ぼす属性や特徴を特定し、企業が"喜びのポイント"を指摘し、"痛みのポイント"に対処し、ターゲットとする介入を設計できるようにする。
構造化されたレビューデータが、時間と店舗間の感情をトラッキングし、パフォーマンスをベンチマークし、改善のための高平均機能を強調する、実行可能なマーケティングダッシュボードをいかに活用できるかを実証する。
シミュレーションでは、主要なサービス機能に対する感情を高めることで、1店舗あたりの平均収入が1-2%増加する可能性がある。
関連論文リスト
- SUMFORU: An LLM-Based Review Summarization Framework for Personalized Purchase Decision Support [3.755588097509539]
オンライン製品レビューには、ユーザを圧倒し、効果的な意思決定を妨げるリッチだがノイズの多いシグナルが含まれている。
本稿では,個人別購入決定を支援するために,アウトプットを明示的なユーザペルソナと整合させる,評価可能な要約フレームワークを提案する。
本結果は,次世代の個人化意思決定支援システム構築における多元的アライメントの実現性を強調した。
論文 参考訳(メタデータ) (2025-12-12T18:05:52Z) - Evalet: Evaluating Large Language Models by Fragmenting Outputs into Functions [26.356994721447283]
本稿では,各出力をキーフラグメントに分解し,各フラグメントが評価基準に対して機能する修辞関数を解釈する機能的フラグメント化を提案する。
Evaletでは,多くのアウトプットにまたがるフラグメントレベルの関数を可視化し,検査,評価,評価の比較を支援するインタラクティブシステムとして,このアプローチをインスタンス化する。
論文 参考訳(メタデータ) (2025-09-14T10:24:13Z) - Beyond "Not Novel Enough": Enriching Scholarly Critique with LLM-Assisted Feedback [81.0031690510116]
本稿では,3段階を通して専門家レビューアの動作をモデル化する,自動ノベルティ評価のための構造化アプローチを提案する。
本手法は,人文のノベルティレビューを大規模に分析した結果から得られたものである。
182 ICLR 2025 の提出で評価されたこの手法は、人間の推論と86.5%の一致と、新規性の結論に関する75.3%の合意を達成している。
論文 参考訳(メタデータ) (2025-08-14T16:18:37Z) - SCAN: Structured Capability Assessment and Navigation for LLMs [54.54085382131134]
textbfSCAN (Structured Capability Assessment and Navigation) は、大規模言語モデルの詳細な特徴付けを可能にする実用的なフレームワークである。
SCANには4つの重要なコンポーネントが含まれている。
TaxBuilder – クエリから機能表示タグを抽出して階層的な分類構造を構築する。
RealMixは、各機能タグに対する十分な評価データを保証するクエリ合成とフィルタリングのメカニズムである。
PC$2$ベースのLCM-as-a-Judge法は従来のLCM-as-a-Judge法と比較して大幅に精度が向上する
論文 参考訳(メタデータ) (2025-05-10T16:52:40Z) - Pairwise or Pointwise? Evaluating Feedback Protocols for Bias in LLM-Based Evaluation [57.380464382910375]
評価のためのフィードバックプロトコルの選択は,評価信頼性に大きく影響し,系統的なバイアスを生じさせることを示す。
ジェネレータモデルは、気を散らす機能を埋め込むことで好みをひっくり返すことができる。
我々は,データセットの特徴と評価目標に基づくフィードバックプロトコルの選択を推奨する。
論文 参考訳(メタデータ) (2025-04-20T19:05:59Z) - On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。
推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。
本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - MME-Survey: A Comprehensive Survey on Evaluation of Multimodal LLMs [97.94579295913606]
MLLM(Multimodal Large Language Models)は、産業と学術の両方から注目を集めている。
開発プロセスでは、モデルの改善に関する直感的なフィードバックとガイダンスを提供するため、評価が重要である。
この研究は、研究者に異なるニーズに応じてMLLMを効果的に評価する方法を簡単に把握し、より良い評価方法を促すことを目的としている。
論文 参考訳(メタデータ) (2024-11-22T18:59:54Z) - CompassJudger-1: All-in-one Judge Model Helps Model Evaluation and Evolution [74.41064280094064]
textbfJudger-1は、最初のオープンソースのtextbfall-in-one judge LLMである。
CompassJudger-1は、優れた汎用性を示す汎用LLMである。
textbfJudgerBenchは、様々な主観評価タスクを含む新しいベンチマークである。
論文 参考訳(メタデータ) (2024-10-21T17:56:51Z) - InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation [79.09622602860703]
3つの重要な特徴を持つベンチマークデータセットであるInsightBenchを紹介します。
財務やインシデント管理といったさまざまなビジネスユースケースを表す100のデータセットで構成されている。
単一のクエリに回答することに焦点を当てた既存のベンチマークとは異なり、InsightBenchは、エンドツーエンドのデータ分析を実行する能力に基づいてエージェントを評価する。
論文 参考訳(メタデータ) (2024-07-08T22:06:09Z) - A Dual-Perspective Approach to Evaluating Feature Attribution Methods [40.73602126894125]
本稿では,直観的特性を明らかにする忠実度パラダイムの中で,音性と完全性という2つの新しい視点を提案する。
健全性は、どの特徴が真に予測的特徴であるかを評価する一方、完全性は、結果の帰属が予測的特徴をどの程度うまく明らかにするかを調べる。
これらのメトリクスを主流属性法に適用し、特徴属性法を解析・比較するための新しいレンズを提供する。
論文 参考訳(メタデータ) (2023-08-17T12:41:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。