論文の概要: MOSAIC: Modular Opinion Summarization using Aspect Identification and Clustering
- arxiv url: http://arxiv.org/abs/2603.19277v1
- Date: Sun, 01 Mar 2026 15:32:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:12.825507
- Title: MOSAIC: Modular Opinion Summarization using Aspect Identification and Clustering
- Title(参考訳): MOSAIC:アスペクト識別とクラスタリングを用いたモジュールオピニオン要約
- Authors: Piyush Kumar Singh, Jayesh Choudhari,
- Abstract要約: 本稿では,要約を解釈可能なコンポーネントに分解する,産業展開用に設計されたスケーラブルでモジュール化されたフレームワークを提案する。
オンラインA/Bテストによるアプローチの実践的影響を実運用の製品ページで検証し,中間出力を上向きにすることで,顧客エクスペリエンスが向上することを示す。
システムレベルのコンポーネントとして意見クラスタリングを導入し,特にユーザレビューに典型的なノイズや冗長な条件下での信頼度を著しく向上することを示す。
- 参考スコア(独自算出の注目度): 0.7519872646378835
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Reviews are central to how travelers evaluate products on online marketplaces, yet existing summarization research often emphasizes end-to-end quality while overlooking benchmark reliability and the practical utility of granular insights. To address this, we propose MOSAIC, a scalable, modular framework designed for industrial deployment that decomposes summarization into interpretable components, including theme discovery, structured opinion extraction, and grounded summary generation. We validate the practical impact of our approach through online A/B tests on live product pages, showing that surfacing intermediate outputs improves customer experience and delivers measurable value even prior to full summarization deployment. We further conduct extensive offline experiments to demonstrate that MOSAIC achieves superior aspect coverage and faithfulness compared to strong baselines for summarization. Crucially, we introduce opinion clustering as a system-level component and show that it significantly enhances faithfulness, particularly under the noisy and redundant conditions typical of user reviews. Finally, we identify reliability limitations in the standard SPACE dataset and release a new open-source tour experience dataset (TRECS) to enable more robust evaluation.
- Abstract(参考訳): レビューは、旅行者がオンラインマーケットプレースで製品を評価する方法の中心であるが、既存の要約研究は、ベンチマークの信頼性と詳細な洞察の実用性を見越しながら、エンドツーエンドの品質を強調していることが多い。
そこで我々はMOSAICを提案する。MOSAICは産業展開用に設計されたスケーラブルでモジュール化されたフレームワークで,要約をテーマ発見,構造化意見抽出,グラウンドド・サマリ生成などの解釈可能なコンポーネントに分解する。
我々は,オンラインのA/Bテストを通じて実稼働の製品ページ上でのアプローチの実践的影響を検証し,中間的なアウトプットによって顧客エクスペリエンスが向上し,総括デプロイに先立って測定可能な価値がもたらされることを示す。
我々はさらに大規模なオフライン実験を行い、MOSAICが要約の強いベースラインよりも優れたアスペクトカバレッジと忠実性を達成することを示す。
重要な点として,システムレベルのコンポーネントとして意見クラスタリングを導入し,特にユーザレビューに典型的なノイズや冗長な条件下での信頼感を著しく向上させることを示す。
最後に、標準SPACEデータセットの信頼性制限を特定し、より堅牢な評価を可能にするために、新しいオープンソースツアー体験データセット(TRECS)をリリースする。
関連論文リスト
- OpinioRAG: Towards Generating User-Centric Opinion Highlights from Large-scale Online Reviews [12.338320566839483]
本稿では,大量のユーザレビューから得られた意見ハイライトの問題点について考察する。
既存のメソッドはスケールアップに失敗するか、パーソナライズされたニーズを見落としている汎用的で一大の要約を生成するかのいずれかです。
本稿では,RAGに基づくエビデンス検索とLCMを組み合わせた拡張性のあるトレーニングフリーフレームワークであるOpinioRAGを紹介する。
論文 参考訳(メタデータ) (2025-08-30T00:00:34Z) - Decomposed Opinion Summarization with Verified Aspect-Aware Modules [82.38097397662436]
レビューの観点から,ドメインに依存しないモジュラーアプローチを提案する。
科学研究、ビジネス、製品ドメインを表すデータセットをまたいだ実験を行います。
論文 参考訳(メタデータ) (2025-01-27T09:29:55Z) - AMRFact: Enhancing Summarization Factuality Evaluation with AMR-Driven Negative Samples Generation [57.8363998797433]
抽象的意味表現(AMR)を用いた摂動要約を生成するフレームワークであるAMRFactを提案する。
提案手法は,AMRグラフに一貫した要約を解析し,制御された事実不整合を注入して負の例を生成し,一貫性のない事実不整合要約を高い誤差型カバレッジで生成する。
論文 参考訳(メタデータ) (2023-11-16T02:56:29Z) - Towards Personalized Review Summarization by Modeling Historical Reviews
from Customer and Product Separately [59.61932899841944]
レビュー要約(review summarization)は、Eコマースのウェブサイトで製品レビューのメインの考え方を要約することを目的とした、簡単ではないタスクである。
Heterogeneous Historical Review aware Review Summarization Model (HHRRS)を提案する。
我々は、レビュー感情分類と要約を共同で行うマルチタスクフレームワークを採用している。
論文 参考訳(メタデータ) (2023-01-27T12:32:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。