論文の概要: Regularised Text Logistic Regression: Key Word Detection and Sentiment
Classification for Online Reviews
- arxiv url: http://arxiv.org/abs/2009.04591v1
- Date: Wed, 9 Sep 2020 22:37:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 08:39:03.612221
- Title: Regularised Text Logistic Regression: Key Word Detection and Sentiment
Classification for Online Reviews
- Title(参考訳): 正規化テキストロジスティック回帰:オンラインレビューにおけるキーワード検出と感性分類
- Authors: Ying Chen, Peng Liu, Chung Piaw Teo
- Abstract要約: 非構造化テキストデータに対するテキスト分析と感情分類を行うための正規化テキストロジスティック回帰モデルを提案する。
RTLモデルをTripAdvisorの2つのオンラインレビューデータセットであるRestaurantとHotelに適用する。
- 参考スコア(独自算出の注目度): 8.036300326665538
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online customer reviews have become important for managers and executives in
the hospitality and catering industry who wish to obtain a comprehensive
understanding of their customers' demands and expectations. We propose a
Regularized Text Logistic (RTL) regression model to perform text analytics and
sentiment classification on unstructured text data, which automatically
identifies a set of statistically significant and operationally insightful word
features, and achieves satisfactory predictive classification accuracy. We
apply the RTL model to two online review datasets, Restaurant and Hotel, from
TripAdvisor. Our results demonstrate satisfactory classification performance
compared with alternative classifiers with a highest true positive rate of
94.9%. Moreover, RTL identifies a small set of word features, corresponding to
3% for Restaurant and 20% for Hotel, which boosts working efficiency by
allowing managers to drill down into a much smaller set of important customer
reviews. We also develop the consistency, sparsity and oracle property of the
estimator.
- Abstract(参考訳): オンラインの顧客レビューは、顧客の要求や期待を包括的に理解したいと考えるホスピタリティ・キャタリング産業の管理者や幹部にとって重要になっている。
本稿では,非構造化テキストデータに対してテキスト分析と感情分類を行うための正規化テキストロジスティック(rtl)回帰モデルを提案する。
RTLモデルをTripAdvisorの2つのオンラインレビューデータセットであるRestaurantとHotelに適用する。
その結果,真正率94.9%の代替分類器と比較して,分類性能が良好であった。
さらにrtlは、レストランの3%、ホテルの20%に相当する小さな単語特徴を識別し、マネージャがより小さな重要な顧客レビューのセットにドリルダウンすることで、作業効率を高める。
また, 推定器の一貫性, 疎性, オラクル特性も発展させる。
関連論文リスト
- Analysing Zero-Shot Readability-Controlled Sentence Simplification [54.09069745799918]
本研究では,異なる種類の文脈情報が,所望の可読性を持つ文を生成するモデルの能力に与える影響について検討する。
結果から,全ての試験されたモデルは,原文の制限や特徴のため,文の簡略化に苦慮していることがわかった。
実験では、RCTSに合わせたより良い自動評価指標の必要性も強調した。
論文 参考訳(メタデータ) (2024-09-30T12:36:25Z) - TRIAGE: Characterizing and auditing training data for improved
regression [80.11415390605215]
TRIAGEは回帰タスクに適した新しいデータキャラクタリゼーションフレームワークで、広範囲の回帰器と互換性がある。
TRIAGEは、共形予測分布を利用して、モデルに依存しないスコアリング方法、TRIAGEスコアを提供する。
TRIAGEの特徴は一貫性があり、複数の回帰設定においてデータの彫刻/フィルタリングによるパフォーマンス向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-10-29T10:31:59Z) - Optimizing Multi-Class Text Classification: A Diverse Stacking Ensemble
Framework Utilizing Transformers [0.0]
本研究では,トランスモデルを利用したマルチテキスト分類手法を提案する。
BERT、ELECTRA、DistilBERTを含む複数の単一トランスを組み合わせることにより、最適な予測モデルを生成する。
実世界の顧客レビューデータセットを用いて実験評価を行い,提案手法の有効性と優位性を示した。
論文 参考訳(メタデータ) (2023-08-19T13:29:15Z) - Bring Your Own Data! Self-Supervised Evaluation for Large Language
Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。
閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。
自己監督評価と人監督評価との間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-06-23T17:59:09Z) - Evaluating Factual Consistency of Texts with Semantic Role Labeling [3.1776833268555134]
本稿では,テキスト要約を念頭に設計した参照不要評価指標SRLScoreを紹介する。
最終事実度スコアは、調整可能なスコアリング機構により算出される。
英語の要約データセットにおける人間の判断との相関は、SRLScoreが最先端の手法と競合していることを示している。
論文 参考訳(メタデータ) (2023-05-22T17:59:42Z) - Retrieval-based Disentangled Representation Learning with Natural
Language Supervision [61.75109410513864]
本稿では,VDR(Vocabulary Disentangled Retrieval)を提案する。
提案手法では,両エンコーダモデルを用いて語彙空間におけるデータと自然言語の両方を表現する。
論文 参考訳(メタデータ) (2022-12-15T10:20:42Z) - Efficient Few-Shot Fine-Tuning for Opinion Summarization [83.76460801568092]
抽象的な要約モデルは、典型的には大量のジェネリックテキストで事前訓練され、数万から数十万の注釈付きサンプルで微調整される。
アダプタをベースとした数ショット法では,ドメイン内の知識を容易に保存できることを示す。
この自己教師型アダプタの事前トレーニングにより,AmazonとYelpのデータセット上の2.0および1.3ROUGE-Lポイントの要約品質が向上することを示す。
論文 参考訳(メタデータ) (2022-05-04T16:38:37Z) - Classifying variety of customer's online engagement for churn prediction
with mixed-penalty logistic regression [0.0]
混合ペナルティ項を付加することによりロジスティック回帰の分類を促進する機械学習手法に基づく顧客チャーン率の新たな予測分析を提供する。
本研究では,提案手法の分析特性と計算上の優位性を示す。
論文 参考訳(メタデータ) (2021-05-17T08:40:34Z) - Improved Customer Transaction Classification using Semi-Supervised
Knowledge Distillation [0.0]
本稿では,セミスーパービジョンおよび知識蒸留フレームワークに基づくコスト効率の高いトランザクション分類手法を提案する。
このアプローチは、顧客が入力した自由テキストを用いてトランザクションのカテゴリを特定する。
弱いラベルを使い、人間の注釈付きサンプルを使うのと性能が似ていることに気付きます。
論文 参考訳(メタデータ) (2021-02-15T16:16:42Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。