論文の概要: Topic Modelling on Consumer Financial Protection Bureau Data: An
Approach Using BERT Based Embeddings
- arxiv url: http://arxiv.org/abs/2205.07259v1
- Date: Sun, 15 May 2022 11:14:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-17 14:00:54.773974
- Title: Topic Modelling on Consumer Financial Protection Bureau Data: An
Approach Using BERT Based Embeddings
- Title(参考訳): 消費者金融保護局データに関するトピックモデリング:BERTベースの埋め込みを用いたアプローチ
- Authors: Vasudeva Raju Sangaraju, Bharath Kumar Bolla, Deepak Kumar Nayak,
Jyothsna Kh
- Abstract要約: 消費者金融保護局(CFPB)のデータに文章を埋め込んでトピックを生成する新しい手法であるBERTopicを評価した。
我々の研究によるとBERTopicは柔軟性があり、LDAやLSAと比べて意味があり多様なトピックを提供している。
ドメイン固有の事前トレーニングされた埋め込み(FinBERT)は、さらに優れたトピックを生み出します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Customers' reviews and comments are important for businesses to understand
users' sentiment about the products and services. However, this data needs to
be analyzed to assess the sentiment associated with topics/aspects to provide
efficient customer assistance. LDA and LSA fail to capture the semantic
relationship and are not specific to any domain. In this study, we evaluate
BERTopic, a novel method that generates topics using sentence embeddings on
Consumer Financial Protection Bureau (CFPB) data. Our work shows that BERTopic
is flexible and yet provides meaningful and diverse topics compared to LDA and
LSA. Furthermore, domain-specific pre-trained embeddings (FinBERT) yield even
better topics. We evaluated the topics on coherence score (c_v) and UMass.
- Abstract(参考訳): 顧客のレビューやコメントは、製品やサービスに対するユーザの感情を理解する上で重要である。
しかし、このデータは、効率的な顧客支援を提供するためにトピックやアスペクトに関連する感情を評価するために分析する必要がある。
LDAとLSAはセマンティックな関係を捉えず、どのドメインにも固有のものではない。
本研究では,消費者金融保護局(CFPB)データへの文埋め込みを用いたトピック生成手法であるBERTopicを評価する。
我々の研究によるとBERTopicは柔軟性があり、LDAやLSAと比べて意味があり多様なトピックを提供している。
さらに、ドメイン固有の事前トレーニングされた埋め込み(FinBERT)により、より優れたトピックが得られる。
コヒーレンススコア(c_v)とUMassについて検討した。
関連論文リスト
- OATS: Opinion Aspect Target Sentiment Quadruple Extraction Dataset for
Aspect-Based Sentiment Analysis [55.61047894397937]
アスペクトベースの感情分析(ABSA)は、ユーザ生成レビュー内の異なる要素に特有の感情を理解する。
OATSデータセットは3つの新しいドメインを包含し,27,470の文レベルと17,092のレビューレベルから構成される。
私たちのイニシアチブは、レストランやラップトップのようなよく知られたドメイン、複雑な四重項抽出タスクのための限られたデータ、時には文とレビューレベルの感情の相乗効果の監視といった、特定の観察されたギャップを埋めることを目指しています。
論文 参考訳(メタデータ) (2023-09-23T07:39:16Z) - Exploring the Power of Topic Modeling Techniques in Analyzing Customer
Reviews: A Comparative Analysis [0.0]
大量のテキストデータをオンラインで分析するために、機械学習と自然言語処理アルゴリズムがデプロイされている。
本研究では,顧客レビューに特化して用いられる5つのトピックモデリング手法について検討・比較する。
以上の結果から,BERTopicはより意味のあるトピックを抽出し,良好な結果を得ることができた。
論文 参考訳(メタデータ) (2023-08-19T08:18:04Z) - Proactive Detractor Detection Framework Based on Message-Wise Sentiment
Analysis Over Customer Support Interactions [60.87845704495664]
本稿では、チャットベースのカスタマーサポートのインタラクションにのみ依存して、個々のユーザの推薦決定を予測するフレームワークを提案する。
ケーススタディでは、ラテンアメリカの大手電子商取引会社の金融分野における16.4kのユーザ数と48.7kの顧客サポートに関する会話を分析した。
以上の結果から,CS会話のメッセージワイドな感情進化のみに基づいて,ユーザが製品やサービスを推薦する可能性を予測することが可能であることが示唆された。
論文 参考訳(メタデータ) (2022-11-08T00:43:36Z) - Retrieval Enhanced Data Augmentation for Question Answering on Privacy
Policies [74.01792675564218]
本研究では,ラベルのないポリシー文書から関連するテキストセグメントを抽出する検索モデルに基づくデータ拡張フレームワークを開発する。
拡張データの多様性と品質を改善するために,複数の事前学習言語モデル(LM)を活用し,ノイズ低減フィルタモデルでそれらをカスケードする。
PrivacyQAベンチマークの強化データを使用して、既存のベースラインを大きなマージン(10% F1)に高め、新しい最先端のF1スコアを50%達成します。
論文 参考訳(メタデータ) (2022-04-19T15:45:23Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - Privacy enabled Financial Text Classification using Differential Privacy
and Federated Learning [0.0]
差分プライバシー (DP) やフェデレートラーニング (FL) などのプライバシー機能と統合した文脈化テキスト分類モデルを提案する。
我々は、NLPモデルと望ましいプライバシ・ユーティリティ・トレードオフをプライベートにトレーニングする方法を示し、それらをファイナンシャル・フレーズ・バンクのデータセットで評価する。
論文 参考訳(メタデータ) (2021-10-04T18:15:32Z) - A Comparative Study of Sentiment Analysis Using NLP and Different
Machine Learning Techniques on US Airline Twitter Data [0.0]
知覚分析は自然言語処理(NLP)と機械学習(ML)の技法である
本稿では,2つのNLP手法(Bag-of-WordsとTF-IDF)と各種ML分類アルゴリズムを提案する。
ベストアプローチは,Bag-of-Words技術を用いたSupport Vector MachineとLogistic Regressionを用いた77%の精度を提供する。
論文 参考訳(メタデータ) (2021-10-02T18:05:00Z) - SIFN: A Sentiment-aware Interactive Fusion Network for Review-based Item
Recommendation [48.1799451277808]
本稿では、レビューに基づく項目推薦のための感性認識型インタラクティブフュージョンネットワーク(SIFN)を提案する。
まず、BERTを介してユーザ/イテムレビューをエンコードし、各レビューのセマンティックな特徴を抽出する軽量な感情学習者を提案する。
そこで我々は,感情学習者が明示的な感情ラベルを用いて感情認識特徴を抽出するための感情予測タスクを提案する。
論文 参考訳(メタデータ) (2021-08-18T08:04:38Z) - Improved Customer Transaction Classification using Semi-Supervised
Knowledge Distillation [0.0]
本稿では,セミスーパービジョンおよび知識蒸留フレームワークに基づくコスト効率の高いトランザクション分類手法を提案する。
このアプローチは、顧客が入力した自由テキストを用いてトランザクションのカテゴリを特定する。
弱いラベルを使い、人間の注釈付きサンプルを使うのと性能が似ていることに気付きます。
論文 参考訳(メタデータ) (2021-02-15T16:16:42Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Improving Services Offered by Internet Providers by Analyzing Online
Reviews using Text Analytics [6.85316573653194]
インターネットサービスプロバイダ(ISP)は、継続的な成長を確実にするために、顧客を引きつけ、維持することを目的とした努力を確実にしなければならない。
近年の顧客は、特にオンラインレビューで利用可能な余計な情報のために、十分なインフォームドな判断を下すことができる。
ISPは、この情報を使って顧客の製品やサービスに対する見解をよりよく理解することができる。
論文 参考訳(メタデータ) (2020-08-16T16:44:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。