論文の概要: Topic Modelling on Consumer Financial Protection Bureau Data: An
Approach Using BERT Based Embeddings
- arxiv url: http://arxiv.org/abs/2205.07259v1
- Date: Sun, 15 May 2022 11:14:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-17 14:00:54.773974
- Title: Topic Modelling on Consumer Financial Protection Bureau Data: An
Approach Using BERT Based Embeddings
- Title(参考訳): 消費者金融保護局データに関するトピックモデリング:BERTベースの埋め込みを用いたアプローチ
- Authors: Vasudeva Raju Sangaraju, Bharath Kumar Bolla, Deepak Kumar Nayak,
Jyothsna Kh
- Abstract要約: 消費者金融保護局(CFPB)のデータに文章を埋め込んでトピックを生成する新しい手法であるBERTopicを評価した。
我々の研究によるとBERTopicは柔軟性があり、LDAやLSAと比べて意味があり多様なトピックを提供している。
ドメイン固有の事前トレーニングされた埋め込み(FinBERT)は、さらに優れたトピックを生み出します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Customers' reviews and comments are important for businesses to understand
users' sentiment about the products and services. However, this data needs to
be analyzed to assess the sentiment associated with topics/aspects to provide
efficient customer assistance. LDA and LSA fail to capture the semantic
relationship and are not specific to any domain. In this study, we evaluate
BERTopic, a novel method that generates topics using sentence embeddings on
Consumer Financial Protection Bureau (CFPB) data. Our work shows that BERTopic
is flexible and yet provides meaningful and diverse topics compared to LDA and
LSA. Furthermore, domain-specific pre-trained embeddings (FinBERT) yield even
better topics. We evaluated the topics on coherence score (c_v) and UMass.
- Abstract(参考訳): 顧客のレビューやコメントは、製品やサービスに対するユーザの感情を理解する上で重要である。
しかし、このデータは、効率的な顧客支援を提供するためにトピックやアスペクトに関連する感情を評価するために分析する必要がある。
LDAとLSAはセマンティックな関係を捉えず、どのドメインにも固有のものではない。
本研究では,消費者金融保護局(CFPB)データへの文埋め込みを用いたトピック生成手法であるBERTopicを評価する。
我々の研究によるとBERTopicは柔軟性があり、LDAやLSAと比べて意味があり多様なトピックを提供している。
さらに、ドメイン固有の事前トレーニングされた埋め込み(FinBERT)により、より優れたトピックが得られる。
コヒーレンススコア(c_v)とUMassについて検討した。
関連論文リスト
- Exploratory Data Analysis for Banking and Finance: Unveiling Insights and Patterns [0.2594420805049218]
本研究は,商店街における取引パターン,信用限度,利用状況について検討した。
また、年齢、性別、利用パターンの収入などの人口統計要因も考慮している。
このレポートは、顧客チャーン率や、人口統計、トランザクション履歴、満足度などの要因を分析し、対処する。
論文 参考訳(メタデータ) (2024-05-25T16:15:21Z) - CLAMBER: A Benchmark of Identifying and Clarifying Ambiguous Information Needs in Large Language Models [60.59638232596912]
大規模言語モデル(LLM)を評価するベンチマークであるCLAMBERを紹介する。
分類を基盤として12Kの高品質なデータを構築し, 市販のLCMの強度, 弱点, 潜在的なリスクを評価する。
本研究は, あいまいなユーザクエリの特定と明確化において, 現在のLCMの実用性に限界があることを示唆する。
論文 参考訳(メタデータ) (2024-05-20T14:34:01Z) - Service Level Agreements and Security SLA: A Comprehensive Survey [51.000851088730684]
本調査では,SLA管理のコンセプト,アプローチ,オープンな課題を網羅する技術の現状を明らかにする。
これは、既存の調査で提案された分析と、このトピックに関する最新の文献とのギャップを包括的にレビューし、カバーすることで貢献する。
SLAライフサイクルの段階に基づく分析を組織化するための新しい分類基準を提案する。
論文 参考訳(メタデータ) (2024-01-31T12:33:41Z) - OATS: Opinion Aspect Target Sentiment Quadruple Extraction Dataset for
Aspect-Based Sentiment Analysis [55.61047894397937]
アスペクトベースの感情分析(ABSA)は、ユーザ生成レビュー内の異なる要素に特有の感情を理解する。
OATSデータセットは3つの新しいドメインを包含し,27,470の文レベルと17,092のレビューレベルから構成される。
私たちのイニシアチブは、レストランやラップトップのようなよく知られたドメイン、複雑な四重項抽出タスクのための限られたデータ、時には文とレビューレベルの感情の相乗効果の監視といった、特定の観察されたギャップを埋めることを目指しています。
論文 参考訳(メタデータ) (2023-09-23T07:39:16Z) - Exploring the Power of Topic Modeling Techniques in Analyzing Customer
Reviews: A Comparative Analysis [0.0]
大量のテキストデータをオンラインで分析するために、機械学習と自然言語処理アルゴリズムがデプロイされている。
本研究では,顧客レビューに特化して用いられる5つのトピックモデリング手法について検討・比較する。
以上の結果から,BERTopicはより意味のあるトピックを抽出し,良好な結果を得ることができた。
論文 参考訳(メタデータ) (2023-08-19T08:18:04Z) - Proactive Detractor Detection Framework Based on Message-Wise Sentiment
Analysis Over Customer Support Interactions [60.87845704495664]
本稿では、チャットベースのカスタマーサポートのインタラクションにのみ依存して、個々のユーザの推薦決定を予測するフレームワークを提案する。
ケーススタディでは、ラテンアメリカの大手電子商取引会社の金融分野における16.4kのユーザ数と48.7kの顧客サポートに関する会話を分析した。
以上の結果から,CS会話のメッセージワイドな感情進化のみに基づいて,ユーザが製品やサービスを推薦する可能性を予測することが可能であることが示唆された。
論文 参考訳(メタデータ) (2022-11-08T00:43:36Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - Privacy enabled Financial Text Classification using Differential Privacy
and Federated Learning [0.0]
差分プライバシー (DP) やフェデレートラーニング (FL) などのプライバシー機能と統合した文脈化テキスト分類モデルを提案する。
我々は、NLPモデルと望ましいプライバシ・ユーティリティ・トレードオフをプライベートにトレーニングする方法を示し、それらをファイナンシャル・フレーズ・バンクのデータセットで評価する。
論文 参考訳(メタデータ) (2021-10-04T18:15:32Z) - A Comparative Study of Sentiment Analysis Using NLP and Different
Machine Learning Techniques on US Airline Twitter Data [0.0]
知覚分析は自然言語処理(NLP)と機械学習(ML)の技法である
本稿では,2つのNLP手法(Bag-of-WordsとTF-IDF)と各種ML分類アルゴリズムを提案する。
ベストアプローチは,Bag-of-Words技術を用いたSupport Vector MachineとLogistic Regressionを用いた77%の精度を提供する。
論文 参考訳(メタデータ) (2021-10-02T18:05:00Z) - Improved Customer Transaction Classification using Semi-Supervised
Knowledge Distillation [0.0]
本稿では,セミスーパービジョンおよび知識蒸留フレームワークに基づくコスト効率の高いトランザクション分類手法を提案する。
このアプローチは、顧客が入力した自由テキストを用いてトランザクションのカテゴリを特定する。
弱いラベルを使い、人間の注釈付きサンプルを使うのと性能が似ていることに気付きます。
論文 参考訳(メタデータ) (2021-02-15T16:16:42Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。