論文の概要: Natural language processing on customer note data
- arxiv url: http://arxiv.org/abs/2305.02029v1
- Date: Wed, 3 May 2023 10:36:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-04 15:14:19.012332
- Title: Natural language processing on customer note data
- Title(参考訳): 顧客ノートデータを用いた自然言語処理
- Authors: Andrew Hilditch, David Webb, Jozef Baca, Tom Armitage, Matthew
Shardlow, Peter Appleby
- Abstract要約: 音符から正確な感情を自動的に抽出でき、音符は関連性によって異なる話題に分類できることを示す。
明確な分離トピックがなければ、ビジネスコンテキストとの関連性が欠如していることが分かっています。
- 参考スコア(独自算出の注目度): 3.0828074702828623
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic analysis of customer data for businesses is an area that is of
interest to companies. Business to business data is studied rarely in academia
due to the sensitive nature of such information. Applying natural language
processing can speed up the analysis of prohibitively large sets of data. This
paper addresses this subject and applies sentiment analysis, topic modelling
and keyword extraction to a B2B data set. We show that accurate sentiment can
be extracted from the notes automatically and the notes can be sorted by
relevance into different topics. We see that without clear separation topics
can lack relevance to a business context.
- Abstract(参考訳): 企業の顧客データの自動分析は、企業にとって関心のある分野である。
ビジネスデータとビジネスデータは、そのような情報の繊細な性質のため、学術的にはほとんど研究されない。
自然言語処理を適用することで、禁止されるほど大きなデータ集合の分析をスピードアップすることができる。
本稿では,b2bデータセットに感情分析,トピックモデリング,キーワード抽出を適用する。
音符から正確な感情を自動的に抽出でき、音符は関連性によって異なる話題に分類できることを示す。
明確な分離トピックがなければ、ビジネスコンテキストとの関連性が欠如していることが分かります。
関連論文リスト
- The Empirical Impact of Data Sanitization on Language Models [1.1359551336076306]
本稿では,複数のベンチマーク言語モデリングタスクにおけるデータ・サニタイズの効果を実証的に分析する。
以上の結果から,感情分析やエンテーメントなどのタスクでは,リアクションの影響は極めて低く,典型的には1~5%程度であることが示唆された。
理解的なQ&Aのようなタスクでは、オリジナルのものと比較して、再実行クエリで観測されるパフォーマンスの25%が大幅に低下している。
論文 参考訳(メタデータ) (2024-11-08T21:22:37Z) - Seed-Guided Fine-Grained Entity Typing in Science and Engineering
Domains [51.02035914828596]
科学・工学分野において,シード誘導型細粒度エンティティタイピングの課題について検討する。
まず、ラベルのないコーパスから各タイプのエンティティを抽出し、弱い監視力を高めるSETypeを提案する。
そして、リッチなエンティティをラベルなしのテキストにマッチさせ、擬似ラベル付きサンプルを取得し、見知らぬ型と見えない型の両方に推論できるテキストエンテリメントモデルを訓練する。
論文 参考訳(メタデータ) (2024-01-23T22:36:03Z) - Demonstration of InsightPilot: An LLM-Empowered Automated Data
Exploration System [48.62158108517576]
本稿では,データ探索プロセスの簡略化を目的とした自動データ探索システムであるInsightPilotを紹介する。
InsightPilotは、理解、要約、説明などの適切な分析意図を自動的に選択する。
簡単に言うと、IQueryはデータ分析操作の抽象化と自動化であり、データアナリストのアプローチを模倣しています。
論文 参考訳(メタデータ) (2023-04-02T07:27:49Z) - Cognitive Computing to Optimize IT Services [0.0]
認知的ソリューションは、構造化されたテキストと非構造化されたテキストの両方の深い分析によって、従来の構造化されたデータ分析を越えている。
実験では,提案手法により年額チケットの18~25%を削減した。
論文 参考訳(メタデータ) (2021-12-28T09:56:44Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Text Mining for Processing Interview Data in Computational Social
Science [0.6820436130599382]
我々は、市販のテキスト分析技術を用いて、計算社会科学研究からのインタビューテキストデータを処理する。
局所的クラスタリングと用語的エンリッチメントが,応答の探索と定量化に有用であることがわかった。
我々は社会科学の研究にテキスト分析を使うことを奨励し、特に探索的オープンエンドな研究に力を入れている。
論文 参考訳(メタデータ) (2020-11-28T00:44:35Z) - Data Readiness for Natural Language Processing [3.6296396308298795]
この文書は、機械学習と自然言語処理の文脈におけるデータの準備性に関するものである。
自動分析手法を促進するために、組織がどのようにしてデータの特定、作成、検証、準備を進めていくかを説明している。
論文 参考訳(メタデータ) (2020-09-04T07:53:43Z) - Intweetive Text Summarization [1.1565654851982567]
本稿では,公開図形E-Reputationを扱うマイクロブログ会話の要約を自動生成する手法を提案する。
これらの要約はキーワードクエリやサンプルツイートを使用して生成され、Micro-Blogネットワーク全体の集中ビューを提供する。
論文 参考訳(メタデータ) (2020-01-16T08:38:40Z) - ORB: An Open Reading Benchmark for Comprehensive Evaluation of Machine
Reading Comprehension [53.037401638264235]
我々は,7種類の読解データセットの性能を報告する評価サーバORBを提案する。
評価サーバは、モデルのトレーニング方法に制限を課さないため、トレーニングパラダイムや表現学習の探索に適したテストベッドである。
論文 参考訳(メタデータ) (2019-12-29T07:27:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。