論文の概要: Transit Pulse: Utilizing Social Media as a Source for Customer Feedback and Information Extraction with Large Language Model
- arxiv url: http://arxiv.org/abs/2410.15016v1
- Date: Sat, 19 Oct 2024 07:08:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-22 13:22:44.132852
- Title: Transit Pulse: Utilizing Social Media as a Source for Customer Feedback and Information Extraction with Large Language Model
- Title(参考訳): トランジットパルス:ソーシャルメディアを大規模言語モデルによる顧客フィードバックと情報抽出の源として活用する
- Authors: Jiahao Wang, Amer Shalaby,
- Abstract要約: 本稿では,交通関連情報を抽出し,分析するための新しい手法を提案する。
提案手法では,Large Language Models (LLM) ,特にLlama 3を合理化解析に用いている。
以上の結果から,公共交通機関におけるソーシャルメディアデータ分析を変革するLLMの可能性が示された。
- 参考スコア(独自算出の注目度): 12.6020349733674
- License:
- Abstract: Users of the transit system flood social networks daily with messages that contain valuable insights crucial for improving service quality. These posts help transit agencies quickly identify emerging issues. Parsing topics and sentiments is key to gaining comprehensive insights to foster service excellence. However, the volume of messages makes manual analysis impractical, and standard NLP techniques like Term Frequency-Inverse Document Frequency (TF-IDF) fall short in nuanced interpretation. Traditional sentiment analysis separates topics and sentiments before integrating them, often missing the interaction between them. This incremental approach complicates classification and reduces analytical productivity. To address these challenges, we propose a novel approach to extracting and analyzing transit-related information, including sentiment and sarcasm detection, identification of unusual system problems, and location data from social media. Our method employs Large Language Models (LLM), specifically Llama 3, for a streamlined analysis free from pre-established topic labels. To enhance the model's domain-specific knowledge, we utilize Retrieval-Augmented Generation (RAG), integrating external knowledge sources into the information extraction pipeline. We validated our method through extensive experiments comparing its performance with traditional NLP approaches on user tweet data from the real world transit system. Our results demonstrate the potential of LLMs to transform social media data analysis in the public transit domain, providing actionable insights and enhancing transit agencies' responsiveness by extracting a broader range of information.
- Abstract(参考訳): トランジットシステムのユーザーは、毎日ソーシャルネットワークに、サービス品質改善に不可欠な貴重な洞察を含むメッセージを流す。
これらの投稿は、交通機関が新興の問題を素早く特定するのに役立ちます。
トピックや感情のパーシングは、サービスの卓越性を育むための総合的な洞察を得るための鍵です。
しかし、メッセージのボリュームは手動による解析を非現実的にし、TF-IDF(Term Frequency-Inverse Document Frequency)のような標準NLP技術はニュアンス解釈では不十分である。
伝統的な感情分析は、それらを統合する前にトピックと感情を分離し、しばしばそれら間の相互作用を欠いている。
この漸進的なアプローチは分類を複雑にし、分析的生産性を低下させる。
これらの課題に対処するために、感情や皮肉の検出、異常なシステム問題の特定、ソーシャルメディアからの位置情報など、交通関連情報を抽出・分析する新しい手法を提案する。
提案手法では,Large Language Models(LLM),特にLlama 3を用いて,事前に確立されたトピックラベルを含まない合理化分析を行う。
モデルのドメイン固有知識を強化するために、情報抽出パイプラインに外部知識ソースを統合するRAG(Retrieval-Augmented Generation)を利用する。
実世界交通システムからのユーザ・ツイートデータに対する従来のNLP手法との比較実験により,本手法の有効性を検証した。
以上の結果から,公共交通機関におけるソーシャルメディアデータ分析を変革し,より広い範囲の情報を抽出することで,公共交通機関の応答性を高めることができる可能性が示唆された。
関連論文リスト
- CityGPT: Towards Urban IoT Learning, Analysis and Interaction with Multi-Agent System [4.612237040042468]
CityGPTはIoTデータの時間的分析を達成するために3つのエージェントを使用している。
我々は,大規模言語モデル(LLM)によって促進されたフレームワークを認証し,データの理解性を高めた。
実世界のデータを異なる時間で評価した結果、CityGPTフレームワークは、コンピューティングにおける堅牢な性能を保証できることが示されている。
論文 参考訳(メタデータ) (2024-05-23T15:27:18Z) - Time Series Analysis of Key Societal Events as Reflected in Complex
Social Media Data Streams [0.9790236766474201]
本研究では,ニッチなソーシャルメディアプラットフォームであるGABと,確立されたメッセージングサービスであるTelegramの物語進化について検討する。
我々のアプローチは、複数のソーシャルメディアドメインを調査し、他の方法では見えない重要な情報を排除するための新しいモードである。
主な知見は,(1) 時間線をデコンストラクトして, 解釈を改善するための有用なデータ機能を提供すること,(2) 一般化の基盤を提供する方法論を適用すること,である。
論文 参考訳(メタデータ) (2024-03-11T18:33:56Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Prompt-and-Align: Prompt-Based Social Alignment for Few-Shot Fake News
Detection [50.07850264495737]
プロンプト・アンド・アライン(Prompt-and-Align、P&A)は、数発のフェイクニュース検出のための新しいプロンプトベースのパラダイムである。
我々はP&Aが、数発のフェイクニュース検出性能をかなりのマージンで新たな最先端に設定していることを示す。
論文 参考訳(メタデータ) (2023-09-28T13:19:43Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - MetRoBERTa: Leveraging Traditional Customer Relationship Management Data
to Develop a Transit-Topic-Aware Language Model [3.3421154214189284]
そこで本稿では,オープンエンドテキストフィードバックを関連するトランジット特化トピックに分類可能な,トランジットトピック対応の大規模言語モデル(LLM)を提案する。
まず、半教師付き学習を用いて、6年間の顧客フィードバックのコーパスで検出された11の幅広いトランジットトピックのトレーニングデータセットを作成する。
次に、このデータセットを使用して、RoBERTaアーキテクチャに基づいた言語モデルをトレーニングし、徹底的に評価します。
論文 参考訳(メタデータ) (2023-08-09T15:11:37Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Twitter Referral Behaviours on News Consumption with Ensemble Clustering
of Click-Stream Data in Turkish Media [2.9005223064604078]
本研究は,Twitter のレファレンスに追随するニュース消費パターンを識別するために,組織ウェブサイトにおける読者のクリック活動について調査する。
調査は、ログデータをニュースコンテンツとリンクして洞察を深めることで、幅広い視点に展開されている。
論文 参考訳(メタデータ) (2022-02-04T09:57:13Z) - Knowledge Graph Augmented Network Towards Multiview Representation
Learning for Aspect-based Sentiment Analysis [96.53859361560505]
本稿では,知識グラフ拡張ネットワーク(KGAN)を提案する。
KGANは感情の特徴表現を、文脈、構文、知識に基づく複数の視点から捉えている。
3つの人気のあるABSAベンチマークの実験は、我々のKGANの有効性と堅牢性を示している。
論文 参考訳(メタデータ) (2022-01-13T08:25:53Z) - Cognitive Computing to Optimize IT Services [0.0]
認知的ソリューションは、構造化されたテキストと非構造化されたテキストの両方の深い分析によって、従来の構造化されたデータ分析を越えている。
実験では,提案手法により年額チケットの18~25%を削減した。
論文 参考訳(メタデータ) (2021-12-28T09:56:44Z) - Mining Implicit Relevance Feedback from User Behavior for Web Question
Answering [92.45607094299181]
本研究は,ユーザ行動と通過関連性との関連性を検討するための最初の研究である。
提案手法は,追加のラベル付きデータを使わずにパスランキングの精度を大幅に向上させる。
実際にこの研究は、グローバルな商用検索エンジンにおけるQAサービスの人為的ラベリングコストを大幅に削減する効果が証明されている。
論文 参考訳(メタデータ) (2020-06-13T07:02:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。