論文の概要: Analysing Public Transport User Sentiment on Low Resource Multilingual Data
- arxiv url: http://arxiv.org/abs/2412.06951v1
- Date: Mon, 09 Dec 2024 19:54:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-11 14:39:08.043776
- Title: Analysing Public Transport User Sentiment on Low Resource Multilingual Data
- Title(参考訳): 低資源多言語データを用いた公共交通機関利用者感の分析
- Authors: Rozina L. Myoya, Vukosi Marivate, Idris Abdulmumin,
- Abstract要約: 本研究では,ケニア,タンザニア,南アフリカの既存の公共交通システムに対する感情を理解するために,通勤的世論調査を行った。
マルチリンガル・オピニオン・マイニングの手法を活用することで、我々のデータセットにある言語多様性とコードスイッチングに対処した。
その結果、南アフリカとケニアでは否定的な感情が主に見られ、タンザニアのデータセットはツイートの広告性から主に肯定的な感情を示した。
- 参考スコア(独自算出の注目度): 1.4690648473866215
- License:
- Abstract: Public transport systems in many Sub-Saharan countries often receive less attention compared to other sectors, underscoring the need for innovative solutions to improve the Quality of Service (QoS) and overall user experience. This study explored commuter opinion mining to understand sentiments toward existing public transport systems in Kenya, Tanzania, and South Africa. We used a qualitative research design, analysing data from X (formerly Twitter) to assess sentiments across rail, mini-bus taxis, and buses. By leveraging Multilingual Opinion Mining techniques, we addressed the linguistic diversity and code-switching present in our dataset, thus demonstrating the application of Natural Language Processing (NLP) in extracting insights from under-resourced languages. We employed PLMs such as AfriBERTa, AfroXLMR, AfroLM, and PuoBERTa to conduct the sentiment analysis. The results revealed predominantly negative sentiments in South Africa and Kenya, while the Tanzanian dataset showed mainly positive sentiments due to the advertising nature of the tweets. Furthermore, feature extraction using the Word2Vec model and K-Means clustering illuminated semantic relationships and primary themes found within the different datasets. By prioritising the analysis of user experiences and sentiments, this research paves the way for developing more responsive, user-centered public transport systems in Sub-Saharan countries, contributing to the broader goal of improving urban mobility and sustainability.
- Abstract(参考訳): 多くのサブサハラ諸国の公共交通システムは、他のセクターと比べてあまり注目されないことが多く、QoS(Quality of Service)とユーザエクスペリエンスを向上するための革新的なソリューションの必要性を浮き彫りにしている。
本研究では,ケニア,タンザニア,南アフリカの既存の公共交通システムに対する感情を理解するために,通勤的世論調査を行った。
私たちは質的なリサーチデザインを使用して、X(元Twitter)のデータを分析し、鉄道、ミニバスタクシー、バスの感情を評価しました。
マルチリンガル・オピニオン・マイニングの手法を活用することで,データセットの言語多様性とコードスイッチングに対処し,低リソース言語からの洞察を抽出するための自然言語処理(NLP)の適用を実証した。
AfriBERTa,AfroXLMR,AfroLM,PuoBERTaなどのPLMを用いて感情分析を行った。
その結果、南アフリカとケニアでは否定的な感情が主に見られ、タンザニアのデータセットはツイートの広告性から主に肯定的な感情を示した。
さらに、Word2VecモデルとK-Meansクラスタリングによる特徴抽出は、異なるデータセット内の照応的セマンティック関係と一次テーマを照会する。
ユーザー体験と感情の分析を優先して、サブサハラ諸国におけるより応答性が高く、ユーザ中心の公共交通システムを開発するための道を開くことにより、都市移動性や持続可能性の向上というより広い目標に寄与する。
関連論文リスト
- A Multilingual Sentiment Lexicon for Low-Resource Language Translation using Large Languages Models and Explainable AI [0.0]
南アフリカとDRCは、ズールー語、セペディ語、アフリカーンス語、フランス語、英語、ツィルバ語などの言語と共に複雑な言語景観を呈している。
この研究はフランス語とツィルバ語用に設計された多言語辞書を開発し、英語、アフリカーンス語、セペディ語、ズールー語への翻訳を含むように拡張された。
総合的なテストコーパスは、感情を予測するためにトレーニングされた機械学習モデルを使用して、翻訳と感情分析タスクをサポートするために作成される。
論文 参考訳(メタデータ) (2024-11-06T23:41:18Z) - Transit Pulse: Utilizing Social Media as a Source for Customer Feedback and Information Extraction with Large Language Model [12.6020349733674]
本稿では,交通関連情報を抽出し,分析するための新しい手法を提案する。
提案手法では,Large Language Models (LLM) ,特にLlama 3を合理化解析に用いている。
以上の結果から,公共交通機関におけるソーシャルメディアデータ分析を変革するLLMの可能性が示された。
論文 参考訳(メタデータ) (2024-10-19T07:08:40Z) - Improving Speech Emotion Recognition in Under-Resourced Languages via Speech-to-Speech Translation with Bootstrapping Data Selection [49.27067541740956]
音声感情認識(SER)は、人間とコンピュータの自然な相互作用が可能な汎用AIエージェントを開発する上で重要な要素である。
英語や中国語以外の言語でラベル付きデータが不足しているため、堅牢な多言語SERシステムの構築は依然として困難である。
本稿では,低SERリソース言語におけるSERの性能向上のための手法を提案する。
論文 参考訳(メタデータ) (2024-09-17T08:36:45Z) - Voices Unheard: NLP Resources and Models for Yorùbá Regional Dialects [72.18753241750964]
Yorub'aは、約4700万人の話者を持つアフリカの言語である。
アフリカ語のためのNLP技術開発への最近の取り組みは、彼らの標準方言に焦点を当てている。
我々は、このギャップを埋めるために、新しい高品質のパラレルテキストと音声コーパスを導入する。
論文 参考訳(メタデータ) (2024-06-27T22:38:04Z) - TransportationGames: Benchmarking Transportation Knowledge of
(Multimodal) Large Language Models [46.862519898969325]
TransportationGamesは(M)LLMを評価するための評価ベンチマークである。
各種(M)LLMの性能を記憶し,理解し,選択したタスクによる交通知識の適用において検証する。
論文 参考訳(メタデータ) (2024-01-09T10:20:29Z) - MasakhaNER 2.0: Africa-centric Transfer Learning for Named Entity
Recognition [55.95128479289923]
アフリカ系言語は10億人を超える人々によって話されているが、NLPの研究や開発ではあまり語られていない。
我々は、20のアフリカ言語で最大の人間アノテーション付きNERデータセットを作成します。
最適な転送言語を選択すると、ゼロショットF1スコアが平均14ポイント向上することを示す。
論文 参考訳(メタデータ) (2022-10-22T08:53:14Z) - Ensuring the Inclusive Use of Natural Language Processing in the Global
Response to COVID-19 [58.720142291102135]
低リソース言語を網羅することで、現在のNLPアプローチと将来のNLPアプローチをより包括的に行う方法について議論する。
我々は,NLPの正の社会的影響を最大化することに関心のある研究者のために,いくつかの今後の方向性を提案する。
論文 参考訳(メタデータ) (2021-08-11T12:54:26Z) - MasakhaNER: Named Entity Recognition for African Languages [48.34339599387944]
アフリカで10の言語で名前付きエンティティ認識のための、最初の大規模な公開可能な高品質データセットを作成します。
我々は,これらの言語がNERにもたらす課題を理解するために,言語の特徴を詳述する。
論文 参考訳(メタデータ) (2021-03-22T13:12:44Z) - Unavailable Transit Feed Specification: Making it Available with
Recurrent Neural Networks [8.968417883198374]
一般論として、公共交通機関の需要は、使用を拒む声が高まり、その品質が要求される。
本稿では,データマイニングと機械学習技術を活用した革新的な手法を用いて,公共交通機関に関する利用できないデータの利用を目標とする。
論文 参考訳(メタデータ) (2021-02-20T12:17:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。