論文の概要: A Big Data-empowered System for Real-time Detection of Regional Discriminatory Comments on Vietnamese Social Media
- arxiv url: http://arxiv.org/abs/2411.02587v1
- Date: Tue, 29 Oct 2024 10:06:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 11:30:41.042037
- Title: A Big Data-empowered System for Real-time Detection of Regional Discriminatory Comments on Vietnamese Social Media
- Title(参考訳): ベトナムのソーシャルメディアにおける地域差別コメントのリアルタイム検出のためのビッグデータ活用システム
- Authors: An Nghiep Huynh, Thanh Dat Do, Trong Hop Do,
- Abstract要約: ベトナムのソーシャルメディア上での地域差別コメントの検出という課題を提案する。
ソーシャルメディアプラットフォームからのコメントを含むViRDCデータセットを構築した。
本システムはベトナムにおける地域差別のリアルタイム検出のための包括的ソリューションを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Regional discrimination is a persistent social issue in Vietnam. While existing research has explored hate speech in the Vietnamese language, the specific issue of regional discrimination remains under-addressed. Previous studies primarily focused on model development without considering practical system implementation. In this work, we propose a task called Detection of Regional Discriminatory Comments on Vietnamese Social Media, leveraging the power of machine learning and transfer learning models. We have built the ViRDC (Vietnamese Regional Discrimination Comments) dataset, which contains comments from social media platforms, providing a valuable resource for further research and development. Our approach integrates streaming capabilities to process real-time data from social media networks, ensuring the system's scalability and responsiveness. We developed the system on the Apache Spark framework to efficiently handle increasing data inputs during streaming. Our system offers a comprehensive solution for the real-time detection of regional discrimination in Vietnam.
- Abstract(参考訳): ベトナムでは地域差別が社会問題となっている。
ベトナム語でヘイトスピーチを研究しているが、地域差別の具体的な問題は未解決のままである。
これまでの研究は主に、実用的なシステム実装を考慮せずに、モデル開発に重点を置いていた。
本研究では,ベトナムのソーシャルメディア上での地域差別的コメントの検出という課題を提案する。
ソーシャルメディアプラットフォームからのコメントを含む ViRDC (Vietnamese Regional Discrimination Comments) データセットを構築し,さらなる研究・開発のための貴重な資料を提供する。
当社のアプローチでは,ストリーミング機能を活用してソーシャルメディアネットワークからリアルタイムデータを処理し,システムのスケーラビリティと応答性を確保する。
我々は,ストリーミング中のデータインプットの増大を効率的に処理するために,Apache Sparkフレームワーク上でシステムを開発した。
本システムはベトナムにおける地域差別のリアルタイム検出のための包括的ソリューションを提供する。
関連論文リスト
- Auditing for Racial Discrimination in the Delivery of Education Ads [50.37313459134418]
本稿では,教育機会のための広告配信において,人種的偏見を評価できる新たな第三者監査手法を提案する。
メタのアルゴリズムによる教育機会の広告配信における人種差別の証拠を見つけ、法的および倫理的懸念を訴える。
論文 参考訳(メタデータ) (2024-06-02T02:00:55Z) - CReMa: Crisis Response through Computational Identification and Matching of Cross-Lingual Requests and Offers Shared on Social Media [5.384787836425144]
危機の時代には、ソーシャルメディアプラットフォームはコミュニケーションの促進と資源の調整において重要な役割を担っている。
本稿では,CReMa(Crisis Response Matcher)を提案する。
16言語でヘルプ検索をシミュレートし,ソーシャルメディアに支援を提供する新しい多言語データセットを提案する。
論文 参考訳(メタデータ) (2024-05-20T09:30:03Z) - LaTeX: Language Pattern-aware Triggering Event Detection for Adverse
Experience during Pandemics [10.292364075312667]
新型コロナウイルス(COVID-19)のパンデミックは、米国の様々な民族集団における社会経済的格差を強調させた。
本稿では,不足と課題の両面においてソーシャルメディアが果たす役割について考察する。
4種類の有害体験に関連する言語パターンを解析する。
論文 参考訳(メタデータ) (2023-10-05T23:09:31Z) - Tackling Hate Speech in Low-resource Languages with Context Experts [7.5217405965075095]
本稿では,ミャンマーにおけるヘイトスピーチの自動検出に関する遠隔研究から得られた知見を報告する。
この問題に効果的に対処するには、コンテキストエキスパートの知識と機械学習ツールを組み合わせたコミュニティベースのアプローチが必要であると我々は主張する。
論文 参考訳(メタデータ) (2023-03-29T16:24:22Z) - Fairness meets Cross-Domain Learning: a new perspective on Models and
Metrics [80.07271410743806]
クロスドメイン学習(CD)とモデルフェアネスの関係について検討する。
いくつかの人口集団にまたがる顔画像と医療画像のベンチマークと、分類とローカライゼーションタスクについて紹介する。
本研究は,3つの最先端フェアネスアルゴリズムとともに,14のCDアプローチをカバーし,前者が後者に勝ることを示す。
論文 参考訳(メタデータ) (2023-03-25T09:34:05Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - Vietnamese Hate and Offensive Detection using PhoBERT-CNN and Social
Media Streaming Data [2.5934729511903445]
ベトナムのソーシャルメディアから収集したコメントをクリーンにするための,効率的な事前処理手法を提案する。
PhoBERTモデルとText-CNNモデルを組み合わせた新しいヘイトスピーチ検出(HSD)モデルがベトナムの課題を解決するために提案された。
EDA技術は、不均衡なデータを扱うために応用され、分類モデルの性能を改善する。
論文 参考訳(メタデータ) (2022-06-01T14:33:25Z) - Attribute Inference Attack of Speech Emotion Recognition in Federated
Learning Settings [56.93025161787725]
Federated Learning(FL)は、クライアントをコーディネートして、ローカルデータを共有せずにモデルを協調的にトレーニングする分散機械学習パラダイムである。
本稿では,共有勾配やモデルパラメータからクライアントの機密属性情報を推測する属性推論攻撃フレームワークを提案する。
FLを用いて学習したSERシステムに対して,属性推論攻撃が達成可能であることを示す。
論文 参考訳(メタデータ) (2021-12-26T16:50:42Z) - Constructive and Toxic Speech Detection for Open-domain Social Media
Comments in Vietnamese [0.32228025627337864]
本論文では,1万語のコメントで構成的,有毒な音声検出を分類するためのデータセットを作成する。
PhoBERTとしてベトナムNLPにおける最先端の転送学習モデルを用いた構造的および有毒な音声検出システムを提案する。
結果から,オンライン議論の課題を解決し,ベトナムのソーシャルメディアコメントを自動的に識別する枠組みを開発することができた。
論文 参考訳(メタデータ) (2021-03-18T08:04:12Z) - Identity-Aware Attribute Recognition via Real-Time Distributed Inference
in Mobile Edge Clouds [53.07042574352251]
我々は、MEC対応カメラ監視システムにおいて、re-IDを用いた歩行者属性認識のための新しいモデルの設計を行う。
本稿では,属性認識と人物再IDを協調的に考慮し,分散モジュールの集合を持つ新しい推論フレームワークを提案する。
そこで我々は,提案した分散推論フレームワークのモジュール分布の学習に基づくアルゴリズムを考案した。
論文 参考訳(メタデータ) (2020-08-12T12:03:27Z) - Data Mining with Big Data in Intrusion Detection Systems: A Systematic
Literature Review [68.15472610671748]
クラウドコンピューティングは、複雑で高性能でスケーラブルな計算のために、強力で必要不可欠な技術になっている。
データ生成の迅速化とボリュームは、データ管理とセキュリティに重大な課題をもたらし始めている。
ビッグデータ設定における侵入検知システム(IDS)の設計と展開が重要視されている。
論文 参考訳(メタデータ) (2020-05-23T20:57:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。