論文の概要: CBRS: Cognitive Blood Request System with Bilingual Dataset and Dual-Layer Filtering for Multi-Platform Social Streams
- arxiv url: http://arxiv.org/abs/2604.16665v1
- Date: Fri, 17 Apr 2026 19:48:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.122991
- Title: CBRS: Cognitive Blood Request System with Bilingual Dataset and Dual-Layer Filtering for Multi-Platform Social Streams
- Title(参考訳): CBRS:マルチプラットフォームソーシャルストリームのためのバイリンガルデータセットと2層フィルタリングを用いた認知血液要求システム
- Authors: Anik Saha, Mst. Fahmida Sultana Naznin, Zia Ul Hassan Abdullah, Anisa Binte Asad, K. G. Subarno Bithi, A. B. M. Alim Al Islam,
- Abstract要約: 我々は,ソーシャルメディアストリームからの献血要求を効率的にフィルタリングし解析する多プラットフォームフレームワークであるCognitive Blood Request System (CBRS)を紹介した。
そのために、ベンガル語、英語、翻訳されたベンガル語で11Kの血液献血要求メッセージの新たなデータセットをキュレートする。
CBRSは99%の精度と精度を達成し、ベンチマーク手法を超越している。
- 参考スコア(独自算出の注目度): 5.24924215668484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Urgent blood donation seeking posts and messages on social media often go unnoticed due to the overwhelming volume of daily communications. Traditional app-based systems, reliant on manual input, struggle to reach users in low-resource settings, delaying critical responses. To address this, we introduce the Cognitive Blood Request System (CBRS), a multi-platform framework that efficiently filters and parses blood donation requests from social media streams using a cost-efficient dual-layered architecture. To do so, we curate a novel dataset of 11K parsed blood donation request messages in Bengali, English, and transliterated Bengali, capturing the linguistic diversity of real social media communications. The inclusion of adversarial negatives further enhances the robustness of our model. CBRS achieves an impressive 99% accuracy and precision in filtering, surpassing benchmark methods. In the parsing task, our LoRA finetuned Llama-3.2-3B model achieves 92% zero-shot accuracy, surpassing the base model by 41.54% and exceeding the few-shot performance of GPT-4o-mini, Gemini-2.0-Flash, and other LLMs, while resulting in a 35X reduction in input token usage. This work lays a robust foundation for scalable, inclusive information extraction in time-sensitive, object-focused tasks. Our code, dataset, and trained models are publicly available at [https://github.com/aaniksahaa/CBRS](https://github.com/aaniksahaa/CBRS).
- Abstract(参考訳): ソーシャルメディア上の投稿やメッセージを求める急激な献血は、毎日のコミュニケーションが圧倒的に多いため、しばしば気づかない。
従来のアプリケーションベースのシステムは手動入力に依存しており、低リソース設定でユーザに到達するのに苦労し、重要な応答を遅らせている。
これを解決するために,コスト効率の良い2層構造を用いて,ソーシャルメディアストリームからの献血要求を効率的にフィルタリング・解析する多プラットフォームフレームワークであるCognitive Blood Request System (CBRS)を紹介した。
そこで我々は、ベンガル語、英語、翻訳されたベンガル語で11Kの血液献血要求メッセージの新たなデータセットを収集し、実際のソーシャルメディアコミュニケーションの言語的多様性を捉えた。
敵対的負の包含は、我々のモデルの堅牢性をさらに高める。
CBRSは99%の精度と精度を達成し、ベンチマーク手法を超越している。
解析タスクでは,Llama-3.2-3Bモデルが92%のゼロショット精度を実現し,ベースモデルの41.54%を超え,GPT-4o-mini,Gemini-2.0-Flash,その他のLLMの少数ショット性能を上回り,入力トークンの使用率を35倍に削減した。
この作業は、時間に敏感でオブジェクトにフォーカスしたタスクにおいて、スケーラブルで包括的な情報抽出のための堅牢な基盤を構築します。
私たちのコード、データセット、トレーニングされたモデルは、[https://github.com/aaniksahaa/CBRS](https://github.com/aaniksahaa/CBRS]で公開されています。
関連論文リスト
- MEME-Fusion@CHiPSAL 2026: Multimodal Ablation Study of Hate Detection and Sentiment Analysis on Nepali Memes [0.0]
本稿では,CHiPSAL 2026共有タスクに対して,サブタスクAとサブタスクBの両方に対処するシステムを提案する。
視覚符号化のためのCLIPと多言語テキスト表現のためのBGE-M3を組み合わせたハイブリッド・モーダル・アテンション融合アーキテクチャを提案する。
テキストのみのベースラインであるSubtask Aの5.9%のF1マクロ改善を実現した。
論文 参考訳(メタデータ) (2026-04-13T07:37:14Z) - Benchmarking Small Language Models and Small Reasoning Language Models on System Log Severity Classification [3.192782465393035]
最終タスクとしてではなく,実行時ログ理解のためのベンチマークとして扱われる場合,重大度分類の方が有益である,と我々は主張する。
9つの小言語モデル (SLM) と小推論言語モデル (SRLM) をゼロショット, 少数ショット, 検索強化世代 (RAG) のプロンプトで評価した。
論文 参考訳(メタデータ) (2026-01-12T18:02:33Z) - TL;DR: Too Long, Do Re-weighting for Efficient LLM Reasoning Compression [55.37723860832064]
高度なデータアノテーションに依存しない動的比に基づくトレーニングパイプラインを提案する。
我々は、DeepSeek-R1-Distill-7BとDeepSeek-R1-Distill-14Bのモデルと、様々な難易度を持つ様々なベンチマークのモデルに対するアプローチを検証する。
論文 参考訳(メタデータ) (2025-06-03T09:23:41Z) - Curating corpora with classifiers: A case study of clean energy sentiment online [0.8192907805418583]
ソーシャルメディア投稿の大規模なコーパスには、幅広い世論が含まれている。
世論調査は、数日や数週間で実施し、世論を下ろすのに費用がかかる。
本稿では,解析用文書の最適コーパスを迅速に選択する手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T18:15:45Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Intent Classification Using Pre-Trained Embeddings For Low Resource
Languages [67.40810139354028]
言語固有の音声認識に依存しない音声理解システムを構築することは、言語処理において重要でない問題である。
本稿では,事前学習した音響モデルを用いて,低資源シナリオにおける音声言語理解を実現するための比較研究を提案する。
私たちは、ハイ、ミディアム、低リソースシナリオをシミュレートするために、それぞれ異なるデータサイズを持つ英語、Sinhala、Tamilの3つの異なる言語で実験を行います。
論文 参考訳(メタデータ) (2021-10-18T13:06:59Z) - Sign Language Recognition via Skeleton-Aware Multi-Model Ensemble [71.97020373520922]
手話は一般的に、聴覚障害者やミュート人がコミュニケーションするために使われる。
孤立手話認識(SLR)のためのGlobal Ensemble Model(GEM)を用いた新しいマルチモーダルフレームワークを提案する。
提案するSAM-SLR-v2 フレームワークは極めて有効であり,最先端の性能を高いマージンで達成している。
論文 参考訳(メタデータ) (2021-10-12T16:57:18Z) - Unsupervised Subword Modeling Using Autoregressive Pretraining and
Cross-Lingual Phone-Aware Modeling [30.905849959257264]
この研究は、教師なしサブワードモデリング、すなわち言語のサブワード単位を区別できる特徴表現の学習に対処する。
提案手法では,自動回帰予測符号化(APC)をフロントエンドとして,DNN-BNFモデルをバックエンドとして,二段階ボトルネック(BNF)学習フレームワークを採用する。
Libri-lightとZeroSpeech 2017データベースの結果は、APCがフロントエンドの機能事前トレーニングに有効であることを示している。
論文 参考訳(メタデータ) (2020-07-25T19:41:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。