論文の概要: Opioid Named Entity Recognition (ONER-2025) from Reddit
- arxiv url: http://arxiv.org/abs/2504.00027v2
- Date: Sat, 05 Apr 2025 04:25:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-08 14:07:38.541496
- Title: Opioid Named Entity Recognition (ONER-2025) from Reddit
- Title(参考訳): RedditによるOpioid Named Entity Recognition (ONER-2025)
- Authors: Muhammad Ahmad, Humaira Farid, Iqra Ameer, Maaz Amjad, Muhammad Muzamil, Ameer Hamza, Muhammad Jalal, Ildar Batyrshin, Grigori Sidorov,
- Abstract要約: Redditのようなソーシャルメディアプラットフォームは、公共の認識、議論、オピオイドの使用に関する経験に関する洞察を提供する膨大な量の構造化されていないデータを提供している。
本研究では、自然言語処理(NLP)、特にOpioid Named Entity Recognition(ONER-2025)を活用して、これらのプラットフォームから実行可能な情報を抽出する。
まず、Redditからソースされたユニークな手動の注釈付きデータセットを作成し、ユーザーが異なる管理ルートを介してオピオイドの使用を自己報告した経験を共有する。
次に、ONER-2025データセットのラベル付けの課題を議論しながら、アノテーションプロセスとガイドラインを詳述する。
第三に、スラング、曖昧さ、断片化を含む重要な言語課題を分析する。
- 参考スコア(独自算出の注目度): 4.228292407569811
- License:
- Abstract: The opioid overdose epidemic remains a critical public health crisis, particularly in the United States, leading to significant mortality and societal costs. Social media platforms like Reddit provide vast amounts of unstructured data that offer insights into public perceptions, discussions, and experiences related to opioid use. This study leverages Natural Language Processing (NLP), specifically Opioid Named Entity Recognition (ONER-2025), to extract actionable information from these platforms. Our research makes four key contributions. First, we created a unique, manually annotated dataset sourced from Reddit, where users share self-reported experiences of opioid use via different administration routes. This dataset contains 331,285 tokens and includes eight major opioid entity categories. Second, we detail our annotation process and guidelines while discussing the challenges of labeling the ONER-2025 dataset. Third, we analyze key linguistic challenges, including slang, ambiguity, fragmented sentences, and emotionally charged language, in opioid discussions. Fourth, we propose a real-time monitoring system to process streaming data from social media, healthcare records, and emergency services to identify overdose events. Using 5-fold cross-validation in 11 experiments, our system integrates machine learning, deep learning, and transformer-based language models with advanced contextual embeddings to enhance understanding. Our transformer-based models (bert-base-NER and roberta-base) achieved 97% accuracy and F1-score, outperforming baselines by 10.23% (RF=0.88).
- Abstract(参考訳): オピオイド過剰摂取の流行は、特に米国では重要な公衆衛生危機であり、重大な死亡率と社会的コストにつながっている。
Redditのようなソーシャルメディアプラットフォームは、公共の認識、議論、オピオイドの使用に関する経験に関する洞察を提供する膨大な量の構造化されていないデータを提供している。
本研究では、自然言語処理(NLP)、特にOpioid Named Entity Recognition(ONER-2025)を活用して、これらのプラットフォームから実行可能な情報を抽出する。
私たちの研究は4つの重要な貢献をしている。
まず、Redditからソースされたユニークな手動の注釈付きデータセットを作成し、ユーザーが異なる管理ルートを介してオピオイドの使用を自己報告した経験を共有する。
このデータセットは331,285トークンを含み、8つの主要なオピオイド実体カテゴリを含んでいる。
次に、ONER-2025データセットのラベル付けの課題を議論しながら、アノテーションプロセスとガイドラインを詳述する。
第3に、オピオイドの議論において、スラング、曖昧さ、断片化文、感情に満ちた言語などの重要な言語課題を分析する。
第4に、ソーシャルメディア、医療記録、救急サービスからストリーミングデータを処理し、過剰なイベントを特定するリアルタイムモニタリングシステムを提案する。
11の実験で5倍のクロスバリデーションを用いることで、機械学習、ディープラーニング、トランスフォーマーベースの言語モデルと高度な文脈埋め込みを統合し、理解を深める。
我々のトランスフォーマーベースモデル(bert-base-NER と roberta-base)は97%の精度とF1スコアを獲得し、ベースラインを10.23%上回った(RF=0.88)。
関連論文リスト
- A Thematic Framework for Analyzing Large-scale Self-reported Social Media Data on Opioid Use Disorder Treatment Using Buprenorphine Product [1.4599176517017673]
ブプレノルフィン(Buprenorphine)は、食品医薬品局(FDA)が承認したオピオイド用薬物の1つである。
その人気にもかかわらず、個人はしばしばRedditのようなソーシャルメディアプラットフォームでブプレノルフィン治療に関する様々な情報を報告している。
本稿では,ソーシャルメディアから大規模データをキュレートし,分析し,自己申告された治療情報のニーズを特徴付けるためのテーマベースフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-02T15:04:21Z) - A Textbook Remedy for Domain Shifts: Knowledge Priors for Medical Image Analysis [48.84443450990355]
ディープネットワークは、医学的なスキャンに適用すると、例外のない状況で失敗することが多いため、自然画像の解析において広く成功している。
胸部X線や皮膚病変画像の文脈において、異なる病院から採取したデータや、性別、人種などの人口統計学的変数によって構築されたデータなど、ドメインシフトに対するモデル感度に焦点をあてる。
医学教育からインスピレーションを得て,自然言語で伝達される明示的な医学知識を基盤としたディープネットワークを提案する。
論文 参考訳(メタデータ) (2024-05-23T17:55:02Z) - Reddit-Impacts: A Named Entity Recognition Dataset for Analyzing Clinical and Social Effects of Substance Use Derived from Social Media [6.138126219622993]
物質利用障害(SUD)は、データ駆動研究を通じて、問題とそのトレンドの理解を深める必要がある、世界的な関心事である。
ソーシャルメディアは、SUDに関するユニークな重要な情報源であり、特にそのような情報源のデータは、生きた経験を持つ人々によってしばしば生成されるためである。
本稿では,処方と違法なオピオイド,およびオピオイド使用障害の薬物に関する議論を専門とするサブレディットからキュレートされた,難解な名前付きエンティティ認識(NER)データセットであるReddit-Impactsを紹介する。
このデータセットは、研究の少ないが重要な、物質利用の側面に特に焦点を絞っている。
論文 参考訳(メタデータ) (2024-05-09T23:43:57Z) - "Hey..! This medicine made me sick": Sentiment Analysis of User-Generated Drug Reviews using Machine Learning Techniques [2.2874754079405535]
本研究は、特定の薬物に関するユーザレビューを、ポジティブ、ネガティブ、中立などの異なるクラスに分類する薬物レビュー分類システムを提案する。
収集されたデータは手動でラベル付けされ、ラベルが正しいことを保証するために手動で検証される。
論文 参考訳(メタデータ) (2024-04-09T08:42:34Z) - Learning to Describe for Predicting Zero-shot Drug-Drug Interactions [54.172575323610175]
薬物と薬物の相互作用は同時投与の有効性を損なう可能性がある。
従来のDDI予測の計算手法では、知識不足のため、新しい薬物の相互作用を捉えることができない可能性がある。
言語モデルに基づくDDI予測器と強化学習(RL)に基づく情報セレクタを用いたテキストDDIを提案する。
論文 参考訳(メタデータ) (2024-03-13T09:42:46Z) - Detection of Opioid Users from Reddit Posts via an Attention-based Bidirectional Recurrent Neural Network [11.491225833044021]
我々は、Redditでオピオイドユーザーを特定する機械学習の最近の進歩を活用している。
1ヶ月で3つのサブレディットに投稿した1000人以上のユーザーからの投稿が収集された。
我々は,オピオイドユーザを特定するために,注目に基づく双方向長短メモリモデルを適用した。
論文 参考訳(メタデータ) (2024-02-09T22:12:20Z) - Identifying Self-Disclosures of Use, Misuse and Addiction in Community-based Social Media Posts [26.161892748901252]
我々は,オピオイド使用の6つの異なる位相をラベル付けした,様々なサブレディットからの2500オピオイド関連ポストのコーパスを提示する。
すべての投稿で、私たちは、アノテーションの品質とモデル開発の両方において、スパンレベルの説明を注釈付けし、彼らの役割を決定的に研究します。
論文 参考訳(メタデータ) (2023-11-15T16:05:55Z) - Goal Driven Discovery of Distributional Differences via Language
Descriptions [58.764821647036946]
大きなコーパスを採掘することは有用な発見をもたらすが、人間には時間がかかる。
我々は、ゴール駆動方式で2つの大きなコーパス間の差異を自動的に発見する新しいタスクD5を定式化する。
本稿では,OpenD5 の幅広い応用について,これまで不明な発見を著者に提示する。
論文 参考訳(メタデータ) (2023-02-28T01:32:32Z) - Text Mining to Identify and Extract Novel Disease Treatments From
Unstructured Datasets [56.38623317907416]
Google Cloudを使って、NPRラジオ番組のポッドキャストのエピソードを書き起こします。
次に、テキストを体系的に前処理するためのパイプラインを構築します。
我々のモデルは、Omeprazoleが心臓熱傷の治療に役立てることに成功しました。
論文 参考訳(メタデータ) (2020-10-22T19:52:49Z) - Computational Support for Substance Use Disorder Prevention, Detection,
Treatment, and Recovery [62.9980747784214]
物質使用障害には、アルコール、オピオイド、マリファナ、メタンフェタミンの誤用が含まれる。
成人12人中1人が薬物使用障害を患っている。
全米薬物乱用協会(National Institute on Drug Abuse)は、SUDが年間5200億ドルの費用を負担していると推計している。
論文 参考訳(メタデータ) (2020-06-23T18:30:20Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。