論文の概要: Reddit-Impacts: A Named Entity Recognition Dataset for Analyzing Clinical and Social Effects of Substance Use Derived from Social Media
- arxiv url: http://arxiv.org/abs/2405.06145v1
- Date: Thu, 9 May 2024 23:43:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-13 17:06:55.287734
- Title: Reddit-Impacts: A Named Entity Recognition Dataset for Analyzing Clinical and Social Effects of Substance Use Derived from Social Media
- Title(参考訳): Reddit-Impacts:ソーシャルメディアから得られた物質使用の臨床的および社会的影響を分析するためのエンティティ認識データセット
- Authors: Yao Ge, Sudeshna Das, Karen O'Connor, Mohammed Ali Al-Garadi, Graciela Gonzalez-Hernandez, Abeed Sarker,
- Abstract要約: 物質利用障害(SUD)は、データ駆動研究を通じて、問題とそのトレンドの理解を深める必要がある、世界的な関心事である。
ソーシャルメディアは、SUDに関するユニークな重要な情報源であり、特にそのような情報源のデータは、生きた経験を持つ人々によってしばしば生成されるためである。
本稿では,処方と違法なオピオイド,およびオピオイド使用障害の薬物に関する議論を専門とするサブレディットからキュレートされた,難解な名前付きエンティティ認識(NER)データセットであるReddit-Impactsを紹介する。
このデータセットは、研究の少ないが重要な、物質利用の側面に特に焦点を絞っている。
- 参考スコア(独自算出の注目度): 6.138126219622993
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Substance use disorders (SUDs) are a growing concern globally, necessitating enhanced understanding of the problem and its trends through data-driven research. Social media are unique and important sources of information about SUDs, particularly since the data in such sources are often generated by people with lived experiences. In this paper, we introduce Reddit-Impacts, a challenging Named Entity Recognition (NER) dataset curated from subreddits dedicated to discussions on prescription and illicit opioids, as well as medications for opioid use disorder. The dataset specifically concentrates on the lesser-studied, yet critically important, aspects of substance use--its clinical and social impacts. We collected data from chosen subreddits using the publicly available Application Programming Interface for Reddit. We manually annotated text spans representing clinical and social impacts reported by people who also reported personal nonmedical use of substances including but not limited to opioids, stimulants and benzodiazepines. Our objective is to create a resource that can enable the development of systems that can automatically detect clinical and social impacts of substance use from text-based social media data. The successful development of such systems may enable us to better understand how nonmedical use of substances affects individual health and societal dynamics, aiding the development of effective public health strategies. In addition to creating the annotated data set, we applied several machine learning models to establish baseline performances. Specifically, we experimented with transformer models like BERT, and RoBERTa, one few-shot learning model DANN by leveraging the full training dataset, and GPT-3.5 by using one-shot learning, for automatic NER of clinical and social impacts. The dataset has been made available through the 2024 SMM4H shared tasks.
- Abstract(参考訳): 物質利用障害(SUD)は、データ駆動研究を通じて、問題とそのトレンドの理解を深める必要がある、世界的な関心事である。
ソーシャルメディアは、SUDに関するユニークな重要な情報源であり、特にそのような情報源のデータは、生きた経験を持つ人々によってしばしば生成されるためである。
本稿では,処方と違法なオピオイド,オピオイド使用障害の薬物に関する議論を専門とするサブレディットからキュレートされた,難易度の高い名前付きエンティティ認識(NER)データセットであるReddit-Impactsを紹介する。
このデータセットは、研究の少ないが重要な、物質の使用の側面 ― 臨床的および社会的影響 ― に焦点を当てている。
Reddit用のアプリケーションプログラミングインタフェースを使って、選択したサブレディットからデータを収集しました。
我々は,オピオイド,刺激薬,ベンゾジアゼピンに限らず,個人の非医療的使用を報告した人々による臨床・社会的な影響を手動で表した。
本研究の目的は、テキストベースのソーシャルメディアデータから、物質使用の臨床的・社会的影響を自動的に検出するシステムの開発を可能にするリソースを作成することである。
このようなシステムの開発が成功すれば、非医療的な物質の使用が個人の健康や社会的ダイナミクスにどのように影響するかをよりよく理解し、効果的な公衆衛生戦略の開発を支援することができるかもしれない。
アノテーション付きデータセットの作成に加えて、ベースライン性能を確立するためにいくつかの機械学習モデルを適用した。
具体的には、BERTやRoBERTaのようなトランスフォーマーモデル、フルトレーニングデータセットを活用した数発の学習モデルDANN、ワンショット学習によるGPT-3.5を、臨床および社会的影響の自動NERとして実験した。
データセットは2024年のSMM4H共有タスクを通じて利用可能になった。
関連論文リスト
- "Hey..! This medicine made me sick": Sentiment Analysis of User-Generated Drug Reviews using Machine Learning Techniques [2.2874754079405535]
本研究は、特定の薬物に関するユーザレビューを、ポジティブ、ネガティブ、中立などの異なるクラスに分類する薬物レビュー分類システムを提案する。
収集されたデータは手動でラベル付けされ、ラベルが正しいことを保証するために手動で検証される。
論文 参考訳(メタデータ) (2024-04-09T08:42:34Z) - Learning to Describe for Predicting Zero-shot Drug-Drug Interactions [54.172575323610175]
薬物と薬物の相互作用は同時投与の有効性を損なう可能性がある。
従来のDDI予測の計算手法では、知識不足のため、新しい薬物の相互作用を捉えることができない可能性がある。
言語モデルに基づくDDI予測器と強化学習(RL)に基づく情報セレクタを用いたテキストDDIを提案する。
論文 参考訳(メタデータ) (2024-03-13T09:42:46Z) - An Annotated Dataset for Explainable Interpersonal Risk Factors of
Mental Disturbance in Social Media Posts [0.0]
ソーシャルメディア上での精神障害に影響を及ぼす人為的リスクファクター(IRF)の分類と説明を伴う注釈付きデータセットの構築とリリースを行う。
我々は,TBeとPBuのパターンをユーザの歴史的ソーシャルメディアプロファイルの感情スペクトルで検出することにより,将来的な研究方向のベースラインモデルを構築し,リアルタイムなパーソナライズされたAIモデルを開発する。
論文 参考訳(メタデータ) (2023-05-30T04:08:40Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - The Health Gym: Synthetic Health-Related Datasets for the Development of
Reinforcement Learning Algorithms [2.032684842401705]
Health Gymは、機械学習アルゴリズムのプロトタイプ、評価、比較に自由にアクセス可能な、合成医療データセットのコレクションである。
このデータセットはGAN(Generative Adversarial Network)を用いて作成された。
合成データセットの公開分布に関連する機密情報開示のリスクは非常に低いと推定される。
論文 参考訳(メタデータ) (2022-03-12T07:28:02Z) - DrugOOD: Out-of-Distribution (OOD) Dataset Curator and Benchmark for
AI-aided Drug Discovery -- A Focus on Affinity Prediction Problems with Noise
Annotations [90.27736364704108]
我々は、AI支援薬物発見のための体系的なOODデータセットキュレーターおよびベンチマークであるTarmOODを提案する。
DrugOODには、ベンチマークプロセスを完全に自動化するオープンソースのPythonパッケージが付属している。
我々は、薬物標的結合親和性予測という、AIDDにおける最も重要な問題の1つに焦点を当てる。
論文 参考訳(メタデータ) (2022-01-24T12:32:48Z) - Data Augmentation for Mental Health Classification on Social Media [0.0]
オンライン利用者の精神障害はソーシャルメディア投稿を用いて決定される。
この領域における大きな課題は、ソーシャルメディアプラットフォーム上でユーザーが生成したテキストを使用するための倫理的クリアランスを活用することである。
メンタルヘルス分類のためのドメイン固有ユーザ生成テキストに対するデータ拡張手法の効果について検討した。
論文 参考訳(メタデータ) (2021-12-19T05:09:01Z) - Heterogeneous Treatment Effect Estimation using machine learning for
Healthcare application: tutorial and benchmark [8.869515663374248]
多くの研究が、薬物効果は人口間で不均一であることを示した。
ヘテロジニアス処理効果(HTE)を推定する高度な機械学習モデルが近年出現している。
我々は,医療分野にHTE手法を導入し,実現可能性を検討することを目的とする。
論文 参考訳(メタデータ) (2021-09-27T02:34:44Z) - Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia
for Human Personality Profiling [74.83957286553924]
我々は、"PERS"と呼ばれる新しい多視点融合フレームワークを適用して、マイアーズ・ブリッグス・パーソナリティ・タイプインジケータを推定する。
実験の結果,多視点データからパーソナリティ・プロファイリングを学習する能力は,多様なソーシャル・マルチメディア・ソースからやってくるデータを効率的に活用できることが示唆された。
論文 参考訳(メタデータ) (2021-06-20T10:48:49Z) - Assessing the Severity of Health States based on Social Media Posts [62.52087340582502]
ユーザの健康状態の重症度を評価するために,テキストコンテンツとコンテキスト情報の両方をモデル化する多視点学習フレームワークを提案する。
多様なNLUビューは、ユーザの健康を評価するために、タスクと個々の疾患の両方に効果を示す。
論文 参考訳(メタデータ) (2020-09-21T03:45:14Z) - I Know Where You Are Coming From: On the Impact of Social Media Sources
on AI Model Performance [79.05613148641018]
我々は、異なるソーシャルネットワークのマルチモーダルデータから学習する際、異なる機械学習モデルの性能について検討する。
最初の実験結果から,ソーシャルネットワークの選択がパフォーマンスに影響を及ぼすことが明らかとなった。
論文 参考訳(メタデータ) (2020-02-05T11:10:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。