論文の概要: Recovering Patient Journeys: A Corpus of Biomedical Entities and
Relations on Twitter (BEAR)
- arxiv url: http://arxiv.org/abs/2204.09952v1
- Date: Thu, 21 Apr 2022 08:18:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-22 21:15:18.656994
- Title: Recovering Patient Journeys: A Corpus of Biomedical Entities and
Relations on Twitter (BEAR)
- Title(参考訳): 患者ジャーニーの回復:Twitter上のバイオメディカルエンティティとリレーションシップのコーパス(BEAR)
- Authors: Amelie W\"uhrl and Roman Klinger
- Abstract要約: 本論文は,患者への旅行や経験を探索し,モデル化する動機として,アノテーション層を多用したコーパスを提案する。
我々は14のエンティティクラス(環境要因、診断、生化学的プロセス、患者のQOL、病原体、医療状況、治療など)と20の関連クラス(予防、影響、相互作用、原因など)をラベル付けする。
公開データセットは2,100のつぶやきと約6,000のエンティティと3,000のリレーショナルアノテーションで構成されている。
- 参考スコア(独自算出の注目度): 12.447379545167642
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Text mining and information extraction for the medical domain has focused on
scientific text generated by researchers. However, their direct access to
individual patient experiences or patient-doctor interactions can be limited.
Information provided on social media, e.g., by patients and their relatives,
complements the knowledge in scientific text. It reflects the patient's journey
and their subjective perspective on the process of developing symptoms, being
diagnosed and offered a treatment, being cured or learning to live with a
medical condition. The value of this type of data is therefore twofold:
Firstly, it offers direct access to people's perspectives. Secondly, it might
cover information that is not available elsewhere, including self-treatment or
self-diagnoses. Named entity recognition and relation extraction are methods to
structure information that is available in unstructured text. However, existing
medical social media corpora focused on a comparably small set of entities and
relations and particular domains, rather than putting the patient into the
center of analyses. With this paper we contribute a corpus with a rich set of
annotation layers following the motivation to uncover and model patients'
journeys and experiences in more detail. We label 14 entity classes (incl.
environmental factors, diagnostics, biochemical processes, patients'
quality-of-life descriptions, pathogens, medical conditions, and treatments)
and 20 relation classes (e.g., prevents, influences, interactions, causes) most
of which have not been considered before for social media data. The publicly
available dataset consists of 2,100 tweets with approx. 6,000 entity and 3,000
relation annotations. In a corpus analysis we find that over 80 % of documents
contain relevant entities. Over 50 % of tweets express relations which we
consider essential for uncovering patients' narratives about their journeys.
- Abstract(参考訳): 医学領域におけるテキストマイニングと情報抽出は、研究者による科学的テキストに焦点を当てている。
しかし、個々の患者体験への直接アクセスや患者と医師の相互作用は制限されることがある。
ソーシャルメディアで提供される情報、例えば患者とその親戚は、科学的なテキストで知識を補完する。
患者の経過と主観的視点を反映し、症状を発症し、診断を受け、治療を提供し、治療を受け、治療を受けたり、医学的な状況で生活することを学ぶ。
この種のデータの価値は2つある: まず、人々の視点に直接アクセスできる。
第二に、他の場所では利用できない情報、例えば自己待遇や自己診断をカバーできる。
名前付きエンティティ認識と関係抽出は、非構造化テキストで利用可能な情報を構成する方法である。
しかし、既存の医療ソーシャルメディアコーポラでは、患者を分析の中心に置くのではなく、比較的小さな実体と関係と特定のドメインに焦点を合わせていた。
本稿では,患者の移動や経験をより詳細に解明しモデル化する動機づけに従い,アノテーション層が豊富なコーパスを寄贈する。
我々は、14の実体クラス(環境要因、診断、生化学的プロセス、患者の生活の質、病原体、医療状況、治療)と20の関連クラス(例えば、予防、影響、相互作用、原因)を分類し、そのほとんどはソーシャルメディアデータについてこれまで考慮されていなかった。
公開データセットは2100のツイートと近似で構成されている。
6000のエンティティと3000の関連アノテーション。
コーパス分析では、80%以上の文書が関連エンティティを含んでいることがわかった。
ツイートの50%以上が、患者の旅の物語を明らかにするのに不可欠な関係を表現している。
関連論文リスト
- A Textbook Remedy for Domain Shifts: Knowledge Priors for Medical Image Analysis [48.84443450990355]
ディープネットワークは、医学的なスキャンに適用すると、例外のない状況で失敗することが多いため、自然画像の解析において広く成功している。
胸部X線や皮膚病変画像の文脈において、異なる病院から採取したデータや、性別、人種などの人口統計学的変数によって構築されたデータなど、ドメインシフトに対するモデル感度に焦点をあてる。
医学教育からインスピレーションを得て,自然言語で伝達される明示的な医学知識を基盤としたディープネットワークを提案する。
論文 参考訳(メタデータ) (2024-05-23T17:55:02Z) - Revealing Patient-Reported Experiences in Healthcare from Social Media
using the DAPMAV Framework [0.04096453902709291]
本稿では,DAPMAV(Design-Acquire-Process-Model-Analyse-Visualise)フレームワークを紹介し,ソーシャルメディアデータから患者に報告された経験を捉える手法とアプローチを提案する。
この枠組みを, /r/ProstateCancer による前立腺癌データのケーススタディに適用する。
論文 参考訳(メタデータ) (2022-10-09T11:38:41Z) - METS-CoV: A Dataset of Medical Entity and Targeted Sentiment on COVID-19
Related Tweets [13.35986397208115]
本稿では、医療機関と新型コロナウイルス関連ツイートのターゲット感情を含むデータセットであるMETS-CoVをリリースする。
私たちの知る限りでは、METS-CoVは、新型コロナウイルス関連ツイートの医療機関とそれに対応する感情を収集する最初のデータセットです。
論文 参考訳(メタデータ) (2022-09-28T01:55:14Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - CoVERT: A Corpus of Fact-checked Biomedical COVID-19 Tweets [10.536415845097661]
CoVERTは事実確認されたツイートのコーパスで、バイオメディシンと新型コロナウイルス関連の情報(ミス)に焦点を当てている。
我々は、新しいクラウドソーシング手法を用いて、すべてのツイートにファクトチェックラベルを付加し、クラウドワーカーがオンラインで検索する証拠を支持する。
得られたエビデンス抽出をファクトチェックパイプラインの一部として使用し、実世界のエビデンスの方が、事前訓練された言語モデルで間接的に利用できる知識よりも有用であることを確認した。
論文 参考訳(メタデータ) (2022-04-26T09:05:03Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - MIMO: Mutual Integration of Patient Journey and Medical Ontology for
Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文 参考訳(メタデータ) (2021-07-20T07:04:52Z) - MedDG: An Entity-Centric Medical Consultation Dataset for Entity-Aware
Medical Dialogue Generation [86.38736781043109]
MedDGという12種類の消化器疾患に関連する大規模医用対話データセットを構築し,公開する。
MedDGデータセットに基づく2種類の医療対話タスクを提案する。1つは次のエンティティ予測であり、もう1つは医師の反応生成である。
実験結果から,プレトレイン言語モデルと他のベースラインは,両方のタスクに苦戦し,データセットの性能が劣ることがわかった。
論文 参考訳(メタデータ) (2020-10-15T03:34:33Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Extracting Structured Data from Physician-Patient Conversations By
Predicting Noteworthy Utterances [39.888619005843246]
本稿では,会話の書き起こし,ビジット後要約,対応する証拠(転写文),構造化ラベルからなる新しいデータセットについて述べる。
方法論的な課題の1つは、会話が長く(約1500語)、現代のディープラーニングモデルではそれらを入力として使うのが難しいことである。
予測音声を初めてフィルタリングすることにより,診断とRoS異常の両方を認識するための予測性能を著しく向上させることができることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:10:37Z) - A Corpus for Detecting High-Context Medical Conditions in Intensive Care
Patient Notes Focusing on Frequently Readmitted Patients [28.668217175230822]
このデータセットには1102個の放電サマリーと1000個の看護進歩ノートが含まれている。
注釈付き表現型には、非アジェレンス治療、慢性痛、進行/転移性癌、および他の10種類の表現型が含まれる。
このデータセットは、医学、コンピュータ科学、特に医学自然言語処理の分野における学術、産業研究に利用することができる。
論文 参考訳(メタデータ) (2020-03-06T05:56:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。