論文の概要: RedHOT: A Corpus of Annotated Medical Questions, Experiences, and Claims
on Social Media
- arxiv url: http://arxiv.org/abs/2210.06331v1
- Date: Wed, 12 Oct 2022 15:50:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 14:10:47.044191
- Title: RedHOT: A Corpus of Annotated Medical Questions, Experiences, and Claims
on Social Media
- Title(参考訳): redhot: ソーシャルメディア上での、注釈付き医療質問、経験、クレームのコーパス
- Authors: Somin Wadhwa, Vivek Khetan, Silvio Amir, Byron Wallace
- Abstract要約: 我々はReddit Health Online Talk (RedHOT)を紹介します。
これらの主張の中で、患者の人口、インターベンション、アウトカム(PIO)を記述したスニペットをマークします。
そこで本研究では,高密度検索モデルの学習に使用するタスクの監視(ノイズ)を自動的に導出する手法を提案する。
- 参考スコア(独自算出の注目度): 1.5293427903448022
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Reddit Health Online Talk (RedHOT), a corpus of 22,000 richly
annotated social media posts from Reddit spanning 24 health conditions.
Annotations include demarcations of spans corresponding to medical claims,
personal experiences, and questions. We collect additional granular annotations
on identified claims. Specifically, we mark snippets that describe patient
Populations, Interventions, and Outcomes (PIO elements) within these. Using
this corpus, we introduce the task of retrieving trustworthy evidence relevant
to a given claim made on social media. We propose a new method to automatically
derive (noisy) supervision for this task which we use to train a dense
retrieval model; this outperforms baseline models. Manual evaluation of
retrieval results performed by medical doctors indicate that while our system
performance is promising, there is considerable room for improvement. Collected
annotations (and scripts to assemble the dataset), are available at
https://github.com/sominw/redhot.
- Abstract(参考訳): reddit health online talk (redhot)は、24の健康状態にまたがるredditのリッチな注釈付きソーシャルメディア投稿のコーパスだ。
アノテーションには、医療クレーム、個人的な経験、質問に対応するスパンの区切りが含まれる。
特定されたクレームに対して追加の細かなアノテーションを収集します。
具体的には,患者集団,インターベンション,アウトカム(PIO)を記述したスニペットをマークする。
このコーパスを用いて,ソーシャルメディア上の主張に関係のある信頼できる証拠を検索する作業を紹介する。
本稿では,高密度検索モデルの学習に使用するタスクの(ノイズの多い)監視を自動的に導出する手法を提案する。
医師による検索結果の手動評価から,システム性能は期待できるものの,改善の余地は十分にあることが示唆された。
収集されたアノテーション(とデータセットを組み立てるスクリプト)はhttps://github.com/sominw/redhot.comで入手できる。
関連論文リスト
- FedIA: Federated Medical Image Segmentation with Heterogeneous Annotation Completeness [30.780654470392125]
フェデレーテッド・ラーニングは医療画像セグメンテーションの魅力的なパラダイムとして登場した。
本稿では,医療実践における課題である不完全アノテーションについて述べる。
この問題に対処するために、FedIAという新しいソリューションを紹介します。
論文 参考訳(メタデータ) (2024-07-02T14:08:55Z) - Cobra Effect in Reference-Free Image Captioning Metrics [58.438648377314436]
視覚言語事前学習モデル(VLM)を活用した参照フリー手法の普及が出現している。
本稿では,基準自由度に欠陥があるかどうかを考察する。
GPT-4Vは生成した文を評価するための評価ツールであり,提案手法がSOTA(State-of-the-art)の性能を達成することを示す。
論文 参考訳(メタデータ) (2024-02-18T12:36:23Z) - Streamlining Social Media Information Retrieval for COVID-19 Research with Deep Learning [19.675191059975877]
ソーシャルメディアを基盤とする公衆衛生研究は、疫病の監視に不可欠である。
ほとんどの研究はキーワードマッチングを伴う関連コーパスを特定している。
本研究は,口語医学辞典の整理過程を合理化するシステムを開発した。
論文 参考訳(メタデータ) (2023-06-28T08:20:35Z) - Semantic Similarity Models for Depression Severity Estimation [53.72188878602294]
本稿では、ソーシャルメディアの文章に基づいて、個人のうつ病の重症度を研究するための効率的なセマンティックパイプラインを提案する。
我々は,抑うつ症状と重度レベルに対応する代表訓練文の指標に対して意味的ランキングを生成するために,テストユーザ文を使用する。
本手法を2つのRedditベースのベンチマークで評価し,うつ病の重症度を指標として,最先端技術よりも30%改善した。
論文 参考訳(メタデータ) (2022-11-14T18:47:26Z) - MedJEx: A Medical Jargon Extraction Model with Wiki's Hyperlink Span and
Contextualized Masked Language Model Score [6.208127495081593]
我々は18K+EHR注記文から専門家が注釈付けした医療用語を用いた,新規かつ公開なデータセットを提示する。
次に,既存のNLPモデルよりも優れた医療ジャーゴン抽出(MedJEx$)モデルを提案する。
論文 参考訳(メタデータ) (2022-10-12T02:27:32Z) - Medical Question Understanding and Answering with Knowledge Grounding
and Semantic Self-Supervision [53.692793122749414]
本稿では,知識基盤とセマンティック・セルフスーパービジョンを備えた医療質問理解・回答システムについて紹介する。
我々のシステムは、まず、教師付き要約損失を用いて、長い医学的、ユーザによる質問を要約するパイプラインである。
システムはまず、信頼された医療知識ベースから要約されたユーザ質問とFAQとをマッチングし、対応する回答文書から一定の数の関連文を検索する。
論文 参考訳(メタデータ) (2022-09-30T08:20:32Z) - Text Mining to Identify and Extract Novel Disease Treatments From
Unstructured Datasets [56.38623317907416]
Google Cloudを使って、NPRラジオ番組のポッドキャストのエピソードを書き起こします。
次に、テキストを体系的に前処理するためのパイプラインを構築します。
我々のモデルは、Omeprazoleが心臓熱傷の治療に役立てることに成功しました。
論文 参考訳(メタデータ) (2020-10-22T19:52:49Z) - COMETA: A Corpus for Medical Entity Linking in the Social Media [27.13349965075764]
われわれは、Redditの専門家がSNOMED CTへのリンクを付加した20万の英語バイオメディカルエンティティからなるCOMETAという新しいコーパスを紹介した。
私たちのコーパスは、スケールとカバレッジから多様性と品質まで、望ましい特性の組み合わせを満足しています。
2つの挑戦的な評価シナリオの下で、エンティティや概念に関する複雑な推論を行うことのできる、これらのシステムの能力に光を当てた。
論文 参考訳(メタデータ) (2020-10-07T09:16:45Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Extracting Structured Data from Physician-Patient Conversations By
Predicting Noteworthy Utterances [39.888619005843246]
本稿では,会話の書き起こし,ビジット後要約,対応する証拠(転写文),構造化ラベルからなる新しいデータセットについて述べる。
方法論的な課題の1つは、会話が長く(約1500語)、現代のディープラーニングモデルではそれらを入力として使うのが難しいことである。
予測音声を初めてフィルタリングすることにより,診断とRoS異常の両方を認識するための予測性能を著しく向上させることができることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:10:37Z) - Learning Contextualized Document Representations for Healthcare Answer
Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。
本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。
我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-03T15:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。