論文の概要: Theme-driven Keyphrase Extraction from Social Media on Opioid Recovery
- arxiv url: http://arxiv.org/abs/2301.11508v1
- Date: Fri, 27 Jan 2023 03:00:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-30 16:42:12.274666
- Title: Theme-driven Keyphrase Extraction from Social Media on Opioid Recovery
- Title(参考訳): オピオイド回復に関するソーシャルメディアからのテーマ駆動型キーフレーズ抽出
- Authors: William Romano, Omar Sharif, Madhusudan Basak, Joseph Gatto, and Sarah
Preum
- Abstract要約: ソーシャルメディアは、症状、治療、および個人的な経験に関する対話を行うためのスティグマのない方法となっている。
社会保健ポストのキーフレーズ抽出(KE)モデルは、公衆衛生の新たなトレンドを発見する上で不可欠である。
本稿では,新規なテーマ駆動型KEデータセットSuboxoPhraseと,臨床関連キーフレーズの抽出を目的とした定性的アノテーションスキームを提案する。
- 参考スコア(独自算出の注目度): 3.2365983191405103
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: An emerging trend on social media platforms is their use as safe spaces for
peer support. Particularly in healthcare, where many medical conditions contain
harsh stigmas, social media has become a stigma-free way to engage in dialogues
regarding symptoms, treatments, and personal experiences. Many existing works
have employed NLP algorithms to facilitate quantitative analysis of health
trends. Notably absent from existing works are keyphrase extraction (KE) models
for social health posts-a task crucial to discovering emerging public health
trends. This paper presents a novel, theme-driven KE dataset, SuboxoPhrase, and
a qualitative annotation scheme with an overarching goal of extracting targeted
clinically-relevant keyphrases. To the best of our knowledge, this is the first
study to design a KE schema for social media healthcare texts. To demonstrate
the value of this approach, this study analyzes Reddit posts regarding
medications for opioid use disorder, a paramount health concern worldwide.
Additionally, we benchmark ten off-the-shelf KE models on our new dataset,
demonstrating the unique extraction challenges in modeling user-generated
health texts. The proposed theme-driven KE approach lays the foundation of
future work on efficient, large-scale analysis of social health texts, allowing
researchers to surface useful public health trends, patterns, and knowledge
gaps.
- Abstract(参考訳): ソーシャルメディアプラットフォームにおける新たなトレンドは、ピアサポートのための安全なスペースとしての利用だ。
特に医療の分野では、多くの医療条件が厳しい便秘を含んでいるため、ソーシャルメディアは、症状、治療、および個人的な経験に関する対話を行うためのスティグマのない方法となっている。
既存の多くの研究では、NLPアルゴリズムを用いて健康動向の定量的分析を行っている。
既存の研究に特に欠けているのは、社会衛生に関するキーフレーズ抽出(ke)モデルである。
本稿では,新規なテーマ駆動型KEデータセットSuboxoPhraseと,臨床関連キーフレーズの抽出を目標とした定性的アノテーションスキームを提案する。
我々の知る限りでは、ソーシャルメディアの医療テキストのためのKEスキーマを設計する最初の研究である。
このアプローチの価値を示すために、オピオイド使用障害の薬物に関するredditの投稿を分析した。
さらに、新しいデータセット上で10の既製のKEモデルをベンチマークし、ユーザ生成の健康テキストをモデル化する際のユニークな抽出課題を実証した。
提案されているテーマ駆動型keアプローチは、ソーシャルヘルステキストの効率的かつ大規模分析に関する今後の研究の基礎となり、研究者が有用な公衆衛生の傾向、パターン、知識のギャップを明らかにすることができる。
関連論文リスト
- MetaKP: On-Demand Keyphrase Generation [52.48698290354449]
オンデマンドのキーフレーズ生成は,特定のハイレベルな目標や意図に従うキーフレーズを必要とする新しいパラダイムである。
そこで我々は,4つのデータセット,7500のドキュメント,3760の目標からなる大規模ベンチマークであるMetaKPを紹介した。
ソーシャルメディアからの流行事象検出に応用して,一般のNLP基盤として機能する可能性を示す。
論文 参考訳(メタデータ) (2024-06-28T19:02:59Z) - A Large-Scale Evaluation of Speech Foundation Models [110.95827399522204]
音声処理ユニバーサルパフォーマンスベンチマーク(SUPERB)を構築し,基礎モデルパラダイムの有効性について検討する。
凍結基盤モデルを用いてSUPERBにおける音声処理タスクに対処する統合マルチタスクフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-15T00:03:16Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - Retrieval-Augmented Multilingual Keyphrase Generation with
Retriever-Generator Iterative Training [66.64843711515341]
キーフレーズ生成は、長いテキストが与えられたキーフレーズを自動的に予測するタスクである。
我々は多言語キーフレーズ生成という新しい設定に注意を払っている。
非英語言語におけるデータ不足問題を軽減するために,多言語キーフレーズ生成のための検索拡張手法を提案する。
論文 参考訳(メタデータ) (2022-05-21T00:45:21Z) - Representation Learning for Resource-Constrained Keyphrase Generation [78.02577815973764]
本稿では,言語モデリングの目的を導くために,有能なスパンリカバリと有能なスパン予測を導入する。
提案手法が低リソースおよびゼロショットのキーフレーズ生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-03-15T17:48:04Z) - Unsupervised Keyphrase Extraction via Interpretable Neural Networks [27.774524511005172]
テキストのトピックを予測するのに最も有用なキーワードは重要なキーワードである。
InSPECTは、影響力のあるキーフレーズを識別するための自己説明型ニューラルネットワークフレームワークである。
InSPECTは4つの異なるデータセットから教師なし鍵抽出を行う。
論文 参考訳(メタデータ) (2022-03-15T04:30:47Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - UniKeyphrase: A Unified Extraction and Generation Framework for
Keyphrase Prediction [20.26899340581431]
キーワード予測タスクは、与えられたドキュメントのメインアイデアを要約できるいくつかのキーフレーズを予測することを目的としている。
メインストリームKP法は、純粋に生成的アプローチと、抽出と生成を伴う統合モデルに分類することができる。
キーフレーズの抽出と生成を共同で学習する新しいエンドツーエンド学習フレームワークUniKeyphraseを提案する。
論文 参考訳(メタデータ) (2021-06-09T07:09:51Z) - Persian Keyphrase Generation Using Sequence-to-Sequence Models [1.192436948211501]
キーワードは入力テキストの要約であり、テキストで議論された主主題を提供する。
本稿では,キーフレーズ生成とニュース記事の抽出に,深いシーケンス・ツー・シーケンスモデルを用いて取り組む。
論文 参考訳(メタデータ) (2020-09-25T14:40:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。