論文の概要: A Unique Training Strategy to Enhance Language Models Capabilities for
Health Mention Detection from Social Media Content
- arxiv url: http://arxiv.org/abs/2310.19057v1
- Date: Sun, 29 Oct 2023 16:08:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 14:36:04.051335
- Title: A Unique Training Strategy to Enhance Language Models Capabilities for
Health Mention Detection from Social Media Content
- Title(参考訳): ソーシャルメディアコンテンツから健康状態検出のための言語モデル構築のためのユニークな訓練方法
- Authors: Pervaiz Iqbal Khan, Muhammad Nabeel Asim, Andreas Dengel, Sheraz Ahmed
- Abstract要約: ソーシャルメディアから健康関連コンテンツを抽出することは、様々なタイプのアプリケーションの開発に有用である。
この欠点の主な理由は、ソーシャルメディア利用者が一般的に使用する標準化されていない書き込みスタイルにある。
鍵となるゴールは、ランダムな重み付き摂動と対照的な学習戦略を取り入れることによって達成される。
ソーシャルメディアテキストの投稿を非健康・健康関連クラスに識別するための5つの異なる言語モデルの利点を享受するメタ予測器を提案する。
- 参考スコア(独自算出の注目度): 6.053876125887214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An ever-increasing amount of social media content requires advanced AI-based
computer programs capable of extracting useful information. Specifically, the
extraction of health-related content from social media is useful for the
development of diverse types of applications including disease spread,
mortality rate prediction, and finding the impact of diverse types of drugs on
diverse types of diseases. Language models are competent in extracting the
syntactic and semantics of text. However, they face a hard time extracting
similar patterns from social media texts. The primary reason for this shortfall
lies in the non-standardized writing style commonly employed by social media
users. Following the need for an optimal language model competent in extracting
useful patterns from social media text, the key goal of this paper is to train
language models in such a way that they learn to derive generalized patterns.
The key goal is achieved through the incorporation of random weighted
perturbation and contrastive learning strategies. On top of a unique training
strategy, a meta predictor is proposed that reaps the benefits of 5 different
language models for discriminating posts of social media text into non-health
and health-related classes. Comprehensive experimentation across 3 public
benchmark datasets reveals that the proposed training strategy improves the
performance of the language models up to 3.87%, in terms of F1-score, as
compared to their performance with traditional training. Furthermore, the
proposed meta predictor outperforms existing health mention classification
predictors across all 3 benchmark datasets.
- Abstract(参考訳): ソーシャルメディアコンテンツの増加は、有用な情報を抽出できる高度なAIベースのコンピュータプログラムを必要とする。
特に、ソーシャルメディアからの健康関連コンテンツの抽出は、疾患の拡散、死亡率の予測、様々な種類の病気に対する様々な種類の薬物の影響の発見を含む、多様な種類のアプリケーションの開発に有用である。
言語モデルは、テキストの構文と意味を抽出する能力を持っている。
しかし、ソーシャルメディアのテキストから同様のパターンを抽出するのは難しい。
この不足の主な理由は、ソーシャルメディアユーザーが一般的に使っている非標準化の文体にある。
ソーシャルメディアテキストから有用なパターンを抽出する上で,最適な言語モデルの必要性に続き,本論文の主な目的は,一般化されたパターンを学習するための言語モデルを訓練することである。
鍵となる目標は、無作為加重摂動と対比学習戦略を組み込むことである。
ユニークなトレーニング戦略に加えて、ソーシャルメディアテキストのポストを非健康および健康関連のクラスに識別するための5つの異なる言語モデルの利点を享受するメタ予測器が提案されている。
3つの公開ベンチマークデータセットにわたる総合的な実験により、提案されたトレーニング戦略が、従来のトレーニングのパフォーマンスと比較して、F1スコアの観点から、言語モデルのパフォーマンスを3.87%向上させることが明らかになった。
さらに、提案されたメタ予測器は、既存の3つのベンチマークデータセットの分類予測器よりも優れている。
関連論文リスト
- MetaKP: On-Demand Keyphrase Generation [52.48698290354449]
オンデマンドのキーフレーズ生成は,特定のハイレベルな目標や意図に従うキーフレーズを必要とする新しいパラダイムである。
そこで我々は,4つのデータセット,7500のドキュメント,3760の目標からなる大規模ベンチマークであるMetaKPを紹介した。
ソーシャルメディアからの流行事象検出に応用して,一般のNLP基盤として機能する可能性を示す。
論文 参考訳(メタデータ) (2024-06-28T19:02:59Z) - Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - Large Language Model Augmented Exercise Retrieval for Personalized
Language Learning [2.946562343070891]
ベクトル類似性アプローチは,学習者が学習したいことを表現するために使用するエクササイズコンテンツと言語との関係を,不十分に捉えていることがわかった。
我々は,学習者の入力に基づいて仮説的演習を合成することにより,大きな言語モデルの生成能力を活用してギャップを埋める。
我々はmHyERと呼ぶアプローチを,(1)学習における関連ラベルの欠如,(2)制限なし学習者の入力内容,(3)入力候補と検索候補とのセマンティックな類似性の低さという3つの課題を克服する。
論文 参考訳(メタデータ) (2024-02-08T20:35:31Z) - Entity Recognition from Colloquial Text [0.0]
我々は、医療分野に焦点をあて、口語テキストからの症状認識の問題について検討する。
これらの戦略を用いて訓練された最高のパフォーマンスモデルは、最先端の専門症状認識器よりも大きなマージンで優れている。
言語文における効果的な実体認識のための学習戦略に関する設計原則を述べる。
論文 参考訳(メタデータ) (2024-01-09T23:52:32Z) - Text generation for dataset augmentation in security classification
tasks [55.70844429868403]
本研究では、複数のセキュリティ関連テキスト分類タスクにおいて、このデータギャップを埋めるための自然言語テキストジェネレータの適用性を評価する。
我々は,GPT-3データ拡張戦略において,既知の正のクラスサンプルに厳しい制約がある状況において,大きなメリットを見出した。
論文 参考訳(メタデータ) (2023-10-22T22:25:14Z) - A Predictive Model of Digital Information Engagement: Forecasting User
Engagement With English Words by Incorporating Cognitive Biases,
Computational Linguistics and Natural Language Processing [3.09766013093045]
本研究は,デジタル情報エンゲージメント(IE)の新しい予測モデルの導入と実証実験である。
READモデルは、重要な認知バイアスを計算言語学や自然言語処理と統合し、情報のエンゲージメントに関する多次元的視点を開発する。
READモデルの可能性は、ビジネス、教育、政府、医療など、さまざまな領域に及んでいる。
論文 参考訳(メタデータ) (2023-07-26T20:58:47Z) - Multilingual Conceptual Coverage in Text-to-Image Models [98.80343331645626]
コンセプチュアル・カバー・アクロス言語(Conceptual Coverage Across Languages, CoCo-CroLa)とは、任意の生成的テキスト・画像システムにおいて、有形名詞の観点から学習言語に多言語対応を提供する程度をベンチマークする手法である。
各モデルについて、ソースコード中の一連の有形名詞に生成される画像の集団と、対象言語に翻訳された各名詞に生成された画像の集団とを比較することにより、ソース言語に対して与えられた対象言語の「概念的カバレッジ」を評価することができる。
論文 参考訳(メタデータ) (2023-06-02T17:59:09Z) - Multi-Modal Perceiver Language Model for Outcome Prediction in Emergency
Department [0.03088120935391119]
主訴のテキスト情報とトリアージで記録されたバイタルサインに基づいて, 病院救急部門における結果予測と患者トリアージに関心がある。
我々は、いくつかのアプリケーションで有望な結果を示すモダリティに依存しないトランスフォーマーベースのモデルであるPerceiverを適応する。
実験では,テキストやバイタルサインのみを訓練したモデルと比較して,変異モダリティが予測性能を向上させることを示した。
論文 参考訳(メタデータ) (2023-04-03T06:32:00Z) - Combining Contrastive Learning and Knowledge Graph Embeddings to develop
medical word embeddings for the Italian language [0.0]
本論文は,イタリアの医療領域の未発見ニッチへの埋め込みを改良する試みである。
主な目的は、医療用語間の意味的類似性の精度を向上させることである。
イタリア語には医学的な文章や制御された語彙が欠けているため、我々は特定の解決法を開発した。
論文 参考訳(メタデータ) (2022-11-09T17:12:28Z) - Leveraging Pre-trained Language Model for Speech Sentiment Analysis [58.78839114092951]
本研究では、事前学習された言語モデルを用いて、文章の感情情報を学習し、音声の感情分析を行う。
本稿では,言語モデルを用いた擬似ラベルに基づく半教師付き訓練戦略を提案する。
論文 参考訳(メタデータ) (2021-06-11T20:15:21Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。