論文の概要: 1024m at SMM4H 2024: Tasks 3, 5 & 6 -- Ensembles of Transformers and Large Language Models for Medical Text Classification
- arxiv url: http://arxiv.org/abs/2410.15998v1
- Date: Mon, 21 Oct 2024 13:29:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-22 13:21:57.176009
- Title: 1024m at SMM4H 2024: Tasks 3, 5 & 6 -- Ensembles of Transformers and Large Language Models for Medical Text Classification
- Title(参考訳): 1024m at SMM4H 2024: Tasks 3, 5 and 6 -- Ensembles of Transformers and Large Language Models for Medical Text Classification (英語)
- Authors: Ram Mohan Rao Kadiyala, M. V. P. Chandra Sekhara Rao,
- Abstract要約: ソーシャルメディアは、ユーザーが情報を報告し、その健康状態や、さまざまなことがそれらにどのような影響を及ぼしたかについて、非常に優れたデータ源である。
本稿ではトランスフォーマーと大規模言語モデルを用いた様々なアプローチとそのアンサンブルについて述べる。
- 参考スコア(独自算出の注目度): 1.1470070927586018
- License:
- Abstract: Social media is a great source of data for users reporting information and regarding their health and how various things have had an effect on them. This paper presents various approaches using Transformers and Large Language Models and their ensembles, their performance along with advantages and drawbacks for various tasks of SMM4H'24 - Classifying texts on impact of nature and outdoor spaces on the author's mental health (Task 3), Binary classification of tweets reporting their children's health disorders like Asthma, Autism, ADHD and Speech disorder (task 5), Binary classification of users self-reporting their age (task 6).
- Abstract(参考訳): ソーシャルメディアは、ユーザーが情報を報告し、その健康状態や、さまざまなことがそれらにどのような影響を及ぼしたかについて、非常に優れたデータ源である。
本稿では,トランスフォーマーと大規模言語モデルとそれらのアンサンブルを用いた様々なアプローチ,その性能,SMM4H'24の様々なタスクに対するメリットと欠点,著者のメンタルヘルスに対する自然と屋外空間の影響に関するテキストの分類(第3章),喘息,自閉症,ADHD,音声障害などの子どもの健康障害を報告するつぶやきのバイナリ分類(第5章),年齢を自己申告するユーザのバイナリ分類(第6章)について述べる。
関連論文リスト
- ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - Health-LLM: Large Language Models for Health Prediction via Wearable Sensor Data [43.48422400822597]
大規模言語モデル(LLM)は多くの自然言語処理が可能であるが、完璧には程遠い。
本稿では、文脈情報に基づいて、健康に関する推測を行うLLMの能力について検討する。
本研究は,4つの公衆衛生データセットを用いた12種類のLCMの包括的評価と微調整技術について述べる。
論文 参考訳(メタデータ) (2024-01-12T19:40:11Z) - PMC-LLaMA: Towards Building Open-source Language Models for Medicine [62.39105735933138]
大規模言語モデル(LLM)は、自然言語理解において顕著な能力を示した。
LLMは、ドメイン固有の知識が不足しているため、医学的応用のような正確性を必要とする領域で苦労している。
PMC-LLaMAと呼ばれる医療応用に特化した強力なオープンソース言語モデルの構築手順について述べる。
論文 参考訳(メタデータ) (2023-04-27T18:29:05Z) - The Casual Conversations v2 Dataset [6.439761523935614]
データセットには、5,567人のユニークな有料参加者による26,467の動画が含まれており、平均して1人あたりの動画数は5本である。
参加者は、AIモデルの公正性を評価するためにデータを使用することに同意し、自己申告された年齢、性別、言語/方言、障害ステータス、身体的装飾、物理的属性、位置情報を提供した。
論文 参考訳(メタデータ) (2023-03-08T19:17:05Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - METS-CoV: A Dataset of Medical Entity and Targeted Sentiment on COVID-19
Related Tweets [13.35986397208115]
本稿では、医療機関と新型コロナウイルス関連ツイートのターゲット感情を含むデータセットであるMETS-CoVをリリースする。
私たちの知る限りでは、METS-CoVは、新型コロナウイルス関連ツイートの医療機関とそれに対応する感情を収集する最初のデータセットです。
論文 参考訳(メタデータ) (2022-09-28T01:55:14Z) - Learning Language and Multimodal Privacy-Preserving Markers of Mood from
Mobile Data [74.60507696087966]
精神状態は、先進医療に共通する国でも診断されていない。
人間の行動を監視するための有望なデータソースのひとつは、日々のスマートフォンの利用だ。
本研究では,自殺行動のリスクが高い青少年集団の移動行動のデータセットを用いて,日常生活の行動マーカーについて検討した。
論文 参考訳(メタデータ) (2021-06-24T17:46:03Z) - Fine-Tuning Transformers for Identifying Self-Reporting Potential Cases
and Symptoms of COVID-19 in Tweets [5.425235965110337]
私たちは、2021年のソーシャルメディアマイニング for Health Applications(SMM4H)共有タスクのタスク5および6に対する当社のストレートフォワードアプローチについて説明します。
私たちのシステムは、各タスクの微調整Distill-BERT、および最初に他のタスクのモデルを微調整に基づいています。
論文 参考訳(メタデータ) (2021-04-12T14:31:51Z) - MedDG: An Entity-Centric Medical Consultation Dataset for Entity-Aware
Medical Dialogue Generation [86.38736781043109]
MedDGという12種類の消化器疾患に関連する大規模医用対話データセットを構築し,公開する。
MedDGデータセットに基づく2種類の医療対話タスクを提案する。1つは次のエンティティ予測であり、もう1つは医師の反応生成である。
実験結果から,プレトレイン言語モデルと他のベースラインは,両方のタスクに苦戦し,データセットの性能が劣ることがわかった。
論文 参考訳(メタデータ) (2020-10-15T03:34:33Z) - Assessing the Severity of Health States based on Social Media Posts [62.52087340582502]
ユーザの健康状態の重症度を評価するために,テキストコンテンツとコンテキスト情報の両方をモデル化する多視点学習フレームワークを提案する。
多様なNLUビューは、ユーザの健康を評価するために、タスクと個々の疾患の両方に効果を示す。
論文 参考訳(メタデータ) (2020-09-21T03:45:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。