論文の概要: Traditional Machine Learning Models and Bidirectional Encoder
Representations From Transformer (BERT)-Based Automatic Classification of
Tweets About Eating Disorders: Algorithm Development and Validation Study
- arxiv url: http://arxiv.org/abs/2402.05571v1
- Date: Thu, 8 Feb 2024 11:16:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 15:28:44.703483
- Title: Traditional Machine Learning Models and Bidirectional Encoder
Representations From Transformer (BERT)-Based Automatic Classification of
Tweets About Eating Disorders: Algorithm Development and Validation Study
- Title(参考訳): 伝統的な機械学習モデルとトランスフォーマ(bert)に基づく摂食障害に関するツイートの自動分類による双方向エンコーダ表現--アルゴリズムの開発と検証研究
- Authors: Jos\'e Alberto Ben\'itez-Andrades, Jos\'e-Manuel Alija-P\'erez,
Maria-Esther Vidal, Rafael Pastor-Vargas and Mar\'ia Teresa Garc\'ia-Ord\'as
- Abstract要約: 我々の目標は、摂食障害に関連するツイートを分類するための効率的な機械学習モデルを見つけることであった。
トランスフォーマーベースのモデルは、より多くの計算資源を必要とするが、摂食障害に関連するツイートを分類する従来の手法よりも優れている。
- 参考スコア(独自算出の注目度): 1.178706350363215
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Background: Eating disorders are increasingly prevalent, and social networks
offer valuable information.
Objective: Our goal was to identify efficient machine learning models for
categorizing tweets related to eating disorders.
Methods: Over three months, we collected tweets about eating disorders. A
2,000-tweet subset was labeled for: (1) being written by individuals with
eating disorders, (2) promoting eating disorders, (3) informativeness, and (4)
scientific content. Both traditional machine learning and deep learning models
were employed for classification, assessing accuracy, F1 score, and
computational time.
Results: From 1,058,957 collected tweets, transformer-based bidirectional
encoder representations achieved the highest F1 scores (71.1%-86.4%) across all
four categories.
Conclusions: Transformer-based models outperform traditional techniques in
classifying eating disorder-related tweets, though they require more
computational resources.
- Abstract(参考訳): 背景: 摂食障害はますます広まり、ソーシャルネットワークは貴重な情報を提供する。
目的: 摂食障害に関連するツイートを分類するための効率的な機械学習モデルを特定すること。
方法:3ヶ月以上にわたり,摂食障害に関するツイートを収集した。
1)摂食障害の個人によって書かれたもの,(2)摂食障害の促進,(3)情報性,(4)科学的内容について,2000ツイートのサブセットをラベル付けした。
従来の機械学習モデルとディープラーニングモデルの両方が、分類、精度評価、f1スコア、計算時間に用いられた。
結果: 1058,957件のツイートから,トランスフォーマーベースの双方向エンコーダ表現は,4つのカテゴリでf1スコア (71.1%-86.4%) を最高に達成した。
結論:transformerベースのモデルは、より多くの計算リソースを必要とするが、障害関連ツイートを分類する従来のテクニックを上回っている。
関連論文リスト
- RESTOR: Knowledge Recovery through Machine Unlearning [71.75834077528305]
Webスケールコーパスでトレーニングされた大規模な言語モデルは、望ましくないデータポイントを記憶することができる。
訓練されたモデルからこれらのデータポイントを「消去」することを目的とした、多くの機械学習手法が提案されている。
以下に示す次元に基づいて,機械学習のためのRESTORフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-31T20:54:35Z) - ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - UCE-FID: Using Large Unlabeled, Medium Crowdsourced-Labeled, and Small
Expert-Labeled Tweets for Foodborne Illness Detection [8.934980946374367]
食品性疾患検出のための深層学習フレームワークEGALを提案する。
EGALは、クラウドソーシングされた大量のラベルのないデータによって強化された、専門家ラベル付き小さなツイートを使用する。
EGALは、ツイートストリーミングのリアルタイム分析のためにデプロイされる可能性がある。
論文 参考訳(メタデータ) (2023-12-02T21:03:23Z) - Food Image Classification and Segmentation with Attention-based Multiple
Instance Learning [51.279800092581844]
本稿では,食品画像分類とセマンティックセグメンテーションモデルを訓練するための弱教師付き方法論を提案する。
提案手法は、注意に基づくメカニズムと組み合わせて、複数のインスタンス学習アプローチに基づいている。
提案手法の有効性を検証するため,FoodSeg103データセット内の2つのメタクラスについて実験を行った。
論文 参考訳(メタデータ) (2023-08-22T13:59:47Z) - Identifying Misinformation on YouTube through Transcript Contextual
Analysis with Transformer Models [1.749935196721634]
本稿では,コンテンツの正確性に着目した映像分類手法を提案する。
我々は、分類課題を解決するためにトランスファーラーニングのような高度な機械学習技術を採用している。
トレーニングされたモデルを、(a)YouTube Vaccine-misinformation関連ビデオ、(b)YouTube Pseudoscienceビデオ、(c)Fake-Newsデータセットの3つのデータセットに適用する。
論文 参考訳(メタデータ) (2023-07-22T19:59:16Z) - A Novel Site-Agnostic Multimodal Deep Learning Model to Identify
Pro-Eating Disorder Content on Social Media [0.0]
本研究の目的は、ソーシャルメディア投稿が摂食障害を促進するかどうかを判断できるマルチモーダルディープラーニングモデルを構築することである。
ツイートのラベル付きデータセットがTwitterから収集され、最近Xと改名され、12のディープラーニングモデルがトレーニングされ、評価された。
RoBERTaとMaxViTの融合モデルは、TumblrとRedditの未ラベルの投稿のデータセットを分類するためにデプロイされた。
論文 参考訳(メタデータ) (2023-07-06T16:04:46Z) - Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2023-06-15T15:38:10Z) - 2021 BEETL Competition: Advancing Transfer Learning for Subject
Independence & Heterogenous EEG Data Sets [89.84774119537087]
我々は、診断とBCI(Brain-Computer-Interface)に関する2つの伝達学習課題を設計する。
第1タスクは、患者全体にわたる自動睡眠ステージアノテーションに対処する医療診断に重点を置いている。
タスク2はBrain-Computer Interface (BCI)に集中しており、被験者とデータセットの両方にわたる運動画像のデコードに対処する。
論文 参考訳(メタデータ) (2022-02-14T12:12:20Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Utilizing Deep Learning to Identify Drug Use on Twitter Data [0.0]
サポートベクトルマシン(SVM)、XGBoost、畳み込みニューラルネットワーク(CNN)に基づく分類器を含む複数の手法の分類能力を比較した。
精度は76.35%と82.31%で、AUCは0.90と0.91である。
合成されたセットはスコアを増やし、分類能力を改善し、この方法論の価値を証明した。
論文 参考訳(メタデータ) (2020-03-08T07:52:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。