論文の概要: AIR-JPMC@SMM4H'22: Classifying Self-Reported Intimate Partner Violence
in Tweets with Multiple BERT-based Models
- arxiv url: http://arxiv.org/abs/2209.10763v1
- Date: Thu, 22 Sep 2022 03:43:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 13:16:06.672457
- Title: AIR-JPMC@SMM4H'22: Classifying Self-Reported Intimate Partner Violence
in Tweets with Multiple BERT-based Models
- Title(参考訳): AIR-JPMC@SMM4H'22:複数のBERTモデルを用いたつぶやきにおける自己申告された親密なパートナー暴力の分類
- Authors: Alec Candidato, Akshat Gupta, Xiaomo Liu, Sameena Shah
- Abstract要約: 本稿では,SMM4H 2022-Shared Taskに対して,Twitter上での自己報告された親密なパートナー暴力の分類について提案する。
このタスクの目的は、あるツイートの内容が、親密なパートナーの暴力で自分の経験を報告している人を示すかどうかを正確に判断することであった。
- 参考スコア(独自算出の注目度): 4.563365975305439
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents our submission for the SMM4H 2022-Shared Task on the
classification of self-reported intimate partner violence on Twitter (in
English). The goal of this task was to accurately determine if the contents of
a given tweet demonstrated someone reporting their own experience with intimate
partner violence. The submitted system is an ensemble of five RoBERTa models
each weighted by their respective F1-scores on the validation data-set. This
system performed 13% better than the baseline and was the best performing
system overall for this shared task.
- Abstract(参考訳): 本稿では,smm4h 2022-shared task on the classification of self-reported companion violence on twitter (英語) について述べる。
このタスクの目的は、あるツイートの内容が、親密なパートナー暴力で自分の経験を報告した人物を正確に判断することであった。
提出されたシステムは、検証データセット上の各F1スコアによって重み付けされた5つのRoBERTaモデルのアンサンブルである。
このシステムはベースラインよりも13%向上し、共有タスク全体において最高の性能を発揮した。
関連論文リスト
- SureMap: Simultaneous Mean Estimation for Single-Task and Multi-Task Disaggregated Evaluation [75.56845750400116]
分散評価(disaggregated evaluation) -- 異なるサブポピュレーション上での機械学習モデルのパフォーマンスの推定 - は、AIシステムのパフォーマンスとグループフェアネスを評価する上で、中核的なタスクである。
ブラックボックスモデルの評価において,マルチタスクとシングルタスクの双方に対して高い推定精度を持つSureMapを開発した。
提案手法は, ウェル・チョーゼンを用いた最大後部推定と, スタインの非バイアスリスク推定(SURE)によるクロスバリデーションフリーチューニングを併用する。
論文 参考訳(メタデータ) (2024-11-14T17:53:35Z) - Data Contamination Report from the 2024 CONDA Shared Task [78.50743680642405]
この最初のコンピレーション・ペーパーは、合計23人のコントリビュータから91件以上の汚染された資料が報告された566件を基にしている。
共有タスクと関連するデータベースの目標は,問題の範囲の理解と,既知の汚染資源に対する報告評価結果の回避を支援することにある。
論文 参考訳(メタデータ) (2024-07-31T11:26:57Z) - LT4SG@SMM4H24: Tweets Classification for Digital Epidemiology of Childhood Health Outcomes Using Pre-Trained Language Models [1.0312118123538199]
本稿では,子どもの医学的障害を報告した英語ツイートのバイナリ分類について,SMM4H24共有タスク5に対するアプローチを提案する。
テストデータに対するF1スコアの0.938を達成し,ベンチマークを1.18%上回った。
論文 参考訳(メタデータ) (2024-06-11T22:48:18Z) - ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - SemEval-2024 Shared Task 6: SHROOM, a Shared-task on Hallucinations and Related Observable Overgeneration Mistakes [48.83290963506378]
本稿では,幻覚検出に焦点をあてた共有タスクであるSHROOMの結果について述べる。
このアプローチをどのように取り組んだかについて、いくつかの重要なトレンドを観察します。
チームの大多数が提案したベースラインシステムより優れていますが、トップスコアシステムのパフォーマンスは依然として、より困難なアイテムのランダムなハンドリングと一致しています。
論文 参考訳(メタデータ) (2024-03-12T15:06:22Z) - Shayona@SMM4H23: COVID-19 Self diagnosis classification using BERT and
LightGBM models [1.5566524830295307]
本稿では,Team Shayona による SMMH4-23 のタスク 1 と 4 の共有に対するアプローチと結果について述べる。
私たちのチームは、すべての参加者の中で、Task-1のf1スコア0.94を達成しました。
論文 参考訳(メタデータ) (2024-01-04T09:13:18Z) - HausaNLP at SemEval-2023 Task 10: Transfer Learning, Synthetic Data and
Side-Information for Multi-Level Sexism Classification [0.007696728525672149]
SemEval-2023 Task 10: Explainable Detection of Online Sexism (EDOS) task。
XLM-T (sentiment classification) と HateBERT (same domain - Reddit) の2つの言語モデルを用いて,マルチレベル分類をSexist と not Sexist に移行する効果を検討した。
論文 参考訳(メタデータ) (2023-04-28T20:03:46Z) - SSS at SemEval-2023 Task 10: Explainable Detection of Online Sexism
using Majority Voted Fine-Tuned Transformers [0.0]
本稿では,SemEval 2023におけるタスク10の提出について述べる。
最近のソーシャルメディアプラットフォームの増加は、ソーシャルメディアプラットフォーム上で女性が経験する性差別の格差が増加している。
提案手法は、BERTモデルの実験と微調整と、個別のベースラインモデルスコアより優れるMajority Votingアンサンブルモデルを用いて構成する。
論文 参考訳(メタデータ) (2023-04-07T07:24:32Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - Evaluation Toolkit For Robustness Testing Of Automatic Essay Scoring
Systems [64.4896118325552]
モデル逆算評価スキームと関連するメトリクスを用いて、現状のAESモデルを評価する。
AESモデルは非常に過大評価されていることがわかった。質問の話題に関係のない内容の重い修正(25%まで)でさえ、モデルが生み出すスコアを低下させることはない。
論文 参考訳(メタデータ) (2020-07-14T03:49:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。