論文の概要: DS@GT at CheckThat! 2025: Ensemble Methods for Detection of Scientific Discourse on Social Media
- arxiv url: http://arxiv.org/abs/2507.06205v1
- Date: Tue, 08 Jul 2025 17:30:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:38.37257
- Title: DS@GT at CheckThat! 2025: Ensemble Methods for Detection of Scientific Discourse on Social Media
- Title(参考訳): DS@GT at CheckThat! 2025: Ensemble Methods for Detection of Scientific Discourse on Social Media (英語)
- Authors: Ayush Parikh, Hoang Thanh Thanh Truong, Jeanette Schofield, Maximilian Heil,
- Abstract要約: 本稿では,課題4aにおけるScientific Web Discourse Detectionのための手法を提案する。
この課題のために、あるツイートが科学的な主張、科学的な研究や出版への言及、および/または科学的な実体の言及を含むかどうかを決定した。
我々のチームは7位となり、マクロ平均F1スコア0.8611、DeBERTaV3ベースライン0.8375を上回りました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we, as the DS@GT team for CLEF 2025 CheckThat! Task 4a Scientific Web Discourse Detection, present the methods we explored for this task. For this multiclass classification task, we determined if a tweet contained a scientific claim, a reference to a scientific study or publication, and/or mentions of scientific entities, such as a university or a scientist. We present 3 modeling approaches for this task: transformer finetuning, few-shot prompting of LLMs, and a combined ensemble model whose design was informed by earlier experiments. Our team placed 7th in the competition, achieving a macro-averaged F1 score of 0.8611, an improvement over the DeBERTaV3 baseline of 0.8375. Our code is available on Github at https://github.com/dsgt-arc/checkthat-2025-swd/tree/main/subtask-4a.
- Abstract(参考訳): 本稿では,CLEF 2025 CheckThatのDS@GTチームとして紹介する。
課題4a 科学的Web談話の検出, この課題について検討した手法について述べる。
この多クラス分類タスクにおいて、ツイートが科学的な主張、科学的な研究や出版への言及、大学や科学者のような科学的な実体の言及を含むか否かを判定した。
本稿では, この課題に対する3つのモデリング手法を提案する。トランスフォーマーファインタニング, LLMの少数ショットプロンプト, および, 先行実験により設計が通知されたアンサンブルモデルである。
我々のチームは7位となり、マクロ平均F1スコア0.8611、DeBERTaV3ベースライン0.8375を上回りました。
私たちのコードはGithubでhttps://github.com/dsgt-arc/checkthat-2025-swd/tree/main/subtask-4a.comで公開されています。
関連論文リスト
- LENS: Multi-level Evaluation of Multimodal Reasoning with Large Language Models [59.0256377330646]
Lensは3.4Kの現代画像と8つのタスクと12の日次シナリオをカバーする60K以上の人間による質問のベンチマークである。
このデータセットは本質的に、基本的な知覚から構成的推論に至るまで、画像不変のプロンプトを処理するためのMLLMの評価をサポートする。
我々は,Qwen2.5-VL-72B,InternVL3-78B,GPT-4oおよび2つの推論モデルQVQ-72B-previewとKim-VLなどの15以上のフロンティアMLLMを評価する。
論文 参考訳(メタデータ) (2025-05-21T15:06:59Z) - ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - SciAgent: Tool-augmented Language Models for Scientific Reasoning [129.51442677710452]
ツール強化科学推論という新しいタスク設定を導入する。
この設定は、スケーラブルなツールセットでLarge Language Modelsを補完する。
約3万のサンプルと約6,000のツールを含むツール拡張トレーニングコーパスであるMathFuncを構築した。
MathFunc上に構築したSciAgentは,科学的な問題解決のためのツールを検索し,理解し,必要に応じて利用する。
論文 参考訳(メタデータ) (2024-02-18T04:19:44Z) - Mavericks at ArAIEval Shared Task: Towards a Safer Digital Space --
Transformer Ensemble Models Tackling Deception and Persuasion [0.0]
本稿では,各課題のタスク1-Aとタスク2-Aのアプローチについて述べる。
タスクは、与えられたバイナリ分類問題に対して、ツイートとニュース記事のマルチジャンルスニペットを使用する。
タスク1-A(8位)では0.742、タスク2-A(7位)では0.901のマイクロF1スコアを達成した。
論文 参考訳(メタデータ) (2023-11-30T17:26:57Z) - Attention at SemEval-2023 Task 10: Explainable Detection of Online
Sexism (EDOS) [15.52876591707497]
我々は、分類タスクの形式でモデルによってなされた決定の解釈可能性、信頼、理解に取り組んできた。
最初のタスクは、バイナリ性検出を決定することで構成される。
第二の課題は性差別のカテゴリーを記述することである。
第3の課題は、よりきめ細かい性差別のカテゴリーを記述することである。
論文 参考訳(メタデータ) (2023-04-10T14:24:52Z) - Detecting Generated Scientific Papers using an Ensemble of Transformer
Models [4.56877715768796]
DAGPap22共有タスクのために開発されたニューラルモデルについて,Scholarly Document Processingの第3ワークショップで紹介した。
我々の研究は、異なるトランスフォーマーベースのモデルの比較と、不均衡なクラスを扱うために追加のデータセットとテクニックの使用に焦点を当てている。
論文 参考訳(メタデータ) (2022-09-17T08:43:25Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z) - Team Alex at CLEF CheckThat! 2020: Identifying Check-Worthy Tweets With
Transformer Models [28.25006244616817]
本稿では、深い文脈のテキスト表現と、そのツイートの社会的文脈をモデル化した、新型コロナウイルスに関するチェックアワーなツイートを検出するモデルを提案する。
CLEF-2020 CheckThat! Task 1 System Team_AlexはMAPスコア0.8034で2位にランクされた。
論文 参考訳(メタデータ) (2020-09-07T08:03:21Z) - On the Inference of Soft Biometrics from Typing Patterns Collected in a
Multi-device Environment [47.37893297206786]
本稿では,マルチデバイス環境における117人を対象に,性別,メジャー/マイナー,タイピングスタイル,年齢,身長の推測を行った。
分類タスクでは、6つの古典的機械学習(ML)と4つのディープラーニング(DL)分類器のパフォーマンスをベンチマークする。
この研究で挙げられた様々なアプリケーションシナリオを考慮して、結果は有望です。
論文 参考訳(メタデータ) (2020-06-16T20:25:58Z) - Tracking by Instance Detection: A Meta-Learning Approach [99.66119903655711]
本稿では,高性能トラッカー構築のための3段階の原理的手法を提案する。
我々は2つの現代的な検出器であるRetinaNetとFCOSをベースに、Retina-MAMLとFCOS-MAMLという2つのトラッカーを構築した。
両方のトラッカーは40FPSでリアルタイムに動作します。
論文 参考訳(メタデータ) (2020-04-02T05:55:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。