論文の概要: ReINTEL: A Multimodal Data Challenge for Responsible Information
Identification on Social Network Sites
- arxiv url: http://arxiv.org/abs/2012.08895v1
- Date: Wed, 16 Dec 2020 12:17:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-04 13:12:41.609840
- Title: ReINTEL: A Multimodal Data Challenge for Responsible Information
Identification on Social Network Sites
- Title(参考訳): ReINTEL: ソーシャルネットワーク上での応答性情報識別のためのマルチモーダルデータチャレンジ
- Authors: Duc-Trong Le, Xuan-Son Vu, Nhu-Dung To, Huu-Quang Nguyen, Thuy-Trinh
Nguyen, Linh Le, Anh-Tuan Nguyen, Minh-Duc Hoang, Nghia Le, Huyen Nguyen and
Hoang D. Nguyen
- Abstract要約: 本稿では,ReINTEL Shared Task for Responsible Information Identification on social network sitesについて報告する。
それぞれのテキスト、ビジュアルコンテンツ、メタデータのニュースが与えられた場合、参加者はニュースが信頼できるかどうかを分類する必要がある」。
ベトナムのソーシャルネットワークから集めた1万件以上のニュースを人間に注釈付けした新しいデータセットを紹介します。
- 参考スコア(独自算出の注目度): 7.653131137068877
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper reports on the ReINTEL Shared Task for Responsible Information
Identification on social network sites, which is hosted at the seventh annual
workshop on Vietnamese Language and Speech Processing (VLSP 2020). Given a
piece of news with respective textual, visual content and metadata,
participants are required to classify whether the news is `reliable' or
`unreliable'. In order to generate a fair benchmark, we introduce a novel
human-annotated dataset of over 10,000 news collected from a social network in
Vietnam. All models will be evaluated in terms of AUC-ROC score, a typical
evaluation metric for classification. The competition was run on the Codalab
platform. Within two months, the challenge has attracted over 60 participants
and recorded nearly 1,000 submission entries.
- Abstract(参考訳): 本稿では,ベトナム語・音声処理に関する第7回年次ワークショップ(VLSP 2020)で開催されているソーシャルネットワーク上でのReINTEL Shared Task for Responsible Information Identificationについて報告する。
各テキスト、ビジュアルコンテンツ、メタデータを含むニュースが与えられた場合、参加者はニュースが「信頼性」か「信頼できない」かを分類する必要がある。
公平なベンチマークを生成するために,ベトナムのソーシャルネットワークから収集された1万以上のニュースの,人間の注釈付きデータセットを紹介する。
全てのモデルは、分類の典型的な評価指標であるAUC-ROCスコアで評価される。
コンペはcodalabプラットフォームで行われた。
2ヶ月以内に60人以上の参加者を集め、1000人近い応募者を記録した。
関連論文リスト
- Overview of the VLSP 2022 -- Abmusu Shared Task: A Data Challenge for
Vietnamese Abstractive Multi-document Summarization [0.6827423171182151]
Abmusuの共有タスクの目的は、トピック上の文書の集合に対して抽象的な要約を自動的に作成できる要約システムを開発することである。
ベトナムのニュースから収集した1,839の文書を600のクラスタにまとめた人手によるデータセットを8つのカテゴリに分けて構築する。
モデルは、文書要約問題の最も典型的な評価指標であるtexttROUGE2-F1 スコアで評価され、ランク付けされる。
論文 参考訳(メタデータ) (2023-11-27T04:01:13Z) - DeVAn: Dense Video Annotation for Video-Language Models [68.70692422636313]
実世界のビデオクリップに記述を生成する視覚言語モデルの有効性を評価するために,人間の注釈付きデータセットを提案する。
データセットには、20秒から60秒間の8.5KのYouTubeビデオクリップが含まれており、幅広いトピックや関心事をカバーしている。
論文 参考訳(メタデータ) (2023-10-08T08:02:43Z) - Slovo: Russian Sign Language Dataset [83.93252084624997]
本稿では,クラウドソーシングプラットフォームを用いたロシア手話(RSL)ビデオデータセットであるSlovoについて述べる。
データセットには20,000のFullHDレコードが含まれており、194人の署名者が受信した1,000の独立したRSLジェスチャーに分割されている。
論文 参考訳(メタデータ) (2023-05-23T21:00:42Z) - UrduFake@FIRE2020: Shared Track on Fake News Identification in Urdu [62.6928395368204]
本稿では、ウルドゥー語における偽ニュース検出に関するFIRE 2020における最初の共有タスクの概要について述べる。
目標は、900の注釈付きニュース記事と400のニュース記事からなるデータセットを使って偽ニュースを特定することである。
データセットには、 (i) Health、 (ii) Sports、 (iii) Showbiz、 (iv) Technology、 (v) Businessの5つのドメインのニュースが含まれている。
論文 参考訳(メタデータ) (2022-07-25T03:46:51Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2020 [62.6928395368204]
タスクはバイナリ分類タスクとして設定され、ゴールはリアルニュースとフェイクニュースを区別することである。
トレーニング用に900の注釈付きニュース記事とテスト用に400のニュース記事のデータセットを作成した。
6カ国(インド、中国、エジプト、ドイツ、パキスタン、イギリス)の42チームが登録された。
論文 参考訳(メタデータ) (2022-07-25T03:41:32Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2021 [55.41644538483948]
共有タスクの目標は、コミュニティにこの重要な問題を解決するための効率的な方法を考え出すことを動機付けることです。
トレーニングセットには1300件の注釈付きニュース記事、750件のリアルニュース、550件のフェイクニュース、300件のニュース記事、200件のリアルニュース、100件のフェイクニュースが含まれている。
F1-macroスコアは0.679で、これは過去最高の0.907 F1-macroよりも低かった。
論文 参考訳(メタデータ) (2022-07-11T18:58:36Z) - VLSP 2021 Shared Task: Vietnamese Machine Reading Comprehension [2.348805691644086]
本稿では,共有タスクの組織化,共有タスク参加者の実施方法の概要,その結果について述べる。
ベトナム語に対する MRC タスクと質問応答システムを評価するためのベンチマークデータセット UIT-ViQuAD 2.0 を提供する。
UIT-ViQuAD 2.0データセットは、ベトナムの機械読解、質問応答、質問生成を研究するためのより多くの研究者を動機付けている。
論文 参考訳(メタデータ) (2022-03-22T00:44:41Z) - ReINTEL Challenge 2020: Exploiting Transfer Learning Models for Reliable
Intelligence Identification on Vietnamese Social Network Sites [0.38073142980733]
本稿では,ベトナムのソーシャルネットワークサイト(ReINTEL)における信頼性情報識別システムを提案する。
このタスクでは、VLSP 2020は、信頼性または信頼性の低いラベルで注釈付けされた約6,000のトレーニングニュース/ポストのデータセットを提供し、テストセットはラベルなしで2,000のサンプルで構成されている。
実験では,ReINTELのオーガナイザによるプライベートテストセットのAUCスコアが94.52%に達した。
論文 参考訳(メタデータ) (2021-02-22T06:17:33Z) - A Sentence Cloze Dataset for Chinese Machine Reading Comprehension [64.07894249743767]
我々はSentence Cloze-style Machine Reading (SC-MRC)と呼ばれる新しいタスクを提案する。
提案課題は,複数の空白を持つ文に適切な候補文を埋めることである。
私たちは、SC-MRCタスクの難しさを評価するためにCMRC 2019という中国のデータセットを構築しました。
論文 参考訳(メタデータ) (2020-04-07T04:09:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。