論文の概要: ICPR 2024 Competition on Multilingual Claim-Span Identification
- arxiv url: http://arxiv.org/abs/2411.19579v1
- Date: Fri, 29 Nov 2024 09:50:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-02 15:20:49.391241
- Title: ICPR 2024 Competition on Multilingual Claim-Span Identification
- Title(参考訳): ICPR 2024による多言語クレームスパン識別の競争
- Authors: Soham Poddar, Biswajit Paul, Moumita Basu, Saptarshi Ghosh,
- Abstract要約: 膨大な数のソーシャルメディア投稿を考えると、クレームを識別するタスクは自動化される必要がある。
このコンペティションは、テキストが与えられた場合、クレームに対応する部分/スパンを識別する「Claim Span Identification」というタスクを扱う。
この競争のために、HECSIと呼ばれる新たに開発されたデータセットを使用し、英語で約8Kの投稿とヒンディー語で約8Kの投稿と、人間のアノテーションでマークされたクレームスパンを含む。
- 参考スコア(独自算出の注目度): 2.621722915752911
- License:
- Abstract: A lot of claims are made in social media posts, which may contain misinformation or fake news. Hence, it is crucial to identify claims as a first step towards claim verification. Given the huge number of social media posts, the task of identifying claims needs to be automated. This competition deals with the task of 'Claim Span Identification' in which, given a text, parts / spans that correspond to claims are to be identified. This task is more challenging than the traditional binary classification of text into claim or not-claim, and requires state-of-the-art methods in Pattern Recognition, Natural Language Processing and Machine Learning. For this competition, we used a newly developed dataset called HECSI containing about 8K posts in English and about 8K posts in Hindi with claim-spans marked by human annotators. This paper gives an overview of the competition, and the solutions developed by the participating teams.
- Abstract(参考訳): 多くの主張は、誤報やフェイクニュースを含むかもしれないソーシャルメディアの投稿でなされている。
したがって、クレーム検証への第一歩としてクレームを識別することが不可欠である。
膨大な数のソーシャルメディア投稿を考えると、クレームを識別するタスクは自動化される必要がある。
このコンペティションは、テキストが与えられた場合、クレームに対応する部分/スパンを識別する「Claim Span Identification」というタスクを扱う。
このタスクは、従来のバイナリのテキストをクレームまたはクレームに分類するよりも難しく、パターン認識、自然言語処理、機械学習に最先端の手法を必要とする。
この競争のために、HECSIと呼ばれる新たに開発されたデータセットを使用し、英語で約8Kの投稿とヒンディー語で約8Kの投稿と、人間のアノテーションでマークされたクレームスパンを含む。
本稿では,コンペティションの概要と,参加チームが開発したソリューションについて述べる。
関連論文リスト
- ACE: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
我々は、エンドツーエンドのクロスモーダル検索のための先駆的なジェネリッククロスモーダル rEtrieval framework (ACE) を提案する。
ACEは、クロスモーダル検索における最先端のパフォーマンスを達成し、Recall@1の強いベースラインを平均15.27%上回る。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - Asking Multimodal Clarifying Questions in Mixed-Initiative
Conversational Search [89.1772985740272]
混合開始型会話検索システムでは、質問を明確にすることで、意図を単一のクエリで表現するのに苦労するユーザを支援する。
マルチモーダル情報が関係するシナリオでは、非テクスチャ情報を用いることで、明確化のプロセスを改善することができると仮定する。
質問を明確にする4k以上のマルチモーダルを含むMelonというデータセットを収集し、14k以上の画像で濃縮する。
クエリの明確化フェーズにおけるマルチモーダルコンテンツの重要性を理解するために,いくつかの解析を行った。
論文 参考訳(メタデータ) (2024-02-12T16:04:01Z) - Claim Detection for Automated Fact-checking: A Survey on Monolingual, Multilingual and Cross-Lingual Research [7.242609314791262]
本稿では,現状の多言語クレーム検出研究を,問題の3つの重要な要因,妥当性,優先性,類似性に分類する。
本稿では,既存の多言語データセットの概要と課題について概説し,今後の発展の可能性を提案する。
論文 参考訳(メタデータ) (2024-01-22T14:17:03Z) - Overview of the CLAIMSCAN-2023: Uncovering Truth in Social Media through
Claim Detection and Identification of Claim Spans [36.21314290592325]
ソーシャルメディアプラットフォームは、偽情報、プロパガンダ、フェイクニュースを広める人々の避難所になっている。
ソーシャルメディアの投稿を自動的に識別し、そのクレームを確認し、信用と偽のクレームを区別することが重要になっている。
主な目的は、ソーシャルメディア投稿がクレームを構成するかどうかを判断するタスクAと、クレームを構成するポスト内の単語やフレーズを正確に識別するタスクBである。
論文 参考訳(メタデータ) (2023-10-30T04:57:41Z) - From Chaos to Clarity: Claim Normalization to Empower Fact-Checking [57.024192702939736]
Claim Normalization(別名 ClaimNorm)は、複雑でノイズの多いソーシャルメディア投稿を、より単純で分かりやすい形式に分解することを目的としている。
本稿では,チェーン・オブ・ソートとクレーム・チェック・バシネス推定を利用した先駆的アプローチであるCACNを提案する。
実験により, CACNは様々な評価尺度において, いくつかの基準値を上回る性能を示した。
論文 参考訳(メタデータ) (2023-10-22T16:07:06Z) - ICDAR 2023 Competition on Hierarchical Text Detection and Recognition [60.68100769639923]
このコンペティションは、テキストの検出と認識を共同で行うディープラーニングモデルとシステムの研究を促進することを目的としている。
提案するコンペティション組織の詳細について,タスク,データセット,評価,スケジュールなどを紹介する。
大会期間中(2023年1月2日から2023年4月1日まで)、20チーム以上から少なくとも50人が提案された2つのタスクで応募された。
論文 参考訳(メタデータ) (2023-05-16T18:56:12Z) - Summary on the ISCSLP 2022 Chinese-English Code-Switching ASR Challenge [25.69349931845173]
ISCSLP 2022 CSASRチャレンジでは、TAL_CSASRコーパスとMagicData-RAMCコーパス、参加者向けの開発とテストセットの2つのトレーニングセットが提供された。
40以上のチームがこの挑戦に参加し、勝者チームは16.70%の混合誤差率(MER)をテストセットで達成した。
本稿では、データセット、関連するベースラインシステム、および要件を説明し、CSASRチャレンジ結果と提案システムで使用される主要なテクニックとトリックを要約する。
論文 参考訳(メタデータ) (2022-10-12T11:05:13Z) - RuArg-2022: Argument Mining Evaluation [69.87149207721035]
本稿は、ロシア語テキストを扱う議論分析システムの最初のコンペティションの主催者の報告である。
新型コロナウイルスの感染拡大に伴う3つの話題について、9,550文(ソーシャルメディア投稿記事)のコーパスを用意した。
両タスクで第一位を獲得したシステムは、BERTアーキテクチャのNLI(Natural Language Inference)変種を使用した。
論文 参考訳(メタデータ) (2022-06-18T17:13:37Z) - IAM: A Comprehensive and Large-Scale Dataset for Integrated Argument
Mining Tasks [59.457948080207174]
本稿では,一連の議論マイニングタスクに適用可能なIAMという,包括的で大規模なデータセットを提案する。
データセットの70k近い文は、引数特性に基づいて完全に注釈付けされている。
議論準備プロセスに関連する2つの新しい統合された議論マイニングタスクを提案する。(1) 姿勢分類付きクレーム抽出(CESC)と(2) クレーム・エビデンス・ペア抽出(CEPE)である。
論文 参考訳(メタデータ) (2022-03-23T08:07:32Z) - ReINTEL: A Multimodal Data Challenge for Responsible Information
Identification on Social Network Sites [7.653131137068877]
本稿では,ReINTEL Shared Task for Responsible Information Identification on social network sitesについて報告する。
それぞれのテキスト、ビジュアルコンテンツ、メタデータのニュースが与えられた場合、参加者はニュースが信頼できるかどうかを分類する必要がある」。
ベトナムのソーシャルネットワークから集めた1万件以上のニュースを人間に注釈付けした新しいデータセットを紹介します。
論文 参考訳(メタデータ) (2020-12-16T12:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。