論文の概要: LIIR at SemEval-2021 task 6: Detection of Persuasion Techniques In Texts
and Images using CLIP features
- arxiv url: http://arxiv.org/abs/2105.14774v1
- Date: Mon, 31 May 2021 08:16:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-02 04:11:03.885675
- Title: LIIR at SemEval-2021 task 6: Detection of Persuasion Techniques In Texts
and Images using CLIP features
- Title(参考訳): SemEval-2021 Task 6: CLIP機能を用いたテキスト・画像中の説得手法の検出
- Authors: Erfan Ghadery, Damien Sileo, Marie-Francine Moens
- Abstract要約: マルチモーダルコンテンツ(ミーム)における説得手法検出のためのアプローチについて述べる。
本システムは,事前学習型マルチモーダルモデル(CLIP)と連鎖型分類器を組み合わせたシステムである。
また,データ拡張手法によりデータを強化することを提案する。
- 参考スコア(独自算出の注目度): 22.58596307119695
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We describe our approach for SemEval-2021 task 6 on detection of persuasion
techniques in multimodal content (memes). Our system combines pretrained
multimodal models (CLIP) and chained classifiers. Also, we propose to enrich
the data by a data augmentation technique. Our submission achieves a rank of
8/16 in terms of F1-micro and 9/16 with F1-macro on the test set.
- Abstract(参考訳): 本稿では,SemEval-2021タスク6におけるマルチモーダルコンテンツ(ミーム)における説得手法の検出について述べる。
本システムは,事前学習型マルチモーダルモデル(CLIP)と連鎖型分類器を組み合わせる。
また,データ拡張手法によってデータを強化することを提案する。
F1-microのランクは8/16で、F1-macroは9/16である。
関連論文リスト
- Multimodal Multilabel Classification by CLIP [3.1002416427168304]
マルチモーダルマルチラベル分類(MMC)は、2つのデータソースを扱う学習アルゴリズムの設計を目的とした課題である。
本稿では,特徴抽出器としてContrastive Language-Image Pre-Training(CLIP)を利用する新しい手法を利用する。
論文 参考訳(メタデータ) (2024-06-23T15:28:07Z) - SmurfCat at SemEval-2024 Task 6: Leveraging Synthetic Data for Hallucination Detection [51.99159169107426]
本稿では,SemEval-2024幻覚検出タスクのための新しいシステムを提案する。
我々の調査は、モデル予測と基準基準を比較するための様々な戦略にまたがっている。
強力なパフォーマンス指標を示す3つの異なる方法を紹介します。
論文 参考訳(メタデータ) (2024-04-09T09:03:44Z) - PetKaz at SemEval-2024 Task 8: Can Linguistics Capture the Specifics of LLM-generated Text? [4.463184061618504]
我々はSemEval-2024タスク8「マルチジェネレータ、マルチドメイン、ブラックボックスマシン生成テキスト検出」を提出する。
我々のアプローチは、RoBERTaベースからの埋め込みと多様性機能の組み合わせに依存し、再サンプリングされたトレーニングセットを使用する。
その結果,本手法は未知のモデルや領域にまたがって一般化可能であり,精度は0.91であることがわかった。
論文 参考訳(メタデータ) (2024-04-08T13:05:02Z) - MasonTigers at SemEval-2024 Task 8: Performance Analysis of Transformer-based Models on Machine-Generated Text Detection [0.0]
タスクは、バイナリ人文対マシン生成テキスト分類(トラックA)、マルチウェイマシン生成テキスト分類(トラックB)、ヒューマン・マシン混合テキスト検出(トラックC)を含む。
本稿では,主に識別器変換器モデルのアンサンブルと,特定の事例における文変換器と統計的機械学習のアプローチを利用する。
論文 参考訳(メタデータ) (2024-03-22T06:47:28Z) - Exploiting Modality-Specific Features For Multi-Modal Manipulation
Detection And Grounding [54.49214267905562]
マルチモーダルな操作検出とグラウンド処理のためのトランスフォーマーベースのフレームワークを構築する。
本フレームワークは,マルチモーダルアライメントの能力を維持しながら,モダリティ特有の特徴を同時に探求する。
本稿では,グローバルな文脈的キューを各モーダル内に適応的に集約する暗黙的操作クエリ(IMQ)を提案する。
論文 参考訳(メタデータ) (2023-09-22T06:55:41Z) - MOCA: Self-supervised Representation Learning by Predicting Masked Online Codebook Assignments [72.6405488990753]
自己教師付き学習は、ビジョントランスフォーマーネットワークの欲求を軽減できる。
所望のプロパティを統一する単段および単段のMOCAを提案する。
我々は,様々な評価プロトコルにおいて,低照度設定と強力な実験結果に対して,最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2023-07-18T15:46:20Z) - Transferring Pre-trained Multimodal Representations with Cross-modal
Similarity Matching [49.730741713652435]
本論文では,大規模な事前学習型マルチモーダルモデルの表現を,小さなターゲットモデルに効果的に転送する手法を提案する。
教師なしトランスファーでは,教師モデルの表現を学習できるクロスモーダル類似性マッチング(CSM)を導入する。
テキストプロンプトをよりよくエンコードするために、入力テキストプロンプトの語彙的曖昧さを軽減するコンテキストベースのプロンプト拡張(CPA)を設計する。
論文 参考訳(メタデータ) (2023-01-07T17:24:11Z) - Multi-scale Transformer Network with Edge-aware Pre-training for
Cross-Modality MR Image Synthesis [52.41439725865149]
クロスモダリティ磁気共鳴(MR)画像合成は、与えられたモダリティから欠落するモダリティを生成するために用いられる。
既存の(教師付き学習)手法は、効果的な合成モデルを訓練するために、多くのペア化されたマルチモーダルデータを必要とすることが多い。
マルチスケールトランスフォーマーネットワーク(MT-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T11:40:40Z) - Volta at SemEval-2021 Task 6: Towards Detecting Persuasive Texts and
Images using Textual and Multimodal Ensemble [7.817598216459955]
そこで本研究では, BERT をベースとしたモデルに対して, 異なるモダリティで伝達学習手法を提案する。
57.0, 48.2, 52.1のF1スコアを対応するサブタスクで達成する。
論文 参考訳(メタデータ) (2021-06-01T05:41:03Z) - Inno at SemEval-2020 Task 11: Leveraging Pure Transformer for
Multi-Class Propaganda Detection [0.701955947252181]
本稿では,SEMEVAL 2020タスク11「ニュース記事におけるプロパガンダ技術の検出」に対するチーム"Inno"のソリューションを提案する。
第2サブタスクの目的は、ニュース記事データセットで与えられた18のプロパガンダ技法の1つに対応するテキストセグメントを分類することである。
論文 参考訳(メタデータ) (2020-08-26T14:42:14Z) - SCAN: Learning to Classify Images without Labels [73.69513783788622]
機能学習とクラスタリングを分離する2段階のアプローチを提唱する。
表現学習からの自己教師型タスクを用いて意味論的意味のある特徴を得る。
我々は、ImageNet上で有望な結果を得、低データ体制下では、いくつかの半教師付き学習方法より優れています。
論文 参考訳(メタデータ) (2020-05-25T18:12:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。