Fugu-MT 論文翻訳(概要): MIMIC: Multimodal Islamophobic Meme Identification and Classification

論文の概要: MIMIC: Multimodal Islamophobic Meme Identification and Classification

arxiv url: http://arxiv.org/abs/2412.00681v1
Date: Sun, 01 Dec 2024 05:44:01 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-04 21:11:22.122829
Title: MIMIC: Multimodal Islamophobic Meme Identification and Classification
Title（参考訳）: MIMIC:マルチモーダル・イスラム主義ミームの識別と分類
Authors: S M Jishanul Islam, Sahid Hossain Mustakim, Sadia Ahmmed, Md. Faiyaz Abdullah Sayeedi, Swapnil Khandoker, Syed Tasdid Azam Dhrubo, Nahid Hossain,
Abstract要約: 反イスラムヘイトスピーチは、文脈に依存した、修辞的なメッセージによって特徴付けられるミームの中に現れた。この研究は、新しいデータセットを提示し、ミーム内の反イスラム憎悪を特定するために特別に調整されたViLT(Vision-and-Language Transformer)に基づく分類器を提案する。
参考スコア（独自算出の注目度）: 1.2647816797166167
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Anti-Muslim hate speech has emerged within memes, characterized by context-dependent and rhetorical messages using text and images that seemingly mimic humor but convey Islamophobic sentiments. This work presents a novel dataset and proposes a classifier based on the Vision-and-Language Transformer (ViLT) specifically tailored to identify anti-Muslim hate within memes by integrating both visual and textual representations. Our model leverages joint modal embeddings between meme images and incorporated text to capture nuanced Islamophobic narratives that are unique to meme culture, providing both high detection accuracy and interoperability.
Abstract（参考訳）: 反イスラム教徒のヘイトスピーチは、ユーモアを模倣するように見えるが、イスラム主義的な感情を伝えるようなテキストと画像を用いた文脈依存的かつ修辞的なメッセージによって、ミームの中に現れてきた。この研究は、新しいデータセットを提示し、視覚とテキストの両方の表現を統合することで、ミーム内の反イスラムヘイトを識別するのに適したViLT(Vision-and-Language Transformer)に基づく分類器を提案する。提案モデルでは,ミーム画像と組み込まれたテキスト間の共同モーダル埋め込みを利用して,ミーム文化特有のニュアンスド・イスラム哲学的物語を捉え,高い検出精度と相互運用性を実現する。

関連論文リスト

MemeReaCon: Probing Contextual Meme Understanding in Large Vision-Language Models [50.2355423914562]
我々は,LVLM(Large Vision Language Models)がミームを本来の文脈でどのように理解するかを評価するために設計された,新しいベンチマークであるMemeReaConを紹介する。私たちは5つのRedditコミュニティからミームを収集し、各ミームの画像、ポストテキスト、ユーザーコメントを一緒に保持しました。モデルは文脈において重要な情報を解釈できないか、あるいはコミュニケーション目的を見越しながら視覚的詳細に過度に焦点を合わせるかのどちらかです。
論文参考訳（メタデータ） (2025-05-23T03:27:23Z)
Detecting and Mitigating Hateful Content in Multimodal Memes with Vision-Language Models [12.929357709840975]
マルチモーダルミームは、個人やグループに対してヘイトスピーチを広めるために悪用されることがある。ヘイトフルなミームを検出するための定義誘導プロンプト手法と、UnHateMemeという名前のミームにおけるヘイトフルなコンテンツを緩和するための統一的なフレームワークを提案する。我々のフレームワークはビジョン・ランゲージ・モデルと統合されており、ヘイトフル・ミームを非ヘイトフル・フォームに変換する強力な能力を示している。
論文参考訳（メタデータ） (2025-04-30T19:48:12Z)
MemeBLIP2: A novel lightweight multimodal system to detect harmful memes [10.174106475035689]
画像とテキストの特徴を効果的に組み合わせることで有害なミームを検出する軽量マルチモーダルシステムであるMemeBLIP2を紹介する。我々は、画像とテキストの表現を共有空間に整列させるモジュールを追加し、より良い分類のためにそれらを融合させることにより、以前の研究に基づいて構築した。その結果,MemeBLIP2は,皮肉な内容や文化的な内容であっても,両モードとも微妙な手がかりを捉えることができることがわかった。
論文参考訳（メタデータ） (2025-04-29T23:41:06Z)
Analyzing Islamophobic Discourse Using Semi-Coded Terms and LLMs [2.5081530863229307]
本稿では,過激主義の社会プラットフォームに浮かぶイスラム教の専門用語(ムズラト,ピスラム,泥スリム,モハメダン,ムジー)を大規模に分析する。これらの用語の多くは、特定の文脈以外では、語彙的に中立的または曖昧に見え、人間のモデレーターと自動化されたシステムが、確実にヘイトスピーチとして識別することが困難になる。
論文参考訳（メタデータ） (2025-03-24T01:41:24Z)
TrojVLM: Backdoor Attack Against Vision Language Models [50.87239635292717]
本研究では、視覚言語モデル(VLM)を対象としたバックドアアタックの最初の調査であるTrojVLMを紹介する。 TrojVLMは、有毒な画像に遭遇したとき、所定のターゲットテキストを出力テキストに挿入する。画像内容のセマンティックな整合性を確保するために,新たなセマンティック保存損失を提案する。
論文参考訳（メタデータ） (2024-09-28T04:37:09Z)
HateSieve: A Contrastive Learning Framework for Detecting and Segmenting Hateful Content in Multimodal Memes [8.97062933976566]
textscHateSieveは、ミーム内の憎しみのある要素の検出とセグメンテーションを強化するために設計されたフレームワークである。 textscHateSieveは、セマンティックなペアのミームを生成するContrastive Meme Generatorを特徴としている。 Hateful Memeでの実証実験では、textscHateSieveはトレーニング可能なパラメータが少なく、既存のLMMを超えるだけでなく、ヘイトフルコンテンツを正確に識別し、分離するための堅牢なメカニズムを提供する。
論文参考訳（メタデータ） (2024-08-11T14:56:06Z)
XMeCap: Meme Caption Generation with Sub-Image Adaptability [53.2509590113364]
社会的な意味や文化的な詳細に深く根ざした噂は、機械にとってユニークな挑戦である。我々は、教師付き微調整と強化学習を採用するtextscXMeCapフレームワークを紹介した。 textscXMeCapは、シングルイメージのミームの平均評価スコアが75.85で、マルチイメージのミームは66.32で、それぞれ3.71%と4.82%で最高のベースラインを上回っている。
論文参考訳（メタデータ） (2024-07-24T10:51:46Z)
Meme-ingful Analysis: Enhanced Understanding of Cyberbullying in Memes Through Multimodal Explanations [48.82168723932981]
Em MultiBully-Exは、コード混在型サイバーいじめミームからマルチモーダルな説明を行うための最初のベンチマークデータセットである。ミームの視覚的およびテキスト的説明のために,コントラスト言語-画像事前学習 (CLIP) アプローチが提案されている。
論文参考訳（メタデータ） (2024-01-18T11:24:30Z)
Mapping Memes to Words for Multimodal Hateful Meme Classification [26.101116761577796]
一部のミームは悪意があり、ヘイトフルなコンテンツを宣伝し、差別を永続させる。マルチモーダルヘイトフルミーム分類のためのISSUESという新しい手法を提案する。提案手法は,Hateful Memes Challenge と HarMeme データセットの最先端化を実現する。
論文参考訳（メタデータ） (2023-10-12T14:38:52Z)
On the Evolution of (Hateful) Memes by Means of Multimodal Contrastive Learning [18.794226796466962]
複数の画像から視覚要素を合成したり、テキスト情報をヘイトフル画像と融合させたりすることで、ヘイトフルミームがどのように生成されるかを研究する。 4chanから抽出したデータセット上の我々のフレームワークを用いて、Happy Merchantミームの3.3K変種を見つける。我々のフレームワークは、ヘイトフルミームの新たな変種をフラグ付けすることで、人間のモデレーターを助けることができると期待している。
論文参考訳（メタデータ） (2022-12-13T13:38:04Z)
Detecting and Understanding Harmful Memes: A Survey [48.135415967633676]
我々は有害なミームに焦点を当てた総合的な調査を行っている。興味深い発見の1つは、多くの有害ミームが実際には研究されていないことである。別の観察では、ミームは異なる言語で再パッケージ化することでグローバルに伝播し、多言語化することもできる。
論文参考訳（メタデータ） (2022-05-09T13:43:27Z)
Caption Enriched Samples for Improving Hateful Memes Detection [78.5136090997431]
憎しみのあるミームの挑戦は、ミームが憎悪であるか否かを決定するのが困難であることを示している。ユニモーダル言語モデルとマルチモーダル視覚言語モデルの両方が人間のパフォーマンスレベルに到達できない。
論文参考訳（メタデータ） (2021-09-22T10:57:51Z)
Memes in the Wild: Assessing the Generalizability of the Hateful Memes Challenge Dataset [47.65948529524281]
Pinterestからヘイトフルで非ヘイトフルなミームを収集して、Facebookデータセットで事前トレーニングされたモデルで、サンプル外のパフォーマンスを評価します。 1) キャプションをOCRで抽出しなければならない,2) ミームは従来のミームよりも多様であり, 会話のスクリーンショットやテキストをプレーンな背景に表示する,という2つの重要な側面がある。
論文参考訳（メタデータ） (2021-07-09T09:04:05Z)
Multimodal Learning for Hateful Memes Detection [6.6881085567421605]
本稿では,画像キャプション処理をミーム検出プロセスに組み込む新しい手法を提案する。本モデルは,Hateful Memes Detection Challengeにおける有望な結果を得る。
論文参考訳（メタデータ） (2020-11-25T16:49:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。