論文の概要: CHASM: Unveiling Covert Advertisements on Chinese Social Media
- arxiv url: http://arxiv.org/abs/2604.20511v1
- Date: Wed, 22 Apr 2026 12:53:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:11.127949
- Title: CHASM: Unveiling Covert Advertisements on Chinese Social Media
- Title(参考訳): CHASM:中国のソーシャルメディアでカバーを公開
- Authors: Jingyi Zheng, Tianyi Hu, Yule Liu, Zhen Sun, Zongmin Zhang, Zifan Peng, Wenhan Dong, Xinlei He,
- Abstract要約: CHASMは、ソーシャルメディア上の隠蔽広告を検出する上で、MLLM(Multimodal Large Language Models)の能力を評価するために設計された第一種データセットである。
CHASMは、中国のソーシャルメディアプラットフォームRednoteの現実シナリオに基づいて、4,992インスタンスで構成される高品質で匿名化された、手動でキュレートされたデータセットである。
その結果、ゼロショットとインコンテキストの両方の学習環境下では、現在のMLLMでは、隠蔽広告を検出するのに十分な信頼性が得られていないことがわかった。
- 参考スコア(独自算出の注目度): 14.328587848128201
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current benchmarks for evaluating large language models (LLMs) in social media moderation completely overlook a serious threat: covert advertisements, which disguise themselves as regular posts to deceive and mislead consumers into making purchases, leading to significant ethical and legal concerns. In this paper, we present the CHASM, a first-of-its-kind dataset designed to evaluate the capability of Multimodal Large Language Models (MLLMs) in detecting covert advertisements on social media. CHASM is a high-quality, anonymized, manually curated dataset consisting of 4,992 instances, based on real-world scenarios from the Chinese social media platform Rednote. The dataset was collected and annotated under strict privacy protection and quality control protocols. It includes many product experience sharing posts that closely resemble covert advertisements, making the dataset particularly challenging.The results show that under both zero-shot and in-context learning settings, none of the current MLLMs are sufficiently reliable for detecting covert advertisements.Our further experiments revealed that fine-tuning open-source MLLMs on our dataset yielded noticeable performance gains. However, significant challenges persist, such as detecting subtle cues in comments and differences in visual and textual structures.We provide in-depth error analysis and outline future research directions. We hope our study can serve as a call for the research community and platform moderators to develop more precise defenses against this emerging threat.
- Abstract(参考訳): ソーシャルメディアのモデレーションにおける大きな言語モデル(LLM)を評価するための現在のベンチマークは、深刻な脅威を完全に見落としている。
本稿では,MLLM(Multimodal Large Language Models)がソーシャルメディア上の隠蔽広告を検出する能力を評価するために設計された,第一種データセットであるCHASMを提案する。
CHASMは、中国のソーシャルメディアプラットフォームRednoteの現実シナリオに基づいて、4,992インスタンスで構成される高品質で匿名化された、手動でキュレートされたデータセットである。
データセットは厳格なプライバシ保護と品質管理プロトコルの下で収集され、注釈付けされた。
その結果、ゼロショットとインコンテクストの両方の学習環境下では、現在のMLLMは、隠蔽広告を検出するのに十分な信頼性を持っていないことが示され、我々の実験により、データセット上の微調整されたオープンソースMLLMが顕著なパフォーマンス向上をもたらしたことが判明した。
しかし,コメントの微妙な手がかりの検出や視覚的・テキスト的構造の違いなど,重要な課題が続いている。
今回の研究は、研究コミュニティやプラットフォームモデレーターが、この新たな脅威に対してより正確な防御策を開発するための助けになることを期待しています。
関連論文リスト
- ZoFia: Zero-Shot Fake News Detection with Entity-Guided Retrieval and Multi-LLM Interaction [14.012874564599272]
ZoFiaは、2段階のゼロショットフェイクニュース検出フレームワークである。
まず,ニュースコンテンツにおけるエンティティの重要性を定量化するために階層的サリエンスを導入する。
そこで我々はSC-MMRアルゴリズムを提案し,情報的かつ多様なキーワード群を効果的に選択する。
論文 参考訳(メタデータ) (2025-11-03T03:29:42Z) - Profiling News Media for Factuality and Bias Using LLMs and the Fact-Checking Methodology of Human Experts [29.95198868148809]
本稿では,プロのファクトチェッカーがアウトレット全体の事実と政治的偏見を評価するために使用する基準をエミュレートする新しい手法を提案する。
メディアの人気と地域がモデル性能に与える影響を詳細に分析する。
論文 参考訳(メタデータ) (2025-06-14T15:49:20Z) - Evaluating and Improving Robustness in Large Language Models: A Survey and Future Directions [23.024212585005714]
大規模言語モデル(LLM)は,近年,自然言語の理解と生成能力から注目されている。
本稿では,この分野に関する概念や手法の包括的用語を提供し,コミュニティの促進を目的とする。
論文 参考訳(メタデータ) (2025-06-08T16:20:12Z) - An exploration of features to improve the generalisability of fake news detection models [0.0]
既存のNLPおよび教師付き機械学習メソッドは、クロスバリデーションの下ではうまく機能するが、データセットをまたいだ一般化に苦慮する。
この問題は、記事がパブリッシャに基づいてラベル付けされる、粗いラベル付きトレーニングデータに起因している。
本研究は, 粗いラベル付きデータから意味のある特徴を抽出し, 実世界のロバスト性を向上させることを実証した。
論文 参考訳(メタデータ) (2025-02-27T17:26:56Z) - LLM-PBE: Assessing Data Privacy in Large Language Models [111.58198436835036]
大規模言語モデル(LLM)は多くのドメインに不可欠なものとなり、データ管理、マイニング、分析におけるアプリケーションを大幅に進歩させた。
この問題の批判的な性質にもかかわらず、LLMにおけるデータプライバシのリスクを総合的に評価する文献は存在しない。
本稿では,LLMにおけるデータプライバシリスクの体系的評価を目的としたツールキットであるLLM-PBEを紹介する。
論文 参考訳(メタデータ) (2024-08-23T01:37:29Z) - MultiTrust: A Comprehensive Benchmark Towards Trustworthy Multimodal Large Language Models [51.19622266249408]
MultiTrustはMLLMの信頼性に関する最初の総合的で統一されたベンチマークである。
我々のベンチマークでは、マルチモーダルリスクとクロスモーダルインパクトの両方に対処する厳格な評価戦略を採用している。
21の近代MLLMによる大規模な実験は、これまで調査されなかった信頼性の問題とリスクを明らかにしている。
論文 参考訳(メタデータ) (2024-06-11T08:38:13Z) - A Survey on Detection of LLMs-Generated Content [97.87912800179531]
LLMの生成する内容を検出する能力が最重要視されている。
既存の検出戦略とベンチマークの詳細な概要を提供する。
また、様々な攻撃から守るための多面的アプローチの必要性を示唆する。
論文 参考訳(メタデータ) (2023-10-24T09:10:26Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。