論文の概要: SemIRNet: A Semantic Irony Recognition Network for Multimodal Sarcasm Detection
- arxiv url: http://arxiv.org/abs/2506.14791v1
- Date: Wed, 28 May 2025 16:09:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-22 23:32:14.678645
- Title: SemIRNet: A Semantic Irony Recognition Network for Multimodal Sarcasm Detection
- Title(参考訳): SemIRNet:マルチモーダルサーカスム検出のためのセマンティックアイアンリー認識ネットワーク
- Authors: Jingxuan Zhou, Yuehao Wu, Yibo Zhang, Yeyubei Zhang, Yunchong Liu, Bolin Huang, Chunhong Yuan,
- Abstract要約: SemIRNetはマルチモーダル皮肉検出タスクにおける暗黙的相関を識別するように設計されている。
このモデルの精度とF1値は、既存の最適手法と比較して1.64%と2.88%から88.87%、86.33%向上している。
- 参考スコア(独自算出の注目度): 0.9091698697573423
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aiming at the problem of difficulty in accurately identifying graphical implicit correlations in multimodal irony detection tasks, this paper proposes a Semantic Irony Recognition Network (SemIRNet). The model contains three main innovations: (1) The ConceptNet knowledge base is introduced for the first time to acquire conceptual knowledge, which enhances the model's common-sense reasoning ability; (2) Two cross-modal semantic similarity detection modules at the word level and sample level are designed to model graphic-textual correlations at different granularities; and (3) A contrastive learning loss function is introduced to optimize the spatial distribution of the sample features, which improves the separability of positive and negative samples. Experiments on a publicly available multimodal irony detection benchmark dataset show that the accuracy and F1 value of this model are improved by 1.64% and 2.88% to 88.87% and 86.33%, respectively, compared with the existing optimal methods. Further ablation experiments verify the important role of knowledge fusion and semantic similarity detection in improving the model performance.
- Abstract(参考訳): 本稿では,マルチモーダルアイロン検出タスクにおける暗黙的相関を正確に識別することの難しさに着目し,セマンティックアイアン認識ネットワーク(Semantic Irony Recognition Network,SemIRNet)を提案する。
このモデルには,(1)概念ネット知識ベースを初めて導入して概念知識を習得し,モデルの常識的推論能力を高める,(2)単語レベルとサンプルレベルの2つの相互モーダルな意味的類似性検出モジュールを,異なる粒度で図形的・テクスチャ的相関をモデル化するように設計する,(3)サンプル特徴の空間分布を最適化し,正と負のサンプルの分離性を向上する,対照的な学習損失関数を導入する,という3つの革新が含まれている。
公開されているマルチモーダル皮肉検出ベンチマークデータセットの実験では、既存の最適手法と比較して、このモデルの精度とF1値は1.64%改善され、2.88%が88.87%、86.33%となった。
さらにアブレーション実験により,モデルの性能向上における知識融合と意味的類似性の検出の重要性が検証された。
関連論文リスト
- Pose Matters: Evaluating Vision Transformers and CNNs for Human Action Recognition on Small COCO Subsets [0.0]
本研究では,COCO画像コーパスの3クラスサブセットを用いた人間の認識について検討する。
バイナリビジョン変換器(ViT)は90%の平均テスト精度を達成した。
論文 参考訳(メタデータ) (2025-06-13T11:16:50Z) - Interpretable Failure Detection with Human-Level Concepts [9.086637005449672]
この研究は、モデルが失敗したときを確実に検出し、理由を透過的に解釈する、という、2つの目的のために人間レベルの概念を活用する革新的な戦略を導入している。
入力画像に対する概念アクティベーションの順序付けに基づく簡易かつ高効率な手法を提案する。
論文 参考訳(メタデータ) (2025-02-07T19:19:40Z) - Decoupled and Interactive Regression Modeling for High-performance One-stage 3D Object Detection [8.531052087985097]
回帰タスクにおけるバウンディングボックスモデリングの不十分さは、1段階の3Dオブジェクト検出の性能を制約する。
一段階検出のための疎結合・インタラクティブ回帰モデリング(DIRM)を提案する。
論文 参考訳(メタデータ) (2024-09-01T10:47:22Z) - Improving Network Interpretability via Explanation Consistency Evaluation [56.14036428778861]
本稿では、より説明可能なアクティベーションヒートマップを取得し、同時にモデル性能を向上させるフレームワークを提案する。
具体的には、モデル学習において、トレーニングサンプルを適応的に重み付けするために、新しいメトリクス、すなわち説明整合性を導入する。
そこで,本フレームワークは,これらのトレーニングサンプルに深い注意を払ってモデル学習を促進する。
論文 参考訳(メタデータ) (2024-08-08T17:20:08Z) - Feature graph construction with static features for malware detection [2.6148103955115043]
アプリケーションを特徴付けるために,機能グラフに基づくマルウェア検出手法であるMFGraphを導入する。
マルウェア検出タスクにおいて,AUCスコア0.98756を達成し,他のベースラインモデルよりも優れていることを示す。
MFGraphのAUCスコアは1年でわずか5.884%減少し、コンセプトドリフトの影響を受けていないことを示している。
論文 参考訳(メタデータ) (2024-04-25T06:54:32Z) - Co-guiding for Multi-intent Spoken Language Understanding [53.30511968323911]
本稿では,2つのタスク間の相互指導を実現するための2段階のフレームワークを実装した,コガイドネットと呼ばれる新しいモデルを提案する。
第1段階では,単一タスクによる教師付きコントラスト学習を提案し,第2段階ではコガイドによる教師付きコントラスト学習を提案する。
マルチインテリジェントSLU実験の結果,我々のモデルは既存のモデルよりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-22T08:06:22Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Anomaly Detection on Attributed Networks via Contrastive Self-Supervised
Learning [50.24174211654775]
本論文では,アトリビュートネットワーク上の異常検出のためのコントラスト型自己監視学習フレームワークを提案する。
このフレームワークは、新しいタイプのコントラストインスタンスペアをサンプリングすることで、ネットワークデータからのローカル情報を完全に活用します。
高次元特性と局所構造から情報埋め込みを学習するグラフニューラルネットワークに基づくコントラスト学習モデルを提案する。
論文 参考訳(メタデータ) (2021-02-27T03:17:20Z) - Firearm Detection via Convolutional Neural Networks: Comparing a
Semantic Segmentation Model Against End-to-End Solutions [68.8204255655161]
武器の脅威検出とライブビデオからの攻撃的な行動は、潜在的に致命的な事故の迅速検出と予防に使用できる。
これを実現する一つの方法は、人工知能と、特に画像分析のための機械学習を使用することです。
従来のモノリシックなエンド・ツー・エンドのディープラーニングモデルと、セマンティクスセグメンテーションによって火花を検知する単純なニューラルネットワークのアンサンブルに基づく前述したモデルを比較した。
論文 参考訳(メタデータ) (2020-12-17T15:19:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。