論文の概要: Towards Multimodal Metaphor Understanding: A Chinese Dataset and Model for Metaphor Mapping Identification
- arxiv url: http://arxiv.org/abs/2501.02434v1
- Date: Sun, 05 Jan 2025 04:15:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:07:42.297185
- Title: Towards Multimodal Metaphor Understanding: A Chinese Dataset and Model for Metaphor Mapping Identification
- Title(参考訳): マルチモーダルメタファー理解に向けて--メタファーマッピング同定のための中国語データセットとモデル
- Authors: Dongyu Zhang, Shengcheng Yin, Jingwei Yu, Zhiyao Wu, Zhen Li, Chengpei Xu, Xiaoxia Wang, Feng Xia,
- Abstract要約: 我々は、特定のターゲットドメインとソースドメインのアノテーションを含む中国のマルチモーダルメタファー広告データセット(CM3D)を開発した。
我々は,これらのマッピングを識別するための認知過程をシミュレートする,CPMMIM (Chain-of-NLP) Prompting-based Metaphor Mapping Identification Model) を提案する。
- 参考スコア(独自算出の注目度): 9.08615188602226
- License:
- Abstract: Metaphors play a crucial role in human communication, yet their comprehension remains a significant challenge for natural language processing (NLP) due to the cognitive complexity involved. According to Conceptual Metaphor Theory (CMT), metaphors map a target domain onto a source domain, and understanding this mapping is essential for grasping the nature of metaphors. While existing NLP research has focused on tasks like metaphor detection and sentiment analysis of metaphorical expressions, there has been limited attention to the intricate process of identifying the mappings between source and target domains. Moreover, non-English multimodal metaphor resources remain largely neglected in the literature, hindering a deeper understanding of the key elements involved in metaphor interpretation. To address this gap, we developed a Chinese multimodal metaphor advertisement dataset (namely CM3D) that includes annotations of specific target and source domains. This dataset aims to foster further research into metaphor comprehension, particularly in non-English languages. Furthermore, we propose a Chain-of-Thought (CoT) Prompting-based Metaphor Mapping Identification Model (CPMMIM), which simulates the human cognitive process for identifying these mappings. Drawing inspiration from CoT reasoning and Bi-Level Optimization (BLO), we treat the task as a hierarchical identification problem, enabling more accurate and interpretable metaphor mapping. Our experimental results demonstrate the effectiveness of CPMMIM, highlighting its potential for advancing metaphor comprehension in NLP. Our dataset and code are both publicly available to encourage further advancements in this field.
- Abstract(参考訳): メタファーは人間のコミュニケーションにおいて重要な役割を担っているが、その理解は認知の複雑さのために自然言語処理(NLP)において重要な課題である。
概念メタファー理論 (Conceptual Metaphor Theory, CMT) によれば、メタファーは対象ドメインをソースドメインにマッピングし、このマッピングを理解することはメタファーの性質を理解するのに不可欠である。
既存のNLP研究はメタファー検出や比喩表現の感情分析といったタスクに重点を置いているが、ソースドメインとターゲットドメインのマッピングを識別する複雑なプロセスには注目が集まっていない。
さらに、非英語の多モーダルな比喩資源は文学において無視され続けており、比喩解釈に関わる重要な要素の深い理解を妨げる。
このギャップに対処するため、特定のターゲットドメインとソースドメインのアノテーションを含む中国のマルチモーダルメタファー広告データセット(CM3D)を開発した。
このデータセットは、特に非英語言語におけるメタファー理解のさらなる研究を促進することを目的としている。
さらに,これらのマッピングを識別するための認知過程をシミュレートする,CPMMIM (Chain-of-Thought) Prompting-based Metaphor Mapping Identification Model) を提案する。
CoT推論とBLO(Bi-Level Optimization)のインスピレーションを得て,タスクを階層的識別問題として扱い,より正確かつ解釈可能なメタファマッピングを実現する。
実験の結果,CPMMIMの有効性が示され,NLPにおけるメタファー理解の促進の可能性を明らかにした。
私たちのデータセットとコードはどちらも、この分野のさらなる進歩を促進するために公開されています。
関連論文リスト
- Meta4XNLI: A Crosslingual Parallel Corpus for Metaphor Detection and Interpretation [6.0158981171030685]
本稿ではスペイン語と英語の両方でメタファアノテーションを含むメタファ検出と解釈のタスクのための新しい並列データセットを提案する。
言語モデルのメタファ識別と理解能力について,一言語間実験と言語間実験による検討を行った。
論文 参考訳(メタデータ) (2024-04-10T14:44:48Z) - ContrastWSD: Enhancing Metaphor Detection with Word Sense Disambiguation Following the Metaphor Identification Procedure [1.03590082373586]
メタファー識別法(MIP)と単語センス曖昧化(WSD)を統合したRoBERTaを用いたメタファメタメタファ検出モデルを提案する。
WSDモデルから派生した単語感覚を利用することで、メタファ検出プロセスを強化し、他の手法より優れる。
我々は,様々なベンチマークデータセットに対するアプローチを評価し,それを強力なベースラインと比較し,メタファ検出の促進効果を示す。
論文 参考訳(メタデータ) (2023-09-06T15:41:38Z) - Multi-source Semantic Graph-based Multimodal Sarcasm Explanation
Generation [53.97962603641629]
本稿では,mulTi-source sEmantic grAph-based Multimodal sarcasm explanation scheme, TEAMを提案する。
TEAMは、入力画像から従来のグローバルな視覚的特徴の代わりに、オブジェクトレベルのセマンティックメタデータを抽出する。
TEAMはマルチソース意味関係を包括的に特徴付けるマルチソース意味グラフを導入している。
論文 参考訳(メタデータ) (2023-06-29T03:26:10Z) - DiPlomat: A Dialogue Dataset for Situated Pragmatic Reasoning [89.92601337474954]
プラグマティック推論は、実生活における会話でしばしば起こる暗黙の意味を解読する上で重要な役割を担っている。
そこで我々は,現実的な推論と会話理解の場所に関するマシンの能力のベンチマークを目的とした,新しい挑戦であるDiPlomatを紹介した。
論文 参考訳(メタデータ) (2023-06-15T10:41:23Z) - Metaphorical Polysemy Detection: Conventional Metaphor meets Word Sense
Disambiguation [9.860944032009847]
言語学者は、NLPのメタファ検出タスクが考慮しない、新しいメタファと従来のメタファを区別する。
本稿では,従来のメタファをこのような方法で扱う際の限界について検討する。
我々は、英語のWordNetにおける従来のメタファーを識別する最初のMPDモデルを開発した。
論文 参考訳(メタデータ) (2022-12-16T10:39:22Z) - Metaphors in Pre-Trained Language Models: Probing and Generalization
Across Datasets and Languages [6.7126373378083715]
大規模事前学習言語モデル(PLM)は、NLPシステムに有用な比喩的知識を符号化する。
本稿では,複数のメタファ検出データセットと4言語について研究する。
実験の結果,PLMにおける文脈表現はメタファー的知識をコード化しており,その大部分は中層にあることが示唆された。
論文 参考訳(メタデータ) (2022-03-26T19:05:24Z) - Exploiting BERT For Multimodal Target SentimentClassification Through
Input Space Translation [75.82110684355979]
オブジェクト認識変換器を用いて入力空間内の画像を変換する2ストリームモデルを提案する。
次に、翻訳を利用して、言語モデルに多モーダル情報を提供する補助文を構築する。
2つのマルチモーダルTwitterデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-08-03T18:02:38Z) - Metaphor Generation with Conceptual Mappings [58.61307123799594]
我々は、関連する動詞を置き換えることで、リテラル表現を与えられた比喩文を生成することを目指している。
本稿では,認知領域間の概念マッピングを符号化することで生成過程を制御することを提案する。
教師なしCM-Lexモデルは,近年のディープラーニングメタファ生成システムと競合することを示す。
論文 参考訳(メタデータ) (2021-06-02T15:27:05Z) - Linguistic Structure Guided Context Modeling for Referring Image
Segmentation [61.701577239317785]
本稿では,マルチモーダルコンテキストを相互モーダル相互作用によりモデル化する「ガザ・プロパゲート・ディストリビュート」方式を提案する。
我々のLSCMモジュールは依存パーシングツリーワードグラフ(DPT-WG)を構築し、文の有効なマルチモーダルコンテキストを含むようにすべての単語を誘導する。
論文 参考訳(メタデータ) (2020-10-01T16:03:51Z) - Referring Image Segmentation via Cross-Modal Progressive Comprehension [94.70482302324704]
画像セグメンテーションの参照は、自然言語表現で与えられた記述によく一致するエンティティの前景マスクをセグメンテーションすることを目的としている。
従来のアプローチでは、暗黙的な特徴相互作用と視覚的モダリティと言語的モダリティの融合を用いてこの問題に対処していた。
本稿では,この課題に効果的に対応するために,Cross-Modal Progressive (CMPC) モジュールと Text-Guided Feature Exchange (TGFE) モジュールを提案する。
論文 参考訳(メタデータ) (2020-10-01T16:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。