論文の概要: Explainable Multimodal Aspect-Based Sentiment Analysis with Dependency-guided Large Language Model
- arxiv url: http://arxiv.org/abs/2601.06848v1
- Date: Sun, 11 Jan 2026 10:41:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.028843
- Title: Explainable Multimodal Aspect-Based Sentiment Analysis with Dependency-guided Large Language Model
- Title(参考訳): 依存誘導大言語モデルを用いた説明可能なマルチモーダルアスペクトに基づく感性分析
- Authors: Zhongzheng Wang, Yuanhe Tian, Hongzhi Wang, Yan Song,
- Abstract要約: マルチモーダル・アスペクトベース感情分析(MABSA)は、テキストと視覚情報を共同でモデル化することで、アスペクトレベルの感情を識別することを目的としている。
我々はMABSAを生成的かつ説明可能なタスクとして再構築し、アスペクトレベルの感情を同時に予測し、自然言語の説明を生成する統一的なフレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.581022785230257
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal aspect-based sentiment analysis (MABSA) aims to identify aspect-level sentiments by jointly modeling textual and visual information, which is essential for fine-grained opinion understanding in social media. Existing approaches mainly rely on discriminative classification with complex multimodal fusion, yet lacking explicit sentiment explainability. In this paper, we reformulate MABSA as a generative and explainable task, proposing a unified framework that simultaneously predicts aspect-level sentiment and generates natural language explanations. Based on multimodal large language models (MLLMs), our approach employs a prompt-based generative paradigm, jointly producing sentiment and explanation. To further enhance aspect-oriented reasoning capabilities, we propose a dependency-syntax-guided sentiment cue strategy. This strategy prunes and textualizes the aspect-centered dependency syntax tree, guiding the model to distinguish different sentiment aspects and enhancing its explainability. To enable explainability, we use MLLMs to construct new datasets with sentiment explanations to fine-tune. Experiments show that our approach not only achieves consistent gains in sentiment classification accuracy, but also produces faithful, aspect-grounded explanations.
- Abstract(参考訳): マルチモーダル・アスペクトベース感情分析(MABSA)は、ソーシャルメディアにおける微妙な意見理解に不可欠なテキスト情報と視覚情報を共同でモデル化することで、アスペクトレベルの感情を識別することを目的としている。
既存のアプローチは主に、複雑なマルチモーダル融合を伴う識別的分類に依存しているが、明確な感情説明性は欠如している。
本稿では,MABSAを生成的かつ説明可能なタスクとして再構築し,アスペクトレベルの感情を同時に予測し,自然言語の説明を生成する統一的なフレームワークを提案する。
マルチモーダルな大言語モデル(MLLM)に基づいて,本手法では,感情と説明を協調的に生成する,プロンプトに基づく生成パラダイムを採用している。
アスペクト指向の推論機能をさらに強化するため,依存型シンタクス誘導型感情クエ戦略を提案する。
この戦略はアスペクト中心の依存性構文ツリーを具現化し、異なる感情的側面を区別し、その説明可能性を高めるためにモデルを導く。
説明しやすさを実現するため、MLLMを用いて感情説明を伴う新しいデータセットを構築し、微調整する。
実験により,本手法は感情分類精度において一貫した向上を達成できるだけでなく,忠実でアスペクトベースな説明も生み出すことが示された。
関連論文リスト
- CMV-Fuse: Cross Modal-View Fusion of AMR, Syntax, and Knowledge Representations for Aspect Based Sentiment Analysis [2.2972913486393707]
CMV-Fuseは、人間の言語処理をエミュレートするクロスモーダルビュー融合フレームワークである。
我々のアプローチは4つの言語的視点を体系的に編成する。
CMV-Fuseは、きめ細かい構造パターンと広いコンテキスト理解の両方をキャプチャする。
論文 参考訳(メタデータ) (2025-12-07T06:35:46Z) - MetaExplainer: A Framework to Generate Multi-Type User-Centered Explanations for AI Systems [1.9811010456089264]
ユーザ中心の説明を生成するために設計された,ニューロシンボリックなフレームワークであるMetaExplainerを紹介する。
提案手法には3段階のプロセスがある: まず, 現状の大規模言語モデル (LLM) を用いて, ユーザ質問を機械可読形式に分解し, 第二に, システムレコメンデーションを生成するタスクをモデル記述者メソッドに委譲し, そして最後に, 説明者出力を要約した自然言語説明を合成する。
論文 参考訳(メタデータ) (2025-08-01T04:01:40Z) - Explanation-aware Soft Ensemble Empowers Large Language Model In-context
Learning [50.00090601424348]
大規模言語モデル(LLM)は、様々な自然言語理解タスクにおいて顕著な能力を示している。
我々は,LLMを用いたテキスト内学習を支援するための説明型ソフトアンサンブルフレームワークであるEASEを提案する。
論文 参考訳(メタデータ) (2023-11-13T06:13:38Z) - Interpreting Pretrained Language Models via Concept Bottlenecks [55.47515772358389]
事前訓練された言語モデル(PLM)は、様々な自然言語処理タスクにおいて大きな進歩を遂げてきた。
ブラックボックスの性質による解釈可能性の欠如は、責任ある実装に課題をもたらす。
本研究では,人間にとって理解しやすい高レベルで有意義な概念を用いて,PLMを解釈する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-08T20:41:18Z) - Explainability for Large Language Models: A Survey [59.67574757137078]
大規模言語モデル(LLM)は、自然言語処理における印象的な能力を示している。
本稿では,トランスフォーマーに基づく言語モデルを記述する手法について,説明可能性の分類法を紹介した。
論文 参考訳(メタデータ) (2023-09-02T22:14:26Z) - Transition-based Abstract Meaning Representation Parsing with Contextual
Embeddings [0.0]
本研究では,意味解析のタスクにおいて,言語モデルと記号意味論の定式化という,言語の意味への最も成功したルートを2つ組み合わせる手法について検討する。
本稿では,事前学習した文脈認識単語の埋め込み(BERTやRoBERTaなど)を解析問題に組み込むことの有用性について検討する。
論文 参考訳(メタデータ) (2022-06-13T15:05:24Z) - Incorporating Linguistic Knowledge for Abstractive Multi-document
Summarization [20.572283625521784]
ニューラルネットワークに基づく抽象的多文書要約(MDS)モデルを開発した。
依存関係情報を言語誘導型注意機構に処理する。
言語信号の助けを借りて、文レベルの関係を正しく捉えることができる。
論文 参考訳(メタデータ) (2021-09-23T08:13:35Z) - A Dependency Syntactic Knowledge Augmented Interactive Architecture for
End-to-End Aspect-based Sentiment Analysis [73.74885246830611]
エンドツーエンドABSAのためのマルチタスク学習を用いた対話型アーキテクチャを新たに提案する。
このモデルは、よく設計された依存性関係埋め込みグラフ畳み込みネットワーク(DreGcn)を活用することで、構文知識(依存性関係と型)を完全に活用することができる。
3つのベンチマークデータセットの大規模な実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-04-04T14:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。