論文の概要: M2P2: Multimodal Persuasion Prediction using Adaptive Fusion
- arxiv url: http://arxiv.org/abs/2006.11405v2
- Date: Sat, 11 Dec 2021 20:50:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 17:19:40.278636
- Title: M2P2: Multimodal Persuasion Prediction using Adaptive Fusion
- Title(参考訳): M2P2: アダプティブフュージョンを用いたマルチモーダルパーサーション予測
- Authors: Chongyang Bai, Haipeng Chen, Srijan Kumar, Jure Leskovec, V.S.
Subrahmanian
- Abstract要約: 本稿では,ディベートアウトカム予測 (DOP) 問題において,誰が討論に勝つかを予測し,IPP (Intensity of Persuasion Prediction) 問題では,講演者の発言前後の投票数の変化を予測する。
我々のM2P2フレームワークはIPP問題を解決するためにマルチモーダル(音響、視覚、言語)データを使用した最初のフレームワークです。
- 参考スコア(独自算出の注目度): 65.04045695380333
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Identifying persuasive speakers in an adversarial environment is a critical
task. In a national election, politicians would like to have persuasive
speakers campaign on their behalf. When a company faces adverse publicity, they
would like to engage persuasive advocates for their position in the presence of
adversaries who are critical of them. Debates represent a common platform for
these forms of adversarial persuasion. This paper solves two problems: the
Debate Outcome Prediction (DOP) problem predicts who wins a debate while the
Intensity of Persuasion Prediction (IPP) problem predicts the change in the
number of votes before and after a speaker speaks. Though DOP has been
previously studied, we are the first to study IPP. Past studies on DOP fail to
leverage two important aspects of multimodal data: 1) multiple modalities are
often semantically aligned, and 2) different modalities may provide diverse
information for prediction. Our M2P2 (Multimodal Persuasion Prediction)
framework is the first to use multimodal (acoustic, visual, language) data to
solve the IPP problem. To leverage the alignment of different modalities while
maintaining the diversity of the cues they provide, M2P2 devises a novel
adaptive fusion learning framework which fuses embeddings obtained from two
modules -- an alignment module that extracts shared information between
modalities and a heterogeneity module that learns the weights of different
modalities with guidance from three separately trained unimodal reference
models. We test M2P2 on the popular IQ2US dataset designed for DOP. We also
introduce a new dataset called QPS (from Qipashuo, a popular Chinese debate TV
show ) for IPP. M2P2 significantly outperforms 4 recent baselines on both
datasets.
- Abstract(参考訳): 敵環境における説得的話者の識別は重要な課題である。
国民選挙では、政治家は説得力のある演説者を代表して選挙運動をしたい。
企業が不当な宣伝に直面した場合には、批判的な敵の存在下で、説得力のある支持者にその立場を訴えたい。
議論は、このような逆説の説得の共通基盤を表す。
本稿では,ディベートアウトカム予測(DOP)問題と,講演者の発言前後の投票数の変化を予測するIPP問題という2つの問題を解決する。
DOPは以前から研究されてきたが、我々はIPPを初めて研究している。
DOPに関する過去の研究では、マルチモーダルデータの2つの重要な側面を活用できなかった。
1)複数のモダリティは、しばしば意味的に一致し、
2)異なるモダリティは、予測のための多様な情報を提供することができる。
我々のM2P2(Multimodal Persuasion Prediction)フレームワークは、IPP問題を解決するためにマルチモーダル(音響、視覚、言語)データを使用した最初のフレームワークです。
M2P2は、異なるモジュール間の共有情報を抽出するアライメントモジュールと、異なるモジュールの重みを、別々に訓練された3つのユニモーダル参照モデルからのガイダンスで学習するヘテロジニティモジュールという、2つのモジュールから得られる埋め込みを融合させる新しい適応型融合学習フレームワークを考案した。
DOP用に設計された一般的なIQ2USデータセット上でM2P2をテストする。
また、IPPのためのQPS(Qipashuo、人気の中国の討論番組)という新しいデータセットも紹介する。
M2P2は、両方のデータセットで4つの最近のベースラインを大きく上回っている。
関連論文リスト
- Reasoning Beyond Bias: A Study on Counterfactual Prompting and Chain of Thought Reasoning [0.0]
回答の選択肢によって学習された規則性の違いは、モデルの好みを予測し、人間のテストテイク戦略を反映していることが示される。
我々は2つの新しい方法を紹介した: 思考の連鎖(CoT)と素素数CoT(Agnostically Primed CoT)による反実的プロンプト(APriCoT)である。
以上の結果から,予測バイアスの緩和には「システム-2」のようなプロセスが必要であることが示唆された。
論文 参考訳(メタデータ) (2024-08-16T10:34:50Z) - ACQUIRED: A Dataset for Answering Counterfactual Questions In Real-Life
Videos [53.92440577914417]
ACQUIREDは3.9Kの注釈付きビデオで構成され、幅広いイベントタイプを包含し、ファーストパーソンとサードパーソンの両方の視点を取り入れている。
各ビデオは、物理的、社会的、時間的な3つの異なる推論の次元にまたがる質問で注釈付けされている。
我々は,現在最先端の言語のみおよびマルチモーダルモデルに対して,我々のデータセットをベンチマークし,実験結果から大きな性能差が示された。
論文 参考訳(メタデータ) (2023-11-02T22:17:03Z) - Detecting and Grounding Multi-Modal Media Manipulation and Beyond [93.08116982163804]
マルチモーダルフェイクメディア(DGM4)の新たな研究課題について述べる。
DGM4は、マルチモーダルメディアの真正性を検出するだけでなく、操作されたコンテンツも検出することを目的としている。
本稿では,異なるモーダル間のきめ細かい相互作用を完全に捉えるために,新しい階層型マルチモーダルマニピュレーションrEasoning tRansformer(HAMMER)を提案する。
論文 参考訳(メタデータ) (2023-09-25T15:05:46Z) - GPTs at Factify 2022: Prompt Aided Fact-Verification [0.0]
本稿では, PLM (pre-trained language model) 法と Prompt 法という2つの手法を用いて提案手法を提案する。
FACTIFYデータセットのF1スコアは0.6946で、大会のリーダーボードでは7位でした。
論文 参考訳(メタデータ) (2022-06-29T21:07:39Z) - Visual Persuasion in COVID-19 Social Media Content: A Multi-Modal
Characterization [30.710295617831015]
本研究では,マルチモーダルコンテンツにおける説得情報の結果を分析するための計算手法を提案する。
Twitterでシェアされた新型コロナウイルス関連のニュース記事において、人気と信頼性の2つの側面に焦点を当てている。
論文 参考訳(メタデータ) (2021-12-05T02:15:01Z) - Detecting Speaker Personas from Conversational Texts [52.4557098875992]
本研究では,平易な会話テキストに基づく話者ペルソナの検出を目的とした,話者ペルソナ検出(SPD)という新しいタスクについて検討する。
我々は、Persona Match on Persona-Chat (PMPC)と呼ばれるSPDのためのデータセットを構築している。
本稿では,複数のベースラインモデルを評価し,この課題に対する発話対注目(U2P)マッチングネットワークを提案する。
論文 参考訳(メタデータ) (2021-09-03T06:14:38Z) - Knowledgeable Dialogue Reading Comprehension on Key Turns [84.1784903043884]
MRC(Multi-choice Machine reading comprehension)は、ある項目と質問に対する候補オプションから正しい回答を選択するモデルである。
本研究は,複数回対話を行う対話型MRCに焦点を当てている。
それは2つの課題に悩まされ、答えの選択決定は、最近役に立つコモンセンスをサポートせずに行われ、マルチターンコンテキストは、かなりの無関係な情報を隠蔽する可能性がある。
論文 参考訳(メタデータ) (2020-04-29T07:04:43Z) - DUMA: Reading Comprehension with Transposition Thinking [107.89721765056281]
MRC (Multi-choice Machine Reading) は、解答オプションのセットから正しい解答を決定するためのモデルを必要とする。
新しい Dual Multi-head Co-Attention (DUMA) モデルは、多選択MRC問題を解決する人間の転置思考プロセスにインスパイアされている。
論文 参考訳(メタデータ) (2020-01-26T07:35:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。