Fugu-MT 論文翻訳(概要): Integrating Large Pre-trained Models into Multimodal Named Entity Recognition with Evidential Fusion

論文の概要: Integrating Large Pre-trained Models into Multimodal Named Entity Recognition with Evidential Fusion

arxiv url: http://arxiv.org/abs/2306.16991v1
Date: Thu, 29 Jun 2023 14:50:23 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-30 12:58:07.349248
Title: Integrating Large Pre-trained Models into Multimodal Named Entity Recognition with Evidential Fusion
Title（参考訳）: Evidential Fusionによる大規模事前学習モデルのマルチモーダル固有認識への統合
Authors: Weide Liu, Xiaoyang Zhong, Jingwen Hou, Shaohua Li, Haozhe Huang and Yuming Fang
Abstract要約: 本稿では,MNERタスクに不確実性推定を取り入れ,信頼に値する予測を生成することを提案する。提案アルゴリズムは,各モードの分布を正規逆ガンマ分布としてモデル化し,それらを統一分布に融合する。 2つのデータセットの実験により,提案手法がベースラインを上回り,新しい最先端性能を実現することを示す。
参考スコア（独自算出の注目度）: 31.234455370113075
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multimodal Named Entity Recognition (MNER) is a crucial task for information extraction from social media platforms such as Twitter. Most current methods rely on attention weights to extract information from both text and images but are often unreliable and lack interpretability. To address this problem, we propose incorporating uncertainty estimation into the MNER task, producing trustworthy predictions. Our proposed algorithm models the distribution of each modality as a Normal-inverse Gamma distribution, and fuses them into a unified distribution with an evidential fusion mechanism, enabling hierarchical characterization of uncertainties and promotion of prediction accuracy and trustworthiness. Additionally, we explore the potential of pre-trained large foundation models in MNER and propose an efficient fusion approach that leverages their robust feature representations. Experiments on two datasets demonstrate that our proposed method outperforms the baselines and achieves new state-of-the-art performance.
Abstract（参考訳）: MNER(Multimodal Named Entity Recognition)は、Twitterなどのソーシャルメディアプラットフォームから情報を取り出すための重要なタスクである。現在の手法のほとんどは、テキストと画像の両方から情報を抽出するために注意重みに依存するが、しばしば信頼できず、解釈可能性に欠ける。そこで本研究では,mnerタスクに不確実性推定を取り入れ,信頼性の高い予測を行う。提案するアルゴリズムは,各モダリティの分布を正規逆ガンマ分布としてモデル化し,それらの分布を証拠融合機構により統一分布に融合することにより,不確かさの階層的特徴付けと予測精度と信頼性の促進を可能にする。さらに,MNERにおける事前学習された大規模基盤モデルの可能性を探求し,その頑健な特徴表現を利用した効率的な融合手法を提案する。 2つのデータセットの実験により,提案手法がベースラインを上回り,新しい最先端性能を実現することを示す。

関連論文リスト

Confidence-Aware Self-Distillation for Multimodal Sentiment Analysis with Incomplete Modalities [15.205192581534973]
マルチモーダル感情分析は、マルチモーダルデータを通して人間の感情を理解することを目的としている。既存のモダリティの欠如を扱う方法は、データ再構成や共通部分空間投影に基づいている。マルチモーダルな確率的埋め込みを効果的に組み込んだ信頼性認識型自己蒸留(CASD)戦略を提案する。
論文参考訳（メタデータ） (2025-06-02T09:48:41Z)
NSF-MAP: Neurosymbolic Multimodal Fusion for Robust and Interpretable Anomaly Prediction in Assembly Pipelines [0.0]
本稿では,組立パイプラインにおける多モード異常予測のためのニューロシンボリックAIと融合に基づくアプローチを提案する。決定レベル融合技術を利用した時系列および画像ベース融合モデルを提案する。その結果,伝達学習を用いたニューロシンボリックAIベースの融合アプローチは,時系列データと画像データの相補的強みを効果的に活用できることが示唆された。
論文参考訳（メタデータ） (2025-05-09T16:50:42Z)
Certainly Bot Or Not? Trustworthy Social Bot Detection via Robust Multi-Modal Neural Processes [28.951832771823128]
社会的なボット検出は、誤情報、オンライン操作、不正行為の調整を緩和するために不可欠である。既存のニューラルネットワークベースの検出器は、データセット間の分散シフトによる一般化に苦慮している。本稿では,社会的ボット検出のための不確実性推定フレームワークについて紹介する。
論文参考訳（メタデータ） (2025-03-11T01:32:52Z)
Latent Distribution Decoupling: A Probabilistic Framework for Uncertainty-Aware Multimodal Emotion Recognition [7.25361375272096]
マルチモーダル・マルチラベル感情認識は,マルチモーダルデータにおける複数の感情の存在を同時に認識することを目的としている。既存の研究では、マルチモーダルデータに固有のノイズであるテクスブファレラティック不確実性の影響を見落としている。本稿では,不確かさ認識フレームワークを用いた潜在感情分布分解法を提案する。
論文参考訳（メタデータ） (2025-02-19T18:53:23Z)
Uncertainty Quantification via Hölder Divergence for Multi-View Representation Learning [18.419742575630217]
本稿では,H"older Divergence (HD)に基づく新しいアルゴリズムを導入し,多視点学習の信頼性を高める。デンプスター・シェーファー理論を通じて、異なるモダリティからの不確実性の統合により、包括的な結果が生成される。数学的には、HDは実際のデータ分布とモデルの予測分布の間の距離'をよりよく測定できることを証明している。
論文参考訳（メタデータ） (2024-10-29T04:29:44Z)
Efficient Distribution Matching of Representations via Noise-Injected Deep InfoMax [73.03684002513218]
我々はDeep InfoMax(DIM)を拡張し、学習した表現を選択された事前分布に自動マッチングできるようにする。このような修正により、一様かつ通常に分散した表現を学習できることを示す。その結果,下流作業における性能とDMの品質の中間的なトレードオフが示唆された。
論文参考訳（メタデータ） (2024-10-09T15:40:04Z)
Confidence-aware multi-modality learning for eye disease screening [58.861421804458395]
眼疾患スクリーニングのための新しい多モード顕在核融合パイプラインを提案する。モダリティごとに信頼度を測り、マルチモダリティ情報をエレガントに統合する。パブリックデータセットと内部データセットの両方の実験結果は、我々のモデルが堅牢性に優れていることを示している。
論文参考訳（メタデータ） (2024-05-28T13:27:30Z)
LoRA-Ensemble: Efficient Uncertainty Modelling for Self-attention Networks [52.46420522934253]
本稿では,自己注意ネットワークのためのパラメータ効率の高いディープアンサンブル手法であるLoRA-Ensembleを紹介する。全メンバー間で重みを共有できる1つの事前学習型自己注意ネットワークを利用することで、注意投影のために、メンバー固有の低ランク行列を訓練する。提案手法は明示的なアンサンブルよりも優れたキャリブレーションを示し,様々な予測タスクやデータセットに対して類似あるいは良好な精度を実現する。
論文参考訳（メタデータ） (2024-05-23T11:10:32Z)
Prototype-based Aleatoric Uncertainty Quantification for Cross-modal Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文参考訳（メタデータ） (2023-09-29T09:41:19Z)
Ensemble Modeling for Multimodal Visual Action Recognition [50.38638300332429]
マルチモーダル動作認識のためのアンサンブルモデリング手法を提案する。我々は,MECCANO[21]データセットの長期分布を処理するために,焦点損失の変種を用いて,個別のモダリティモデルを個別に訓練する。
論文参考訳（メタデータ） (2023-08-10T08:43:20Z)
Learning Against Distributional Uncertainty: On the Trade-off Between Robustness and Specificity [24.874664446700272]
本稿では,3つのアプローチを統一し,上記の2つの課題に対処する新たな枠組みについて検討する。提案したモデルのモンテカルロ法に基づく解法(例えば、一貫性と正規性)、非漸近性(例えば、非バイアス性や誤差境界)について検討した。
論文参考訳（メタデータ） (2023-01-31T11:33:18Z)
Transformer Uncertainty Estimation with Hierarchical Stochastic Attention [8.95459272947319]
本稿では,変圧器に不確実性推定機能を持たせるための新しい手法を提案する。これは、価値と学習可能なセントロイドのセットに付随する階層的な自己注意を学ぶことで達成される。我々は、ドメイン内(ID)とドメイン外(OOD)の両方のデータセットを用いて、2つのテキスト分類タスクでモデルを実証的に評価する。
論文参考訳（メタデータ） (2021-12-27T16:43:31Z)
Trustworthy Multimodal Regression with Mixture of Normal-inverse Gamma Distributions [91.63716984911278]
このアルゴリズムは、異なるモードの適応的統合の原理における不確かさを効率的に推定し、信頼できる回帰結果を生成する。実世界のデータと実世界のデータの両方に対する実験結果から,多モード回帰タスクにおける本手法の有効性と信頼性が示された。
論文参考訳（メタデータ） (2021-11-11T14:28:12Z)
Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文参考訳（メタデータ） (2020-03-10T03:10:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。