Fugu-MT 論文翻訳(概要): An Interpretable and Uncertainty Aware Multi-Task Framework for Multi-Aspect Sentiment Analysis

論文の概要: An Interpretable and Uncertainty Aware Multi-Task Framework for Multi-Aspect Sentiment Analysis

arxiv url: http://arxiv.org/abs/2009.09112v2
Date: Mon, 31 May 2021 03:44:49 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-17 03:27:17.234625
Title: An Interpretable and Uncertainty Aware Multi-Task Framework for Multi-Aspect Sentiment Analysis
Title（参考訳）: マルチアスペクト知覚分析のための解釈可能で不確実なマルチタスクフレームワーク
Authors: Tian Shi and Ping Wang and Chandan K. Reddy
Abstract要約: 文書レベルのマルチアスペクト感性分類(DMSC)は困難かつ差し迫った問題である。 DMSC問題に対して,意図的な自己注意に基づく深層ニューラルネットワークモデル,すなわちFEDARを提案する。 FEDARは、予測を解釈しながら、競争性能を達成することができる。
参考スコア（独自算出の注目度）: 15.755185152760083
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In recent years, several online platforms have seen a rapid increase in the number of review systems that request users to provide aspect-level feedback. Document-level Multi-aspect Sentiment Classification (DMSC), where the goal is to predict the ratings/sentiment from a review at an individual aspect level, has become a challenging and imminent problem. To tackle this challenge, we propose a deliberate self-attention-based deep neural network model, namely FEDAR, for the DMSC problem, which can achieve competitive performance while also being able to interpret the predictions made. FEDAR is equipped with a highway word embedding layer to transfer knowledge from pre-trained word embeddings, an RNN encoder layer with output features enriched by pooling and factorization techniques, and a deliberate self-attention layer. In addition, we also propose an Attention-driven Keywords Ranking (AKR) method, which can automatically discover aspect keywords and aspect-level opinion keywords from the review corpus based on the attention weights. These keywords are significant for rating predictions by FEDAR. Since crowdsourcing annotation can be an alternate way to recover missing ratings of reviews, we propose a LEcture-AuDience (LEAD) strategy to estimate model uncertainty in the context of multi-task learning, so that valuable human resources can focus on the most uncertain predictions. Our extensive set of experiments on five different open-domain DMSC datasets demonstrate the superiority of the proposed FEDAR and LEAD models. We further introduce two new DMSC datasets in the healthcare domain and benchmark different baseline models and our models on them. Attention weights visualization results and visualization of aspect and opinion keywords demonstrate the interpretability of our model and the effectiveness of our AKR method.
Abstract（参考訳）: 近年、いくつかのオンラインプラットフォームでは、アスペクトレベルのフィードバックをユーザに要求するレビューシステムが急速に増えている。個別の側面で評価・感性を予測することを目的としている文書レベルの多面的感性分類(DMSC)は、困難かつ差し迫った問題となっている。この課題に対処するために、DMSC問題に対して意図的な自己注意に基づく深層ニューラルネットワークモデル、すなわちFEDARを提案する。 FEDARは、事前訓練された単語埋め込みから知識を伝達するハイウェイワード埋め込み層と、プーリングと分解技術により強化された出力特徴を持つRNNエンコーダ層と、意図的に自己注意層とを備えている。また,アテンション駆動型キーワードランキング (AKR) 手法を提案し,アテンション重みに基づくアスペクトレベルの意見キーワードとアスペクトレベルの意見キーワードを自動的に検出する。これらのキーワードはFEDARによる評価予測に重要である。クラウドソーシングアノテーションは,レビュー評価の欠落を回復するための代替手段となるため,マルチタスク学習におけるモデル不確実性を推定するためのLEAD(LEcture-AuDience)戦略を提案する。 5つの異なるオープンドメインDMSCデータセットに対する広範な実験は、提案したFEDARとLEADモデルの優位性を実証している。さらに、医療領域に2つの新しいDMSCデータセットを導入し、異なるベースラインモデルとそれに基づくモデルをベンチマークします。注意重みの可視化結果とアスペクトと意見キーワードの可視化は、我々のモデルの解釈可能性とAKR法の有効性を示す。

関連論文リスト

RADAR: Revealing Asymmetric Development of Abilities in MLLM Pre-training [59.493415006017635]
事前訓練されたマルチモーダル大言語モデル(MLLM)は、ポストトレーニングのための知識豊富な基盤を提供する。現在の評価は、厳格な追加トレーニングと自己回帰的復号コストを導入する、教師付き微調整後のテストに依存している。 MLLM pRe トレーニングにおける非対称性向上のための効率的な能力中心評価フレームワーク RADAR を提案する。
論文参考訳（メタデータ） (2026-02-13T12:56:31Z)
PENDULUM: A Benchmark for Assessing Sycophancy in Multimodal Large Language Models [43.767942065379366]
サイコファシー(英: Sycophancy)は、AIモデルが実際の正確さや視覚的証拠の矛盾を犠牲にしてユーザー入力に同意する傾向である。約2000組の視覚質問応答対からなる総合評価ベンチマーク「textitPENDULUM」を導入する。本研究は, モデルロバスト性およびサイコファンおよび幻覚行動に対する感受性の顕著な変動を観察する。
論文参考訳（メタデータ） (2025-12-22T12:49:12Z)
Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文参考訳（メタデータ） (2025-06-11T03:29:18Z)
Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing [90.65399476233495]
RISEBenchはReasoning-Informed ViSual Editing (RISE)の最初のベンチマークである。 RISEBenchは、時間、因果、空間、論理的推論の4つの主要な推論タイプに焦点を当てている。本稿では,人間の判断とLMM-as-a-judgeアプローチの両方を用いて,指示推論,外観整合性,視覚的可視性を評価する評価フレームワークを提案する。
論文参考訳（メタデータ） (2025-04-03T17:59:56Z)
A Comprehensive Review on Hashtag Recommendation: From Traditional to Deep Learning and Beyond [0.37865171120254354]
ハッシュタグは、基本的な分類メカニズムとして、コンテンツの可視性とユーザエンゲージメントを高める上で重要な役割を果たす。正確で堅牢なハッシュタグレコメンデーションシステムの開発は、依然として複雑で進化中の研究課題である。本稿では,ハッシュタグレコメンデーションシステムの体系的解析を行い,近年のいくつかの側面にわたる進歩について検討する。
論文参考訳（メタデータ） (2025-03-24T13:40:36Z)
Evaluating and Advancing Multimodal Large Language Models in Ability Lens [30.083110119139793]
textbfAbilityLensは、6つの重要な知覚能力にまたがるMLLMを評価するために設計された統一ベンチマークである。現在のモデルの長所と短所を特定し、安定性のパターンを強調し、オープンソースモデルとクローズドソースモデルの顕著なパフォーマンスギャップを明らかにします。また、早期訓練段階から最高の能力チェックポイントを組み合わせ、能力衝突による性能低下を効果的に軽減する、簡易な能力特異的モデルマージ手法を設計する。
論文参考訳（メタデータ） (2024-11-22T04:41:20Z)
A Survey of Event Causality Identification: Taxonomy, Challenges, Assessment, and Prospects [6.492836595169771]
事象因果同定(ECI)は自然言語処理(NLP)において重要な課題となっている。この総合的な調査は、基本的な概念とモデルを体系的に調査し、体系的な分類学を開発し、多様なモデルを批判的に評価する。
論文参考訳（メタデータ） (2024-11-15T17:19:42Z)
MMIE: Massive Multimodal Interleaved Comprehension Benchmark for Large Vision-Language Models [71.36392373876505]
我々は、LVLM(Large Vision-Language Models)において、インターリーブされたマルチモーダル理解と生成を評価するための大規模ベンチマークであるMMIEを紹介する。 MMIEは、数学、コーディング、物理学、文学、健康、芸術を含む3つのカテゴリ、12のフィールド、102のサブフィールドにまたがる20Kの厳密にキュレートされたマルチモーダルクエリで構成されている。インターリーブされたインプットとアウトプットの両方をサポートし、多様な能力を評価するために、複数選択とオープンな質問フォーマットの混合を提供する。
論文参考訳（メタデータ） (2024-10-14T04:15:00Z)
Unsupervised Model Diagnosis [49.36194740479798]
本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文参考訳（メタデータ） (2024-10-08T17:59:03Z)
Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文参考訳（メタデータ） (2024-04-23T11:45:32Z)
Efficient Prompt Tuning of Large Vision-Language Model for Fine-Grained Ship Classification [62.425462136772666]
リモートセンシング(RS-FGSC)における船のきめ細かい分類は、クラス間の高い類似性とラベル付きデータの限られた可用性のために大きな課題となる。大規模な訓練済みビジョンランゲージモデル(VLM)の最近の進歩は、少数ショット学習やゼロショット学習において印象的な能力を示している。本研究は, 船種別分類精度を高めるために, VLMの可能性を生かしたものである。
論文参考訳（メタデータ） (2024-03-13T05:48:58Z)
Debiasing Multimodal Large Language Models [61.6896704217147]
LVLM(Large Vision-Language Models)は、コンピュータビジョンや自然言語処理において欠かせないツールとなっている。本研究は,入力画像に先行するLarge Language Models (LLM) の影響を主に受け,生成したコンテンツに有意なバイアスが生じることを示す。これらのバイアスを是正し、視覚情報に対するモデルの焦点をリダイレクトするために、我々は2つの単純で訓練のない戦略を導入する。
論文参考訳（メタデータ） (2024-03-08T12:35:07Z)
HGOT: Hierarchical Graph of Thoughts for Retrieval-Augmented In-Context Learning in Factuality Evaluation [20.178644251662316]
本稿では,文脈内学習における関連する文節の検索を促進するために,階層的思考グラフ(HGOT)を導入する。このフレームワークは、複雑なクエリを管理可能なサブクエリに分割する、分割/クエリ戦略を採用している。それは、最近提案された引用リコールと精度の指標を取り入れた、回答の選択のための自己一貫性の過半数投票を洗練する。
論文参考訳（メタデータ） (2024-02-14T18:41:19Z)
Understanding Before Recommendation: Semantic Aspect-Aware Review Exploitation via Large Language Models [53.337728969143086]
レコメンデーションシステムは、クリックやレビューのようなユーザとイテムのインタラクションを利用して表現を学習する。従来の研究では、様々な側面や意図にまたがるユーザの嗜好をモデル化することで、推奨精度と解釈可能性を改善する。そこで本研究では,意味的側面と認識的相互作用を明らかにするためのチェーンベースのプロンプト手法を提案する。
論文参考訳（メタデータ） (2023-12-26T15:44:09Z)
Don't Be So Sure! Boosting ASR Decoding via Confidence Relaxation [7.056222499095849]
ビームサーチは予測分布を用いて最大限の確率で書き起こしを求める最近提案された自己監督学習(SSL)ベースのASRモデルは、極めて確実な予測をもたらす傾向があることを示す。細調整されたASRモデルの性能を向上させる復号法を提案する。
論文参考訳（メタデータ） (2022-12-27T06:42:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。