論文の概要: Task-Routed Mixture-of-Experts with Cognitive Appraisal for Implicit Sentiment Analysis
- arxiv url: http://arxiv.org/abs/2605.20916v1
- Date: Wed, 20 May 2026 08:59:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.585693
- Title: Task-Routed Mixture-of-Experts with Cognitive Appraisal for Implicit Sentiment Analysis
- Title(参考訳): インシシット・センシティメント分析のための認知的評価を用いたタスク制御型混合実験
- Authors: Yaping Chai, Haoran Xie, Joe S. Qin,
- Abstract要約: なぜなら、ある側面に対する感情は、明示的な意見の言葉を通して表現されるのではなく、出来事から推測されることが多いからである。
認知的評価理論を基礎として,暗黙的な感情分析のための評価型マルチタスク学習フレームワークを提案する。
タスク条件付きルータを用いて、各タスクのスパースな専門家混在を選択するとともに、タスク分離されたルーティング目標を用いて、異なるタスクを奨励し、異なる専門家選択パターンを学習する。
- 参考スコア(独自算出の注目度): 3.605122187208041
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Implicit sentiment analysis is challenging because sentiment toward an aspect is often inferred from events rather than expressed through explicit opinion words. Existing models typically learn from the final polarity label, which provides limited guidance for reasoning about sentiment from the context. Motivated by cognitive appraisal theory, we propose an appraisal-aware multi-task learning (MTL) framework for implicit sentiment analysis that provides polarity prediction with two complementary auxiliary tasks: implicit sentiment detection and cognitive rationale generation. However, training several objectives with different targets and sharing a single backbone across tasks in MTL limits flexibility and can lead to task interference. To reduce interference among these related but distinct objectives, we adopt task-level mixture-of-experts models in which all tasks share a common set of experts, and task identity controls the sparse combination of these experts. Our method builds on an encoder-decoder architecture and replaces a subset of encoder and decoder blocks with these sparse mixtures. We use a task-conditioned router to select sparse expert mixtures for each task, and a task-separated routing objective to encourage different tasks to learn distinct expert-selection patterns. Experimental results show that our model outperforms recently proposed approaches, with strong gains on the implicit sentiment subset. Our code is available at https://github.com/yaping166/TRMoE-ISA.
- Abstract(参考訳): なぜなら、ある側面に対する感情は、明示的な意見の言葉を通して表現されるのではなく、出来事から推測されることが多いからである。
既存のモデルは通常、最終的な極性ラベルから学習し、文脈から感情を推論するための限られたガイダンスを提供する。
認知的評価理論によって動機づけられた、暗黙的な感情分析のための評価認識型マルチタスク学習(MTL)フレームワークを提案し、このフレームワークは、暗黙的な感情検出と認知的合理性生成という2つの補完的なタスクで極性予測を提供する。
しかし、異なるターゲットで複数の目標をトレーニングし、MTL内のタスク間で単一のバックボーンを共有することで柔軟性が制限され、タスクの干渉につながる可能性がある。
これらの目的の干渉を軽減するために,各タスクが共通する専門家の集合を共有し,その疎結合をタスクアイデンティティが制御するタスクレベルの混合専門家モデルを採用する。
本手法は,エンコーダとデコーダのサブセットを疎結合に置き換え,エンコーダ-デコーダアーキテクチャ上に構築する。
タスク条件付きルータを用いて、各タスクのスパースな専門家混在を選択するとともに、タスク分離されたルーティング目標を用いて、異なるタスクを奨励し、異なる専門家選択パターンを学習する。
実験結果から,本モデルが最近提案されたアプローチよりも優れており,暗黙の感情サブセットに強い効果が認められた。
私たちのコードはhttps://github.com/yaping166/TRMoE-ISAで利用可能です。
関連論文リスト
- Seeing but Not Thinking: Routing Distraction in Multimodal Mixture-of-Experts [58.86896791968143]
MoE(Multimodal Mixture-of-Experts)モデルは視覚言語タスクにおいて顕著なパフォーマンスを実現している。
モデルは画像の内容が正確に知覚されるが、その後の推論では失敗する。
本稿では,視覚的な入力を処理する際に,タスク関連推論の専門家を適切に活性化できないという,ルーティング・ディトラクションの仮説を提案する。
論文 参考訳(メタデータ) (2026-04-09T17:59:44Z) - Split-on-Share: Mixture of Sparse Experts for Task-Agnostic Continual Learning [10.01449025634975]
大規模言語モデル(LLM)における連続学習は、可塑性安定性ジレンマによって妨げられる。
モデルをモジュラー部分空間に分解することで可塑性と安定性の衝突を解決するフレームワークであるSETAを紹介する。
SETA は,パラメータ効率のよい連続学習法よりも常に優れていることを示す。
論文 参考訳(メタデータ) (2026-01-24T22:39:22Z) - RouteMark: A Fingerprint for Intellectual Property Attribution in Routing-based Model Merging [69.2230254959204]
我々は,統合されたMoEモデルにおけるIP保護のためのフレームワークであるRouteMarkを提案する。
我々の重要な洞察は、タスク固有の専門家は、探索入力の下で安定かつ独特なルーティング行動を示すことである。
属性と改ざん検出のために,類似性に基づくマッチングアルゴリズムを導入する。
論文 参考訳(メタデータ) (2025-08-03T14:51:58Z) - RemoteReasoner: Towards Unifying Geospatial Reasoning Workflow [19.502882116487005]
リモートセンシング画像は、大きく、本質的に非構造的な空間データを提示する。
地理空間推論のための統合ワークフローであるRemoteReasonerを提案する。
RemoteReasonerは、複数の粒度推論タスクにわたる最先端(SOTA)パフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-07-25T13:58:11Z) - Reverse Probing: Evaluating Knowledge Transfer via Finetuned Task Embeddings for Coreference Resolution [23.375053899418504]
複雑なソースタスクから凍結表現を探索する代わりに、複数の単純なソースタスクから1つのターゲットタスクへの埋め込みの有効性について検討する。
この結果,タスクの埋め込みは,意味的類似性タスクが最も有益であることが示され,コア参照の解決に大いに有用であることが判明した。
論文 参考訳(メタデータ) (2025-01-31T17:12:53Z) - Complexity Experts are Task-Discriminative Learners for Any Image Restoration [80.46313715427928]
複雑性の専門家" - 様々な計算複雑性と受容的なフィールドを持つフレキシブルな専門家ブロックを紹介します。
この選好は、タスク固有の割り当てを効果的に推進し、適切な複雑さを持つ専門家にタスクを割り当てる。
提案したMoCE-IRモデルは最先端の手法より優れており、その効率性と実用性が確認されている。
論文 参考訳(メタデータ) (2024-11-27T15:58:07Z) - Pre-training Multi-task Contrastive Learning Models for Scientific
Literature Understanding [52.723297744257536]
事前学習言語モデル(LM)は、科学文献理解タスクにおいて有効であることを示す。
文献理解タスク間の共通知識共有を容易にするために,マルチタスクのコントラスト学習フレームワークであるSciMultを提案する。
論文 参考訳(メタデータ) (2023-05-23T16:47:22Z) - EEML: Ensemble Embedded Meta-learning [5.9514420658483935]
本稿では,事前知識を多種多様な専門家に整理するために,マルチモデルアンサンブルを明示的に活用する組込みメタ学習アルゴリズム(EEML)を提案する。
トレーニングプロセスのエキスパートに多様なタスクを提供し、テストフェーズで専門家がどのように協力するかを指示するために、クラスタメカニズムを組み込むタスクに依存しています。
実験結果から,提案手法は,最近の最先端技術に優れることが示された。
論文 参考訳(メタデータ) (2022-06-18T12:37:17Z) - Distribution Matching for Heterogeneous Multi-Task Learning: a
Large-scale Face Study [75.42182503265056]
マルチタスク学習は、共有学習アルゴリズムによって複数のタスクを共同で学習する方法論として登場した。
我々は異種mtlに対処し,検出,分類,回帰問題を同時に解決する。
大規模な顔分析のための最初のフレームワークであるFaceBehaviorNetを構築し、すべての顔行動タスクを共同で学習する。
論文 参考訳(メタデータ) (2021-05-08T22:26:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。