Fugu-MT 論文翻訳(概要): Do We Really Need to Drop Items with Missing Modalities in Multimodal Recommendation?

論文の概要: Do We Really Need to Drop Items with Missing Modalities in Multimodal Recommendation?

arxiv url: http://arxiv.org/abs/2408.11767v1
Date: Wed, 21 Aug 2024 16:39:47 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-01 22:59:51.178855
Title: Do We Really Need to Drop Items with Missing Modalities in Multimodal Recommendation?
Title（参考訳）: マルチモーダル勧告におけるモダリティの欠落は本当に必要か?
Authors: Daniele Malitesta, Emanuele Rossi, Claudio Pomo, Tommaso Di Noia, Fragkiskos D. Malliaros,
Abstract要約: 我々は、(いくつかの)モダリティの欠如は、実際、マルチモーダルレコメンデーションにおいて広く拡散された現象であることを示した。本稿では,機械学習における従来の計算手法を活用することで,欠落したマルチモーダル機能を推奨するパイプラインを提案する。
参考スコア（独自算出の注目度）: 15.428850539237182
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Generally, items with missing modalities are dropped in multimodal recommendation. However, with this work, we question this procedure, highlighting that it would further damage the pipeline of any multimodal recommender system. First, we show that the lack of (some) modalities is, in fact, a widely-diffused phenomenon in multimodal recommendation. Second, we propose a pipeline that imputes missing multimodal features in recommendation by leveraging traditional imputation strategies in machine learning. Then, given the graph structure of the recommendation data, we also propose three more effective imputation solutions that leverage the item-item co-purchase graph and the multimodal similarities of co-interacted items. Our method can be plugged into any multimodal RSs in the literature working as an untrained pre-processing phase, showing (through extensive experiments) that any data pre-filtering is not only unnecessary but also harmful to the performance.
Abstract（参考訳）: 一般的に、モダリティの欠落したアイテムはマルチモーダルレコメンデーションにドロップされる。しかし、本研究では、この手順に疑問を呈し、マルチモーダルレコメンデータシステムのパイプラインをさらに損なうことを強調した。まず、(いくつかの)モダリティの欠如は、実際、マルチモーダルレコメンデーションにおいて広く拡散された現象であることを示す。次に,機械学習における従来の計算手法を活用することで,欠落したマルチモーダル機能を推奨するパイプラインを提案する。また,推奨データのグラフ構造を考慮し,共同購入グラフと共作用アイテムのマルチモーダル類似性を利用する,より効果的な3つの計算方法を提案する。提案手法は, 学習前処理フェーズとして機能する文献のマルチモーダルRSに差し込むことができ, データの事前フィルタリングは不要であるだけでなく, 性能にも有害であることを示す(広範な実験を通じて)。

関連論文リスト

Training-free Graph-based Imputation of Missing Modalities in Multimodal Recommendation [17.99701858812936]
一般的なプラクティスは、モダリティの欠如したアイテムをドロップし、元のデータセットのサブサンプルでマルチモーダルRSをトレーニングすることである。本研究では,マルチモーダルレコメンデーションにおけるモダリティの欠如に対する問題形式化を提案する。課題項目グラフ全体を通して利用可能なマルチモーダルな特徴を伝達し,不足する特徴を示唆する4つのトレーニング不要なアプローチを提案する。
論文参考訳（メタデータ） (2026-02-19T13:37:03Z)
Better Together: Leveraging Unpaired Multimodal Data for Stronger Unimodal Models [63.032359320629105]
In this present: Unpaired Multimodal, a modality-agnostic training paradigm, a single model then alternately processs from different modalities while sharing parameters across。補助モダリティからの未ペアリングデータを使用することで、画像や音声などの様々な単一目標に対して、ダウンストリーム性能が一貫して向上することを示す。
論文参考訳（メタデータ） (2025-10-09T17:32:23Z)
Does Multimodality Improve Recommender Systems as Expected? A Critical Analysis and Future Directions [52.21847626165085]
マルチモーダルレコメンデーションシステムは、多種多様なデータ型を統合することで、パフォーマンスを向上させる可能性が高まっている。しかし、この統合の実際の利点ははっきりしないままであり、いつ、どのように本当にレコメンデーションを強化するのかという疑問が持ち上がっている。 4次元にわたるマルチモーダルレコメンデーションを体系的に評価するための構造化評価フレームワークを提案する。
論文参考訳（メタデータ） (2025-08-07T13:21:00Z)
STAIR: Manipulating Collaborative and Multimodal Information for E-Commerce Recommendation [11.650613484855356]
本稿では,eコマースレコメンデーションにおける協調的かつマルチモーダルな情報の共存を可能にするために,新しいSTepwise grAph畳み込みを用いたSTAIRを提案する。 STAIRは、計算とメモリのコストを最小限に抑えた3つの公開eコマースデータセットで最先端のレコメンデーションパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-12-16T12:53:06Z)
Ducho meets Elliot: Large-scale Benchmarks for Multimodal Recommendation [9.506245109666907]
商品やサービスを特徴付ける多面的機能は、オンライン販売プラットフォームにおいて、各顧客に影響を与える可能性がある。一般的なマルチモーダルレコメンデーションパイプラインは、(i)マルチモーダルな特徴の抽出、(ii)レコメンデーションタスクに適したハイレベルな表現の精製、(iv)ユーザイテムスコアの予測を含む。本論文は,マルチモーダルレコメンデータシステムに対する大規模ベンチマークを行う最初の試みとして,特にマルチモーダル抽出器に着目したものである。
論文参考訳（メタデータ） (2024-09-24T08:29:10Z)
A Unified Graph Transformer for Overcoming Isolations in Multi-modal Recommendation [9.720586396359906]
既存のマルチモーダルレコメンダシステムは、通常、特徴抽出とモダリティモデリングの両方に分離されたプロセスを使用する。本稿では, マルチウェイ変換器を用いて, 整列したマルチモーダル特徴を抽出するUnified Multi-modal Graph Transformer (UGT) という新しいモデルを提案する。 UGTモデルは, 一般的に使用されるマルチモーダルレコメンデーション損失と共同最適化した場合に, 特に有意な有効性が得られることを示す。
論文参考訳（メタデータ） (2024-07-29T11:04:31Z)
Modality-Balanced Learning for Multimedia Recommendation [21.772064939915214]
本稿では,不均衡問題を解消し,全てのモダリティを最大限に活用するための対実的知識蒸留法を提案する。また,教師からより広義の知識を習得するために,多モーダルな学生を指導するために,新たな総合的・特異な蒸留損失を設計する。我々の手法は、遅延核融合と早期核融合の両方のバックボーンのためのプラグイン・アンド・プレイモジュールとして機能する。
論文参考訳（メタデータ） (2024-07-26T07:53:01Z)
Multi-modal Crowd Counting via a Broker Modality [64.5356816448361]
マルチモーダルな群衆カウントは、視覚画像と熱/深度画像の両方から群衆密度を推定する。本稿では,補助的ブローカーのモダリティを導入し,そのタスクを3つのモーダル学習問題とする新しい手法を提案する。我々はこのブローカーのモダリティを生成するための融合法を考案し、近代的な拡散に基づく核融合モデルの非拡散的軽量化を生かした。
論文参考訳（メタデータ） (2024-07-10T10:13:11Z)
Attention-based sequential recommendation system using multimodal data [8.110978727364397]
本稿では,画像やテキスト,カテゴリといった項目のマルチモーダルなデータを用いた注意に基づくシーケンシャルレコメンデーション手法を提案する。 Amazonデータセットから得られた実験結果は,提案手法が従来の逐次レコメンデーションシステムよりも優れていることを示している。
論文参考訳（メタデータ） (2024-05-28T08:41:05Z)
NoteLLM-2: Multimodal Large Representation Models for Recommendation [71.87790090964734]
大規模言語モデル(LLM)は、テキスト理解や埋め込みタスクにおいて、例外的な習熟度を示している。マルチモーダル表現のポテンシャル、特にアイテムツーイテム(I2I)レコメンデーションについては、未解明のままである。本稿では,既存のLLMと視覚エンコーダの統合をカスタマイズし,効率的なマルチモーダル表現を実現するエンド・ツー・エンドのファインチューニング手法を提案する。
論文参考訳（メタデータ） (2024-05-27T03:24:01Z)
Mirror Gradient: Towards Robust Multimodal Recommender Systems via Exploring Flat Local Minima [54.06000767038741]
フラットローカルミニマの新しい視点からマルチモーダルリコメンデータシステムの解析を行う。我々はミラーグラディエント(MG)と呼ばれる簡潔で効果的な勾配戦略を提案する。提案したMGは、既存の堅牢なトレーニング手法を補完し、多様な高度なレコメンデーションモデルに容易に拡張できることが判明した。
論文参考訳（メタデータ） (2024-02-17T12:27:30Z)
Multimodal Learning Without Labeled Multimodal Data: Guarantees and Applications [90.6849884683226]
ラベル付き単調データのみを用いた半教師付き環境における相互作用定量化の課題について検討する。相互作用の正確な情報理論的定義を用いて、我々の重要な貢献は下界と上界の導出である。本稿では、これらの理論結果を用いてマルチモーダルモデルの性能を推定し、データ収集をガイドし、様々なタスクに対して適切なマルチモーダルモデルを選択する方法について述べる。
論文参考訳（メタデータ） (2023-06-07T15:44:53Z)
Efficient Multimodal Fusion via Interactive Prompting [62.08292938484994]
大規模事前学習は、コンピュータビジョンや自然言語処理のような一助的な分野を新しい時代にもたらした。本稿では,一様事前学習型変圧器の融合に適した効率的かつ柔軟な多モード融合法PMFを提案する。
論文参考訳（メタデータ） (2023-04-13T07:31:51Z)
Align and Attend: Multimodal Summarization with Dual Contrastive Losses [57.83012574678091]
マルチモーダル要約の目標は、異なるモーダルから最も重要な情報を抽出し、出力要約を形成することである。既存の手法では、異なるモダリティ間の時間的対応の活用に失敗し、異なるサンプル間の本質的な相関を無視する。 A2Summ(Align and Attend Multimodal Summarization)は、マルチモーダル入力を効果的に整列し、参加できる統一型マルチモーダルトランスフォーマーモデルである。
論文参考訳（メタデータ） (2023-03-13T17:01:42Z)
Mining Latent Structures for Multimedia Recommendation [46.70109406399858]
本稿では,マルチモーダル再圧縮のためのLATent sTructureマイニング手法を提案する。各モダリティの項目構造を学び、複数のモダリティを集約して潜在アイテムグラフを得る。学習した潜在グラフに基づいてグラフ畳み込みを行い、アイテム表現に高次項目親和性を明示的に注入する。
論文参考訳（メタデータ） (2021-04-19T03:50:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。