Fugu-MT 論文翻訳(概要): Advancing Re-Ranking with Multimodal Fusion and Target-Oriented Auxiliary Tasks in E-Commerce Search

論文の概要: Advancing Re-Ranking with Multimodal Fusion and Target-Oriented Auxiliary Tasks in E-Commerce Search

arxiv url: http://arxiv.org/abs/2408.05751v1
Date: Sun, 11 Aug 2024 11:46:21 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-13 15:37:52.306920
Title: Advancing Re-Ranking with Multimodal Fusion and Target-Oriented Auxiliary Tasks in E-Commerce Search
Title（参考訳）: Eコマース検索におけるマルチモーダルフュージョンとターゲット指向補助タスクによるリランキングの促進
Authors: Enqiang Xu, Xinhui Li, Zhigong Zhou, Jiahao Ji, Jinyuan Zhao, Dadong Miao, Songlin Wang, Lin Liu, Sulong Xu,
Abstract要約: textbfAdvancing textbfRe-Ranking with textbfMultitextbfmodal Fusion and textbfTarget-Oriented Auxiliary Tasks (ARMMT)を提案する。 ARMMTは、注目に基づくマルチモーダルフュージョン技術と、アイテム表現の強化とターゲティング能力の向上のための補助的なランキングアラインメントタスクを統合している。
参考スコア（独自算出の注目度）: 14.607057199250228
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In the rapidly evolving field of e-commerce, the effectiveness of search re-ranking models is crucial for enhancing user experience and driving conversion rates. Despite significant advancements in feature representation and model architecture, the integration of multimodal information remains underexplored. This study addresses this gap by investigating the computation and fusion of textual and visual information in the context of re-ranking. We propose \textbf{A}dvancing \textbf{R}e-Ranking with \textbf{M}ulti\textbf{m}odal Fusion and \textbf{T}arget-Oriented Auxiliary Tasks (ARMMT), which integrates an attention-based multimodal fusion technique and an auxiliary ranking-aligned task to enhance item representation and improve targeting capabilities. This method not only enriches the understanding of product attributes but also enables more precise and personalized recommendations. Experimental evaluations on JD.com's search platform demonstrate that ARMMT achieves state-of-the-art performance in multimodal information integration, evidenced by a 0.22\% increase in the Conversion Rate (CVR), significantly contributing to Gross Merchandise Volume (GMV). This pioneering approach has the potential to revolutionize e-commerce re-ranking, leading to elevated user satisfaction and business growth.
Abstract（参考訳）: 急速に発展するeコマースの分野では、検索の再ランク付けモデルの有効性は、ユーザエクスペリエンスの向上とコンバージョン率の向上に不可欠である。特徴表現とモデルアーキテクチャの大幅な進歩にもかかわらず、マルチモーダル情報の統合は未解明のままである。本研究は,テキスト情報と視覚情報の融合を再ランク付けの文脈で検討することによって,このギャップに対処する。本稿では、注目に基づくマルチモーダル融合技術と、アイテム表現の強化とターゲティング能力の向上のための補助的なランキングアラインメントタスクを統合した、 \textbf{A}dvancing \textbf{R}e-Ranking with \textbf{M}ulti\textbf{m}odal Fusion と \textbf{T}arget-Oriented Auxiliary Tasks (ARMMT)を提案する。この方法は、製品属性の理解を深めるだけでなく、より正確でパーソナライズされたレコメンデーションを可能にします。 JD.comの検索プラットフォーム上での実験的な評価は、ARMMTがマルチモーダル情報統合における最先端のパフォーマンスを達成し、コンバージョンレート(CVR)の0.22倍の上昇によって証明され、Gross Merchandise Volume(GMV)に大きく貢献していることを示している。この先駆的なアプローチは、Eコマースのリグレードに革命をもたらす可能性を秘めている。

関連論文リスト

Complementarity-driven Representation Learning for Multi-modal Knowledge Graph Completion [0.0]
我々はMixture of Complementary Modality Experts (MoCME)という新しいフレームワークを提案する。 MoCMEはComplementarity-guided Modality Knowledge Fusion (CMKF)モジュールとEntropy-guided Negative Sampling (EGNS)メカニズムで構成されている。私たちのMoCMEは最先端のパフォーマンスを達成し、既存のアプローチを超越しています。
論文参考訳（メタデータ） (2025-07-28T08:35:11Z)
SLIF-MR: Self-loop Iterative Fusion of Heterogeneous Auxiliary Information for Multimodal Recommendation [13.3951304427872]
マルチモーダルレコメンデーション(SLIF-MR)のための不均一補助情報の自己ループ反復融合(Self-loop Iterative Fusion)という新しいフレームワークを提案する。 SLIF-MRは、KG、マルチモーダルアイテム特徴グラフ、ユーザ-イテム相互作用グラフからなる異種グラフ構造を動的に最適化するために、以前のトレーニングエポックからの項目表現をフィードバック信号として活用する。実験により、SLIF-MRは既存の手法、特に精度と堅牢性において著しく優れていた。
論文参考訳（メタデータ） (2025-07-14T07:32:16Z)
Gated Recursive Fusion: A Stateful Approach to Scalable Multimodal Transformers [0.0]
Gated Recurrent Fusion(GRF)は、線形にスケーラブルで再帰的なパイプライン内で、モーダル間注目のパワーをキャプチャする新しいアーキテクチャである。我々の研究は、強力でスケーラブルなマルチモーダル表現学習のための堅牢で効率的なパラダイムを提示している。
論文参考訳（メタデータ） (2025-07-01T09:33:38Z)
Co-AttenDWG: Co-Attentive Dimension-Wise Gating and Expert Fusion for Multi-Modal Offensive Content Detection [0.0]
マルチモーダル学習は重要な研究の方向性として浮上している。既存のアプローチは、しばしばクロスモーダル相互作用の不足と固い融合戦略に悩まされる。本稿では,Co-AttenDWGを提案する。我々は,Co-AttenDWGが最先端性能と優れたクロスモーダルアライメントを実現することを示す。
論文参考訳（メタデータ） (2025-05-25T07:26:00Z)
Learning Item Representations Directly from Multimodal Features for Effective Recommendation [51.49251689107541]
マルチモーダルレコメンデータシステムは、主にベイズパーソナライズされたランク付け(BPR)最適化を利用してアイテム表現を学習する。本稿では,マルチモーダルな特徴からアイテム表現を直接学習し,推薦性能を向上する新しいモデル(LIRDRec)を提案する。
論文参考訳（メタデータ） (2025-05-08T05:42:22Z)
Killing Two Birds with One Stone: Unifying Retrieval and Ranking with a Single Generative Recommendation Model [71.45491434257106]
Unified Generative Recommendation Framework (UniGRF)は、検索とランキングを単一の生成モデルに統合する新しいアプローチである。ステージ間コラボレーションを強化するため、UniGRFはランキング駆動エンハンサーモジュールを導入した。 UniGRFは、ベンチマークデータセット上で既存のモデルよりも大幅に優れています。
論文参考訳（メタデータ） (2025-04-23T06:43:54Z)
Composed Multi-modal Retrieval: A Survey of Approaches and Applications [17.316062338546544]
Composed Multi-modal Retrieval (CMR) では、参照視覚入力とテキスト修正を統合することで、画像やビデオを検索することができる。 CMRは次世代の検索システムにおいて重要な技術になりつつある。
論文参考訳（メタデータ） (2025-03-03T09:18:43Z)
MCSFF: Multi-modal Consistency and Specificity Fusion Framework for Entity Alignment [7.109735168520378]
知識グラフの強化と質問応答システムの改善には,MMEA(Multi-modal entity alignment)が不可欠である。既存の方法は、しばしばそれらの相補性を通じてモダリティを統合することにフォーカスするが、各モダリティの特異性を見落としている。本稿では,モダリティの相補性と特異性の両方を革新的に統合するマルチモーダル一貫性・特異性融合フレームワーク(MCSFF)を提案する。
論文参考訳（メタデータ） (2024-10-18T16:35:25Z)
What Makes Good Collaborative Views? Contrastive Mutual Information Maximization for Multi-Agent Perception [52.41695608928129]
マルチエージェント認識(MAP)は、複数のソースからのデータを解釈することで、自律システムが複雑な環境を理解することを可能にする。本稿では,MAPにおける協調的視点の「良い」特性を探求することに焦点を当てた中間的協調について検討する。中間コラボレーションのための新しいフレームワークCMiMCを提案する。
論文参考訳（メタデータ） (2024-03-15T07:18:55Z)
Modality-Collaborative Transformer with Hybrid Feature Reconstruction for Robust Emotion Recognition [35.15390769958969]
ハイブリッド特徴再構成(MCT-HFR)を用いた統一型モダリティ協調変換器を提案する。 MCT-HFRは、モダリティ内およびモダリティ間関係を同時に抽出し、動的にバランスをとる新しいアテンションベースのエンコーダで構成されている。モデルトレーニング中、LFIは、完全特徴を監督信号として活用し、局所的欠落した特徴を回復する一方、GFAはペア完全表現と不完全表現のグローバルな意味的ギャップを減らすように設計されている。
論文参考訳（メタデータ） (2023-12-26T01:59:23Z)
Exploiting Modality-Specific Features For Multi-Modal Manipulation Detection And Grounding [54.49214267905562]
マルチモーダルな操作検出とグラウンド処理のためのトランスフォーマーベースのフレームワークを構築する。本フレームワークは,マルチモーダルアライメントの能力を維持しながら,モダリティ特有の特徴を同時に探求する。本稿では,グローバルな文脈的キューを各モーダル内に適応的に集約する暗黙的操作クエリ(IMQ)を提案する。
論文参考訳（メタデータ） (2023-09-22T06:55:41Z)
Multi-interactive Feature Learning and a Full-time Multi-modality Benchmark for Image Fusion and Segmentation [66.15246197473897]
多モード画像融合とセグメンテーションは、自律走行とロボット操作において重要な役割を果たす。画像融合とtextbfSegmentation のための textbfMulti-textbfinteractive textbfFeature Learning アーキテクチャを提案する。
論文参考訳（メタデータ） (2023-08-04T01:03:58Z)
Alternative Telescopic Displacement: An Efficient Multimodal Alignment Method [3.0903319879656084]
本稿では,マルチモーダル情報の融合に革命をもたらす機能アライメントに対する革新的なアプローチを提案する。提案手法では,異なるモードをまたいだ特徴表現の遠隔的変位と拡張の新たな反復的プロセスを用いて,共有特徴空間内の一貫性のある統一表現を導出する。
論文参考訳（メタデータ） (2023-06-29T13:49:06Z)
Information Screening whilst Exploiting! Multimodal Relation Extraction with Feature Denoising and Multimodal Topic Modeling [96.75821232222201]
既存のマルチモーダル関係抽出(MRE)研究は、内部情報過剰利用と外部情報過多という2つの共存課題に直面している。内部情報スクリーニングと外部情報活用を同時に実現する新しいフレームワークを提案する。
論文参考訳（メタデータ） (2023-05-19T14:56:57Z)
Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文参考訳（メタデータ） (2022-06-17T15:40:45Z)
Decoupled Side Information Fusion for Sequential Recommendation [6.515279047538104]
シーケンスレコメンデーションのためのデカップリングサイド情報融合(DIF-SR)を提案する。入力から注目層に側情報を移動し、様々な側情報の注意計算とアイテム表現を分離する。提案手法は現状のSRモデルより安定して優れている。
論文参考訳（メタデータ） (2022-04-23T10:53:36Z)
MMLatch: Bottom-up Top-down Fusion for Multimodal Sentiment Analysis [84.7287684402508]
マルチモーダル融合に対する最近のディープラーニングアプローチは、ハイレベルおよびミドルレベルの潜在モダリティ表現のボトムアップ融合に依存している。人間の知覚モデルでは、高レベルの表現が感覚入力の知覚に影響を及ぼすトップダウン融合の重要性を強調している。本稿では,ネットワークトレーニング中のフォワードパスにおけるフィードバック機構を用いて,トップダウンのクロスモーダルインタラクションをキャプチャするニューラルネットワークを提案する。
論文参考訳（メタデータ） (2022-01-24T17:48:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。