論文の概要: C-MAG: Cascade Multimodal Attributed Graphs for Supply Chain Link Prediction
- arxiv url: http://arxiv.org/abs/2508.08071v2
- Date: Wed, 13 Aug 2025 14:18:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 14:06:00.562563
- Title: C-MAG: Cascade Multimodal Attributed Graphs for Supply Chain Link Prediction
- Title(参考訳): C-MAG:サプライチェーンリンク予測のためのカスケード多モード分散グラフ
- Authors: Yunqing Li, Zixiang Tang, Jiaying Zhuang, Zhenyu Yang, Farhad Ameri, Jianbang Zhang,
- Abstract要約: PMGraphは,8,888のメーカー,70k以上の製品,110k以上のメーカー製品エッジ,29k以上の製品イメージをリンクするバイパーティタイトおよび異種マルチモーダルサプライチェーングラフのベンチマークである。
C-MAGは、まずテキストと視覚の属性を中間グループ埋め込みにアライメントし集約し、その後、マルチスケールのメッセージパッシングを通じて製造元が生成するヘテログラフを介して伝播し、リンク予測精度を向上させる2段階アーキテクチャである。
C-MAGはまた、ノイズの多い実世界の環境での予測性能を保ちながら、モダリティを意識した融合の実践的ガイドラインも提供している。
- 参考スコア(独自算出の注目度): 2.924554544787983
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Workshop version accepted at KDD 2025 (AI4SupplyChain). Connecting an ever-expanding catalogue of products with suitable manufacturers and suppliers is critical for resilient, efficient global supply chains, yet traditional methods struggle to capture complex capabilities, certifications, geographic constraints, and rich multimodal data of real-world manufacturer profiles. To address these gaps, we introduce PMGraph, a public benchmark of bipartite and heterogeneous multimodal supply-chain graphs linking 8,888 manufacturers, over 70k products, more than 110k manufacturer-product edges, and over 29k product images. Building on this benchmark, we propose the Cascade Multimodal Attributed Graph C-MAG, a two-stage architecture that first aligns and aggregates textual and visual attributes into intermediate group embeddings, then propagates them through a manufacturer-product hetero-graph via multiscale message passing to enhance link prediction accuracy. C-MAG also provides practical guidelines for modality-aware fusion, preserving predictive performance in noisy, real-world settings.
- Abstract(参考訳): ワークショップ版はKDD 2025 (AI4SupplyChain)で受理された。
製品カタログを適切なメーカーやサプライヤーと結び付けることは、レジリエンスで効率的なグローバルサプライチェーンにとって重要であるが、従来の手法は複雑な能力、認証、地理的制約、そして実世界のメーカープロファイルの豊富なマルチモーダルデータを取得するのに苦労している。
PMGraphは8,888のメーカー,70k以上の製品,110k以上の製造業製品エッジ,29k以上の製品イメージをリンクする2部構成および異種多モードサプライチェーングラフの公開ベンチマークである。
このベンチマークに基づいて,2段階のアーキテクチャであるCascade Multimodal Attributed Graph C-MAGを提案する。
C-MAGはまた、ノイズの多い実世界の環境での予測性能を保ちながら、モダリティを意識した融合の実践的ガイドラインも提供している。
関連論文リスト
- IC-Custom: Diverse Image Customization via In-Context Learning [72.92059781700594]
IC-Customは、位置認識と位置自由な画像カスタマイズをシームレスに統合する統合フレームワークである。
試着、アクセサリ配置、家具の配置、創造的なIPカスタマイズなど、さまざまな産業アプリケーションをサポートしている。
アイデンティティの整合性、調和性、テキストアライメントの指標に対して、人間の嗜好が73%向上する一方で、オリジナルのモデルのパラメータの0.4%しかトレーニングしていない。
論文 参考訳(メタデータ) (2025-07-02T17:36:38Z) - DiffusionCom: Structure-Aware Multimodal Diffusion Model for Multimodal Knowledge Graph Completion [15.898786167134997]
マルチモーダル知識グラフ補完(DiffusionCom)のための構造認識型マルチモーダル拡散モデルを提案する。
DiffusionComはジェネレータの生成的損失と識別的損失の両方を用いて訓練され、特徴抽出器は識別的損失にのみ最適化される。
FB15k-237-IMGデータセットとWN18-IMGデータセットの実験は、DiffusionComが最先端モデルより優れていることを示した。
論文 参考訳(メタデータ) (2025-04-09T02:50:37Z) - ModServe: Scalable and Resource-Efficient Large Multimodal Model Serving [19.388562622309838]
大規模なマルチモーダルモデル(LMM)は、画像、ビデオ、音声をテキストを超えて理解する能力を示す。
本稿では,6つの代表的なオープンソースモデルに対して,デコーダのみとクロスアテンションという,2つの著名なLMMアーキテクチャを包括的に解析する。
本稿では,モジュール型LMMサービスシステムであるModServeを提案する。
論文 参考訳(メタデータ) (2025-02-02T22:10:40Z) - Transformer-Based Multimodal Knowledge Graph Completion with Link-Aware Contexts [3.531533402602335]
マルチモーダル知識グラフ補完(MMKGC)は、マルチモーダル知識グラフ(MMKG)における欠落リンクの予測を目的とする。
既存のMMKGCアプローチは主に知識グラフ埋め込み(KGE)モデルを拡張している。
本稿では,トランスフォーマーをベースとしたKGEモデルと,事前学習したVLMが生成するクロスモーダルコンテキストを統合した新しい手法を提案する。
論文 参考訳(メタデータ) (2025-01-26T22:23:14Z) - Tokenization, Fusion, and Augmentation: Towards Fine-grained Multi-modal Entity Representation [51.80447197290866]
マルチモーダル知識グラフ補完(MMKGC)は、与えられた知識グラフから観測されていない知識を発見することを目的としている。
既存のMMKGCメソッドは通常、事前訓練されたモデルでマルチモーダルな特徴を抽出する。
エンティティの微細なマルチモーダル表現をトークン化し、融合し、拡張する新しいフレームワークであるMyGOを紹介します。
論文 参考訳(メタデータ) (2024-04-15T05:40:41Z) - Noise-powered Multi-modal Knowledge Graph Representation Framework [52.95468915728721]
マルチモーダル・プレトレーニングの台頭は、統合されたマルチモーダル知識グラフ表現学習フレームワークの必要性を強調している。
モードレベルのノイズマスキングを備えたトランスフォーマーアーキテクチャを用いた新しいSNAG手法を提案する。
提案手法は10個のデータセットにまたがってSOTA性能を実現し,その汎用性を実証する。
論文 参考訳(メタデータ) (2024-03-11T15:48:43Z) - Product1M: Towards Weakly Supervised Instance-Level Product Retrieval
via Cross-modal Pretraining [108.86502855439774]
弱教師付きマルチモーダル・インスタンスレベルの製品検索を目的とした,より現実的な設定について検討する。
実世界のインスタンスレベルの検索において,最も大規模なマルチモーダル化粧品データセットであるProduct1Mをコントリビュートする。
ケースレベルの予測検索(CAPTURE)のためのクロスモーダル・コントラサシブ・プロダクト・トランスフォーマーという新しいモデルを提案する。
論文 参考訳(メタデータ) (2021-07-30T12:11:24Z) - Cross-Modal Collaborative Representation Learning and a Large-Scale RGBT
Benchmark for Crowd Counting [109.32927895352685]
RGBT Crowd Counting (RGBT-CC) ベンチマークは2,030対のRGB熱画像と138,389人の注釈付き画像を含む。
マルチモーダルな群集カウントを容易にするために,クロスモーダルな協調表現学習フレームワークを提案する。
RGBT-CCベンチマークで行った実験は、RGBTの群集カウントにおけるフレームワークの有効性を示した。
論文 参考訳(メタデータ) (2020-12-08T16:18:29Z) - Pre-training Graph Transformer with Multimodal Side Information for
Recommendation [82.4194024706817]
本稿では,項目側情報とその関連性を考慮した事前学習戦略を提案する。
我々はMCNSamplingという新しいサンプリングアルゴリズムを開発し、各項目のコンテキスト近傍を選択する。
The proposed Pre-trained Multimodal Graph Transformer (PMGT) learns item representations with two objectives: 1) graph structure reconstruction, 2) masked node feature reconstruction。
論文 参考訳(メタデータ) (2020-10-23T10:30:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。