論文の概要: Unimodal vs. Multimodal Siamese Networks for Outfit Completion
- arxiv url: http://arxiv.org/abs/2207.10355v1
- Date: Thu, 21 Jul 2022 08:20:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-22 12:39:53.867786
- Title: Unimodal vs. Multimodal Siamese Networks for Outfit Completion
- Title(参考訳): 単モーダル対マルチモーダル・シームズ・ネットワーク
- Authors: Mariya Hendriksen, Viggo Overes
- Abstract要約: 我々は、SIGIR 2022 Workshop on eCommerceの一部であるFashion Outfits Challengeに注力する。
この課題は、不完全な服装と候補者のリストを与えられた状態で、行方不明の衣服を予測するためのFITB(Fill in the Blank)タスクを中心に展開されている。
複数のモーダル性(テキストと視覚のモーダル性)からの情報の組み合わせが、タスクにおけるモデルの性能にどのように影響するかを考察する。
- 参考スコア(独自算出の注目度): 3.1410342959104725
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The popularity of online fashion shopping continues to grow. The ability to
offer an effective recommendation to customers is becoming increasingly
important. In this work, we focus on Fashion Outfits Challenge, part of SIGIR
2022 Workshop on eCommerce. The challenge is centered around Fill in the Blank
(FITB) task that implies predicting the missing outfit, given an incomplete
outfit and a list of candidates. In this paper, we focus on applying siamese
networks on the task. More specifically, we explore how combining information
from multiple modalities (textual and visual modality) impacts the performance
of the model on the task. We evaluate our model on the test split provided by
the challenge organizers and the test split with gold assignments that we
created during the development phase. We discover that using both visual, and
visual and textual data demonstrates promising results on the task. We conclude
by suggesting directions for further improvement of our method.
- Abstract(参考訳): オンラインファッションショッピングの人気は増え続けている。
顧客に効果的なレコメンデーションを提供する能力はますます重要になっています。
本研究は、SIGIR 2022 Workshop on eCommerceの一部であるFashion Outfits Challengeに焦点を当てる。
課題は、不完全な衣装と候補者のリストが与えられた場合、行方不明の衣装を予測するための空白(fitb)タスクを満たすことにある。
本稿では,課題にシアムネットワークを適用することに焦点を当てる。
具体的には、複数のモーダル性(テキストと視覚のモーダル性)からの情報の組み合わせが、タスクにおけるモデルの性能にどのように影響するかを検討する。
チャレンジオーガナイザによるテスト分割と,開発期間中に作成したゴールドアサインによるテスト分割について,本モデルの評価を行った。
ビジュアルデータとビジュアルデータとテキストデータの両方を使用することで、タスクに有望な結果が得られることが分かりました。
提案手法のさらなる改善に向けての方向性を提案する。
関連論文リスト
- MMTryon: Multi-Modal Multi-Reference Control for High-Quality Fashion Generation [70.83668869857665]
MMTryonはマルチモーダルなマルチ参照VIrtual Try-ONフレームワークである。
テキスト命令と複数の衣料品画像を入力として、高品質な合成試行結果を生成することができる。
論文 参考訳(メタデータ) (2024-05-01T11:04:22Z) - FaD-VLP: Fashion Vision-and-Language Pre-training towards Unified
Retrieval and Captioning [66.38951790650887]
ファッション分野におけるマルチモーダルタスクは、eコマースにとって大きな可能性を秘めている。
本稿では,ファッションとテクストのペアから構築した弱教師付き三つ組に基づく,ファッション特有の事前学習フレームワークを提案する。
3重項に基づくタスクは、標準的なマルチモーダル事前学習タスクに有効な追加であることを示す。
論文 参考訳(メタデータ) (2022-10-26T21:01:19Z) - Dress Well via Fashion Cognitive Learning [18.867513936553195]
そこで本稿では,Fashion Cognitive Network (FCN) を提案する。
FCNには2つのサブモジュール、すなわち服用エンコーダとマルチラベルグラフニューラルネットワーク(ML-GCN)がある。
論文 参考訳(メタデータ) (2022-08-01T06:52:37Z) - Fashionformer: A simple, Effective and Unified Baseline for Human
Fashion Segmentation and Recognition [80.74495836502919]
本研究では,共同ファッションセグメンテーションと属性認識に着目した。
本稿では,セグメンテーションのためのオブジェクトクエリと属性予測のための属性クエリを紹介する。
属性ストリームのために,よりきめ細かい特徴を探索する新しいマルチレイヤレンダリングモジュールを設計する。
論文 参考訳(メタデータ) (2022-04-10T11:11:10Z) - Logically at the Factify 2022: Multimodal Fact Verification [2.8914815569249823]
本稿では,AAAI 2022におけるマルチモーダル事実検証(Factify)課題の参加者システムについて述べる。
アンサンブルモデルとマルチモーダルアテンションネットワークを含む2つのベースラインアプローチを提案し,検討した。
我々の最良モデルは、検証セットとテストセットの両方において、重み付き平均F値が0.77となるリーダーボードで第1位にランクされている。
論文 参考訳(メタデータ) (2021-12-16T23:34:07Z) - Dealing with Missing Modalities in the Visual Question Answer-Difference
Prediction Task through Knowledge Distillation [75.1682163844354]
我々は,視覚的質問応答拡散予測タスクから生じる欠落モダリティの問題に対処する。
本稿では,イメージ/質問/回答トリプレットを入力として,ベースラインを上回る「大きな」教師モデルを紹介する。
論文 参考訳(メタデータ) (2021-04-13T06:41:11Z) - Bootstrapping Complete The Look at Pinterest [8.503851753592512]
PinterestにおけるComplete The Look(CTL)システムのブートストラップについて説明する。
これは「スタイル整合性」の主観的な課題を学習し、衣服を完成させる補完的な項目を推薦することを目的とした技術である。
100万以上の服と400万のオブジェクトからなる私たちの服のデータセットを紹介します。
論文 参考訳(メタデータ) (2020-06-18T18:20:19Z) - Personalized Fashion Recommendation from Personal Social Media Data: An
Item-to-Set Metric Learning Approach [71.63618051547144]
ソーシャルメディアデータからパーソナライズされたファッションレコメンデーションの問題について検討する。
本稿では,ユーザの過去のファッションアイテムと新しいファッションアイテムとの類似性を学習する,アイテムツーセットのメトリック学習フレームワークを提案する。
提案手法の有効性を検証するために,実世界のソーシャルメディアデータセットを収集する。
論文 参考訳(メタデータ) (2020-05-25T23:24:24Z) - Learning Diverse Fashion Collocation by Neural Graph Filtering [78.9188246136867]
本稿では,グラフニューラルネットワークを用いて,フレキシブルなファッションアイテムセットをモデル化する新しいファッションコロケーションフレームワークであるNeural Graph Filteringを提案する。
エッジベクトルに対称演算を適用することにより、このフレームワークは様々な入力/出力を許容し、それらの順序に不変である。
提案手法を,Polyvoreデータセット,Polyvore-Dデータセット,Amazon Fashionデータセットの3つの一般的なベンチマークで評価した。
論文 参考訳(メタデータ) (2020-03-11T16:17:08Z) - A Strong Baseline for Fashion Retrieval with Person Re-Identification
Models [0.0]
ファッション検索は、画像に含まれるファッションアイテムの正確なマッチングを見つけるのに難しいタスクである。
ファッション検索のためのシンプルなベースラインモデルを導入する。
Street2ShopとDeepFashionのデータセットで詳細な実験を行い、その結果を検証する。
論文 参考訳(メタデータ) (2020-03-09T12:50:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。