Fugu-MT 論文翻訳(概要): End-to-End Image-Based Fashion Recommendation

論文の概要: End-to-End Image-Based Fashion Recommendation

arxiv url: http://arxiv.org/abs/2205.02923v1
Date: Thu, 5 May 2022 21:14:42 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-09 13:28:10.531991
Title: End-to-End Image-Based Fashion Recommendation
Title（参考訳）: エンドツーエンド画像ベースファッションレコメンデーション
Authors: Shereen Elsayed, Lukas Brinkmeyer and Lars Schmidt-Thieme
Abstract要約: ファッションベースのレコメンデーション設定では、アイテムイメージの機能を取り入れることが重要な要素と考えられている。本稿では,画像特徴を取り入れたシンプルな属性認識モデルを提案する。 2つの画像ベースの実世界のレコメンデータシステムデータセットの実験では、提案されたモデルが、最先端の画像ベースモデル全てを大幅に上回っていることが示されている。
参考スコア（独自算出の注目度）: 5.210197476419621
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In fashion-based recommendation settings, incorporating the item image features is considered a crucial factor, and it has shown significant improvements to many traditional models, including but not limited to matrix factorization, auto-encoders, and nearest neighbor models. While there are numerous image-based recommender approaches that utilize dedicated deep neural networks, comparisons to attribute-aware models are often disregarded despite their ability to be easily extended to leverage items' image features. In this paper, we propose a simple yet effective attribute-aware model that incorporates image features for better item representation learning in item recommendation tasks. The proposed model utilizes items' image features extracted by a calibrated ResNet50 component. We present an ablation study to compare incorporating the image features using three different techniques into the recommender system component that can seamlessly leverage any available items' attributes. Experiments on two image-based real-world recommender systems datasets show that the proposed model significantly outperforms all state-of-the-art image-based models.
Abstract（参考訳）: ファッションベースのレコメンデーション設定では、アイテムイメージの機能を組み込むことが重要な要素と考えられており、行列の分解やオートエンコーダ、近隣のモデルに限らず、多くの伝統的なモデルに大幅に改善されている。専用ディープニューラルネットワークを利用するイメージベースのレコメンダアプローチは数多く存在するが、属性認識モデルとの比較は、アイテムの画像機能を活用するために簡単に拡張できるにもかかわらず、しばしば無視される。本稿では,アイテムレコメンデーションタスクにおいて,より優れた項目表現学習を実現するための画像特徴を組み込んだ,単純かつ効果的な属性認識モデルを提案する。提案モデルは,キャリブレーションされたresnet50コンポーネントによって抽出されたアイテムのイメージ特徴を利用する。本稿では,3つの異なる手法を用いた画像特徴を,利用可能なアイテムの属性をシームレスに活用できるレコメンデータシステムコンポーネントに組み込むことを比較検討する。 2つの画像ベースの実世界のレコメンダシステムに関する実験では、提案されたモデルが最先端の画像ベースモデルを大きく上回っていることが示されている。

関連論文リスト

Generating Multi-Image Synthetic Data for Text-to-Image Customization [48.59231755159313]
テキスト・ツー・イメージ・モデルのカスタマイズにより、ユーザーはカスタムのコンセプトを挿入し、目に見えない設定でコンセプトを生成することができる。既存の方法は、コストのかかるテストタイム最適化か、マルチイメージの監督なしにシングルイメージのトレーニングデータセットのトレーニングエンコーダに依存している。両制約に対処する簡単なアプローチを提案する。
論文参考訳（メタデータ） (2025-02-03T18:59:41Z)
Personalized Fashion Recommendation with Image Attributes and Aesthetics Assessment [15.423307815155534]
利用可能な情報、特に画像を2つのグラフ属性に変換することで、より正確なファッションレコメンデーションを提供することを目指している。画像とテキストを2つのコンポーネントとして分離する従来の手法と比較して,提案手法は画像とテキスト情報を組み合わせてよりリッチな属性グラフを作成する。 IQON3000データセットの予備実験により,提案手法はベースラインと比較して競争精度が向上することを示した。
論文参考訳（メタデータ） (2025-01-06T15:31:10Z)
FiVA: Fine-grained Visual Attribute Dataset for Text-to-Image Diffusion Models [112.94440113631897]
現在の方法では、ソース画像からアイデンティティとスタイルを抽出しようとする。スタイル」は、テクスチャ、色、芸術的要素を含む広い概念であるが、照明や動力学など他の重要な要素をカバーしていない。画像の美学を特定の視覚属性に分解するより効果的なアプローチを定式化し、ユーザーは異なる画像から照明、テクスチャ、ダイナミックスなどの特徴を適用できる。
論文参考訳（メタデータ） (2024-12-10T17:02:58Z)
MIA-DPO: Multi-Image Augmented Direct Preference Optimization For Large Vision-Language Models [85.30735602813093]
Multi-Image Augmented Direct Preference Optimization (MIA-DPO)は、マルチイメージ入力を効果的に処理する視覚的嗜好アライメントアプローチである。 MIA-DPOは、グリッドコラージュやピクチャ・イン・ピクチャ形式で配置された無関係な画像で単一の画像データを拡張することにより、多様なマルチイメージトレーニングデータの不足を軽減する。
論文参考訳（メタデータ） (2024-10-23T07:56:48Z)
ARMADA: Attribute-Based Multimodal Data Augmentation [93.05614922383822]
Attribute-based Multimodal Data Augmentation (ARMADA) は、知識誘導による視覚属性の操作による新しいマルチモーダルデータ拡張手法である。 ARMADAは、新しいマルチモーダルデータ生成フレームワークである。 (i) 意味的に一貫性があるがユニークな画像-テキストペア生成のために、シンボリックKBから知識基底属性を抽出する。これはまた、解釈可能性の向上と現実世界の接地のために外部の知識プロキシを活用する必要性を強調している。
論文参考訳（メタデータ） (2024-08-19T15:27:25Z)
Multi-View Photometric Stereo Revisited [100.97116470055273]
多視点測光ステレオ(MVPS)は、画像から被写体を詳細に正確に3D取得する方法として好まれる。 MVPSは異方性や光沢などの他の対象物質と同様に,等方性に対しても有効である。提案手法は、複数のベンチマークデータセットで広範囲にテストした場合に、最先端の結果を示す。
論文参考訳（メタデータ） (2022-10-14T09:46:15Z)
Aesthetic Attribute Assessment of Images Numerically on Mixed Multi-attribute Datasets [16.120684660965978]
我々は、属性(AMD-A)を用いた美的混合データセットと呼ばれる画像属性データセットを構築し、融合のための外部属性特徴を設計する。我々のモデルは、美的分類、総合評価、属性スコアを達成できる。 MindSporeを用いた実験結果から,本手法は審美的総合評価と属性評価を効果的に改善できることが示された。
論文参考訳（メタデータ） (2022-07-05T04:42:10Z)
Composition and Style Attributes Guided Image Aesthetic Assessment [66.60253358722538]
本稿では,画像の美学を自動予測する手法を提案する。提案ネットワークには,意味的特徴抽出のための事前学習ネットワーク(Backbone)と,画像属性の予測にBackbone機能に依存するマルチレイヤパーセプトロン(MLP)ネットワーク(AttributeNet)が含まれる。画像が与えられた場合、提案するマルチネットワークは、スタイルと構成属性、および美的スコア分布を予測できる。
論文参考訳（メタデータ） (2021-11-08T17:16:38Z)
Contextual Similarity Aggregation with Self-attention for Visual Re-ranking [96.55393026011811]
本稿では,自己注意を伴う文脈的類似性集約による視覚的再ランク付け手法を提案する。提案手法の汎用性と有効性を示すため,4つのベンチマークデータセットの総合的な実験を行った。
論文参考訳（メタデータ） (2021-10-26T06:20:31Z)
Inverting Adversarially Robust Networks for Image Synthesis [37.927552662984034]
本稿では,特徴反転モデルの知覚的プリミティブとしてロバスト表現を用いることを提案する。画像として頑健な表現を採用することにより,CNNに基づく特徴反転モデルの再構成精度が大幅に向上することを示す。そこで本研究では,ロバストな表現に基づく符号化復号ネットワークを提案し,異常検出,スタイル転送,画像復号化などの応用にその利点を示す。
論文参考訳（メタデータ） (2021-06-13T05:51:00Z)
Apparel Recommender System based on Bilateral image shape features [0.0]
本研究では、二重畳み込みニューラルネットワーク(CNN)をレコメンダシステムに統合する新しい確率モデルを提案する。アパレルグッズでは、ユーザとアイテムの画像形状特徴から訓練された2つのcnnを組み合わせて、ユーザとアイテムの潜在変数を最適化する。我々のモデルは、他の推奨モデルよりも正確な結果を予測する。
論文参考訳（メタデータ） (2021-05-04T14:48:38Z)
Adaptive Compact Attention For Few-shot Video-to-video Translation [13.535988102579918]
本稿では,複数の参照画像からコンテキスト特徴を効率的に抽出する適応型コンパクトアテンション機構を提案する。我々の中心となる考え方は、すべての参照画像からより高レベルな表現としてコンパクトな基底集合を抽出することである。提案手法を大規模トーキングヘッドビデオデータセットと人間のダンスデータセットで広範囲に評価した。
論文参考訳（メタデータ） (2020-11-30T11:19:12Z)
Saliency-driven Class Impressions for Feature Visualization of Deep Neural Networks [55.11806035788036]
分類に欠かせないと思われる特徴を視覚化することは有利である。既存の可視化手法は,背景特徴と前景特徴の両方からなる高信頼画像を生成する。本研究では,あるタスクにおいて最も重要であると考えられる識別的特徴を可視化するための,サリエンシ駆動型アプローチを提案する。
論文参考訳（メタデータ） (2020-07-31T06:11:06Z)
Multi-Image Summarization: Textual Summary from a Set of Cohesive Images [17.688344968462275]
本稿では,マルチイメージ要約の新しい課題を提案する。入力画像のコヒーレントな集合から簡潔で記述的なテキスト要約を生成することを目的としている。密度の高い平均画像特徴集約ネットワークにより、モデルは属性のコヒーレントなサブセットに集中することができる。
論文参考訳（メタデータ） (2020-06-15T18:45:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。