論文の概要: Performance-Efficiency Trade-off for Fashion Image Retrieval
- arxiv url: http://arxiv.org/abs/2509.24477v1
- Date: Mon, 29 Sep 2025 08:51:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.875659
- Title: Performance-Efficiency Trade-off for Fashion Image Retrieval
- Title(参考訳): ファッション画像検索における効率トレードオフ
- Authors: Julio Hurtado, Haoran Ni, Duygu Sap, Connor Mattinson, Martin Lotz,
- Abstract要約: 本稿では,データベースからの2手画像検索のスケーラビリティについて論じる。
選択表現フレームワークを導入することで、検索精度を犠牲にすることなく、データベースを元のサイズの10%まで縮小することができる。
DeepFashion Attribute、DeepFashion Con2Shop、DeepFashion2の3つのパブリックデータセットに対するアプローチを評価します。
- 参考スコア(独自算出の注目度): 2.757749539742832
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The fashion industry has been identified as a major contributor to waste and emissions, leading to an increased interest in promoting the second-hand market. Machine learning methods play an important role in facilitating the creation and expansion of second-hand marketplaces by enabling the large-scale valuation of used garments. We contribute to this line of work by addressing the scalability of second-hand image retrieval from databases. By introducing a selective representation framework, we can shrink databases to 10% of their original size without sacrificing retrieval accuracy. We first explore clustering and coreset selection methods to identify representative samples that capture the key features of each garment and its internal variability. Then, we introduce an efficient outlier removal method, based on a neighbour-homogeneity consistency score measure, that filters out uncharacteristic samples prior to selection. We evaluate our approach on three public datasets: DeepFashion Attribute, DeepFashion Con2Shop, and DeepFashion2. The results demonstrate a clear performance-efficiency trade-off by strategically pruning and selecting representative vectors of images. The retrieval system maintains near-optimal accuracy, while greatly reducing computational costs by reducing the images added to the vector database. Furthermore, applying our outlier removal method to clustering techniques yields even higher retrieval performance by removing non-discriminative samples before the selection.
- Abstract(参考訳): ファッション産業は廃棄物や排ガスの主要な貢献者と見なされ、中古市場への関心が高まっている。
機械学習手法は、中古衣料品の大規模な評価を可能にすることによって、中古品の市場創出と拡大を促進する上で重要な役割を担っている。
データベースからの2手画像検索のスケーラビリティに対処することで、この一連の作業に貢献する。
選択表現フレームワークを導入することで、検索精度を犠牲にすることなく、データベースを元のサイズの10%まで縮小することができる。
まずクラスタリングとコアセットの選択手法を探索し、各衣服の重要特徴と内部変動を捉える代表サンプルを同定する。
そこで本研究では, 選択前の非特性サンプルをフィルタリングする, 近傍の均一性一貫性スコア尺度に基づく効率的な外乱除去手法を提案する。
DeepFashion Attribute、DeepFashion Con2Shop、DeepFashion2の3つのパブリックデータセットに対するアプローチを評価します。
その結果,画像の代表的なベクトルを戦略的にプルーニングし,選択することで,性能・効率のトレードオフを明らかにすることができた。
検索システムは、ベクトルデータベースに追加される画像の削減により、計算コストを大幅に削減しつつ、ほぼ最適の精度を維持している。
さらに, クラスタリング手法に外乱除去手法を適用することにより, 選択前の非識別サンプルを除去することにより, さらに高い検索性能が得られる。
関連論文リスト
- A Re-ranking Method using K-nearest Weighted Fusion for Person Re-identification [2.1204495827342438]
本稿では,隣人の特徴を集約することで,多視点特徴を効率よく生成する手法を提案する。
本手法は,マーケット1501,MSMT17,Occluded-DukeMTMCの人物識別データセットについて検討した。
論文 参考訳(メタデータ) (2025-09-04T09:29:25Z) - ProgRoCC: A Progressive Approach to Rough Crowd Counting [66.09510514180593]
私たちはRough Crowd Countingというラベルを付け、取得が容易なトレーニングデータに基づいて精度を向上します。
本稿では,ProgRoCCと呼ばれるCLIPに基づく大群カウント問題に対するアプローチを提案する。
具体的には、粗大なアプローチによってオブジェクト数を決定するプログレッシブな推定学習戦略を導入する。
論文 参考訳(メタデータ) (2025-04-18T01:57:42Z) - iEBAKER: Improved Remote Sensing Image-Text Retrieval Framework via Eliminate Before Align and Keyword Explicit Reasoning [80.44805667907612]
iEBAKERは、弱い相関のサンプルペアをフィルタリングする革新的な戦略である。
SAR(Sort After Reversed Retrieval)戦略の代替として,SAR(Sort After Retrieval)戦略を導入する。
キーワード明示型推論(KER)モジュールを組み込んで、微妙なキー概念の区別による有益な影響を促進する。
論文 参考訳(メタデータ) (2025-04-08T03:40:19Z) - Revealing the Two Sides of Data Augmentation: An Asymmetric Distillation-based Win-Win Solution for Open-Set Recognition [26.641452963393156]
閉集合認識の強化は開集合認識の大幅な減少と相関することがわかった。
知識蒸留は模倣によって特徴を損なう可能性があるが、あいまいな意味論との混合特徴は蒸留を妨げている。
提案手法は,Tiny-ImageNetデータセット上で,オープンセットの低下を軽減し,AUROCを2%向上させる。
論文 参考訳(メタデータ) (2024-04-28T09:56:49Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - SRFormer: Text Detection Transformer with Incorporated Segmentation and
Regression [6.74412860849373]
本稿では,アマルガメーションと回帰を併用した統合DTRモデルSRFormerを提案する。
実験分析により,初期デコーダ層で良好なセグメンテーション予測が得られることが示された。
提案手法の強靭性,優れたトレーニングとデータ効率,および最先端の性能について検討した。
論文 参考訳(メタデータ) (2023-08-21T07:34:31Z) - Few-shot Image Classification based on Gradual Machine Learning [6.935034849731568]
少ないショット画像分類は、ラベル付きサンプルのみを使用してラベル付きイメージを正確に分類することを目的としている。
段階的機械学習(GML)の非i.dパラダイムに基づく新しいアプローチを提案する。
提案手法は精度でSOTAの性能を1-5%向上させることができることを示す。
論文 参考訳(メタデータ) (2023-07-28T12:30:41Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Few-Shot Learning with Part Discovery and Augmentation from Unlabeled
Images [79.34600869202373]
帰納的バイアスは、ラベルなし画像の平坦な集合から学習でき、目に見えるクラスと目に見えないクラスの間で伝達可能な表現としてインスタンス化されることを示す。
具体的には、トランスファー可能な表現を学習するための、新しいパートベース自己教師型表現学習手法を提案する。
我々の手法は印象的な結果をもたらし、それまでの最高の教師なし手法を7.74%、9.24%上回った。
論文 参考訳(メタデータ) (2021-05-25T12:22:11Z) - Semi-Supervised Crowd Counting via Self-Training on Surrogate Tasks [50.78037828213118]
本稿では,機能学習の観点から,半教師付き群集カウント問題に取り組む。
本稿では,2つの革新的なコンポーネント上に構築された,新しい半教師付き群集カウント手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T05:30:53Z) - Progressive Local Filter Pruning for Image Retrieval Acceleration [43.97722250091591]
画像検索高速化のための新しいプログレッシブ・ローカルフィルタ・プルーニング(PLFP)法を提案する。
具体的には、各フィルタの局所的な幾何学的性質を分析し、隣人に置き換えられるものを選択する。
このように、モデルの表現能力は保持される。
論文 参考訳(メタデータ) (2020-01-24T04:28:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。