論文の概要: Image Similarity using An Ensemble of Context-Sensitive Models
- arxiv url: http://arxiv.org/abs/2401.07951v1
- Date: Mon, 15 Jan 2024 20:23:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 16:02:17.648728
- Title: Image Similarity using An Ensemble of Context-Sensitive Models
- Title(参考訳): 文脈感応モデルのアンサンブルを用いた画像類似性
- Authors: Zukang Liao and Min Chen
- Abstract要約: ラベル付け類似性において、一対の画像に数値スコアを割り当てることは、画像Aが他の画像Bよりも基準画像Rに近いかどうかを判断するよりも直感的ではない。
A:R対B:Rというラベル付きデータに基づく画像類似性モデルを構築するための新しい手法を提案する。
- 参考スコア(独自算出の注目度): 3.4839256836124624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image similarity has been extensively studied in computer vision. In recently
years, machine-learned models have shown their ability to encode more semantics
than traditional multivariate metrics. However, in labelling similarity,
assigning a numerical score to a pair of images is less intuitive than
determining if an image A is closer to a reference image R than another image
B. In this work, we present a novel approach for building an image similarity
model based on labelled data in the form of A:R vs B:R. We address the
challenges of sparse sampling in the image space (R, A, B) and biases in the
models trained with context-based data by using an ensemble model. In
particular, we employed two ML techniques to construct such an ensemble model,
namely dimensionality reduction and MLP regressors. Our testing results show
that the ensemble model constructed performs ~5% better than the best
individual context-sensitive models. They also performed better than the model
trained with mixed imagery data as well as existing similarity models, e.g.,
CLIP and DINO. This work demonstrate that context-based labelling and model
training can be effective when an appropriate ensemble approach is used to
alleviate the limitation due to sparse sampling.
- Abstract(参考訳): 画像類似性はコンピュータビジョンで広く研究されている。
近年、機械学習モデルは、従来の多変量メトリクスよりも多くの意味をエンコードする能力を示している。
しかし,ラベル付け類似性では,画像Aが他の画像Bよりも参照画像Rに近いかどうかを判断するよりも,数値スコアを一対の画像に割り当てる方が直感的ではない。
画像空間(R,A,B)におけるスパースサンプリングの課題と、アンサンブルモデルを用いてコンテキストベースデータで訓練されたモデルにおけるバイアスに対処する。
特に,このようなアンサンブルモデルを構築するために,mlpレセプタと次元リセプタという2つのml手法を用いた。
その結果,構築したアンサンブルモデルは,個々の文脈に敏感なモデルよりも約5%高い性能を示した。
また、混合画像データで訓練されたモデルや、クリップやディノのような既存の類似性モデルよりもパフォーマンスが良かった。
本研究は,スパースサンプリングによる制限を緩和するために適切なアンサンブルアプローチを用いる場合,文脈に基づくラベリングとモデルトレーニングが有効であることを示す。
関連論文リスト
- Evaluating Data Attribution for Text-to-Image Models [62.844382063780365]
我々は,既存の大規模モデルを与えられた模範オブジェクトやスタイルにチューニングする「カストミゼーション」手法による属性評価を行う。
私たちのキーとなる洞察は、これによって、構築によって模範にコンピュータ的に影響される合成画像を効率的に作成できるということです。
問題の本質的な不確実性を考慮することで、一連のトレーニング画像に対してソフトな属性スコアを割り当てることができる。
論文 参考訳(メタデータ) (2023-06-15T17:59:51Z) - Masked Images Are Counterfactual Samples for Robust Fine-tuning [77.82348472169335]
微調整の深層学習モデルは、分布内(ID)性能と分布外(OOD)堅牢性の間のトレードオフにつながる可能性がある。
そこで本研究では,マスク付き画像を対物サンプルとして用いて,ファインチューニングモデルのロバスト性を向上させる新しいファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T11:51:28Z) - Identical Image Retrieval using Deep Learning [0.0]
私たちは最先端のモデルであるBigTransfer Modelを使用しています。
我々は、K-Nearest Neighborモデルで重要な特徴を抽出し、最も近い隣人を得るために訓練する。
本モデルの応用は,低推論時間でテキストクエリによって実現し難い,類似した画像を見つけることである。
論文 参考訳(メタデータ) (2022-05-10T13:34:41Z) - IMACS: Image Model Attribution Comparison Summaries [16.80986701058596]
我々は,勾配に基づくモデル属性とアグリゲーションと可視化技術を組み合わせたIMACSを提案する。
IMACSは評価データセットから適切な入力特徴を抽出し、類似性に基づいてクラスタ化し、類似した入力特徴に対するモデル属性の違いを可視化する。
本稿では,衛星画像上で訓練した2つのモデル間の領域シフトによる行動差を明らかにする方法を示す。
論文 参考訳(メタデータ) (2022-01-26T21:35:14Z) - Meta Internal Learning [88.68276505511922]
単一画像生成のための内部学習は、単一の画像に基づいて新しい画像を生成するようにジェネレータを訓練するフレームワークである。
本稿では,サンプル画像の内部統計をより効果的にモデル化するために,画像集合のトレーニングを可能にするメタラーニング手法を提案する。
以上の結果から, 得られたモデルは, 多数の共通画像アプリケーションにおいて, シングルイメージのGANと同程度に適していることがわかった。
論文 参考訳(メタデータ) (2021-10-06T16:27:38Z) - NP-DRAW: A Non-Parametric Structured Latent Variable Modelfor Image
Generation [139.8037697822064]
NP-DRAWと呼ばれる画像生成のための非パラメトリック構造化潜在変数モデルを提案する。
後続のキャンバスをパーツ単位で順次描画し、それをキャンバスからデコードする。
論文 参考訳(メタデータ) (2021-06-25T05:17:55Z) - Evaluating Contrastive Models for Instance-based Image Retrieval [6.393147386784114]
画像検索タスクにおけるコントラストモデルの評価を行う。
対照的な手法を用いてトレーニングされたモデルは、ImageNetラベルに基づいてトレーニングされたトレーニング済みベースラインとオンパー(およびパフォーマンス)を実行する。
論文 参考訳(メタデータ) (2021-04-30T12:05:23Z) - An application of a pseudo-parabolic modeling to texture image
recognition [0.0]
偏微分方程式モデルを用いたテクスチャ画像認識のための新しい手法を提案する。
擬似パラボリックなBuckley-Leverett方程式を用いて、デジタル画像表現のダイナミクスを提供し、時間とともに進化するそれらの画像から局所的な記述子を収集する。
論文 参考訳(メタデータ) (2021-02-09T18:08:42Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。