論文の概要: RE-Tagger: A light-weight Real-Estate Image Classifier
- arxiv url: http://arxiv.org/abs/2207.05696v1
- Date: Tue, 12 Jul 2022 17:16:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-13 13:21:21.269319
- Title: RE-Tagger: A light-weight Real-Estate Image Classifier
- Title(参考訳): RE-Tagger:軽量リアルタイム画像分類器
- Authors: Prateek Chhikara, Anil Goyal, Chirag Sharma
- Abstract要約: 本稿では,リアルタイム画像分類問題に対するエンドツーエンドパイプライン(RE-Tagger)を提案する。
本稿では,カスタムインセプションV3アーキテクチャを用いた2段階のトランスファー学習手法を提案する。
- 参考スコア(独自算出の注目度): 0.5156484100374059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-estate image tagging is one of the essential use-cases to save efforts
involved in manual annotation and enhance the user experience. This paper
proposes an end-to-end pipeline (referred to as RE-Tagger) for the real-estate
image classification problem. We present a two-stage transfer learning approach
using custom InceptionV3 architecture to classify images into different
categories (i.e., bedroom, bathroom, kitchen, balcony, hall, and others).
Finally, we released the application as REST API hosted as a web application
running on 2 cores machine with 2 GB RAM. The demo video is available here.
- Abstract(参考訳): リアルタイム画像タグ付けは、手動アノテーションに関わる労力を省き、ユーザエクスペリエンスを向上させるために不可欠なユースケースの1つです。
本稿では,リアルタイム画像分類問題に対するエンドツーエンドパイプライン(RE-Tagger)を提案する。
本稿では,カスタムインセプションv3アーキテクチャを用いた2段階のトランスファー学習アプローチを提案し,画像を異なるカテゴリ(寝室,浴室,キッチン,バルコニー,ホールなど)に分類する。
最後に、2GBのRAMを持つ2コアマシン上で動作するWebアプリケーションとしてホストされたREST APIとしてアプリケーションをリリースしました。
デモビデオはここにある。
関連論文リスト
- Image2Struct: Benchmarking Structure Extraction for Vision-Language Models [57.531922659664296]
Image2Structは、画像から構造を抽出する際のビジョンピクセルモデル(VLM)を評価するためのベンチマークである。
Image2Structでは、VLMが入力画像から基盤構造を生成するように促される。
そして、構造を描画して出力画像を生成し、入力画像と比較して類似度スコアを生成する。
論文 参考訳(メタデータ) (2024-10-29T18:44:59Z) - RAFIC: Retrieval-Augmented Few-shot Image Classification [0.0]
少ないショット画像分類は、見えない画像を互いに排他的なクラスに分類するタスクである。
我々は,検索した画像の付加集合を用いて,Kの集合を増大させる手法を開発した。
我々は,RAFICが2つの挑戦的データセットをまたいだ数ショット画像分類の性能を著しく向上させることを実証した。
論文 参考訳(メタデータ) (2023-12-11T22:28:51Z) - Reference-based Image and Video Super-Resolution via C2-Matching [100.0808130445653]
本稿では,C2-Matchingを提案する。
C2-Matchingは、標準的なCUFED5ベンチマークにおいて、最先端のアーツを著しく上回っている。
また、類似シーンで撮影された画像がHR参照画像として機能するため、C2-Matchingを参照ベースでビデオスーパーリゾリューションタスクに拡張する。
論文 参考訳(メタデータ) (2022-12-19T16:15:02Z) - Transductive Decoupled Variational Inference for Few-Shot Classification [2.538209532048867]
ほとんどショットの学習は、この機能をマシンに渡すための努力だ。
少数ショット分類のための新しい変分推論ネットワーク(TRIDENT)を提案する。
我々は、新しいアテンションベースのトランスダクティブ特徴抽出モジュール(AttFEXと呼ぶ)を使用して、クエリと数ショットタスクのサポート両方の情報を利用する。
論文 参考訳(メタデータ) (2022-08-22T19:27:09Z) - TINYCD: A (Not So) Deep Learning Model For Change Detection [68.8204255655161]
変化検出(CD)の目的は、同じ領域で発生した変化を異なる時間に撮影された2つの画像を比較して検出することである。
ディープラーニングの分野での最近の進歩により、研究者はこの分野で卓越した成果を得られるようになった。
我々はTinyCDと呼ばれる新しいモデルを提案し、軽量かつ効果的であることを実証した。
論文 参考訳(メタデータ) (2022-07-26T19:28:48Z) - Matching Feature Sets for Few-Shot Image Classification [22.84472344406448]
セットベースの表現は本質的に、ベースクラスからの画像のよりリッチな表現を構築します。
私たちのアプローチは、SetFeatと呼ばれ、既存のエンコーダアーキテクチャに浅い自己アテンションメカニズムを組み込んでいます。
論文 参考訳(メタデータ) (2022-04-02T22:42:54Z) - Palette: Image-to-Image Diffusion Models [50.268441533631176]
我々は条件付き拡散モデルを用いた画像から画像への変換のためのシンプルで一般的なフレームワークであるPaletteを紹介する。
4つの困難な画像から画像への変換タスクにおいて、Paletteは強力なGANと回帰ベースラインを上回っている。
本稿では、FID、インセプションスコア、事前訓練されたResNet-50の分類精度、参照画像に対する知覚距離などのサンプル品質スコアについて報告する。
論文 参考訳(メタデータ) (2021-11-10T17:49:29Z) - Subspace Representation Learning for Few-shot Image Classification [105.7788602565317]
少数の画像分類タスクに対処するサブスペース表現学習フレームワークを提案する。
画像を表すためにローカルCNN機能空間のサブスペースを利用し、重み付きサブスペース距離(WSD)に従って2つの画像間の類似度を測定します。
論文 参考訳(メタデータ) (2021-05-02T02:29:32Z) - Memory-Augmented Reinforcement Learning for Image-Goal Navigation [67.3963444878746]
本論文では,クロスエピソードメモリを活用したナビゲーション学習法を提案する。
オーバーフィッティングを避けるため、トレーニング中にRGB入力にデータ拡張を適用することを提案する。
この競合性能はRGB入力のみから得られるが,位置や深度などのセンサは利用できない。
論文 参考訳(メタデータ) (2021-01-13T16:30:20Z) - DISIR: Deep Image Segmentation with Interactive Refinement [26.087244189340858]
本稿では,空中画像のマルチクラスセグメンテーションのためのインタラクティブなアプローチを提案する。
RGBイメージとアノテーションの両方を活用するディープニューラルネットワークに基づいている。
クリックごとに約5000ピクセルが修正されます。
論文 参考訳(メタデータ) (2020-03-31T13:37:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。