論文の概要: Diagram Image Retrieval using Sketch-Based Deep Learning and Transfer
Learning
- arxiv url: http://arxiv.org/abs/2004.10780v1
- Date: Wed, 22 Apr 2020 18:27:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 18:32:36.389340
- Title: Diagram Image Retrieval using Sketch-Based Deep Learning and Transfer
Learning
- Title(参考訳): スケッチに基づくディープラーニングと転送学習を用いたダイアグラム画像検索
- Authors: Manish Bhattarai, Diane Oyen, Juan Castorena, Liping Yang, Brendt
Wohlberg
- Abstract要約: 本稿では,画像に基づく二元特許画像検索のための深層学習手法を提案する。
まず、深層学習を用いて自然画像からスケッチを生成し、画像検索を行う。
次に、手動でラベル付けした特許図画像の小さなセットをトランスファーラーニングを使って、自然画像のスケッチから図への画像検索に適応させます。
- 参考スコア(独自算出の注目度): 28.31395148295604
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Resolution of the complex problem of image retrieval for diagram images has
yet to be reached. Deep learning methods continue to excel in the fields of
object detection and image classification applied to natural imagery. However,
the application of such methodologies applied to binary imagery remains limited
due to lack of crucial features such as textures,color and intensity
information. This paper presents a deep learning based method for image-based
search for binary patent images by taking advantage of existing large natural
image repositories for image search and sketch-based methods (Sketches are not
identical to diagrams, but they do share some characteristics; for example,
both imagery types are gray scale (binary), composed of contours, and are
lacking in texture).
We begin by using deep learning to generate sketches from natural images for
image retrieval and then train a second deep learning model on the sketches. We
then use our small set of manually labeled patent diagram images via transfer
learning to adapt the image search from sketches of natural images to diagrams.
Our experiment results show the effectiveness of deep learning with transfer
learning for detecting near-identical copies in patent images and querying
similar images based on content.
- Abstract(参考訳): 図形画像に対する画像検索の複雑な問題の解決は、まだ至っていない。
深層学習法は、自然画像に適用された物体の検出と画像分類の分野において、引き続き優れている。
しかしながら,テクスチャや色彩,強度情報といった重要な特徴が欠如しているため,バイナリ画像に適用する手法の適用は限られている。
本稿では,画像検索やスケッチベース手法において,既存の大規模自然画像リポジトリを活用して,画像に基づく2元特許画像検索を行う深層学習手法を提案する。
まず、深層学習を用いて自然画像からスケッチを生成して画像検索を行い、それからスケッチ上で第2の深層学習モデルを訓練する。
次に、手動でラベル付けした特許図画像の小さなセットをトランスファーラーニングを用いて、自然画像のスケッチから図への画像検索に適応させる。
本実験では,特許画像における同一に近いコピーの検出と類似画像の検索における転送学習を用いた深層学習の有効性を示す。
関連論文リスト
- Detecting Generated Images by Real Images Only [64.12501227493765]
既存の画像検出手法は、生成画像中の視覚的アーティファクトを検出したり、大規模なトレーニングによって、実画像と生成画像の両方から識別的特徴を学習する。
本稿では,新たな視点から生成した画像検出問題にアプローチする。
実画像の共通性を見つけ、特徴空間内の密接な部分空間にマッピングすることで、生成した画像は生成モデルに関係なくサブ空間の外側に投影される。
論文 参考訳(メタデータ) (2023-11-02T03:09:37Z) - Adapt and Align to Improve Zero-Shot Sketch-Based Image Retrieval [85.39613457282107]
スケッチに基づく画像検索のクロスドメイン性は困難である。
重要な課題に対処する効果的なAdaptとAlignのアプローチを提案する。
ゼロショットシナリオにおける画像テキスト基盤モデル(例えばCLIP)の最近の進歩に触発されて、学習したイメージの埋め込みを、より意味的なテキスト埋め込みと明確に整合させ、見知らぬクラスから見つからないクラスへの所望の知識伝達を実現する。
論文 参考訳(メタデータ) (2023-05-09T03:10:15Z) - Sketch2Saliency: Learning to Detect Salient Objects from Human Drawings [99.9788496281408]
本研究では,スケッチを弱いラベルとして使用して,画像中の有能な物体を検出する方法について検討する。
これを実現するために,与えられた視覚写真に対応する逐次スケッチ座標を生成することを目的としたフォト・ツー・スケッチ生成モデルを提案する。
テストは、私たちの仮説を証明し、スケッチベースの唾液度検出モデルが、最先端技術と比較して、競争力のあるパフォーマンスを提供する方法を明確にします。
論文 参考訳(メタデータ) (2023-03-20T23:46:46Z) - Three-Stream Joint Network for Zero-Shot Sketch-Based Image Retrieval [15.191262439963221]
ZS-SBIR(Zero-Shot Sketch-based Image Retrieval)は、スケッチと自然画像の間に大きな領域ギャップがあるため、難しい課題である。
本稿では,ZS-SBIRタスクのための3ストリーム共同学習ネットワーク(JOIN)を提案する。
論文 参考訳(メタデータ) (2022-04-12T09:52:17Z) - Texture for Colors: Natural Representations of Colors Using Variable
Bit-Depth Textures [13.180922099929765]
そこで本研究では,画像の強度だけでなく,元の色も表わす2値テクスチャの組に画像が変換される自動手法を提案する。
このシステムは、様々な画像ソースでテストすると、美的にバイナリイメージを満足させる。
論文 参考訳(メタデータ) (2021-05-04T21:22:02Z) - Insights From A Large-Scale Database of Material Depictions In Paintings [18.2193253052961]
本稿では,視覚認識システムと美術品で利用可能な豊富な情報との関係について検討する。
自然画像用に設計された視覚認識システムは、絵画で驚くほどうまく機能する。
絵画からの学習は、自然画像に使用されることを意図したニューラルネットワークにとって有益であることを示す。
論文 参考訳(メタデータ) (2020-11-24T18:42:58Z) - SketchEmbedNet: Learning Novel Concepts by Imitating Drawings [125.45799722437478]
モデルを用いて画像のスケッチを作成することによって学習した画像表現の特性について検討する。
この生成型クラスに依存しないモデルでは,新規な例,クラス,さらには新規なデータセットからの画像の情報埋め込みが,数ショットで生成されることが示されている。
論文 参考訳(メタデータ) (2020-08-27T16:43:28Z) - Cross-Modal Hierarchical Modelling for Fine-Grained Sketch Based Image
Retrieval [147.24102408745247]
我々は、これまで見過ごされてきたスケッチのさらなる特性、すなわち、詳細レベルの階層性について研究する。
本稿では,スケッチ固有の階層を育成し,それを利用して,対応する階層レベルでのスケッチと写真とのマッチングを行う新しいネットワークを設計する。
論文 参考訳(メタデータ) (2020-07-29T20:50:25Z) - Learning Spatial Relationships between Samples of Patent Image Shapes [14.37369942979269]
深層学習(DL)の成功を橋渡しするバイナリ画像に適した手法を提案する。
本手法は、二元画像から興味の形状を抽出し、非ユークリッド幾何学的ニューラルネットワークアーキテクチャを適用して、形状の局所的および大域的空間的関係を学習する。
論文 参考訳(メタデータ) (2020-04-12T23:05:19Z) - Geometrically Mappable Image Features [85.81073893916414]
地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
本稿では,画像検索を対象とした画像特徴学習手法を提案する。
論文 参考訳(メタデータ) (2020-03-21T15:36:38Z) - Image retrieval approach based on local texture information derived from
predefined patterns and spatial domain information [14.620086904601472]
提案手法の性能は,Simplicityデータベース上での精度とリコールの観点から評価する。
比較の結果,提案手法は既知の多くの手法よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2019-12-30T16:11:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。