論文の概要: Modeling Extent-of-Texture Information for Ground Terrain Recognition
- arxiv url: http://arxiv.org/abs/2004.08141v2
- Date: Tue, 27 Oct 2020 10:03:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 13:25:46.477515
- Title: Modeling Extent-of-Texture Information for Ground Terrain Recognition
- Title(参考訳): 地形認識のためのテクスチャ幅情報モデリング
- Authors: Shuvozit Ghose, Pinaki Nath Chowdhury, Partha Pratim Roy, Umapada Pal
- Abstract要約: 本研究では,テクスチュア情報のモデル化による地上地層認識への新たなアプローチを提案する。
提案手法は,CNNのバックボーン特徴抽出ネットワークを用いて地上地形画像の有意義な情報を取得する。
実験結果から,既存の最先端技術よりも提案モデルの方が優れた性能を示した。
- 参考スコア(独自算出の注目度): 29.35376015981281
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ground Terrain Recognition is a difficult task as the context information
varies significantly over the regions of a ground terrain image. In this paper,
we propose a novel approach towards ground-terrain recognition via modeling the
Extent-of-Texture information to establish a balance between the order-less
texture component and ordered-spatial information locally. At first, the
proposed method uses a CNN backbone feature extractor network to capture
meaningful information of a ground terrain image, and model the extent of
texture and shape information locally. Then, the order-less texture information
and ordered shape information are encoded in a patch-wise manner, which is
utilized by intra-domain message passing module to make every patch aware of
each other for rich feature learning. Next, the Extent-of-Texture (EoT) Guided
Inter-domain Message Passing module combines the extent of texture and shape
information with the encoded texture and shape information in a patch-wise
fashion for sharing knowledge to balance out the order-less texture information
with ordered shape information. Further, Bilinear model generates a pairwise
correlation between the order-less texture information and ordered shape
information. Finally, the ground-terrain image classification is performed by a
fully connected layer. The experimental results indicate superior performance
of the proposed model over existing state-of-the-art techniques on publicly
available datasets like DTD, MINC and GTOS-mobile.
- Abstract(参考訳): 地上地形画像の領域でコンテキスト情報が大きく変化するため,地上地形認識は難しい課題である。
本稿では,テクスチャ成分と順序空間情報のバランスを局所的に確立するために,テクスチャの幅をモデル化し,地中認識への新しいアプローチを提案する。
提案手法はまず,CNNのバックボーン特徴抽出ネットワークを用いて地形画像の有意義な情報を取得し,テクスチャや形状情報を局所的にモデル化する。
そして、注文のないテクスチャ情報と注文された形状情報をパッチ単位でエンコードし、ドメイン内メッセージパッシングモジュールが利用し、各パッチが互いに認識してリッチな特徴学習を行う。
次に、Extent-of-Texture(EoT)ガイド付きドメイン間メッセージパッシングモジュールは、テクスチャと形状情報の範囲を符号化されたテクスチャと形状情報とをパッチワイズで組み合わせて、秩序のないテクスチャ情報と秩序のない形状情報とのバランスをとる。
さらに、バイリニアモデルは、順序のないテクスチャ情報と順序付き形状情報とのペアワイズ相関を生成する。
最後に、全連結層により地上画像分類を行う。
実験結果から,DTD,MINC,GTOS-mobileなどの公開データセット上で,既存の最先端技術よりも提案モデルの方が優れた性能を示した。
関連論文リスト
- Neural Texture Puppeteer: A Framework for Neural Geometry and Texture
Rendering of Articulated Shapes, Enabling Re-Identification at Interactive
Speed [2.8544822698499255]
我々はニューラルテクスチュア Puppeteer と呼ぶテクスチャ化された形状のためのニューラルレンダリングパイプラインを提案する。
テクスチャオートエンコーダは、この情報を利用して、テクスチャ化された画像をグローバルな潜在コードにエンコードする。
本手法は,データに制限がある絶滅危惧種に適用できる。
論文 参考訳(メタデータ) (2023-11-28T10:51:05Z) - Geo-Tiles for Semantic Segmentation of Earth Observation Imagery [7.49377967268953]
既存の手法とベンチマークデータセットは、ピクセルベースのタイリングスキームや、Webマッピングアプリケーションで使用されるジオタイリングスキームに依存している。
異種データに基づくジオタイルを生成するタイリング方式を用いて,地球観測画像のための新しいセグメンテーションパイプラインを提案する。
このアプローチは、ピクセルベースの、あるいは一般的なWebマッピングアプローチと比較して、いくつかの有益な特性を示す。
提案システムは,現在最先端のセマンティックセグメンテーションモデルの結果を改善することができることを示す。
論文 参考訳(メタデータ) (2023-06-01T15:46:04Z) - Delving Globally into Texture and Structure for Image Inpainting [20.954875933730808]
画像の塗布は目覚ましい進歩を遂げ、豊富な手法にインスピレーションを与え、重要なボトルネックは、マスキング領域における高周波構造と低周波テクスチャ情報のセマンティクスを満たす方法として特定される。
本稿では,テクスチャと構造情報を世界規模で探索し,画像インペイントのセマンティクスをうまく把握する。
我々のモデルは、テクスチャと構造情報の観点から、コナールニューラルネットワーク(CNN)やアテンション、トランスフォーマーモデルといったファッショナブルな芸術への進化である。
論文 参考訳(メタデータ) (2022-09-17T02:19:26Z) - Modeling Image Composition for Complex Scene Generation [77.10533862854706]
本稿では,レイアウト・ツー・イメージ生成タスクにおける最先端結果を実現する手法を提案する。
本稿では,RGB画像をパッチトークンに圧縮した後,オブジェクト・トゥ・オブジェクト,オブジェクト・トゥ・パッチ,パッチ・トゥ・パッチの依存関係を探索するTransformer with Focal Attention (TwFA)を提案する。
論文 参考訳(メタデータ) (2022-06-02T08:34:25Z) - Content-aware Warping for View Synthesis [110.54435867693203]
本稿では,比較的大きな近傍の画素の重みを,軽量ニューラルネットワークによる文脈情報から適応的に学習するコンテンツ認識ワープを提案する。
この学習可能なワープモジュールに基づいて、2つのソースビューから新しいビューを合成するエンド・ツー・エンドの学習ベースのフレームワークを提案する。
広いベースラインと非構造的多視点データセットを有する構造的光フィールドデータセットの実験結果から,提案手法は,定量的かつ視覚的に,最先端の手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2022-01-22T11:35:05Z) - Texture Generation with Neural Cellular Automata [64.70093734012121]
一つのテンプレート画像からテクスチャジェネレータを学習する。
NCAモデルで示される振る舞いは、テクスチャを生成するための学習された分散されたローカルアルゴリズムであると主張します。
論文 参考訳(メタデータ) (2021-05-15T22:05:46Z) - Deep Video Matting via Spatio-Temporal Alignment and Aggregation [63.6870051909004]
新たな集計機能モジュール(STFAM)を用いた深層学習型ビデオマッチングフレームワークを提案する。
フレーム毎のトリマップアノテーションを排除するため、軽量なインタラクティブなトリマップ伝搬ネットワークも導入されている。
私達のフレームワークは従来のビデオ マットおよび深いイメージのマットの方法よりかなり優秀です。
論文 参考訳(メタデータ) (2021-04-22T17:42:08Z) - Deep Texture-Aware Features for Camouflaged Object Detection [69.84122372541506]
本稿では, テクスチャ認識モジュールを定式化し, 深層畳み込みニューラルネットワークにおけるテクスチャ認識の特徴を学習する。
我々は,キャモフラージュされた物体検出のためのベンチマークデータセット上で,定性的かつ定量的にネットワークを評価した。
論文 参考訳(メタデータ) (2021-02-05T04:38:32Z) - Texture image classification based on a pseudo-parabolic diffusion model [0.0]
提案手法は、確立されたベンチマークテクスチャデータベースの分類と、植物種認識の実践的な課題について検証する。
画像の同種領域内では、擬似放物的演算子が、うる限りノイズの多い詳細を滑らかにすることができることで、優れた性能を大いに正当化することができる。
論文 参考訳(メタデータ) (2020-11-14T00:04:07Z) - Region-adaptive Texture Enhancement for Detailed Person Image Synthesis [86.69934638569815]
RATE-Netは、シャープなテクスチャで人物画像を合成するための新しいフレームワークである。
提案するフレームワークは,テクスチャ強化モジュールを利用して,画像から外観情報を抽出する。
DeepFashionベンチマークデータセットで実施された実験は、既存のネットワークと比較して、我々のフレームワークの優位性を実証した。
論文 参考訳(メタデータ) (2020-05-26T02:33:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。