論文の概要: Coarse-to-fine Task-driven Inpainting for Geoscience Images
- arxiv url: http://arxiv.org/abs/2211.11059v1
- Date: Sun, 20 Nov 2022 19:14:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 20:33:56.607303
- Title: Coarse-to-fine Task-driven Inpainting for Geoscience Images
- Title(参考訳): 地球科学画像のための粗大なタスク駆動型塗装
- Authors: Sun Huiming and Ma Jin and Guo Qing and Song Shaoyue and Yuewei Lin
and Yu Hongkai
- Abstract要約: 本稿では,高度可視化品質を同時に向上させるため,閉鎖領域の修復を目標とする。
地学画像の複雑なコンテキストから,粗大から細大のエンコーダ・デコーダネットワークを提案する。
- 参考スコア(独自算出の注目度): 1.7741871563668714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The processing and recognition of geoscience images have wide applications.
Most of existing researches focus on understanding the high-quality geoscience
images by assuming that all the images are clear. However, in many real-world
cases, the geoscience images might contain occlusions during the image
acquisition. This problem actually implies the image inpainting problem in
computer vision and multimedia. To the best of our knowledge, all the existing
image inpainting algorithms learn to repair the occluded regions for a better
visualization quality, they are excellent for natural images but not good
enough for geoscience images by ignoring the geoscience related tasks. This
paper aims to repair the occluded regions for a better geoscience task
performance with the advanced visualization quality simultaneously, without
changing the current deployed deep learning based geoscience models. Because of
the complex context of geoscience images, we propose a coarse-to-fine
encoder-decoder network with coarse-to-fine adversarial context discriminators
to reconstruct the occluded image regions. Due to the limited data of
geoscience images, we use a MaskMix based data augmentation method to exploit
more information from limited geoscience image data. The experimental results
on three public geoscience datasets for remote sensing scene recognition,
cross-view geolocation and semantic segmentation tasks respectively show the
effectiveness and accuracy of the proposed method.
- Abstract(参考訳): 地学画像の処理と認識は広く応用されている。
既存の研究のほとんどは、すべての画像が明確であると仮定して、高品質な地球科学画像を理解することに焦点を当てている。
しかし、現実世界の多くのケースでは、画像取得中にジオサイエンス画像には隠蔽が含まれている可能性がある。
この問題は、コンピュータビジョンとマルチメディアにおけるイメージインペイントの問題を意味している。
我々の知る限り、既存の画像インペイントアルゴリズムはすべて、閉鎖された領域をより良い視認性で修復することを学ぶが、自然画像には優れているが、地学関連のタスクを無視して、地学画像には不十分である。
本稿では,現在デプロイされている深層学習に基づくジオサイエンスモデルを変更することなく,高度な可視化品質と同時に,より優れたジオサイエンスタスクパフォーマンスを実現するため,オクルード領域を修復することを目的とする。
地理科学画像の複雑な文脈から,粗大から細かなエンコーダ・デコーダネットワークを提案する。
地学画像の限られたデータのために,MaskMixに基づくデータ拡張手法を用いて,限られた地学画像データからより多くの情報を利用する。
リモートセンシングシーン認識, クロスビュージオロケーション, セマンティックセグメンテーションタスクのための3つの公開地科学データセットの実験結果は, 提案手法の有効性と精度を示している。
関連論文リスト
- Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - Where We Are and What We're Looking At: Query Based Worldwide Image
Geo-localization Using Hierarchies and Scenes [53.53712888703834]
地理的レベルの異なる関係を利用して、エンドツーエンドのトランスフォーマーベースのアーキテクチャを導入する。
4つの標準ジオローカライゼーションデータセット上で,アートストリートレベルの精度を実現する。
論文 参考訳(メタデータ) (2023-03-07T21:47:58Z) - Revisiting Near/Remote Sensing with Geospatial Attention [24.565068569913382]
本研究は、地上レベルの補助画像が利用できる場合のオーバーヘッド画像分割の課題に対処する。
近年の研究では、近接・遠隔センシングと呼ばれる2つのモードで共同推論を行うことで、精度が大幅に向上することが示されている。
地平面画像中の画素と地理的位置との地理空間的関係を明確に考察する幾何学的注意機構である地理空間的注意の概念を導入する。
論文 参考訳(メタデータ) (2022-04-04T19:19:50Z) - Accurate 3-DoF Camera Geo-Localization via Ground-to-Satellite Image
Matching [102.39635336450262]
地上で取得したクエリ画像とジオタグ付き衛星画像の大規模データベースとをマッチングすることにより、地上から衛星画像のジオローカライズの問題に対処する。
我々の新しい手法は、衛星画像のピクセルサイズの精度まで、クエリー画像のきめ細かい位置を達成できる。
論文 参考訳(メタデータ) (2022-03-26T20:10:38Z) - Visual and Object Geo-localization: A Comprehensive Survey [11.120155713865918]
ジオローカライゼーション(ジオローカライゼーション)とは、地球上の「ある実体がどこにあるか」を決定する過程のこと。
本稿では、画像の撮影場所(画像ジオローカライゼーション)や画像内の物体の位置決め(オブジェクトジオローカライゼーション)を含む、画像を含む画像の地理的ローカライゼーションに関する包括的調査を行う。
本稿では、一般的なアルゴリズムの要約、提案したデータセットの説明、各分野の現状を説明するためのパフォーマンス結果の分析など、詳細な研究を行う。
論文 参考訳(メタデータ) (2021-12-30T20:46:53Z) - High Definition image classification in Geoscience using Machine
Learning [0.0]
ドローンで撮影されたHDデジタル写真は、地球科学の研究で広く使われている。
ぼやけた画像はしばしば収集されたデータで撮影され、ぼやけた画像とはっきりした画像を区別するのに多くの時間と労力がかかります。
本研究では,SVM(Support Vector Machine)やNN(Neural Network)などの機械学習技術を用いて,GeoscienceのHDイメージを明瞭でぼやけたものとして分類する。
論文 参考訳(メタデータ) (2020-09-25T17:30:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。