論文の概要: Augmentation Invariance and Adaptive Sampling in Semantic Segmentation
of Agricultural Aerial Images
- arxiv url: http://arxiv.org/abs/2204.07969v1
- Date: Sun, 17 Apr 2022 10:19:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-19 16:06:31.556845
- Title: Augmentation Invariance and Adaptive Sampling in Semantic Segmentation
of Agricultural Aerial Images
- Title(参考訳): 農業用空中画像の意味セグメンテーションにおける拡張不変性と適応サンプリング
- Authors: Antonio Tavera, Edoardo Arnaudo, Carlo Masone, Barbara Caputo
- Abstract要約: 農業用航空画像におけるセマンティックの問題点について検討する。
この作業に用いられている既存の手法は,2つの特徴を考慮せずに設計されている。
i) 上向きの視点に典型的な測光的および幾何学的シフトに不変な意味表現を学習するために、モデルに適切な拡張と整合性損失のセットを併用した2つのアイデアに基づく解を提案する。
本研究は,農業ビジョンデータセットを用いた広範囲な実験により,提案手法が現在の最先端手法の性能を向上させることを実証する。
- 参考スコア(独自算出の注目度): 16.101248613062292
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we investigate the problem of Semantic Segmentation for
agricultural aerial imagery. We observe that the existing methods used for this
task are designed without considering two characteristics of the aerial data:
(i) the top-down perspective implies that the model cannot rely on a fixed
semantic structure of the scene, because the same scene may be experienced with
different rotations of the sensor; (ii) there can be a strong imbalance in the
distribution of semantic classes because the relevant objects of the scene may
appear at extremely different scales (e.g., a field of crops and a small
vehicle). We propose a solution to these problems based on two ideas: (i) we
use together a set of suitable augmentation and a consistency loss to guide the
model to learn semantic representations that are invariant to the photometric
and geometric shifts typical of the top-down perspective (Augmentation
Invariance); (ii) we use a sampling method (Adaptive Sampling) that selects the
training images based on a measure of pixel-wise distribution of classes and
actual network confidence. With an extensive set of experiments conducted on
the Agriculture-Vision dataset, we demonstrate that our proposed strategies
improve the performance of the current state-of-the-art method.
- Abstract(参考訳): 本稿では,農業用航空画像におけるセマンティックセグメンテーションの問題点について考察する。
この課題に使用される既存の手法は,2つの特徴を考慮せずに設計されている。
(i)トップダウン視点は、同じシーンがセンサの異なる回転で体験される可能性があるため、モデルがシーンの一定の意味構造に依存しないことを意味する。
(ii)シーンの関連する対象が極めて異なる規模(作物の畑や小型車両など)で現れる可能性があるため、意味クラスの分布に強い不均衡が生じる可能性がある。
この問題に対する解決策を2つのアイデアに基づいて提案する。
(i)トップダウンの視点に典型的な測光的および幾何学的シフト(拡張不変性)に不変な意味表現を学習するために、適切な拡張と一貫性損失のセットを併用する(Augmentation Invariance)。
(ii)授業の画素単位分布と実際のネットワーク信頼度の測定に基づいて訓練画像を選択するサンプリング手法(適応サンプリング)を用いる。
農業用ビジョンデータセット上で行った広範囲な実験により,提案手法が現状の手法の性能を向上させることを実証する。
関連論文リスト
- Reducing Semantic Ambiguity In Domain Adaptive Semantic Segmentation Via Probabilistic Prototypical Pixel Contrast [7.092718945468069]
ドメイン適応は、ソースとターゲットドメイン間のドメインシフトに起因するターゲットドメインのモデル劣化を低減することを目的としています。
確率的原型画素コントラスト(probabilistic proto-typeal pixel contrast、PPPC)は、各画素の埋め込みを確率としてモデル化する普遍的な適応フレームワークである。
PPPCは、画素レベルでの曖昧さに対処するだけでなく、識別的表現をもたらすだけでなく、合成からリアルタイム、および日毎の適応タスクにおいて大きな改善をもたらす。
論文 参考訳(メタデータ) (2024-09-27T08:25:03Z) - SemFlow: Binding Semantic Segmentation and Image Synthesis via Rectified Flow [94.90853153808987]
セマンティックセグメンテーション(Semantic segmentation)とセマンティックイメージ合成(Semantic image synthesis)は、視覚知覚と生成において代表的なタスクである。
我々は、統一されたフレームワーク(SemFlow)を提案し、それらを2つの逆問題としてモデル化する。
実験の結果,セマンティックセグメンテーションとセマンティック画像合成タスクにおいて,セマンティックセグメンテーションと競合する結果が得られた。
論文 参考訳(メタデータ) (2024-05-30T17:34:40Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - Flow Factorized Representation Learning [109.51947536586677]
本稿では、異なる入力変換を定義する潜在確率パスの別個のセットを規定する生成モデルを提案する。
本モデルは,ほぼ同変モデルに近づきながら,標準表現学習ベンチマークにおいて高い確率を達成することを示す。
論文 参考訳(メタデータ) (2023-09-22T20:15:37Z) - COSE: A Consistency-Sensitivity Metric for Saliency on Image
Classification [21.3855970055692]
本稿では,画像分類タスクにおいて,視覚の先行値を用いてサリエンシ手法の性能を評価する指標について述べる。
しかし,ほとんどの手法では,畳み込みモデルよりもトランスフォーマーモデルの方がよく説明できる。
論文 参考訳(メタデータ) (2023-09-20T01:06:44Z) - Improving Diversity in Zero-Shot GAN Adaptation with Semantic Variations [61.132408427908175]
0ショットのGAN適応は、よく訓練されたジェネレータを再利用して、目に見えないターゲットドメインの画像を合成することを目的としている。
実際の画像の代わりに1つの代表的テキスト機能しか持たないため、合成された画像は徐々に多様性を損なう。
そこで本研究では,CLIP空間における対象テキストの意味的変化を見つけるための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-21T08:12:28Z) - Domain Adaptation for Medical Image Segmentation using
Transformation-Invariant Self-Training [7.738197566031678]
領域適応型変換不変自己学習(TI-ST)のための半教師付き学習戦略を提案する。
提案手法は,画素単位の擬似ラベルの信頼性を評価し,自己学習中の信頼できない検出をフィルタリングする。
論文 参考訳(メタデータ) (2023-07-31T13:42:56Z) - Weakly supervised segmentation with cross-modality equivariant
constraints [7.757293476741071]
弱い教師付き学習は、セマンティックセグメンテーションにおける大きなラベル付きデータセットの必要性を軽減するための魅力的な代替手段として登場した。
本稿では,マルチモーダル画像シナリオにおける自己スーパービジョンを活用した新しい学習戦略を提案する。
私たちのアプローチは、同じ学習条件下で関連する最近の文学を上回ります。
論文 参考訳(メタデータ) (2021-04-06T13:14:20Z) - Unsupervised Discovery of Disentangled Manifolds in GANs [74.24771216154105]
解釈可能な生成プロセスは、様々な画像編集アプリケーションに有用である。
本稿では,任意の学習された生成逆数ネットワークが与えられた潜在空間における解釈可能な方向を検出する枠組みを提案する。
論文 参考訳(メタデータ) (2020-11-24T02:18:08Z) - Semantic Change Detection with Asymmetric Siamese Networks [71.28665116793138]
2つの空中画像が与えられた場合、セマンティックチェンジ検出は、土地被覆のバリエーションを特定し、それらの変化タイプをピクセルワイド境界で識別することを目的としている。
この問題は、正確な都市計画や天然資源管理など、多くの地球ビジョンに関連するタスクにおいて不可欠である。
本研究では, 広く異なる構造を持つモジュールから得られた特徴対を用いて意味変化を同定し, 同定するための非対称システマネットワーク(ASN)を提案する。
論文 参考訳(メタデータ) (2020-10-12T13:26:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。