論文の概要: Guided Generative Models using Weak Supervision for Detecting Object
Spatial Arrangement in Overhead Images
- arxiv url: http://arxiv.org/abs/2112.05786v1
- Date: Fri, 10 Dec 2021 19:14:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 15:11:44.227751
- Title: Guided Generative Models using Weak Supervision for Detecting Object
Spatial Arrangement in Overhead Images
- Title(参考訳): 頭上画像における物体空間配置検出のための弱監視を用いた誘導生成モデル
- Authors: Weiwei Duan, Yao-Yi Chiang, Stefan Leyk, Johannes H. Uhl, Craig A.
Knoblock
- Abstract要約: 本稿では,変分自動エンコーダ(VAE)フレームワークに基づくターゲット誘導生成モデル(TGGM)を提案する。
実験の結果,TGGMは最先端の半教師あり手法に匹敵する結果が得られることがわかった。
- 参考スコア(独自算出の注目度): 5.5042961659167045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The increasing availability and accessibility of numerous overhead images
allows us to estimate and assess the spatial arrangement of groups of
geospatial target objects, which can benefit many applications, such as traffic
monitoring and agricultural monitoring. Spatial arrangement estimation is the
process of identifying the areas which contain the desired objects in overhead
images. Traditional supervised object detection approaches can estimate
accurate spatial arrangement but require large amounts of bounding box
annotations. Recent semi-supervised clustering approaches can reduce manual
labeling but still require annotations for all object categories in the image.
This paper presents the target-guided generative model (TGGM), under the
Variational Auto-encoder (VAE) framework, which uses Gaussian Mixture Models
(GMM) to estimate the distributions of both hidden and decoder variables in
VAE. Modeling both hidden and decoder variables by GMM reduces the required
manual annotations significantly for spatial arrangement estimation. Unlike
existing approaches that the training process can only update the GMM as a
whole in the optimization iterations (e.g., a "minibatch"), TGGM allows the
update of individual GMM components separately in the same optimization
iteration. Optimizing GMM components separately allows TGGM to exploit the
semantic relationships in spatial data and requires only a few labels to
initiate and guide the generative process. Our experiments shows that TGGM
achieves results comparable to the state-of-the-art semi-supervised methods and
outperforms unsupervised methods by 10% based on the $F_{1}$ scores, while
requiring significantly fewer labeled data.
- Abstract(参考訳): 多数のオーバヘッドイメージの可用性とアクセシビリティの増大により,地理空間対象オブジェクトのグループの空間配置を推定し,評価することが可能となり,交通監視や農業監視など,多くの応用が期待できる。
空間配置推定は、頭上画像に所望のオブジェクトを含む領域を識別するプロセスである。
従来の教師付きオブジェクト検出手法は正確な空間配置を推定できるが、大量の境界ボックスアノテーションを必要とする。
最近の半教師付きクラスタリングアプローチは手動ラベリングを減らすことができるが、画像内のすべてのオブジェクトカテゴリに対してアノテーションを必要とする。
本稿では,Gaussian Mixture Models (GMM) を用いて,VAEにおける隠れ変数とデコーダ変数の両方の分布を推定する,変分自動エンコーダ(VAE)フレームワークに基づくターゲット誘導生成モデル(TGGM)を提案する。
GMMによる隠れ変数と復号変数の両方のモデリングは、空間配置推定に必要なマニュアルアノテーションを大幅に削減する。
トレーニングプロセスが最適化イテレーション(例:"minibatch")でのみGMMを更新できる既存のアプローチとは異なり、TGGMは個別のGMMコンポーネントを同じ最適化イテレーションで別々に更新することができる。
GMMコンポーネントを個別に最適化することで、TGGMは空間データのセマンティックな関係を活用でき、生成プロセスを開始するためのラベルはわずかである。
実験の結果、TGGMは最先端の半教師付き手法に匹敵する結果を達成し、F_{1}$スコアに基づいて教師なし手法を10%上回り、ラベル付きデータをはるかに少なくすることがわかった。
関連論文リスト
- Learning a Mini-batch Graph Transformer via Two-stage Interaction Augmentation [34.969019293698885]
Mini-batch Graph Transformer (MGT) は、半教師付きノード予測タスクにおいて大きな利点を示している。
各ミニバッチにおけるノード数の制限は、グラフのグローバルな特性を捉えるためのモデルの容量を制限する。
LGMformerは,2段階の拡張現実戦略を取り入れた新しいMGTモデルである。
論文 参考訳(メタデータ) (2024-07-13T14:42:22Z) - ProtoGMM: Multi-prototype Gaussian-Mixture-based Domain Adaptation Model for Semantic Segmentation [0.8213829427624407]
ドメイン適応型セマンティックセグメンテーションは、ラベルのないターゲットドメインに対して正確で高密度な予測を生成することを目的としている。
本稿では,GMMを比較学習に組み込んだProtoGMMモデルを提案する。
クラス間のセマンティックな類似性の向上,クラス間の類似性の低下,およびソースドメインとターゲットドメイン間のドメインアライメントを実現するために,マルチプロトタイプコントラスト学習を採用する。
論文 参考訳(メタデータ) (2024-06-27T14:50:50Z) - Domain Adaptive Segmentation of Electron Microscopy with Sparse Point
Annotations [2.5137859989323537]
競争性能に優れたアノテーション効率のアプローチを開発する。
弱教師付きドメイン適応(WDA)に極端にスパースで弱いアノテーションのタイプで焦点を当てる。
15%のポイントアノテーションしか持たないモデルでは、教師付きモデルと同等のパフォーマンスが得られることを示す。
論文 参考訳(メタデータ) (2022-10-24T10:50:37Z) - Towards Robust Adaptive Object Detection under Noisy Annotations [40.25050610617893]
既存のメソッドでは、ソースドメインラベルは完全にクリーンだが、大規模なデータセットにはインスタンスの曖昧さのためにエラーが発生しやすいアノテーションが含まれることが多い。
本稿では,この問題に対処するためのノイズ遅延伝達可能性探索フレームワークを提案する。
NLTEは、60%の破損したアノテーションの下でmAPを8.4%改善し、クリーンソースデータセットでのトレーニングの理想的な上限にアプローチする。
論文 参考訳(メタデータ) (2022-04-06T07:02:37Z) - Domain Generalisation for Object Detection under Covariate and Concept Shift [10.32461766065764]
ドメインの一般化は、ドメイン固有の特徴を抑えながら、ドメイン不変の機能の学習を促進することを目的としている。
オブジェクト検出のためのドメイン一般化手法を提案し, オブジェクト検出アーキテクチャに適用可能な最初のアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-10T11:14:18Z) - META: Mimicking Embedding via oThers' Aggregation for Generalizable
Person Re-identification [68.39849081353704]
Domain Generalizable (DG) Person Re-identification (ReID)は、トレーニング時に対象のドメインデータにアクセスすることなく、見えないドメインをまたいでテストすることを目的としている。
本稿では,DG ReID のための OThers' Aggregation (META) を用いた Mimicking Embedding という新しい手法を提案する。
論文 参考訳(メタデータ) (2021-12-16T08:06:50Z) - Score-based Generative Modeling in Latent Space [93.8985523558869]
スコアベース生成モデル(SGM)は,最近,サンプル品質と分布範囲の両面で顕著な結果を示した。
本稿では,Latent Score-based Generative Model (LSGM)を提案する。
データから潜在空間への移動により、より表現力のある生成モデルをトレーニングし、非連続データにSGMを適用し、よりスムーズなSGMをより小さな空間で学習することができる。
論文 参考訳(メタデータ) (2021-06-10T17:26:35Z) - Cauchy-Schwarz Regularized Autoencoder [68.80569889599434]
変分オートエンコーダ(VAE)は、強力で広く使われている生成モデルのクラスである。
GMMに対して解析的に計算できるCauchy-Schwarz分散に基づく新しい制約対象を導入する。
本研究の目的は,密度推定,教師なしクラスタリング,半教師なし学習,顔分析における変分自動エンコーディングモデルの改善である。
論文 参考訳(メタデータ) (2021-01-06T17:36:26Z) - Self-Guided Adaptation: Progressive Representation Alignment for Domain
Adaptive Object Detection [86.69077525494106]
非教師なしドメイン適応(UDA)は、オブジェクト検出モデルのドメイン間ロバスト性を改善するために前例のない成功を収めた。
既存のUDA手法は、モデル学習中の瞬間的なデータ分布を無視しており、大きなドメインシフトによって特徴表現が劣化する可能性がある。
本稿では、特徴表現の整合とドメイン間のオブジェクト検出モデルの転送を目標とする自己ガイド適応モデルを提案する。
論文 参考訳(メタデータ) (2020-03-19T13:30:45Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z) - Semi-Supervised Learning with Normalizing Flows [54.376602201489995]
FlowGMMは、フローの正規化を伴う生成半教師付き学習におけるエンドツーエンドのアプローチである。
我々は AG-News や Yahoo Answers のテキストデータなど,幅広いアプリケーションに対して有望な結果を示す。
論文 参考訳(メタデータ) (2019-12-30T17:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。