Fugu-MT 論文翻訳(概要): SegForestNet: Spatial-Partitioning-Based Aerial Image Segmentation

論文の概要: SegForestNet: Spatial-Partitioning-Based Aerial Image Segmentation

arxiv url: http://arxiv.org/abs/2302.01585v1
Date: Fri, 3 Feb 2023 07:35:53 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-06 16:53:48.696003
Title: SegForestNet: Spatial-Partitioning-Based Aerial Image Segmentation
Title（参考訳）: SegForestNet: 空間分割に基づく空中画像分割
Authors: Daniel Gritzner, J\"orn Ostermann
Abstract要約: 本稿では,二分空間分割木を予測するディープラーニングモデルを改良する。また,予測木によって定義された空間分割を改善するために,新たな損失関数を設計する。提案モデルでは,小さいバックボーンモデルを使用する場合のモデルパラメータを最大60%,大きなバックボーンモデルを使用する場合のモデルパラメータを最大20%削減しながら,最先端の性能を実現する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Aerial image analysis, specifically the semantic segmentation thereof, is the basis for applications such as automatically creating and updating maps, tracking city growth, or tracking deforestation. In true orthophotos, which are often used in these applications, many objects and regions can be approximated well by polygons. However, this fact is rarely exploited by state-of-the-art semantic segmentation models. Instead, most models allow unnecessary degrees of freedom in their predictions by allowing arbitrary region shapes. We therefore present a refinement of our deep learning model which predicts binary space partitioning trees, an efficient polygon representation. The refinements include a new feature decoder architecture and a new differentiable BSP tree renderer which both avoid vanishing gradients. Additionally, we designed a novel loss function specifically designed to improve the spatial partitioning defined by the predicted trees. Furthermore, our expanded model can predict multiple trees at once and thus can predict class-specific segmentations. Taking all modifications together, our model achieves state-of-the-art performance while using up to 60% fewer model parameters when using a small backbone model or up to 20% fewer model parameters when using a large backbone model.
Abstract（参考訳）: 航空画像解析、特にセマンティックセグメンテーションは、地図の自動作成や更新、都市の成長の追跡、森林破壊の追跡といった応用の基盤である。これらの用途でよく用いられる真の直交写真では、多くの物体や領域は多角形によってよく近似することができる。しかし、この事実は最先端のセマンティックセグメンテーションモデルによって利用されることは稀である。代わりに、ほとんどのモデルは任意の領域形状を許容することにより、予測において不要な自由度を許容する。そこで我々は,効率的な多角形表現である二分空間分割木を予測するディープラーニングモデルを改良した。改良には、新しい機能デコーダアーキテクチャと、どちらも廃止される勾配を避ける新しい差別化可能なBSPツリーレンダラーが含まれている。さらに,予測木によって定義された空間分割を改善するために,新たな損失関数を設計した。さらに,拡張モデルは複数の木を同時に予測し,クラス固有のセグメンテーションを予測する。すべての修正を組み合わせることで、小さなバックボーンモデルを使用する場合や、大きなバックボーンモデルを使用する場合の最大20%のモデルパラメータを使用しながら、最先端のパフォーマンスを実現します。

関連論文リスト

The Persian Rug: solving toy models of superposition using large-scale symmetries [0.0]
入力次元が大きければ最小限の非線形スパースデータオートエンコーダによって学習されたアルゴリズムの完全なメカニスティック記述を示す。我々の研究は、オートエンコーダの構造を理解する技術を導入することによって、ニューラルネットワークの解釈可能性に貢献している。
論文参考訳（メタデータ） (2024-10-15T22:52:45Z)
Exploring the design space of deep-learning-based weather forecasting systems [56.129148006412855]
本稿では,異なる設計選択がディープラーニングに基づく天気予報システムに与える影響を系統的に分析する。 UNet、完全畳み込みアーキテクチャ、トランスフォーマーベースモデルなどの固定グリッドアーキテクチャについて検討する。固定グリッドモデルの強靭な性能とグリッド不変アーキテクチャの柔軟性を組み合わせたハイブリッドシステムを提案する。
論文参考訳（メタデータ） (2024-10-09T22:25:50Z)
Radio Map Prediction from Aerial Images and Application to Coverage Optimization [46.870065000932016]
畳み込みニューラルネットワークを用いた経路損失無線マップの予測に着目する。既存の無線地図データセットに対して開発された最先端モデルがこの課題に効果的に適応できることを示す。複雑さを低減した現在の最先端技術の性能をわずかに上回る新しいモデルを導入する。
論文参考訳（メタデータ） (2024-10-07T09:19:20Z)
Split-and-Fit: Learning B-Reps via Structure-Aware Voronoi Partitioning [50.684254969269546]
本稿では,3次元CADモデルのバウンダリ表現(B-Reps)を取得する新しい手法を提案する。各パーティション内に1つのプリミティブを導出するために空間分割を適用する。我々のネットワークはニューラルなボロノイ図でNVD-Netと呼ばれ、訓練データからCADモデルのボロノイ分割を効果的に学習できることを示す。
論文参考訳（メタデータ） (2024-06-07T21:07:49Z)
Sparse Concept Bottleneck Models: Gumbel Tricks in Contrastive Learning [86.15009879251386]
概念ボトルネックモデル(CBM)を用いた新しいアーキテクチャと説明可能な分類法を提案する。 CBMには、さらなる概念のセットが必要である。 CLIPをベースとしたボトルネックモデルにおいて,スパース隠れ層を用いた精度の大幅な向上を示す。
論文参考訳（メタデータ） (2024-04-04T09:43:43Z)
The Convex Landscape of Neural Networks: Characterizing Global Optima and Stationary Points via Lasso Models [75.33431791218302]
ディープニューラルネットワーク(DNN)モデルは、プログラミング目的に使用される。本稿では,凸型神経回復モデルについて検討する。定常的非次元目的物はすべて,グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。また, 静止非次元目的物はすべて, グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。
論文参考訳（メタデータ） (2023-12-19T23:04:56Z)
Unboxing Tree Ensembles for interpretability: a hierarchical visualization tool and a multivariate optimal re-built tree [0.34530027457862006]
我々は,木組モデルの解釈可能な表現を開発し,その振る舞いに関する貴重な洞察を提供する。提案モデルは,木組決定関数を近似した浅い解釈可能な木を得るのに有効である。
論文参考訳（メタデータ） (2023-02-15T10:43:31Z)
Scaling Structured Inference with Randomization [64.18063627155128]
本稿では、構造化されたモデルを数万の潜在状態に拡張するためにランダム化された動的プログラミング(RDP)のファミリを提案する。我々の手法は古典的DPベースの推論に広く適用できる。また、自動微分とも互換性があり、ニューラルネットワークとシームレスに統合できる。
論文参考訳（メタデータ） (2021-12-07T11:26:41Z)
OctField: Hierarchical Implicit Functions for 3D Modeling [18.488778913029805]
我々は3次元曲面の学習可能な階層的暗黙表現であるOctoFieldを提案し、メモリと計算予算の少ない複雑な曲面の高精度符号化を可能にする。この目的を達成するために、曲面占有率と部分幾何学の豊かさに応じて3次元空間を適応的に分割する階層的オクツリー構造を導入する。
論文参考訳（メタデータ） (2021-11-01T16:29:39Z)
Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文参考訳（メタデータ） (2020-12-09T12:40:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。