論文の概要: Semantic Segmentation for Partially Occluded Apple Trees Based on Deep
Learning
- arxiv url: http://arxiv.org/abs/2010.06879v1
- Date: Wed, 14 Oct 2020 08:43:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-10-07 13:37:59.153990
- Title: Semantic Segmentation for Partially Occluded Apple Trees Based on Deep
Learning
- Title(参考訳): 深層学習に基づく部分集積型アップルツリーのセマンティックセグメンテーション
- Authors: Zijue Chen, David Ting, Rhys Newbury, Chao Chen
- Abstract要約: 我々は、教師付き学習モデルU-NetとDeepLabv3と条件付き生成アドリアルネットワークPix2Pixを用いて、部分的に閉鎖された2D-オープン-Vリンゴツリーを分割する。
DeepLabv3は、Binaryの精度で他のモデル、Mean IoUとBundary F1よりも優れているが、OccludedブランチリコールではPix2PixとU-Netに勝っている。
- 参考スコア(独自算出の注目度): 4.996869748674549
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fruit tree pruning and fruit thinning require a powerful vision system that
can provide high resolution segmentation of the fruit trees and their branches.
However, recent works only consider the dormant season, where there are minimal
occlusions on the branches or fit a polynomial curve to reconstruct branch
shape and hence, losing information about branch thickness. In this work, we
apply two state-of-the-art supervised learning models U-Net and DeepLabv3, and
a conditional Generative Adversarial Network Pix2Pix (with and without the
discriminator) to segment partially occluded 2D-open-V apple trees. Binary
accuracy, Mean IoU, Boundary F1 score and Occluded branch recall were used to
evaluate the performances of the models. DeepLabv3 outperforms the other models
at Binary accuracy, Mean IoU and Boundary F1 score, but is surpassed by Pix2Pix
(without discriminator) and U-Net in Occluded branch recall. We define two
difficulty indices to quantify the difficulty of the task: (1) Occlusion
Difficulty Index and (2) Depth Difficulty Index. We analyze the worst 10 images
in both difficulty indices by means of Branch Recall and Occluded Branch
Recall. U-Net outperforms the other two models in the current metrics. On the
other hand, Pix2Pix (without discriminator) provides more information on branch
paths, which are not reflected by the metrics. This highlights the need for
more specific metrics on recovering occluded information. Furthermore, this
shows the usefulness of image-transfer networks for hallucination behind
occlusions. Future work is required to further enhance the models to recover
more information from occlusions such that this technology can be applied to
automating agricultural tasks in a commercial environment.
- Abstract(参考訳): 果樹の刈り取りと果実の薄切りには、果実の木とその枝の高分解能なセグメンテーションを提供する強力な視覚システムが必要である。
しかし、近年の研究は休眠期のみを考慮し、枝に最小限の閉塞があるか、多項式曲線に適合して枝の形を再構築し、枝の厚さに関する情報を失う。
本研究では,2つの最先端教師付き学習モデル U-Net と DeepLabv3 と条件付き生成逆数ネットワーク Pix2Pix を用いて,部分閉塞な2D-オープン-V リンゴを分割する。
モデルの性能評価には,バイナリ精度,平均IoU,境界F1スコア,Occludedブランチリコールが用いられた。
DeepLabv3は、Binaryの精度で他のモデル、Mean IoUとBundary F1よりも優れているが、OccludedブランチリコールではPix2PixとU-Netに勝っている。
課題の難易度を定量化するための難易度指標として,(1)閉塞困難度指標と(2)深さ困難度指標を定式化した。
本稿では,分岐リコールとOccludedブランチリコールを用いて,両難易度指標の最悪の10画像を解析する。
u-netは、現在のメトリクスで他の2つのモデルを上回る。
一方、Pix2Pix(差別化なしで)は、メトリクスに反映されないブランチパスに関するより多くの情報を提供する。
これは、隠された情報を回復する上で、より具体的なメトリクスの必要性を強調します。
さらに,オクルージョンの背後の幻覚に対する画像伝達ネットワークの有用性を示す。
この技術が商業環境における農業作業の自動化に応用可能であるように、隠蔽からより多くの情報を回収するためのモデルをさらに強化する必要がある。
関連論文リスト
- NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth
Supervision for Indoor Multi-View 3D Detection [72.0098999512727]
NeRF-Detは、NeRFを用いた屋内マルチビュー3次元検出において、表現学習の強化による優れた性能を実現している。
セマンティックエンハンスメント(セマンティックエンハンスメント)、パースペクティブ・アウェア・サンプリング(パースペクティブ・アウェア・サンプリング)、および順序深度監視を含む3つのソリューションを提案する。
結果として得られたアルゴリズムであるNeRF-Det++は、ScanNetV2とAR KITScenesデータセットで魅力的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-22T11:48:06Z) - Lookback for Learning to Branch [77.32867454769936]
Bipartite Graph Neural Networks (GNN) は、ディープラーニングに基づくMixed-Integer Linear Program (MILP) の重要コンポーネントであることが示されている。
近年の研究では、分岐とバウンド(B&B)の解法における分岐(可変選択)を置き換える上で、そのようなGNNの有効性が実証されている。
論文 参考訳(メタデータ) (2022-06-30T02:33:32Z) - R2U++: A Multiscale Recurrent Residual U-Net with Dense Skip Connections
for Medical Image Segmentation [0.5735035463793008]
本稿では,新しいU-Netベースの医用画像セグメンテーションアーキテクチャR2U++を提案する。
提案したアーキテクチャでは, 単純な畳み込みバックボーンを, より深い再帰的な畳み込みブロックに置き換える。
エンコーダとデコーダのセマンティックギャップは、濃密なスキップ経路によって減少する。
論文 参考訳(メタデータ) (2022-06-03T19:42:44Z) - DTU-Net: Learning Topological Similarity for Curvilinear Structure
Segmentation [2.9398911304923447]
本稿では,2つの重み付きU-Netからなる2重デコーダとトポロジ対応ディープニューラルネットワークDTU-Netを提案する。
テクスチャネットは、画像テクスチャ情報を用いて粗い予測を行う。
トポロジネットは、誤りとミスの分割を認識するために訓練された三重項損失を用いることで、粗い予測からトポロジ情報を学習する。
論文 参考訳(メタデータ) (2022-05-23T08:15:26Z) - Tree Energy Loss: Towards Sparsely Annotated Semantic Segmentation [141.16965264264195]
Sparsely Annotated semantic segmentation (SASS) は、粗い粒度の監督によるセグメンテーションネットワークのトレーニングを目的としている。
ラベルなし画素のセマンティックガイダンスを提供することにより,SASSの新たなツリーエネルギー損失を提案する。
論文 参考訳(メタデータ) (2022-03-21T05:16:23Z) - Growing Deep Forests Efficiently with Soft Routing and Learned
Connectivity [79.83903179393164]
この論文は、いくつかの重要な側面で深い森林のアイデアをさらに拡張します。
我々は、ノードがハードバイナリ決定ではなく、確率的ルーティング決定、すなわちソフトルーティングを行う確率的ツリーを採用する。
MNISTデータセットの実験は、私たちの力のある深部森林が[1]、[3]よりも優れたまたは匹敵するパフォーマンスを達成できることを示しています。
論文 参考訳(メタデータ) (2020-12-29T18:05:05Z) - Offset Curves Loss for Imbalanced Problem in Medical Segmentation [15.663236378920637]
我々は,輪郭内領域と輪郭内領域の両方を考慮した新しい深層学習モデルを構築した。
提案するオフセット曲線(OsC)損失は3つの主要な適合項からなる。
提案したOsC損失を2次元ネットワークと3次元ネットワークの両方で評価した。
論文 参考訳(メタデータ) (2020-12-04T08:35:21Z) - Monocular Depth Estimation Using Multi Scale Neural Network And Feature
Fusion [0.0]
ネットワークは2つの異なるブロックを使用し、まず、各特徴マップの畳み込みとマージに異なるフィルタサイズを使用する。
第2ブロックは、完全に連結された層の代わりに拡張畳み込みを使用し、計算を減らし、受容場を増大させる。
我々は、RMSE損失とSILog損失からなる深さ推定のための標準評価指標を用いて、Make 3Dデータセット、NYU Depth V2データセット、Kittiデータセットでネットワークをトレーニングし、テストする。
論文 参考訳(メタデータ) (2020-09-11T18:08:52Z) - DONet: Dual Objective Networks for Skin Lesion Segmentation [77.9806410198298]
本稿では,皮膚病変のセグメンテーションを改善するために,Dual Objective Networks (DONet) という,シンプルで効果的なフレームワークを提案する。
我々のDONetは2つの対称デコーダを採用し、異なる目標に近づくための異なる予測を生成する。
皮膚内視鏡画像における多種多様な病変のスケールと形状の課題に対処するために,再帰的コンテキスト符号化モジュール(RCEM)を提案する。
論文 参考訳(メタデータ) (2020-08-19T06:02:46Z) - Pairwise Relation Learning for Semi-supervised Gland Segmentation [90.45303394358493]
病理組織像における腺分節に対するPRS2モデルを提案する。
このモデルはセグメンテーションネットワーク(S-Net)とペア関係ネットワーク(PR-Net)から構成される。
我々は,GlaSデータセットの最近の5つの手法とCRAGデータセットの最近の3つの手法を比較した。
論文 参考訳(メタデータ) (2020-08-06T15:02:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。