論文の概要: Combining Supervised and Un-supervised Learning for Automatic Citrus
Segmentation
- arxiv url: http://arxiv.org/abs/2105.01553v1
- Date: Tue, 4 May 2021 15:09:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-05 14:43:54.828069
- Title: Combining Supervised and Un-supervised Learning for Automatic Citrus
Segmentation
- Title(参考訳): 自動シトラスセグメンテーションのための教師なし学習と教師なし学習の組み合わせ
- Authors: Heqing Huang, Tongbin Huang, Zhen Li, Zhiwei Wei, Shilei Lv
- Abstract要約: まずCNNを少数のラベル付きシトラス画像で教師付きで訓練し、各フレームからシトラスの位置を大まかに予測します。
そこで我々は,未ラベルのシトラスの動画からフレーム間の潜在的な動きを事前学習するために,最先端の教師なし学習手法を拡張する。
両ネットワークの利点を生かすために,マルチモーダルトランスフォーマーを用いて,教師なし静的情報と教師なし学習動作情報を組み合わせた。
- 参考スコア(独自算出の注目度): 4.269821426212774
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Citrus segmentation is a key step of automatic citrus picking. While most
current image segmentation approaches achieve good segmentation results by
pixel-wise segmentation, these supervised learning-based methods require a
large amount of annotated data, and do not consider the continuous temporal
changes of citrus position in real-world applications. In this paper, we first
train a simple CNN with a small number of labelled citrus images in a
supervised manner, which can roughly predict the citrus location from each
frame. Then, we extend a state-of-the-art unsupervised learning approach to
pre-learn the citrus's potential movements between frames from unlabelled
citrus's videos. To take advantages of both networks, we employ the multimodal
transformer to combine supervised learned static information and unsupervised
learned movement information. The experimental results show that combing both
network allows the prediction accuracy reached at 88.3$\%$ IOU and 93.6$\%$
precision, outperforming the original supervised baseline 1.2$\%$ and 2.4$\%$.
Compared with most of the existing citrus segmentation methods, our method uses
a small amount of supervised data and a large number of unsupervised data,
while learning the pixel level location information and the temporal
information of citrus changes to enhance the segmentation effect.
- Abstract(参考訳): シトラスセグメンテーションは、自動シトラスピクションの重要なステップである。
現在のイメージセグメンテーションのアプローチは、ピクセル単位のセグメンテーションによって良好なセグメンテーション結果を達成するが、これらの教師付き学習に基づく方法は、大量の注釈付きデータを必要とする。
本稿では,まず,少量のラベル付きシトラス画像を用いた単純なCNNを教師付きで訓練し,各フレームからシトラス位置を大まかに予測する。
そこで我々は,未ラベルのシトラスの動画からフレーム間の潜在的な動きを事前学習するために,最先端の教師なし学習手法を拡張する。
両ネットワークの利点を生かすために,マルチモーダルトランスフォーマーを用いて,教師なし静的情報と教師なし学習動作情報を組み合わせた。
実験の結果、両方のネットワークを結合することで、予測精度が88.3$\%$ IOUと93.6$\%$の精度で到達し、オリジナルの教師付きベースラインである1.2$\%$と2.4$\%$を上回った。
本手法は,既存のシトラス分割法と比較して,少数の教師付きデータと多数の教師なしデータを用いて,画素レベルの位置情報とクトラスの時間的情報を学び,セグメント化効果を高める。
関連論文リスト
- Horticultural Temporal Fruit Monitoring via 3D Instance Segmentation and Re-Identification using Point Clouds [29.23207854514898]
本稿では,温室で収集した点群に時間とともに対処する,時間的果実モニタリングのための新しいアプローチを提案する。
本手法は,学習に基づくインスタンスセグメンテーション手法を用いて実の節分をポイントクラウド上で直接行う。
実のイチゴのデータセットを用いた実験結果から,本手法は果実の再同定方法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-11-12T13:53:22Z) - Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud
Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。
既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。
本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-13T04:16:40Z) - A Lightweight Clustering Framework for Unsupervised Semantic
Segmentation [28.907274978550493]
教師なしセマンティックセグメンテーションは、注釈付きデータを用いることなく、画像の各ピクセルを対応するクラスに分類することを目的としている。
教師なしセマンティックセグメンテーションのための軽量クラスタリングフレームワークを提案する。
本フレームワークは,PASCAL VOCおよびMS COCOデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2023-11-30T15:33:42Z) - Scribble-supervised Cell Segmentation Using Multiscale Contrastive
Regularization [9.849498498869258]
Scribble2Label (S2L) は、一握りのスクリブルと自己教師付き学習を使用することで、完全なアノテーションなしで正確なセグメンテーション結果を生成することを示した。
本研究では,S2Lに対して,新しいマルチスケールコントラスト正規化項を用いる。
主なアイデアは、ニューラルネットワークの中間層から特徴を抽出して、さまざまなスケールの構造を効果的に分離できるようにすることである。
論文 参考訳(メタデータ) (2023-06-25T06:00:33Z) - Weakly Supervised Semantic Segmentation for Large-Scale Point Cloud [69.36717778451667]
大規模なポイントクラウドセマンティックセグメンテーションのための既存の方法は、高価な、退屈でエラーを起こしやすい手動のポイントワイドアノテーションを必要とする。
この問題を解決するために,2つのコンポーネントを含む効果的な弱教師付き手法を提案する。
実験結果から,既存の弱教師付き手法と完全教師付き手法を比較検討した。
論文 参考訳(メタデータ) (2022-12-09T09:42:26Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - Unsupervised Representation Learning for 3D Point Cloud Data [66.92077180228634]
我々は、教師なしのポイントクラウド学習に対して、シンプルで効果的なアプローチを提案する。
特に、原点雲の優れたコントラストバージョンを生成する非常に有用な変換を同定する。
本研究では,3次元オブジェクト分類,形状部分分割,シーン分割の3つの下流タスクについて実験を行った。
論文 参考訳(メタデータ) (2021-10-13T10:52:45Z) - 3D medical image segmentation with labeled and unlabeled data using
autoencoders at the example of liver segmentation in CT images [58.720142291102135]
本研究では、畳み込みニューラルネットワークによるセグメンテーションを改善するために、オートエンコーダ抽出機能の可能性を検討する。
コンボリューション・オートエンコーダを用いてラベルのないデータから特徴を抽出し,CT画像における3次元肝セグメンテーションの目標タスクを実行するために,マルチスケールの完全畳み込みCNNを用いた。
論文 参考訳(メタデータ) (2020-03-17T20:20:43Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。