論文の概要: FruitNeRF++: A Generalized Multi-Fruit Counting Method Utilizing Contrastive Learning and Neural Radiance Fields
- arxiv url: http://arxiv.org/abs/2505.19863v1
- Date: Mon, 26 May 2025 11:48:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.397193
- Title: FruitNeRF++: A Generalized Multi-Fruit Counting Method Utilizing Contrastive Learning and Neural Radiance Fields
- Title(参考訳): FruitNeRF++: コントラスト学習とニューラルラジアンス場を利用した一般化マルチフルートカウント手法
- Authors: Lukas Meyer, Andrei-Timotei Ardelean, Tim Weyrich, Marc Stamminger,
- Abstract要約: FruitNeRF++は、コントラスト学習とニューラルラディアンスフィールドを組み合わせた、新しいフルーツカウント手法である。
我々の研究はFruitNeRFに基づいており、FruitNeRFは、果物固有のクラスタリングアプローチと組み合わせて、ニューラルネットワークのセマンティックフィールドを利用している。
以上の結果から,FruitNeRF++は制御が容易で,他の最先端手法と比較できることがわかった。
- 参考スコア(独自算出の注目度): 5.669562773066833
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce FruitNeRF++, a novel fruit-counting approach that combines contrastive learning with neural radiance fields to count fruits from unstructured input photographs of orchards. Our work is based on FruitNeRF, which employs a neural semantic field combined with a fruit-specific clustering approach. The requirement for adaptation for each fruit type limits the applicability of the method, and makes it difficult to use in practice. To lift this limitation, we design a shape-agnostic multi-fruit counting framework, that complements the RGB and semantic data with instance masks predicted by a vision foundation model. The masks are used to encode the identity of each fruit as instance embeddings into a neural instance field. By volumetrically sampling the neural fields, we extract a point cloud embedded with the instance features, which can be clustered in a fruit-agnostic manner to obtain the fruit count. We evaluate our approach using a synthetic dataset containing apples, plums, lemons, pears, peaches, and mangoes, as well as a real-world benchmark apple dataset. Our results demonstrate that FruitNeRF++ is easier to control and compares favorably to other state-of-the-art methods.
- Abstract(参考訳): FruitNeRF++は、対照的な学習とニューラルラディアンスフィールドを組み合わせることで、果樹園の非構造的な入力写真から果実を数える新しいフルーツカウント手法である。
我々の研究はFruitNeRFに基づいており、FruitNeRFは、果物固有のクラスタリングアプローチと組み合わせて、ニューラルネットワークのセマンティックフィールドを利用している。
各果実品種の適応要件は, 適用性を制限し, 実際にの使用を困難にしている。
この制限を緩和するために、我々は、RGBとセマンティックデータを視覚基礎モデルによって予測されるインスタンスマスクで補完する形状に依存しないマルチフルーツカウントフレームワークを設計する。
マスクは、ニューラルネットワークのインスタンスフィールドへの埋め込みとして、各果実のアイデンティティを符号化するために使用される。
ニューラルネットワークを体積的にサンプリングすることにより,実測値に埋め込まれた点群を抽出し,実測値を得る。
我々は,リンゴ,プラム,レモン,ナシ,桃,マンゴーを含む合成データセットと,実世界のベンチマークリンゴデータセットを用いてアプローチを評価した。
以上の結果から,FruitNeRF++は制御が容易で,他の最先端手法と比較できることがわかった。
関連論文リスト
- FruitNeRF: A Unified Neural Radiance Field based Fruit Counting Framework [5.363729942767801]
FruitNeRFは,新鮮果実のカウンティングフレームワークである。
我々は3Dで直接果物の種類を数えるために最先端のビュー合成法を用いる。
実世界のデータセットと合成データセットの両方を用いて,本手法の評価を行った。
論文 参考訳(メタデータ) (2024-08-12T14:40:38Z) - A pipeline for multiple orange detection and tracking with 3-D fruit
relocalization and neural-net based yield regression in commercial citrus
orchards [0.0]
本稿では,パイプラインとして実装されたビデオの果実数を利用した非侵襲的な代替手段を提案する。
そこで本研究では, 果実位置の3次元推定を利用した再局在化成分を導入する。
果実の少なくとも30%を正確に検出・追跡・数えることにより, 収率回帰器の精度は0.85である。
論文 参考訳(メタデータ) (2023-12-27T21:22:43Z) - Fruit Ripeness Classification: a Survey [59.11160990637616]
食品を格付けするための特徴記述子を多用する多くの自動的手法が提案されている。
機械学習とディープラーニング技術がトップパフォーマンスの手法を支配している。
ディープラーニングは生のデータで操作できるため、複雑なエンジニアリング機能を計算する必要がなくなる。
論文 参考訳(メタデータ) (2022-12-29T19:32:20Z) - Extracting Semantic Knowledge from GANs with Unsupervised Learning [65.32631025780631]
GAN(Generative Adversarial Networks)は、特徴写像のセマンティクスを線形に分離可能な形でエンコードする。
本稿では,線形分離性を利用してGANの特徴をクラスタリングする新しいクラスタリングアルゴリズムKLiSHを提案する。
KLiSHは、さまざまなオブジェクトのデータセットに基づいてトレーニングされたGANのきめ細かいセマンティクスの抽出に成功している。
論文 参考訳(メタデータ) (2022-11-30T03:18:16Z) - Apple Counting using Convolutional Neural Networks [22.504279159923765]
果樹園のような現実の環境でのイメージから、正確で信頼性の高い果実や野菜の数を推定することは、難しい問題である。
コンボリューショナルニューラルネットワークを訓練することにより,画像から果実を数えることを多クラス分類問題として定式化し,その問題を解決する。
当社のネットワークは、最大94%の精度で、4つのデータセットのうち3つでパフォーマンスを向上しています。
論文 参考訳(メタデータ) (2022-08-24T14:13:40Z) - Facilitated machine learning for image-based fruit quality assessment in
developing countries [68.8204255655161]
自動画像分類は食品科学における教師あり機械学習の一般的な課題である。
事前学習型視覚変換器(ViT)に基づく代替手法を提案する。
標準的なデバイス上で限られたリソースで簡単に実装できる。
論文 参考訳(メタデータ) (2022-07-10T19:52:20Z) - A methodology for detection and localization of fruits in apples
orchards from aerial images [0.0]
本研究は, 空中画像を用いた自動果物カウント手法を提案する。
複数のビュー形状に基づくアルゴリズムが含まれており、果物の追跡を行う。
予備評価では,リンゴの果実数と実収率との間に0.8以上の相関が認められた。
論文 参考訳(メタデータ) (2021-10-24T01:57:52Z) - Convolutional Neural Networks from Image Markers [62.997667081978825]
特徴 画像マーカーからの学習(FLIM)は、ごく少数の画像でユーザーが描画したストロークから、バックプロパゲーションのない畳み込みフィルタを推定するために最近提案されました。
本稿では、フルコネクテッド層に対してFLIMを拡張し、異なる画像分類問題について実証する。
その結果、FLIMベースの畳み込みニューラルネットワークは、バックプロパゲーションによってゼロから訓練された同じアーキテクチャを上回ります。
論文 参考訳(メタデータ) (2020-12-15T22:58:23Z) - Permutation Matters: Anisotropic Convolutional Layer for Learning on
Point Clouds [145.79324955896845]
本稿では,各点のソフトな置換行列を計算する変分異方性畳み込み演算(PAI-Conv)を提案する。
点雲の実験により、PAI-Convは分類とセマンティックセグメンテーションのタスクにおいて競合する結果をもたらすことが示された。
論文 参考訳(メタデータ) (2020-05-27T02:42:29Z) - Linguistically Driven Graph Capsule Network for Visual Question
Reasoning [153.76012414126643]
我々は「言語的に駆動されるグラフカプセルネットワーク」と呼ばれる階層的構成推論モデルを提案する。
具体的には,各カプセルを最下層に結合させ,元の質問に1つの単語を埋め込んだ言語的埋め込みを視覚的証拠で橋渡しする。
CLEVRデータセット、CLEVR合成生成テスト、およびFinalQAデータセットの実験は、我々のエンドツーエンドモデルの有効性と構成一般化能力を示す。
論文 参考訳(メタデータ) (2020-03-23T03:34:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。