論文の概要: RowDetr: End-to-End Row Detection Using Polynomials
- arxiv url: http://arxiv.org/abs/2412.10525v2
- Date: Fri, 07 Mar 2025 00:00:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-10 12:21:05.856058
- Title: RowDetr: End-to-End Row Detection Using Polynomials
- Title(参考訳): RowDetr:ポリノミアルを用いたエンドツーエンドのロウ検出
- Authors: Rahul Harsha Cheppally, Ajay Sharda,
- Abstract要約: 堅牢で効率的な行検出のために、新しいエンドツーエンドニューラルネットワークアーキテクチャであるRowDetrが導入されている。
約6900枚の画像からなる新しいデータセットがキュレーションされ、さまざまな現実世界の農業条件を捉えている。
重要なイノベーションはPolyLossである。これは、ノイズや不完全なラベルが存在する場合でも、学習を強化するために設計された新しいエネルギーベースの損失関数である。
- 参考スコア(独自算出の注目度): 0.6278186810520364
- License:
- Abstract: Crop row detection is essential for enabling autonomous navigation in GPS-denied environments, such as under-canopy agricultural settings. Traditional methods often struggle with occlusions, variable lighting conditions, and the structural variability of crop rows. To address these challenges, RowDetr, a novel end-to-end neural network architecture, is introduced for robust and efficient row detection. A new dataset of approximately 6,900 images is curated, capturing a diverse range of real-world agricultural conditions, including occluded rows, uneven terrain, and varying crop densities. Unlike previous approaches, RowDetr leverages smooth polynomial functions to precisely delineate crop boundaries in the image space, ensuring a more structured and interpretable representation of row geometry. A key innovation of this approach is PolyOptLoss, a novel energy-based loss function designed to enhance learning robustness, even in the presence of noisy or imperfect labels. This loss function significantly improves model stability and generalization by optimizing polynomial curve fitting directly in image space. Extensive experiments demonstrate that RowDetr significantly outperforms existing frameworks, including Agronav and RowColAttention, across key performance metrics. Additionally, RowDetr achieves a sixfold speedup over Agronav, making it highly suitable for real-time deployment on resource-constrained edge devices. To facilitate better comparisons across future studies, lane detection metrics from autonomous driving research are adapted, providing a more standardized and meaningful evaluation framework for crop row detection. This work establishes a new benchmark in under-canopy
- Abstract(参考訳): 作物の列検出は、不毛の農業環境など、GPSを付加した環境での自律的なナビゲーションを可能にするために不可欠である。
伝統的手法は、しばしばオクルージョン、変光条件、および作物の列の構造的変動に苦しむ。
これらの課題に対処するため、新しいエンドツーエンドニューラルネットワークアーキテクチャであるRowDetrが、堅牢で効率的な行検出のために導入された。
約6900枚の画像からなる新しいデータセットがキュレーションされ、ブロックされた行、不均一な地形、さまざまな作物の密度を含む、さまざまな現実世界の農業状況が収集される。
以前のアプローチとは異なり、RowDetrはスムーズな多項式関数を利用して、画像空間における作物の境界を正確に定義し、より構造化され解釈可能な行幾何学の表現を保証する。
このアプローチの重要な革新はPolyOptLossである。これは、ノイズや不完全なラベルが存在する場合でも、学習の堅牢性を高めるために設計された、新しいエネルギーベースの損失関数である。
この損失関数は、画像空間に直接収まる多項式曲線を最適化することにより、モデルの安定性と一般化を著しく改善する。
大規模な実験によると、RowDetrはAgronavやRowColAttentionなど、主要なパフォーマンス指標で、既存のフレームワークを著しく上回っている。
さらにRowDetrは、Agronavの6倍のスピードアップを実現し、リソース制約のあるエッジデバイスへのリアルタイムデプロイメントに非常に適している。
将来の研究間でのより良い比較を容易にするために、自律運転研究からの車線検出メトリクスが適応され、より標準化され意味のあるクロップ行検出フレームワークを提供する。
この研究は、アンダーキャノピーで新しいベンチマークを確立する
関連論文リスト
- FLARES: Fast and Accurate LiDAR Multi-Range Semantic Segmentation [52.89847760590189]
3Dシーンの理解は、自動運転における重要な課題である。
近年の手法では、レンジビュー表現を利用して処理効率を向上している。
範囲ビューに基づくLiDARセマンティックセマンティックセグメンテーションのためのワークフローを再設計する。
論文 参考訳(メタデータ) (2025-02-13T12:39:26Z) - An Enhanced Classification Method Based on Adaptive Multi-Scale Fusion for Long-tailed Multispectral Point Clouds [67.96583737413296]
長距離分布を持つMPCに対する適応的マルチスケール融合に基づく拡張型分類法を提案する。
トレーニングセット生成段階では、スパースラベル付きデータセットからトレーニングサンプルを確実に生成するグリッドバランスサンプリング戦略が設計されている。
特徴学習の段階では,異なるスケールの土地被覆の浅い特徴を融合させるため,マルチスケールの特徴融合モジュールが提案されている。
論文 参考訳(メタデータ) (2024-12-16T03:21:20Z) - GSPR: Multimodal Place Recognition Using 3D Gaussian Splatting for Autonomous Driving [9.023864430027333]
マルチモーダル位置認識は ユニセンサーシステムの弱点を克服する能力によって 注目を集めています
本稿では,GSPRと呼ばれる3次元ガウス型マルチモーダル位置認識ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2024-10-01T00:43:45Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - CurbNet: Curb Detection Framework Based on LiDAR Point Cloud Segmentation [8.502741852406904]
本稿では,ポイントクラウドセグメンテーションを利用した検出を抑える新しいフレームワークであるCurbNetを紹介する。
我々はセマンティックKITTIをベースとした3D-Curbデータセットを開発した。
xy平面上の凹凸特性の不均一分布と、z軸に沿った高周波特性への依存による課題に対処するため、マルチスケール・チャネルアテンション(MSCA)モジュールを導入する。
論文 参考訳(メタデータ) (2024-03-25T14:13:09Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - 3D Harmonic Loss: Towards Task-consistent and Time-friendly 3D Object
Detection on Edge for Intelligent Transportation System [28.55894241049706]
本稿では,ポイントクラウドに基づく不整合予測を緩和する3次元高調波損失関数を提案する。
提案手法はベンチマークモデルよりも性能が大幅に向上する。
私たちのコードはオープンソースで公開されています。
論文 参考訳(メタデータ) (2022-11-07T10:11:48Z) - Deep learning-based Crop Row Detection for Infield Navigation of
Agri-Robots [10.386591972977207]
本稿では、安価なカメラを用いて、フィールド変動に耐えられるロバストな作物列検出アルゴリズムを提案する。
複数の生育段階、光度、雑草密度の変化、曲がりくねった作物の列、不連続な作物の列からなる11のフィールド変動を表すサトウキビ画像のデータセットを作成した。
提案アルゴリズムは, 基準値よりも高いフィールド条件下で, 頑健な視覚に基づく作物の列検出を実証した。
論文 参考訳(メタデータ) (2022-09-09T12:47:24Z) - Reconfigurable Voxels: A New Representation for LiDAR-Based Point Clouds [76.52448276587707]
本稿では,3次元点群から表現を構成する新しい手法であるReconfigurable Voxelsを提案する。
具体的には,各地区を一定数のボクセルで適応的にカバーするランダムウォーク方式を考案する。
この手法は,特に疎水領域において,ボクセル特性の安定性を効果的に向上することがわかった。
論文 参考訳(メタデータ) (2020-04-06T15:07:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。