論文の概要: Distortion-Adaptive Grape Bunch Counting for Omnidirectional Images
- arxiv url: http://arxiv.org/abs/2008.12511v1
- Date: Fri, 28 Aug 2020 07:17:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 02:14:40.897728
- Title: Distortion-Adaptive Grape Bunch Counting for Omnidirectional Images
- Title(参考訳): 全方位画像に対する歪み適応型グレープパンチカウント
- Authors: Ryota Akai, Yuzuko Utsumi, Yuka Miwa, Masakazu Iwamura, Koichi Kise
- Abstract要約: 従来のオブジェクトカウント法では、全方位画像の歪みを処理できない。
全方位画像の立体投影のための新しいデータ拡張法を提案する。
提案手法は従来の手法よりも優れ,平均絶対誤差を14.7%,平均二乗誤差を10.5%向上させる。
- 参考スコア(独自算出の注目度): 9.963881019390593
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes the first object counting method for omnidirectional
images. Because conventional object counting methods cannot handle the
distortion of omnidirectional images, we propose to process them using
stereographic projection, which enables conventional methods to obtain a good
approximation of the density function. However, the images obtained by
stereographic projection are still distorted. Hence, to manage this distortion,
we propose two methods. One is a new data augmentation method designed for the
stereographic projection of omnidirectional images. The other is a
distortion-adaptive Gaussian kernel that generates a density map ground truth
while taking into account the distortion of stereographic projection. Using the
counting of grape bunches as a case study, we constructed an original
grape-bunch image dataset consisting of omnidirectional images and conducted
experiments to evaluate the proposed method. The results show that the proposed
method performs better than a direct application of the conventional method,
improving mean absolute error by 14.7% and mean squared error by 10.5%.
- Abstract(参考訳): 本稿では,全方位画像に対する最初のオブジェクトカウント手法を提案する。
従来の物体計数法は全方位画像の歪みを処理できないため,立体投影法を用いて処理することを提案する。
しかし、立体投影で得られた画像はいまだ歪んでいる。
したがって、この歪みを管理するために2つの方法を提案する。
1つは、全方位画像の立体投影のために設計された新しいデータ拡張手法である。
もう1つは歪み適応ガウス核であり、立体射影の歪みを考慮しつつ密度写像基底真理を生成する。
グレープ束の計数を事例として,全方位画像からなるオリジナルグレープバンチ画像データセットを構築し,提案手法の評価実験を行った。
その結果,本手法は従来の手法の直接的適用よりも優れた性能を示し,平均絶対誤差を14.7%,平均二乗誤差を10.5%改善した。
関連論文リスト
- RoFIR: Robust Fisheye Image Rectification Framework Impervious to Optical Center Deviation [88.54817424560056]
局所歪みの度合いと方向を測定する歪みベクトルマップ(DVM)を提案する。
DVMを学習することで、大域的な歪みパターンに頼ることなく、各ピクセルの局所歪みを独立に識別することができる。
事前学習段階では、歪みベクトルマップを予測し、各画素の局所歪み特徴を知覚する。
微調整段階では、魚眼画像修正のための画素単位のフローマップを予測する。
論文 参考訳(メタデータ) (2024-06-27T06:38:56Z) - OmniSSR: Zero-shot Omnidirectional Image Super-Resolution using Stable Diffusion Model [6.83367289911244]
ODI(Omnidirectional Image)は、現実世界の視覚タスクで一般的に使われ、高解像度のODIは関連する視覚タスクのパフォーマンス向上に役立つ。
ODIの既存の超解像法のほとんどはエンドツーエンドの学習戦略を用いており、結果として生成された画像の劣る現実性をもたらす。
論文 参考訳(メタデータ) (2024-04-16T06:39:37Z) - How to turn your camera into a perfect pinhole model [0.38233569758620056]
本稿では,画像からの歪みを除去する前処理ステップを含む新しいアプローチを提案する。
本手法は歪みモデルを仮定する必要がなく, 厳しい歪み画像に適用できる。
このモデルは、多くのアルゴリズムとアプリケーションの深刻なアップグレードを可能にします。
論文 参考訳(メタデータ) (2023-09-20T13:54:29Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - Bayesian dense inverse searching algorithm for real-time stereo matching
in minimally invasive surgery [1.2074552857379273]
手術画像のCPUレベルリアルタイムステレオマッチング法について報告する(i5-9400の単一コアを持つ640×480画像の10Hz)。
提案手法は,ステレオ画像の差分を推定する高速な'dense inverse search'アルゴリズムに基づいて構築される。
実験の結果, 手術シナリオにおいて, 推定深度は基準法よりも精度が高く, アウトリーチも少ないことが明らかとなった。
論文 参考訳(メタデータ) (2021-06-14T02:26:27Z) - Leveraging Spatial and Photometric Context for Calibrated Non-Lambertian
Photometric Stereo [61.6260594326246]
空間と測光の両方を同時に活用できる効率的な完全畳み込みアーキテクチャを提案する。
分離可能な4D畳み込みと2D熱マップを使うことで、サイズが小さくなり、効率が向上する。
論文 参考訳(メタデータ) (2021-03-22T18:06:58Z) - Uncalibrated Neural Inverse Rendering for Photometric Stereo of General
Surfaces [103.08512487830669]
本稿では,測光ステレオ問題に対する無補間深層ニューラルネットワークフレームワークを提案する。
既存のニューラルネットワークベースの方法は、物体の正確な光方向または接地正則のいずれかまたは両方を必要とします。
本稿では,この問題に対する未調整の神経逆レンダリング手法を提案する。
論文 参考訳(メタデータ) (2020-12-12T10:33:08Z) - Generative and Discriminative Learning for Distorted Image Restoration [22.230017059874445]
Liquifyは、画像の歪みに使用できる画像編集のテクニックである。
本稿では,深層ニューラルネットワークに基づく新しい生成的・識別的学習手法を提案する。
論文 参考訳(メタデータ) (2020-11-11T14:01:29Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - A Deep Ordinal Distortion Estimation Approach for Distortion Rectification [62.72089758481803]
より高精度なパラメータを効率良く得る新しい歪み補正手法を提案する。
本研究では, 局所言語関連推定ネットワークを設計し, 順序歪みを学習し, 現実的な歪み分布を近似する。
歪み情報の冗長性を考慮すると,本手法では歪み画像の一部のみを用いて順序方向の歪み推定を行う。
論文 参考訳(メタデータ) (2020-07-21T10:03:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。