論文の概要: In The Wild Ellipse Parameter Estimation for Circular Dining Plates and Bowls
- arxiv url: http://arxiv.org/abs/2405.07121v1
- Date: Sun, 12 May 2024 01:09:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-14 18:18:14.081249
- Title: In The Wild Ellipse Parameter Estimation for Circular Dining Plates and Bowls
- Title(参考訳): 球状ダイニングプレートとボウルの野生楕円パラメータ推定
- Authors: Akil Pathiranage, Chris Czarnecki, Yuhao Chen, Pengcheng Xi, Linlin Xu, Alexander Wong,
- Abstract要約: 本研究では,プレートとボウルの楕円縁の検出と推定を行うWildEllipseFitを提案する。
提案したYummly-ellipseデータセットの評価は、実世界のシナリオにおけるその有効性とゼロショット能力を示す。
- 参考スコア(独自算出の注目度): 63.611551981684244
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ellipse estimation is an important topic in food image processing because it can be leveraged to parameterize plates and bowls, which in turn can be used to estimate camera view angles and food portion sizes. Automatically detecting the elliptical rim of plates and bowls and estimating their ellipse parameters for data "in-the-wild" is challenging: diverse camera angles and plate shapes could have been used for capture, noisy background, multiple non-uniform plates and bowls in the image could be present. Recent advancements in foundational models offer promising capabilities for zero-shot semantic understanding and object segmentation. However, the output mask boundaries for plates and bowls generated by these models often lack consistency and precision compared to traditional ellipse fitting methods. In this paper, we combine ellipse fitting with semantic information extracted by zero-shot foundational models and propose WildEllipseFit, a method to detect and estimate the elliptical rim for plate and bowl. Evaluation on the proposed Yummly-ellipse dataset demonstrates its efficacy and zero-shot capability in real-world scenarios.
- Abstract(参考訳): 楕円推定は, 皿やボウルのパラメータ化に利用することができるため, 食品画像処理において重要な話題である。
プレートとボウルの楕円縁を自動的に検出し、その楕円パラメータを「地中」のデータとして推定することは困難であり、様々なカメラアングルとプレート形状が、撮影、ノイズの多い背景、複数の不均一なプレートとボウルが画像に存在している可能性がある。
基礎モデルの最近の進歩は、ゼロショットセマンティック理解とオブジェクトセグメンテーションに有望な機能を提供する。
しかし、これらのモデルによって生成されたプレートとボウルの出力マスク境界は、従来の楕円フィッティング法に比べて一貫性と精度が欠けることが多い。
本稿では,ゼロショット基礎モデルから抽出した楕円フィッティングと意味情報を組み合わせて,プレートとボウルの楕円リムを検出する手法であるWildEllipseFitを提案する。
提案したYummly-ellipseデータセットの評価は、実世界のシナリオにおけるその有効性とゼロショット能力を示す。
関連論文リスト
- Single-image camera calibration with model-free distortion correction [0.0]
本稿では,センサ全体をカバーする平面スペックルパターンの単一画像から,キャリブレーションパラメータの完全な集合を推定する方法を提案する。
デジタル画像相関を用いて校正対象の画像点と物理点との対応を求める。
プロシージャの最後には、画像全体にわたって、密度が高く均一なモデルフリーな歪みマップが得られる。
論文 参考訳(メタデータ) (2024-03-02T16:51:35Z) - Curved Diffusion: A Generative Model With Optical Geometry Control [56.24220665691974]
最終シーンの外観に対する異なる光学系の影響は、しばしば見過ごされる。
本研究では,画像レンダリングに使用される特定のレンズとテキスト画像拡散モデルを密接に統合するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-29T13:06:48Z) - Perspective Fields for Single Image Camera Calibration [47.15297775014322]
画像の局所的なパースペクティブ特性をモデル化する表現として、パースペクティブフィールドを提案する。
パースペクティブフィールドは、カメラビューに関する画素ごとの情報を含み、アップベクトルと緯度値としてパラメータ化される。
我々は、パースペクティブフィールドを予測するためにニューラルネットワークを訓練し、予測されたパースペクティブフィールドを簡単にキャリブレーションパラメータに変換することができる。
論文 参考訳(メタデータ) (2022-12-06T18:59:50Z) - SphereDepth: Panorama Depth Estimation from Spherical Domain [17.98608948955211]
本稿では,新しいパノラマ深度推定法であるSphereDepthを提案する。
プロジェクション前処理なしで球面メッシュ上の深さを直接予測する。
パノラマ深度推定の最先端手法と同等の結果が得られる。
論文 参考訳(メタデータ) (2022-08-29T16:50:19Z) - RelPose: Predicting Probabilistic Relative Rotation for Single Objects
in the Wild [73.1276968007689]
本稿では、任意のオブジェクトの複数の画像からカメラ視点を推定するデータ駆動手法について述べる。
本手法は, 画像の鮮明さから, 最先端のSfM法とSLAM法より優れていることを示す。
論文 参考訳(メタデータ) (2022-08-11T17:59:59Z) - Level Set-Based Camera Pose Estimation From Multiple 2D/3D
Ellipse-Ellipsoid Correspondences [2.016317500787292]
2次元物体検出に対する3次元物体の投影を特徴付けるコスト関数の定義は簡単ではないことを示す。
レベルセットのサンプリングに基づいて楕円楕円コストを開発し、部分的な可視オブジェクトを扱うための優れた特性を実証し、その性能を他の一般的なメトリクスと比較する。
論文 参考訳(メタデータ) (2022-07-16T14:09:54Z) - Object-Based Visual Camera Pose Estimation From Ellipsoidal Model and
3D-Aware Ellipse Prediction [2.016317500787292]
本稿では,1枚の画像から初期カメラのポーズ推定を行う手法を提案する。
観察条件に関係なく、物体を確実に検出する深層学習技術を活用する。
実験により,提案手法により計算結果の精度が著しく向上することが確認された。
論文 参考訳(メタデータ) (2022-03-09T10:00:52Z) - Neural Point Light Fields [80.98651520818785]
本稿では,スパース点雲上に存在する光の場を暗黙的に表現するニューラルポイント光場について紹介する。
これらの点光場は、光線方向と局所点特徴近傍の関数として機能し、光場条件付きトレーニング画像を高密度の被写体とパララックスを介さずに補間することができる。
論文 参考訳(メタデータ) (2021-12-02T18:20:10Z) - 3D-Aware Ellipse Prediction for Object-Based Camera Pose Estimation [3.103806775802078]
視聴条件に頑健な粗いカメラポーズ計算法を提案する。
観察条件に関係なく、物体を確実に検出する深層学習技術を活用する。
論文 参考訳(メタデータ) (2021-05-24T18:40:18Z) - A Robust Attentional Framework for License Plate Recognition in the Wild [95.7296788722492]
本稿では,ライセンスプレート認識のための堅牢なフレームワークを提案する。
ナンバープレート画像生成のためのCycleGANモデルと、プレート認識のための精巧な設計された画像系列ネットワークで構成されている。
われわれは、中国本土31州から1200枚の画像を含む新しいライセンスプレートデータセット「CLPD」をリリースした。
論文 参考訳(メタデータ) (2020-06-06T17:11:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。