論文の概要: Measure Anything: Real-time, Multi-stage Vision-based Dimensional Measurement using Segment Anything
- arxiv url: http://arxiv.org/abs/2412.03472v1
- Date: Wed, 04 Dec 2024 16:59:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-05 15:07:57.007846
- Title: Measure Anything: Real-time, Multi-stage Vision-based Dimensional Measurement using Segment Anything
- Title(参考訳): 計測値:セグメント値を用いた実時間多段階視覚計測
- Authors: Yongkyu Lee, Shivam Kumar Panda, Wei Wang, Mohammad Khalid Jawed,
- Abstract要約: 本稿では,円形断面を持つ物体の次元計測のための視覚に基づくフレームワークであるMeteore Anythingについて述べる。
提案手法は, 曲率の異なる棒状地形と, 一定のスケルトン傾斜を有する一般物体について, 重要な幾何学的特徴を推定する。
ノースダコタ州の農地から採取したカノーラ茎の直径を推定することにより,我々の枠組みを検証した。
- 参考スコア(独自算出の注目度): 5.395925950748224
- License:
- Abstract: We present Measure Anything, a comprehensive vision-based framework for dimensional measurement of objects with circular cross-sections, leveraging the Segment Anything Model (SAM). Our approach estimates key geometric features -- including diameter, length, and volume -- for rod-like geometries with varying curvature and general objects with constant skeleton slope. The framework integrates segmentation, mask processing, skeleton construction, and 2D-3D transformation, packaged in a user-friendly interface. We validate our framework by estimating the diameters of Canola stems -- collected from agricultural fields in North Dakota -- which are thin and non-uniform, posing challenges for existing methods. Measuring its diameters is critical, as it is a phenotypic traits that correlates with the health and yield of Canola crops. This application also exemplifies the potential of Measure Anything, where integrating intelligent models -- such as keypoint detection -- extends its scalability to fully automate the measurement process for high-throughput applications. Furthermore, we showcase its versatility in robotic grasping, leveraging extracted geometric features to identify optimal grasp points.
- Abstract(参考訳): 本稿では,Segment Anything Model(SAM)を応用した,円形断面を持つ物体の次元計測のための包括的視覚ベースフレームワークであるMessagee Anythingについて述べる。
提案手法は, 曲率の異なるロッド状測地と, 一定のスケルトン傾斜を有する一般物体の, 直径, 長さ, 体積などの重要な幾何学的特徴を推定する。
このフレームワークは、セグメンテーション、マスク処理、スケルトン構築、ユーザフレンドリーなインターフェースでパッケージ化された2D-3D変換を統合している。
我々は、ノースダコタ州の農地から採取されたカノーラ茎の直径を推定し、我々の枠組みを検証する。
直径を測定することは、カノーラの作物の健康と収量と相関する表現型の特徴であるため、非常に重要である。
このアプリケーションは、キーポイント検出のようなインテリジェントなモデルを統合することで、そのスケーラビリティを拡張して、高スループットアプリケーションのための測定プロセスを完全に自動化する、測定の可能性を実証しています。
さらに, 抽出した幾何学的特徴を利用して最適な把握点を同定し, ロボットグルーピングにおける汎用性を示す。
関連論文リスト
- Geometry Distributions [51.4061133324376]
本稿では,分布として幾何学をモデル化する新しい幾何学的データ表現を提案する。
提案手法では,新しいネットワークアーキテクチャを用いた拡散モデルを用いて表面点分布の学習を行う。
本研究では,多種多様な対象に対して質的かつ定量的に表現を評価し,その有効性を実証した。
論文 参考訳(メタデータ) (2024-11-25T04:06:48Z) - Towards Scalable Multi-View Reconstruction of Geometry and Materials [27.660389147094715]
本稿では,3次元シーンのカメラポーズ,オブジェクト形状,空間変化の両方向反射分布関数(svBRDF)のジョイントリカバリ手法を提案する。
入力は高解像度のRGBD画像であり、アクティブ照明用の点灯付き携帯型ハンドヘルドキャプチャシステムによってキャプチャされる。
論文 参考訳(メタデータ) (2023-06-06T15:07:39Z) - Generalizable Neural Performer: Learning Robust Radiance Fields for
Human Novel View Synthesis [52.720314035084215]
この研究は、一般のディープラーニングフレームワークを使用して、任意の人間の演奏者の自由視点画像を合成することを目的としている。
我々は、汎用的で堅牢な神経体表現を学習するシンプルな、かつ強力なフレームワーク、Generalizable Neural Performer(GNR)を提案する。
GeneBody-1.0とZJU-Mocapの実験は、最近の最先端の一般化可能な手法よりも、我々の手法の堅牢性を示している。
論文 参考訳(メタデータ) (2022-04-25T17:14:22Z) - Towards Self-Supervised Category-Level Object Pose and Size Estimation [121.28537953301951]
本研究は,一深度画像からのカテゴリレベルのオブジェクトポーズとサイズ推定のための自己教師型フレームワークを提案する。
我々は、同じ形状の点雲における幾何学的整合性を利用して自己超越する。
論文 参考訳(メタデータ) (2022-03-06T06:02:30Z) - NeROIC: Neural Rendering of Objects from Online Image Collections [42.02832046768925]
本稿では,オンライン画像コレクションからオブジェクト表現を取得し,任意のオブジェクトの高品質な形状と材料特性をキャプチャする手法を提案する。
これにより、新規ビュー合成、リライト、調和した背景合成など、さまざまなオブジェクト中心のレンダリングアプリケーションが可能になる。
論文 参考訳(メタデータ) (2022-01-07T16:45:15Z) - DONet: Learning Category-Level 6D Object Pose and Size Estimation from
Depth Observation [53.55300278592281]
単一深度画像からカテゴリレベルの6次元オブジェクト・ポースとサイズ推定(COPSE)を提案する。
筆者らのフレームワークは,深度チャネルのみの物体のリッチな幾何学的情報に基づいて推論を行う。
我々のフレームワークは、ラベル付き現実世界の画像を必要とする最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-06-27T10:41:50Z) - Nothing But Geometric Constraints: A Model-Free Method for Articulated
Object Pose Estimation [89.82169646672872]
本稿では,ロボットアームの関節構成を,モデルに先入観を持たずにRGBまたはRGB-D画像のシーケンスから推定する,教師なし視覚ベースシステムを提案する。
我々は,古典幾何学的定式化と深層学習を組み合わせることで,この課題を解決するために,極性多剛体制約を拡張した。
論文 参考訳(メタデータ) (2020-11-30T20:46:48Z) - Contour Primitive of Interest Extraction Network Based on One-Shot
Learning for Object-Agnostic Vision Measurement [37.552192926136065]
単発学習フレームワークに基づく利子抽出ネットワーク(CPieNet)の輪郭プリミティブを提案する。
新たなCPI抽出タスクのために,オンライン公開画像を用いたObject Contour Primitivesデータセットと,ロボットに搭載されたカメラを用いたRobotic Object Contour Measurementデータセットを構築した。
論文 参考訳(メタデータ) (2020-10-07T11:00:30Z) - Single View Metrology in the Wild [94.7005246862618]
本研究では,物体の3次元の高さや地上のカメラの高さで表現されるシーンの絶対的なスケールを再現する,単一ビューメロジに対する新しいアプローチを提案する。
本手法は,被写体の高さなどの3Dエンティティによる未知のカメラとの相互作用から,弱い教師付き制約を抑えるために設計されたディープネットワークによって学習されたデータ駆動の先行情報に依存する。
いくつかのデータセットと仮想オブジェクト挿入を含むアプリケーションに対して、最先端の定性的かつ定量的な結果を示す。
論文 参考訳(メタデータ) (2020-07-18T22:31:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。