論文の概要: Prior Availability in Industrial Visual Sim-to-Real: A Review of CAD-Guided and CAD-Unavailable Regimes
- arxiv url: http://arxiv.org/abs/2605.30581v1
- Date: Thu, 28 May 2026 21:18:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 20:56:50.240046
- Title: Prior Availability in Industrial Visual Sim-to-Real: A Review of CAD-Guided and CAD-Unavailable Regimes
- Title(参考訳): 産業用Visual Sim-to-Realの事前利用:CAD-Guided と CAD-In available Regimes の概観
- Authors: Chenxi Tao, Seung-Kyum Choi,
- Abstract要約: 産業的なビジュアル・シム・トゥ・リアル(英語版)は、しばしば利用可能な証拠と必要な決定のより大きなミスマッチを伴う。
このレビューでは、産業用ビジュアル・シム・トゥ・リアルを、事前可用性によって構成されたドメインギャップ問題として再検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial visual sim-to-real is often described as transferring from synthetic images to real images, but industrial deployment usually involves a broader mismatch between available evidence and required decisions. A system may be built from CAD renderings, simulated RGB-D observations, normal reference images, synthetic defects, pretrained feature spaces, or language prompts, yet deployed under different sensors, lighting, materials, fixtures, calibration, production variation, and rare defect modes. This review reframes industrial visual sim-to-real as a domain-gap problem organized by prior availability. We distinguish CAD-available settings, where explicit object geometry can support rendering, calibration, pose estimation, segmentation, and test-time geometric verification; CAD-unavailable settings, where geometry is replaced by normal-reference appearance, feature distributions, teacher-student residuals, synthetic anomaly assumptions, foundation features, or vision-language priors; and boundary-prior settings, where approximate models, templates, reference views, or semantic correspondences preserve only part of the CAD role. This framing connects CAD-based detection and 6D pose-estimation literature with industrial anomaly and surface-inspection literature that is usually reviewed separately. To make the taxonomy concrete, we use empirical anchors on T-LESS/BOP, MVTec AD, and VisA. The anchors show that CAD render count alone does not close transfer; source-distribution design, detector capacity, and small real calibration can matter more. They also show that CAD at test time creates a distinct verification channel through mask, pose, and depth consistency, whereas CAD-unavailable inspection relies on calibrated normality and feature deviation. The review therefore argues against a single cross-task leaderboard and instead asks what prior grounds the deployment decision.
- Abstract(参考訳): 産業用ビジュアル・シム・トゥ・リアルは、しばしば合成画像から実際の画像への転送と表現されるが、産業用展開は通常、利用可能な証拠と必要な決定とのより大きなミスマッチを伴う。
システムはCADレンダリング、シミュレーションされたRGB-D観測、通常の参照画像、合成欠陥、事前訓練された特徴空間、言語プロンプトから構築されるが、異なるセンサー、照明、材料、フィクスチャ、キャリブレーション、生産変動、まれな欠陥モードの下に展開される。
このレビューでは、産業用ビジュアル・シム・トゥ・リアルを、事前可用性によって構成されたドメインギャップ問題として再検討する。
CADを識別し,レンダリング,キャリブレーション,ポーズ推定,セグメンテーション,テストタイムの幾何的検証をサポートする明示的オブジェクト幾何の設定,幾何学を正規参照の外観,特徴分布,教師学習残差,合成異常仮定,基礎的特徴,視覚言語先行,境界優先の設定,CADロールの一部のみを保持する境界優先設定を識別する。
このフレーミングはCADに基づく検出と6次元ポーズ推定の文献と、通常別々にレビューされる産業的異常と表面検査の文献を結びつける。
分類を具体化するために,T-LESS/BOP,MVTec AD,VisAに経験的アンカーを用いる。
アンカーはCADレンダリング数だけでは転送をクローズしないことを示しており、ソース分配設計、検出器容量、より小さな実キャリブレーションが重要である。
また、テスト時にCADがマスク、ポーズ、深さの整合性を通じて個別の検証チャネルを生成するのに対して、CADが使用できない検査は正規度と特徴の偏差に頼っていることも示している。
したがって、レビューはシングルタスクのリーダーボードに反対し、デプロイ決定に先立ってどのような根拠があるのかを尋ねる。
関連論文リスト
- Hylos: Operability Contracts for Model-Native Spatial Intelligence [0.0]
本稿では,契約境界空間知能のためのシステムアーキテクチャであるHylosを紹介する。
Hylosは、オブジェクト、アセンブリ、アセット、サーフェスアンカー、アサーション、アクション候補、ソルバジョブ、共有アクチュエータ呼び出し、能力ギャップ、エフェクト差といった、シーンスケールの操作性状態を維持している。
この研究は、因果修復について検討し、視覚的不整合が依存部品に現れるのに対して、支持された修復はそれを制御する配置構造に上流に置かれている。
論文 参考訳(メタデータ) (2026-05-23T20:47:05Z) - Geometry OR Tracker: Universal Geometric Operating Room Tracking [61.399734016038614]
手術室(OR)では、世界規模のマルチビュー3Dトラッキングは、外科医の行動認識のような下流のアプリケーションをサポートする。
カメラのキャリブレーションとRGB-Dの登録は常に信頼性が低く、幾何学的不整合が生じる。
我々は、不正確なキャリブレーションをスケール一貫性と幾何学的に整合したカメラ設定に修正する2段階パイプラインであるGeometry OR Trackerを紹介する。
論文 参考訳(メタデータ) (2026-02-28T09:21:21Z) - CAD-Prompted SAM3: Geometry-Conditioned Instance Segmentation for Industrial Objects [8.676167989526347]
本稿ではSAM3上に構築されたCADによるセグメント化フレームワークを提案する。
CADモデルの標準マルチビューレンダリングをプロンプト入力として使用する。
レンダリングされたビューは、表面の外観とは無関係に幾何学ベースの条件付けを提供する。
論文 参考訳(メタデータ) (2026-02-24T05:10:22Z) - CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning [31.342222156939403]
本稿では,2段階の微調整パラダイムであるCReFT-CADを紹介する。
われわれはTriView2CADをリリースした。
論文 参考訳(メタデータ) (2025-05-31T13:52:56Z) - CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - DiffCAD: Weakly-Supervised Probabilistic CAD Model Retrieval and Alignment from an RGB Image [34.47379913018661]
本稿では,RGB画像からのCAD検索とアライメントに対する,最初の弱教師付き確率的アプローチであるDiffCADを提案する。
我々はこれを条件付き生成タスクとして定式化し、拡散を利用して画像中のCADオブジェクトの形状、ポーズ、スケールをキャプチャする暗黙の確率モデルを学ぶ。
提案手法は, 合成データのみを用いて学習し, 単眼深度とマスク推定を利用して, 種々の実対象領域へのロバストなゼロショット適応を実現する。
論文 参考訳(メタデータ) (2023-11-30T15:10:21Z) - Multitask AET with Orthogonal Tangent Regularity for Dark Object
Detection [84.52197307286681]
暗黒環境下でのオブジェクト検出を強化するために,新しいマルチタスク自動符号化変換(MAET)モデルを提案する。
自己超越的な方法で、MAETは、現実的な照明劣化変換を符号化して復号することで、本質的な視覚構造を学習する。
我々は,合成および実世界のデータセットを用いて最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-05-06T16:27:14Z) - Patch2CAD: Patchwise Embedding Learning for In-the-Wild Shape Retrieval
from a Single Image [58.953160501596805]
本稿では,2次元画像と3次元CADモデルの結合埋め込み空間をパッチワイズで構築する手法を提案する。
我々のアプローチは、CADが正確に一致しない実世界のシナリオにおける最先端技術よりも堅牢である。
論文 参考訳(メタデータ) (2021-08-20T20:58:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。