論文の概要: Physics-Informed Machine Learning for Efficient Sim-to-Real Data Augmentation in Micro-Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2511.16494v1
- Date: Thu, 20 Nov 2025 16:10:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.712961
- Title: Physics-Informed Machine Learning for Efficient Sim-to-Real Data Augmentation in Micro-Object Pose Estimation
- Title(参考訳): 物理インフォームド・機械学習によるマイクロオブジェクト・ポース推定における効率的なシモン・トゥ・リアルデータ拡張
- Authors: Zongcai Tan, Lan Wei, Dandan Zhang,
- Abstract要約: 本研究では,マイクロロボットのポーズ推定のための物理インフォームド深層生成学習フレームワークを提案する。
波動光学に基づく物理レンダリングと深度アライメントをGAN(Generative Adversarial Network)に統合する。
構造類似度指数(SSIM)は、純粋にAI駆動の手法に比べて35.6%向上する。
93.9%/91.9%(ピッチ/ロール)の精度を達成し、実際のデータにのみ訓練された推定値よりも5.0%/5.4%(ピッチ/ロール)低い。
- 参考スコア(独自算出の注目度): 6.975054201075641
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precise pose estimation of optical microrobots is essential for enabling high-precision object tracking and autonomous biological studies. However, current methods rely heavily on large, high-quality microscope image datasets, which are difficult and costly to acquire due to the complexity of microrobot fabrication and the labour-intensive labelling. Digital twin systems offer a promising path for sim-to-real data augmentation, yet existing techniques struggle to replicate complex optical microscopy phenomena, such as diffraction artifacts and depth-dependent imaging.This work proposes a novel physics-informed deep generative learning framework that, for the first time, integrates wave optics-based physical rendering and depth alignment into a generative adversarial network (GAN), to synthesise high-fidelity microscope images for microrobot pose estimation efficiently. Our method improves the structural similarity index (SSIM) by 35.6% compared to purely AI-driven methods, while maintaining real-time rendering speeds (0.022 s/frame).The pose estimator (CNN backbone) trained on our synthetic data achieves 93.9%/91.9% (pitch/roll) accuracy, just 5.0%/5.4% (pitch/roll) below that of an estimator trained exclusively on real data. Furthermore, our framework generalises to unseen poses, enabling data augmentation and robust pose estimation for novel microrobot configurations without additional training data.
- Abstract(参考訳): 光マイクロロボットの精密ポーズ推定は、高精度物体追跡と自律生物学研究を可能にするために不可欠である。
しかし、現在の手法は、マイクロロボット製造の複雑さと労働集約的なラベル付けのために、大きな高品質の顕微鏡画像データセットに大きく依存しており、取得が困難でコストがかかる。
ディジタルツインシステムは、シミュレーションから実データへの拡張に期待できるパスを提供するが、既存の技術は、回折アーティファクトや深度依存イメージングなどの複雑な光学顕微鏡現象を再現するのに苦労している。本研究は、波動光学に基づく物理レンダリングと深度アライメントを生成逆数ネットワーク(GAN)に初めて統合し、マイクロロボットのポーズ推定のための高忠実度顕微鏡画像の効率的な合成を行う新しい物理インフォームド深部生成学習フレームワークを提案する。
実時間レンダリング速度(0.022 s/frame)を維持しながら、純粋にAI駆動の手法と比較して、構造類似度指数(SSIM)を35.6%改善する。
合成データに基づいてトレーニングされたポーズ推定器(CNNバックボーン)は、93.9%/91.9%(ピッチ/ロール)の精度を達成し、実際のデータにのみ訓練された推定器よりわずか5.0%/5.4%(ピッチ/ロール)低い。
さらに,本フレームワークは未知のポーズを一般化し,新たなマイクロロボット構成のためのデータ拡張とロバストポーズ推定を可能にする。
関連論文リスト
- Uni-AIMS: AI-Powered Microscopy Image Analysis [28.24402780080126]
高品質な注釈付きデータセットを生成するデータエンジンを開発する。
本研究では,小物体と大物体の両方を頑健に検出できるセグメンテーションモデルを提案する。
我々のソリューションは、画像スケールバーの精度の高い自動認識を支援する。
論文 参考訳(メタデータ) (2025-05-11T09:35:53Z) - Accelerating Domain-Aware Electron Microscopy Analysis Using Deep Learning Models with Synthetic Data and Image-Wide Confidence Scoring [0.0]
我々は物理に基づく合成画像とデータ生成装置を作成し、その結果、同等の精度(0.86)、リコール(0.63)、F1スコア(0.71)、エンジニアリング特性予測(R2=0.82)を実現する機械学習モデルを得た。
本研究は,合成データがMLの人間依存を排除し,画像毎に多くの特徴を検出する必要がある場合に,ドメイン認識の手段を提供することを示す。
論文 参考訳(メタデータ) (2024-08-02T20:15:15Z) - Optimizations of Autoencoders for Analysis and Classification of
Microscopic In Situ Hybridization Images [68.8204255655161]
同様のレベルの遺伝子発現を持つ顕微鏡画像の領域を検出・分類するためのディープラーニングフレームワークを提案する。
分析するデータには教師なし学習モデルが必要です。
論文 参考訳(メタデータ) (2023-04-19T13:45:28Z) - Leveraging generative adversarial networks to create realistic scanning
transmission electron microscopy images [2.5954872177280346]
機械学習は、自律的なデータ収集と処理を通じて材料研究に革命をもたらす可能性がある。
我々は,実空間周波数情報を用いたシミュレーションデータを増大させるために,相互空間判別器を備えたサイクル生成逆数ネットワーク(CycleGAN)を用いる。
完全な畳み込みネットワーク(FCN)をトレーニングして、450万個の原子データセット内の単一原子欠陥を同定することで、我々のアプローチを実証する。
論文 参考訳(メタデータ) (2023-01-18T19:19:27Z) - An Adversarial Active Sampling-based Data Augmentation Framework for
Manufacturable Chip Design [55.62660894625669]
リソグラフィーモデリングは、チップ設計マスクが製造可能であることを保証するため、チップ設計において重要な問題である。
機械学習の最近の進歩は、時間を要するリソグラフィーシミュレーションをディープニューラルネットワークに置き換えるための代替ソリューションを提供している。
本稿では,限られたデータのジレンマを解消し,機械学習モデルの性能を向上させるために,データ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-27T20:53:39Z) - DeepRM: Deep Recurrent Matching for 6D Pose Refinement [77.34726150561087]
DeepRMは、6Dポーズ改善のための新しいリカレントネットワークアーキテクチャである。
アーキテクチャにはLSTMユニットが組み込まれ、各改善ステップを通じて情報を伝達する。
DeepRMは、2つの広く受け入れられている課題データセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-28T16:18:08Z) - A parameter refinement method for Ptychography based on Deep Learning
concepts [55.41644538483948]
伝播距離、位置誤差、部分的コヒーレンスにおける粗いパラメトリゼーションは、しばしば実験の生存性を脅かす。
最新のDeep Learningフレームワークは、セットアップの不整合を自律的に補正するために使用され、ポチコグラフィーの再構築の質が向上する。
我々は,elettra シンクロトロン施設のツインミックビームラインで取得した合成データセットと実データの両方でシステムをテストした。
論文 参考訳(メタデータ) (2021-05-18T10:15:17Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial
Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。
RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。
本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T17:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。