論文の概要: A Large-Language-Model Assisted Automated Scale Bar Detection and Extraction Framework for Scanning Electron Microscopic Images
- arxiv url: http://arxiv.org/abs/2510.11260v1
- Date: Mon, 13 Oct 2025 10:50:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.32807
- Title: A Large-Language-Model Assisted Automated Scale Bar Detection and Extraction Framework for Scanning Electron Microscopic Images
- Title(参考訳): 走査型電子顕微鏡画像のための大域モデルを用いた自動スケールバー検出・抽出フレームワーク
- Authors: Yuxuan Chen, Ruotong Yang, Zhengyang Zhang, Mehreen Ahmed, Yanming Wang,
- Abstract要約: マルチモーダルかつ自動スケールバー検出・抽出フレームワークを提案する。
オブジェクト検出、テキスト検出、およびLarge Language Model (LLM)エージェントによるテキスト認識を同時に提供する。
提案手法は,SEM画像におけるスケールバーの検出と抽出の効率と精度を大幅に向上させる。
- 参考スコア(独自算出の注目度): 11.084738769064701
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Microscopic characterizations, such as Scanning Electron Microscopy (SEM), are widely used in scientific research for visualizing and analyzing microstructures. Determining the scale bars is an important first step of accurate SEM analysis; however, currently, it mainly relies on manual operations, which is both time-consuming and prone to errors. To address this issue, we propose a multi-modal and automated scale bar detection and extraction framework that provides concurrent object detection, text detection and text recognition with a Large Language Model (LLM) agent. The proposed framework operates in four phases; i) Automatic Dataset Generation (Auto-DG) model to synthesize a diverse dataset of SEM images ensuring robust training and high generalizability of the model, ii) scale bar object detection, iii) information extraction using a hybrid Optical Character Recognition (OCR) system with DenseNet and Convolutional Recurrent Neural Network (CRNN) based algorithms, iv) an LLM agent to analyze and verify accuracy of the results. The proposed model demonstrates a strong performance in object detection and accurate localization with a precision of 100%, recall of 95.8%, and a mean Average Precision (mAP) of 99.2% at IoU=0.5 and 69.1% at IoU=0.5:0.95. The hybrid OCR system achieved 89% precision, 65% recall, and a 75% F1 score on the Auto-DG dataset, significantly outperforming several mainstream standalone engines, highlighting its reliability for scientific image analysis. The LLM is introduced as a reasoning engine as well as an intelligent assistant that suggests follow-up steps and verifies the results. This automated method powered by an LLM agent significantly enhances the efficiency and accuracy of scale bar detection and extraction in SEM images, providing a valuable tool for microscopic analysis and advancing the field of scientific imaging.
- Abstract(参考訳): SEM(Scanning Electron Microscopy)のような微視的特性は、微細構造を可視化し分析するための科学的研究に広く用いられている。
スケールバーを決定することは、正確なSEM分析の重要な第1ステップであるが、現在は主に手動操作に依存しており、これは時間を要することとエラーを起こしやすい。
この問題に対処するために,大規模言語モデル(LLM)エージェントを用いたオブジェクト検出,テキスト検出,テキスト認識を同時に行うマルチモーダルかつ自動化されたスケールバー検出抽出フレームワークを提案する。
提案するフレームワークは4つのフェーズで動作します。
一 モデルの自動データセット生成(Auto-DG)モデルにより、モデルの堅牢なトレーニングと高一般化性を保証する多種多様なSEM画像のデータセットを合成する。
二 スケールバー物検出
三 DenseNet と Convolutional Recurrent Neural Network (CRNN) を用いたハイブリッド光文字認識(OCR)システムによる情報抽出
四 結果の正確性を分析し検証するLLM剤。
提案モデルでは,物体検出精度が100%,95.8%,平均精度が99.2%,IoU=0.5:0.95で69.1%であった。
ハイブリッドOCRシステムは89%の精度、65%のリコールとオートDGデータセットの75%のF1スコアを達成した。
LLMは推論エンジンとして、そして後続ステップを提案し、結果を検証するインテリジェントアシスタントとして導入された。
SEM画像におけるスケールバーの検出及び抽出の効率及び精度を大幅に向上させ、顕微鏡解析および科学画像の分野の進展に有用な手段を提供する。
関連論文リスト
- AutoMat: Enabling Automated Crystal Structure Reconstruction from Microscopy via Agentic Tool Use [43.82226218242389]
本稿では,走査型電子顕微鏡画像から原子結晶構造への自動変換を行う,エンドツーエンドのエージェントアシストパイプラインであるAutoMatを紹介する。
AutoMatはパターン適応型Denoising、物理誘導型テンプレート検索、対称性を考慮した原子再構成、高速な緩和、MatterSimによるプロパティ予測を組み合わせたものだ。
450以上の構造サンプルの大規模な実験では、AutoMatは既存のマルチモーダルな大規模言語モデルやツールを大幅に上回っている。
論文 参考訳(メタデータ) (2025-05-19T03:04:50Z) - Uni-AIMS: AI-Powered Microscopy Image Analysis [28.24402780080126]
高品質な注釈付きデータセットを生成するデータエンジンを開発する。
本研究では,小物体と大物体の両方を頑健に検出できるセグメンテーションモデルを提案する。
我々のソリューションは、画像スケールバーの精度の高い自動認識を支援する。
論文 参考訳(メタデータ) (2025-05-11T09:35:53Z) - Zero-shot Autonomous Microscopy for Scalable and Intelligent Characterization of 2D Materials [41.856704526703595]
従来、原子スケールの材料の特徴付けには、数ヶ月から数年の専門的な訓練を必要とする。
このボトルネックは、大規模なトレーニングデータセットを必要とせずに研究目的を理解できる完全自律的な実験システムへの需要を加速させる。
本稿では,2次元材料の完全自律的ゼロショットキャラクタリゼーションを実現するため,基礎モデルを統合するエンドツーエンドフレームワークであるATOMICを提案する。
論文 参考訳(メタデータ) (2025-04-14T14:49:45Z) - Automated Segmentation and Analysis of Microscopy Images of Laser Powder Bed Fusion Melt Tracks [0.0]
断面画像から溶融トラック次元を自動的に識別し,計測する画像分割ニューラルネットワークを提案する。
我々は、U-Netアーキテクチャを用いて、異なる研究室、機械、材料から得られた62個の事前ラベル付き画像のデータセットと、画像拡張を併用したトレーニングを行う。
論文 参考訳(メタデータ) (2024-09-26T22:44:00Z) - Accelerating Domain-Aware Electron Microscopy Analysis Using Deep Learning Models with Synthetic Data and Image-Wide Confidence Scoring [0.0]
我々は物理に基づく合成画像とデータ生成装置を作成し、その結果、同等の精度(0.86)、リコール(0.63)、F1スコア(0.71)、エンジニアリング特性予測(R2=0.82)を実現する機械学習モデルを得た。
本研究は,合成データがMLの人間依存を排除し,画像毎に多くの特徴を検出する必要がある場合に,ドメイン認識の手段を提供することを示す。
論文 参考訳(メタデータ) (2024-08-02T20:15:15Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Optimizations of Autoencoders for Analysis and Classification of
Microscopic In Situ Hybridization Images [68.8204255655161]
同様のレベルの遺伝子発現を持つ顕微鏡画像の領域を検出・分類するためのディープラーニングフレームワークを提案する。
分析するデータには教師なし学習モデルが必要です。
論文 参考訳(メタデータ) (2023-04-19T13:45:28Z) - A parameter refinement method for Ptychography based on Deep Learning
concepts [55.41644538483948]
伝播距離、位置誤差、部分的コヒーレンスにおける粗いパラメトリゼーションは、しばしば実験の生存性を脅かす。
最新のDeep Learningフレームワークは、セットアップの不整合を自律的に補正するために使用され、ポチコグラフィーの再構築の質が向上する。
我々は,elettra シンクロトロン施設のツインミックビームラインで取得した合成データセットと実データの両方でシステムをテストした。
論文 参考訳(メタデータ) (2021-05-18T10:15:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。