論文の概要: Bridging Foundation Models and ASTM Metallurgical Standards for Automated Grain Size Estimation from Microscopy Images
- arxiv url: http://arxiv.org/abs/2604.18957v1
- Date: Tue, 21 Apr 2026 01:13:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.559821
- Title: Bridging Foundation Models and ASTM Metallurgical Standards for Automated Grain Size Estimation from Microscopy Images
- Title(参考訳): 顕微鏡画像からの粒径自動推定のためのブリッジング基礎モデルとASTM金属標準
- Authors: Abdul Mueez, Shruti Vyas,
- Abstract要約: 本研究では,高密度セグメンテーションと粒径推定のための自動パイプラインを提案する。
このパイプラインを古典的畳み込みネットワーク(U-Net)、適応型プロンプト視覚基盤モデル(MatSAM)、現代視覚言語モデル(Qwen2.5-VL-7B)とベンチマークする。
トレーニングスプリットを段階的に削減した実験は、驚くべき数ショットのスケーラビリティを示している。
- 参考スコア(独自算出の注目度): 4.3441332321802095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extracting standardized metallurgical metrics from microscopy images remains challenging due to complex grain morphology and the data demands of supervised segmentation. To bridge foundational computer vision with practical metallurgical evaluation, we propose an automated pipeline for dense instance segmentation and grain size estimation that adapts Cellpose-SAM to microstructures and integrates its topology-aware gradient tracking with an ASTM E112 Jeffries planimetric module. We systematically benchmark this pipeline against a classical convolutional network (U-Net), an adaptive-prompting vision foundation model (MatSAM) and a contemporary vision-language model (Qwen2.5-VL-7B). Our evaluations reveal that while the out-of-the-box vision-language model struggles with the localized spatial reasoning required for dense microscopic counting and MatSAM suffers from over-segmentation despite its domain-specific prompt generation, our adapted pipeline successfully maintains topological separation. Furthermore, experiments across progressively reduced training splits demonstrate exceptional few-shot scalability; utilizing only two training samples, the proposed system predicts the ASTM grain size number (G) with a mean absolute percentage error (MAPE) as low as 1.50%, while robustness testing across varying target grain counts empirically validates the ASTM 50-grain sampling minimum. These results highlight the efficacy of application-level foundation model integration for highly accurate, automated materials characterization. Our project repository is available at https://github.com/mueez-overflow/ASTM-Grain-Size-Estimator.
- Abstract(参考訳): 顕微鏡画像から標準化された冶金のメトリクスを抽出することは、複雑な粒の形態と教師付きセグメンテーションのデータ要求のために依然として困難である。
基礎的なコンピュータビジョンを実用的な冶金的評価で橋渡しするために,Cellpose-SAMをマイクロ構造に適用し,そのトポロジを考慮した勾配追跡をASTM E112 Jeffries計画モジュールと統合する,高密度なインスタンス分割と粒度推定のための自動パイプラインを提案する。
我々はこのパイプラインを古典的畳み込みネットワーク(U-Net)、適応型プロンプト型視覚基盤モデル(MatSAM)、現代視覚言語モデル(Qwen2.5-VL-7B)と体系的にベンチマークする。
提案手法は,高密度微視的計数に必要な局所的な空間的推論に難渋するが,MateSAMはドメイン固有の急激な生成にもかかわらず過密化に悩まされるが,適応パイプラインはトポロジ的分離の維持に成功している。
さらに,2つのトレーニングサンプルのみを用いて,平均絶対パーセンテージ誤差(MAPE)を1.50%まで低減したASTM粒径数(G)を予測し,目標粒数に対するロバスト性試験はASTM50粒径の最小値を実証的に検証した。
これらの結果は、高精度で自動化された材料評価のためのアプリケーションレベルの基礎モデル統合の有効性を浮き彫りにした。
私たちのプロジェクトリポジトリはhttps://github.com/mueez-overflow/ASTM-Grain-Size-Estimatorで公開されています。
関連論文リスト
- TubeMLLM: A Foundation Model for Topology Knowledge Exploration in Vessel-like Anatomy [16.269041470108938]
TubeMLLMは、医療血管のような解剖学のための制御可能な生成と構造的理解を結合した統合基盤モデルである。
トポロジ的先行を明示的な自然言語によって統合し、それらを共有アテンションアーキテクチャの視覚的表現と整合させることで、チューブMLLMはトポロジ的認識を著しく強化する。
論文 参考訳(メタデータ) (2026-03-10T05:39:30Z) - Assessing Foundation Models for Mold Colony Detection with Limited Training Data [13.811543290168684]
5000ペトリの食器画像にバウンディングボックスをアノテートした代表的データセットを構築した。
従来のタスク固有のメトリクスのベースラインに対して、3つのビジョンファウンデーションモデルをベンチマークする。
MaskDinoは150枚の画像のみを微調整しながら、広範囲に訓練されたYoloV9モデルでほぼ完成している。
論文 参考訳(メタデータ) (2025-10-01T06:25:45Z) - LEMUR Neural Network Dataset: Towards Seamless AutoML [35.57280723615144]
我々は、PyTorchベースのニューラルネットワークの大規模なコレクションを提供するオープンソースのデータセットとフレームワークであるLEMURを紹介する。
各モデルは統一されたテンプレートに従い、構成と結果が構造化データベースに格納され、一貫性が保証される。
LEMURはAutoMLの研究を加速し、公正なベンチマークを可能にし、大規模ニューラルネットワーク研究の障壁を減らすことを目的としている。
論文 参考訳(メタデータ) (2025-04-14T09:08:00Z) - Hybrid machine learning based scale bridging framework for permeability prediction of fibrous structures [0.0]
本研究では,繊維状繊維構造の透水性を予測するための,ハイブリッド機械学習に基づくスケールブリジングフレームワークを提案する。
SSM(Single Scale Method)、SUM(Simple Upscaling Method)、SBM(Scale-Bridging Method)、FRM(Fully Resolved Model)の4つの手法が評価された。
論文 参考訳(メタデータ) (2025-02-07T16:09:25Z) - Self-Supervised Dataset Distillation for Transfer Learning [77.4714995131992]
ラベルなしデータセットを、効率的な自己教師付き学習(SSL)のための小さな合成サンプル群に蒸留する新しい問題を提案する。
両レベル最適化におけるSSL目標に対する合成サンプルの勾配は、データ拡張やマスキングから生じるランダム性から、テキストバイアスを受けていることを最初に証明する。
転送学習を含む様々な応用における本手法の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2023-10-10T10:48:52Z) - Learning Multiscale Consistency for Self-supervised Electron Microscopy
Instance Segmentation [48.267001230607306]
本稿では,EMボリュームのマルチスケール一貫性を高める事前学習フレームワークを提案する。
当社のアプローチでは,強力なデータ拡張と弱いデータ拡張を統合することで,Siameseネットワークアーキテクチャを活用している。
効果的にボクセルと機能の一貫性をキャプチャし、EM分析のための転送可能な表現を学習する。
論文 参考訳(メタデータ) (2023-08-19T05:49:13Z) - Score-based Generative Modeling in Latent Space [93.8985523558869]
スコアベース生成モデル(SGM)は,最近,サンプル品質と分布範囲の両面で顕著な結果を示した。
本稿では,Latent Score-based Generative Model (LSGM)を提案する。
データから潜在空間への移動により、より表現力のある生成モデルをトレーニングし、非連続データにSGMを適用し、よりスムーズなSGMをより小さな空間で学習することができる。
論文 参考訳(メタデータ) (2021-06-10T17:26:35Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - A Generative Learning Approach for Spatio-temporal Modeling in Connected
Vehicular Network [55.852401381113786]
本稿では,コネクテッドカーの無線アクセス遅延を実現するための総合的時間品質フレームワークであるLaMI(Latency Model Inpainting)を提案する。
LaMIはイメージインペイントと合成のアイデアを採用し、2段階の手順で欠落したレイテンシサンプルを再構築することができる。
特に、パッチ方式のアプローチを用いて各地域で収集されたサンプル間の空間的相関を初めて発見し、その後、原点および高度に相関したサンプルをバラエナオートコーダ(VAE)に供給する。
論文 参考訳(メタデータ) (2020-03-16T03:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。