論文の概要: CornViT: A Multi-Stage Convolutional Vision Transformer Framework for Hierarchical Corn Kernel Analysis
- arxiv url: http://arxiv.org/abs/2601.00897v1
- Date: Wed, 31 Dec 2025 16:16:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:21.836134
- Title: CornViT: A Multi-Stage Convolutional Vision Transformer Framework for Hierarchical Corn Kernel Analysis
- Title(参考訳): CornViT:階層型カーネル解析のための多段階畳み込み視覚変換フレームワーク
- Authors: Sai Teja Erukude, Jane Mascarenhas, Lior Shamir,
- Abstract要約: トウモロコシの核の正確なグレーディングは、種子の認証、方向性の種付け、育種において重要である。
これは、人間のシードアナリストの階層的推論をエミュレートする3段階のConvolutional Vision Transformerフレームワークである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate grading of corn kernels is critical for seed certification, directional seeding, and breeding, yet it is still predominantly performed by manual inspection. This work introduces CornViT, a three-stage Convolutional Vision Transformer (CvT) framework that emulates the hierarchical reasoning of human seed analysts for single-kernel evaluation. Three sequential CvT-13 classifiers operate on 384x384 RGB images: Stage 1 distinguishes pure from impure kernels; Stage 2 categorizes pure kernels into flat and round morphologies; and Stage 3 determines the embryo orientation (up vs. down) for pure, flat kernels. Starting from a public corn seed image collection, we manually relabeled and filtered images to construct three stage-specific datasets: 7265 kernels for purity, 3859 pure kernels for morphology, and 1960 pure-flat kernels for embryo orientation, all released as benchmarks. Head-only fine-tuning of ImageNet-22k pretrained CvT-13 backbones yields test accuracies of 93.76% for purity, 94.11% for shape, and 91.12% for embryo-orientation detection. Under identical training conditions, ResNet-50 reaches only 76.56 to 81.02 percent, whereas DenseNet-121 attains 86.56 to 89.38 percent accuracy. These results highlight the advantages of convolution-augmented self-attention for kernel analysis. To facilitate adoption, we deploy CornViT in a Flask-based web application that performs stage-wise inference and exposes interpretable outputs through a browser interface. Together, the CornViT framework, curated datasets, and web application provide a deployable solution for automated corn kernel quality assessment in seed quality workflows. Source code and data are publicly available.
- Abstract(参考訳): トウモロコシの核の正確なグレーディングは、種子の認証、方向性の種付け、育種において重要であるが、手作業による検査が中心である。
この研究は、3段階のConvolutional Vision Transformer (CvT)フレームワークであるCornViTを紹介した。
3つのシーケンシャルなCvT-13分類器は、384x384 RGBイメージで動作している:ステージ1は純核と不純核を区別し、ステージ2は純核を平らで丸い形態に分類し、ステージ3は純粋で平らなカーネルの胚配向(アップ対ダウン)を決定する。
パブリックコーンのシード画像収集から始まり、手動で画像のレバーベリングとフィルタを行い、3つのステージ固有のデータセットを構築しました。
ImageNet-22kで事前訓練されたCvT-13バックボーンの頭部のみを微調整すると、純度は93.76%、形状は94.11%、胚方位検出は91.12%となる。
同じトレーニング条件下では、ResNet-50は76.56から81.02%にしか達せず、DenseNet-121は86.56から89.38パーセントの精度である。
これらの結果は、カーネル解析における畳み込み強化自己アテンションの利点を浮き彫りにした。
採用を容易にするため、FlaskベースのWebアプリケーションにCornViTをデプロイし、ステージワイズ推論を行い、ブラウザインターフェースを介して解釈可能な出力を公開する。
CornViTフレームワーク、キュレートされたデータセット、Webアプリケーションとともに、シード品質ワークフローにおけるコーンカーネル品質の自動評価のためのデプロイ可能なソリューションを提供する。
ソースコードとデータは公開されている。
関連論文リスト
- Scaling Up 3D Kernels with Bayesian Frequency Re-parameterization for
Medical Image Segmentation [25.62587471067468]
RepUX-Netは、単純な大きなカーネルブロック設計を持つ純粋なCNNアーキテクチャである。
人間の視覚系における空間周波数にインスパイアされ、カーネル収束を要素的設定に変化させるよう拡張する。
論文 参考訳(メタデータ) (2023-03-10T08:38:34Z) - Which Pixel to Annotate: a Label-Efficient Nuclei Segmentation Framework [70.18084425770091]
ディープニューラルネットワークは、H&E染色病理像の核インスタンスセグメンテーションに広く応用されている。
通常、類似したパターンと冗長なパターンを含む核画像のデータセットに全てのピクセルをラベル付けするのは非効率で不要である。
そこで本研究では,アノテートするイメージパッチを数個だけ選択し,選択したサンプルからトレーニングセットを増強し,半教師付きで核分割を実現する,新しいフル核分割フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-20T14:53:26Z) - Global Context Vision Transformers [78.5346173956383]
我々は,コンピュータビジョンのパラメータと計算利用を向上する新しいアーキテクチャであるGC ViT(Global context vision transformer)を提案する。
本稿では,ViTにおける帰納バイアスの欠如に対処し,アーキテクチャにおける可溶性逆残差ブロックを改良して活用することを提案する。
提案したGC ViTは,画像分類,オブジェクト検出,セマンティックセマンティックセグメンテーションタスクにまたがる最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-06-20T18:42:44Z) - Low-complexity deep learning frameworks for acoustic scene
classification [64.22762153453175]
音響シーン分類(ASC)のための低複雑さ深層学習フレームワークを提案する。
提案するフレームワークは、フロントエンドのスペクトログラム抽出、オンラインデータ拡張、バックエンドの分類、予測される確率の後期融合の4つの主要なステップに分けることができる。
DCASE 2022 Task 1 Development データセットで実施した実験は,低複雑さの要求を十分に満たし,最も高い分類精度を 60.1% で達成した。
論文 参考訳(メタデータ) (2022-06-13T11:41:39Z) - Kernel Identification Through Transformers [54.3795894579111]
カーネル選択はガウス過程(GP)モデルの性能決定において中心的な役割を果たす。
この研究は、高次元GP回帰モデルのためのカスタムカーネル関数を構築するという課題に対処する。
KITT: Kernel Identification through Transformersを提案する。
論文 参考訳(メタデータ) (2021-06-15T14:32:38Z) - A Deep Learning Approach Based on Graphs to Detect Plantation Lines [16.76043873454695]
本稿では,UAVを用いたRGB画像における植林線検出のためのグラフに基づく深層学習手法を提案する。
提案手法は最先端のディープラーニング手法と比較した。
精度、リコール、F1スコアはそれぞれ98.7%、91.9%、95.1%だった。
論文 参考訳(メタデータ) (2021-02-05T14:56:42Z) - A CNN Approach to Simultaneously Count Plants and Detect Plantation-Rows
from UAV Imagery [56.10033255997329]
畳み込みニューラルネットワーク(CNN)を用いた新しい深層学習手法を提案する。
高度に乾燥したプランテーション構成を考慮した植物を数えながら、同時にプランテーション・ロウを検出し、配置する。
提案手法は、異なる種類の作物のUAV画像において、植物と植物をカウントおよびジオロケートするための最先端の性能を達成した。
論文 参考訳(メタデータ) (2020-12-31T18:51:17Z) - Pollen Grain Microscopic Image Classification Using an Ensemble of
Fine-Tuned Deep Convolutional Neural Networks [2.824133171517646]
花粉の微粒化を4つのカテゴリに分類するためのアンサンブル手法を提案する。
我々は、4つの最先端の微調整畳み込みニューラルネットワークの融合に基づく分類戦略を開発する。
我々は、ICPR 2020 Pollen Grain Classification Challengeトレーニングデータセットで94.48%の精度と重み付きF1スコア94.54%を得る。
論文 参考訳(メタデータ) (2020-11-15T01:25:46Z) - Convolutional Neural Networks for Image-based Corn Kernel Detection and
Counting [22.070850942573863]
発達したトウモロコシの耳は最大800個の核を持つ。
手動でトウモロコシの耳にカーネルを数えるのは、労働集約的であり、ヒューマンエラーを起こしやすい。
本稿では,スライディングウインドウアプローチに基づくカーネル検出とカウント手法を提案する。
論文 参考訳(メタデータ) (2020-03-26T16:46:23Z) - Learning Deep Kernels for Non-Parametric Two-Sample Tests [50.92621794426821]
2組のサンプルが同じ分布から引き出されるかどうかを判定するカーネルベースの2サンプルテストのクラスを提案する。
私たちのテストは、テストパワーを最大化するためにトレーニングされたディープニューラルネットワークによってパラメータ化されたカーネルから構築されます。
論文 参考訳(メタデータ) (2020-02-21T03:54:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。