論文の概要: SortScrews: A Dataset and Baseline for Real-time Screw Classification
- arxiv url: http://arxiv.org/abs/2603.13027v1
- Date: Fri, 13 Mar 2026 14:35:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:12.122294
- Title: SortScrews: A Dataset and Baseline for Real-time Screw Classification
- Title(参考訳): SortScrews: リアルタイムスクリュー分類のためのデータセットとベースライン
- Authors: Tianhao Fu, Bingxuan Yang, Juncheng Guo, Shrena Sribalan, Yucheng Chen,
- Abstract要約: ネジのケースワイズ分類のためのデータセットであるtextbfSortScrews$を紹介した。
データセットには,6種類のネジとバックグラウンドクラスをカバーする512タイム512ドルの解像度で,560RGBイメージが含まれている。
画像は、標準化された取得設定を使用してキャプチャされ、照明とカメラの視点の微妙なバリエーションを含む。
- 参考スコア(独自算出の注目度): 3.368575063510668
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic identification of screw types is important for industrial automation, robotics, and inventory management. However, publicly available datasets for screw classification are scarce, particularly for controlled single-object scenarios commonly encountered in automated sorting systems. In this work, we introduce $\textbf{SortScrews}$, a dataset for casewise visual classification of screws. The dataset contains 560 RGB images at $512\times512$ resolution covering six screw types and a background class. Images are captured using a standardized acquisition setup and include mild variations in lighting and camera perspective across four capture settings. To facilitate reproducible research and dataset expansion, we also provide a reusable data collection script that allows users to easily construct similar datasets for custom hardware components using inexpensive camera setups. We establish baseline results using transfer learning with EfficientNet-B0 and ResNet-18 classifiers pretrained on ImageNet. In addition, we conduct a well-explored failure analysis. Despite the limited dataset size, these lightweight models achieve strong classification accuracy, demonstrating that controlled acquisition conditions enable effective learning even with relatively small datasets. The dataset, collection pipeline, and baseline training code are publicly available at https://github.com/ATATC/SortScrews.
- Abstract(参考訳): スクリュータイプの自動識別は、産業自動化、ロボット工学、在庫管理において重要である。
しかし、特に自動ソートシステムでよく見られる制御された単一オブジェクトシナリオでは、スクリュー分類のための公開データセットは少ない。
本稿では,ネジのケースワイズ分類のためのデータセットである$\textbf{SortScrews}$を紹介する。
データセットには,6種類のネジとバックグラウンドクラスをカバーする512\times512$解像度の560 RGBイメージが含まれている。
画像は、標準化された取得設定でキャプチャされ、4つのキャプチャ設定で照明とカメラの視点が微妙に変化する。
また、再現可能な研究やデータセットの拡張を容易にするために、ユーザが安価なカメラセットアップを使用して、カスタムハードウェアコンポーネント用の同様のデータセットを簡単に構築できる再利用可能なデータ収集スクリプトを提供する。
我々は、ImageNetで事前訓練されたEfficientNet-B0およびResNet-18分類器を用いた転送学習によるベースライン結果を確立する。
さらに、よく探索された故障解析を行う。
データセットのサイズが限られているにもかかわらず、これらの軽量モデルは強力な分類精度を実現し、制御された取得条件が比較的小さなデータセットでも効果的な学習を可能にすることを示した。
データセット、コレクションパイプライン、ベースライントレーニングコードはhttps://github.com/ATATC/SortScrews.comで公開されている。
関連論文リスト
- Data Filtering Networks [67.827994353269]
本研究では、大規模な未処理データセットをフィルタリングする第2ステップにおいて、データフィルタリングネットワーク(DFN)を学習する問題について検討する。
我々の重要な発見は、フィルタリングのためのネットワークの品質が下流タスクのパフォーマンスと異なることである。
我々の知見に基づいて、最先端の画像テキストデータセットを誘導する新しいデータフィルタリングネットワークを構築した。
論文 参考訳(メタデータ) (2023-09-29T17:37:29Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z) - Q: How to Specialize Large Vision-Language Models to Data-Scarce VQA
Tasks? A: Self-Train on Unlabeled Images! [103.09776737512077]
SelTDA(Self-Taught Data Augmentation)は、小規模なVQAデータセット上で大きな視覚言語モデルを微調整するための戦略である。
画像上に直接条件付の疑似ラベルを生成することで、未ラベル画像の疑似ラベル作成を可能にする。
我々は, 自己学習によるデータ拡張が, 対向的に検索された質問に対して堅牢性を高めることを示す一連の実験について述べる。
論文 参考訳(メタデータ) (2023-06-06T18:00:47Z) - A Fine-Grained Vehicle Detection (FGVD) Dataset for Unconstrained Roads [29.09167268252761]
本研究では,自動車に搭載された移動カメラから捉えた,野生におけるファイングラインド車両検出データセットについて紹介する。
シーンイメージは5502枚あり、3レベル階層に整理された複数の車両の210個の細粒度ラベルがある。
以前の分類データセットには、さまざまな種類の車も含まれていたが、FGVDデータセットでは、二輪車、オートリックショー、トラックを分類するための新しいクラスラベルが導入されている。
論文 参考訳(メタデータ) (2022-12-30T06:50:15Z) - Prefix Conditioning Unifies Language and Label Supervision [84.11127588805138]
学習した表現の一般化性を低減することにより,データセットのバイアスが事前学習に悪影響を及ぼすことを示す。
実験では、この単純な手法により、ゼロショット画像認識精度が向上し、画像レベルの分布シフトに対するロバスト性が向上することを示した。
論文 参考訳(メタデータ) (2022-06-02T16:12:26Z) - StandardSim: A Synthetic Dataset For Retail Environments [0.07874708385247352]
本稿では,意味的セグメンテーション,インスタンスセグメンテーション,深さ推定,オブジェクト検出のためのアノテーションを特徴とする大規模合成データセットを提案する。
私たちのデータセットはシーン毎に複数のビューを提供し、マルチビュー表現学習を可能にします。
我々は、データセットのセグメンテーションと深さ推定に広く使用されているモデルをベンチマークし、我々のテストセットが現在の小規模データセットと比較して難しいベンチマークを構成することを示す。
論文 参考訳(メタデータ) (2022-02-04T22:28:35Z) - CPPE-5: Medical Personal Protective Equipment Dataset [0.0]
このデータセットには、5つのオブジェクトカテゴリ(カバール、フェイスシールド、手袋、マスク、ゴーグル)が含まれており、各イメージには境界ボックスと正のラベルのセットがアノテートされている。
このデータセットでトレーニングされたモデルが、複雑なシーンの現実的なシナリオで簡単に使用できるようにするために、我々のデータセットは主に、各シーンに複数のオブジェクトがある複雑なシーンを自然のコンテキストで表示する画像を含んでいる。
論文 参考訳(メタデータ) (2021-12-15T18:45:55Z) - Free Lunch for Co-Saliency Detection: Context Adjustment [14.688461235328306]
市販のサリエンシ検出データセットからの画像を利用して新しいサンプルを合成する「コストフリー」グループカットペースト(GCP)手順を提案する。
我々は、Context Adjustment Trainingと呼ばれる新しいデータセットを収集します。データセットの2つのバリエーション、すなわち、CATとCAT+は、それぞれ16,750と33,500の画像で構成されています。
論文 参考訳(メタデータ) (2021-08-04T14:51:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。