Fugu-MT 論文翻訳(概要): Speeding up the annotation process in semantic segmentation industrial applications

論文の概要: Speeding up the annotation process in semantic segmentation industrial applications

arxiv url: http://arxiv.org/abs/2606.19934v1
Date: Thu, 18 Jun 2026 08:31:50 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-19 18:23:39.732553
Title: Speeding up the annotation process in semantic segmentation industrial applications
Title（参考訳）: セマンティックセグメンテーション産業応用におけるアノテーションプロセスの高速化
Authors: Marta Fernandez-Moreno, Margarita Guerrero, Rosalia Rementeria, Pablo Mesejo, Raul Moreno,
Abstract要約: 本稿では,教師なしアルゴリズムがラベル付け過程をいかに加速するかを定量化する最初の研究である。教師なしコンピュータビジョンアルゴリズムを用いることで、ラベリングプロセスに必要な時間を170時間から37時間に短縮できることを示す。これらの課題にも拘わらず、MITライセンス下で永続的なDOIで利用可能な、これまでで最大のパブリックスチールミクロ構造セグメンテーションデータセットを作成し、共有しています。
参考スコア（独自算出の注目度）: 2.819055101336186
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Current machine learning models commonly require large and well-annotated datasets. However, the annotation process often becomes a bottleneck, with increased complexity leading to higher chances of human errors. Within this context, our goal in this paper is to leverage unsupervised algorithms to improve data annotation efficiency for complex semantic segmentation problems in industrial materials science. Previous research has quantified labeling time and others explored unsupervised methods. However, to the best of our knowledge, this is the first study to quantify how much unsupervised algorithms accelerate the labeling process. We aim to validate the extent to which this laborious process can be accelerated, focusing on semantic segmentation tasks that involve annotating each pixel of high-resolution images, such as the microstructure characterization challenge in materials science. Specifically, we demonstrate that by using unsupervised computer vision algorithms, the time required for the labeling process can be reduced from 170 hours to 37 hours, achieving an approximate reduction of 78\%. The dataset we work with includes large images of dimensions 1280x959 and 960x703, which further increases the complexity of the annotation task. Despite these challenges, we create and share the largest public steel microstructure segmentation dataset to date, available under MIT License with permanent DOI, contributing a fully annotated, high-resolution dataset to the field. Additionally, this is the first work to compare the labeling time from scratch (a common approach in previous studies) to the labeling time when using these unsupervised algorithms as a pre-annotation step. Furthermore, we provide a Deep Learning model trained on this dataset, validated by field experts, and deployed in an industrial setting, serving as an initial benchmark for this public dataset.
Abstract（参考訳）: 現在の機械学習モデルでは、大きくよく注釈付けされたデータセットが一般的に必要である。しかし、アノテーションプロセスはしばしばボトルネックとなり、複雑さが増し、人間のエラーの可能性が高まる。本研究の目的は, 産業材料科学における複雑なセマンティックセグメンテーション問題に対するデータアノテーション効率を向上させるために, 教師なしアルゴリズムを活用することである。これまでの研究では、ラベル付け時間など、教師なしの手法が研究されている。しかし、私たちの知る限りでは、教師なしアルゴリズムがラベリングプロセスをいかに加速するかを定量化する最初の研究である。本研究の目的は,材料科学における微細構造解析の課題など,高解像度画像の各ピクセルに注釈を付ける意味的セグメンテーションタスクに焦点をあてて,この手間のかかるプロセスがどの程度加速できるかを検証することである。具体的には、教師なしコンピュータビジョンアルゴリズムを用いることで、ラベリングに要する時間を170時間から37時間に短縮し、78 %の近似的な削減を達成できることを実証する。私たちが取り組んでいるデータセットには、1280x959と960x703の次元の大規模なイメージが含まれており、アノテーションタスクの複雑さをさらに高めています。これらの課題にも拘わらず、MITライセンスの下で利用可能な、これまでで最大のパブリックスチールミクロ構造セグメンテーションデータセットを作成し、共有し、完全に注釈付きで高解像度のデータセットをこの分野に提供します。さらに、これは、スクラッチからラベリング時間(以前の研究における一般的なアプローチ)を、これらの教師なしアルゴリズムを事前アノテーションステップとして使用するときのラベリング時間と比較する最初の研究である。さらに、このデータセットに基づいてトレーニングされたディープラーニングモデルを提供し、フィールドの専門家によって検証され、産業環境でデプロイされ、このパブリックデータセットの初期ベンチマークとして機能します。

関連論文リスト

A Dataset for the Validation of Truth Inference Algorithms Suitable for Online Deployment [76.04306818209753]
実世界のクラウドソーシングプラットフォームから収集した,実質的なクラウドソーシングアノテーションデータセットを紹介する。このデータセットは、約2万のワーカー、100万のタスク、600万のアノテーションで構成されている。本データセットにおけるいくつかの代表的真理推論アルゴリズムの有効性を評価する。
論文参考訳（メタデータ） (2024-03-10T16:00:41Z)
Stochastic Amortization: A Unified Approach to Accelerate Feature and Data Attribution [62.71425232332837]
雑音ラベル付きモデルを用いたトレーニングは安価で驚くほど効果的であることを示す。このアプローチは、いくつかの特徴属性とデータ評価手法を著しく加速し、しばしば既存のアプローチよりも桁違いにスピードアップする。
論文参考訳（メタデータ） (2024-01-29T03:42:37Z)
Timestamp-supervised Wearable-based Activity Segmentation and Recognition with Contrastive Learning and Order-Preserving Optimal Transport [11.837401473598288]
本稿では,タイムスタンプによる協調活動のセグメンテーションと認識のための新しい手法を提案する。プロトタイプはクラスアクティベーションマップによって推定され、サンプル-プロトタイプコントラストモジュールを形成する。 4つの公開HARデータセットに関する総合的な実験により、タイムスタンプの監督で訓練されたモデルが、最先端の弱い教師付き手法よりも優れていることが示された。
論文参考訳（メタデータ） (2023-10-13T14:00:49Z)
Active Transfer Prototypical Network: An Efficient Labeling Algorithm for Time-Series Data [1.7205106391379026]
本稿では,プロトタイプネットワーク(ProtoNet)をALイテレーションに組み込むことで,トレードオフ問題に対処する新しいFew-Shot Learning(FSL)ベースのALフレームワークを提案する。このフレームワークは、UCI HAR/HAPTデータセットと現実世界のブレーキ操作データセットに基づいて検証された。学習性能は、両方のデータセットにおける従来のALアルゴリズムを大幅に上回り、それぞれ10%と5%のラベル付け作業で90%の分類精度を達成した。
論文参考訳（メタデータ） (2022-09-28T16:14:40Z)
Streaming Self-Training via Domain-Agnostic Unlabeled Images [62.57647373581592]
視覚認識モデル学習の過程を民主化することを目的としたストリーミング自己学習(SST)を提案する。 SSTの鍵となるのは、(1)ドメインに依存しない未ラベル画像により、追加の知識や監督なしにいくつかのラベル付き例でより良いモデルを学ぶことができ、(2)学習は継続的なプロセスであり、学習更新のスケジュールを構築することで行うことができる。
論文参考訳（メタデータ） (2021-04-07T17:58:39Z)
Deep learning for time series classification [2.0305676256390934]
時系列分析により、時間の経過とともにプロセスの進化を可視化し、理解することができます。時系列分類は時系列データを自動的にラベル付けするアルゴリズムで構成されている。ディープラーニングは、教師付き分類タスクに対処する最も効果的な方法の1つとして登場した。
論文参考訳（メタデータ） (2020-10-01T17:38:40Z)
Semi-Supervised Learning with Meta-Gradient [123.26748223837802]
半教師付き学習における簡単なメタ学習アルゴリズムを提案する。その結果,提案アルゴリズムは最先端の手法に対して良好に動作することがわかった。
論文参考訳（メタデータ） (2020-07-08T08:48:56Z)
Naive-Student: Leveraging Semi-Supervised Learning in Video Sequences for Urban Scene Segmentation [57.68890534164427]
本研究では,未ラベル映像シーケンスと追加画像の半教師付き学習を利用して,都市景観セグメンテーションの性能を向上させることができるかどうかを問う。我々は単にラベルのないデータに対して擬似ラベルを予測し、人間の注釈付きデータと擬似ラベル付きデータの両方でその後のモデルを訓練する。我々のNaive-Studentモデルは、このような単純で効果的な反復的半教師付き学習で訓練され、3つのCityscapesベンチマークで最先端の結果を得る。
論文参考訳（メタデータ） (2020-05-20T18:00:05Z)
Improving Semantic Segmentation via Self-Training [75.07114899941095]
半教師付きアプローチ,特に自己学習パラダイムを用いて,最先端の成果を得ることができることを示す。まず、ラベル付きデータに基づいて教師モデルを訓練し、次にラベルなしデータの大規模なセット上で擬似ラベルを生成する。私たちの堅牢なトレーニングフレームワークは、人名と擬似ラベルを共同で消化し、Cityscapes、CamVid、KITTIデータセット上で最高のパフォーマンスを達成することができます。
論文参考訳（メタデータ） (2020-04-30T17:09:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。