論文の概要: A survey of image labelling for computer vision applications
- arxiv url: http://arxiv.org/abs/2104.08885v1
- Date: Sun, 18 Apr 2021 16:01:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-21 10:04:05.857384
- Title: A survey of image labelling for computer vision applications
- Title(参考訳): コンピュータビジョン応用のための画像ラベリングに関する調査
- Authors: Christoph Sager, Christian Janiesch, Patrick Zschech
- Abstract要約: 近年,画像コンテンツ認識のためのディープラーニングアルゴリズムが普及し,アドホックなラベリングツールが出現している。
画像ラベリングソフトウェアの基本的な概念と特徴をコンパイルするために,構造化文献レビューを行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Supervised machine learning methods for image analysis require large amounts
of labelled training data to solve computer vision problems. The recent rise of
deep learning algorithms for recognising image content has led to the emergence
of many ad-hoc labelling tools. With this survey, we capture and systematise
the commonalities as well as the distinctions between existing image labelling
software. We perform a structured literature review to compile the underlying
concepts and features of image labelling software such as annotation
expressiveness and degree of automation. We structure the manual labelling task
by its organisation of work, user interface design options, and user support
techniques to derive a systematisation schema for this survey. Applying it to
available software and the body of literature, enabled us to uncover several
application archetypes and key domains such as image retrieval or instance
identification in healthcare or television.
- Abstract(参考訳): 画像解析のための機械学習手法は、コンピュータビジョン問題を解決するために大量のラベル付きトレーニングデータを必要とする。
近年,画像コンテンツ認識のためのディープラーニングアルゴリズムが普及し,多くのアドホックラベリングツールが出現している。
本調査では,既存の画像ラベルソフトウェアとの区別とともに,共通点の抽出と体系化を行う。
我々は、アノテーション表現性や自動化度などの画像ラベルソフトウェアの基本概念と特徴をコンパイルするために構造化された文献レビューを行う。
本調査のシステム化スキーマを導出するために,作業の組織,ユーザインターフェース設計オプション,ユーザサポート技術によって手作業のラベル付けタスクを構造化する。
利用可能なソフトウェアや文献に応用することで、医療やテレビにおける画像検索やインスタンス識別といったいくつかのアプリケーションアーチタイプや重要なドメインを明らかにすることができます。
関連論文リスト
- Pixels to Prose: Understanding the art of Image Captioning [1.9635669040319872]
画像キャプションにより、機械は視覚的コンテンツを解釈し、記述的なテキストを生成することができる。
レビューでは、画像キャプションモデルの進化を最新の最先端ソリューションに遡る。
医療領域における画像キャプションの適用についても検討した。
論文 参考訳(メタデータ) (2024-08-28T11:21:23Z) - Revolutionizing Text-to-Image Retrieval as Autoregressive Token-to-Voken Generation [90.71613903956451]
テキスト・ツー・イメージ検索はマルチメディア処理における基本的な課題である。
本稿では,AVGという自己回帰ボウケン生成手法を提案する。
AVGは有効性と有効性の両方において優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2024-07-24T13:39:51Z) - An Image-based Typology for Visualization [23.716718517642878]
本稿では,画像からの視覚表現の質的解析結果について述べる。
定義群を10種類に分類した。
我々は、6,833枚のタグ付き画像のデータセットと、ラベル付き画像の大規模な集合を探索および分析するために使用できるオンラインツールを提供する。
論文 参考訳(メタデータ) (2024-03-07T04:33:42Z) - Semi-Supervised Semantic Segmentation Based on Pseudo-Labels: A Survey [49.47197748663787]
本総説は, 半教師付きセマンティックセグメンテーション分野における擬似ラベル手法に関する最新の研究成果について, 包括的かつ組織的に概観することを目的としている。
さらに,医用およびリモートセンシング画像のセグメンテーションにおける擬似ラベル技術の適用について検討する。
論文 参考訳(メタデータ) (2024-03-04T10:18:38Z) - InstructCV: Instruction-Tuned Text-to-Image Diffusion Models as Vision Generalists [66.85125112199898]
我々は,タスク固有の設計選択を抽象化する,コンピュータビジョンタスクのための統一言語インタフェースを開発する。
InstructCVと呼ばれる我々のモデルは、他のジェネラリストやタスク固有の視覚モデルと比較して競合的に機能する。
論文 参考訳(メタデータ) (2023-09-30T14:26:43Z) - Enhancing Textbooks with Visuals from the Web for Improved Learning [50.01434477801967]
本稿では,Webからの画像を用いた教科書を自動的に強化する視覚言語モデルの有効性について検討する。
数学、科学、社会科学、ビジネス分野における電子教科書のデータセットを収集します。
次に,テキスト画像マッチングタスクを設定し,テキスト画像の検索とテキストへの適切な割り当てを行う。
論文 参考訳(メタデータ) (2023-04-18T12:16:39Z) - Automatic Image Content Extraction: Operationalizing Machine Learning in
Humanistic Photographic Studies of Large Visual Archives [81.88384269259706]
本稿では,機械学習による大規模画像アーカイブの検索と解析のための自動画像コンテンツ抽出フレームワークを提案する。
提案する枠組みは、人文科学と社会科学のいくつかの分野に適用できる。
論文 参考訳(メタデータ) (2022-04-05T12:19:24Z) - Label Assistant: A Workflow for Assisted Data Annotation in Image
Segmentation Tasks [0.8135412538980286]
本稿では,アノテーションプロセスを支援する汎用ワークフローを提案し,抽象レベルでメソッドについて議論する。
これにより、将来性のあるサンプル、画像前処理、ラベル前処理、ラベル検査、アノテーションの後処理などに焦点を当てる可能性について検討する。
さらに,ハイブリッドタッチスクリーン/ラップトップデバイスにネストしたフレキシブルで拡張可能なソフトウェアプロトタイプの開発により,提案手法の実装を提案する。
論文 参考訳(メタデータ) (2021-11-27T19:08:25Z) - Computer Vision for Supporting Image Search [2.18624447693809]
トレーニングに利用可能な膨大なデータのメリットを活用しており、膨大なコンピュータ処理が利用可能であり、マシンラーニングの進化をデータ処理と正確な視覚ベースのシステム提供のための一連のテクニックとして見てきました。
我々はこれを、自動運転車のナビゲーションやセキュリティアプリケーション、例えばCCTVの検索、医療診断のための医療画像解析に利用しています。
ユーザによる画像検索やビデオ検索が普及しないアプリケーションのひとつとして,人間の記憶を調べたり,失敗したりすることで,そのような画像検索や再検索の必要性が指摘され,画像検索に対する別のアプローチの必要性が浮き彫りにされている。
論文 参考訳(メタデータ) (2021-11-16T20:50:32Z) - Image Segmentation Using Deep Learning: A Survey [58.37211170954998]
イメージセグメンテーションは、画像処理とコンピュータビジョンにおいて重要なトピックである。
深層学習モデルを用いた画像セグメンテーション手法の開発を目的とした研究が,これまでに数多く行われている。
論文 参考訳(メタデータ) (2020-01-15T21:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。