論文の概要: Loss Functions in the Era of Semantic Segmentation: A Survey and Outlook
- arxiv url: http://arxiv.org/abs/2312.05391v1
- Date: Fri, 8 Dec 2023 22:06:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 21:10:09.829627
- Title: Loss Functions in the Era of Semantic Segmentation: A Survey and Outlook
- Title(参考訳): セマンティックセグメンテーション時代の損失関数:調査と展望
- Authors: Reza Azad, Moein Heidary, Kadir Yilmaz, Michael H\"uttemann, Sanaz
Karimijafarbigloo, Yuli Wu, Anke Schmeink, Dorit Merhof
- Abstract要約: ロス関数は、ディープラーニングベースのセグメンテーションアルゴリズムの開発に不可欠である。
画像分割において、これらの損失関数がどのようにカスタマイズされ、どのように活用されるかについて、新しい分類法とレビューを提供する。
本稿では,現在の課題を特定し,今後の研究機会を明らかにすることで,このレビューを締めくくる。
- 参考スコア(独自算出の注目度): 11.119967679567587
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic image segmentation, the process of classifying each pixel in an
image into a particular class, plays an important role in many visual
understanding systems. As the predominant criterion for evaluating the
performance of statistical models, loss functions are crucial for shaping the
development of deep learning-based segmentation algorithms and improving their
overall performance. To aid researchers in identifying the optimal loss
function for their particular application, this survey provides a comprehensive
and unified review of $25$ loss functions utilized in image segmentation. We
provide a novel taxonomy and thorough review of how these loss functions are
customized and leveraged in image segmentation, with a systematic
categorization emphasizing their significant features and applications.
Furthermore, to evaluate the efficacy of these methods in real-world scenarios,
we propose unbiased evaluations of some distinct and renowned loss functions on
established medical and natural image datasets. We conclude this review by
identifying current challenges and unveiling future research opportunities.
Finally, we have compiled the reviewed studies that have open-source
implementations on our GitHub page.
- Abstract(参考訳): セマンティック画像分割(Semantic image segmentation)は、画像の各ピクセルを特定のクラスに分類するプロセスであり、多くの視覚的理解システムにおいて重要な役割を果たす。
統計モデルの性能を評価するための主要な基準として、損失関数は深層学習に基づくセグメンテーションアルゴリズムの構築と全体的な性能向上に不可欠である。
研究者が特定の用途に最適な損失関数を特定するのを助けるため、この調査は画像分割に使用される25ドルの損失関数の包括的かつ統一的なレビューを提供する。
我々は,これらの損失関数が画像分割においてどのようにカスタマイズ・活用されるか,その重要な特徴と応用を強調する体系的分類法について,新しい分類法と徹底的なレビューを行った。
さらに,本手法の有効性を現実のシナリオで評価するために,確立された医用・自然画像データセット上での明らかで有名な損失関数の偏りのない評価を提案する。
本稿では,現在の課題を特定し,今後の研究機会を明らかにすることで,このレビューを締めくくる。
最後に、GitHubページにオープンソース実装のレビューされた研究をまとめました。
関連論文リスト
- Visual Context-Aware Person Fall Detection [52.49277799455569]
画像中の個人とオブジェクトを半自動分離するセグメンテーションパイプラインを提案する。
ベッド、椅子、車椅子などの背景オブジェクトは、転倒検知システムに挑戦し、誤ったポジティブアラームを引き起こす。
トレーニング中のオブジェクト固有のコンテキスト変換が、この課題を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2024-04-11T19:06:36Z) - Advancements in Content-Based Image Retrieval: A Comprehensive Survey of
Relevance Feedback Techniques [0.0]
コンテントベース画像検索(CBIR)システムはコンピュータビジョンの分野で重要なツールとして登場してきた。
本稿では,対象検出におけるCBIRの役割と,コンテンツ特徴に基づく視覚的に類似した画像の識別と検索の可能性について,包括的に概説する。
低レベルの特徴と高レベルのセマンティック概念の相違から生じるセマンティックギャップについて詳述し、このギャップを橋渡しするためのアプローチを探る。
論文 参考訳(メタデータ) (2023-12-13T11:07:32Z) - A survey and taxonomy of loss functions in machine learning [60.41650195728953]
ほとんどの最先端の機械学習技術は、損失関数の最適化を中心に進化している。
この調査は、初心者と高度な機械学習実践者の両方にとって最も重要な損失関数の参照を提供することを目的としている。
論文 参考訳(メタデータ) (2023-01-13T14:38:24Z) - Unsupervised Part Discovery from Contrastive Reconstruction [90.88501867321573]
自己監督型視覚表現学習の目標は、強く伝達可能な画像表現を学習することである。
対象部分の発見とセグメンテーションに対する教師なしアプローチを提案する。
本手法は, 細粒度, 視覚的に異なるカテゴリ間でセマンティックな部分を生成する。
論文 参考訳(メタデータ) (2021-11-11T17:59:42Z) - How can we learn (more) from challenges? A statistical approach to
driving future algorithm development [1.0690055408831725]
本稿では,課題から学習し,腹腔鏡ビデオにおけるインスタンスセグメンテーションの具体的タスクをインスタンス化する統計フレームワークを提案する。
2,728枚の画像から51,542個のメタデータを抽出し,ロバスト・メディカル・インスツルメンツ・チャレンジ(ROBUST-MIS)の結果に適用した。
提案手法の開発は,従来の手法が失敗する傾向にあった画像の処理において,最先端の総合的性能と具体的な強みを有する深層学習モデルを得た。
論文 参考訳(メタデータ) (2021-06-17T08:12:37Z) - Common Limitations of Image Processing Metrics: A Picture Story [58.83274952067888]
本論文は, 画像レベルの分類, セマンティックセグメンテーション, インスタンスセグメンテーション, オブジェクト検出タスクと表現できるバイオメディカル画像解析問題に焦点を当てる。
現在のバージョンは、世界中の60以上の機関からの画像分析の専門家からなる国際コンソーシアムが実施するメトリクスに関するDelphiプロセスに基づいている。
論文 参考訳(メタデータ) (2021-04-12T17:03:42Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Understanding Failures of Deep Networks via Robust Feature Extraction [44.204907883776045]
本研究では,視覚的特徴を識別し,不在や不在がパフォーマンスの低下を招き,失敗を特徴づけ,説明することを目的とした手法を紹介し,検討する。
我々は、分離されたロバストモデルの表現を活用して、解釈可能な特徴を抽出し、これらの特徴を利用して障害モードを特定します。
論文 参考訳(メタデータ) (2020-12-03T08:33:29Z) - A Weakly-Supervised Semantic Segmentation Approach based on the Centroid
Loss: Application to Quality Control and Inspection [6.101839518775968]
本稿では,新しい損失関数を用いた弱教師付きセマンティックセマンティックセマンティクス手法の提案と評価を行う。
アプローチのパフォーマンスは,2つの業界関連ケーススタディのデータセットに対して評価される。
論文 参考訳(メタデータ) (2020-10-26T09:08:21Z) - Online Graph Completion: Multivariate Signal Recovery in Computer Vision [29.89364298411089]
グラフ上で定義された「完了」問題について検討し、追加測定の要求を順次行う必要がある。
グラフのフーリエ領域における最適化モデルを設計し、適応的な部分モジュラー性に基づくアイデアが実際にうまく機能するアルゴリズムをどう提供するかを記述する。
Imgurから収集した大量の画像では、分類が難しい画像について有望な結果が得られます。
論文 参考訳(メタデータ) (2020-08-12T01:34:21Z) - Saliency-driven Class Impressions for Feature Visualization of Deep
Neural Networks [55.11806035788036]
分類に欠かせないと思われる特徴を視覚化することは有利である。
既存の可視化手法は,背景特徴と前景特徴の両方からなる高信頼画像を生成する。
本研究では,あるタスクにおいて最も重要であると考えられる識別的特徴を可視化するための,サリエンシ駆動型アプローチを提案する。
論文 参考訳(メタデータ) (2020-07-31T06:11:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。