論文の概要: Standardized Max Logits: A Simple yet Effective Approach for Identifying
Unexpected Road Obstacles in Urban-Scene Segmentation
- arxiv url: http://arxiv.org/abs/2107.11264v1
- Date: Fri, 23 Jul 2021 14:25:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-26 16:08:51.978939
- Title: Standardized Max Logits: A Simple yet Effective Approach for Identifying
Unexpected Road Obstacles in Urban-Scene Segmentation
- Title(参考訳): 都市・シーンセグメンテーションにおける未予測道路障害物の簡易かつ効果的な同定手法
- Authors: Sanghun Jung, Jungsoo Lee, Daehoon Gwak, Sungha Choi, Jaegul Choo
- Abstract要約: 本稿では,各予測クラスにおける最大ロジットの相対的意味を反映し,各分布を整列させるため,最大ロジットを標準化する,単純かつ効果的なアプローチを提案する。
提案手法は,一般公開されているFishyscapes Lost & Foundのリーダーボード上での最先端のパフォーマンスを高いマージンで達成する。
- 参考スコア(独自算出の注目度): 18.666365568765098
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Identifying unexpected objects on roads in semantic segmentation (e.g.,
identifying dogs on roads) is crucial in safety-critical applications. Existing
approaches use images of unexpected objects from external datasets or require
additional training (e.g., retraining segmentation networks or training an
extra network), which necessitate a non-trivial amount of labor intensity or
lengthy inference time. One possible alternative is to use prediction scores of
a pre-trained network such as the max logits (i.e., maximum values among
classes before the final softmax layer) for detecting such objects. However,
the distribution of max logits of each predicted class is significantly
different from each other, which degrades the performance of identifying
unexpected objects in urban-scene segmentation. To address this issue, we
propose a simple yet effective approach that standardizes the max logits in
order to align the different distributions and reflect the relative meanings of
max logits within each predicted class. Moreover, we consider the local regions
from two different perspectives based on the intuition that neighboring pixels
share similar semantic information. In contrast to previous approaches, our
method does not utilize any external datasets or require additional training,
which makes our method widely applicable to existing pre-trained segmentation
models. Such a straightforward approach achieves a new state-of-the-art
performance on the publicly available Fishyscapes Lost & Found leaderboard with
a large margin.
- Abstract(参考訳): セマンティックセグメンテーション(例えば、道路上の犬を識別する)における道路上の予期せぬ物体の同定は、安全クリティカルな応用において不可欠である。
既存のアプローチでは、外部データセットからの予期せぬオブジェクトの画像を使用するか、追加のトレーニング(セグメンテーションネットワークの再トレーニングや余分なネットワークのトレーニングなど)を必要とする。
考えられる選択肢の1つは、事前訓練されたネットワークの予測スコア(例えば、max logits(最終softmax層前のクラス間の最大値)を使用して、そのようなオブジェクトを検出することである。
しかし,各予測クラスにおける最大ロジットの分布は,都市間セグメンテーションにおける予期せぬ対象の識別性能を低下させるため,大きく異なる。
この問題に対処するために,我々は,各予測クラスにおけるmaxロジットの相対的意味を反映するために,maxロジットを標準化する単純かつ効果的なアプローチを提案する。
さらに,隣接画素が類似した意味情報を共有するという直観に基づいて,二つの異なる視点から局所領域を考える。
従来のアプローチとは対照的に,本手法では外部データセットは使用せず,追加のトレーニングも必要とせず,既存の事前学習されたセグメンテーションモデルに広く適用できる。
このような直接的なアプローチは、広く入手可能なfishyscapes lost & found leaderboardにおける最先端のパフォーマンスを、大きなマージンで達成する。
関連論文リスト
- Multi-Scale Foreground-Background Confidence for Out-of-Distribution Segmentation [0.36832029288386137]
本研究では,前景-背景セグメントモデルの信頼性情報を利用するマルチスケールOODセグメンテーション手法を提案する。
モデル予測の画素毎の信頼スコアは,前景オブジェクトの画素に対して1に近い。
異なるサイズのパッチに対してこれらの信頼値を集約することにより、さまざまなサイズのオブジェクトを単一のイメージで識別することができる。
論文 参考訳(メタデータ) (2024-12-22T12:09:27Z) - Redefining Normal: A Novel Object-Level Approach for Multi-Object Novelty Detection [68.14842693208465]
我々は、データセットにおける最も支配的なオブジェクトを標準と考え、現実世界のシナリオに対してより効果的である視点を提供します。
我々の最初の貢献であるDeFeND(Dense Feature Fine-tuning on Normal Data)は、高密度特徴微調整を蒸留プロセスに統合する。
このアプローチは、単一対象の新規性検出においてうまく機能するが、複数対象のコンテキストにおける既存の手法をかなり上回る。
論文 参考訳(メタデータ) (2024-12-15T10:47:09Z) - Pixel-wise Gradient Uncertainty for Convolutional Neural Networks
applied to Out-of-Distribution Segmentation [0.43512163406552007]
本稿では,推定時に効率よく計算できる画素単位の損失勾配から不確実点を求める手法を提案する。
本実験は,提案手法が誤った画素分類を識別し,無視可能な計算オーバーヘッドで予測品質を推定する能力を示す。
論文 参考訳(メタデータ) (2023-03-13T08:37:59Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - Segmenting Known Objects and Unseen Unknowns without Prior Knowledge [86.46204148650328]
全体論的セグメンテーションは、目に見えない未知のカテゴリのオブジェクトを、それに関する事前の知識なしにインスタンスに識別し、分離することを目的としている。
U3HSでは、未知の領域を極めて不確実な領域として見つけ、対応するインスタンス認識の埋め込みを個々のオブジェクトにクラスタ化する。
MS、Cityscapes、Lost&Foundの公開データに関する実験は、U3HSの有効性を実証している。
論文 参考訳(メタデータ) (2022-09-12T16:59:36Z) - Few-Max: Few-Shot Domain Adaptation for Unsupervised Contrastive
Representation Learning [7.748713051083396]
対照的な自己教師付き学習手法は、ラベルを必要とせず、画像などのデータポイントを非パラメトリック表現空間にマッピングすることを学ぶ。
本稿では,Few-Maxと呼ばれる自己指導型コントラスト学習のためのドメイン適応手法を提案する。
我々は、Few-MaxをImageNet、VisDA、fastMRIなど、様々なソースおよびターゲットデータセットで評価し、Few-Maxは他のアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2022-06-21T06:46:19Z) - Multi-dataset Pretraining: A Unified Model for Semantic Segmentation [97.61605021985062]
我々は、異なるデータセットの断片化アノテーションを最大限に活用するために、マルチデータセット事前訓練と呼ばれる統合フレームワークを提案する。
これは、複数のデータセットに対して提案されたピクセルからプロトタイプへのコントラスト損失を通じてネットワークを事前トレーニングすることで実現される。
異なるデータセットからの画像とクラス間の関係をより良くモデル化するために、クロスデータセットの混合によりピクセルレベルの埋め込みを拡張する。
論文 参考訳(メタデータ) (2021-06-08T06:13:11Z) - SegmentMeIfYouCan: A Benchmark for Anomaly Segmentation [111.61261419566908]
ディープニューラルネットワーク(DNN)は通常、閉集合のセマンティッククラスで訓練される。
未発見のオブジェクトを扱うには不備だ。
このような物体の検出と局在化は、自動運転の認識などの安全クリティカルなアプリケーションに不可欠です。
論文 参考訳(メタデータ) (2021-04-30T07:58:19Z) - Unsupervised Semantic Segmentation by Contrasting Object Mask Proposals [78.12377360145078]
画素埋め込みを学習するために、コントラスト最適化の目的として、予め決められた事前を取り入れた新しい2段階フレームワークを導入する。
これは、プロキシタスクやエンドツーエンドのクラスタリングに依存する既存の作業から大きく逸脱している。
特に、PASCALでラベル付き例の1%だけを用いて学習した表現を微調整すると、7.1% mIoUで教師付き ImageNet の事前トレーニングを上回ります。
論文 参考訳(メタデータ) (2021-02-11T18:54:47Z) - Hyperspherical embedding for novel class classification [1.5952956981784217]
本稿では,正規化ソフトマックス損失下での潜在空間の表現に制約に基づくアプローチを提案する。
本研究では,メトリクス学習と正規化ソフトマックス損失の両方を用いて,異なるデータセット上の未知のクラスを分類するための提案手法を実験的に検証した。
この結果から,提案した戦略は,ペアワイズ学習を必要とせず,メトリック学習戦略よりも優れた分類結果を提供するため,より大規模なクラスで効率的に学習可能であることが示唆された。
論文 参考訳(メタデータ) (2021-02-05T15:42:13Z) - Find it if You Can: End-to-End Adversarial Erasing for Weakly-Supervised
Semantic Segmentation [6.326017213490535]
本稿では,注目マップの逆消去の新たな定式化を提案する。
提案手法はサリエンシマスクを必要とせず, 注意マップの識別対象領域への拡散を防止するために, 正規化損失を用いる。
パスカルVOCデータセットを用いた実験により, 従来と比べ2.1mIoU, 1.0mIoUのセグメンテーション性能が向上することが示された。
論文 参考訳(メタデータ) (2020-11-09T18:35:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。