Fugu-MT 論文翻訳(概要): Standardized Max Logits: A Simple yet Effective Approach for Identifying Unexpected Road Obstacles in Urban-Scene Segmentation

論文の概要: Standardized Max Logits: A Simple yet Effective Approach for Identifying Unexpected Road Obstacles in Urban-Scene Segmentation

arxiv url: http://arxiv.org/abs/2107.11264v1
Date: Fri, 23 Jul 2021 14:25:02 GMT
ステータス: 翻訳完了
システム内更新日: 2021-07-26 16:08:51.978939
Title: Standardized Max Logits: A Simple yet Effective Approach for Identifying Unexpected Road Obstacles in Urban-Scene Segmentation
Title（参考訳）: 都市・シーンセグメンテーションにおける未予測道路障害物の簡易かつ効果的な同定手法
Authors: Sanghun Jung, Jungsoo Lee, Daehoon Gwak, Sungha Choi, Jaegul Choo
Abstract要約: 本稿では,各予測クラスにおける最大ロジットの相対的意味を反映し,各分布を整列させるため,最大ロジットを標準化する,単純かつ効果的なアプローチを提案する。提案手法は,一般公開されているFishyscapes Lost & Foundのリーダーボード上での最先端のパフォーマンスを高いマージンで達成する。
参考スコア（独自算出の注目度）: 18.666365568765098
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Identifying unexpected objects on roads in semantic segmentation (e.g., identifying dogs on roads) is crucial in safety-critical applications. Existing approaches use images of unexpected objects from external datasets or require additional training (e.g., retraining segmentation networks or training an extra network), which necessitate a non-trivial amount of labor intensity or lengthy inference time. One possible alternative is to use prediction scores of a pre-trained network such as the max logits (i.e., maximum values among classes before the final softmax layer) for detecting such objects. However, the distribution of max logits of each predicted class is significantly different from each other, which degrades the performance of identifying unexpected objects in urban-scene segmentation. To address this issue, we propose a simple yet effective approach that standardizes the max logits in order to align the different distributions and reflect the relative meanings of max logits within each predicted class. Moreover, we consider the local regions from two different perspectives based on the intuition that neighboring pixels share similar semantic information. In contrast to previous approaches, our method does not utilize any external datasets or require additional training, which makes our method widely applicable to existing pre-trained segmentation models. Such a straightforward approach achieves a new state-of-the-art performance on the publicly available Fishyscapes Lost & Found leaderboard with a large margin.
Abstract（参考訳）: セマンティックセグメンテーション(例えば、道路上の犬を識別する)における道路上の予期せぬ物体の同定は、安全クリティカルな応用において不可欠である。既存のアプローチでは、外部データセットからの予期せぬオブジェクトの画像を使用するか、追加のトレーニング(セグメンテーションネットワークの再トレーニングや余分なネットワークのトレーニングなど)を必要とする。考えられる選択肢の1つは、事前訓練されたネットワークの予測スコア(例えば、max logits(最終softmax層前のクラス間の最大値)を使用して、そのようなオブジェクトを検出することである。しかし,各予測クラスにおける最大ロジットの分布は,都市間セグメンテーションにおける予期せぬ対象の識別性能を低下させるため,大きく異なる。この問題に対処するために,我々は,各予測クラスにおけるmaxロジットの相対的意味を反映するために,maxロジットを標準化する単純かつ効果的なアプローチを提案する。さらに,隣接画素が類似した意味情報を共有するという直観に基づいて,二つの異なる視点から局所領域を考える。従来のアプローチとは対照的に,本手法では外部データセットは使用せず,追加のトレーニングも必要とせず,既存の事前学習されたセグメンテーションモデルに広く適用できる。このような直接的なアプローチは、広く入手可能なfishyscapes lost & found leaderboardにおける最先端のパフォーマンスを、大きなマージンで達成する。

関連論文リスト

P2Object: Single Point Supervised Object Detection and Instance Segmentation [58.778288785355]
バランスの取れたtextbftextitinstance レベルの提案バッグを構成する Point-to-Box Network (P2BNet) を導入する。 P2MNetはより正確なバウンディングボックスを生成し、セグメンテーションタスクに一般化することができる。提案手法は,COCO,VOC,Cityscapesの平均精度において,従来の手法をはるかに上回っている。
論文参考訳（メタデータ） (2025-04-10T14:51:08Z)
Multi-Scale Foreground-Background Confidence for Out-of-Distribution Segmentation [0.36832029288386137]
本研究では,前景-背景セグメントモデルの信頼性情報を利用するマルチスケールOODセグメンテーション手法を提案する。モデル予測の画素毎の信頼スコアは,前景オブジェクトの画素に対して1に近い。異なるサイズのパッチに対してこれらの信頼値を集約することにより、さまざまなサイズのオブジェクトを単一のイメージで識別することができる。
論文参考訳（メタデータ） (2024-12-22T12:09:27Z)
Pixel-wise Gradient Uncertainty for Convolutional Neural Networks applied to Out-of-Distribution Segmentation [0.43512163406552007]
本稿では,推定時に効率よく計算できる画素単位の損失勾配から不確実点を求める手法を提案する。本実験は,提案手法が誤った画素分類を識別し,無視可能な計算オーバーヘッドで予測品質を推定する能力を示す。
論文参考訳（メタデータ） (2023-03-13T08:37:59Z)
ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文参考訳（メタデータ） (2022-12-12T13:10:19Z)
Segmenting Known Objects and Unseen Unknowns without Prior Knowledge [86.46204148650328]
全体論的セグメンテーションは、目に見えない未知のカテゴリのオブジェクトを、それに関する事前の知識なしにインスタンスに識別し、分離することを目的としている。 U3HSでは、未知の領域を極めて不確実な領域として見つけ、対応するインスタンス認識の埋め込みを個々のオブジェクトにクラスタ化する。 MS、Cityscapes、Lost&Foundの公開データに関する実験は、U3HSの有効性を実証している。
論文参考訳（メタデータ） (2022-09-12T16:59:36Z)
Few-Max: Few-Shot Domain Adaptation for Unsupervised Contrastive Representation Learning [7.748713051083396]
対照的な自己教師付き学習手法は、ラベルを必要とせず、画像などのデータポイントを非パラメトリック表現空間にマッピングすることを学ぶ。本稿では,Few-Maxと呼ばれる自己指導型コントラスト学習のためのドメイン適応手法を提案する。我々は、Few-MaxをImageNet、VisDA、fastMRIなど、様々なソースおよびターゲットデータセットで評価し、Few-Maxは他のアプローチよりも一貫して優れています。
論文参考訳（メタデータ） (2022-06-21T06:46:19Z)
Multi-dataset Pretraining: A Unified Model for Semantic Segmentation [97.61605021985062]
我々は、異なるデータセットの断片化アノテーションを最大限に活用するために、マルチデータセット事前訓練と呼ばれる統合フレームワークを提案する。これは、複数のデータセットに対して提案されたピクセルからプロトタイプへのコントラスト損失を通じてネットワークを事前トレーニングすることで実現される。異なるデータセットからの画像とクラス間の関係をより良くモデル化するために、クロスデータセットの混合によりピクセルレベルの埋め込みを拡張する。
論文参考訳（メタデータ） (2021-06-08T06:13:11Z)
SegmentMeIfYouCan: A Benchmark for Anomaly Segmentation [111.61261419566908]
ディープニューラルネットワーク(DNN)は通常、閉集合のセマンティッククラスで訓練される。未発見のオブジェクトを扱うには不備だ。このような物体の検出と局在化は、自動運転の認識などの安全クリティカルなアプリケーションに不可欠です。
論文参考訳（メタデータ） (2021-04-30T07:58:19Z)
Unsupervised Semantic Segmentation by Contrasting Object Mask Proposals [78.12377360145078]
画素埋め込みを学習するために、コントラスト最適化の目的として、予め決められた事前を取り入れた新しい2段階フレームワークを導入する。これは、プロキシタスクやエンドツーエンドのクラスタリングに依存する既存の作業から大きく逸脱している。特に、PASCALでラベル付き例の1%だけを用いて学習した表現を微調整すると、7.1% mIoUで教師付き ImageNet の事前トレーニングを上回ります。
論文参考訳（メタデータ） (2021-02-11T18:54:47Z)
TraND: Transferable Neighborhood Discovery for Unsupervised Cross-domain Gait Recognition [77.77786072373942]
本稿では、教師なしクロスドメイン歩行認識のための領域ギャップを橋渡しするTransferable Neighborhood Discovery (TraND) フレームワークを提案する。我々は、潜在空間におけるラベルなしサンプルの自信ある近傍を自動的に発見するために、エンドツーエンドのトレーニング可能なアプローチを設計する。提案手法は,CASIA-BとOU-LPの2つの公開データセットに対して,最先端の結果を得る。
論文参考訳（メタデータ） (2021-02-09T03:07:07Z)
Hyperspherical embedding for novel class classification [1.5952956981784217]
本稿では,正規化ソフトマックス損失下での潜在空間の表現に制約に基づくアプローチを提案する。本研究では,メトリクス学習と正規化ソフトマックス損失の両方を用いて,異なるデータセット上の未知のクラスを分類するための提案手法を実験的に検証した。この結果から,提案した戦略は,ペアワイズ学習を必要とせず,メトリック学習戦略よりも優れた分類結果を提供するため,より大規模なクラスで効率的に学習可能であることが示唆された。
論文参考訳（メタデータ） (2021-02-05T15:42:13Z)
Find it if You Can: End-to-End Adversarial Erasing for Weakly-Supervised Semantic Segmentation [6.326017213490535]
本稿では,注目マップの逆消去の新たな定式化を提案する。提案手法はサリエンシマスクを必要とせず, 注意マップの識別対象領域への拡散を防止するために, 正規化損失を用いる。パスカルVOCデータセットを用いた実験により, 従来と比べ2.1mIoU, 1.0mIoUのセグメンテーション性能が向上することが示された。
論文参考訳（メタデータ） (2020-11-09T18:35:35Z)
Reinforced active learning for image segmentation [34.096237671643145]
深部強化学習(RL)に基づく意味的セグメンテーションのための新しいアクティブラーニング戦略を提案する。エージェントは、ラベルなしデータのプールからラベル付けされる小さな情報領域(画像全体とは対照的に)のサブセットを選択するポリシーを学ぶ。本手法では, 意味的セグメンテーション問題の大規模性質に適応して, 能動的学習のための深部Q-network (DQN) の定式化を新たに提案する。
論文参考訳（メタデータ） (2020-02-16T14:03:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。