論文の概要: CenterDisks: Real-time instance segmentation with disk covering
- arxiv url: http://arxiv.org/abs/2403.03296v1
- Date: Tue, 5 Mar 2024 19:51:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 16:53:49.179778
- Title: CenterDisks: Real-time instance segmentation with disk covering
- Title(参考訳): CenterDisks:ディスクカバー付きリアルタイムインスタンスセグメンテーション
- Authors: Katia Jodogne-Del Litto, Guillaume-Alexandre Bilodeau
- Abstract要約: 我々は、マスク近似を予測するために、セットカバー問題からインスピレーションを得る。
提案手法は,IDDおよびKITTIデータセット上で,推定時間0.040秒で最先端の成果を得る。
- 参考スコア(独自算出の注目度): 7.394029879643518
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Increasing the accuracy of instance segmentation methods is often done at the
expense of speed. Using coarser representations, we can reduce the number of
parameters and thus obtain real-time masks. In this paper, we take inspiration
from the set cover problem to predict mask approximations. Given ground-truth
binary masks of objects of interest as training input, our method learns to
predict the approximate coverage of these objects by disks without supervision
on their location or radius. Each object is represented by a fixed number of
disks with different radii. In the learning phase, we consider the radius as
proportional to a standard deviation in order to compute the error to propagate
on a set of two-dimensional Gaussian functions rather than disks. We trained
and tested our instance segmentation method on challenging datasets showing
dense urban settings with various road users. Our method achieve state-of-the
art results on the IDD and KITTI dataset with an inference time of 0.040 s on a
single RTX 3090 GPU.
- Abstract(参考訳): インスタンス分割法の精度を高めることは、しばしば速度を犠牲にして行われる。
粗い表現を用いることで、パラメータの数を削減し、リアルタイムマスクを得ることができる。
本稿では,マスク近似の予測のために,集合被覆問題から着想を得た。
訓練入力として興味のある対象の地対角二分マスクを与えられた場合,本手法は,その位置や半径を監視せずに,ディスクによる対象物の近似被覆率を予測することを学ぶ。
各オブジェクトは、異なるradiiを持つ固定数のディスクで表現される。
学習段階では、半径は円盤ではなく二次元ガウス関数の集合上で伝播する誤差を計算するために標準偏差に比例すると考えられる。
様々な道路利用者と密集した都市環境を示す挑戦的データセットを用いて,インスタンスセグメンテーション手法の訓練と試験を行った。
本手法は,RTX 3090 GPU 上での 0.040 秒の推論時間で IDD および KITTI データセットの最先端化を実現する。
関連論文リスト
- ProtoSeg: A Prototype-Based Point Cloud Instance Segmentation Method [6.632158868486343]
本稿では,3次元点雲上でインスタンスセグメンテーションを行うニューラルネットワークアーキテクチャを提案する。
本稿では, 並列に係数とプロトタイプを学習し, 組み合わせて実例予測を行う手法を提案する。
提案手法は,最先端技術よりも28%高速であるだけでなく,標準偏差が低いことを示す。
論文 参考訳(メタデータ) (2024-10-03T10:05:27Z) - Faithful Density-Peaks Clustering via Matrix Computations on MPI Parallelization System [7.594123537718585]
密度ピーククラスタリング(DP)は任意の形状のクラスタを検出し、非ユークリッド空間データをクラスタリングする能力を持つ。
本稿では,2種類のベクトル状距離行列と逆前ノードファイリングポリシを併用した忠実かつ並列なDP法を提案する。
本手法は,コミュニティ検出などの非ユークリッドデータをクラスタリングすると同時に,大規模ユークリッドデータをクラスタリングする場合の精度において,最先端の手法よりも優れる。
論文 参考訳(メタデータ) (2024-06-18T06:05:45Z) - Distributed Collapsed Gibbs Sampler for Dirichlet Process Mixture Models
in Federated Learning [0.22499166814992444]
本稿では,DPMM (DisCGS) のための分散マルコフ連鎖モンテカルロ (MCMC) 推論手法を提案する。
我々のアプローチでは、崩壊したGibbsサンプルラーを使用し、独立マシンと異種マシンの分散データを扱うように設計されています。
例えば、100Kのデータポイントのデータセットでは、中央集権的なアルゴリズムは100回のイテレーションを完了するのに約12時間かかります。
論文 参考訳(メタデータ) (2023-12-18T13:16:18Z) - Sketching Multidimensional Time Series for Fast Discord Mining [37.342885653387604]
多次元時系列間の不協和音マイニングのためのスケッチを提案する。
提案アルゴリズムはスループットを少なくとも1桁(50X)改善し、近似された解の品質に最小限の影響しか与えない。
論文 参考訳(メタデータ) (2023-11-05T04:17:34Z) - DFormer: Diffusion-guided Transformer for Universal Image Segmentation [86.73405604947459]
提案したDFormerは,拡散モデルを用いて画像分割タスクをデノナイズプロセスとみなしている。
我々のDFormerは、ランダムに生成されたマスクの集合から、マスクとそれに対応するカテゴリを直接予測します。
我々のDFormerは、最近の拡散型汎光学分割法Pix2Seq-Dより優れており、MS COCO val 2017セットで3.6%向上している。
論文 参考訳(メタデータ) (2023-06-06T06:33:32Z) - Quadric Representations for LiDAR Odometry, Mapping and Localization [93.24140840537912]
現在のLiDARオードメトリ、マッピング、ローカライズ手法は、3Dシーンのポイントワイズ表現を利用する。
3次元オブジェクトのよりコンパクトな表現である2次元曲面を用いたシーン記述法を提案する。
提案手法は低レイテンシとメモリの有効性を維持しつつ、競争力があり、しかも精度も優れている。
論文 参考訳(メタデータ) (2023-04-27T13:52:01Z) - MaskDiff: Modeling Mask Distribution with Diffusion Probabilistic Model
for Few-Shot Instance Segmentation [31.648523213206595]
少数ショットのインスタンスセグメンテーションは、数ショットの学習パラダイムをインスタンスセグメンテーションタスクに拡張する。
従来のアプローチでは、ポイント推定と呼ばれるプロトタイプ学習を通じてその課題に対処しようと試みてきた。
本稿では,二項マスクの条件分布をモデル化したMaskDiffという新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-09T08:24:02Z) - Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly
Types [60.45942774425782]
我々は異常クラスタリングを導入し、その目標はデータを異常型の一貫性のあるクラスタにまとめることである。
これは異常検出とは違い、その目標は異常を通常のデータから分割することである。
パッチベースの事前訓練されたディープ埋め込みとオフザシェルフクラスタリング手法を用いた,単純で効果的なクラスタリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-21T23:11:33Z) - Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。
しかし、その推測時間は一般的に540p画像の秒数で遅い。
本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文 参考訳(メタデータ) (2020-12-01T23:58:16Z) - SipMask: Spatial Information Preservation for Fast Image and Video
Instance Segmentation [149.242230059447]
SipMaskと呼ばれる高速な単一ステージインスタンス分割法を提案する。
検出されたバウンディングボックスの異なるサブリージョンにインスタンスのマスク予測を分離することで、インスタンス固有の空間情報を保存する。
リアルタイム機能の面では、SipMaskはYOLACTを、同様の設定で3.0%(マスクAP)という絶対的なゲインで上回ります。
論文 参考訳(メタデータ) (2020-07-29T12:21:00Z) - Variable Skipping for Autoregressive Range Density Estimation [84.60428050170687]
深部自己回帰モデルを用いた距離密度推定を高速化する手法である可変スキップについて述べる。
可変スキップは、10-100$timesの効率向上をもたらすことを示す。
論文 参考訳(メタデータ) (2020-07-10T19:01:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。