論文の概要: TetraPackNet: Four-Corner-Based Object Detection in Logistics Use-Cases
- arxiv url: http://arxiv.org/abs/2104.09123v1
- Date: Mon, 19 Apr 2021 08:22:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-21 00:31:37.709451
- Title: TetraPackNet: Four-Corner-Based Object Detection in Logistics Use-Cases
- Title(参考訳): TetraPackNet:ロジスティックス利用ケースにおける4コラーベースオブジェクト検出
- Authors: Laura D\"orr, Felix Brandt, Alexander Naumann, Martin Pouls
- Abstract要約: tetrapacknetはcornernetにインスパイアされ、類似のベースアルゴリズムとアイデアを使っている。
定形物体の高精度検出が重要であるため、用途に指定されています。
このユースケースのために、我々のモデルを実世界のデータセットで評価する。
- 参考スコア(独自算出の注目度): 60.01198542150638
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: While common image object detection tasks focus on bounding boxes or
segmentation masks as object representations, we propose a novel method, named
TetraPackNet, using fourcorner based object representations. TetraPackNet is
inspired by and based on CornerNet and uses similar base algorithms and ideas.
It is designated for applications were the high-accuracy detection of regularly
shaped objects is crucial, which is the case in the logistics use-case of
packaging structure recognition. We evaluate our model on our specific
real-world dataset for this use-case. Baselined against a previous solution,
consisting of a a Mask R-CNN model and suitable post-processing steps,
TetraPackNet achieves superior results (6% higher in accuracy) in the
application of four-corner based transport unit side detection.
- Abstract(参考訳): 一般的な画像オブジェクト検出タスクは、境界ボックスやセグメンテーションマスクをオブジェクト表現として重視する一方で、四角形オブジェクト表現を用いたtetrapacknetという新しい手法を提案する。
tetrapacknetはcornernetにインスパイアされ、類似のベースアルゴリズムとアイデアを使っている。
パッケージ構造認識のロジスティクスユースケースにおいて,定期的な形状の物体の高精度検出が重要となるため,用途が指定されている。
このユースケースのために、我々のモデルを実世界のデータセットで評価する。
マスクr-cnnモデルと適切な後処理ステップからなる以前のソリューションに対して、tetrapacknetは4角形トランスポートユニットサイド検出の適用において優れた結果(6%高い精度)を達成している。
関連論文リスト
- LAC-Net: Linear-Fusion Attention-Guided Convolutional Network for Accurate Robotic Grasping Under the Occlusion [79.22197702626542]
本稿では, 乱れ場面におけるロボットグルーピングのためのアモーダルセグメンテーションを探求する枠組みを提案する。
線形融合注意誘導畳み込みネットワーク(LAC-Net)を提案する。
その結果,本手法が最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-08-06T14:50:48Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Neural Packing: from Visual Sensing to Reinforcement Learning [24.35678534893451]
本稿では,3DでTAP(Transport-and-packing)問題を解決するための新しい学習フレームワークを提案する。
RGBDセンシングと認識による入力オブジェクトの部分的な観察から、ロボットモーション計画による最終ボックス配置に至るまで、完全なソリューションパイプラインを構成し、ターゲットコンテナ内のコンパクトパッキングに到達する。
論文 参考訳(メタデータ) (2023-10-17T02:42:54Z) - RBGNet: Ray-based Grouping for 3D Object Detection [104.98776095895641]
本稿では,点雲からの正確な3次元物体検出のための投票型3次元検出器RBGNetフレームワークを提案する。
決定された光線群を用いて物体表面上の点方向の特徴を集約する。
ScanNet V2 と SUN RGB-D による最先端の3D 検出性能を実現する。
論文 参考訳(メタデータ) (2022-04-05T14:42:57Z) - TricubeNet: 2D Kernel-Based Object Representation for Weakly-Occluded
Oriented Object Detection [24.44389034373491]
本稿では,アンカーフリーのワンステージディテクタである指向オブジェクト検出の新たなアプローチを提案する。
このアプローチはTricubeNetと呼ばれ、各オブジェクトを2D Tricubeカーネルとして表現し、外見ベースの後処理を用いて境界ボックスを抽出する。
論文 参考訳(メタデータ) (2021-04-23T06:50:28Z) - Location-Sensitive Visual Recognition with Cross-IOU Loss [177.86369890708457]
本稿では,オブジェクト検出,インスタンスセグメンテーション,ポーズ推定のための位置感知ネットワーク (LSNet) という統合ソリューションを提案する。
ディープニューラルネットワークをバックボーンとして、LSNetは、ターゲットオブジェクトの形状を一緒に定義するアンカーポイントとランドマークのセットを予測します。
論文 参考訳(メタデータ) (2021-04-11T02:17:14Z) - Contour Primitive of Interest Extraction Network Based on One-Shot
Learning for Object-Agnostic Vision Measurement [37.552192926136065]
単発学習フレームワークに基づく利子抽出ネットワーク(CPieNet)の輪郭プリミティブを提案する。
新たなCPI抽出タスクのために,オンライン公開画像を用いたObject Contour Primitivesデータセットと,ロボットに搭載されたカメラを用いたRobotic Object Contour Measurementデータセットを構築した。
論文 参考訳(メタデータ) (2020-10-07T11:00:30Z) - Learning Gaussian Maps for Dense Object Detection [1.8275108630751844]
類似したオブジェクトが互いに近接して配置されるシーンにおいて,共通かつ高精度なオブジェクト検出手法を概説する。
ガウス写像のマルチタスク学習と分類と境界ボックス回帰がベースラインの精度を大幅に向上させることを示す。
提案手法は,SKU110K citesku110kデータセットの精度も向上する。
論文 参考訳(メタデータ) (2020-04-24T17:01:25Z) - Unifying Training and Inference for Panoptic Segmentation [111.44758195510838]
本稿では,汎視的セグメンテーションのためのトレーニングと推論のギャップを埋めるエンド・ツー・エンドのネットワークを提案する。
本システムは,ResNet-50のバックボーンで61.4 PQを達成した,人気のストリートシーンデータセットであるCityscapesに新たなレコードを設定する。
当社のネットワークは柔軟にオブジェクトマスクのヒントなしで動作し、両方の設定下で競合的に動作します。
論文 参考訳(メタデータ) (2020-01-14T18:58:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。