論文の概要: Towards Scale Balanced 6-DoF Grasp Detection in Cluttered Scenes
- arxiv url: http://arxiv.org/abs/2212.05275v1
- Date: Sat, 10 Dec 2022 11:31:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 17:49:15.947096
- Title: Towards Scale Balanced 6-DoF Grasp Detection in Cluttered Scenes
- Title(参考訳): バラバラシーンにおけるスケールバランス6-DoFグラフ検出に向けて
- Authors: Haoxiang Ma and Di Huang
- Abstract要約: 本稿では,特に小規模サンプル処理の難しさに対処する新しい手法を提案する。
局所幾何学表現を強化するため,マルチスケールシリンダーグルーピング (MsCG) モジュールが提案される。
トレーニングを容易にするため、ノイズクリーンミックス(NcM)データ拡張が導入される。
- 参考スコア(独自算出の注目度): 19.25678039613183
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we focus on the problem of feature learning in the presence of
scale imbalance for 6-DoF grasp detection and propose a novel approach to
especially address the difficulty in dealing with small-scale samples. A
Multi-scale Cylinder Grouping (MsCG) module is presented to enhance local
geometry representation by combining multi-scale cylinder features and global
context. Moreover, a Scale Balanced Learning (SBL) loss and an Object Balanced
Sampling (OBS) strategy are designed, where SBL enlarges the gradients of the
samples whose scales are in low frequency by apriori weights while OBS captures
more points on small-scale objects with the help of an auxiliary segmentation
network. They alleviate the influence of the uneven distribution of grasp
scales in training and inference respectively. In addition, Noisy-clean Mix
(NcM) data augmentation is introduced to facilitate training, aiming to bridge
the domain gap between synthetic and raw scenes in an efficient way by
generating more data which mix them into single ones at instance-level.
Extensive experiments are conducted on the GraspNet-1Billion benchmark and
competitive results are reached with significant gains on small-scale cases.
Besides, the performance of real-world grasping highlights its generalization
ability. Our code is available at
https://github.com/mahaoxiang822/Scale-Balanced-Grasp.
- Abstract(参考訳): 本稿では,6-DoFグリップ検出におけるスケール不均衡の存在下での特徴学習の問題に着目し,特に小型サンプルの扱いの難しさに対処する新しい手法を提案する。
マルチスケールシリンダ・グルーピング (MsCG) モジュールは, マルチスケールシリンダ特徴とグローバルコンテキストを組み合わせることで, 局所的幾何表現を強化する。
さらに、sblは、補助セグメンテーションネットワークの助けを借りて、小規模オブジェクトのより多くのポイントをキャプチャしながら、apriori重みによって、低周波数のスケールを有するサンプルの勾配をsblで拡大する、スケールバランス学習(sbl)損失とオブジェクトバランスサンプリング(obs)戦略を設計する。
学習と推論における把握尺度の不均一分布の影響を緩和する。
さらに,合成シーンと生シーンのドメイン間ギャップを,インスタンスレベルで1つのシーンにミックスするより多くのデータを生成する効率的な方法で橋渡しすることを目的とした,トレーニングを容易にするために,ノイズ-クリーンミックス(ncm)データ拡張が導入されている。
grabnet-1billionベンチマークでは広範な実験が行われ、小規模ケースでは競争結果が大幅に向上した。
さらに,実世界の把握性能は,その一般化能力を強調している。
私たちのコードはhttps://github.com/mahaoxiang822/scale-balanced-graspで利用可能です。
関連論文リスト
- SeMi: When Imbalanced Semi-Supervised Learning Meets Mining Hard Examples [54.760757107700755]
Semi-Supervised Learning (SSL)は、豊富なラベルのないデータを活用して、モデルのパフォーマンスを向上させる。
実世界のシナリオにおけるクラス不均衡なデータ分散は、SSLに大きな課題をもたらし、結果としてパフォーマンスが低下する。
マイニングハードケース(SeMi)による不均衡半教師学習の性能向上手法を提案する。
論文 参考訳(メタデータ) (2025-01-10T14:35:16Z) - Multi-Scale Denoising in the Feature Space for Low-Light Instance Segmentation [2.642212767247493]
低照度画像のインスタンスセグメンテーションはほとんど探索されていない。
提案手法は特徴抽出器に重み付けされた非局所ブロック(wNLB)を実装する。
実世界の騒音特性に対するネットワークの適応性を高めるため,各層に学習可能な重みを導入する。
論文 参考訳(メタデータ) (2024-02-28T13:07:16Z) - Scale Equalization for Multi-Level Feature Fusion [8.541075075344438]
並列ブランチのマルチレベル機能は、異なるスケールにあることが分かりました。
スケール不均衡は普遍的かつ望ましくない欠陥であり、有害な勾配降下を引き起こす。
両線形アップサンプリング後のマルチレベル特徴量間でのスケール平衡を実現するために, スケール等化器の注入を提案する。
論文 参考訳(メタデータ) (2024-02-02T05:25:51Z) - Combating Representation Learning Disparity with Geometric Harmonization [50.29859682439571]
本稿では,表現学習におけるカテゴリレベルの均一性を促進するために,新しい幾何調和法を提案する。
我々の提案はSSLの設定を変更せず、低コストで既存のメソッドに容易に統合できる。
論文 参考訳(メタデータ) (2023-10-26T17:41:11Z) - Deep Boosting Multi-Modal Ensemble Face Recognition with Sample-Level
Weighting [11.39204323420108]
深層畳み込みニューラルネットワークは顔認識において顕著な成功を収めた。
現在のトレーニングベンチマークは、不均衡な品質分布を示している。
これは、訓練中に不足しているため、ハードサンプルの一般化に問題を引き起こす。
有名なAdaBoostにインスパイアされた本研究では、FR損失に異なるサンプルの重要性を組み込むためのサンプルレベルの重み付け手法を提案する。
論文 参考訳(メタデータ) (2023-08-18T01:44:54Z) - L-DAWA: Layer-wise Divergence Aware Weight Aggregation in Federated
Self-Supervised Visual Representation Learning [14.888569402903562]
自己教師付き学習(SSL)とフェデレーション付き学習(FL)をひとつのコヒーレントシステムに統合することは、データプライバシの保証を提供する可能性がある。
本稿では,FLアグリゲーションにおけるクライアントバイアスや分散の影響を軽減するため,レイヤワイド・ディバージェンス・アウェア・ウェイト・アグリゲーション(L-DAWA)と呼ばれる新たなアグリゲーション戦略を提案する。
論文 参考訳(メタデータ) (2023-07-14T15:07:30Z) - Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。
実験結果から,これらの手法が直面する課題を分析した。
本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文 参考訳(メタデータ) (2022-03-23T07:33:37Z) - Attentional-Biased Stochastic Gradient Descent [74.49926199036481]
深層学習におけるデータ不均衡やラベルノイズ問題に対処するための証明可能な手法(ABSGD)を提案する。
本手法は運動量SGDの簡易な修正であり,各試料に個別の重み付けを行う。
ABSGDは追加コストなしで他の堅牢な損失と組み合わせられるほど柔軟である。
論文 参考訳(メタデータ) (2020-12-13T03:41:52Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z) - Crowd Counting via Hierarchical Scale Recalibration Network [61.09833400167511]
本稿では,群集カウントの課題に取り組むために,階層型大規模校正ネットワーク(HSRNet)を提案する。
HSRNetは、リッチなコンテキスト依存をモデル化し、複数のスケール関連情報を再検討する。
提案手法は,様々なノイズを選択的に無視し,適切な群集スケールに自動的に焦点を合わせることができる。
論文 参考訳(メタデータ) (2020-03-07T10:06:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。