論文の概要: Improving Generalization of Deep Networks for Estimating Physical
Properties of Containers and Fillings
- arxiv url: http://arxiv.org/abs/2203.01192v1
- Date: Wed, 2 Mar 2022 15:47:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-03 15:38:19.039364
- Title: Improving Generalization of Deep Networks for Estimating Physical
Properties of Containers and Fillings
- Title(参考訳): 容器および充填物の物性推定のためのディープネットワークの一般化
- Authors: Hengyi Wang, Chaoran Zhu, Ziyin Ma and Changjae Oh
- Abstract要約: 我々は、パイプラインのバックボーンモデルとして、協調的な注意を伴う軽量で訓練済みの畳み込みニューラルネットワークを使用している。
補充型分類とオーディオデータに対処し、その情報とビデオのモダリティを組み合わせ、補充レベル分類に対処する。
コンテナ容量,寸法,質量推定について,データ拡張と整合性の測定を行う。
- 参考スコア(独自算出の注目度): 9.804998964598115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present methods to estimate the physical properties of household
containers and their fillings manipulated by humans. We use a lightweight,
pre-trained convolutional neural network with coordinate attention as a
backbone model of the pipelines to accurately locate the object of interest and
estimate the physical properties in the CORSMAL Containers Manipulation (CCM)
dataset. We address the filling type classification with audio data and then
combine this information from audio with video modalities to address the
filling level classification. For the container capacity, dimension, and mass
estimation, we present a data augmentation and consistency measurement to
alleviate the over-fitting issue in the CCM dataset caused by the limited
number of containers. We augment the training data using an
object-of-interest-based re-scaling that increases the variety of physical
values of the containers. We then perform the consistency measurement to choose
a model with low prediction variance in the same containers under different
scenes, which ensures the generalization ability of the model. Our method
improves the generalization ability of the models to estimate the property of
the containers that were not previously seen in the training.
- Abstract(参考訳): 本研究では, 家庭用容器の物理的特性と, 人間が操作した充填物を推定する方法を提案する。
パイプラインのバックボーンモデルとして,事前学習された軽量畳み込みニューラルネットワークを用いて,関心対象を正確に同定し,ccm(corsmal containers manipulation)データセットの物理的特性を推定する。
補充型分類とオーディオデータに対処し,その情報とビデオモダリティを組み合わせることで,補充レベル分類に対処する。
コンテナ容量,寸法,質量推定については,コンテナ数の制限によるCCMデータセットの過度適合問題を軽減するために,データ拡張と整合性の測定を行う。
我々は,コンテナの物理値の多様性を増大させるオブジェクト・オブ・関心に基づく再スケーリングを用いて,トレーニングデータを拡張する。
次に,各場面における同一容器内の予測ばらつきの低いモデルを選択するための整合性測定を行い,モデルの一般化能力を確保する。
本手法は,従来トレーニングでは見られなかった容器の特性を推定するために,モデルの一般化能力を向上する。
関連論文リスト
- Measuring Feature Dependency of Neural Networks by Collapsing Feature Dimensions in the Data Manifold [18.64569268049846]
ニューラルネットワークモデルの特徴依存性を測定するための新しい手法を提案する。
その動機は、人間が理解可能な機能から情報を使っているかどうかを問うことによって、モデルをよりよく理解することにある。
本手法は,合成画像データに基づいて学習した深層ニューラルネットワークモデルを用いて実験を行った。
論文 参考訳(メタデータ) (2024-04-18T17:10:18Z) - A Comprehensive Study of Image Classification Model Sensitivity to
Foregrounds, Backgrounds, and Visual Attributes [58.633364000258645]
このデータセットをRIVAL10と呼びます。
本研究では,前景,背景,属性の騒音劣化に対する幅広いモデルの感度を評価する。
本稿では,多種多様な最先端アーキテクチャ (ResNets, Transformers) とトレーニング手順 (CLIP, SimCLR, DeiT, Adversarial Training) について考察する。
論文 参考訳(メタデータ) (2022-01-26T06:31:28Z) - Multi-modal estimation of the properties of containers and their
content: survey and evaluation [33.774625622770984]
コンテナの容量を推定する手法と,その内容のタイプ,質量,量について述べる。
これらの手法は、メル周波数ケプストラム係数、ゼロクロスレート、分光図、および視覚データを用いた幾何学的アプローチなどの学習および手作りの特徴を用いる。
新たに配布されたデータセットでは、音声のみが強いモダリティであり、コンテンツタイプとレベル分類において、重み付き平均F1スコアが最大81%、97%に達することが示されている。
論文 参考訳(メタデータ) (2021-07-27T10:36:19Z) - Featurized Density Ratio Estimation [82.40706152910292]
本研究では,2つの分布を推定前の共通特徴空間にマッピングするために,可逆生成モデルを活用することを提案する。
この偉業化は、学習された入力空間の密度比が任意に不正確な場合、潜在空間において密度が密接な関係をもたらす。
同時に、特徴写像の可逆性は、特徴空間で計算された比が入力空間で計算された比と同値であることを保証する。
論文 参考訳(メタデータ) (2021-07-05T18:30:26Z) - Learning Optical Flow from a Few Matches [67.83633948984954]
密な相関体積表現は冗長であり、その中の要素のほんの一部で正確なフロー推定が達成できることを示した。
実験により,高い精度を維持しつつ計算コストとメモリ使用量を大幅に削減できることを示した。
論文 参考訳(メタデータ) (2021-04-05T21:44:00Z) - Improving filling level classification with adversarial training [90.01594595780928]
単一画像からカップや飲料グラスのコンテントのレベルを分類する問題について検討する。
汎用ソースデータセットで逆トレーニングを使用し、タスク固有のデータセットでトレーニングを洗練します。
ソース領域における逆学習による伝達学習は,テストセットの分類精度を常に向上させることを示す。
論文 参考訳(メタデータ) (2021-02-08T08:32:56Z) - Estimating informativeness of samples with Smooth Unique Information [108.25192785062367]
サンプルが最終的な重みを知らせる量と、重みによって計算される関数を知らせる量を測定します。
線形化ネットワークを用いてこれらの量の効率的な近似を行う。
本稿では,データセットの要約など,いくつかの問題に適用する。
論文 参考訳(メタデータ) (2021-01-17T10:29:29Z) - TraDE: Transformers for Density Estimation [101.20137732920718]
TraDEは自己回帰密度推定のための自己アテンションに基づくアーキテクチャである。
本稿では, 生成したサンプルを用いた回帰, 分布外検出, トレーニングデータにおける雑音に対する頑健性などのタスクについて述べる。
論文 参考訳(メタデータ) (2020-04-06T07:32:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。