論文の概要: Cooking Object's State Identification Without Using Pretrained Model
- arxiv url: http://arxiv.org/abs/2103.02305v1
- Date: Wed, 3 Mar 2021 10:33:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-06 22:24:44.451541
- Title: Cooking Object's State Identification Without Using Pretrained Model
- Title(参考訳): 事前学習モデルを用いない調理物体の状態識別
- Authors: Md Sadman Sakib
- Abstract要約: 本稿では,CNNを提案し,それをゼロから訓練した。
モデルは、調理状態認識チャレンジからデータセット上でトレーニングされ、テストされる。
我々のモデルは、目に見えないテストデータセットで65.8%の精度を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, Robotic Cooking has been a very promising field. To execute a
recipe, a robot has to recognize different objects and their states. Contrary
to object recognition, state identification has not been explored that much.
But it is very important because different recipe might require different state
of an object. Moreover, robotic grasping depends on the state. Pretrained model
usually perform very well in this type of tests. Our challenge was to handle
this problem without using any pretrained model. In this paper, we have
proposed a CNN and trained it from scratch. The model is trained and tested on
the dataset from cooking state recognition challenge. We have also evaluated
the performance of our network from various perspective. Our model achieves
65.8% accuracy on the unseen test dataset.
- Abstract(参考訳): 最近、ロボット料理は非常に有望な分野である。
レシピを実行するには、ロボットは異なるオブジェクトとその状態を認識する必要がある。
オブジェクト認識とは対照的に、状態識別はあまり研究されていない。
しかし、異なるレシピがオブジェクトの異なる状態を必要とする可能性があるため、非常に重要です。
さらに、ロボットの把持は状態に依存する。
事前訓練されたモデルは、通常この種のテストで非常によく機能する。
私たちの課題は、事前訓練されたモデルを使わずにこの問題に対処することでした。
本稿では,CNNを提案し,それをゼロから訓練した。
モデルは、調理状態認識チャレンジからデータセット上でトレーニングされ、テストされる。
また,ネットワークの性能を様々な観点から評価した。
我々のモデルは、目に見えないテストデータセットで65.8%の精度を達成する。
関連論文リスト
- Realtime Person Identification via Gait Analysis [1.3260363717086592]
エッジAIデプロイメントとリアルタイム歩行認識に非常に適した4層を有する小型CNNモデルを提案する。
我々のモデルは96.7%の精度で5KBのRAMしか消費せず、起動時間は70msと125mWである。
論文 参考訳(メタデータ) (2024-04-02T18:15:06Z) - Continuous Object State Recognition for Cooking Robots Using Pre-Trained
Vision-Language Models and Black-box Optimization [18.41474014665171]
本稿では,ロボットを調理する際の食品の状態変化を音声言語で認識する手法を提案する。
各テキストの重み付けを調整することで、より正確で堅牢な連続状態認識を実現することができることを示す。
論文 参考訳(メタデータ) (2024-03-13T04:45:40Z) - Rethinking Cooking State Recognition with Vision Transformers [0.0]
料理状態認識タスクにおいて視覚変換器(ViT)アーキテクチャの自己保持機構を提案する。
提案したアプローチは、画像から得られたグローバルな健全な特徴をカプセル化するとともに、より大きなデータセットから得られた重みを利用する。
私たちのフレームワークの精度は94.3%で、最先端のフレームワークよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-12-16T17:06:28Z) - Finding Differences Between Transformers and ConvNets Using
Counterfactual Simulation Testing [82.67716657524251]
本稿では,ニューラルネットワークの自然的変動に対するロバスト性を研究するための反現実的枠組みを提案する。
我々の手法は、最近リリースされた最先端の畳み込みニューラルネットワークとビジョントランスフォーマーの頑健さを公平に比較することができる。
論文 参考訳(メタデータ) (2022-11-29T18:59:23Z) - Could Giant Pretrained Image Models Extract Universal Representations? [94.97056702288317]
本稿では,多種多様なコンピュータビジョンタスクに適用した凍結事前学習モデルについて述べる。
私たちの研究は、この凍結した設定にどのような事前学習タスクが最適か、凍結した設定を様々な下流タスクに柔軟にする方法、より大きなモデルサイズの影響について、質問に答えています。
論文 参考訳(メタデータ) (2022-11-03T17:57:10Z) - Sim-to-Real 6D Object Pose Estimation via Iterative Self-training for
Robotic Bin-picking [98.5984733963713]
コスト効率の良いロボットグルーピングを容易にするために,シミュレート・トゥ・リアルな6次元オブジェクトのポーズ推定のための反復的自己学習フレームワークを提案する。
我々は、豊富な仮想データを合成するためのフォトリアリスティックシミュレータを構築し、これを初期ポーズ推定ネットワークのトレーニングに利用する。
このネットワークは教師モデルの役割を担い、未ラベルの実データに対するポーズ予測を生成する。
論文 参考訳(メタデータ) (2022-04-14T15:54:01Z) - Where is my hand? Deep hand segmentation for visual self-recognition in
humanoid robots [129.46920552019247]
本稿では、画像からロボットの手を切り離すための畳み込みニューラルネットワーク(CNN)を提案する。
ヒューマノイドロボットVizzyの手のセグメンテーションのために,Mask-RCNNネットワークを微調整した。
論文 参考訳(メタデータ) (2021-02-09T10:34:32Z) - Application of Facial Recognition using Convolutional Neural Networks
for Entry Access Control [0.0]
本論文は,画像中の人物を入力として捉え,その人物を著者の1人か否かを分類する,教師付き分類問題の解決に焦点をあてる。
提案手法は,(1)WoodNetと呼ばれるニューラルネットワークをスクラッチから構築し,トレーニングすること,(2)ImageNetデータベース上に事前トレーニングされたネットワークを利用することで,転送学習を活用すること,の2つである。
結果は、データセット内の個人を高い精度で分類し、保持されたテストデータに対して99%以上の精度で達成する2つのモデルである。
論文 参考訳(メタデータ) (2020-11-23T07:55:24Z) - Fast Uncertainty Quantification for Deep Object Pose Estimation [91.09217713805337]
深層学習に基づくオブジェクトポーズ推定は、しばしば信頼できない、自信過剰である。
本研究では,6-DoFオブジェクトのポーズ推定のための,シンプルで効率的かつプラグアンドプレイなUQ手法を提案する。
論文 参考訳(メタデータ) (2020-11-16T06:51:55Z) - A robot that counts like a child: a developmental model of counting and
pointing [69.26619423111092]
実物を数えることができる新しい神経ロボティクスモデルを導入する。
このモデルにより,エンボディメントと数値認識の相互作用を調べることができる。
トレーニングされたモデルは、アイテムのセットをカウントすることができ、同時にそれらを指し示します。
論文 参考訳(メタデータ) (2020-08-05T21:06:27Z) - Action Recognition and State Change Prediction in a Recipe Understanding
Task Using a Lightweight Neural Network Model [8.49031088470346]
本稿では,行動認識と状態変化予測を分離する単純化されたニューラルネットワークモデルを提案する。
これにより、学習は互いに間接的に影響を及ぼすことができる。
論文 参考訳(メタデータ) (2020-01-23T17:04:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。