論文の概要: Object Detection in Indian Food Platters using Transfer Learning with
YOLOv4
- arxiv url: http://arxiv.org/abs/2205.04841v1
- Date: Tue, 10 May 2022 12:28:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-12 18:44:58.698201
- Title: Object Detection in Indian Food Platters using Transfer Learning with
YOLOv4
- Title(参考訳): YOLOv4を用いた移動学習によるインド食品の物体検出
- Authors: Deepanshu Pandey, Purva Parmar, Gauri Toshniwal, Mansi Goel, Vishesh
Agrawal, Shivangi Dhiman, Lavanya Gupta and Ganesh Bagler
- Abstract要約: インド料理を包括的にラベル付けした「IndianFood10」は、インド料理によく見られる10種類の食品を含む。
また、従来の10種類のインド料理クラスを含む10種類のデータセット、IndianFood20の拡張も提供しています。
- 参考スコア(独自算出の注目度): 2.244485584005043
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Object detection is a well-known problem in computer vision. Despite this,
its usage and pervasiveness in the traditional Indian food dishes has been
limited. Particularly, recognizing Indian food dishes present in a single photo
is challenging due to three reasons: 1. Lack of annotated Indian food datasets
2. Non-distinct boundaries between the dishes 3. High intra-class variation. We
solve these issues by providing a comprehensively labelled Indian food dataset-
IndianFood10, which contains 10 food classes that appear frequently in a staple
Indian meal and using transfer learning with YOLOv4 object detector model. Our
model is able to achieve an overall mAP score of 91.8% and f1-score of 0.90 for
our 10 class dataset. We also provide an extension of our 10 class dataset-
IndianFood20, which contains 10 more traditional Indian food classes.
- Abstract(参考訳): 物体検出はコンピュータビジョンにおいてよく知られた問題である。
それにもかかわらず、伝統的なインド料理の使用と普及は制限されている。
特に1枚の写真に写っているインド料理の認識は3つの理由から困難である。
注釈付きインド食品データセットの欠如
2.皿間の不特定境界
3.高いクラス内変動
インド料理を包括的にラベル付けしたIndianFood10は、インド料理に頻繁に現れる10の食品クラスを含み、YOLOv4オブジェクト検出モデルを用いた移動学習を用いて、これらの問題を解決する。
私たちのモデルは、10クラスのデータセットで91.8%の総合マップスコアと0.90のf1スコアを達成できます。
また、従来の10のインド料理クラスを含む10クラスのdatasetindianfood20の拡張も提供しています。
関連論文リスト
- A Mobile Food Recognition System for Dietary Assessment [6.982738885923204]
我々は,生活支援のための食品認識アプリケーションの開発に焦点をあてる。
このタスクにMobilenet-v2アーキテクチャを使うことは、正確性とメモリ使用量の両方において有益である。
開発されたモバイルアプリケーションは、画像を介して自動食品認識において視覚障害者に役立てる可能性がある。
論文 参考訳(メタデータ) (2022-04-20T12:49:36Z) - TASTEset -- Recipe Dataset and Food Entities Recognition Benchmark [1.0569625612398386]
NERモデルは、レシピの処理に役立つ様々なタイプのエンティティを発見または推測することが期待されている。
データセットは700のレシピで構成され、13,000以上のエンティティを抽出する。
私たちは、名前付きエンティティ認識モデルの最先端のベースラインをいくつか提供しています。
論文 参考訳(メタデータ) (2022-04-16T10:52:21Z) - BEHAVE: Dataset and Method for Tracking Human Object Interactions [105.77368488612704]
マルチビューのRGBDフレームとそれに対応する3D SMPLとオブジェクトをアノテートしたアノテートコンタクトに適合させる。
このデータを用いて、自然環境における人間と物体を、容易に使用可能なマルチカメラで共同で追跡できるモデルを学ぶ。
論文 参考訳(メタデータ) (2022-04-14T13:21:19Z) - A Real-time Junk Food Recognition System based on Machine Learning [0.0]
20のジャンクフード分類から1万のデータポイントのデータセットを作成し、ジャンクフードの認識を試みた。
研究全体で98.05%の精度を達成したが、満足できた。
私たちの究極のゴールは、ジャンクフードを食べないようにし、健康に配慮するシステムを作ることです。
論文 参考訳(メタデータ) (2022-03-22T16:03:24Z) - Cluttered Food Grasping with Adaptive Fingers and Synthetic-Data Trained
Object Detection [8.218146534971156]
食品包装産業は、幅広い形状と大きさのさまざまな食品を扱う。
ビンピッキングの一般的なアプローチは、まず、インスタンスセグメンテーション法を用いてトレイ内の各食品を識別することである。
合成データを純粋に訓練し,sim2real法を用いて実世界へ転送する手法を提案する。
論文 参考訳(メタデータ) (2022-03-10T06:44:09Z) - Challenge Dataset of Cognates and False Friend Pairs from Indian
Languages [54.6340870873525]
コニャートは異なる言語で同じテキストの複数の変種に存在する。
本稿では,12言語を対象とした2つのコグネートデータセットの作成について述べる。
論文 参考訳(メタデータ) (2021-12-17T14:23:43Z) - FoodLogoDet-1500: A Dataset for Large-Scale Food Logo Detection via
Multi-Scale Feature Decoupling Network [55.49022825759331]
高度な食品ロゴ検出アルゴリズムを開発するには、大規模な食品ロゴデータセットが緊急に必要である。
FoodLogoDet-1500は、1500のカテゴリ、約10万の画像、約15万個の手動で注釈付けされた食品ロゴオブジェクトを備えた、新しい大規模一般公開の食品ロゴデータセットである。
食品のロゴを識別する手法として,MFDNet(Multi-scale Feature Decoupling Network)を提案する。
論文 参考訳(メタデータ) (2021-08-10T12:47:04Z) - VinaFood21: A Novel Dataset for Evaluating Vietnamese Food Recognition [0.5716776378742904]
本稿ではベトナムの食品データセットであるVinaFood21について紹介する。
10,044枚の画像と6,682枚のテスト画像を使って、VinaFood21データセットの各食品を分類し、平均精度は74.81%に達した。
論文 参考訳(メタデータ) (2021-08-06T03:24:43Z) - Towards Building a Food Knowledge Graph for Internet of Food [66.57235827087092]
食品分類から食品分類、食品知識グラフまで、食品知識組織の進化を概観する。
食品知識グラフは、食品検索と質問回答(QA)、パーソナライズされた食事レコメンデーション、食品分析、可視化において重要な役割を果たす。
食品知識グラフの今後の方向性は、マルチモーダル食品知識グラフや食品インテリジェンスなど、いくつかの分野をカバーする。
論文 参考訳(メタデータ) (2021-07-13T06:26:53Z) - A Large-Scale Benchmark for Food Image Segmentation [62.28029856051079]
我々は9,490枚の画像を含む新しい食品画像データセットFoodSeg103(およびその拡張FoodSeg154)を構築します。
これらの画像に154種類の成分を付加し,各画像は平均6つの成分ラベルと画素単位のマスクを有する。
ReLeMと呼ばれるマルチモダリティプリトレーニングアプローチを提案し、豊富なセマンティックな食品知識を持つセグメンテーションモデルを明確に装備します。
論文 参考訳(メタデータ) (2021-05-12T03:00:07Z) - Concealed Object Detection [140.98738087261887]
隠蔽物体検出(COD)に関する最初の体系的研究を紹介します。
CODは、背景に「完全に」埋め込まれているオブジェクトを特定することを目指しています。
このタスクをより理解するために、cod10kと呼ばれる大規模なデータセットを収集します。
論文 参考訳(メタデータ) (2021-02-20T06:49:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。