論文の概要: Dish detection in food platters: A framework for automated diet logging
and nutrition management
- arxiv url: http://arxiv.org/abs/2305.07552v1
- Date: Fri, 12 May 2023 15:25:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-15 12:19:17.129090
- Title: Dish detection in food platters: A framework for automated diet logging
and nutrition management
- Title(参考訳): 食品プラッターにおけるダイシュ検出:自動ダイエットロギングと栄養管理のための枠組み
- Authors: Mansi Goel, Shashank Dargar, Shounak Ghatak, Nidhi Verma, Pratik
Chauhan, Anushka Gupta, Nikhila Vishnumolakala, Hareesh Amuru, Ekta Gambhir,
Ronak Chhajed, Meenal Jain, Astha Jain, Samiksha Garg, Nitesh Narwade,
Nikhilesh Verhwani, Abhuday Tiwari, Kirti Vashishtha and Ganesh Bagler
- Abstract要約: 食品プラッターからのディッシュ検出は、視覚的に複雑な食品レイアウトのために難しい問題である。
本稿では,データコンパイル,アノテーション,最先端モデル同定など,ダイエット管理のためのエンドツーエンドの計算フレームワークを提案する。
このフレームワークは、複雑なプレゼンテーションで知られるインド料理の皿の文脈で実装されている。
- 参考スコア(独自算出の注目度): 1.7855867849530096
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Diet is central to the epidemic of lifestyle disorders. Accurate and
effortless diet logging is one of the significant bottlenecks for effective
diet management and calorie restriction. Dish detection from food platters is a
challenging problem due to a visually complex food layout. We present an
end-to-end computational framework for diet management, from data compilation,
annotation, and state-of-the-art model identification to its mobile app
implementation. As a case study, we implement the framework in the context of
Indian food platters known for their complex presentation that poses a
challenge for the automated detection of dishes. Starting with the 61 most
popular Indian dishes, we identify the state-of-the-art model through a
comparative analysis of deep-learning-based object detection architectures.
Rooted in a meticulous compilation of 68,005 platter images with 134,814 manual
dish annotations, we first compare ten architectures for multi-label
classification to identify ResNet152 (mAP=84.51%) as the best model. YOLOv8x
(mAP=87.70%) emerged as the best model architecture for dish detection among
the eight deep-learning models implemented after a thorough performance
evaluation. By comparing with the state-of-the-art model for the IndianFood10
dataset, we demonstrate the superior object detection performance of YOLOv8x
for this subset and establish Resnet152 as the best architecture for
multi-label classification. The models thus trained on richly annotated data
can be extended to include dishes from across global cuisines. The proposed
framework is demonstrated through a proof-of-concept mobile application with
diverse applications for diet logging, food recommendation systems, nutritional
interventions, and mitigation of lifestyle disorders.
- Abstract(参考訳): 食生活は生活習慣病の流行の中心である。
正確な食事記録は、効果的な食事管理とカロリー制限の重要なボトルネックの1つである。
食品プラッターからのディッシュ検出は、視覚的に複雑な食品レイアウトのために難しい問題である。
本稿では,データコンパイル,アノテーション,最先端モデル同定からモバイルアプリ実装まで,ダイエット管理のためのエンドツーエンド計算フレームワークを提案する。
ケーススタディとして,インド料理の自動検出の課題となる複雑なプレゼンテーションで知られているインド料理の皿の文脈で,この枠組みを実装した。
61のインド料理を皮切りに、ディープラーニングに基づくオブジェクト検出アーキテクチャの比較分析により最先端のモデルを同定する。
68,005枚のプラッター画像と134,814個の手動料理アノテーションを巧妙にまとめて,まず,マルチラベル分類のための10のアーキテクチャを比較し,ResNet152(mAP=84.51%)を最良のモデルとして同定する。
YOLOv8x (mAP=87.70%) は、徹底的な性能評価を経て実装された8つのディープラーニングモデルの中で、料理検出のための最良のモデルアーキテクチャとして登場した。
IndianFood10データセットの最先端モデルと比較することにより、このサブセットに対するYOLOv8xの優れたオブジェクト検出性能を示し、Resnet152をマルチラベル分類の最高のアーキテクチャとして確立する。
このように、豊富な注釈データに基づいて訓練されたモデルは、グローバル料理全体からの料理を含むように拡張することができる。
提案手法は, ダイエットログ, 食品レコメンデーションシステム, 栄養介入, ライフスタイル障害の緩和など, 多様な応用をともなう概念実証モバイルアプリケーションを通じて実証された。
関連論文リスト
- NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images [63.314702537010355]
自己申告法はしばしば不正確であり、重大な偏見に悩まされる。
近年、食品画像から栄養情報を予測するためにコンピュータビジョン予測システムを用いた研究が進められている。
本稿では,様々なニューラルネットワークアーキテクチャを活用することにより,食事摂取量推定の有効性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-05-13T14:56:55Z) - From Canteen Food to Daily Meals: Generalizing Food Recognition to More
Practical Scenarios [92.58097090916166]
DailyFood-172とDailyFood-16という2つの新しいベンチマークを、毎日の食事から食のイメージをキュレートする。
これらの2つのデータセットは、よく計算された食品画像領域から日常的な食品画像領域へのアプローチの伝達性を評価するために使用される。
論文 参考訳(メタデータ) (2024-03-12T08:32:23Z) - Food Image Classification and Segmentation with Attention-based Multiple
Instance Learning [51.279800092581844]
本稿では,食品画像分類とセマンティックセグメンテーションモデルを訓練するための弱教師付き方法論を提案する。
提案手法は、注意に基づくメカニズムと組み合わせて、複数のインスタンス学習アプローチに基づいている。
提案手法の有効性を検証するため,FoodSeg103データセット内の2つのメタクラスについて実験を行った。
論文 参考訳(メタデータ) (2023-08-22T13:59:47Z) - Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2023-06-15T15:38:10Z) - UMDFood: Vision-language models boost food composition compilation [26.5694236976957]
本稿では, 食品組成プロファイルを正確に推定するために, フロント・オブ・パッケージ・ラベリングと製品画像を用いた新しい視覚言語モデル, UMDFood-VLを提案する。
化学分析結果とモデル推定結果の誤差の最大82.2%は10%未満である。
この性能は、他の食品および栄養関連データコンパイルと触媒化への一般化に光を当てている。
論文 参考訳(メタデータ) (2023-05-18T03:18:12Z) - Food Ingredients Recognition through Multi-label Learning [0.0]
ダイエット自動評価システムにおいて, 食材中のさまざまな食材を識別する能力は重要な決定要因である。
我々は,料理画像中の任意の成分を検出するために,深層多ラベル学習アプローチを採用し,最先端のニューラルネットワークを評価した。
論文 参考訳(メタデータ) (2022-10-24T10:18:26Z) - A Mobile Food Recognition System for Dietary Assessment [6.982738885923204]
我々は,生活支援のための食品認識アプリケーションの開発に焦点をあてる。
このタスクにMobilenet-v2アーキテクチャを使うことは、正確性とメモリ使用量の両方において有益である。
開発されたモバイルアプリケーションは、画像を介して自動食品認識において視覚障害者に役立てる可能性がある。
論文 参考訳(メタデータ) (2022-04-20T12:49:36Z) - Visual Aware Hierarchy Based Food Recognition [10.194167945992938]
本稿では,コンボリューショナルニューラルネットワーク(CNN)をバックボーンアーキテクチャとして用いた2段階の食品認識システムを提案する。
食品ローカライゼーションのステップは、食品領域を識別するFaster R-CNN法の実装に基づいている。
食品分類工程では、視覚的に類似した食品カテゴリーを自動的にまとめて階層構造を生成することができる。
論文 参考訳(メタデータ) (2020-12-06T20:25:31Z) - MyFood: A Food Segmentation and Classification System to Aid Nutritional
Monitoring [1.5469452301122173]
食料モニタリングの欠如は、人口の体重増加に大きく寄与している。
食品画像を認識するためにコンピュータビジョンでいくつかのソリューションが提案されているが、栄養モニタリングに特化しているものはほとんどない。
本研究は, ユーザの食事と栄養摂取の自動モニタリングを支援するために, 画像に提示された食品を分類・分別するインテリジェントシステムの開発について述べる。
論文 参考訳(メタデータ) (2020-12-05T17:40:05Z) - ISIA Food-500: A Dataset for Large-Scale Food Recognition via Stacked
Global-Local Attention Network [50.7720194859196]
ウィキペディアのリストから500のカテゴリと399,726の画像を含むデータセットISIA Food-500を紹介する。
このデータセットは、既存の一般的なベンチマークデータセットをカテゴリカバレッジとデータボリュームで上回る。
食品認識のための2つのサブネットワークからなるグローバルローカルアテンションネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T02:48:27Z) - Cross-Modal Food Retrieval: Learning a Joint Embedding of Food Images
and Recipes with Semantic Consistency and Attention Mechanism [70.85894675131624]
画像とレシピを共通の特徴空間に埋め込み、対応する画像とレシピの埋め込みが互いに近接するように学習する。
本稿では,2つのモダリティの埋め込みを正規化するためのセマンティック・一貫性とアテンション・ベース・ネットワーク(SCAN)を提案する。
食品画像や調理レシピの最先端のクロスモーダル検索戦略を,かなりの差で達成できることが示される。
論文 参考訳(メタデータ) (2020-03-09T07:41:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。