論文の概要: NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images
- arxiv url: http://arxiv.org/abs/2405.07814v1
- Date: Mon, 13 May 2024 14:56:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-14 13:15:58.835619
- Title: NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images
- Title(参考訳): NutritionVerse-Direct: 食品画像からのマルチタスク栄養予測のためのディープニューラルネットワークの探索
- Authors: Matthew Keller, Chi-en Amy Tai, Yuhao Chen, Pengcheng Xi, Alexander Wong,
- Abstract要約: 自己申告法はしばしば不正確であり、重大な偏見に悩まされる。
近年、食品画像から栄養情報を予測するためにコンピュータビジョン予測システムを用いた研究が進められている。
本稿では,様々なニューラルネットワークアーキテクチャを活用することにより,食事摂取量推定の有効性を高めることを目的とする。
- 参考スコア(独自算出の注目度): 63.314702537010355
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many aging individuals encounter challenges in effectively tracking their dietary intake, exacerbating their susceptibility to nutrition-related health complications. Self-reporting methods are often inaccurate and suffer from substantial bias; however, leveraging intelligent prediction methods can automate and enhance precision in this process. Recent work has explored using computer vision prediction systems to predict nutritional information from food images. Still, these methods are often tailored to specific situations, require other inputs in addition to a food image, or do not provide comprehensive nutritional information. This paper aims to enhance the efficacy of dietary intake estimation by leveraging various neural network architectures to directly predict a meal's nutritional content from its image. Through comprehensive experimentation and evaluation, we present NutritionVerse-Direct, a model utilizing a vision transformer base architecture with three fully connected layers that lead to five regression heads predicting calories (kcal), mass (g), protein (g), fat (g), and carbohydrates (g) present in a meal. NutritionVerse-Direct yields a combined mean average error score on the NutritionVerse-Real dataset of 412.6, an improvement of 25.5% over the Inception-ResNet model, demonstrating its potential for improving dietary intake estimation accuracy.
- Abstract(参考訳): 多くの高齢の個人は、食事摂取を効果的に追跡し、栄養関連合併症への感受性を高めるという課題に直面している。
自己報告手法はしばしば不正確であり、重大なバイアスに悩まされるが、インテリジェントな予測手法を活用することで、このプロセスの精度を自動化し、向上させることができる。
近年、食品画像から栄養情報を予測するためにコンピュータビジョン予測システムを用いた研究が進められている。
しかし、これらの方法はしばしば特定の状況に合わせて調整され、食物のイメージに加えて他の入力を必要とするか、包括的な栄養情報を提供しない。
本稿では, 各種ニューラルネットワークアーキテクチャを用いて, 食事の栄養素含量を画像から直接予測することにより, 食事摂取量推定の有効性を高めることを目的とする。
食事中に存在するカロリー(kcal)、質量(g)、タンパク質(g)、脂肪(g)、炭水化物(g)を予測する5つの回帰ヘッドを導く3つの完全に連結された層を持つ視覚トランスフォーマーベースアーキテクチャを利用するモデルであるNutritionVerse-Directを提案する。
NutritionVerse-Directは、NutritionVerse-Realデータセットの412.6の平均エラースコアを合計し、Inception-ResNetモデルよりも25.5%改善した。
関連論文リスト
- How Much You Ate? Food Portion Estimation on Spoons [63.611551981684244]
現在の画像に基づく食品部分推定アルゴリズムは、ユーザが食事の画像を1、2回取ることを前提としている。
本稿では,静止型ユーザ向けカメラを用いて,機器上の食品の追跡を行う革新的なソリューションを提案する。
本システムは,スープやシチューなどの液状固形不均一混合物の栄養含量の推定に信頼性が高い。
論文 参考訳(メタデータ) (2024-05-12T00:16:02Z) - NutritionVerse-Real: An Open Access Manually Collected 2D Food Scene
Dataset for Dietary Intake Estimation [68.49526750115429]
食事摂取推定のための2D食品シーンデータセットであるNutritionVerse-Realを導入する。
NutritionVerse-Realデータセットは、実生活における食品シーンのイメージを手作業で収集し、各成分の重量を測定し、各料理の食生活内容を計算することによって作成されました。
論文 参考訳(メタデータ) (2023-11-20T11:05:20Z) - DPF-Nutrition: Food Nutrition Estimation via Depth Prediction and Fusion [0.8579795118452238]
DPF-Nutritionは単分子画像を用いたエンドツーエンドの栄養推定法である。
DPF-Nutritionでは,深度マップを生成するための深度予測モジュールを導入し,食品部分推定の精度を向上した。
また,単分子画像と予測深度情報を組み合わせたRGB-D融合モジュールを設計した。
論文 参考訳(メタデータ) (2023-10-18T04:23:05Z) - NutritionVerse: Empirical Study of Various Dietary Intake Estimation Approaches [59.38343165508926]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。
最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。
我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。
また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文 参考訳(メタデータ) (2023-09-14T13:29:41Z) - NutritionVerse-3D: A 3D Food Model Dataset for Nutritional Intake
Estimation [65.47310907481042]
高齢者の4人に1人は栄養不良です。
機械学習とコンピュータビジョンは、食品の自動栄養トラッキング方法の約束を示す。
NutritionVerse-3Dは、105個の3D食品モデルの大規模な高解像度データセットである。
論文 参考訳(メタデータ) (2023-04-12T05:27:30Z) - Vision-Based Food Analysis for Automatic Dietary Assessment [49.32348549508578]
本総説では, 食品画像分析, 容積推定, 栄養素抽出の3段階からなる, 統合型ビジョンベース食事評価(VBDA)の枠組みを概説する。
深層学習により、VBDAは徐々にエンドツーエンドの実装へと移行し、単一のネットワークに食品画像を適用して栄養を直接見積もる。
論文 参考訳(メタデータ) (2021-08-06T05:46:01Z) - Nutrition5k: Towards Automatic Nutritional Understanding of Generic Food [8.597152169571057]
本研究では,映像ストリーム,奥行き画像,成分重み,高精細な栄養コンテンツアノテーションを備えた,5kの多様な実世界の食品料理のデータセットである nutrition5kを紹介する。
本稿では, 複雑で現実的な料理のカロリーおよびマクロ栄養価を, プロの栄養士を上回る精度で予測できるコンピュータビジョンアルゴリズムを訓練することにより, このデータセットの可能性を実証する。
論文 参考訳(メタデータ) (2021-03-04T22:59:22Z) - An Artificial Intelligence-Based System to Assess Nutrient Intake for
Hospitalised Patients [4.048427587958764]
入院患者の栄養摂取の定期的なモニタリングは、疾患関連栄養失調のリスクを低減する上で重要な役割を担っている。
本稿では,栄養摂取量を正確に推定する人工知能(AI)に基づく新しいシステムを提案する。
論文 参考訳(メタデータ) (2020-03-18T15:28:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。