Fugu-MT 論文翻訳(概要): Vision-Based Approach for Food Weight Estimation from 2D Images

論文の概要: Vision-Based Approach for Food Weight Estimation from 2D Images

arxiv url: http://arxiv.org/abs/2405.16478v1
Date: Sun, 26 May 2024 08:03:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-28 20:58:51.638057
Title: Vision-Based Approach for Food Weight Estimation from 2D Images
Title（参考訳）: 2次元画像からの食品重量推定のための視覚的アプローチ
Authors: Chathura Wimalasiri, Prasan Kumar Sahoo,
Abstract要約: この研究は、さまざまな部分、向き、容器の14種類の食品からなる2380の画像のデータセットを用いている。提案手法は深層学習とコンピュータビジョン技術を統合し,特に食品検出にFaster R-CNN,重量推定にMobileNetV3を用いている。
参考スコア（独自算出の注目度）: 0.9208007322096533
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: In response to the increasing demand for efficient and non-invasive methods to estimate food weight, this paper presents a vision-based approach utilizing 2D images. The study employs a dataset of 2380 images comprising fourteen different food types in various portions, orientations, and containers. The proposed methodology integrates deep learning and computer vision techniques, specifically employing Faster R-CNN for food detection and MobileNetV3 for weight estimation. The detection model achieved a mean average precision (mAP) of 83.41\%, an average Intersection over Union (IoU) of 91.82\%, and a classification accuracy of 100\%. For weight estimation, the model demonstrated a root mean squared error (RMSE) of 6.3204, a mean absolute percentage error (MAPE) of 0.0640\%, and an R-squared value of 98.65\%. The study underscores the potential applications of this technology in healthcare for nutrition counseling, fitness and wellness for dietary intake assessment, and smart food storage solutions to reduce waste. The results indicate that the combination of Faster R-CNN and MobileNetV3 provides a robust framework for accurate food weight estimation from 2D images, showcasing the synergy of computer vision and deep learning in practical applications.
Abstract（参考訳）: 食品重量を推定する効率的で非侵襲的な手法の需要が高まっている中で,本研究では2次元画像を用いた視覚的アプローチを提案する。この研究は、さまざまな部分、向き、容器の14種類の食品からなる2380の画像のデータセットを用いている。提案手法は深層学習とコンピュータビジョン技術を統合し,特に食品検出にFaster R-CNN,重量推定にMobileNetV3を用いている。検出モデルは平均平均精度 (mAP) は83.41\%, 平均IoUは91.82\%, 分類精度 (100\%) を達成した。重量推定では,根平均2乗誤差6.3204,平均絶対パーセンテージ誤差0.0640\%,R2乗誤差98.65\%を示した。この研究は、栄養カウンセリング、食事摂取評価のためのフィットネスとウェルネス、および無駄を減らすスマートフードストレージソリューションにおける、この技術の医療への応用の可能性を強調している。以上の結果から,Faster R-CNNとMobileNetV3の組み合わせは,コンピュータビジョンと深層学習の相乗効果を示す2次元画像から食品重量を正確に推定するための堅牢なフレームワークを提供することが示された。

関連論文リスト

Food Portion Estimation: From Pixels to Calories [9.670264791361605]
画像に基づく食事評価では、2次元画像入力から食品の3次元サイズを推定する。深層学習はまた、画像の単眼画像または補助入力の組み合わせを使用することでギャップを埋め、画像入力からの出力部分を正確に予測する。
論文参考訳（メタデータ） (2026-02-04T21:53:21Z)
Investigating the Impact of Large-Scale Pre-training on Nutritional Content Estimation from 2D Images [0.0699049312989311]
画像から食物の栄養含量を推定することは、健康と食事のモニタリングに重要な意味を持つ重要な課題である。本稿では,2次元画像のみを用いた栄養推定のためのディープラーニングモデルの性能に及ぼす大規模事前学習データセットの影響について検討する。
論文参考訳（メタデータ） (2025-08-06T00:57:55Z)
VolETA: One- and Few-shot Food Volume Estimation [4.282795945742752]
本稿では,3次元生成技術を用いた食品量推定手法であるVolETAについて述べる。当社のアプローチでは,1枚または数枚のRGBD画像を用いて,食品の3Dメッシュをスケールアップする。 MTFデータセットを用いて10.97%のMAPEを用いて、ロバストで正確なボリューム推定を行う。
論文参考訳（メタデータ） (2024-07-01T18:47:15Z)
NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images [63.314702537010355]
自己申告法はしばしば不正確であり、重大な偏見に悩まされる。近年、食品画像から栄養情報を予測するためにコンピュータビジョン予測システムを用いた研究が進められている。本稿では,様々なニューラルネットワークアーキテクチャを活用することにより,食事摂取量推定の有効性を高めることを目的とする。
論文参考訳（メタデータ） (2024-05-13T14:56:55Z)
How Much You Ate? Food Portion Estimation on Spoons [63.611551981684244]
現在の画像に基づく食品部分推定アルゴリズムは、ユーザが食事の画像を1、2回取ることを前提としている。本稿では,静止型ユーザ向けカメラを用いて,機器上の食品の追跡を行う革新的なソリューションを提案する。本システムは,スープやシチューなどの液状固形不均一混合物の栄養含量の推定に信頼性が高い。
論文参考訳（メタデータ） (2024-05-12T00:16:02Z)
NutritionVerse: Empirical Study of Various Dietary Intake Estimation Approaches [59.38343165508926]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文参考訳（メタデータ） (2023-09-14T13:29:41Z)
Food Image Classification and Segmentation with Attention-based Multiple Instance Learning [51.279800092581844]
本稿では,食品画像分類とセマンティックセグメンテーションモデルを訓練するための弱教師付き方法論を提案する。提案手法は、注意に基づくメカニズムと組み合わせて、複数のインスタンス学習アプローチに基づいている。提案手法の有効性を検証するため,FoodSeg103データセット内の2つのメタクラスについて実験を行った。
論文参考訳（メタデータ） (2023-08-22T13:59:47Z)
An End-to-end Food Portion Estimation Framework Based on Shape Reconstruction from Monocular Image [7.380382380564532]
3次元形状再構成による単眼画像からの食品エネルギー推定のためのエンドツーエンドのディープラーニングフレームワークを提案する。その結果,40.05kCalの平均絶対誤差 (MAE) とMAPEの11.47%の平均絶対誤差 (MAPE) が得られた。
論文参考訳（メタデータ） (2023-08-03T15:17:24Z)
Transferring Knowledge for Food Image Segmentation using Transformers and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。 1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。 2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。 BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文参考訳（メタデータ） (2023-06-15T15:38:10Z)
MyFood: A Food Segmentation and Classification System to Aid Nutritional Monitoring [1.5469452301122173]
食料モニタリングの欠如は、人口の体重増加に大きく寄与している。食品画像を認識するためにコンピュータビジョンでいくつかのソリューションが提案されているが、栄養モニタリングに特化しているものはほとんどない。本研究は, ユーザの食事と栄養摂取の自動モニタリングを支援するために, 画像に提示された食品を分類・分別するインテリジェントシステムの開発について述べる。
論文参考訳（メタデータ） (2020-12-05T17:40:05Z)
Multi-Task Image-Based Dietary Assessment for Food Recognition and Portion Size Estimation [6.603050343996914]
本稿では,食品分類と食品部分サイズ推定の両立が可能なエンドツーエンドマルチタスクフレームワークを提案する。本結果は,分類精度と部分推定の平均絶対誤差の両方において,ベースライン法より優れる。
論文参考訳（メタデータ） (2020-04-27T21:35:07Z)
An Artificial Intelligence-Based System to Assess Nutrient Intake for Hospitalised Patients [4.048427587958764]
入院患者の栄養摂取の定期的なモニタリングは、疾患関連栄養失調のリスクを低減する上で重要な役割を担っている。本稿では,栄養摂取量を正確に推定する人工知能(AI)に基づく新しいシステムを提案する。
論文参考訳（メタデータ） (2020-03-18T15:28:51Z)
Cross-Modal Food Retrieval: Learning a Joint Embedding of Food Images and Recipes with Semantic Consistency and Attention Mechanism [70.85894675131624]
画像とレシピを共通の特徴空間に埋め込み、対応する画像とレシピの埋め込みが互いに近接するように学習する。本稿では,2つのモダリティの埋め込みを正規化するためのセマンティック・一貫性とアテンション・ベース・ネットワーク(SCAN)を提案する。食品画像や調理レシピの最先端のクロスモーダル検索戦略を,かなりの差で達成できることが示される。
論文参考訳（メタデータ） (2020-03-09T07:41:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。