論文の概要: Bangladeshi Street Food Calorie Estimation Using Improved YOLOv8 and Regression Model
- arxiv url: http://arxiv.org/abs/2509.01415v1
- Date: Mon, 01 Sep 2025 12:14:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.682629
- Title: Bangladeshi Street Food Calorie Estimation Using Improved YOLOv8 and Regression Model
- Title(参考訳): 改良型YOLOv8と回帰モデルを用いたバングラデシュの街路食カロリー推定
- Authors: Aparup Dhar, MD Tamim Hossain, Pritom Barua,
- Abstract要約: バングラデシュのストリートフードを対象とする調整ソリューションを提案する。
我々は最先端のビジョンモデル YOLOv8 を改良した改良されたカロリー推定システムを開発した。
本システムでは6.94の平均絶対誤差(MAE)、11.03ルート平均二乗誤差(RMSE)、96.4%のR2スコアが得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As obesity rates continue to increase, automated calorie tracking has become a vital tool for people seeking to maintain a healthy lifestyle or adhere to a diet plan. Although numerous research efforts have addressed this issue, existing approaches often face key limitations, such as providing only constant caloric output, struggling with multiple food recognition challenges, challenges in image scaling and normalization, and a predominant focus on Western cuisines. In this paper, we propose a tailored solution that specifically targets Bangladeshi street food. We first construct a diverse dataset of popular street foods found across Bangladesh. Then, we develop a refined calorie estimation system by modifying the state-of-the-art vision model YOLOv8. Our modified model achieves superior classification and segmentation results, with only a slight increase in computational complexity compared to the base variant. Coupled with a machine learning regression model, our system achieves an impressive 6.94 mean absolute error (MAE), 11.03 root mean squared error (RMSE), and a 96.0% R^2 score in calorie estimation, making it both highly effective and accurate for real-world food calorie calculations.
- Abstract(参考訳): 肥満率の上昇に伴い、健康的なライフスタイルを維持したり、食事計画に従おうとする人々にとって、自動カロリー追跡は重要なツールとなっている。
この問題に多くの研究努力が取り組んできたが、既存のアプローチでは、一定のカロリー出力しか提供できないこと、複数の食品認識の課題に苦しむこと、画像のスケーリングと正規化の課題、西洋料理に重点を置くことなど、重要な制限に直面していることが多い。
本稿では,バングラデシュのストリートフードを対象とする調整ソリューションを提案する。
まずバングラデシュ全土で見られる人気のストリートフードの多様なデータセットを構築した。
そこで我々は,最先端のビジョンモデル YOLOv8 を改良した改良型カロリー推定システムを開発した。
修正されたモデルでは, 基本変種と比較して計算複雑性がわずかに増大しただけで, より優れた分類とセグメンテーション結果が得られる。
機械学習回帰モデルと組み合わせて,本システムは6.94平均絶対誤差(MAE),11.03ルート平均二乗誤差(RMSE),96.0%R^2のカロリー推定を達成し,実世界の食品カロリー計算に有効かつ正確である。
関連論文リスト
- Advancing Food Nutrition Estimation via Visual-Ingredient Feature Fusion [69.84988999191343]
我々はファストフード(FastFood)について紹介する。ファストフード(FastFood)は、908のファストフードカテゴリーに84,446のイメージを持つデータセットで、成分や栄養のアノテーションが特徴である。
栄養推定の精度を高めるために,新しいモデル非依存型ビジュアル・イングレディエント・フィーチャー・フュージョン (VIF$2$) 法を提案する。
論文 参考訳(メタデータ) (2025-05-13T17:01:21Z) - Dietary Intake Estimation via Continuous 3D Reconstruction of Food [5.010690651107531]
本研究では,モノクロ2Dビデオから構築した3次元食品モデルを利用して,摂取行動の正確なモニタリングを行う手法を提案する。
おもちゃのモデルと実際の食品による実験は、アプローチの可能性を示している。
論文 参考訳(メタデータ) (2025-05-01T15:35:42Z) - Personalized Class Incremental Context-Aware Food Classification for Food Intake Monitoring Systems [3.8767314375943918]
既存の食品分類モデルでは、新しい分類の精度は低く、パーソナライゼーションの欠如がある。
本稿では,これらの課題を克服するために,個人別・クラス別食品分類モデルを提案する。
本手法は, 個人化により, 新クラスと既存クラスの両方に適用可能性と精度を維持しながら, 新たな食品クラスに適応する。
論文 参考訳(メタデータ) (2025-03-09T14:50:56Z) - NGQA: A Nutritional Graph Question Answering Benchmark for Personalized Health-aware Nutritional Reasoning [49.06840168630573]
食事は人間の健康において重要な役割を担っているが、個々の健康状態に対する食事の理由付けは大きな課題である。
栄養質問回答(QA)は,この問題に対処するための一般的な方法である。
栄養学的健康推論のために設計された最初のグラフ質問応答データセットであるNGQA(Nutritional Graph Question Answering)ベンチマークを紹介する。
論文 参考訳(メタデータ) (2024-12-20T04:13:46Z) - RoDE: Linear Rectified Mixture of Diverse Experts for Food Large Multi-Modal Models [96.43285670458803]
Uni-Foodは、さまざまな食品ラベルを持つ10万以上の画像からなる統合食品データセットである。
Uni-Foodは、食品データ分析に対するより包括的なアプローチを提供するように設計されている。
本稿では,食品関連マルチタスキングの課題に対処するため,新しいリニア・リクティフィケーション・ミックス・オブ・ディバース・エキスパート (RoDE) アプローチを提案する。
論文 参考訳(メタデータ) (2024-07-17T16:49:34Z) - NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images [63.314702537010355]
自己申告法はしばしば不正確であり、重大な偏見に悩まされる。
近年、食品画像から栄養情報を予測するためにコンピュータビジョン予測システムを用いた研究が進められている。
本稿では,様々なニューラルネットワークアーキテクチャを活用することにより,食事摂取量推定の有効性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-05-13T14:56:55Z) - Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2023-06-15T15:38:10Z) - Cook-Gen: Robust Generative Modeling of Cooking Actions from Recipes [6.666528076345153]
食品計算モデルは、健康的な食事習慣を維持するのを助けることで、ますます人気が高まっている。
本研究では,調理行動を含む現在の食品計算モデルを拡張するための生成AI手法について検討する。
本稿では,レシピから調理動作を確実に生成する新しいアグリゲーションベースの生成AI手法であるCook-Genを提案する。
論文 参考訳(メタデータ) (2023-06-01T18:49:47Z) - Dish detection in food platters: A framework for automated diet logging
and nutrition management [1.7855867849530096]
食品プラッターからのディッシュ検出は、視覚的に複雑な食品レイアウトのために難しい問題である。
本稿では,データコンパイル,アノテーション,最先端モデル同定など,ダイエット管理のためのエンドツーエンドの計算フレームワークを提案する。
このフレームワークは、複雑なプレゼンテーションで知られるインド料理の皿の文脈で実装されている。
論文 参考訳(メタデータ) (2023-05-12T15:25:58Z) - Simulating Personal Food Consumption Patterns using a Modified Markov
Chain [5.874935571318868]
本稿では,マルコフ連鎖モデルの改良と自己指導型学習を活用することにより,個人用食品消費データパターンをシミュレートする新しい枠組みを提案する。
実験の結果,ランダムシミュレーションやマルコフ連鎖法と比較して有望な性能を示した。
論文 参考訳(メタデータ) (2022-08-13T18:50:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。