論文の概要: Towards Learning Food Portion From Monocular Images With Cross-Domain
Feature Adaptation
- arxiv url: http://arxiv.org/abs/2103.07562v1
- Date: Fri, 12 Mar 2021 22:58:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 14:12:45.692481
- Title: Towards Learning Food Portion From Monocular Images With Cross-Domain
Feature Adaptation
- Title(参考訳): クロスドメイン機能適応による単眼画像から食品移植の学習に向けて
- Authors: Zeman Shao, Shaobo Fang, Runyu Mao, Jiangpeng He, Janine Wright,
Deborah Kerr, Carol Jo Boushey, Fengqing Zhu
- Abstract要約: 本稿では,RGBと学習エネルギー分布領域の両方から推定される特徴を組み合わせることで,部分サイズ推定のための深回帰過程を提案する。
食品エネルギーの推計値は11.47%で、非専門家の推計を27.56%上回っている。
- 参考スコア(独自算出の注目度): 6.648441500207032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We aim to estimate food portion size, a property that is strongly related to
the presence of food object in 3D space, from single monocular images under
real life setting. Specifically, we are interested in end-to-end estimation of
food portion size, which has great potential in the field of personal health
management. Unlike image segmentation or object recognition where annotation
can be obtained through large scale crowd sourcing, it is much more challenging
to collect datasets for portion size estimation since human cannot accurately
estimate the size of an object in an arbitrary 2D image without expert
knowledge. To address such challenge, we introduce a real life food image
dataset collected from a nutrition study where the groundtruth food energy
(calorie) is provided by registered dietitians, and will be made available to
the research community. We propose a deep regression process for portion size
estimation by combining features estimated from both RGB and learned energy
distribution domains. Our estimates of food energy achieved state-of-the-art
with a MAPE of 11.47%, significantly outperforms non-expert human estimates by
27.56%.
- Abstract(参考訳): 実生活環境下における単一眼像から3次元空間における食品物の存在に強く関係する食品部分の大きさを推定することを目指しています。
具体的には、個人の健康管理の分野で大きな可能性を秘めた食品部分サイズのエンドツーエンド推定に興味があります。
大規模なクラウドソーシングによってアノテーションを得ることができる画像分割やオブジェクト認識とは異なり、人間が専門知識のない任意の2次元画像においてオブジェクトのサイズを正確に推定できないため、部分サイズ推定のためのデータセットを集めることははるかに困難である。
そこで本研究では、登録栄養士が栄養エネルギー(カロリー)を提供する栄養研究から収集した実生活用食品画像データセットについて紹介し、研究コミュニティに公開します。
本稿では,RGBと学習エネルギー分布領域の両方から推定される特徴を組み合わせることで,部分サイズ推定のための深回帰過程を提案する。
食品エネルギーの推計値は11.47%で、非専門家の推計を27.56%上回っている。
関連論文リスト
- MetaFood3D: Large 3D Food Object Dataset with Nutrition Values [53.24500333363066]
このデータセットは、詳細な栄養情報、体重、および包括的栄養データベースに関連付けられた食品コードを含む、108カテゴリにわたる637の細かな3D食品オブジェクトから成っている。
実験の結果、我々のデータセットがアルゴリズムの性能を向上させる重要な可能性を実証し、ビデオキャプチャと3Dスキャンされたデータの間の困難さを強調し、高品質なデータ生成、シミュレーション、拡張におけるMetaFood3Dデータセットの強みを示した。
論文 参考訳(メタデータ) (2024-09-03T15:02:52Z) - NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images [63.314702537010355]
自己申告法はしばしば不正確であり、重大な偏見に悩まされる。
近年、食品画像から栄養情報を予測するためにコンピュータビジョン予測システムを用いた研究が進められている。
本稿では,様々なニューラルネットワークアーキテクチャを活用することにより,食事摂取量推定の有効性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-05-13T14:56:55Z) - From Canteen Food to Daily Meals: Generalizing Food Recognition to More
Practical Scenarios [92.58097090916166]
DailyFood-172とDailyFood-16という2つの新しいベンチマークを、毎日の食事から食のイメージをキュレートする。
これらの2つのデータセットは、よく計算された食品画像領域から日常的な食品画像領域へのアプローチの伝達性を評価するために使用される。
論文 参考訳(メタデータ) (2024-03-12T08:32:23Z) - NutritionVerse-Real: An Open Access Manually Collected 2D Food Scene
Dataset for Dietary Intake Estimation [68.49526750115429]
食事摂取推定のための2D食品シーンデータセットであるNutritionVerse-Realを導入する。
NutritionVerse-Realデータセットは、実生活における食品シーンのイメージを手作業で収集し、各成分の重量を測定し、各料理の食生活内容を計算することによって作成されました。
論文 参考訳(メタデータ) (2023-11-20T11:05:20Z) - NutritionVerse: Empirical Study of Various Dietary Intake Estimation Approaches [59.38343165508926]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。
最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。
我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。
また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文 参考訳(メタデータ) (2023-09-14T13:29:41Z) - An End-to-end Food Portion Estimation Framework Based on Shape
Reconstruction from Monocular Image [7.380382380564532]
3次元形状再構成による単眼画像からの食品エネルギー推定のためのエンドツーエンドのディープラーニングフレームワークを提案する。
その結果,40.05kCalの平均絶対誤差 (MAE) とMAPEの11.47%の平均絶対誤差 (MAPE) が得られた。
論文 参考訳(メタデータ) (2023-08-03T15:17:24Z) - Image Based Food Energy Estimation With Depth Domain Adaptation [6.602838826255494]
本稿では,RGB画像から食品のエネルギー密度への画素間マッピングである「エネルギー密度マップ」を提案する。
次に「エネルギー密度マップ」と関連する深度マップを、深度センサで捉えた食品エネルギーを推定する。
論文 参考訳(メタデータ) (2022-08-25T15:18:48Z) - Towards the Creation of a Nutrition and Food Group Based Image Database [58.429385707376554]
栄養・食品群に基づく画像データベースを構築するための枠組みを提案する。
米国農務省食品栄養データベース(FNDDS)における食品群に基づく食品コードリンクプロトコルを設計する。
提案手法は16,114個の食品データセットを含む栄養・食品群に基づく画像データベースを構築するために用いられる。
論文 参考訳(メタデータ) (2022-06-05T02:41:44Z) - An End-to-End Food Image Analysis System [8.622335099019214]
食品の局所化, 分類, 部分サイズ推定を統合した画像に基づく食品分析フレームワークを提案する。
提案するフレームワークはエンドツーエンドであり,複数の食品を含む任意の食品画像として入力することができる。
本研究の枠組みは,栄養摂食調査から収集した実生活食品画像データセットを用いて評価する。
論文 参考訳(メタデータ) (2021-02-01T05:36:20Z) - Multi-Task Image-Based Dietary Assessment for Food Recognition and
Portion Size Estimation [6.603050343996914]
本稿では,食品分類と食品部分サイズ推定の両立が可能なエンドツーエンドマルチタスクフレームワークを提案する。
本結果は,分類精度と部分推定の平均絶対誤差の両方において,ベースライン法より優れる。
論文 参考訳(メタデータ) (2020-04-27T21:35:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。