論文の概要: NutritionVerse-Synth: An Open Access Synthetically Generated 2D Food
Scene Dataset for Dietary Intake Estimation
- arxiv url: http://arxiv.org/abs/2312.06192v1
- Date: Mon, 11 Dec 2023 08:15:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 16:29:45.459832
- Title: NutritionVerse-Synth: An Open Access Synthetically Generated 2D Food
Scene Dataset for Dietary Intake Estimation
- Title(参考訳): NutritionVerse-Synth:食事摂取推定のためのオープンアクセス合成2次元食品シーンデータセット
- Authors: Saeejith Nair, Chi-en Amy Tai, Yuhao Chen, Alexander Wong
- Abstract要約: 大規模な合成食品画像データセットであるNutritionVerse-Synth(NV-Synth)を紹介する。
NV-Synthは7,082枚の動的3Dシーンからレンダリングされた84,984枚のフォトリアリスティックな食事画像を含んでいる。
オープンソースで最大の合成食品データセットであるNV-Synthは、物理学に基づくシミュレーションの価値を強調している。
- 参考スコア(独自算出の注目度): 71.22646949733833
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Manually tracking nutritional intake via food diaries is error-prone and
burdensome. Automated computer vision techniques show promise for dietary
monitoring but require large and diverse food image datasets. To address this
need, we introduce NutritionVerse-Synth (NV-Synth), a large-scale synthetic
food image dataset. NV-Synth contains 84,984 photorealistic meal images
rendered from 7,082 dynamically plated 3D scenes. Each scene is captured from
12 viewpoints and includes perfect ground truth annotations such as RGB, depth,
semantic, instance, and amodal segmentation masks, bounding boxes, and detailed
nutritional information per food item. We demonstrate the diversity of NV-Synth
across foods, compositions, viewpoints, and lighting. As the largest
open-source synthetic food dataset, NV-Synth highlights the value of
physics-based simulations for enabling scalable and controllable generation of
diverse photorealistic meal images to overcome data limitations and drive
advancements in automated dietary assessment using computer vision. In addition
to the dataset, the source code for our data generation framework is also made
publicly available at https://saeejithnair.github.io/nvsynth.
- Abstract(参考訳): 手動で食事日記による栄養摂取を追跡することは、エラーを起こしやすく、負担がかかる。
自動コンピュータビジョン技術は、食事の監視を約束するが、大規模で多様な食品画像データセットを必要とする。
このニーズに対処するために,大規模な合成食品画像データセットであるNutritionVerse-Synth(NV-Synth)を紹介する。
NV-Synthは7,082枚の動的3Dシーンからレンダリングされた84,984枚のフォトリアリスティックな食事画像を含んでいる。
各シーンは12の視点から捉えられ、rgb、深度、意味、インスタンス、アモーダルセグメンテーションマスク、バウンディングボックス、食品アイテム毎の詳細な栄養情報といった完璧な地上真実のアノテーションを含んでいる。
食品, 組成, 視点, 照明におけるNV-Synthの多様性を示す。
最大のオープンソース合成食品データセットであるNV-Synthは、多様なフォトリアリスティックな食事画像のスケーラブルで制御可能な生成を可能にし、データ制限を克服し、コンピュータビジョンを用いた自動食事評価の進歩を促進するために、物理学に基づくシミュレーションの価値を強調している。
データセットに加えて、データ生成フレームワークのソースコードもhttps://saeejithnair.github.io/nvsynthで公開されています。
関連論文リスト
- MetaFood3D: Large 3D Food Object Dataset with Nutrition Values [53.24500333363066]
このデータセットは、詳細な栄養情報、体重、および包括的栄養データベースに関連付けられた食品コードを含む、108カテゴリにわたる637の細かな3D食品オブジェクトから成っている。
実験の結果、我々のデータセットがアルゴリズムの性能を向上させる重要な可能性を実証し、ビデオキャプチャと3Dスキャンされたデータの間の困難さを強調し、高品質なデータ生成、シミュレーション、拡張におけるMetaFood3Dデータセットの強みを示した。
論文 参考訳(メタデータ) (2024-09-03T15:02:52Z) - FoodFusion: A Latent Diffusion Model for Realistic Food Image Generation [69.91401809979709]
後期拡散モデル(LDMs)のような最先端画像生成モデルでは、視覚的に印象的な食品関連画像を生成する能力が実証されている。
本稿では,テキスト記述からリアルな食品画像の忠実な合成を目的とした,潜伏拡散モデルであるFoodFusionを紹介する。
FoodFusionモデルの開発には、大規模なオープンソースフードデータセットを活用することが含まれており、30万以上のキュレーションされたイメージキャプチャペアが生成される。
論文 参考訳(メタデータ) (2023-12-06T15:07:12Z) - NutritionVerse-Real: An Open Access Manually Collected 2D Food Scene
Dataset for Dietary Intake Estimation [68.49526750115429]
食事摂取推定のための2D食品シーンデータセットであるNutritionVerse-Realを導入する。
NutritionVerse-Realデータセットは、実生活における食品シーンのイメージを手作業で収集し、各成分の重量を測定し、各料理の食生活内容を計算することによって作成されました。
論文 参考訳(メタデータ) (2023-11-20T11:05:20Z) - NutritionVerse: Empirical Study of Various Dietary Intake Estimation Approaches [59.38343165508926]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。
最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。
我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。
また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文 参考訳(メタデータ) (2023-09-14T13:29:41Z) - NutritionVerse-3D: A 3D Food Model Dataset for Nutritional Intake
Estimation [65.47310907481042]
高齢者の4人に1人は栄養不良です。
機械学習とコンピュータビジョンは、食品の自動栄養トラッキング方法の約束を示す。
NutritionVerse-3Dは、105個の3D食品モデルの大規模な高解像度データセットである。
論文 参考訳(メタデータ) (2023-04-12T05:27:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。