論文の概要: Leveraging Human Salience to Improve Calorie Estimation
- arxiv url: http://arxiv.org/abs/2306.09527v1
- Date: Thu, 15 Jun 2023 22:13:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-19 15:36:31.281466
- Title: Leveraging Human Salience to Improve Calorie Estimation
- Title(参考訳): カロリー推定を改善するための人間のサリエンスを活用する
- Authors: Katherine R. Dearstyne, Alberto D. Rodriguez
- Abstract要約: 食品画像からのカロリー予測のタスクに人体サリエンスを組み込むことの有効性について検討した。
食品の食感を最も強調する画像に塩分マップを取り入れた場合,32.2%の相対的な改善が観察された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The following paper investigates the effectiveness of incorporating human
salience into the task of calorie prediction from images of food. We observe a
32.2% relative improvement when incorporating saliency maps on the images of
food highlighting the most calorie regions. We also attempt to further improve
the accuracy by starting the best models using pre-trained weights on similar
tasks of mass estimation and food classification. However, we observe no
improvement. Surprisingly, we also find that our best model was not able to
surpass the original performance published alongside the test dataset,
Nutrition5k. We use ResNet50 and Xception as the base models for our
experiment.
- Abstract(参考訳): 本研究は,食品画像からのカロリー予測タスクに人的敬礼を組み込む効果について検討する。
食品の食感を最も強調する画像に塩分マップを取り入れた場合,32.2%の相対的な改善が観察された。
また,質量推定と食品分類の類似タスクにおいて,事前学習した重みを用いたベストモデルの構築により,精度の向上を図る。
しかし、改善は見られません。
驚いたことに、私たちの最高のモデルは、テストデータセットであるNutrition5kと共に公開されたオリジナルのパフォーマンスを上回りませんでした。
私たちは実験のベースモデルとしてResNet50とXceptionを使用しています。
関連論文リスト
- PrefPaint: Aligning Image Inpainting Diffusion Model with Human Preference [62.72779589895124]
画像インペイントのための拡散モデルと人間の審美基準との整合性を、強化学習フレームワークを用いて初めて試みる。
我々は、人間の好みを付加した約51,000枚の画像からなるデータセットで報酬モデルを訓練する。
画像拡張や3次元再構成などの下流タスクの塗装比較実験により, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-10-29T11:49:39Z) - From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis [50.80532910808962]
GluFormerは、トランスフォーマーアーキテクチャに基づく生体医学的時間的データの生成基盤モデルである。
GluFormerは5つの地理的領域にまたがる4936人を含む15の異なる外部データセットに一般化されている。
今後4年間の健康状態も予測できる。
論文 参考訳(メタデータ) (2024-08-20T13:19:06Z) - NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images [63.314702537010355]
自己申告法はしばしば不正確であり、重大な偏見に悩まされる。
近年、食品画像から栄養情報を予測するためにコンピュータビジョン予測システムを用いた研究が進められている。
本稿では,様々なニューラルネットワークアーキテクチャを活用することにより,食事摂取量推定の有効性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-05-13T14:56:55Z) - Image-Based Dietary Assessment: A Healthy Eating Plate Estimation System [0.0]
食生活の栄養質は過去20年から30年の間に著しく悪化し、人々はしばしば低下を過小評価している。
本稿では,イメージ分析による食事の健康度評価を目的とした,革新的なイメージベース食事アセスメントシステムを提案する。
本システムでは, 皿上の食品を解析し, その割合を評価し, ハーバード大学の健康食品推奨事項に対する食事の付着度を計算するために, 高度な画像分割と分類技術を用いている。
論文 参考訳(メタデータ) (2024-03-02T21:01:01Z) - NutritionVerse-Real: An Open Access Manually Collected 2D Food Scene
Dataset for Dietary Intake Estimation [68.49526750115429]
食事摂取推定のための2D食品シーンデータセットであるNutritionVerse-Realを導入する。
NutritionVerse-Realデータセットは、実生活における食品シーンのイメージを手作業で収集し、各成分の重量を測定し、各料理の食生活内容を計算することによって作成されました。
論文 参考訳(メタデータ) (2023-11-20T11:05:20Z) - NutritionVerse: Empirical Study of Various Dietary Intake Estimation Approaches [59.38343165508926]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。
最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。
我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。
また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文 参考訳(メタデータ) (2023-09-14T13:29:41Z) - An End-to-end Food Portion Estimation Framework Based on Shape
Reconstruction from Monocular Image [7.380382380564532]
3次元形状再構成による単眼画像からの食品エネルギー推定のためのエンドツーエンドのディープラーニングフレームワークを提案する。
その結果,40.05kCalの平均絶対誤差 (MAE) とMAPEの11.47%の平均絶対誤差 (MAPE) が得られた。
論文 参考訳(メタデータ) (2023-08-03T15:17:24Z) - Image Based Food Energy Estimation With Depth Domain Adaptation [6.602838826255494]
本稿では,RGB画像から食品のエネルギー密度への画素間マッピングである「エネルギー密度マップ」を提案する。
次に「エネルギー密度マップ」と関連する深度マップを、深度センサで捉えた食品エネルギーを推定する。
論文 参考訳(メタデータ) (2022-08-25T15:18:48Z) - On the Robustness of Pretraining and Self-Supervision for a Deep
Learning-based Analysis of Diabetic Retinopathy [70.71457102672545]
糖尿病網膜症における訓練方法の違いによる影響を比較検討した。
本稿では,定量的性能,学習した特徴表現の統計,解釈可能性,画像歪みに対する頑健性など,さまざまな側面について検討する。
以上の結果から,ImageNet事前学習モデルでは,画像歪みに対する性能,一般化,堅牢性が著しく向上していることが示唆された。
論文 参考訳(メタデータ) (2021-06-25T08:32:45Z) - Eating Habits Discovery in Egocentric Photo-streams [9.436913961194671]
食事関連行動パターン探索モデルを構築し,日常的に実施されている活動から栄養のルーチンを明らかにする。
このフレームワーク内では、単純だが堅牢で高速な新しい分類パイプラインを提示する。
本稿では,カメラが単独で食べる際の食品関連シーンの識別への応用について述べる。
論文 参考訳(メタデータ) (2020-09-16T12:46:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。