論文の概要: Artificial Intelligence in the Food Industry: Food Waste Estimation based on Computer Vision, a Brief Case Study in a University Dining Hall
- arxiv url: http://arxiv.org/abs/2507.14662v1
- Date: Sat, 19 Jul 2025 15:21:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:31.992316
- Title: Artificial Intelligence in the Food Industry: Food Waste Estimation based on Computer Vision, a Brief Case Study in a University Dining Hall
- Title(参考訳): 食品産業における人工知能:コンピュータビジョンに基づく食品廃棄物推定 : 大学食堂を事例として
- Authors: Shayan Rokhva, Babak Teimourpour,
- Abstract要約: 本研究は,プレートレベルの食品廃棄物を推定する費用対効果のコンピュータビジョンフレームワークを提案する。
4つの完全に教師されたモデルが、キャップ付き動的逆周波数損失とAdamWメトリクスを使用して訓練された。
全てのモデルが満足な性能を達成し、食品の種類ごとに、少なくとも1つのモデルがDPAに近づいたか、90%を超えた。
- 参考スコア(独自算出の注目度): 1.864621482724548
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quantifying post-consumer food waste in institutional dining settings is essential for supporting data-driven sustainability strategies. This study presents a cost-effective computer vision framework that estimates plate-level food waste by utilizing semantic segmentation of RGB images taken before and after meal consumption across five Iranian dishes. Four fully supervised models (U-Net, U-Net++, and their lightweight variants) were trained using a capped dynamic inverse-frequency loss and AdamW optimizer, then evaluated through a comprehensive set of metrics, including Pixel Accuracy, Dice, IoU, and a custom-defined Distributional Pixel Agreement (DPA) metric tailored to the task. All models achieved satisfying performance, and for each food type, at least one model approached or surpassed 90% DPA, demonstrating strong alignment in pixel-wise proportion estimates. Lighter models with reduced parameter counts offered faster inference, achieving real-time throughput on an NVIDIA T4 GPU. Further analysis showed superior segmentation performance for dry and more rigid components (e.g., rice and fries), while more complex, fragmented, or viscous dishes, such as stews, showed reduced performance, specifically post-consumption. Despite limitations such as reliance on 2D imaging, constrained food variety, and manual data collection, the proposed framework is pioneering and represents a scalable, contactless solution for continuous monitoring of food consumption. This research lays foundational groundwork for automated, real-time waste tracking systems in large-scale food service environments and offers actionable insights and outlines feasible future directions for dining hall management and policymakers aiming to reduce institutional food waste.
- Abstract(参考訳): データ駆動型サステナビリティ戦略を支援するためには, 施設食環境における消費後食品廃棄物の定量化が不可欠である。
本研究では,イラン料理5食前後のRGB画像のセマンティックセマンティックセグメンテーションを利用して,プレートレベルの食品廃棄物を推定する,コスト効率の高いコンピュータビジョンフレームワークを提案する。
フル教師付き4つのモデル(U-Net、U-Net++、およびそれらの軽量なモデル)は、カプセル化された動的逆周波数損失とAdamWオプティマイザを使用してトレーニングされ、タスクに合わせて、Pixel Accuracy、Dice、IoU、カスタム定義のDistributedal Pixel Agreement(DPA)メトリックを含む包括的なメトリクスセットで評価された。
全てのモデルが満足な性能を達成し、各食品タイプについて、少なくとも1つのモデルがDPAに近づいたか、90%を超え、ピクセルワイド比推算において強いアライメントを示した。
パラメータ数を削減した軽量モデルは推論を高速化し、NVIDIA T4 GPU上でリアルタイムスループットを実現した。
さらに, 乾燥, 硬質成分(米, フライなど)のセグメンテーション性能は優れ, シチューなどの複雑な, 破砕された, 粘性のある料理は, とくに消費後の性能が低下した。
2Dイメージング、制限された食品の多様性、手動データ収集などの制限にもかかわらず、提案フレームワークは先駆的であり、食品消費の継続的なモニタリングのためのスケーラブルで接触のないソリューションである。
本研究は, 大規模食品サービス環境におけるリアルタイム自動ごみ追跡システムの基礎的基礎を築き, 現実的な知見を提供し, 食堂経営や政策立案者にとって, 機関的な食品廃棄物削減をめざした今後の方向性を概説する。
関連論文リスト
- VolE: A Point-cloud Framework for Food 3D Reconstruction and Volume Estimation [4.621139625109643]
モバイル端末駆動型3D再構成を利用して食品量を推定する新しいフレームワークであるVolEを提案する。
VolEは、AR対応モバイルデバイスのおかげで、画像やカメラの位置を自由に撮影し、正確な3Dモデルを生成する。
実験の結果,VolEは2.22 %のMAPEを達成し,複数のデータセットにわたる既存のボリューム推定手法より優れていることがわかった。
論文 参考訳(メタデータ) (2025-05-15T12:03:05Z) - IMRL: Integrating Visual, Physical, Temporal, and Geometric Representations for Enhanced Food Acquisition [16.32678094159896]
IMRL(Integrated Multi-dimensional Representation Learning, 統合多次元表現学習)を提案する。
提案手法は, 食品の種類や物理的特性を捉え, 獲得行動の時間的ダイナミクスをモデル化し, 最適スクーピング点を決定するための幾何学的情報を導入する。
IMRLにより、ILはコンテキストに基づいてスクーピング戦略を適応的に調整し、多様な食品取得シナリオを扱うロボットの能力を改善することができる。
論文 参考訳(メタデータ) (2024-09-18T16:09:06Z) - MetaFood3D: 3D Food Dataset with Nutrition Values [52.16894900096017]
このデータセットは、131のカテゴリにまたがって、743の精細にスキャンされ、ラベル付けされた3D食品オブジェクトで構成されている。
我々のMetaFood3Dデータセットはクラス内の多様性を重視しており、テクスチャメッシュファイル、RGB-Dビデオ、セグメンテーションマスクなどのリッチなモダリティを含んでいる。
論文 参考訳(メタデータ) (2024-09-03T15:02:52Z) - RoDE: Linear Rectified Mixture of Diverse Experts for Food Large Multi-Modal Models [96.43285670458803]
Uni-Foodは、さまざまな食品ラベルを持つ10万以上の画像からなる統合食品データセットである。
Uni-Foodは、食品データ分析に対するより包括的なアプローチを提供するように設計されている。
本稿では,食品関連マルチタスキングの課題に対処するため,新しいリニア・リクティフィケーション・ミックス・オブ・ディバース・エキスパート (RoDE) アプローチを提案する。
論文 参考訳(メタデータ) (2024-07-17T16:49:34Z) - Computer Vision in the Food Industry: Accurate, Real-time, and Automatic Food Recognition with Pretrained MobileNetV2 [1.6590638305972631]
本研究は,16643画像からなる公共食品11データセット上での食品認識において,効率的かつ高速な事前訓練されたMobileNetV2モデルを用いる。
また、データセット理解、転送学習、データ拡張、正規化、動的学習率、ハイパーパラメータチューニング、さまざまなサイズの画像の考慮など、さまざまな技術を活用して、パフォーマンスと堅牢性を高めている。
より単純な構造を持ち、深層学習領域の深部・密度モデルと比較して訓練可能なパラメータが少ない光モデルを採用するが、短時間で計算可能な精度を達成した。
論文 参考訳(メタデータ) (2024-05-19T17:20:20Z) - NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images [63.314702537010355]
自己申告法はしばしば不正確であり、重大な偏見に悩まされる。
近年、食品画像から栄養情報を予測するためにコンピュータビジョン予測システムを用いた研究が進められている。
本稿では,様々なニューラルネットワークアーキテクチャを活用することにより,食事摂取量推定の有効性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-05-13T14:56:55Z) - How Much You Ate? Food Portion Estimation on Spoons [63.611551981684244]
現在の画像に基づく食品部分推定アルゴリズムは、ユーザが食事の画像を1、2回取ることを前提としている。
本稿では,静止型ユーザ向けカメラを用いて,機器上の食品の追跡を行う革新的なソリューションを提案する。
本システムは,スープやシチューなどの液状固形不均一混合物の栄養含量の推定に信頼性が高い。
論文 参考訳(メタデータ) (2024-05-12T00:16:02Z) - NutritionVerse: Empirical Study of Various Dietary Intake Estimation Approaches [59.38343165508926]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。
最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。
我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。
また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文 参考訳(メタデータ) (2023-09-14T13:29:41Z) - An End-to-end Food Portion Estimation Framework Based on Shape
Reconstruction from Monocular Image [7.380382380564532]
3次元形状再構成による単眼画像からの食品エネルギー推定のためのエンドツーエンドのディープラーニングフレームワークを提案する。
その結果,40.05kCalの平均絶対誤差 (MAE) とMAPEの11.47%の平均絶対誤差 (MAPE) が得られた。
論文 参考訳(メタデータ) (2023-08-03T15:17:24Z) - Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2023-06-15T15:38:10Z) - Dish detection in food platters: A framework for automated diet logging
and nutrition management [1.7855867849530096]
食品プラッターからのディッシュ検出は、視覚的に複雑な食品レイアウトのために難しい問題である。
本稿では,データコンパイル,アノテーション,最先端モデル同定など,ダイエット管理のためのエンドツーエンドの計算フレームワークを提案する。
このフレームワークは、複雑なプレゼンテーションで知られるインド料理の皿の文脈で実装されている。
論文 参考訳(メタデータ) (2023-05-12T15:25:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。