論文の概要: Enhanced Food Category Recognition under Illumination-Induced Domain Shift
- arxiv url: http://arxiv.org/abs/2602.08491v1
- Date: Mon, 09 Feb 2026 10:43:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.17591
- Title: Enhanced Food Category Recognition under Illumination-Induced Domain Shift
- Title(参考訳): 発光誘起ドメインシフト下における食品カテゴリー認識の促進
- Authors: Keonvin Park, Aditya Pal, Jin Hong Mok,
- Abstract要約: 広範に採用されている2つのデータセットを用いた多クラス食品カテゴリー認識における照明によるドメインシフトについて検討した。
光温度と強度を体系的に変化させることで,合成照明増強データセットを構築した。
実験の結果,照明認識による拡張は,領域シフト下での認識の堅牢性を大幅に向上させることが示された。
- 参考スコア(独自算出の注目度): 0.2366840032676479
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual food recognition systems deployed in real-world environments, such as automated conveyor-belt inspection, are highly sensitive to domain shifts caused by illumination changes. While recent studies have shown that lighting variations can significantly distort food perception by both humans and AI, existing works are often limited to single food categories or controlled settings, and most public food datasets lack explicit illumination annotations. In this work, we investigate illumination-induced domain shift in multi-class food category recognition using two widely adopted datasets, Food-101 and Fruits-360. We demonstrate substantial accuracy degradation under cross-dataset evaluation due to mismatched visual conditions. To address this challenge, we construct synthetic illumination-augmented datasets by systematically varying light temperature and intensity, enabling controlled robustness analysis without additional labels. We further evaluate cross-dataset transfer learning and domain generalization, with a focus on illumination-sensitive target categories such as apple-based classes. Experimental results show that illumination-aware augmentation significantly improves recognition robustness under domain shift while preserving real-time performance. Our findings highlight the importance of illumination robustness and provide practical insights for deploying reliable food recognition systems in real-world inspection scenarios.
- Abstract(参考訳): 自動コンベアベルト検査などの実環境に展開される視覚的食品認識システムは、照明変化による領域シフトに非常に敏感である。
近年の研究では、照明のバリエーションは人間とAIの両方による食品の知覚を著しく歪めることが示されているが、既存の作品は単一の食品カテゴリーや制御された設定に限られており、ほとんどの公共食品データセットには明示的な照明アノテーションがない。
本研究では,多クラス食品カテゴリー認識における照明による領域シフトを,広く採用されている2つのデータセットであるFood-101とFruits-360を用いて検討する。
画像条件のミスマッチにより, データセット間評価において, 精度が著しく低下することが確認できた。
この課題に対処するために,光温度と強度を体系的に変化させて合成照明増強データセットを構築し,ラベルを付加せずに頑健さを制御可能にする。
さらに、アップル系クラスのような照明に敏感なターゲットカテゴリに着目し、クロスデータセット変換学習とドメインの一般化を評価した。
実験結果から,照度認識による拡張は,リアルタイム性能を維持しつつ,ドメインシフト下での認識堅牢性を大幅に向上することが示された。
本研究は,照明の堅牢性の重要性を強調し,実世界の検査シナリオにおいて信頼性の高い食品認識システムを展開するための実践的な洞察を提供するものである。
関連論文リスト
- LLMs-based Augmentation for Domain Adaptation in Long-tailed Food Datasets [54.527878056610156]
食品認識におけるこれらの課題に対処するために,大規模言語モデル(LLM)を用いた枠組みを提案する。
まず LLM を利用して食品イメージを解析し,食品のタイトルや材料を生成する。
そして、生成したテキストと食品の画像を異なるドメインから共有埋め込み空間に投影し、ペアの類似性を最大化する。
論文 参考訳(メタデータ) (2025-11-20T04:38:56Z) - A smart fridge with AI-enabled food computing [0.0]
IoT(Internet of Things)は、特に食品管理において、シームレスな接続性とインテリジェントなホームオートメーションを可能にする上で、重要な役割を担います。
IoTとコンピュータビジョンを統合することで、スマート冷蔵庫はESP32-CAMを使用して、リアルタイム食品検出、在庫追跡、温度監視を通じて食品管理効率を向上させる監視サブシステムを確立する。
論文 参考訳(メタデータ) (2025-09-09T05:29:00Z) - From Canteen Food to Daily Meals: Generalizing Food Recognition to More
Practical Scenarios [92.58097090916166]
DailyFood-172とDailyFood-16という2つの新しいベンチマークを、毎日の食事から食のイメージをキュレートする。
これらの2つのデータセットは、よく計算された食品画像領域から日常的な食品画像領域へのアプローチの伝達性を評価するために使用される。
論文 参考訳(メタデータ) (2024-03-12T08:32:23Z) - NutritionVerse: Empirical Study of Various Dietary Intake Estimation Approaches [59.38343165508926]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。
最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。
我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。
また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文 参考訳(メタデータ) (2023-09-14T13:29:41Z) - Food Image Classification and Segmentation with Attention-based Multiple
Instance Learning [51.279800092581844]
本稿では,食品画像分類とセマンティックセグメンテーションモデルを訓練するための弱教師付き方法論を提案する。
提案手法は、注意に基づくメカニズムと組み合わせて、複数のインスタンス学習アプローチに基づいている。
提案手法の有効性を検証するため,FoodSeg103データセット内の2つのメタクラスについて実験を行った。
論文 参考訳(メタデータ) (2023-08-22T13:59:47Z) - Rethinking Cooking State Recognition with Vision Transformers [0.0]
料理状態認識タスクにおいて視覚変換器(ViT)アーキテクチャの自己保持機構を提案する。
提案したアプローチは、画像から得られたグローバルな健全な特徴をカプセル化するとともに、より大きなデータセットから得られた重みを利用する。
私たちのフレームワークの精度は94.3%で、最先端のフレームワークよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-12-16T17:06:28Z) - A novel illumination condition varied image dataset-Food Vision Dataset
(FVD) for fair and reliable consumer acceptability predictions from food [0.0]
グループは、人間とコンピュータの知覚に対する照明効果を定量化する新しいデータセット、Food Vision dataset(FVD)を提示している。
FVDは3つの異なるパワーで撮影された675の画像と、5日ごとに5つの異なる温度設定で構成されている。
論文 参考訳(メタデータ) (2022-09-14T22:46:42Z) - Does Thermal data make the detection systems more reliable? [1.2891210250935146]
マルチモーダル協調フレームワークに基づく包括的検知システムを提案する。
このフレームワークは、RGB(ビジュアルカメラから)と熱(赤外線カメラから)の両方のデータから学習する。
実験の結果,精度の向上は名目上はいるものの,難易度と難易度は高いことがわかった。
論文 参考訳(メタデータ) (2021-11-09T15:04:34Z) - A Robust Illumination-Invariant Camera System for Agricultural
Applications [7.349727826230863]
オブジェクト検出とセマンティックセグメンテーションは、農業アプリケーションで最も広く採用されているディープラーニングアルゴリズムの2つです。
我々は,全ての照明条件下で一貫した画像を生成する,高スループットな能動照明カメラシステムを提案する。
平均して、オブジェクト検出のためのディープネットは、一貫性のあるデータで訓練され、同様の精度を達成するために4倍近いデータを必要としました。
論文 参考訳(メタデータ) (2021-01-06T18:50:53Z) - ISIA Food-500: A Dataset for Large-Scale Food Recognition via Stacked
Global-Local Attention Network [50.7720194859196]
ウィキペディアのリストから500のカテゴリと399,726の画像を含むデータセットISIA Food-500を紹介する。
このデータセットは、既存の一般的なベンチマークデータセットをカテゴリカバレッジとデータボリュームで上回る。
食品認識のための2つのサブネットワークからなるグローバルローカルアテンションネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T02:48:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。