論文の概要: FoodLogAthl-218: Constructing a Real-World Food Image Dataset Using Dietary Management Applications
- arxiv url: http://arxiv.org/abs/2512.14574v1
- Date: Tue, 16 Dec 2025 16:43:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.797853
- Title: FoodLogAthl-218: Constructing a Real-World Food Image Dataset Using Dietary Management Applications
- Title(参考訳): FoodLogAthl-218:食事管理アプリケーションを用いた実世界の食品画像データセットの構築
- Authors: Mitsuki Watanabe, Sosuke Amano, Kiyoharu Aizawa, Yoko Yamakata,
- Abstract要約: FoodLogAthl-218は、FoodLog Athlを通じて収集された実世界の食事記録から構築された食品画像データセットである。
データセットには218の食品カテゴリにわたる6,925のイメージが含まれており、合計で14,349のバウンディングボックスがある。
- 参考スコア(独自算出の注目度): 23.279120449375412
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Food image classification models are crucial for dietary management applications because they reduce the burden of manual meal logging. However, most publicly available datasets for training such models rely on web-crawled images, which often differ from users' real-world meal photos. In this work, we present FoodLogAthl-218, a food image dataset constructed from real-world meal records collected through the dietary management application FoodLog Athl. The dataset contains 6,925 images across 218 food categories, with a total of 14,349 bounding boxes. Rich metadata, including meal date and time, anonymized user IDs, and meal-level context, accompany each image. Unlike conventional datasets-where a predefined class set guides web-based image collection-our data begins with user-submitted photos, and labels are applied afterward. This yields greater intra-class diversity, a natural frequency distribution of meal types, and casual, unfiltered images intended for personal use rather than public sharing. In addition to (1) a standard classification benchmark, we introduce two FoodLog-specific tasks: (2) an incremental fine-tuning protocol that follows the temporal stream of users' logs, and (3) a context-aware classification task where each image contains multiple dishes, and the model must classify each dish by leveraging the overall meal context. We evaluate these tasks using large multimodal models (LMMs). The dataset is publicly available at https://huggingface.co/datasets/FoodLog/FoodLogAthl-218.
- Abstract(参考訳): 食品画像分類モデルは、手作業による食事記録の負担を軽減するため、食事管理アプリケーションにとって重要である。
しかしながら、そのようなモデルをトレーニングするためのほとんどの公開データセットは、ユーザの実際の食事写真とは異なる、Webcrawledイメージに依存している。
本稿では,食事管理アプリケーションであるFoodLog Athlを通じて収集された実世界の食事記録から構築した食品画像データセットであるFoodLogAthl-218について述べる。
データセットには218の食品カテゴリにわたる6,925のイメージが含まれており、合計で14,349のバウンディングボックスがある。
食事の日付と時間、匿名化されたユーザーID、食事レベルのコンテキストを含む豊富なメタデータは、各画像に付随する。
従来のデータセットとは異なり、定義済みのクラスセットは、Webベースのイメージコレクションーアデータをユーザから送信された写真から開始し、その後ラベルが適用される。
これにより、クラス内での多様性が向上し、食事の種類が自然に分布し、公的な共有よりも個人用に意図された、カジュアルで未濾過の画像が得られる。
1)標準分類基準に加えて,(2)ユーザのログの時間的流れを追従するインクリメンタルな微調整プロトコル,(3)各画像が複数の料理を含むコンテキスト対応分類タスク,そして,そのモデルが食事のコンテキスト全体を活用することで各料理を分類する必要がある。
大規模マルチモーダルモデル(LMM)を用いてこれらのタスクを評価する。
データセットはhttps://huggingface.co/datasets/FoodLog/FoodLogAthl-218で公開されている。
関連論文リスト
- LLMs-based Augmentation for Domain Adaptation in Long-tailed Food Datasets [54.527878056610156]
食品認識におけるこれらの課題に対処するために,大規模言語モデル(LLM)を用いた枠組みを提案する。
まず LLM を利用して食品イメージを解析し,食品のタイトルや材料を生成する。
そして、生成したテキストと食品の画像を異なるドメインから共有埋め込み空間に投影し、ペアの類似性を最大化する。
論文 参考訳(メタデータ) (2025-11-20T04:38:56Z) - From Canteen Food to Daily Meals: Generalizing Food Recognition to More
Practical Scenarios [92.58097090916166]
DailyFood-172とDailyFood-16という2つの新しいベンチマークを、毎日の食事から食のイメージをキュレートする。
これらの2つのデータセットは、よく計算された食品画像領域から日常的な食品画像領域へのアプローチの伝達性を評価するために使用される。
論文 参考訳(メタデータ) (2024-03-12T08:32:23Z) - NutritionVerse-Real: An Open Access Manually Collected 2D Food Scene
Dataset for Dietary Intake Estimation [68.49526750115429]
食事摂取推定のための2D食品シーンデータセットであるNutritionVerse-Realを導入する。
NutritionVerse-Realデータセットは、実生活における食品シーンのイメージを手作業で収集し、各成分の重量を測定し、各料理の食生活内容を計算することによって作成されました。
論文 参考訳(メタデータ) (2023-11-20T11:05:20Z) - Personalized Food Image Classification: Benchmark Datasets and New
Baseline [8.019925729254178]
本稿では、自己教師付き学習と時間的特徴情報を活用することにより、個人化された食品画像分類のための新しい枠組みを提案する。
提案手法は両方のベンチマークデータセットで評価され,既存手法と比較して性能が向上した。
論文 参考訳(メタデータ) (2023-09-15T20:11:07Z) - Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2023-06-15T15:38:10Z) - Self-Supervised Visual Representation Learning on Food Images [6.602838826255494]
既存の深層学習手法は、食品画像の人間のアノテーションに基づいて、下流タスクの視覚的表現を学習する。
実生活のほとんどの食品画像はラベルなしで取得され、データアノテーションには多くの時間と人的労力が必要です。
本稿では,食品画像における自己指導型学習手法の実装と分析に焦点をあてる。
論文 参考訳(メタデータ) (2023-03-16T02:31:51Z) - Towards the Creation of a Nutrition and Food Group Based Image Database [58.429385707376554]
栄養・食品群に基づく画像データベースを構築するための枠組みを提案する。
米国農務省食品栄養データベース(FNDDS)における食品群に基づく食品コードリンクプロトコルを設計する。
提案手法は16,114個の食品データセットを含む栄養・食品群に基づく画像データベースを構築するために用いられる。
論文 参考訳(メタデータ) (2022-06-05T02:41:44Z) - A Large-Scale Benchmark for Food Image Segmentation [62.28029856051079]
我々は9,490枚の画像を含む新しい食品画像データセットFoodSeg103(およびその拡張FoodSeg154)を構築します。
これらの画像に154種類の成分を付加し,各画像は平均6つの成分ラベルと画素単位のマスクを有する。
ReLeMと呼ばれるマルチモダリティプリトレーニングアプローチを提案し、豊富なセマンティックな食品知識を持つセグメンテーションモデルを明確に装備します。
論文 参考訳(メタデータ) (2021-05-12T03:00:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。