論文の概要: Khana: A Comprehensive Indian Cuisine Dataset
- arxiv url: http://arxiv.org/abs/2509.06006v1
- Date: Sun, 07 Sep 2025 10:43:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.813393
- Title: Khana: A Comprehensive Indian Cuisine Dataset
- Title(参考訳): Khana: 総合的なインド料理データセット
- Authors: Omkar Prabhu,
- Abstract要約: Khanaは、インド料理からの料理の分類、セグメンテーション、検索のための新しいベンチマークデータセットである。
Khanaはこのギャップを埋めるために、インド料理の分類を確立し、80のラベルにまたがるデータセットに約131Kの画像を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As global interest in diverse culinary experiences grows, food image models are essential for improving food-related applications by enabling accurate food recognition, recipe suggestions, dietary tracking, and automated meal planning. Despite the abundance of food datasets, a noticeable gap remains in capturing the nuances of Indian cuisine due to its vast regional diversity, complex preparations, and the lack of comprehensive labeled datasets that cover its full breadth. Through this exploration, we uncover Khana, a new benchmark dataset for food image classification, segmentation, and retrieval of dishes from Indian cuisine. Khana fills the gap by establishing a taxonomy of Indian cuisine and offering around 131K images in the dataset spread across 80 labels, each with a resolution of 500x500 pixels. This paper describes the dataset creation process and evaluates state-of-the-art models on classification, segmentation, and retrieval as baselines. Khana bridges the gap between research and development by providing a comprehensive and challenging benchmark for researchers while also serving as a valuable resource for developers creating real-world applications that leverage the rich tapestry of Indian cuisine. Webpage: https://khana.omkar.xyz
- Abstract(参考訳): 多様な食体験へのグローバルな関心が高まるにつれて、食品画像モデルは、正確な食品認識、レシピの提案、食事追跡、自動食事計画を可能にすることによって、食品関連アプリケーションを改善するために不可欠である。
食品データセットの豊富さにもかかわらず、インド料理の多様性、複雑な準備、広さをカバーする包括的ラベル付きデータセットの欠如などにより、インド料理のニュアンスをとらえる大きなギャップが残っている。
この調査を通じて、インド料理からの料理の分類、セグメンテーション、検索のための新しいベンチマークデータセットであるKhanaを明らかにした。
Khanaは、インド料理の分類を確立し、80のラベルにまたがるデータセットに約131Kの画像を提供し、それぞれ500×500ピクセルの解像度でギャップを埋める。
本稿では,データセット作成プロセスについて述べるとともに,分類,セグメンテーション,検索の最先端モデルをベースラインとして評価する。
Khanaは、研究者に包括的で挑戦的なベンチマークを提供することで、研究と開発の間のギャップを埋めると同時に、インド料理の豊富なタペストリーを活用する現実世界のアプリケーションを開発する開発者にとって、貴重なリソースとなっている。
Webページ: https://khana.omkar.xyz
関連論文リスト
- Enhancing FKG.in: automating Indian food composition analysis [2.334669361092524]
本稿では,インド料理の食品組成データを知識グラフを用いて計算する手法を提案する。
栄養データアグリゲーション、食品組成分析、LLM強化情報解決といった機能について説明する。
次に、構造、多言語主義、不確実性といった次元にわたってインドのレシピ情報を分析するという複雑な課題について検討する。
論文 参考訳(メタデータ) (2024-12-06T18:27:15Z) - MetaFood3D: 3D Food Dataset with Nutrition Values [52.16894900096017]
このデータセットは、131のカテゴリにまたがって、743の精細にスキャンされ、ラベル付けされた3D食品オブジェクトで構成されている。
我々のMetaFood3Dデータセットはクラス内の多様性を重視しており、テクスチャメッシュファイル、RGB-Dビデオ、セグメンテーションマスクなどのリッチなモダリティを含んでいる。
論文 参考訳(メタデータ) (2024-09-03T15:02:52Z) - Building FKG.in: a Knowledge Graph for Indian Food [2.339288371903242]
本研究では,インド料理の料理情報を知識グラフの形で同化する自動システムを構築した。
我々は、AI、LLM、言語技術を用いて、パブリックドメインのレシピブログサイトから情報をキュレートする新しいワークフローを提案する。
設計はアプリケーションに依存しず、AI駆動のスマート分析、パーソナライズドデジタルヘルスのためのレコメンデーションシステム構築に使用することができる。
論文 参考訳(メタデータ) (2024-09-01T20:18:36Z) - FoodieQA: A Multimodal Dataset for Fine-Grained Understanding of Chinese Food Culture [60.51749998013166]
中国各地の食文化の複雑な特徴を,手作業でキュレートした,きめ細かい画像テキストデータセットであるFoodieQAを紹介した。
視覚言語モデル(VLM)と大規模言語モデル(LLM)を,新たに収集した未確認食品画像およびそれに対応する質問に対して評価する。
以上の結果から,食品とその文化的意味の理解は依然として困難かつ未解明の方向にあることが示唆された。
論文 参考訳(メタデータ) (2024-06-16T17:59:32Z) - Towards Building a Food Knowledge Graph for Internet of Food [66.57235827087092]
食品分類から食品分類、食品知識グラフまで、食品知識組織の進化を概観する。
食品知識グラフは、食品検索と質問回答(QA)、パーソナライズされた食事レコメンデーション、食品分析、可視化において重要な役割を果たす。
食品知識グラフの今後の方向性は、マルチモーダル食品知識グラフや食品インテリジェンスなど、いくつかの分野をカバーする。
論文 参考訳(メタデータ) (2021-07-13T06:26:53Z) - ISIA Food-500: A Dataset for Large-Scale Food Recognition via Stacked
Global-Local Attention Network [50.7720194859196]
ウィキペディアのリストから500のカテゴリと399,726の画像を含むデータセットISIA Food-500を紹介する。
このデータセットは、既存の一般的なベンチマークデータセットをカテゴリカバレッジとデータボリュームで上回る。
食品認識のための2つのサブネットワークからなるグローバルローカルアテンションネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T02:48:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。