論文の概要: FoodSky: A Food-oriented Large Language Model that Passes the Chef and Dietetic Examination
- arxiv url: http://arxiv.org/abs/2406.10261v1
- Date: Tue, 11 Jun 2024 01:27:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-19 01:31:17.292353
- Title: FoodSky: A Food-oriented Large Language Model that Passes the Chef and Dietetic Examination
- Title(参考訳): FoodSky:シェフとダイエットテストに合格した食品指向の大規模言語モデル
- Authors: Pengfei Zhou, Weiqing Min, Chaoran Fu, Ying Jin, Mingyu Huang, Xiangyang Li, Shuhuan Mei, Shuqiang Jiang,
- Abstract要約: 食品データを理解するために食品指向の大規模言語モデル(LLM)を導入する。
中国料理の複雑さと典型性を考えると、我々はまず1つの総合的な中華料理コーパス「FoodEarth」を構築した。
そこで我々は,HTRAG(Herarchical Topic Retrieval Augmented Generation)機構とTS3M(Selective State Space Model)を提案する。
- 参考スコア(独自算出の注目度): 37.11551779015218
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Food is foundational to human life, serving not only as a source of nourishment but also as a cornerstone of cultural identity and social interaction. As the complexity of global dietary needs and preferences grows, food intelligence is needed to enable food perception and reasoning for various tasks, ranging from recipe generation and dietary recommendation to diet-disease correlation discovery and understanding. Towards this goal, for powerful capabilities across various domains and tasks in Large Language Models (LLMs), we introduce Food-oriented LLM FoodSky to comprehend food data through perception and reasoning. Considering the complexity and typicality of Chinese cuisine, we first construct one comprehensive Chinese food corpus FoodEarth from various authoritative sources, which can be leveraged by FoodSky to achieve deep understanding of food-related data. We then propose Topic-based Selective State Space Model (TS3M) and the Hierarchical Topic Retrieval Augmented Generation (HTRAG) mechanism to enhance FoodSky in capturing fine-grained food semantics and generating context-aware food-relevant text, respectively. Our extensive evaluations demonstrate that FoodSky significantly outperforms general-purpose LLMs in both chef and dietetic examinations, with an accuracy of 67.2% and 66.4% on the Chinese National Chef Exam and the National Dietetic Exam, respectively. FoodSky not only promises to enhance culinary creativity and promote healthier eating patterns, but also sets a new standard for domain-specific LLMs that address complex real-world issues in the food domain. An online demonstration of FoodSky is available at http://222.92.101.211:8200.
- Abstract(参考訳): 食べ物は人間の生活の基礎であり、栄養源としてだけでなく、文化的アイデンティティや社会的相互作用の基盤としても機能している。
グローバルな食生活のニーズと嗜好の複雑さが増大するにつれて、レシピ生成や食事推奨から食生活と食生活の相関関係の発見や理解まで、食品の認識と推論を可能にするために、食品知性が必要である。
この目標に向けて,Large Language Models (LLMs) における様々なドメインやタスクにまたがる強力な機能を実現するために,食品指向の LLM FoodSky を導入し,食品データの認識と推論を通じて理解する。
中国料理の複雑さと典型性を考慮すると、まず、さまざまな権威ソースから1つの総合的な中華料理コーパス「FoodEarth」を構築し、食品関連データを深く理解するためにFoodSkyが活用する。
そこで,我々は,食品の微細なセマンティクスを捕捉し,コンテキスト対応の食品関連テキストを生成する際に,食品Skyを強化するために,トピックベースの選択状態空間モデル(TS3M)と階層的トピック検索拡張生成(HTRAG)機構を提案する。
以上の結果から,食生活において,食生活は食生活と食生活の両方において,食生活の汎用的LLMよりも有意に優れており,それぞれ67.2%,66.4%が中国食生活と食生活の総合的LLMよりも優れていたことが示唆された。
FoodSkyは、料理の創造性を高め、健康的な食事パターンを促進するだけでなく、食品分野における複雑な現実世界の問題に対処する、ドメイン固有のLLMの新しい標準も設定している。
FoodSkyのオンラインデモはhttp://222.92.101.211:8200で公開されている。
関連論文リスト
- FoodieQA: A Multimodal Dataset for Fine-Grained Understanding of Chinese Food Culture [60.51749998013166]
中国各地の食文化の複雑な特徴を捉えた、きめ細かい画像テキストデータセットであるFoodieQAを紹介する。
視覚言語モデル(VLM)と大規模言語モデル(LLM)を,新たに収集した未確認食品画像およびそれに対応する質問に対して評価する。
以上の結果から,食品とその文化的意味の理解は依然として困難かつ未解明の方向にあることが示唆された。
論文 参考訳(メタデータ) (2024-06-16T17:59:32Z) - NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images [63.314702537010355]
自己申告法はしばしば不正確であり、重大な偏見に悩まされる。
近年、食品画像から栄養情報を予測するためにコンピュータビジョン予測システムを用いた研究が進められている。
本稿では,様々なニューラルネットワークアーキテクチャを活用することにより,食事摂取量推定の有効性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-05-13T14:56:55Z) - NutritionVerse-3D: A 3D Food Model Dataset for Nutritional Intake
Estimation [65.47310907481042]
高齢者の4人に1人は栄養不良です。
機械学習とコンピュータビジョンは、食品の自動栄養トラッキング方法の約束を示す。
NutritionVerse-3Dは、105個の3D食品モデルの大規模な高解像度データセットである。
論文 参考訳(メタデータ) (2023-04-12T05:27:30Z) - Leveraging Automatic Personalised Nutrition: Food Image Recognition Benchmark and Dataset based on Nutrition Taxonomy [14.569887684034061]
本研究では,全国及び国際保健機関の勧告に基づき,食品画像と栄養分類を取り入れた初の栄養データベースを提案する。
AI4Food-NutritionDBは、食品の摂取頻度、品質、分類の観点から、新しい食品コンピューティングアプローチへの扉を開く。
論文 参考訳(メタデータ) (2022-11-14T15:14:50Z) - MenuAI: Restaurant Food Recommendation System via a Transformer-based
Deep Learning Model [15.248362664235845]
本稿では,新しいレストラン料理推薦システムを提案する。
光学文字認識(OCR)技術とトランスフォーマーベースのディープラーニングモデルであるLearning to Rank(LTR)モデルを使用する。
我々のシステムは、入力された検索キー(例えば、カロリー、タンパク質レベル)で食品料理をランク付けすることができる。
論文 参考訳(メタデータ) (2022-10-15T11:45:44Z) - Towards the Creation of a Nutrition and Food Group Based Image Database [58.429385707376554]
栄養・食品群に基づく画像データベースを構築するための枠組みを提案する。
米国農務省食品栄養データベース(FNDDS)における食品群に基づく食品コードリンクプロトコルを設計する。
提案手法は16,114個の食品データセットを含む栄養・食品群に基づく画像データベースを構築するために用いられる。
論文 参考訳(メタデータ) (2022-06-05T02:41:44Z) - Towards Building a Food Knowledge Graph for Internet of Food [66.57235827087092]
食品分類から食品分類、食品知識グラフまで、食品知識組織の進化を概観する。
食品知識グラフは、食品検索と質問回答(QA)、パーソナライズされた食事レコメンデーション、食品分析、可視化において重要な役割を果たす。
食品知識グラフの今後の方向性は、マルチモーダル食品知識グラフや食品インテリジェンスなど、いくつかの分野をカバーする。
論文 参考訳(メタデータ) (2021-07-13T06:26:53Z) - Large Scale Visual Food Recognition [43.43598316339732]
これは2000のカテゴリと100万以上のイメージを持つ、最大規模の食品認識データセットです。
food2kはそれらをカテゴリとイメージの両方で1桁ずつバイパスする。
食品認識のためのディーププログレッシブ領域強化ネットワークを提案します。
論文 参考訳(メタデータ) (2021-03-30T06:41:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。