論文の概要: Deep learning approaches in food recognition
- arxiv url: http://arxiv.org/abs/2004.03357v2
- Date: Wed, 8 Apr 2020 08:44:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 22:51:19.559457
- Title: Deep learning approaches in food recognition
- Title(参考訳): 食品認識における深層学習アプローチ
- Authors: Chairi Kiourt, George Pavlidis, Stella Markantonatou
- Abstract要約: 本章は、画像に基づく食品認識に適用されたいくつかの一般的なアプローチと技法の提示に焦点を当てる。
スクラッチからの設計、トランスファーラーニング、プラットフォームベースのアプローチの3つの主なソリューションが概説されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic image-based food recognition is a particularly challenging task.
Traditional image analysis approaches have achieved low classification accuracy
in the past, whereas deep learning approaches enabled the identification of
food types and their ingredients. The contents of food dishes are typically
deformable objects, usually including complex semantics, which makes the task
of defining their structure very difficult. Deep learning methods have already
shown very promising results in such challenges, so this chapter focuses on the
presentation of some popular approaches and techniques applied in image-based
food recognition. The three main lines of solutions, namely the design from
scratch, the transfer learning and the platform-based approaches, are outlined,
particularly for the task at hand, and are tested and compared to reveal the
inherent strengths and weaknesses. The chapter is complemented with basic
background material, a section devoted to the relevant datasets that are
crucial in light of the empirical approaches adopted, and some concluding
remarks that underline the future directions.
- Abstract(参考訳): 画像に基づく食品の自動認識は特に難しい課題だ。
従来の画像解析手法では分類精度が低かったが,深層学習では食品の種類や成分の同定が可能であった。
料理の内容は、通常変形可能なオブジェクトであり、複雑な意味論を含んでいるため、構造を定義する作業は非常に困難である。
深層学習の手法はすでにこのような課題において有望な成果を上げており、この章では、画像に基づく食品認識に適用された一般的なアプローチと技法の提示に焦点を当てている。
スクラッチからの設計、トランスファーラーニング、プラットフォームベースのアプローチの3つの主なソリューションは、特に目前にあるタスクのために概説され、固有の強みと弱点を明らかにするためにテストされ、比較される。
この章は基本的な背景資料と、採用される経験的アプローチに照らして重要な関連するデータセットを専門とするセクションと、将来の方向性を下記した発言を補完するものである。
関連論文リスト
- Shape-Preserving Generation of Food Images for Automatic Dietary Assessment [1.602820210496921]
条件付き食品画像生成のための簡単なGANベースのニューラルネットワークアーキテクチャを提案する。
生成された画像中の食品や容器の形状は、参照入力画像の形状とよく似ている。
論文 参考訳(メタデータ) (2024-08-23T20:18:51Z) - Understanding the Limitations of Diffusion Concept Algebra Through Food [68.48103545146127]
潜伏拡散モデルは バイアスと概念の関係に 重要な洞察を与えます
食品分野は、複雑な組成と地域バイアスを通じて、ユニークな課題を提供する。
我々は、料理の多様性のニュアンスを捉え、表現するモデルの能力に関する測定可能な洞察を明らかにする。
論文 参考訳(メタデータ) (2024-06-05T18:57:02Z) - Food Image Classification and Segmentation with Attention-based Multiple
Instance Learning [51.279800092581844]
本稿では,食品画像分類とセマンティックセグメンテーションモデルを訓練するための弱教師付き方法論を提案する。
提案手法は、注意に基づくメカニズムと組み合わせて、複数のインスタンス学習アプローチに基づいている。
提案手法の有効性を検証するため,FoodSeg103データセット内の2つのメタクラスについて実験を行った。
論文 参考訳(メタデータ) (2023-08-22T13:59:47Z) - Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2023-06-15T15:38:10Z) - Self-Supervised Visual Representation Learning on Food Images [6.602838826255494]
既存の深層学習手法は、食品画像の人間のアノテーションに基づいて、下流タスクの視覚的表現を学習する。
実生活のほとんどの食品画像はラベルなしで取得され、データアノテーションには多くの時間と人的労力が必要です。
本稿では,食品画像における自己指導型学習手法の実装と分析に焦点をあてる。
論文 参考訳(メタデータ) (2023-03-16T02:31:51Z) - Rethinking Cooking State Recognition with Vision Transformers [0.0]
料理状態認識タスクにおいて視覚変換器(ViT)アーキテクチャの自己保持機構を提案する。
提案したアプローチは、画像から得られたグローバルな健全な特徴をカプセル化するとともに、より大きなデータセットから得られた重みを利用する。
私たちのフレームワークの精度は94.3%で、最先端のフレームワークよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-12-16T17:06:28Z) - Self-Supervised Representation Learning: Introduction, Advances and
Challenges [125.38214493654534]
自己教師付き表現学習手法は、大きな注釈付きデータセットを必要とせずに強力な機能学習を提供することを目的としている。
本稿では、この活気ある領域について、鍵となる概念、アプローチの4つの主要なファミリーと関連する技術の状態、そして、データの多様性に自己監督手法を適用する方法について紹介する。
論文 参考訳(メタデータ) (2021-10-18T13:51:22Z) - Deep Long-Tailed Learning: A Survey [163.16874896812885]
ディープ・ロングテール・ラーニング(Deep Long-tailed Learning)は、長いテールのクラス分布に追従する多数の画像から、優れたパフォーマンスのディープモデルをトレーニングすることを目的としている。
長い尾を持つクラス不均衡は、現実的な視覚認識タスクにおいて一般的な問題である。
本稿では,近年の長期学習の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2021-10-09T15:25:22Z) - Online Continual Learning For Visual Food Classification [7.704949298975352]
既存の方法はトレーニングのために静的なデータセットを必要としており、シーケンシャルに利用可能な新しい食品画像から学ぶことができない。
本稿では,各学習食品に含まれる最も代表的なデータを格納するための,クラスタリングに基づく模範選択アルゴリズムを提案する。
その結果,既存のオンライン連続学習手法と比較して,大幅な改善が見られた。
論文 参考訳(メタデータ) (2021-08-15T17:48:03Z) - Cross-Modal Food Retrieval: Learning a Joint Embedding of Food Images
and Recipes with Semantic Consistency and Attention Mechanism [70.85894675131624]
画像とレシピを共通の特徴空間に埋め込み、対応する画像とレシピの埋め込みが互いに近接するように学習する。
本稿では,2つのモダリティの埋め込みを正規化するためのセマンティック・一貫性とアテンション・ベース・ネットワーク(SCAN)を提案する。
食品画像や調理レシピの最先端のクロスモーダル検索戦略を,かなりの差で達成できることが示される。
論文 参考訳(メタデータ) (2020-03-09T07:41:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。