論文の概要: Dual-Imbalance Continual Learning for Real-World Food Recognition
- arxiv url: http://arxiv.org/abs/2603.29133v1
- Date: Tue, 31 Mar 2026 01:32:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:02.98787
- Title: Dual-Imbalance Continual Learning for Real-World Food Recognition
- Title(参考訳): 実世界の食品認識のための二重不均衡連続学習
- Authors: Xiaoyan Zhang, Jiangpeng He,
- Abstract要約: DIMEは、食品の連続認識のためのデュアル・イムバランスを意識したアダプタ・マージングフレームワークである。
ステップ不均衡な設定下でのリアルな長期食品ベンチマーク実験により、提案手法は、既存の最強の学習ベースラインよりも、一貫して3%以上改善されていることが示された。
- 参考スコア(独自算出の注目度): 15.73921281192878
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual food recognition in real-world dietary logging scenarios naturally exhibits severe data imbalance, where a small number of food categories appear frequently while many others occur rarely, resulting in long-tailed class distributions. In practice, food recognition systems often operate in a continual learning setting, where new categories are introduced sequentially over time. However, existing studies typically assume that each incremental step introduces a similar number of new food classes, which rarely happens in real world where the number of newly observed categories can vary significantly across steps, leading to highly uneven learning dynamics. As a result, continual food recognition exhibits a dual imbalance: imbalanced samples within each food class and imbalanced numbers of new food classes to learn at each incremental learning step. In this work, we introduce DIME, a Dual-Imbalance-aware Adapter Merging framework for continual food recognition. DIME learns lightweight adapters for each task using parameter-efficient fine-tuning and progressively integrates them through a class-count guided spectral merging strategy. A rank-wise threshold modulation mechanism further stabilizes the merging process by preserving dominant knowledge while allowing adaptive updates. The resulting model maintains a single merged adapter for inference, enabling efficient deployment without accumulating task-specific modules. Experiments on realistic long-tailed food benchmarks under our step-imbalanced setup show that the proposed method consistently improves by more than 3% over the strongest existing continual learning baselines. Code is available at https://github.com/xiaoyanzhang1/DIME.
- Abstract(参考訳): 実世界の食物検食シナリオにおける視覚的食品認識は、自然に深刻なデータ不均衡を示し、少数の食品カテゴリーが頻繁に出現する一方で、多くの食品が稀に出現し、長い列の分布をもたらす。
実際には、食品認識システムは、時間とともに新しいカテゴリーが順次導入される連続的な学習環境で運用されることが多い。
しかし、既存の研究は、各段階が同様の数の新しい食品クラスを導入すると仮定しており、このクラスは、新しく観察されたカテゴリーの数がステップによって大きく異なるため、非常に不均一な学習のダイナミクスをもたらすことは稀である。
その結果、連続した食品認識は、各食品クラス内の不均衡なサンプルと、各漸進的な学習ステップで学習する新しい食品クラスの不均衡な数と、二重不均衡を示す。
本研究は,食品認識のためのDIME(Dual-Imbalance-aware Adapter Merging)フレームワークについて紹介する。
DIMEはパラメータ効率の良い微調整を用いて各タスク用の軽量アダプタを学習し、クラスカウントによるスペクトルマージ戦略を通じて徐々に統合する。
ランクワイドしきい値変調機構は、適応的な更新を許容しつつ、支配的な知識を保ち、マージプロセスをさらに安定化する。
結果として得られたモデルは、推論のための単一のマージアダプタを保持し、タスク固有のモジュールを蓄積することなく、効率的なデプロイを可能にする。
ステップ不均衡な設定下でのリアルな長期食品ベンチマーク実験により、提案手法は、既存の最強の学習ベースラインよりも、一貫して3%以上改善されていることが示された。
コードはhttps://github.com/xiaoyanzhang1/DIMEで入手できる。
関連論文リスト
- Continual Learning for Food Category Classification Dataset: Enhancing Model Adaptability and Performance [0.9480662172227129]
テキスト誘導食品分類のための連続学習フレームワークを提案する。
提案手法は,事前知識を劣化させることなく,新たなカテゴリを統合可能なインクリメンタルアップデートを実現する。
このデザインは食品の適応的認識を約束するもので、食生活のモニタリングやパーソナライズされた栄養計画に応用されている。
論文 参考訳(メタデータ) (2026-03-20T04:03:53Z) - Bagging-Based Model Merging for Robust General Text Embeddings [73.51674133699196]
汎用テキスト埋め込みモデルは、幅広いNLPおよび情報検索アプリケーションを支える。
本稿では,データスケジューリングとモデルマージという2つの観点から,テキスト埋め込みのためのマルチタスク学習の体系的研究を行う。
本稿では,Baging ベースの rObust mOdel Merging (BOOM) を提案する。
論文 参考訳(メタデータ) (2026-02-05T15:45:08Z) - LLMs-based Augmentation for Domain Adaptation in Long-tailed Food Datasets [54.527878056610156]
食品認識におけるこれらの課題に対処するために,大規模言語モデル(LLM)を用いた枠組みを提案する。
まず LLM を利用して食品イメージを解析し,食品のタイトルや材料を生成する。
そして、生成したテキストと食品の画像を異なるドメインから共有埋め込み空間に投影し、ペアの類似性を最大化する。
論文 参考訳(メタデータ) (2025-11-20T04:38:56Z) - DRL: Discriminative Representation Learning with Parallel Adapters for Class Incremental Learning [63.65467569295623]
本稿では,これらの課題に対処するための差別的表現学習(DRL)フレームワークを提案する。
逐次学習を効果的かつ効率的に行うために、DRLのネットワークはPTM上に構築される。
我々のDRLは、CIL時代を通して、他の最先端の手法よりも一貫して優れています。
論文 参考訳(メタデータ) (2025-10-14T03:19:15Z) - Classifier-guided Gradient Modulation for Enhanced Multimodal Learning [50.7008456698935]
Gradient-Guided Modulation (CGGM) は,マルチモーダル学習と勾配のバランスをとる新しい手法である。
UPMC-Food 101, CMU-MOSI, IEMOCAP, BraTSの4つのマルチモーダルデータセットについて広範な実験を行った。
CGGMはすべてのベースラインや最先端のメソッドを一貫して上回る。
論文 参考訳(メタデータ) (2024-11-03T02:38:43Z) - Rethinking Classifier Re-Training in Long-Tailed Recognition: A Simple
Logits Retargeting Approach [102.0769560460338]
我々は,クラスごとのサンプル数に関する事前知識を必要とせず,シンプルなロジットアプローチ(LORT)を開発した。
提案手法は,CIFAR100-LT, ImageNet-LT, iNaturalist 2018など,様々な不均衡データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-01T03:27:08Z) - Food Image Classification and Segmentation with Attention-based Multiple
Instance Learning [51.279800092581844]
本稿では,食品画像分類とセマンティックセグメンテーションモデルを訓練するための弱教師付き方法論を提案する。
提案手法は、注意に基づくメカニズムと組み合わせて、複数のインスタンス学習アプローチに基づいている。
提案手法の有効性を検証するため,FoodSeg103データセット内の2つのメタクラスについて実験を行った。
論文 参考訳(メタデータ) (2023-08-22T13:59:47Z) - Long-Tailed Continual Learning For Visual Food Recognition [8.246111678466717]
包括的アノテーションとともに、186のアメリカ食品を含むデータセットを紹介した。
本稿では, 食品クラスにおける一般化能力を向上する新しいエンドツーエンドフレームワークを提案する。
本手法は,Food101-LT,VFN-LT,VFN186-LT,VFN186-INSULIN,VFN186-T2DMで評価され,既存の方法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-07-01T00:55:05Z) - Online Class-Incremental Learning For Real-World Food Image
Classification [8.438092346233054]
文化的、経済的、個人的影響によって形成された実世界の食品消費パターンは、動的かつ進化的なデータを含んでいる。
Online Class Incremental Learning (OCIL)は、シングルパスのデータストリームから継続的に学習するという課題に対処する。
本稿では,既存のER法用に設計された動的モデル更新モジュールについて述べる。
論文 参考訳(メタデータ) (2023-01-12T19:00:27Z) - Long-tailed Food Classification [5.874935571318868]
本稿では,フード101-LTとVFN-LTを含む長期食品分類のための2つの新しいベンチマークデータセットを提案する。
本稿では,(1)本級における授業不均衡問題に対処する新しい2相枠組みを提案し,知識蒸留による学習情報の保持とともに冗長なサンプルを除去する。
本手法の有効性は,既存の最先端のロングテール分類法と比較し,Food101-LTとVFN-LTのベンチマークにおいて改善された性能を示す。
論文 参考訳(メタデータ) (2022-10-26T14:29:30Z) - Online Continual Learning For Visual Food Classification [7.704949298975352]
既存の方法はトレーニングのために静的なデータセットを必要としており、シーケンシャルに利用可能な新しい食品画像から学ぶことができない。
本稿では,各学習食品に含まれる最も代表的なデータを格納するための,クラスタリングに基づく模範選択アルゴリズムを提案する。
その結果,既存のオンライン連続学習手法と比較して,大幅な改善が見られた。
論文 参考訳(メタデータ) (2021-08-15T17:48:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。