論文の概要: CiMRAG: CiM-Aware Domain-Adaptive and Noise-Resilient Retrieval-Augmented Generation for Edge-Based LLMs
- arxiv url: http://arxiv.org/abs/2601.20041v2
- Date: Fri, 30 Jan 2026 10:00:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 14:22:45.222816
- Title: CiMRAG: CiM-Aware Domain-Adaptive and Noise-Resilient Retrieval-Augmented Generation for Edge-Based LLMs
- Title(参考訳): CiMRAG:エッジベースLLMのためのCiM対応型ドメイン適応型・耐雑音性検索型ジェネレーション
- Authors: Shih-Hsuan Chiu, Ming-Syan Chen,
- Abstract要約: Retrieval-Augmented Generation (RAG)は、関連するプロファイルデータを検索し、調整された応答を生成することでパーソナライズするための重要な方法である。
計算メモリ(CiM)アーキテクチャは、メモリと処理ユニット間のデータ移動をin-situ操作によって排除することで、このボトルネックを軽減する。
本稿では,雑音環境におけるRAGのノイズおよびドメイン適応性を改善するフレームワークである,タスク指向型ノイズ-レジリエントな埋め込み学習を提案する。
- 参考スコア(独自算出の注目度): 10.372308692379404
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Personalized virtual assistants powered by large language models (LLMs) on edge devices are attracting growing attention, with Retrieval-Augmented Generation (RAG) emerging as a key method for personalization by retrieving relevant profile data and generating tailored responses. However, deploying RAG on edge devices faces efficiency hurdles due to the rapid growth of profile data, such as user-LLM interactions and recent updates. While Computing-in-Memory (CiM) architectures mitigate this bottleneck by eliminating data movement between memory and processing units via in-situ operations, they are susceptible to environmental noise that can degrade retrieval precision. This poses a critical issue in dynamic, multi-domain edge-based scenarios (e.g., travel, medicine, and law) where both accuracy and adaptability are paramount. To address these challenges, we propose Task-Oriented Noise-resilient Embedding Learning (TONEL), a framework that improves noise robustness and domain adaptability for RAG in noisy edge environments. TONEL employs a noise-aware projection model to learn task-specific embeddings compatible with CiM hardware constraints, enabling accurate retrieval under noisy conditions. Extensive experiments conducted on personalization benchmarks demonstrate the effectiveness and practicality of our methods relative to strong baselines, especially in task-specific noisy scenarios.
- Abstract(参考訳): エッジデバイス上での大規模言語モデル(LLM)を活用したパーソナライズされた仮想アシスタントが注目を集めており、関連するプロファイルデータを取得して適切な応答を生成することにより、パーソナライズのための重要な方法として、Retrieval-Augmented Generation(RAG)が登場している。
しかしながら、エッジデバイスにRAGをデプロイすることは、ユーザ-LLMインタラクションや最近のアップデートなど、プロファイルデータの急速な増加による効率上のハードルに直面している。
メモリ・イン・メモリ(CiM)アーキテクチャはメモリと処理ユニット間のデータ移動をその場操作で排除することでこのボトルネックを緩和するが、検索精度を低下させる環境ノイズの影響を受けやすい。
これは、正確性と適応性の両方が最重要である、動的でマルチドメインのエッジベースのシナリオ(例えば、旅行、医学、法則)において、重要な問題を引き起こします。
これらの課題に対処するため,ノイズの堅牢性とRAGのドメイン適応性を向上させるフレームワークであるタスク指向型ノイズ-レジリエント・エンベディング・ラーニング(TONEL)を提案する。
TONELは、CiMハードウェア制約に適合するタスク固有の埋め込みを学習するためにノイズ対応プロジェクションモデルを使用し、ノイズの多い条件下で正確な検索を可能にする。
パーソナライズベンチマークで行った大規模な実験は、特にタスク固有のノイズのシナリオにおいて、強いベースラインに対する手法の有効性と実用性を示した。
関連論文リスト
- MANTRA: a Framework for Multi-stage Adaptive Noise TReAtment During Training [3.619444603816032]
大規模リポジトリでは、ノイズやラベルの誤りによって、正確性と堅牢性の両方を低下させている。
本稿では,音の診断と緩和を微調整プロセスに直接組み込む多段階適応ノイズTReAtmentフレームワークMANTRAを提案する。
論文 参考訳(メタデータ) (2025-12-03T23:09:55Z) - FAIM: Frequency-Aware Interactive Mamba for Time Series Classification [87.84511960413715]
時系列分類(TSC)は、環境モニタリング、診断、姿勢認識など、多くの実世界の応用において重要である。
本稿では,周波数対応対話型マンバモデルであるFAIMを提案する。
FAIMは既存の最先端(SOTA)手法を一貫して上回り、精度と効率のトレードオフが優れていることを示す。
論文 参考訳(メタデータ) (2025-11-26T08:36:33Z) - Joint Learning using Mixture-of-Expert-Based Representation for Enhanced Speech Generation and Robust Emotion Recognition [54.44798086835314]
音声感情認識(SER)は感情認識音声システム構築において重要な役割を担っているが,その性能は雑音下で著しく低下する。
本稿では, フレームワイド・エキスパート・ルーティングを自己教師付き音声表現に応用した, フレキシブルMTLフレームワークSparse Mixture-of-Experts Representation Integration Technique (Sparse MERIT)を提案する。
MSP-Podcastコーパスの実験では、Sparse MERITはSERとSEの両方のタスクのベースラインモデルより一貫して優れていた。
論文 参考訳(メタデータ) (2025-09-10T10:18:56Z) - Reliable Few-shot Learning under Dual Noises [166.53173694689693]
そこで我々はDETA++(Denoized Task Adaptation)を提案する。
DETA++はメモリバンクを使用して、各インナータスククラスのクリーンなリージョンを格納し、精製する。
大規模な実験は、DETA++の有効性と柔軟性を示している。
論文 参考訳(メタデータ) (2025-06-19T14:05:57Z) - Automatically Identify and Rectify: Robust Deep Contrastive Multi-view Clustering in Noisy Scenarios [76.02688769599686]
本稿では,AIRMVCと呼ばれるノイズデータの自動識別と修正のための新しいマルチビュークラスタリングフレームワークを提案する。
具体的には,GMMを用いて雑音識別を異常識別問題として再構成する。
次に,同定結果に基づいて,ノイズデータの悪影響を軽減するためのハイブリッド補正戦略を設計する。
論文 参考訳(メタデータ) (2025-05-27T16:16:54Z) - Edge-preserving Image Denoising via Multi-scale Adaptive Statistical Independence Testing [2.8724598079549715]
マルチスケール適応独立性テストに基づくエッジ検出・デノイング(EDD-MAIT)を提案する。
EDD-MAITはチャンネルアテンション機構と独立テストを統合している。
Fスコア、MSE、PSNR、ランタイムの削減など、堅牢性、正確性、効率性の向上を実現している。
論文 参考訳(メタデータ) (2025-05-02T06:09:32Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - One-step Noisy Label Mitigation [86.57572253460125]
ノイズラベルのトレーニング過程に対する有害な影響の軽減がますます重要になっている。
モデルに依存しないノイズラベル緩和パラダイムである1ステップアンチノイズ(OSA)を提案する。
我々はOSAの優位性を実証的に実証し、トレーニングの堅牢性の向上、タスク転送性の向上、デプロイメントの容易性、計算コストの削減を強調した。
論文 参考訳(メタデータ) (2024-10-02T18:42:56Z) - Effective Noise-aware Data Simulation for Domain-adaptive Speech Enhancement Leveraging Dynamic Stochastic Perturbation [25.410770364140856]
クロスドメイン音声強調(SE)は、目に見えない対象領域におけるノイズや背景情報の不足により、しばしば深刻な課題に直面している。
本研究では,ノイズ抽出技術とGANを利用した新しいデータシミュレーション手法を提案する。
本研究では,動的摂動の概念を導入し,制御された摂動を推論中の雑音埋め込みに注入する。
論文 参考訳(メタデータ) (2024-09-03T02:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。