論文の概要: MeMemo: On-device Retrieval Augmentation for Private and Personalized Text Generation
- arxiv url: http://arxiv.org/abs/2407.01972v1
- Date: Tue, 2 Jul 2024 06:08:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-03 16:34:10.856808
- Title: MeMemo: On-device Retrieval Augmentation for Private and Personalized Text Generation
- Title(参考訳): MeMemo: プライベートおよびパーソナライズされたテキスト生成のためのオンデバイス検索拡張
- Authors: Zijie J. Wang, Duen Horng Chau,
- Abstract要約: 我々はMeMemoを紹介した。MeMemoは最先端に近い近接検索技術であるHNSWをブラウザ環境に適用する最初のオープンソースのJavaScriptツールキットである。
MeMemoは、プライベートでパーソナライズされたコンテンツ作成やインタラクティブなプロトタイピングなど、エキサイティングな新しいデザインと研究の機会を提供する。
- 参考スコア(独自算出の注目度): 36.50320728984937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-augmented text generation (RAG) addresses the common limitations of large language models (LLMs), such as hallucination, by retrieving information from an updatable external knowledge base. However, existing approaches often require dedicated backend servers for data storage and retrieval, thereby limiting their applicability in use cases that require strict data privacy, such as personal finance, education, and medicine. To address the pressing need for client-side dense retrieval, we introduce MeMemo, the first open-source JavaScript toolkit that adapts the state-of-the-art approximate nearest neighbor search technique HNSW to browser environments. Developed with modern and native Web technologies, such as IndexedDB and Web Workers, our toolkit leverages client-side hardware capabilities to enable researchers and developers to efficiently search through millions of high-dimensional vectors in the browser. MeMemo enables exciting new design and research opportunities, such as private and personalized content creation and interactive prototyping, as demonstrated in our example application RAG Playground. Reflecting on our work, we discuss the opportunities and challenges for on-device dense retrieval. MeMemo is available at https://github.com/poloclub/mememo.
- Abstract(参考訳): Retrieval-augmented text generation (RAG) は、幻覚のような大きな言語モデル(LLM)の共通の制限に対処し、最新の外部知識ベースから情報を取得する。
しかし、既存のアプローチでは、データストレージと検索のために専用のバックエンドサーバを必要とすることが多く、個人金融、教育、医療といった厳格なデータプライバシーを必要とするユースケースでは、適用性が制限される。
クライアントサイドの高密度検索の必要性に対処するため、我々はMeMemoを紹介した。MeMemoは、最先端に近い近接検索技術であるHNSWをブラウザ環境に適用する最初のオープンソースのJavaScriptツールキットである。
IndexedDBやWeb WorkersといったモダンでネイティブなWebテクノロジで開発されたこのツールキットは、クライアントサイドのハードウェア機能を活用して、研究者や開発者がブラウザ内の何百万もの高次元ベクトルを効率的に検索できるようにします。
MeMemoは、プライベートでパーソナライズされたコンテンツ作成やインタラクティブなプロトタイピングなど、エキサイティングな新しいデザインと研究の機会を可能にします。
本研究を反映して,デバイス上での高密度検索の機会と課題について論じる。
MeMemoはhttps://github.com/poloclub/mememo.comで入手できる。
関連論文リスト
- CAMPHOR: Collaborative Agents for Multi-input Planning and High-Order Reasoning On Device [2.4100803794273005]
本稿では、複数のユーザ入力を処理し、個人的コンテキストを局所的に理性的に扱うように設計された、オンデバイス・スモールランゲージ・モデル(SLM)フレームワークを提案する。
CAMPHORは階層的アーキテクチャを採用しており、高階推論エージェントは複雑なタスクを分解し、個人のコンテキスト検索、ツールインタラクション、動的プラン生成に責任を持つ専門家エージェントを調整する。
エージェント間でパラメータ共有を実装し、即時圧縮を活用することにより、モデルサイズ、レイテンシ、メモリ使用量を大幅に削減する。
論文 参考訳(メタデータ) (2024-10-12T07:28:10Z) - On-Device Language Models: A Comprehensive Review [26.759861320845467]
資源制約のあるデバイスに計算コストの高い大規模言語モデルをデプロイする際の課題について検討する。
論文は、デバイス上での言語モデル、その効率的なアーキテクチャ、および最先端の圧縮技術について考察する。
主要モバイルメーカーによるオンデバイス言語モデルのケーススタディは、実世界の応用と潜在的な利益を実証している。
論文 参考訳(メタデータ) (2024-08-26T03:33:36Z) - OpenOmni: A Collaborative Open Source Tool for Building Future-Ready Multimodal Conversational Agents [11.928422245125985]
Open Omniはオープンソースのエンドツーエンドパイプラインベンチマークツールである。
音声テキスト、感情検出、検索拡張生成、大規模言語モデルなどの高度な技術を統合している。
ローカルとクラウドのデプロイメントをサポートし、データのプライバシを確保し、レイテンシと精度のベンチマークをサポートする。
論文 参考訳(メタデータ) (2024-08-06T09:02:53Z) - Large Language Models for Generative Information Extraction: A Survey [89.71273968283616]
大規模言語モデル(LLM)は、テキスト理解と生成において顕著な能力を示した。
各種IEサブタスクと技術の観点から,これらの作品を分類して概観する。
我々は,最も先進的な手法を実証的に分析し,LLMによるIEタスクの出現傾向を明らかにする。
論文 参考訳(メタデータ) (2023-12-29T14:25:22Z) - SimplyRetrieve: A Private and Lightweight Retrieval-Centric Generative
AI Tool [0.14777718769290524]
大規模言語モデル(LLM)ベースの生成AIシステムは,近年,大きな進歩を遂げている。
知識検索アーキテクチャを統合することで、プライベートデータの公開可能な生成AIシステムへのシームレスな統合が可能になる。
Retrieval-Centric Generation (RCG)アプローチは、文脈解釈と知識記憶におけるLLMとレトリバーの役割を分離する。
SimplyRetrieveは、これらの高度な進歩に対して、ローカライズされ、軽量で、ユーザフレンドリーなインターフェースを提供することを目標とする、オープンソースのツールである。
論文 参考訳(メタデータ) (2023-08-08T02:00:43Z) - GAIA Search: Hugging Face and Pyserini Interoperability for NLP Training
Data Exploration [97.68234051078997]
我々はPyseriniを、オープンソースのAIライブラリとアーティファクトのHugging Faceエコシステムに統合する方法について論じる。
Jupyter NotebookベースのウォークスルーがGitHubで公開されている。
GAIA Search - 前述した原則に従って構築された検索エンジンで、人気の高い4つの大規模テキストコレクションへのアクセスを提供する。
論文 参考訳(メタデータ) (2023-06-02T12:09:59Z) - Active Retrieval Augmented Generation [123.68874416084499]
外部知識資源から情報を取得することで、大きな言語モデル(LM)を拡張することは、有望な解決策である。
ほとんどの既存の検索拡張LMは、入力に基づいて一度だけ情報を検索する検索と生成のセットアップを採用している。
本稿では,将来的な内容を予測するために,文の予測を反復的に利用する汎用手法であるフォワード・フォワード・アクティブ・レトリヴァル・ジェネレーション・ジェネレーション(FLARE)を提案する。
論文 参考訳(メタデータ) (2023-05-11T17:13:40Z) - MuRAG: Multimodal Retrieval-Augmented Generator for Open Question
Answering over Images and Text [58.655375327681774]
我々は,Multimodal Retrieval-Augmented Transformer (MuRAG)を提案する。
MuRAGは外部の非パラメトリックマルチモーダルメモリにアクセスして言語生成を増強する。
以上の結果から, MuRAGは最先端の精度を達成し, 既存のモデルよりも10~20%精度が高いことがわかった。
論文 参考訳(メタデータ) (2022-10-06T13:58:03Z) - A Survey of Machine Unlearning [56.017968863854186]
最近の規制では、要求に応じて、ユーザに関する個人情報をコンピュータシステムから削除する必要がある。
MLモデルは古いデータをよく記憶します。
機械学習に関する最近の研究は、この問題を完全に解決することはできなかった。
論文 参考訳(メタデータ) (2022-09-06T08:51:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。