Fugu-MT 論文翻訳(概要): Continual Learning and Private Unlearning

論文の概要: Continual Learning and Private Unlearning

arxiv url: http://arxiv.org/abs/2203.12817v1
Date: Thu, 24 Mar 2022 02:40:33 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-26 00:21:15.008432
Title: Continual Learning and Private Unlearning
Title（参考訳）: 継続的な学習とプライベートアンラーニング
Authors: Bo Liu, Qiang Liu, Peter Stone
Abstract要約: 本稿では、継続学習とプライベートアンラーニング(CLPU)問題を定式化する。これはCLPU問題を解決するための第一歩として、単純だが完全にプライベートなソリューションであるCLPU-DER++を紹介している。
参考スコア（独自算出の注目度）: 49.848423659220444
License: http://creativecommons.org/licenses/by/4.0/
Abstract: As intelligent agents become autonomous over longer periods of time, they may eventually become lifelong counterparts to specific people. If so, it may be common for a user to want the agent to master a task temporarily but later on to forget the task due to privacy concerns. However enabling an agent to \emph{forget privately} what the user specified without degrading the rest of the learned knowledge is a challenging problem. With the aim of addressing this challenge, this paper formalizes this continual learning and private unlearning (CLPU) problem. The paper further introduces a straightforward but exactly private solution, CLPU-DER++, as the first step towards solving the CLPU problem, along with a set of carefully designed benchmark problems to evaluate the effectiveness of the proposed solution.
Abstract（参考訳）: 知的エージェントが長い時間をかけて自律化するにつれ、彼らは最終的に特定の人々と生涯にわたって対等になるかもしれない。もしそうなら、ユーザーがエージェントに一時的にタスクをマスターさせたいが、後にプライバシー上の懸念からタスクを忘れるのが一般的かもしれない。しかし、エージェントが学習した知識の残りの部分を劣化させることなく、ユーザが指定したものをプライベートに指定できるようにすることは、難しい問題である。本論文は,この課題に対処するために,この継続学習とプライベートアンラーニング(CLPU)問題を定式化する。さらに、CLPU問題の解決に向けた第一歩として、単純だが完全にプライベートなソリューションであるCLPU-DER++を紹介し、提案ソリューションの有効性を評価するために、慎重に設計されたベンチマーク問題のセットを紹介する。

関連論文リスト

Memento No More: Coaching AI Agents to Master Multiple Tasks via Hints Internalization [56.674356045200696]
本稿では,複雑なメモシステムや事前の高品質な実演データを必要としない,複数のタスクに対する知識とスキルを取り入れたAIエージェントの訓練手法を提案する。このアプローチでは,エージェントが新たな経験を収集し,ヒントの形で人間から補正フィードバックを受け取り,このフィードバックを重みに組み込む,反復的なプロセスを採用している。 Llama-3 をベースとしたエージェントに実装することで,提案手法の有効性を実証し,数ラウンドのフィードバックの後,高度なモデル GPT-4o と DeepSeek-V3 をタスクセットで向上させる。
論文参考訳（メタデータ） (2025-02-03T17:45:46Z)
Continual Deep Reinforcement Learning with Task-Agnostic Policy Distillation [0.0]
TAPD(Task-Agnostic Policy Distillation)フレームワークが導入されている。本稿では,継続学習の問題に対処する。タスク非依存の蒸留知識を利用することで、下流タスクをより効率的に解決することができる。
論文参考訳（メタデータ） (2024-11-25T16:18:39Z)
Vector Quantization Prompting for Continual Learning [23.26682439914273]
連続学習は、1つのモデルを一連のタスクでトレーニングする際に破滅的な忘れを克服する必要がある。最近のトップパフォーマンスアプローチは、学習可能なパラメータのセットを使ってタスク知識をエンコードするプロンプトベースの手法である。本稿では,ベクトル量子化を離散的なプロンプトのエンドツーエンドトレーニングに組み込む,プロンプトに基づく連続学習手法であるVQ-Promptを提案する。
論文参考訳（メタデータ） (2024-10-27T13:43:53Z)
BloomWise: Enhancing Problem-Solving capabilities of Large Language Models using Bloom's-Taxonomy-Inspired Prompts [59.83547898874152]
我々は,Bloomの分類にインスパイアされた新しいプロンプト技術であるBloomWiseを導入し,Large Language Models(LLMs)の性能を向上させる。より洗練された認知スキルを身につける必要性に関する決定は、LLMによる自己評価に基づいている。 4つの一般的な算数推論データセットの広範な実験において,提案手法の有効性を実証した。
論文参考訳（メタデータ） (2024-10-05T09:27:52Z)
Improving Socratic Question Generation using Data Augmentation and Preference Optimization [2.1485350418225244]
大規模言語モデル(LLM)は、学生のためのソクラテス的質問を自動的に生成することにより、人間の努力を強化するために使用できる。これらの LLM をプロンプトする既存の手法は、時に無効な出力を生成する。本研究では,既存のソクラテス質問データセットを,特定の方法で無効な質問で強化するデータ拡張手法を提案する。次に,LLama 2 などのオープンソース LLM の最適化手法を提案する。
論文参考訳（メタデータ） (2024-03-01T00:08:20Z)
DP-OPT: Make Large Language Model Your Privacy-Preserving Prompt Engineer [57.04801796205638]
大きな言語モデル(LLM)は、様々なタスクのための支配的なツールとして現れています。しかし、データプライバシに関する懸念は、調整されたプロンプトが機密情報に依存しているため、障害となる。本稿では,DP-OPT(Dis Differentially-Private Offsite Prompt Tuning)を提案する。
論文参考訳（メタデータ） (2023-11-27T02:01:10Z)
You Only Live Once: Single-Life Reinforcement Learning [124.1738675154651]
多くの現実世界の状況では、そのタスクを繰り返し実行できるポリシーを学ぶことではなく、単一のトライアルで1回だけ新しいタスクを成功させることが目的である。エージェントが介入なしにひとつのエピソード内でタスクを完了しなければならない問題設定を形式化する。本稿では,分散マッチング戦略を用いたQ$-weighted adversarial Learning (QWALE)を提案する。
論文参考訳（メタデータ） (2022-10-17T09:00:11Z)
Knowledge acquisition via interactive Distributed Cognitive skill Modules [0.0]
問題解決における人間の認知能力は、常に教育的背景、スキル、経験等に限られる。本研究は,分散認知スキルモジュールによる手続き的スキル獲得とストレージのための,モジュール型アプローチの初期段階の導入を目的とする。
論文参考訳（メタデータ） (2022-10-13T01:41:11Z)
Learning with Recoverable Forgetting [77.56338597012927]
学習wIth Recoverable Forgettingは、タスクまたはサンプル固有の知識の除去とリカバリを明示的に処理する。具体的には、LIRFは2つの革新的なスキーム、すなわち知識預金と離脱をもたらす。いくつかのデータセットで実験を行い、提案したLIRF戦略が一般化能力を満足させる結果をもたらすことを示す。
論文参考訳（メタデータ） (2022-07-17T16:42:31Z)
Probably Approximately Correct Constrained Learning [135.48447120228658]
我々は、ほぼ正しい学習フレームワーク(PAC)に基づく一般化理論を開発する。 PAC学習可能なクラスも制約のある学習者であるという意味では,学習者の導入は学習問題を難しくするものではないことを示す。このソリューションの特性を分析し,制約付き学習が公平でロバストな分類における問題にどのように対処できるかを説明する。
論文参考訳（メタデータ） (2020-06-09T19:59:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。