Fugu-MT 論文翻訳(概要): Constraint-driven multi-task learning

論文の概要: Constraint-driven multi-task learning

arxiv url: http://arxiv.org/abs/2208.11656v1
Date: Wed, 24 Aug 2022 16:53:54 GMT
ステータス: 翻訳完了
システム内更新日: 2022-08-25 12:18:03.008290
Title: Constraint-driven multi-task learning
Title（参考訳）: 制約駆動型マルチタスク学習
Authors: Bogdan Cretu, Andrew Cropper
Abstract要約: 本稿では,マルチタスク学習を活用するために,Popper ILPシステムを拡張した。制約保存は,すべてのアプローチの全体的な性能を改善する手法である。
参考スコア（独自算出の注目度）: 18.27510863075184
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Inductive logic programming is a form of machine learning based on mathematical logic that generates logic programs from given examples and background knowledge. In this project, we extend the Popper ILP system to make use of multi-task learning. We implement the state-of-the-art approach and several new strategies to improve search performance. Furthermore, we introduce constraint preservation, a technique that improves overall performance for all approaches. Constraint preservation allows the system to transfer knowledge between updates on the background knowledge set. Consequently, we reduce the amount of repeated work performed by the system. Additionally, constraint preservation allows us to transition from the current state-of-the-art iterative deepening search approach to a more efficient breadth first search approach. Finally, we experiment with curriculum learning techniques and show their potential benefit to the field.
Abstract（参考訳）: 帰納論理プログラミングは、与えられた例と背景知識から論理プログラムを生成する数学的論理に基づく機械学習の一形態である。本稿では,マルチタスク学習を活用するために,Popper ILPシステムを拡張した。我々は最先端のアプローチと検索性能を改善するための新しい戦略をいくつか実装する。さらに,全ての手法の全体的な性能を向上させる手法である制約保存を導入する。制約の保存により、システムはバックグラウンドの知識セットの更新間で知識を転送できる。これにより、システムによる繰り返し作業の量を削減できる。さらに、制約保存により、現在最先端の反復的深化探索アプローチから、より効率的な第1探索アプローチに移行することができる。最後に,カリキュラム学習手法を実験し,その分野でのメリットを示す。

関連論文リスト

Sequencing to Mitigate Catastrophic Forgetting in Continual Learning [1.1724961392643483]
破滅的な忘れ(CF)は継続的学習アプローチの進歩にとって大きな課題である。 CFの緩和におけるタスクシークエンシングの役割を考察し、最適なタスク順序を決定する方法を提案する。その結果、インテリジェントなタスクシークエンシングはCFを大幅に削減できることが示された。
論文参考訳（メタデータ） (2025-12-18T18:40:58Z)
Online inductive learning from answer sets for efficient reinforcement learning exploration [52.03682298194168]
エージェントポリシーの近似を説明可能な近似を表す論理規則の集合を学習するために,帰納的な解集合プログラムの学習を利用する。次に、学習ルールに基づいて回答セット推論を行い、次のバッチで学習エージェントの探索をガイドします。本手法は,初回トレーニングにおいても,エージェントが達成した割引リターンを著しく向上させる。
論文参考訳（メタデータ） (2025-01-13T16:13:22Z)
A Unified Framework for Neural Computation and Learning Over Time [56.44910327178975]
Hamiltonian Learningはニューラルネットワークを"時間とともに"学習するための新しい統合フレームワーク i)外部ソフトウェアソルバを必要とせずに統合できる、(ii)フィードフォワードおよびリカレントネットワークにおける勾配に基づく学習の概念を一般化する、(iii)新しい視点で開放する、という微分方程式に基づいている。
論文参考訳（メタデータ） (2024-09-18T14:57:13Z)
Towards a General Framework for Continual Learning with Pre-training [55.88910947643436]
本稿では,事前学習を用いた逐次到着タスクの連続学習のための一般的な枠組みを提案する。我々はその目的を,タスク内予測,タスク同一性推論,タスク適応予測という3つの階層的構成要素に分解する。本稿では,パラメータ効率細調整(PEFT)技術と表現統計量を用いて,これらのコンポーネントを明示的に最適化する革新的な手法を提案する。
論文参考訳（メタデータ） (2023-10-21T02:03:38Z)
Subspace Distillation for Continual Learning [27.22147868163214]
本稿では,ニューラルネットワークの多様体構造を考慮した知識蒸留手法を提案する。部分空間を用いたモデリングは、雑音に対するロバスト性など、いくつかの興味深い特性を提供することを示した。実験により,提案手法は,いくつかの挑戦的データセットにおいて,様々な連続学習法よりも優れていることがわかった。
論文参考訳（メタデータ） (2023-07-31T05:59:09Z)
Hierarchically Structured Task-Agnostic Continual Learning [0.0]
本研究では,連続学習のタスク非依存的な視点を取り入れ,階層的情報理論の最適性原理を考案する。我々は,情報処理経路の集合を作成することで,忘れを緩和する,Mixture-of-Variational-Experts層と呼ばれるニューラルネットワーク層を提案する。既存の連続学習アルゴリズムのようにタスク固有の知識を必要としない。
論文参考訳（メタデータ） (2022-11-14T19:53:15Z)
A Multi-label Continual Learning Framework to Scale Deep Learning Approaches for Packaging Equipment Monitoring [57.5099555438223]
連続シナリオにおけるマルチラベル分類を初めて研究した。タスク数に関して対数的複雑性を持つ効率的なアプローチを提案する。我々は,包装業界における実世界のマルチラベル予測問題に対するアプローチを検証した。
論文参考訳（メタデータ） (2022-08-08T15:58:39Z)
Continual Prompt Tuning for Dialog State Tracking [58.66412648276873]
望ましいダイアログシステムは、古いスキルを忘れずに継続的に新しいスキルを学ぶことができるべきである。本稿では,タスク間の知識伝達を可能にするパラメータ効率フレームワークであるContinuous Prompt Tuningを提案する。
論文参考訳（メタデータ） (2022-03-13T13:22:41Z)
Investigating Bi-Level Optimization for Learning and Vision from a Unified Perspective: A Survey and Beyond [114.39616146985001]
機械学習やコンピュータビジョンの分野では、モチベーションやメカニズムが異なるにもかかわらず、複雑な問題の多くは、一連の密接に関連するサブプロトコルを含んでいる。本稿では,BLO(Bi-Level Optimization)の観点から,これらの複雑な学習と視覚問題を一様に表現する。次に、値関数に基づく単一レベル再構成を構築し、主流勾配に基づくBLO手法を理解し、定式化するための統一的なアルゴリズムフレームワークを確立する。
論文参考訳（メタデータ） (2021-01-27T16:20:23Z)
Parrot: Data-Driven Behavioral Priors for Reinforcement Learning [79.32403825036792]
そこで本研究では,実験で得られた複雑なインプット・アウトプット関係を事前に学習する手法を提案する。 RLエージェントが新規な動作を試す能力を阻害することなく、この学習が新しいタスクを迅速に学習するのにどのように役立つかを示す。
論文参考訳（メタデータ） (2020-11-19T18:47:40Z)
Managing caching strategies for stream reasoning with reinforcement learning [18.998260813058305]
ストリーム推論は、継続的なデータ変更よりも効率的な意思決定を可能にする。我々は、衝突駆動制約学習(CDCL)を用いてレガシーソリューションを効率的に更新する新しいアプローチを提案する。特に,強化学習の適用性について検討し,学習制約の有用性を継続的に評価する。
論文参考訳（メタデータ） (2020-08-07T15:01:41Z)
Model-based Multi-Agent Reinforcement Learning with Cooperative Prioritized Sweeping [4.5497948012757865]
本稿では,新しいモデルに基づく強化学習アルゴリズム,Cooperative Prioritized Sweepingを提案する。このアルゴリズムは、値関数を近似するために因子化を利用することにより、大きな問題に対するサンプル効率の学習を可能にする。我々の手法は、よく知られたSysAdminベンチマークとランダム化環境の両方において、最先端の協調的なQ-ラーニングアルゴリズムよりも優れている。
論文参考訳（メタデータ） (2020-01-15T19:13:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。