論文の概要: Towards Realistic Single-Task Continuous Learning Research for NER
- arxiv url: http://arxiv.org/abs/2110.14694v1
- Date: Wed, 27 Oct 2021 18:23:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-29 13:43:25.671889
- Title: Towards Realistic Single-Task Continuous Learning Research for NER
- Title(参考訳): NERのための現実的なシングルタスク連続学習研究に向けて
- Authors: Justin Payan, Yuval Merhav, He Xie, Satyapriya Krishna, Anil
Ramakrishna, Mukund Sridhar, Rahul Gupta
- Abstract要約: 本稿では、公開データセットの非現実的なデータ特性について論じ、現実的な単一タスク連続学習の課題について考察する。
我々は、既存の公開データセットからCL NERデータセットを構築し、コードとともに研究コミュニティにリリースする。
- 参考スコア(独自算出の注目度): 19.61159414320659
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is an increasing interest in continuous learning (CL), as data privacy
is becoming a priority for real-world machine learning applications. Meanwhile,
there is still a lack of academic NLP benchmarks that are applicable for
realistic CL settings, which is a major challenge for the advancement of the
field. In this paper we discuss some of the unrealistic data characteristics of
public datasets, study the challenges of realistic single-task continuous
learning as well as the effectiveness of data rehearsal as a way to mitigate
accuracy loss. We construct a CL NER dataset from an existing publicly
available dataset and release it along with the code to the research community.
- Abstract(参考訳): データプライバシが現実の機械学習アプリケーションにとって最優先事項になりつつあるため、継続的学習(CL)への関心が高まっている。
一方、現実的なCL設定に適用可能な学術的なNLPベンチマークがまだ存在しないため、この分野の発展の大きな課題である。
本稿では、公開データセットの非現実的なデータ特性について論じ、現実的な単一タスク連続学習の課題と、精度損失を軽減する手段としてのデータリハーサルの有効性について考察する。
我々は、既存の公開データセットからCL NERデータセットを構築し、コードとともに研究コミュニティにリリースする。
関連論文リスト
- What Makes CLIP More Robust to Long-Tailed Pre-Training Data? A Controlled Study for Transferable Insights [67.72413262980272]
大規模なデータ不均衡は、Webスケールの視覚言語データセットの間に自然に存在する。
事前学習したCLIPは、教師付き学習と比較してデータ不均衡に顕著な堅牢性を示す。
CLIPの堅牢性と差別性は、より記述的な言語監督、より大きなデータスケール、より広いオープンワールドの概念によって改善される。
論文 参考訳(メタデータ) (2024-05-31T17:57:24Z) - Where is the Truth? The Risk of Getting Confounded in a Continual World [21.862370510786004]
データセットは、新たなデータへの一般化に失敗する急激な相関によって、最も容易に解決される場合、構築される。
共同創設者がタスク間で時間的に異なるような継続的な学習環境では、共同創設者の効果を緩和するという課題は、標準的な忘れる問題よりもはるかに多い。
論文 参考訳(メタデータ) (2024-02-09T14:24:18Z) - Analysis of Knowledge Tracing performance on synthesised student data [3.9227982854973438]
知識追跡は,知識状態の発達を追跡することによって,学生の今後のパフォーマンスを予測することを目的としている。
この分野での最近の進歩にもかかわらず、教育システムにおけるKTモデルの適用は、今でもデータの観点から制限されている。
私たちの研究は、学習に合成データのみを使用することで、実際のデータと同じようなパフォーマンスが得られることを示しています。
論文 参考訳(メタデータ) (2024-01-30T09:19:50Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - CTP: Towards Vision-Language Continual Pretraining via Compatible
Momentum Contrast and Topology Preservation [128.00940554196976]
Vision-Language Continual Pretraining (VLCP)は、大規模なデータセット上でオフラインでトレーニングすることで、さまざまな下流タスクに対して印象的な結果を示している。
VLCP(Vision-Language Continual Pretraining)の研究を支援するために,我々はまず,包括的で統一されたベンチマークデータセットP9Dをコントリビュートする。
独立したタスクとしての各業界からのデータは、継続的な学習をサポートし、Webデータの事前学習をシミュレートする現実世界のロングテールな性質に準拠している。
論文 参考訳(メタデータ) (2023-08-14T13:53:18Z) - On Handling Catastrophic Forgetting for Incremental Learning of Human
Physical Activity on the Edge [1.4695979686066065]
PILOTEは、インクリメンタルな学習プロセスを極端にプッシュし、信頼性の高いデータプライバシと実用性を提供します。
モバイルセンサから収集した人間の活動データについて, PILOTEを広範囲にわたる実験により検証した。
論文 参考訳(メタデータ) (2023-02-18T11:55:01Z) - The CLEAR Benchmark: Continual LEArning on Real-World Imagery [77.98377088698984]
連続学習(CL)は、生涯AIにとって重要な課題であると考えられている。
本稿では,視覚概念の自然な時間進化を伴う最初の連続画像分類ベンチマークであるCLEARを紹介する。
単純な教師なし事前学習のステップで、最先端のCLアルゴリズムがすでに強化されていることが分かりました。
論文 参考訳(メタデータ) (2022-01-17T09:09:09Z) - Continual Learning for Recurrent Neural Networks: a Review and Empirical
Evaluation [12.27992745065497]
リカレントニューラルネットワークによる連続学習は、受信データが定常的でない多数のアプリケーションへの道を開くことができる。
コントリビューションの分類とベンチマークのレビューを提供することで、シーケンシャルデータ処理のためのCLに関する文献を整理します。
我々は既存のデータセットに基づくシーケンシャルデータを持つclの新しいベンチマークを2つ提案する。
論文 参考訳(メタデータ) (2021-03-12T19:25:28Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。