論文の概要: biquality-learn: a Python library for Biquality Learning
- arxiv url: http://arxiv.org/abs/2308.09643v1
- Date: Fri, 18 Aug 2023 16:01:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 12:26:47.393412
- Title: biquality-learn: a Python library for Biquality Learning
- Title(参考訳): Biquality-learn: 両品質学習のためのPythonライブラリ
- Authors: Pierre Nodet and Vincent Lemaire and Alexis Bondu and Antoine
Cornu\'ejols
- Abstract要約: バイ品質学習は、監督とデータセットシフトの弱点を扱うアルゴリズムを設計するためのフレームワークとして提案されている。
Python Library for Biquality Learningは、バイ品質データから機械学習モデルを学ぶための直感的で一貫性のあるAPIである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The democratization of Data Mining has been widely successful thanks in part
to powerful and easy-to-use Machine Learning libraries. These libraries have
been particularly tailored to tackle Supervised Learning. However, strong
supervision signals are scarce in practice, and practitioners must resort to
weak supervision. In addition to weaknesses of supervision, dataset shifts are
another kind of phenomenon that occurs when deploying machine learning models
in the real world. That is why Biquality Learning has been proposed as a
machine learning framework to design algorithms capable of handling multiple
weaknesses of supervision and dataset shifts without assumptions on their
nature and level by relying on the availability of a small trusted dataset
composed of cleanly labeled and representative samples. Thus we propose
biquality-learn: a Python library for Biquality Learning with an intuitive and
consistent API to learn machine learning models from biquality data, with
well-proven algorithms, accessible and easy to use for everyone, and enabling
researchers to experiment in a reproducible way on biquality data.
- Abstract(参考訳): データマイニングの民主化は、強力で使いやすい機械学習ライブラリのおかげで、広く成功している。
これらのライブラリは、特にSupervised Learningに取り組むように調整されている。
しかし、実際には強力な監視信号は乏しく、実践者は弱い監督に頼らなければならない。
監視の弱点に加えて、データセットシフトも、現実世界に機械学習モデルをデプロイするときに発生する現象のひとつだ。
そのため、クリーンなラベル付きおよび代表的サンプルからなる小さな信頼されたデータセットの可用性に依存することで、その性質とレベルを前提にすることなく、監視とデータセットシフトの複数の弱点を処理可能なアルゴリズムを設計するための機械学習フレームワークとして、biquality learningが提案されている。
そこで我々はbiquality-learnを提案する。biquality-learnは、直感的で一貫性のあるapiを備えた、biquality dataから機械学習モデルを学習するための、直感的で一貫性のあるpythonライブラリである。
関連論文リスト
- Biquality Learning: a Framework to Design Algorithms Dealing with
Closed-Set Distribution Shifts [0.0]
このようなアルゴリズムを設計するのには、バイ品質のデータ設定が適していると考えています。
トレーニング時に利用可能な信頼できないデータセットは、任意の分散シフトを扱うアルゴリズムの設計を可能にする。
実世界のデータセットに概念ドリフトとクラス条件シフトを合成的に導入する2つの新しい手法を実験した。
論文 参考訳(メタデータ) (2023-08-29T08:57:47Z) - Improving Behavioural Cloning with Positive Unlabeled Learning [15.484227081812852]
本稿では,混合品質のロボットデータセットにおける専門家の軌跡を特定するための,新しい反復学習アルゴリズムを提案する。
結果のフィルタデータセットに行動クローンを適用することで、競合するオフライン強化学習と模倣学習ベースラインを上回っます。
論文 参考訳(メタデータ) (2023-01-27T14:17:45Z) - Towards Robust Dataset Learning [90.2590325441068]
本稿では,頑健なデータセット学習問題を定式化するための三段階最適化法を提案する。
ロバストな特徴と非ロバストな特徴を特徴付ける抽象モデルの下で,提案手法はロバストなデータセットを確実に学習する。
論文 参考訳(メタデータ) (2022-11-19T17:06:10Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Federated Self-Supervised Learning in Heterogeneous Settings: Limits of
a Baseline Approach on HAR [0.5039813366558306]
我々は,標準軽量オートエンコーダと標準フェデレーション平均化が,人間の活動認識の堅牢な表現を学習できないことを示す。
これらの知見は、フェデレーション・セルフ・スーパーバイザード・ラーニングにおけるより集中的な研究努力を提唱している。
論文 参考訳(メタデータ) (2022-07-17T14:15:45Z) - Development of a robust cascaded architecture for intelligent robot
grasping using limited labelled data [0.0]
ロボットの場合、オブジェクトを効果的に把握する方法を学ぶために多くの時間を費やす余裕はありません。
本稿では,VQVAEに基づく効率的な学習アーキテクチャを提案する。
ラベル付きデータセットが限定された場合でも,より一般化可能な半教師付き学習ベースモデルについて検討した。
論文 参考訳(メタデータ) (2021-11-06T11:01:15Z) - Investigating a Baseline Of Self Supervised Learning Towards Reducing
Labeling Costs For Image Classification [0.0]
この研究は、Kaggle.comの cat-vs-dogs データセット Mnist と Fashion-Mnist を実装し、自己教師型学習タスクを調査している。
その結果、自己教師型学習におけるプレテキスト処理は、下流分類タスクの約15%の精度を向上させることがわかった。
論文 参考訳(メタデータ) (2021-08-17T06:43:05Z) - What Matters in Learning from Offline Human Demonstrations for Robot
Manipulation [64.43440450794495]
ロボット操作のための6つのオフライン学習アルゴリズムについて広範な研究を行う。
我々の研究は、オフラインの人間のデータから学習する際の最も重要な課題を分析します。
人間のデータセットから学ぶ機会を強調します。
論文 参考訳(メタデータ) (2021-08-06T20:48:30Z) - Low-Regret Active learning [64.36270166907788]
トレーニングに最も有用なラベル付きデータポイントを識別するオンライン学習アルゴリズムを開発した。
私たちの仕事の中心は、予測可能な(簡単な)インスタンスの低い後悔を達成するために調整された睡眠専門家のための効率的なアルゴリズムです。
論文 参考訳(メタデータ) (2021-04-06T22:53:45Z) - Fairness in Semi-supervised Learning: Unlabeled Data Help to Reduce
Discrimination [53.3082498402884]
機械学習の台頭における投機は、機械学習モデルによる決定が公正かどうかである。
本稿では,未ラベルデータのラベルを予測するための擬似ラベリングを含む,前処理フェーズにおける公平な半教師付き学習の枠組みを提案する。
偏見、分散、ノイズの理論的分解分析は、半教師付き学習における差別の異なる源とそれらが公平性に与える影響を浮き彫りにする。
論文 参考訳(メタデータ) (2020-09-25T05:48:56Z) - Laplacian Denoising Autoencoder [114.21219514831343]
本稿では,新しいタイプの自動符号化器を用いてデータ表現を学習することを提案する。
勾配領域における潜伏クリーンデータを破損させて雑音入力データを生成する。
いくつかのビジュアルベンチマークの実験では、提案されたアプローチでより良い表現が学べることが示されている。
論文 参考訳(メタデータ) (2020-03-30T16:52:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。