論文の概要: scikit-dyn2sel -- A Dynamic Selection Framework for Data Streams
- arxiv url: http://arxiv.org/abs/2008.08920v1
- Date: Mon, 17 Aug 2020 13:48:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 04:10:07.698137
- Title: scikit-dyn2sel -- A Dynamic Selection Framework for Data Streams
- Title(参考訳): scikit-dyn2sel - データストリームのための動的選択フレームワーク
- Authors: Lucca Portes Cavalheiro, Jean Paul Barddal, Alceu de Souza Britto Jr,
Laurent Heutte
- Abstract要約: scikit-dyn2selは、ストリーミングデータにおける動的選択技術に適したオープンソースのpythonライブラリである。
scikit-dyn2selの開発は、PEP8や自動テストカバレッジなど、コード品質とテスト標準に従っている。
- 参考スコア(独自算出の注目度): 4.714199151237852
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mining data streams is a challenge per se. It must be ready to deal with an
enormous amount of data and with problems not present in batch machine
learning, such as concept drift. Therefore, applying a batch-designed
technique, such as dynamic selection of classifiers (DCS) also presents a
challenge. The dynamic characteristic of ensembles that deal with streams
presents barriers to the application of traditional DCS techniques in such
classifiers. scikit-dyn2sel is an open-source python library tailored for
dynamic selection techniques in streaming data. scikit-dyn2sel's development
follows code quality and testing standards, including PEP8 compliance and
automated high test coverage using codecov.io and circleci.com. Source code,
documentation, and examples are made available on GitHub at
https://github.com/luccaportes/Scikit-DYN2SEL.
- Abstract(参考訳): データストリームのマイニングは、それ自体が課題である。
膨大な量のデータと、コンセプトドリフトのようなバッチ機械学習に存在しない問題に対処する準備ができている必要があります。
したがって、分類器(DCS)の動的選択のようなバッチ設計技術を適用することも課題である。
ストリームを扱うアンサンブルの動的特性は、そのような分類器における従来のDCS技術の適用に障壁を与える。
scikit-dyn2selは、ストリーミングデータにおける動的選択技術に適したオープンソースのpythonライブラリである。
scikit-dyn2selの開発は、PEP8準拠やcodecov.io と circleci.com を使用した自動テストカバレッジなど、コード品質とテスト標準に従っている。
ソースコード、ドキュメント、サンプルはgithubのhttps://github.com/luccaportes/scikit-dyn2selで入手できる。
関連論文リスト
- Continual Learning for Multimodal Data Fusion of a Soft Gripper [1.0589208420411014]
あるデータモダリティに基づいてトレーニングされたモデルは、異なるモダリティでテストした場合、しばしば失敗する。
異なるデータモダリティを漸進的に学習できる連続学習アルゴリズムを提案する。
我々は、アルゴリズムの有効性を、挑戦的なカスタムマルチモーダルデータセット上で評価する。
論文 参考訳(メタデータ) (2024-09-20T09:53:27Z) - Cross-modal Prompts: Adapting Large Pre-trained Models for Audio-Visual
Downstream Tasks [55.36987468073152]
本稿では,DG-SCT(Dual-Guided Space-Channel-Temporal)アテンション機構を提案する。
DG-SCTモジュールはトレーニング可能なクロスモーダル・インタラクション・レイヤを事前トレーニングされたオーディオ・ビジュアル・エンコーダに組み込む。
提案手法は, AVE, AVVP, AVS, AVQA, AVQAを含む複数のダウンストリームタスクにまたがる最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2023-11-09T05:24:20Z) - Imbalanced Data Stream Classification using Dynamic Ensemble Selection [0.0]
本研究では,データ前処理と動的アンサンブル選択を統合する新しいフレームワークを提案する。
提案手法は,不均衡比の異なる6つのデータストリームを用いて評価した。
実験結果によると、データ前処理とDynamic Ensemble Selection技術を組み合わせることで、精度が大幅に向上する。
論文 参考訳(メタデータ) (2023-09-17T06:51:29Z) - PEOPL: Characterizing Privately Encoded Open Datasets with Public Labels [59.66777287810985]
プライバシとユーティリティのための情報理論スコアを導入し、不誠実なユーザの平均パフォーマンスを定量化する。
次に、ランダムなディープニューラルネットワークの使用を動機付ける符号化スキームのファミリーを構築する際のプリミティブを理論的に特徴づける。
論文 参考訳(メタデータ) (2023-03-31T18:03:53Z) - Software Vulnerability Prediction Knowledge Transferring Between
Programming Languages [2.3035725779568583]
本稿では、利用可能なデータセットを活用するトランスファー学習手法を提案し、異なるプログラミング言語の共通脆弱性を検出するモデルを生成する。
我々は、Cのソースコードサンプルを使用して、畳み込みニューラルネットワーク(CNN)モデルをトレーニングし、Javaのソースコードサンプルを使用して学習モデルを採用し、評価する。
その結果,提案モデルでは,CコードとJavaコードの両方の脆弱性を平均72%のリコールで検出できることがわかった。
論文 参考訳(メタデータ) (2023-03-10T19:21:52Z) - Continual Learning with Optimal Transport based Mixture Model [17.398605698033656]
成熟最適輸送理論(OT-MM)の優れた性質に基づくオンライン混合モデル学習手法を提案する。
提案手法は,現在の最先端のベースラインを大きく上回ることができる。
論文 参考訳(メタデータ) (2022-11-30T06:40:29Z) - Dynamic Network-Assisted D2D-Aided Coded Distributed Learning [59.29409589861241]
本稿では,デバイス間のロードバランシングのための新しいデバイス・ツー・デバイス(D2D)支援型符号化学習手法(D2D-CFL)を提案する。
最小処理時間を達成するための最適圧縮率を導出し、収束時間との接続を確立する。
提案手法は,ユーザが継続的にトレーニングデータを生成するリアルタイム協調アプリケーションに有用である。
論文 参考訳(メタデータ) (2021-11-26T18:44:59Z) - Neural Distributed Source Coding [59.630059301226474]
相関構造に依存せず,高次元までスケール可能な損失DSCのためのフレームワークを提案する。
提案手法は,複数のデータセット上で評価し,複雑な相関関係と最先端PSNRを扱えることを示す。
論文 参考訳(メタデータ) (2021-06-05T04:50:43Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z) - Contextual-Bandit Anomaly Detection for IoT Data in Distributed
Hierarchical Edge Computing [65.78881372074983]
IoTデバイスは複雑なディープニューラルネットワーク(DNN)モデルにはほとんど余裕がなく、異常検出タスクをクラウドにオフロードすることは長い遅延を引き起こす。
本稿では,分散階層エッジコンピューティング(HEC)システムを対象とした適応型異常検出手法のデモと構築を行う。
提案手法は,検出タスクをクラウドにオフロードした場合と比較して,精度を犠牲にすることなく検出遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-04-15T06:13:33Z) - stream-learn -- open-source Python library for difficult data stream
batch analysis [0.0]
stream-learnはScikit-learnと互換性があり、ドリフトと不均衡なデータストリーム分析のために開発された。
主なコンポーネントは、合成データストリームを生成するストリームジェネレータである。
さらに,データストリーム分類に適応した推定器も実装されている。
論文 参考訳(メタデータ) (2020-01-29T20:15:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。