Fugu-MT 論文翻訳(概要): scikit-dyn2sel -- A Dynamic Selection Framework for Data Streams

論文の概要: scikit-dyn2sel -- A Dynamic Selection Framework for Data Streams

arxiv url: http://arxiv.org/abs/2008.08920v1
Date: Mon, 17 Aug 2020 13:48:32 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-28 04:10:07.698137
Title: scikit-dyn2sel -- A Dynamic Selection Framework for Data Streams
Title（参考訳）: scikit-dyn2sel - データストリームのための動的選択フレームワーク
Authors: Lucca Portes Cavalheiro, Jean Paul Barddal, Alceu de Souza Britto Jr, Laurent Heutte
Abstract要約: scikit-dyn2selは、ストリーミングデータにおける動的選択技術に適したオープンソースのpythonライブラリである。 scikit-dyn2selの開発は、PEP8や自動テストカバレッジなど、コード品質とテスト標準に従っている。
参考スコア（独自算出の注目度）: 4.714199151237852
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Mining data streams is a challenge per se. It must be ready to deal with an enormous amount of data and with problems not present in batch machine learning, such as concept drift. Therefore, applying a batch-designed technique, such as dynamic selection of classifiers (DCS) also presents a challenge. The dynamic characteristic of ensembles that deal with streams presents barriers to the application of traditional DCS techniques in such classifiers. scikit-dyn2sel is an open-source python library tailored for dynamic selection techniques in streaming data. scikit-dyn2sel's development follows code quality and testing standards, including PEP8 compliance and automated high test coverage using codecov.io and circleci.com. Source code, documentation, and examples are made available on GitHub at https://github.com/luccaportes/Scikit-DYN2SEL.
Abstract（参考訳）: データストリームのマイニングは、それ自体が課題である。膨大な量のデータと、コンセプトドリフトのようなバッチ機械学習に存在しない問題に対処する準備ができている必要があります。したがって、分類器(DCS)の動的選択のようなバッチ設計技術を適用することも課題である。ストリームを扱うアンサンブルの動的特性は、そのような分類器における従来のDCS技術の適用に障壁を与える。 scikit-dyn2selは、ストリーミングデータにおける動的選択技術に適したオープンソースのpythonライブラリである。 scikit-dyn2selの開発は、PEP8準拠やcodecov.io と circleci.com を使用した自動テストカバレッジなど、コード品質とテスト標準に従っている。ソースコード、ドキュメント、サンプルはgithubのhttps://github.com/luccaportes/scikit-dyn2selで入手できる。

関連論文リスト

Private Training & Data Generation by Clustering Embeddings [74.00687214400021]
差分プライバシー(DP)は、個々のデータを保護するための堅牢なフレームワークを提供する。本稿では,DP合成画像埋め込み生成のための新しい原理的手法を提案する。経験的に、合成的に生成された埋め込みに基づいて訓練された単純な2層ニューラルネットワークは、最先端(SOTA)分類の精度を達成する。
論文参考訳（メタデータ） (2025-06-20T00:17:14Z)
KodCode: A Diverse, Challenging, and Verifiable Synthetic Dataset for Coding [49.56049319037421]
KodCodeは、高品質で検証可能なトレーニングデータを取得するという永続的な課題に対処する、合成データセットである。自己検証手順によって体系的に検証される質問解決テスト三つ子を含む。このパイプラインは大規模で堅牢で多様なコーディングデータセットを生成する。
論文参考訳（メタデータ） (2025-03-04T19:17:36Z)
A Pipeline of Augmentation and Sequence Embedding for Classification of Imbalanced Network Traffic [0.0]
本稿では,頑健で正確な埋め込み手法を用いて,データセットのバランスと分類を行うパイプラインを提案する。提案した拡張パイプラインとFS-Embeddingを組み合わせることで収束速度が向上し,モデルパラメータの数が大幅に減少することを示す。
論文参考訳（メタデータ） (2025-02-26T07:55:24Z)
Continual Learning for Multimodal Data Fusion of a Soft Gripper [1.0589208420411014]
あるデータモダリティに基づいてトレーニングされたモデルは、異なるモダリティでテストした場合、しばしば失敗する。異なるデータモダリティを漸進的に学習できる連続学習アルゴリズムを提案する。我々は、アルゴリズムの有効性を、挑戦的なカスタムマルチモーダルデータセット上で評価する。
論文参考訳（メタデータ） (2024-09-20T09:53:27Z)
Cross-modal Prompts: Adapting Large Pre-trained Models for Audio-Visual Downstream Tasks [55.36987468073152]
本稿では,DG-SCT(Dual-Guided Space-Channel-Temporal)アテンション機構を提案する。 DG-SCTモジュールはトレーニング可能なクロスモーダル・インタラクション・レイヤを事前トレーニングされたオーディオ・ビジュアル・エンコーダに組み込む。提案手法は, AVE, AVVP, AVS, AVQA, AVQAを含む複数のダウンストリームタスクにまたがる最先端の処理結果を実現する。
論文参考訳（メタデータ） (2023-11-09T05:24:20Z)
Imbalanced Data Stream Classification using Dynamic Ensemble Selection [0.0]
本研究では,データ前処理と動的アンサンブル選択を統合する新しいフレームワークを提案する。提案手法は,不均衡比の異なる6つのデータストリームを用いて評価した。実験結果によると、データ前処理とDynamic Ensemble Selection技術を組み合わせることで、精度が大幅に向上する。
論文参考訳（メタデータ） (2023-09-17T06:51:29Z)
PEOPL: Characterizing Privately Encoded Open Datasets with Public Labels [59.66777287810985]
プライバシとユーティリティのための情報理論スコアを導入し、不誠実なユーザの平均パフォーマンスを定量化する。次に、ランダムなディープニューラルネットワークの使用を動機付ける符号化スキームのファミリーを構築する際のプリミティブを理論的に特徴づける。
論文参考訳（メタデータ） (2023-03-31T18:03:53Z)
Software Vulnerability Prediction Knowledge Transferring Between Programming Languages [2.3035725779568583]
本稿では、利用可能なデータセットを活用するトランスファー学習手法を提案し、異なるプログラミング言語の共通脆弱性を検出するモデルを生成する。我々は、Cのソースコードサンプルを使用して、畳み込みニューラルネットワーク(CNN)モデルをトレーニングし、Javaのソースコードサンプルを使用して学習モデルを採用し、評価する。その結果,提案モデルでは,CコードとJavaコードの両方の脆弱性を平均72%のリコールで検出できることがわかった。
論文参考訳（メタデータ） (2023-03-10T19:21:52Z)
Continual Learning with Optimal Transport based Mixture Model [17.398605698033656]
成熟最適輸送理論(OT-MM)の優れた性質に基づくオンライン混合モデル学習手法を提案する。提案手法は,現在の最先端のベースラインを大きく上回ることができる。
論文参考訳（メタデータ） (2022-11-30T06:40:29Z)
Dynamic Network-Assisted D2D-Aided Coded Distributed Learning [59.29409589861241]
本稿では,デバイス間のロードバランシングのための新しいデバイス・ツー・デバイス(D2D)支援型符号化学習手法(D2D-CFL)を提案する。最小処理時間を達成するための最適圧縮率を導出し、収束時間との接続を確立する。提案手法は,ユーザが継続的にトレーニングデータを生成するリアルタイム協調アプリケーションに有用である。
論文参考訳（メタデータ） (2021-11-26T18:44:59Z)
Neural Distributed Source Coding [59.630059301226474]
相関構造に依存せず,高次元までスケール可能な損失DSCのためのフレームワークを提案する。提案手法は,複数のデータセット上で評価し,複雑な相関関係と最先端PSNRを扱えることを示す。
論文参考訳（メタデータ） (2021-06-05T04:50:43Z)
Learning to Continuously Optimize Wireless Resource In Episodically Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文参考訳（メタデータ） (2020-11-16T08:24:34Z)
Contextual-Bandit Anomaly Detection for IoT Data in Distributed Hierarchical Edge Computing [65.78881372074983]
IoTデバイスは複雑なディープニューラルネットワーク(DNN)モデルにはほとんど余裕がなく、異常検出タスクをクラウドにオフロードすることは長い遅延を引き起こす。本稿では,分散階層エッジコンピューティング(HEC)システムを対象とした適応型異常検出手法のデモと構築を行う。提案手法は,検出タスクをクラウドにオフロードした場合と比較して,精度を犠牲にすることなく検出遅延を著しく低減することを示す。
論文参考訳（メタデータ） (2020-04-15T06:13:33Z)
stream-learn -- open-source Python library for difficult data stream batch analysis [0.0]
stream-learnはScikit-learnと互換性があり、ドリフトと不均衡なデータストリーム分析のために開発された。主なコンポーネントは、合成データストリームを生成するストリームジェネレータである。さらに,データストリーム分類に適応した推定器も実装されている。
論文参考訳（メタデータ） (2020-01-29T20:15:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。