論文の概要: Using system context information to complement weakly labeled data
- arxiv url: http://arxiv.org/abs/2107.10236v1
- Date: Mon, 19 Jul 2021 07:05:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-23 01:15:14.961482
- Title: Using system context information to complement weakly labeled data
- Title(参考訳): システムコンテキスト情報を用いた弱ラベル付きデータの補完
- Authors: Matthias Meyer, Michaela Wenner, Cl\'ement Hibert, Fabian Walter,
Lothar Thiele
- Abstract要約: センサーネットワークで収集された実世界のデータセットは、しばしば不完全で不確実なラベルを含む。
本稿では,情報グラフに形式化されたシステムコンテキスト情報を利用して,コントラスト学習による学習プロセスに組み込むことを提案する。
実世界のデータに基づいて、弱いラベル付きデータの場合、このアプローチによって精度が向上することを示す。
- 参考スコア(独自算出の注目度): 4.952316606722224
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-world datasets collected with sensor networks often contain incomplete
and uncertain labels as well as artefacts arising from the system environment.
Complete and reliable labeling is often infeasible for large-scale and
long-term sensor network deployments due to the labor and time overhead,
limited availability of experts and missing ground truth. In addition, if the
machine learning method used for analysis is sensitive to certain features of a
deployment, labeling and learning needs to be repeated for every new
deployment. To address these challenges, we propose to make use of system
context information formalized in an information graph and embed it in the
learning process via contrastive learning. Based on real-world data we show
that this approach leads to an increased accuracy in case of weakly labeled
data and leads to an increased robustness and transferability of the classifier
to new sensor locations.
- Abstract(参考訳): センサネットワークで収集された実世界のデータセットは、システム環境から生じるアーティファクトだけでなく、不完全で不確定なラベルを含むことが多い。
完全かつ信頼性の高いラベリングは、労力と時間のオーバーヘッド、専門家の可用性の制限、根拠の欠如といった理由から、大規模かつ長期的なセンサネットワークデプロイメントでは実現不可能であることが多い。
さらに、分析に使用される機械学習手法がデプロイメントの特定の機能に敏感な場合には、新しいデプロイメント毎にラベル付けと学習を繰り返す必要がある。
そこで本研究では,情報グラフに形式化されたシステムコンテキスト情報を用いて,コントラスト学習による学習プロセスに組み込む手法を提案する。
実世界のデータに基づいて,このアプローチは,弱ラベルデータの場合の精度が向上し,新たなセンサロケーションへの分類器の堅牢性と転送性が向上することを示す。
関連論文リスト
- An Automated Approach to Collecting and Labeling Time Series Data for Event Detection Using Elastic Node Hardware [18.15754187896287]
本稿では,センサデータをIoTデバイス上で直接ラベル付けする新しい組込みシステムを提案する。
本稿では,各種センサデータのキャプチャとラベル付けを効率化する,特殊なラベル付けセンサを備えたハードウェアとソフトウェアの統合ソリューションを提案する。
論文 参考訳(メタデータ) (2024-07-06T15:19:16Z) - Capturing Pertinent Symbolic Features for Enhanced Content-Based
Misinformation Detection [0.0]
誤解を招く内容の検出は、言語的・ドメイン的多様性の極端さから、大きなハードルとなる。
本稿では,この現象を特徴付ける言語特性と,最も一般的な誤情報データセットの表現方法について分析する。
ニューラルネットワークモデルと組み合わせた関連する記号的知識の適切な利用は、誤解を招くコンテンツを検出するのに有効であることを示す。
論文 参考訳(メタデータ) (2024-01-29T16:42:34Z) - VELVET: a noVel Ensemble Learning approach to automatically locate
VulnErable sTatements [62.93814803258067]
本稿では,ソースコード中の脆弱な文を見つけるための新しいアンサンブル学習手法であるVELVETを提案する。
我々のモデルは、グラフベースとシーケンスベースニューラルネットワークを組み合わせて、プログラムグラフの局所的およびグローバル的コンテキストを捕捉する。
VELVETは、合成データと実世界のデータに対して、それぞれ99.6%と43.6%の精度を達成している。
論文 参考訳(メタデータ) (2021-12-20T22:45:27Z) - DomainMix: Learning Generalizable Person Re-Identification Without Human
Annotations [89.78473564527688]
本稿では,ラベル付き合成データセットとラベル付き実世界のデータセットを用いてユニバーサルモデルをトレーニングする方法を示す。
このように、人間のアノテーションはもはや不要であり、大規模で多様な現実世界のデータセットにスケーラブルである。
実験結果から,提案手法は完全な人間のアノテーションで訓練されたアノテーションとほぼ同等であることがわかった。
論文 参考訳(メタデータ) (2020-11-24T08:15:53Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - Sense and Learn: Self-Supervision for Omnipresent Sensors [9.442811508809994]
我々は、生の知覚データから表現や特徴学習のためのSense and Learnというフレームワークを提案する。
これは、面倒なラベル付けプロセスに人間が関与することなく、注釈のないデータから、高レベルで広範囲に有用な特徴を学習できる補助的なタスクで構成されている。
提案手法は、教師付きアプローチと競合する結果を達成し、ネットワークを微調整し、ほとんどの場合、下流タスクを学習することでギャップを埋める。
論文 参考訳(メタデータ) (2020-09-28T11:57:43Z) - Adversarial Knowledge Transfer from Unlabeled Data [62.97253639100014]
本稿では,インターネット規模の未ラベルデータから知識を伝達し,分類器の性能を向上させるための新しいAdversarial Knowledge Transferフレームワークを提案する。
我々の手法の重要な新しい側面は、ラベル付けされていないソースデータは、ラベル付けされたターゲットデータと異なるクラスであることができ、個別のプリテキストタスクを定義する必要がないことである。
論文 参考訳(メタデータ) (2020-08-13T08:04:27Z) - Federated Self-Supervised Learning of Multi-Sensor Representations for
Embedded Intelligence [8.110949636804772]
スマートフォン、ウェアラブル、IoT(Internet of Things)デバイスは、教師付きモデルを学習するための集中リポジトリに蓄積できない豊富なデータを生成する。
本稿では,ウェーブレット変換に基づくテキストカルグラム・信号対応学習という自己教師付きアプローチを提案し,ラベルなしセンサ入力から有用な表現を学習する。
さまざまなパブリックデータセットのマルチビュー戦略を用いて,学習機能の品質を広範囲に評価し,すべての領域で高いパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-07-25T21:59:17Z) - Laplacian Denoising Autoencoder [114.21219514831343]
本稿では,新しいタイプの自動符号化器を用いてデータ表現を学習することを提案する。
勾配領域における潜伏クリーンデータを破損させて雑音入力データを生成する。
いくつかのビジュアルベンチマークの実験では、提案されたアプローチでより良い表現が学べることが示されている。
論文 参考訳(メタデータ) (2020-03-30T16:52:39Z) - Iterative Label Improvement: Robust Training by Confidence Based
Filtering and Dataset Partitioning [5.1293809610257775]
最先端、高容量のディープニューラルネットワークは、大量のラベル付きトレーニングデータを必要とする。
また、このデータにエラーをラベル付けする可能性も高い。
本稿では,安価な非競合データを使用することのできる新しいメタトレーニング・ラベリング手法を提案する。
論文 参考訳(メタデータ) (2020-02-07T10:42:26Z) - Exploratory Machine Learning with Unknown Unknowns [60.78953456742171]
本稿では,他のラベルと誤認識されたトレーニングデータに未知のクラスが存在するという,新たな問題設定について検討する。
本研究では,潜在的に隠蔽されたクラスを発見するために,機能空間を積極的に拡張することにより,学習データを調べ,調査する探索機械学習を提案する。
論文 参考訳(メタデータ) (2020-02-05T02:06:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。