論文の概要: Conditional Synthetic Data Generation for Personal Thermal Comfort
Models
- arxiv url: http://arxiv.org/abs/2203.05242v1
- Date: Thu, 10 Mar 2022 08:57:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-11 23:02:54.012985
- Title: Conditional Synthetic Data Generation for Personal Thermal Comfort
Models
- Title(参考訳): 個人熱快適モデルのための条件付き合成データ生成
- Authors: Hari Prasanna Das and Costas J. Spanos
- Abstract要約: 個人的熱的快適性モデルは、大規模なグループの平均的な応答ではなく、個人の熱的快適性反応を予測することを目的としている。
近年、機械学習アルゴリズムは、個人の熱的快適性モデル候補として大きな可能性を証明している。
しかし、しばしば建物の通常の設定内では、実験によって得られた個人的熱的快適性データは、非常に不均衡である。
本稿では,低周波クラスに対応する合成データを生成するための,最先端の条件付き合成データ生成手法を提案する。
- 参考スコア(独自算出の注目度): 7.505485586268498
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Personal thermal comfort models aim to predict an individual's thermal
comfort response, instead of the average response of a large group. Recently,
machine learning algorithms have proven to be having enormous potential as a
candidate for personal thermal comfort models. But, often within the normal
settings of a building, personal thermal comfort data obtained via experiments
are heavily class-imbalanced. There are a disproportionately high number of
data samples for the "Prefer No Change" class, as compared with the "Prefer
Warmer" and "Prefer Cooler" classes. Machine learning algorithms trained on
such class-imbalanced data perform sub-optimally when deployed in the real
world. To develop robust machine learning-based applications using the above
class-imbalanced data, as well as for privacy-preserving data sharing, we
propose to implement a state-of-the-art conditional synthetic data generator to
generate synthetic data corresponding to the low-frequency classes. Via
experiments, we show that the synthetic data generated has a distribution that
mimics the real data distribution. The proposed method can be extended for use
by other smart building datasets/use-cases.
- Abstract(参考訳): 個人の熱的快適性モデルは、大きなグループの平均的な反応ではなく、個人の熱的快適性反応を予測することを目的としている。
近年、機械学習アルゴリズムは、個人の熱的快適性モデル候補として大きな可能性を証明している。
しかし、しばしば建物の通常の設定内では、実験によって得られた個人的熱的快適性データは、非常に不均衡である。
Prefer No Change"クラスには、"Prefer Warmer"クラスや"Prefer Cooler"クラスと比較して、非常に多くのデータサンプルがあります。
このようなクラス不均衡なデータに基づいてトレーニングされた機械学習アルゴリズムは、現実世界にデプロイされたときにサブオプティマイズを実行する。
上記のクラス不均衡データとプライバシ保存データ共有を用いた頑健な機械学習アプリケーションを開発するために,最先端の条件付き合成データ生成装置を実装し,低周波クラスに対応する合成データを生成する。
実験の結果,生成した合成データは実データ分布を模倣した分布を持つことがわかった。
提案手法は,他のスマートビルディングデータセットやユースケースによって拡張することができる。
関連論文リスト
- Enhancing Indoor Temperature Forecasting through Synthetic Data in Low-Data Environments [42.8983261737774]
合成データ生成のためのSoTA AI を用いたデータ拡張手法の有効性について検討する。
そこで本研究では,実データと合成データの融合戦略を探求し,予測モデルの改善を図る。
論文 参考訳(メタデータ) (2024-06-07T12:36:31Z) - Self-Correcting Self-Consuming Loops for Generative Model Training [16.59453827606427]
機械学習モデルは、人間と機械が生成したデータの混合に基づいて、ますます訓練されている。
合成データを用いた表現学習の成功にもかかわらず、合成データを用いた生成モデルトレーニングは「自己消費ループ」を創出する
本稿では,理想化された補正関数を導入することで,自己消費生成モデルの訓練を安定化することを目的とする。
論文 参考訳(メタデータ) (2024-02-11T02:34:42Z) - Trading Off Scalability, Privacy, and Performance in Data Synthesis [11.698554876505446]
a) Howsoエンジンを導入し、(b)ランダムプロジェクションに基づく合成データ生成フレームワークを提案する。
Howsoエンジンが生成する合成データは、プライバシーと正確性に優れており、その結果、総合的なスコアが最高の結果となる。
提案するランダム・プロジェクション・ベース・フレームワークは,高い精度で合成データを生成することができ,スケーラビリティが最速である。
論文 参考訳(メタデータ) (2023-12-09T02:04:25Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Federated Privacy-preserving Collaborative Filtering for On-Device Next
App Prediction [52.16923290335873]
本稿では,モバイルデバイス使用時の次のアプリの起動を予測するための新しいSeqMFモデルを提案する。
古典行列分解モデルの構造を修正し、学習手順を逐次学習に更新する。
提案手法のもうひとつの要素は,ユーザからリモートサーバへの送信データの保護を保証する,新たなプライバシメカニズムである。
論文 参考訳(メタデータ) (2023-02-05T10:29:57Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Investigating Bias with a Synthetic Data Generator: Empirical Evidence
and Philosophical Interpretation [66.64736150040093]
機械学習の応用は、私たちの社会でますます広まりつつある。
リスクは、データに埋め込まれたバイアスを体系的に広めることである。
本稿では,特定の種類のバイアスとその組み合わせで合成データを生成するフレームワークを導入することにより,バイアスを分析することを提案する。
論文 参考訳(メタデータ) (2022-09-13T11:18:50Z) - A Kernelised Stein Statistic for Assessing Implicit Generative Models [10.616967871198689]
本稿では,合成データ生成装置の品質を評価するための基本手法を提案する。
合成データ生成装置からのサンプルサイズは所望の大きさで、生成装置がエミュレートすることを目的とした観測データのサイズは固定される。
論文 参考訳(メタデータ) (2022-05-31T23:40:21Z) - An Analysis of the Deployment of Models Trained on Private Tabular
Synthetic Data: Unexpected Surprises [4.129847064263057]
異なるプライベート(DP)合成データセットは、機械学習モデルをトレーニングするための強力なアプローチである。
差分プライベートな合成データ生成が分類に与える影響について検討する。
論文 参考訳(メタデータ) (2021-06-15T21:00:57Z) - Partially Conditioned Generative Adversarial Networks [75.08725392017698]
Generative Adversarial Networks (GAN)は、実世界のトレーニングデータセットの基盤となる確率分布を暗黙的にモデル化することで、人工データセットを合成する。
条件付きGANとその変種の導入により、これらの手法はデータセット内の各サンプルで利用可能な補助情報に基づいて条件付きサンプルを生成するように拡張された。
本研究では,標準条件付きGANがそのようなタスクに適さないことを論じ,新たなAdversarial Networkアーキテクチャとトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-07-06T15:59:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。