Fugu-MT 論文翻訳(概要): Conditional Synthetic Data Generation for Personal Thermal Comfort Models

論文の概要: Conditional Synthetic Data Generation for Personal Thermal Comfort Models

arxiv url: http://arxiv.org/abs/2203.05242v1
Date: Thu, 10 Mar 2022 08:57:25 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-11 23:02:54.012985
Title: Conditional Synthetic Data Generation for Personal Thermal Comfort Models
Title（参考訳）: 個人熱快適モデルのための条件付き合成データ生成
Authors: Hari Prasanna Das and Costas J. Spanos
Abstract要約: 個人的熱的快適性モデルは、大規模なグループの平均的な応答ではなく、個人の熱的快適性反応を予測することを目的としている。近年、機械学習アルゴリズムは、個人の熱的快適性モデル候補として大きな可能性を証明している。しかし、しばしば建物の通常の設定内では、実験によって得られた個人的熱的快適性データは、非常に不均衡である。本稿では,低周波クラスに対応する合成データを生成するための,最先端の条件付き合成データ生成手法を提案する。
参考スコア（独自算出の注目度）: 7.505485586268498
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Personal thermal comfort models aim to predict an individual's thermal comfort response, instead of the average response of a large group. Recently, machine learning algorithms have proven to be having enormous potential as a candidate for personal thermal comfort models. But, often within the normal settings of a building, personal thermal comfort data obtained via experiments are heavily class-imbalanced. There are a disproportionately high number of data samples for the "Prefer No Change" class, as compared with the "Prefer Warmer" and "Prefer Cooler" classes. Machine learning algorithms trained on such class-imbalanced data perform sub-optimally when deployed in the real world. To develop robust machine learning-based applications using the above class-imbalanced data, as well as for privacy-preserving data sharing, we propose to implement a state-of-the-art conditional synthetic data generator to generate synthetic data corresponding to the low-frequency classes. Via experiments, we show that the synthetic data generated has a distribution that mimics the real data distribution. The proposed method can be extended for use by other smart building datasets/use-cases.
Abstract（参考訳）: 個人の熱的快適性モデルは、大きなグループの平均的な反応ではなく、個人の熱的快適性反応を予測することを目的としている。近年、機械学習アルゴリズムは、個人の熱的快適性モデル候補として大きな可能性を証明している。しかし、しばしば建物の通常の設定内では、実験によって得られた個人的熱的快適性データは、非常に不均衡である。 Prefer No Change"クラスには、"Prefer Warmer"クラスや"Prefer Cooler"クラスと比較して、非常に多くのデータサンプルがあります。このようなクラス不均衡なデータに基づいてトレーニングされた機械学習アルゴリズムは、現実世界にデプロイされたときにサブオプティマイズを実行する。上記のクラス不均衡データとプライバシ保存データ共有を用いた頑健な機械学習アプリケーションを開発するために,最先端の条件付き合成データ生成装置を実装し,低周波クラスに対応する合成データを生成する。実験の結果,生成した合成データは実データ分布を模倣した分布を持つことがわかった。提案手法は,他のスマートビルディングデータセットやユースケースによって拡張することができる。

関連論文リスト

Self-Consuming Generative Models with Adversarially Curated Data [7.535438563518571]
本研究では, 自己消費再学習ループにおいて, ノイズや逆向きにキュレートされたデータを用いて生成モデルがどのように進化するかを考察する。我々は、プラットフォームが悪質なユーザーを雇い、実際のユーザーの好みからライバルのモデルを誤認識させるような、競合する敵のシナリオに対する攻撃アルゴリズムを設計する。
論文参考訳（メタデータ） (2025-05-14T19:54:55Z)
Enhancing Indoor Temperature Forecasting through Synthetic Data in Low-Data Environments [42.8983261737774]
合成データ生成のためのSoTA AI を用いたデータ拡張手法の有効性について検討する。そこで本研究では,実データと合成データの融合戦略を探求し,予測モデルの改善を図る。
論文参考訳（メタデータ） (2024-06-07T12:36:31Z)
Self-Correcting Self-Consuming Loops for Generative Model Training [16.59453827606427]
機械学習モデルは、人間と機械が生成したデータの混合に基づいて、ますます訓練されている。合成データを用いた表現学習の成功にもかかわらず、合成データを用いた生成モデルトレーニングは「自己消費ループ」を創出する本稿では,理想化された補正関数を導入することで,自己消費生成モデルの訓練を安定化することを目的とする。
論文参考訳（メタデータ） (2024-02-11T02:34:42Z)
Trading Off Scalability, Privacy, and Performance in Data Synthesis [11.698554876505446]
a) Howsoエンジンを導入し、(b)ランダムプロジェクションに基づく合成データ生成フレームワークを提案する。 Howsoエンジンが生成する合成データは、プライバシーと正確性に優れており、その結果、総合的なスコアが最高の結果となる。提案するランダム・プロジェクション・ベース・フレームワークは,高い精度で合成データを生成することができ,スケーラビリティが最速である。
論文参考訳（メタデータ） (2023-12-09T02:04:25Z)
Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文参考訳（メタデータ） (2023-10-25T20:32:02Z)
Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文参考訳（メタデータ） (2023-05-16T07:30:29Z)
Federated Privacy-preserving Collaborative Filtering for On-Device Next App Prediction [52.16923290335873]
本稿では,モバイルデバイス使用時の次のアプリの起動を予測するための新しいSeqMFモデルを提案する。古典行列分解モデルの構造を修正し、学習手順を逐次学習に更新する。提案手法のもうひとつの要素は,ユーザからリモートサーバへの送信データの保護を保証する,新たなプライバシメカニズムである。
論文参考訳（メタデータ） (2023-02-05T10:29:57Z)
Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文参考訳（メタデータ） (2022-10-05T09:17:27Z)
Investigating Bias with a Synthetic Data Generator: Empirical Evidence and Philosophical Interpretation [66.64736150040093]
機械学習の応用は、私たちの社会でますます広まりつつある。リスクは、データに埋め込まれたバイアスを体系的に広めることである。本稿では,特定の種類のバイアスとその組み合わせで合成データを生成するフレームワークを導入することにより,バイアスを分析することを提案する。
論文参考訳（メタデータ） (2022-09-13T11:18:50Z)
A Kernelised Stein Statistic for Assessing Implicit Generative Models [10.616967871198689]
本稿では,合成データ生成装置の品質を評価するための基本手法を提案する。合成データ生成装置からのサンプルサイズは所望の大きさで、生成装置がエミュレートすることを目的とした観測データのサイズは固定される。
論文参考訳（メタデータ） (2022-05-31T23:40:21Z)
An Analysis of the Deployment of Models Trained on Private Tabular Synthetic Data: Unexpected Surprises [4.129847064263057]
異なるプライベート(DP)合成データセットは、機械学習モデルをトレーニングするための強力なアプローチである。差分プライベートな合成データ生成が分類に与える影響について検討する。
論文参考訳（メタデータ） (2021-06-15T21:00:57Z)
Partially Conditioned Generative Adversarial Networks [75.08725392017698]
Generative Adversarial Networks (GAN)は、実世界のトレーニングデータセットの基盤となる確率分布を暗黙的にモデル化することで、人工データセットを合成する。条件付きGANとその変種の導入により、これらの手法はデータセット内の各サンプルで利用可能な補助情報に基づいて条件付きサンプルを生成するように拡張された。本研究では,標準条件付きGANがそのようなタスクに適さないことを論じ,新たなAdversarial Networkアーキテクチャとトレーニング戦略を提案する。
論文参考訳（メタデータ） (2020-07-06T15:59:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。