論文の概要: Balancing thermal comfort datasets: We GAN, but should we?
- arxiv url: http://arxiv.org/abs/2009.13154v1
- Date: Mon, 28 Sep 2020 09:09:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 21:06:26.590669
- Title: Balancing thermal comfort datasets: We GAN, but should we?
- Title(参考訳): 熱快適データセットのバランスをとる: 私たちはGANですが、すべきだろうか?
- Authors: Matias Quintana, Stefano Schiavon, Kwok Wai Tham, and Clayton Miller
- Abstract要約: 本稿では, 各種熱的快適性データセットのクラスバランス技術について文献から検討する。
この不均衡シナリオに対処するために、条件付きジェネレーティブ・アドバイサル・ネットワーク(GAN)の$texttcomfortGAN$を提案する。
その結果、$texttcomfortGAN$の実際のサンプルと生成されたサンプルで構成されたバランスの取れたデータセットに基づいてトレーニングされた分類モデルは、テストされた他の拡張メソッドよりも高いパフォーマンス(分類精度の4%から17%の増加)を持つことがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Thermal comfort assessment for the built environment has become more
available to analysts and researchers due to the proliferation of sensors and
subjective feedback methods. These data can be used for modeling comfort
behavior to support design and operations towards energy efficiency and
well-being. By nature, occupant subjective feedback is imbalanced as indoor
conditions are designed for comfort, and responses indicating otherwise are
less common. This situation creates a scenario for the machine learning
workflow where class balancing as a pre-processing step might be valuable for
developing predictive thermal comfort classification models with
high-performance. This paper investigates the various thermal comfort dataset
class balancing techniques from the literature and proposes a modified
conditional Generative Adversarial Network (GAN), $\texttt{comfortGAN}$, to
address this imbalance scenario. These approaches are applied to three publicly
available datasets, ranging from 30 and 67 participants to a global collection
of thermal comfort datasets, with 1,474; 2,067; and 66,397 data points,
respectively. This work finds that a classification model trained on a balanced
dataset, comprised of real and generated samples from $\texttt{comfortGAN}$,
has higher performance (increase between 4% and 17% in classification accuracy)
than other augmentation methods tested. However, when classes representing
discomfort are merged and reduced to three, better imbalanced performance is
expected, and the additional increase in performance by $\texttt{comfortGAN}$
shrinks to 1-2%. These results illustrate that class balancing for thermal
comfort modeling is beneficial using advanced techniques such as GANs, but its
value is diminished in certain scenarios. A discussion is provided to assist
potential users in determining which scenarios this process is useful and which
method works best.
- Abstract(参考訳): センサの拡散や主観的フィードバックの手法により,建設環境の熱的快適性評価がアナリストや研究者に利用できるようになった。
これらのデータは、エネルギー効率と幸福への設計と操作をサポートするために快適行動のモデリングに使用できる。
自然界では、室内環境が快適に設計されているため、主観的なフィードバックはバランスがとれない。
この状況は、事前処理ステップとしてのクラスバランシングが、高性能な予測熱快適分類モデルの開発に有用である、機械学習ワークフローのシナリオを生み出します。
本稿では,本論文から得られた各種熱的快適性データセットのクラスバランス技術について検討し,この不均衡シナリオに対処するための条件付き生成適応ネットワーク(GAN),$\texttt{comfortGAN}$を提案する。
これらのアプローチは、30名と67名の参加者から、それぞれ1,474名、2,067名、66,397点からなる世界規模の熱快適データセットまで、3つの公開データセットに適用される。
この研究は、$\texttt{comfortgan}$から生成した実データと実データからなるバランスデータセットでトレーニングされた分類モデルは、他の拡張法よりも高いパフォーマンス(分類精度では4%から17%)を持つ。
しかし、不快を表すクラスをマージして3つにすると、より良い不均衡なパフォーマンスが期待でき、$\texttt{comfortGAN}$のパフォーマンスが1-2%に向上する。
これらの結果は, GANなどの高度な技術を用いて, 温度快適性モデリングのためのクラスバランスが有用であるが, 一定のシナリオではその価値が低下していることを示している。
このプロセスが役に立つシナリオと最善の方法を決定する上で,潜在的なユーザを支援するための議論が提供されている。
関連論文リスト
- Conformal-in-the-Loop for Learning with Imbalanced Noisy Data [5.69777817429044]
大規模なデータセットでは、クラス不均衡とラベルノイズが広まっています。
機械学習の研究の多くは、よくラベル付けされたバランスの取れたデータを前提としている。
コンフォーマル・イン・ザ・ループ(Conformal-in-the-Loop, CitL)は,コンフォーマルな予測に基づく手法を用いて,両課題に対処する新しいトレーニングフレームワークである。
論文 参考訳(メタデータ) (2024-11-04T17:09:58Z) - On conditional diffusion models for PDE simulations [53.01911265639582]
スパース観測の予測と同化のためのスコアベース拡散モデルについて検討した。
本稿では,予測性能を大幅に向上させる自動回帰サンプリング手法を提案する。
また,条件付きスコアベースモデルに対する新たなトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2024-10-21T18:31:04Z) - Capturing Climatic Variability: Using Deep Learning for Stochastic Downscaling [0.0]
気候変動に適応するには、正確な局地的な気候情報が必要である。
ダウンスケーリング中の変動のキャプチャは、不確実性を推定し、極端な事象を特徴づけるのに不可欠である。
本稿では,GANのキャリブレーションを3つの方法で改善する手法を提案する。
論文 参考訳(メタデータ) (2024-05-31T03:04:10Z) - Feedback-guided Data Synthesis for Imbalanced Classification [10.836265321046561]
有用な合成サンプルを用いて静的データセットを拡張するためのフレームワークを提案する。
サンプルはタスクの実際のデータのサポートに近づき、十分に多様であることに気付きました。
ImageNet-LTでは、表現不足のクラスでは4%以上改善され、最先端の結果が得られます。
論文 参考訳(メタデータ) (2023-09-29T21:47:57Z) - Scaling Laws for Sparsely-Connected Foundation Models [70.41266138010657]
大規模データセット上でトレーニングしたトランスフォーマーのスケーリング挙動に及ぼすパラメータ空間の影響について検討する。
重み空間,非ゼロパラメータ数,およびトレーニングデータの量との関係を記述した最初のスケーリング法則を同定する。
論文 参考訳(メタデータ) (2023-09-15T16:29:27Z) - Uncertainty Guided Adaptive Warping for Robust and Efficient Stereo
Matching [77.133400999703]
相関に基づくステレオマッチングは優れた性能を達成した。
固定モデルによる現在のメソッドは、さまざまなデータセットで均一に動作しない。
本稿では,ロバストなステレオマッチングのための相関を動的に計算する新しい視点を提案する。
論文 参考訳(メタデータ) (2023-07-26T09:47:37Z) - MargCTGAN: A "Marginally'' Better CTGAN for the Low Sample Regime [63.851085173614]
MargCTGANは、非相関な辺縁部の特徴マッチングを追加し、結果として、下流ユーティリティと合成データの統計的性質が一貫した改善をもたらす。
論文 参考訳(メタデータ) (2023-07-16T10:28:49Z) - Conditional Synthetic Data Generation for Personal Thermal Comfort
Models [7.505485586268498]
個人的熱的快適性モデルは、大規模なグループの平均的な応答ではなく、個人の熱的快適性反応を予測することを目的としている。
近年、機械学習アルゴリズムは、個人の熱的快適性モデル候補として大きな可能性を証明している。
しかし、しばしば建物の通常の設定内では、実験によって得られた個人的熱的快適性データは、非常に不均衡である。
本稿では,低周波クラスに対応する合成データを生成するための,最先端の条件付き合成データ生成手法を提案する。
論文 参考訳(メタデータ) (2022-03-10T08:57:25Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Robust Optimal Transport with Applications in Generative Modeling and
Domain Adaptation [120.69747175899421]
ワッサーシュタインのような最適輸送(OT)距離は、GANやドメイン適応のようないくつかの領域で使用されている。
本稿では,現代のディープラーニングアプリケーションに適用可能な,ロバストなOT最適化の計算効率のよい2つの形式を提案する。
提案手法では, ノイズの多いデータセット上で, 外部分布で劣化したGANモデルをトレーニングすることができる。
論文 参考訳(メタデータ) (2020-10-12T17:13:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。