Fugu-MT 論文翻訳(概要): Transfer Learning on Transformers for Building Energy Consumption Forecasting -- A Comparative Study

論文の概要: Transfer Learning on Transformers for Building Energy Consumption Forecasting -- A Comparative Study

arxiv url: http://arxiv.org/abs/2410.14107v1
Date: Fri, 18 Oct 2024 01:26:04 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:37.276979
Title: Transfer Learning on Transformers for Building Energy Consumption Forecasting -- A Comparative Study
Title（参考訳）: 建築エネルギー消費予測のための変圧器の伝達学習-比較研究
Authors: Robert Spencer, Surangika Ranathunga, Mikael Boulic, Andries, van Heerden, Teo Susnjak,
Abstract要約: 本研究では,トランスフォーマーアーキテクチャへのトランスファーラーニング(TL)の適用について検討した。バニラトランスフォーマーアーキテクチャに加えて、時系列予測用に特別に設計されたInformerとPatchTSTについても実験を行った。実験結果から、TLは一般的に有用であるが、特に対象ドメインにデータがない場合には、TL戦略を慎重に選択して最大限の利益を得る必要があることが明らかとなった。
参考スコア（独自算出の注目度）: 0.9110413356918055
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This study investigates the application of Transfer Learning (TL) on Transformer architectures to enhance building energy consumption forecasting. Transformers are a relatively new deep learning architecture, which has served as the foundation for groundbreaking technologies such as ChatGPT. While TL has been studied in the past, these studies considered either one TL strategy or used older deep learning models such as Recurrent Neural Networks or Convolutional Neural Networks. Here, we carry out an extensive empirical study on six different TL strategies and analyse their performance under varying feature spaces. In addition to the vanilla Transformer architecture, we also experiment with Informer and PatchTST, specifically designed for time series forecasting. We use 16 datasets from the Building Data Genome Project 2 to create building energy consumption forecasting models. Experiment results reveal that while TL is generally beneficial, especially when the target domain has no data, careful selection of the exact TL strategy should be made to gain the maximum benefit. This decision largely depends on the feature space properties such as the recorded weather features. We also note that PatchTST outperforms the other two Transformer variants (vanilla Transformer and Informer). We believe our findings would assist researchers in making informed decision in using TL and transformer architectures for building energy consumption forecasting.
Abstract（参考訳）: 本研究では,トランスフォーマーアーキテクチャへのトランスファーラーニング(TL)の適用について検討した。 Transformersは比較的新しいディープラーニングアーキテクチャであり、ChatGPTのような画期的な技術の基盤となっている。 TLは過去に研究されてきたが、これらの研究は1つのTL戦略か、リカレントニューラルネットワークや畳み込みニューラルネットワークのような古いディープラーニングモデルを用いた。ここでは,6つの異なるTL戦略に関する広範な実証研究を行い,その性能を異なる特徴空間下で解析する。バニラトランスフォーマーアーキテクチャに加えて、時系列予測用に特別に設計されたInformerとPatchTSTについても実験を行った。我々は、ビルディングデータゲノムプロジェクト2から16のデータセットを使用して、ビルディングエネルギー消費予測モデルを作成します。実験結果から、TLは一般的に有用であるが、特に対象ドメインにデータがない場合には、TL戦略を慎重に選択して最大限の利益を得る必要があることが明らかとなった。この決定は、記録された気象特性のような特徴空間の性質に大きく依存する。 PatchTSTは、他の2つのTransformer(vanilla TransformerとInformer)よりも優れています。我々は,TLとトランスフォーマーアーキテクチャをエネルギー消費予測の構築に活用することで,研究者の意思決定を支援すると信じている。

関連論文リスト

Knowledge-enhanced Transformer for Multivariate Long Sequence Time-series Forecasting [4.645182684813973]
本研究では,変数間の概念的関係をよく定義された知識グラフ内にカプセル化する新しい手法を提案する。 PatchTST, Autoformer, Informer, Vanilla Transformer などのセマンティックアーキテクチャへの統合の影響について検討する。この拡張により、変数間の固有の構造的関係に対処するトランスフォーマーベースのアーキテクチャが強化される。
論文参考訳（メタデータ） (2024-11-17T11:53:54Z)
Learning on Transformers is Provable Low-Rank and Sparse: A One-layer Analysis [63.66763657191476]
低ランク計算としての効率的な数値学習と推論アルゴリズムはトランスフォーマーに基づく適応学習に優れた性能を持つことを示す。我々は、等級モデルが適応性を改善しながら一般化にどのように影響するかを分析する。適切なマグニチュードベースのテストは,テストパフォーマンスに多少依存している,と結論付けています。
論文参考訳（メタデータ） (2024-06-24T23:00:58Z)
VST++: Efficient and Stronger Visual Saliency Transformer [74.26078624363274]
我々は,グローバルな長距離依存関係を探索する,効率的で強力なVST++モデルを開発した。我々は、RGB、RGB-D、RGB-T SODベンチマークデータセット上で、トランスフォーマーベースのバックボーンにまたがってモデルを評価した。
論文参考訳（メタデータ） (2023-10-18T05:44:49Z)
A Survey of Techniques for Optimizing Transformer Inference [3.6258657276072253]
近年、トランスフォーマーニューラルネットワークの性能と応用が飛躍的に上昇している。 ChatGPTのようなトランスフォーマーベースのネットワークは、一般的な男性の生活に影響を与えている。研究者は、あらゆるレベルの抽象化でトランスフォーマー推論を最適化する手法を提案している。
論文参考訳（メタデータ） (2023-07-16T08:50:50Z)
TLNets: Transformation Learning Networks for long-range time-series prediction [17.844048490712016]
本稿では,変換に基づくネットワークアーキテクチャ設計のための新しい計画を提案する。上記の構成ブロックに基づいて,FT-Matrix,FT-SVD,FT-Conv,Conv-SVDの4つの学習モデルを開発した。上記のトランスフォーメーション学習ネットワーク(TLNet)は、複数のベースラインモデルと比較して、広範囲にテストされている。
論文参考訳（メタデータ） (2023-05-25T06:27:45Z)
Transformer-based approaches to Sentiment Detection [55.41644538483948]
テキスト分類のための4種類の最先端変圧器モデルの性能について検討した。 RoBERTa変換モデルは82.6%のスコアでテストデータセット上で最高のパフォーマンスを示し、品質予測に非常に推奨されている。
論文参考訳（メタデータ） (2023-03-13T17:12:03Z)
Full Stack Optimization of Transformer Inference: a Survey [58.55475772110702]
トランスフォーマーモデルは広範囲のアプリケーションにまたがって優れた精度を実現する。最近のTransformerモデルの推測に必要な計算量と帯域幅は、かなり増加しています。 Transformerモデルをより効率的にすることに注力している。
論文参考訳（メタデータ） (2023-02-27T18:18:13Z)
Spatio-Temporal Wind Speed Forecasting using Graph Networks and Novel Transformer Architectures [1.278093617645299]
本研究は,ノルウェー大陸棚の多段階風速予測に焦点を当てた。グラフニューラルネットワーク(GNN)アーキテクチャは、時間的相関を学習するために異なる更新機能を持つ空間的依存関係を抽出するために使用された。 LogSparse TransformerとAutoformerが風速予測に適用されたのはこれが初めてである。
論文参考訳（メタデータ） (2022-08-29T13:26:20Z)
Exploring Structure-aware Transformer over Interaction Proposals for Human-Object Interaction Detection [119.93025368028083]
我々は、新しいトランスフォーマー型ヒューマンオブジェクトインタラクション(HOI)検出器、すなわち、インタラクション提案(STIP)による構造認識トランスフォーマーを設計する。 STIPはHOIセット予測の過程を、まず相互作用の提案生成を行い、次に構造認識変換器を介して非パラメトリック相互作用提案をHOI予測に変換する2つのフェーズに分解する。構造対応トランスフォーマーは、相互作用提案間の相同的意味構造を付加してバニラトランスフォーマーをアップグレードし、各相互作用提案内の人間・物体の局所的空間構造を付加し、HOIを強化する。
論文参考訳（メタデータ） (2022-06-13T16:21:08Z)
Vision Transformers are Robust Learners [65.91359312429147]
ビジョントランスフォーマー(ViT)の一般的な腐敗や摂動、分布シフト、自然逆転例に対する堅牢性について検討します。 ViTsが実際により堅牢な学習者である理由を説明するために、定量的および定性的な指標を提供する分析を提示します。
論文参考訳（メタデータ） (2021-05-17T02:39:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。