Fugu-MT 論文翻訳(概要): Long Short-term Memory RNN

論文の概要: Long Short-term Memory RNN

arxiv url: http://arxiv.org/abs/2105.06756v1
Date: Fri, 14 May 2021 10:34:14 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-17 18:11:11.866955
Title: Long Short-term Memory RNN
Title（参考訳）: 長期短期記憶rnn
Authors: Christian Bakke Venner{\o}d and Adrian Kj{\ae}rran and Erling Stray Bugge
Abstract要約: 本論文は,2020年秋のノルウェー科学技術大学における機械学習プロジェクトに基づいている。このプロジェクトは,時系列予測手法の最新動向に関する文献レビューから始まった。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper is based on a machine learning project at the Norwegian University of Science and Technology, fall 2020. The project was initiated with a literature review on the latest developments within time-series forecasting methods in the scientific community over the past five years. The paper summarizes the essential aspects of this research. Furthermore, in this paper, we introduce an LSTM cell's architecture, and explain how different components go together to alter the cell's memory and predict the output. Also, the paper provides the necessary formulas and foundations to calculate a forward iteration through an LSTM. Then, the paper refers to some practical applications and research that emphasize the strength and weaknesses of LSTMs, shown within the time-series domain and the natural language processing (NLP) domain. Finally, alternative statistical methods for time series predictions are highlighted, where the paper outline ARIMA and exponential smoothing. Nevertheless, as LSTMs can be viewed as a complex architecture, the paper assumes that the reader has some knowledge of essential machine learning aspects, such as the multi-layer perceptron, activation functions, overfitting, backpropagation, bias, over- and underfitting, and more.
Abstract（参考訳）: 本論文は,2020年秋のノルウェー科学技術大学における機械学習プロジェクトに基づいている。このプロジェクトは、過去5年間の科学コミュニティにおける時系列予測手法の最新の展開に関する文献レビューから始まった。本論文は,本研究の本質的側面を概説する。さらに,本論文ではLSTMセルのアーキテクチャを導入し,異なるコンポーネントが協調してセルのメモリを変更して出力を予測する方法について説明する。また,LSTMによる前方反復計算に必要な公式や基礎も提供する。そこで本研究では,時系列領域と自然言語処理(NLP)領域で示されるLSTMの強みと弱みを強調する実践的応用と研究について述べる。最後に,ARIMAの概要と指数的平滑化を概説した時系列予測のための統計手法について述べる。それにもかかわらず、LSTMは複雑なアーキテクチャと見なすことができるため、読者は多層パーセプトロン、アクティベーション関数、オーバーフィット、バックプロパゲーション、バイアス、オーバーフィット、アンダーフィットなど、基本的な機械学習の側面についてある程度の知識を持っていると仮定する。

関連論文リスト

Inverse Reinforcement Learning Meets Large Language Model Post-Training: Basics, Advances, and Opportunities [62.05713042908654]
本稿では,逆強化学習(IRL)のレンズによる大規模言語モデル(LLM)のアライメントの進歩について概観する。我々は、人間のデータからニューラル報酬モデルを構築する必要性を強調し、このパラダイムシフトの形式的および実践的意味について議論する。
論文参考訳（メタデータ） (2025-07-17T14:22:24Z)
Recalibrating the Compass: Integrating Large Language Models into Classical Research Methods [0.48670895845367385]
本稿では,大規模言語モデル (LLM) がコミュニケーション研究における中核的な定量的手法をどのように変換しているかを検討する。古典的なアプローチを置き換えるのではなく、LLMはテキストのコーディングと解釈の新しい可能性を導入している。この論文は、分野がLLMと生成AIを統合するため、古典的な研究ロジックは依然として不可欠であると主張している。
論文参考訳（メタデータ） (2025-05-26T01:38:02Z)
Large Language models for Time Series Analysis: Techniques, Applications, and Challenges [10.347387584258222]
大規模言語モデル (LLMs) は、時系列解析において、その横断的な知識の統合と固有の注意機構を活用することによって、変革的なポテンシャルを提供する。本稿では,LLM駆動型時系列解析の体系的レビューを行う。技術、潜在的なアプリケーション、オープンな課題の実現に重点を置いています。
論文参考訳（メタデータ） (2025-05-21T04:45:11Z)
How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective [64.00022624183781]
大規模言語モデル(LLM)は、関連性を評価し、情報検索(IR)タスクをサポートする。メカニスティック・インタプリタビリティのレンズを用いて,異なるLLMモジュールが関係判断にどのように寄与するかを検討する。
論文参考訳（メタデータ） (2025-04-10T16:14:55Z)
LLM-PS: Empowering Large Language Models for Time Series Forecasting with Temporal Patterns and Semantics [56.99021951927683]
Time Series Forecasting (TSF) は、金融計画や健康モニタリングなど、多くの現実世界のドメインにおいて重要である。既存のLarge Language Models (LLM) は通常、時系列データ固有の特性を無視するため、非最適に実行する。時系列データから基本的なtextitPatterns と有意義な textitSemantics を学習し,TLF のための LLM-PS を提案する。
論文参考訳（メタデータ） (2025-03-12T11:45:11Z)
Foundational Large Language Models for Materials Research [22.77591279242839]
大規模言語モデル(LLM)は、自動分析と予測を通じて材料研究を加速する機会を提供する。本稿では,LLaMAモデルの継続事前学習を通じて発達した材料科学の基礎モデルであるLLaMatについて述べる。 LLaMatは、一般的な言語能力を維持しつつ、材料固有のNLPと構造化情報抽出に優れることを示した。
論文参考訳（メタデータ） (2024-12-12T18:46:38Z)
Recent Advances on Machine Learning for Computational Fluid Dynamics: A Survey [51.87875066383221]
本稿では、基本概念、従来の手法、ベンチマークデータセットを紹介し、CFDを改善する上で機械学習が果たす様々な役割について検討する。我々は,空気力学,燃焼,大気・海洋科学,生物流体,プラズマ,記号回帰,秩序の低減など,CFDにおけるMLの現実的な応用を強調した。シミュレーションの精度を向上し、計算時間を短縮し、流体力学のより複雑な解析を可能にすることにより、MLはCFD研究を大きく変革する可能性があるという結論を導いた。
論文参考訳（メタデータ） (2024-08-22T07:33:11Z)
Unlocking the Power of LSTM for Long Term Time Series Forecasting [27.245021350821638]
本稿では, sLSTM 上に実装したP-sLSTM という単純なアルゴリズムを提案する。これらの改良により、TSFにおけるsLSTMの性能が大幅に向上し、最先端の結果が得られた。
論文参考訳（メタデータ） (2024-08-19T13:59:26Z)
Retrieval-Enhanced Machine Learning: Synthesis and Opportunities [60.34182805429511]
検索エンハンスメントは機械学習(ML)の幅広い範囲に拡張できるこの研究は、MLの様々な領域の文献を、現在の文献から欠落している一貫した表記で合成することで、このパラダイムの正式なフレームワークであるRetrieval-Enhanced Machine Learning (REML)を導入する。本研究の目的は、様々な分野の研究者に対して、検索強化モデルの包括的、正式に構造化された枠組みを付与し、学際的な将来の研究を促進することである。
論文参考訳（メタデータ） (2024-07-17T20:01:21Z)
Mapping the Increasing Use of LLMs in Scientific Papers [99.67983375899719]
2020年1月から2024年2月にかけて、arXiv、bioRxiv、Natureのポートフォリオジャーナルで950,965の論文をまとめて、体系的で大規模な分析を行った。計算機科学の論文では, LLMの使用が着実に増加し, 最大, 最速の成長が観察された。
論文参考訳（メタデータ） (2024-04-01T17:45:15Z)
LLM Inference Unveiled: Survey and Roofline Model Insights [62.92811060490876]
大規模言語モデル(LLM)推論は急速に進化しており、機会と課題のユニークなブレンドを提示している。本調査は, 研究状況を要約するだけでなく, 屋上モデルに基づく枠組みを導入することによって, 従来の文献レビューから際立っている。このフレームワークは、ハードウェアデバイスにLSMをデプロイする際のボトルネックを特定し、実用上の問題を明確に理解する。
論文参考訳（メタデータ） (2024-02-26T07:33:05Z)
Advancing Transformer Architecture in Long-Context Large Language Models: A Comprehensive Survey [18.930417261395906]
トランスフォーマーベースの大規模言語モデル(LLM)は、知識ベース、ヒューマンインタフェース、動的エージェントなど様々な分野に適用されている。本稿では,トランスフォーマーをベースとしたLLMアーキテクチャの最近の進歩について,LLMの長期的コンテキスト能力の向上を目的とした調査を行う。
論文参考訳（メタデータ） (2023-11-21T04:59:17Z)
Instruction Tuning for Large Language Models: A Survey [52.86322823501338]
我々は、教師付き微調整(SFT)の一般的な方法論を含む、文献の体系的なレビューを行う。また、既存の戦略の欠陥を指摘しながら、SFTの潜在的な落とし穴についても、それに対する批判とともに検討する。
論文参考訳（メタデータ） (2023-08-21T15:35:16Z)
Disentangling Structured Components: Towards Adaptive, Interpretable and Scalable Time Series Forecasting [52.47493322446537]
本研究では,時空間パターンの各コンポーネントを個別にモデル化する適応的,解釈可能,スケーラブルな予測フレームワークを開発する。 SCNNは、空間時間パターンの潜在構造を算術的に特徴づける、MSSの事前定義された生成プロセスで動作する。 SCNNが3つの実世界のデータセットの最先端モデルよりも優れた性能を達成できることを示すため、大規模な実験が行われた。
論文参考訳（メタデータ） (2023-05-22T13:39:44Z)
A Survey on Few-Shot Class-Incremental Learning [11.68962265057818]
FSCIL(Few-shot class-incremental Learning)は、ディープニューラルネットワークが新しいタスクを学習する上で重要な課題である。本稿では, FSCILに関する包括的調査を行う。 FSCILはコンピュータビジョンの様々な分野で大きな成果を上げている。
論文参考訳（メタデータ） (2023-04-17T10:15:08Z)
A Survey on Deep Learning based Time Series Analysis with Frequency Transformation [74.3919960186696]
周波数変換(FT)は、時系列解析における最先端の精度と効率を高めるために、ディープラーニングモデルにますます取り入れられている。この新興分野における注目の高まりと研究の高まりにもかかわらず、現在、FTを用いたディープラーニングベースの時系列モデルの体系的レビューと詳細な分析が欠如している。本稿では,FTを用いた深層学習に基づく時系列解析における最近の研究成果を体系的に研究し,要約する総合的なレビューを紹介する。
論文参考訳（メタデータ） (2023-02-04T14:33:07Z)
Enhancing Identification of Structure Function of Academic Articles Using Contextual Information [6.28532577139029]
本稿では,学術論文の構造的機能を明らかにするためのコーパスとして,ACLカンファレンスの記事を取り上げる。従来の機械学習モデルとディープラーニングモデルを用いて、様々な特徴入力に基づいて分類器を構築する。 2) に触発された本論文は,ディープラーニングモデルに文脈情報を導入し,重要な結果を得た。
論文参考訳（メタデータ） (2021-11-28T11:21:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。