Fugu-MT 論文翻訳(概要): Deep Learning Calabi-Yau four folds with hybrid and recurrent neural network architectures

論文の概要: Deep Learning Calabi-Yau four folds with hybrid and recurrent neural network architectures

arxiv url: http://arxiv.org/abs/2405.17406v1
Date: Mon, 27 May 2024 17:55:05 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-28 14:04:26.433913
Title: Deep Learning Calabi-Yau four folds with hybrid and recurrent neural network architectures
Title（参考訳）: ハイブリッドおよびリカレントニューラルネットワークアーキテクチャを用いたDeep Learning Calabi-Yau 4つのフォールド
Authors: H. L. Dao,
Abstract要約: 約100万の完全交点Calabi-Yau 4-folds (CICY4) のデータセットにディープラーニングを適用し、4つの数字を機械学習する。 h1,1,h2,1,h3,1,h2,2$の予測精度は72%のトレーニング率で,CNN-LSTM-400が最適である。トレーニング率72%と比較すると、大幅な改善がある。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this work, we report the results of applying deep learning based on hybrid convolutional-recurrent and purely recurrent neural network architectures to the dataset of almost one million complete intersection Calabi-Yau four-folds (CICY4) to machine-learn their four Hodge numbers $h^{1,1}, h^{2,1}, h^{3,1}, h^{2,2}$. In particular, we explored and experimented with twelve different neural network models, nine of which are convolutional-recurrent (CNN-RNN) hybrids with the RNN unit being either GRU (Gated Recurrent Unit) or Long Short Term Memory (LSTM). The remaining four models are purely recurrent neural networks based on LSTM. In terms of the $h^{1,1}, h^{2,1}, h^{3,1}, h^{2,2}$ prediction accuracies, at 72% training ratio, our best performing individual model is CNN-LSTM-400, a hybrid CNN-LSTM with the LSTM hidden size of 400, which obtained 99.74%, 98.07%, 95.19%, 81.01%, our second best performing individual model is LSTM-448, an LSTM-based model with the hidden size of 448, which obtained 99.74%, 97.51%, 94.24%, and 78.63%. These results were improved by forming ensembles of the top two, three or even four models. Our best ensemble, consisting of the top three models, achieved the accuracies of 99.80%, 98.40%, 95.80%, 83.02%. At 80% training ratio, the top two performing models LSTM-448 and LSTM-424 are both LSTM-based with the hidden sizes of 448 and 424. Compared with the 72% training ratio, there is a significant improvement of accuracies, which reached 99.85%, 98.66%, 96.26%, 84.77% for the best individual model and 99.88%, 98.91%, 96.96%, 86.78% for the best ensemble.
Abstract（参考訳）: 本研究では,ハイブリッド畳み込みと純粋に反復するニューラルネットワークアーキテクチャに基づくディープラーニングを,約100万の完全交点(CICY4)のデータセットに適用して,ホッジ数$h^{1,1},h^{2,1},h^{3,1},h^{2,2}$のマシン学習を行った。特に,12種類のニューラルネットワークモデルを探索,実験した。そのうち9つは畳み込みリカレント(CNN-RNN)ハイブリッドであり,RNNユニットはGRU(Gated Recurrent Unit)またはLong Short Term Memory(LSTM)である。残りの4つのモデルはLSTMに基づく純粋にリカレントなニューラルネットワークである。 h^{1,1}, h^{2,1}, h^{3,1}, h^{2,2}$ 予測精度 72% のトレーニング比で、我々の最高の個別モデルは CNN-LSTM-400, LSTM隠蔽サイズ 400 のハイブリッド CNN-LSTM, 99.74%, 98.07%, 95.19%, 81.01%, LSTM-448, 隠蔽サイズ 448, 99.74%, 97.51%, 94.24%, 78.63% である。これらの結果はトップ2、3または4モデルのアンサンブルを形成することで改善された。私たちのベストアンサンブルは上位3モデルで構成され、99.80%、98.40%、95.80%、83.02%の精度を達成した。 80%のトレーニング比率で、LSTM-448とLSTM-424の上位2つはLSTMベースであり、隠されたサイズは448と424である。 72%のトレーニング比と比較して、精度は99.85%、98.66%、96.26%、84.77%、99.88%、98.91%、96.96%、86.78%に達した。

関連論文リスト

Towards Sample Efficient Entanglement Classification for 3 and 4 Qubit Systems: A Tailored CNN-BiLSTM Approach [6.448866790627225]
畳み込みと双方向長短期記憶ネットワーク(CNN-BiLSTM)を統合したハイブリッドニューラルネットワークアーキテクチャを提案する。この設計では、ローカルな特徴抽出にCNN、シーケンシャルな依存性モデリングにBiLSTMを活用し、最小限のトレーニングデータから堅牢な特徴学習を可能にする。わずか100のサンプルでトレーニングされた場合、アーキテクチャ2は3ビットと4ビットの両方で90%を超える分類精度を維持し、数十のエポックで急速に失われることを示した。
論文参考訳（メタデータ） (2026-01-30T04:59:44Z)
From Memorization to Creativity: LLM as a Designer of Novel Neural-Architectures [48.83701310501069]
大規模言語モデル(LLM)は、プログラム合成において優れているが、ニューラルネットワーク設計(信頼性、性能、構造的ノベルティ)を自律的にナビゲートする能力は、未調査のままである。コード指向LLMをクローズドループ合成フレームワークに配置し、22の教師付き微調整サイクルの進化を解析することによって、この問題に対処する。
論文参考訳（メタデータ） (2026-01-06T13:20:28Z)
A Unified Platform to Evaluate STDP Learning Rule and Synapse Model using Pattern Recognition in a Spiking Neural Network [0.0]
We developed a unified platform to evaluate Ideal, Linear, and Non-linear $textPr_0.7textCa_0.3textMnO_3$ memristor-based synapse model。列車セットが小さいMNISTと大型テストセットの2層SNNでは, それぞれ92.73 %, 91.07 %, 80 %の精度を実現している。
論文参考訳（メタデータ） (2025-06-24T07:10:43Z)
Malware Classification from Memory Dumps Using Machine Learning, Transformers, and Large Language Models [1.038088229789127]
本研究では,異なる特徴セットとデータ構成を用いたマルウェア分類タスクにおける各種分類モデルの性能について検討する。 XGBはTop 45 Featuresで87.42%の精度を達成し、他の全てのモデルを上回った。ディープラーニングモデルはパフォーマンスが悪く、RNNは66.71%の精度でトランスフォーマーは71.59%に達した。
論文参考訳（メタデータ） (2025-03-04T00:24:21Z)
Kimi k1.5: Scaling Reinforcement Learning with LLMs [84.2229964736678]
我々は、強化学習で訓練された最新のマルチモーダル言語モデル、Kimi k1.5の訓練実践について報告する。長いコンテキストスケーリングと改善されたポリシー最適化手法が、我々のアプローチの鍵となる要素である。本システムは,複数のベンチマークやモダリティに対して,最先端の推論性能を実現する。
論文参考訳（メタデータ） (2025-01-22T02:48:14Z)
A Comparative Study of Hybrid Models in Health Misinformation Text Classification [0.43695508295565777]
本研究では、オンラインソーシャルネットワーク(OSN)上での新型コロナウイルス関連誤情報検出における機械学習(ML)モデルとディープラーニング(DL)モデルの有効性を評価する。本研究は, 従来のMLアルゴリズムよりも, DLおよびハイブリッドDLモデルの方が, OSN上の新型コロナウイルスの誤情報を検出するのに有効であることが示唆された。
論文参考訳（メタデータ） (2024-10-08T19:43:37Z)
Common 7B Language Models Already Possess Strong Math Capabilities [61.61442513067561]
本稿では,LLaMA-2 7Bモデルと事前学習を併用したモデルが,すでに強力な数学的能力を示していることを示す。拡張スケーリングの可能性は、公開されている数学の質問の不足によって制限されている。
論文参考訳（メタデータ） (2024-03-07T18:00:40Z)
A model for multi-attack classification to improve intrusion detection performance using deep learning approaches [0.0]
ここでの目的は、悪意のある攻撃を識別するための信頼性の高い侵入検知メカニズムを作ることである。ディープラーニングベースのソリューションフレームワークは、3つのアプローチから成り立っている。最初のアプローチは、adamax、SGD、adagrad、adam、RMSprop、nadam、adadeltaといった7つの機能を持つLong-Short Term Memory Recurrent Neural Network (LSTM-RNN)である。モデルは特徴を自己学習し、攻撃クラスをマルチアタック分類として分類する。
論文参考訳（メタデータ） (2023-10-25T05:38:44Z)
QLoRA: Efficient Finetuning of Quantized LLMs [66.58009990713134]
我々は,48GBのGPU上で65Bパラメータモデルを微調整するのに十分なメモリ使用量を削減する,効率的な微調整手法QLoRAを提案する。 QLoRAは凍結した4ビット量子化事前学習言語モデルを通して低ランクアダプタ(LoRA)に逆伝搬する最高のモデルファミリであるGuanacoは、Vicunaベンチマークでリリースされたすべてのモデルより優れています。
論文参考訳（メタデータ） (2023-05-23T17:50:33Z)
Short-Term Aggregated Residential Load Forecasting using BiLSTM and CNN-BiLSTM [0.3499870393443268]
短期的な住宅負荷予測が注目の的となっている。最近、この問題に対処するためにディープニューラルネットワークが活用されている。本稿では、双方向長短期メモリ(BiLSTM)と畳み込みニューラルネットワークに基づくBiLSTMの機能について検討する。
論文参考訳（メタデータ） (2023-02-10T03:11:02Z)
Bayesian Neural Network Language Modeling for Speech Recognition [59.681758762712754]
長期記憶リカレントニューラルネットワーク(LSTM-RNN)とトランスフォーマーで表される最先端のニューラルネットワーク言語モデル(NNLM)は非常に複雑になりつつある。本稿では,LSTM-RNN と Transformer LM の基盤となる不確実性を考慮するために,ベイズ学習フレームワークの全体構造を提案する。
論文参考訳（メタデータ） (2022-08-28T17:50:19Z)
Use of 1D-CNN for input data size reduction of LSTM in Hourly Rainfall-Runoff modeling [0.0]
CNNsLSTMは石狩川流域で1時間ごとの降雨・流出モデルとして実装された。 CNNsLSTMの結果は、1D-CNNとLSTMを時差入力のみ(LSTMwHour)、1D-CNNとLSTMの並列アーキテクチャ(CNNpLSTM)、日毎および時差入力データ(LSTMwDpH)を用いたLSTMアーキテクチャと比較した。
論文参考訳（メタデータ） (2021-11-07T23:46:06Z)
End-to-end LSTM based estimation of volcano event epicenter localization [55.60116686945561]
火山イベントの局所化問題に対処するために, エンドツーエンドのLSTMスキームを提案する。 LSTMは、時間変化の信号のダイナミクスを捉えることができるため、選択された。その結果、LSTMベースのアーキテクチャは成功率、すなわち1.0Km未満のエラーが48.5%に等しいことを示した。
論文参考訳（メタデータ） (2021-10-27T17:11:33Z)
A Battle of Network Structures: An Empirical Study of CNN, Transformer, and MLP [121.35904748477421]
畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンのための支配的なディープニューラルネットワーク(DNN)アーキテクチャである。トランスフォーマーとマルチ層パーセプトロン(MLP)ベースのモデル(Vision TransformerやVision-Mixer)が新しいトレンドを導い始めた。本稿では,これらのDNN構造について実証的研究を行い,それぞれの長所と短所を理解しようとする。
論文参考訳（メタデータ） (2021-08-30T06:09:02Z)
Improving Deep Learning for HAR with shallow LSTMs [70.94062293989832]
本稿では,DeepConvLSTMを2層LSTMではなく1層LSTMに変更することを提案する。この結果は、シーケンシャルデータを扱う場合、少なくとも2層LSTMが必要であるという信念とは対照的である。
論文参考訳（メタデータ） (2021-08-02T08:14:59Z)
ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文参考訳（メタデータ） (2021-05-07T11:39:05Z)
Towards Extremely Compact RNNs for Video Recognition with Fully Decomposed Hierarchical Tucker Structure [41.41516453160845]
完全に分解された階層型タッカー(FDHT)構造を持つ非常にコンパクトなRNNモデルを提案する。複数のポピュラービデオ認識データセットを用いた実験結果から,完全分解型階層型タッカー型lstmは極めてコンパクトかつ高効率であることがわかった。
論文参考訳（メタデータ） (2021-04-12T18:40:44Z)
Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文参考訳（メタデータ） (2019-10-12T22:07:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。