Fugu-MT 論文翻訳(概要): How Many Pages? Paper Length Prediction from the Metadata

論文の概要: How Many Pages? Paper Length Prediction from the Metadata

arxiv url: http://arxiv.org/abs/2010.15924v2
Date: Thu, 17 Dec 2020 15:21:44 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-01 22:26:57.580107
Title: How Many Pages? Paper Length Prediction from the Metadata
Title（参考訳）: ページ数は? メタデータからの紙長予測
Authors: Erion \c{C}ano and Ond\v{r}ej Bojar
Abstract要約: 本研究は,紙長予測タスクを回帰問題として定義し,一般的な機械学習モデルを用いて実験結果を報告する。また、出版メタデータと各ページの長さの巨大なデータセットを作成します。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Being able to predict the length of a scientific paper may be helpful in numerous situations. This work defines the paper length prediction task as a regression problem and reports several experimental results using popular machine learning models. We also create a huge dataset of publication metadata and the respective lengths in number of pages. The dataset will be freely available and is intended to foster research in this domain. As future work, we would like to explore more advanced regressors based on neural networks and big pretrained language models.
Abstract（参考訳）: 科学論文の長さを予測することは、多くの状況で役立つかもしれない。本研究は,紙長予測タスクを回帰問題として定義し,一般的な機械学習モデルを用いて実験結果を報告する。また、出版メタデータと各ページの長さの巨大なデータセットを作成します。データセットは無償で提供され、この分野の研究を促進することを意図している。今後の取り組みとして、ニューラルネットワークと大きな事前学習された言語モデルに基づいた、より高度なレグレッシャを探求したいと思います。

関連論文リスト

MOLE: Metadata Extraction and Validation in Scientific Papers Using LLMs [54.5729817345543]
MOLEは、アラビア語以外の言語のデータセットをカバーする科学論文からメタデータ属性を自動的に抽出するフレームワークである。本手法では,複数の入力形式にまたがって文書全体を処理し,一貫した出力に対する堅牢な検証機構を組み込む。
論文参考訳（メタデータ） (2025-05-26T10:31:26Z)
Applied Machine Learning Methods with Long-Short Term Memory Based Recurrent Neural Networks for Multivariate Temperature Prediction [0.0]
本稿では,時系列予測のためのディープニューラルネットワークの開発方法について概説する。 Pythonの開発環境Jupyterは、パッケージKerasで拡張されている。研究の結果と評価から,深層ニューラルネットワークによる天気予報が短時間で達成できることが示唆された。
論文参考訳（メタデータ） (2025-03-08T16:52:27Z)
LABOR-LLM: Language-Based Occupational Representations with Large Language Models [8.909328013944567]
CAREERは、キャリア履歴の関数として労働者の次の仕事を予測する。本稿では,履歴書に基づく基礎モデルを大規模言語モデルに置き換える方法を検討する。
論文参考訳（メタデータ） (2024-06-25T23:07:18Z)
Machine Learning for Soccer Match Result Prediction [0.9002260638342727]
本章では、利用可能なデータセット、モデルと機能のタイプ、モデルパフォーマンスを評価する方法について論じる。本章の目的は,サッカーの試合結果予測のための機械学習の現状と今後の展開について概説することである。
論文参考訳（メタデータ） (2024-03-12T14:00:50Z)
Pushing the Limits of Pre-training for Time Series Forecasting in the CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文参考訳（メタデータ） (2023-10-08T08:09:51Z)
Interactive Distillation of Large Single-Topic Corpora of Scientific Papers [1.2954493726326113]
より堅牢だが時間を要するアプローチは、主題の専門家が文書を手書きするデータセットを構成的に構築することである。ここでは,学術文献のターゲットデータセットを構築的に生成するための,機械学習に基づく新しいツールを紹介する。
論文参考訳（メタデータ） (2023-09-19T17:18:36Z)
Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey [66.18478838828231]
マルチモーダルな事前訓練型大型モデルは近年ますます注目を集めている。本稿では, 自然言語処理, コンピュータビジョン, 音声処理における従来の深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・次に,マルチモーダル・プレトレーニング・モデル(MM-PTM)のタスク定義,課題,メリットを紹介し,データ,目的,ネットワーク,知識強化による事前トレーニングに着目して,MM-PTMについて議論する。
論文参考訳（メタデータ） (2023-02-20T15:34:03Z)
Predicting the Citation Count and CiteScore of Journals One Year in Advance [0.6599344783327052]
学術誌の将来の業績を予測することは、様々な利害関係者に利益をもたらすことができる課題である。本研究では,次の暦年においてジャーナルが受ける引用回数の予測と,次の暦年においてジャーナルが割り当てられるElsevier CiteScoreの予測という2つの回帰タスクについて検討する。我々は,我々のデータセットでトレーニングされたニューラルネットワークモデルを用いて,将来のジャーナルの性能を予測することを提案する。
論文参考訳（メタデータ） (2022-10-24T01:32:02Z)
Adapting Pretrained Text-to-Text Models for Long Text Sequences [39.62224414485055]
我々は、時系列入力に既存の事前訓練されたテキスト・ツー・テキスト・モデルを適用する。長文QAタスク上での競合性能を実現するための長文モデルを構築した。
論文参考訳（メタデータ） (2022-09-21T00:41:07Z)
Efficient Nearest Neighbor Language Models [114.40866461741795]
非パラメトリックニューラルネットワークモデル(NLM)は、外部データストアを用いてテキストの予測分布を学習する。比較性能を維持しながら、推論速度の最大6倍の高速化を実現する方法を示す。
論文参考訳（メタデータ） (2021-09-09T12:32:28Z)
Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing [78.8500633981247]
本稿では,自然言語処理における新たなパラダイムにおける研究成果の探索と整理を行う。入力xを取り込んで出力yをP(y|x)として予測するようにモデルを訓練する従来の教師付き学習とは異なり、プロンプトベースの学習は直接テキストの確率をモデル化する言語モデルに基づいている。
論文参考訳（メタデータ） (2021-07-28T18:09:46Z)
On Anytime Learning at Macroscale [33.674452784463774]
多くの実用的なアプリケーションでは、データが一度に到着するのではなく、時間の経過とともにバッチになる。欲求予測器は、これらが利用可能になったらすぐにバッチでトレーニングすることで、非自明な予測を生成することができるが、将来のデータの準最適利用も可能かもしれない。荒々しい予測器は、複数のバッチをより大きなデータセットに集約するのに長い時間を要するが、最終的にははるかに優れたパフォーマンスを提供する。
論文参考訳（メタデータ） (2021-06-17T14:45:22Z)
$n$-Reference Transfer Learning for Saliency Prediction [73.17061116358036]
本稿では,サリエンシ予測のための数発のトランスファー学習パラダイムを提案する。提案するフレームワークは勾配ベースでモデルに依存しない。その結果,提案フレームワークは大幅な性能向上を実現していることがわかった。
論文参考訳（メタデータ） (2020-07-09T23:20:44Z)
Ambiguity in Sequential Data: Predicting Uncertain Futures with Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文参考訳（メタデータ） (2020-03-10T09:15:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。