論文の概要: How Many Pages? Paper Length Prediction from the Metadata
- arxiv url: http://arxiv.org/abs/2010.15924v2
- Date: Thu, 17 Dec 2020 15:21:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 22:26:57.580107
- Title: How Many Pages? Paper Length Prediction from the Metadata
- Title(参考訳): ページ数は?
メタデータからの紙長予測
- Authors: Erion \c{C}ano and Ond\v{r}ej Bojar
- Abstract要約: 本研究は,紙長予測タスクを回帰問題として定義し,一般的な機械学習モデルを用いて実験結果を報告する。
また、出版メタデータと各ページの長さの巨大なデータセットを作成します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Being able to predict the length of a scientific paper may be helpful in
numerous situations. This work defines the paper length prediction task as a
regression problem and reports several experimental results using popular
machine learning models. We also create a huge dataset of publication metadata
and the respective lengths in number of pages. The dataset will be freely
available and is intended to foster research in this domain. As future work, we
would like to explore more advanced regressors based on neural networks and big
pretrained language models.
- Abstract(参考訳): 科学論文の長さを予測することは、多くの状況で役立つかもしれない。
本研究は,紙長予測タスクを回帰問題として定義し,一般的な機械学習モデルを用いて実験結果を報告する。
また、出版メタデータと各ページの長さの巨大なデータセットを作成します。
データセットは無償で提供され、この分野の研究を促進することを意図している。
今後の取り組みとして、ニューラルネットワークと大きな事前学習された言語モデルに基づいた、より高度なレグレッシャを探求したいと思います。
関連論文リスト
- Machine Learning for Soccer Match Result Prediction [0.9002260638342727]
本章では、利用可能なデータセット、モデルと機能のタイプ、モデルパフォーマンスを評価する方法について論じる。
本章の目的は,サッカーの試合結果予測のための機械学習の現状と今後の展開について概説することである。
論文 参考訳(メタデータ) (2024-03-12T14:00:50Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - Interactive Distillation of Large Single-Topic Corpora of Scientific
Papers [1.2954493726326113]
より堅牢だが時間を要するアプローチは、主題の専門家が文書を手書きするデータセットを構成的に構築することである。
ここでは,学術文献のターゲットデータセットを構築的に生成するための,機械学習に基づく新しいツールを紹介する。
論文 参考訳(メタデータ) (2023-09-19T17:18:36Z) - Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey [66.18478838828231]
マルチモーダルな事前訓練型大型モデルは近年ますます注目を集めている。
本稿では, 自然言語処理, コンピュータビジョン, 音声処理における従来の深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・
次に,マルチモーダル・プレトレーニング・モデル(MM-PTM)のタスク定義,課題,メリットを紹介し,データ,目的,ネットワーク,知識強化による事前トレーニングに着目して,MM-PTMについて議論する。
論文 参考訳(メタデータ) (2023-02-20T15:34:03Z) - Predicting the Citation Count and CiteScore of Journals One Year in
Advance [0.6599344783327052]
学術誌の将来の業績を予測することは、様々な利害関係者に利益をもたらすことができる課題である。
本研究では,次の暦年においてジャーナルが受ける引用回数の予測と,次の暦年においてジャーナルが割り当てられるElsevier CiteScoreの予測という2つの回帰タスクについて検討する。
我々は,我々のデータセットでトレーニングされたニューラルネットワークモデルを用いて,将来のジャーナルの性能を予測することを提案する。
論文 参考訳(メタデータ) (2022-10-24T01:32:02Z) - Adapting Pretrained Text-to-Text Models for Long Text Sequences [39.62224414485055]
我々は、時系列入力に既存の事前訓練されたテキスト・ツー・テキスト・モデルを適用する。
長文QAタスク上での競合性能を実現するための長文モデルを構築した。
論文 参考訳(メタデータ) (2022-09-21T00:41:07Z) - Efficient Nearest Neighbor Language Models [114.40866461741795]
非パラメトリックニューラルネットワークモデル(NLM)は、外部データストアを用いてテキストの予測分布を学習する。
比較性能を維持しながら、推論速度の最大6倍の高速化を実現する方法を示す。
論文 参考訳(メタデータ) (2021-09-09T12:32:28Z) - Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods
in Natural Language Processing [78.8500633981247]
本稿では,自然言語処理における新たなパラダイムにおける研究成果の探索と整理を行う。
入力xを取り込んで出力yをP(y|x)として予測するようにモデルを訓練する従来の教師付き学習とは異なり、プロンプトベースの学習は直接テキストの確率をモデル化する言語モデルに基づいている。
論文 参考訳(メタデータ) (2021-07-28T18:09:46Z) - On Anytime Learning at Macroscale [33.674452784463774]
多くの実用的なアプリケーションでは、データが一度に到着するのではなく、時間の経過とともにバッチになる。
欲求予測器は、これらが利用可能になったらすぐにバッチでトレーニングすることで、非自明な予測を生成することができるが、将来のデータの準最適利用も可能かもしれない。
荒々しい予測器は、複数のバッチをより大きなデータセットに集約するのに長い時間を要するが、最終的にははるかに優れたパフォーマンスを提供する。
論文 参考訳(メタデータ) (2021-06-17T14:45:22Z) - $n$-Reference Transfer Learning for Saliency Prediction [73.17061116358036]
本稿では,サリエンシ予測のための数発のトランスファー学習パラダイムを提案する。
提案するフレームワークは勾配ベースでモデルに依存しない。
その結果,提案フレームワークは大幅な性能向上を実現していることがわかった。
論文 参考訳(メタデータ) (2020-07-09T23:20:44Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。