論文の概要: Improving Editorial Workflow and Metadata Quality at Springer Nature
- arxiv url: http://arxiv.org/abs/2103.13527v1
- Date: Wed, 24 Mar 2021 23:23:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-27 00:32:07.958445
- Title: Improving Editorial Workflow and Metadata Quality at Springer Nature
- Title(参考訳): Springer Natureにおける編集ワークフローとメタデータ品質の改善
- Authors: Angelo A. Salatino, Francesco Osborne, Aliaksandr Birukou and Enrico
Motta
- Abstract要約: Smart Topic Miner(STM)は、Springer Nature編集チームを支援するアプリケーションで、コンピュータサイエンスの会議手続きをカバーするすべての書籍のボリュームに注釈を付けています。
STMは、ドイツ、中国、ブラジル、インド、日本の編集者によって年間約800巻にわたって定期的に使用されている。
特に私たちのソリューションは、アノテートに必要な時間を劇的に削減し、発見可能性を大幅に改善しました。
- 参考スコア(独自算出の注目度): 7.1717344176500335
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Identifying the research topics that best describe the scope of a scientific
publication is a crucial task for editors, in particular because the quality of
these annotations determine how effectively users are able to discover the
right content in online libraries. For this reason, Springer Nature, the
world's largest academic book publisher, has traditionally entrusted this task
to their most expert editors. These editors manually analyse all new books,
possibly including hundreds of chapters, and produce a list of the most
relevant topics. Hence, this process has traditionally been very expensive,
time-consuming, and confined to a few senior editors. For these reasons, back
in 2016 we developed Smart Topic Miner (STM), an ontology-driven application
that assists the Springer Nature editorial team in annotating the volumes of
all books covering conference proceedings in Computer Science. Since then STM
has been regularly used by editors in Germany, China, Brazil, India, and Japan,
for a total of about 800 volumes per year. Over the past three years the
initial prototype has iteratively evolved in response to feedback from the
users and evolving requirements. In this paper we present the most recent
version of the tool and describe the evolution of the system over the years,
the key lessons learnt, and the impact on the Springer Nature workflow. In
particular, our solution has drastically reduced the time needed to annotate
proceedings and significantly improved their discoverability, resulting in 9.3
million additional downloads. We also present a user study involving 9 editors,
which yielded excellent results in term of usability, and report an evaluation
of the new topic classifier used by STM, which outperforms previous versions in
recall and F-measure.
- Abstract(参考訳): 学術出版のスコープを最もよく記述した研究トピックの特定は編集者にとって重要な課題であり、特に、これらのアノテーションの品質が、オンライン図書館における適切なコンテンツを効果的に発見できるかどうかを決定するためである。
このため、世界最大の学術書出版社であるSpringer Natureは伝統的に、このタスクを最も専門的な編集者に委ねてきた。
これらの編集者は、おそらく数百の章を含む全ての新しい本を手作業で分析し、最も関連するトピックのリストを作成する。
そのため、このプロセスは伝統的に非常に高価で時間がかかり、数人の上級編集者に限られていた。
これらの理由から、2016年に私たちは、Springer Natureの編集チームを支援するオントロジー駆動のアプリケーションであるSmart Topic Miner(STM)を開発しました。
それ以来、STMはドイツ、中国、ブラジル、インド、日本の編集者によって年間約800巻にわたって定期的に使用されている。
過去3年間、最初のプロトタイプはユーザからのフィードバックと要件の進化に応じて反復的に進化してきた。
本稿では,このツールの最新バージョンについて述べるとともに,長年にわたるシステムの進化,学んだ重要な教訓,そして springer の自然ワークフローへの影響について述べる。
特に私たちのソリューションは、アノテートに必要な時間を劇的に削減し、発見可能性を大幅に改善しました。
また,ユーザビリティの面で優れた結果を得た9名の編集者を対象としたユーザ調査を行い,stmが使用するトピック分類器の評価を報告する。
関連論文リスト
- Language Modeling with Editable External Knowledge [90.7714362827356]
本稿では,新たな文書取得時のモデル動作を改善するERASEを提案する。
ドキュメントを追加するたびに、知識ベースで他のエントリを段階的に削除または書き直します。
7-13%(Mixtral-8x7B)と6-10%(Llama-3-8B)の精度を向上する。
論文 参考訳(メタデータ) (2024-06-17T17:59:35Z) - MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。
MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。
我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文 参考訳(メタデータ) (2024-06-10T15:19:09Z) - Language Models as Science Tutors [79.73256703631492]
本研究では,LMの現実的なユーザビリティを科学的アシスタントとして測定するTutorEvalとTutorChatを紹介する。
既存の対話データセットを用いた微調整ベースモデルがTutorEvalの性能を低下させることを示す。
我々はTutorChatを用いて、7Bパラメータと34Bパラメータを持つLlemmaモデルを微調整する。これらのLMチューターは32Kのコンテキストウィンドウを持ち、GSM8KとMATHに強く依存しながらTutorEvalで優れている。
論文 参考訳(メタデータ) (2024-02-16T22:24:13Z) - Trustworthy Machine Learning [57.08542102068706]
信頼に値する機械学習(TML)に関する教科書は、TMLの4つの重要なトピックの理論的および技術的な背景をカバーしている。
本稿では、上記の分野に関する重要な古典的・現代的な研究論文について論じ、その基礎となる直観を解明し、接続する。
論文 参考訳(メタデータ) (2023-10-12T11:04:17Z) - EditEval: An Instruction-Based Benchmark for Text Improvements [73.5918084416016]
編集機能の自動評価のためのインストラクションベース、ベンチマーク、評価スイートであるEditEvalを提示する。
InstructGPTとPEERが最良であることを示す事前学習モデルをいくつか評価するが,ほとんどのベースラインは教師付きSOTA以下である。
我々の分析は、タスクの編集によく使われるメトリクスが必ずしも相関しているとは限らないことを示し、最高の性能を持つプロンプトに対する最適化は、必ずしも異なるモデルに対して強い堅牢性を持つとは限らないことを示唆している。
論文 参考訳(メタデータ) (2022-09-27T12:26:05Z) - Generating Summaries for Scientific Paper Review [29.12631698162247]
機械学習とNLPにおけるトップの会場への応募の増加は、レビュアーに過剰な負担を課す問題を引き起こしている。
レビュープロセスを支援する自動システムは、問題を改善するための解決策になり得る。
本稿では,学術論文の自動レビュー要約生成について検討する。
論文 参考訳(メタデータ) (2021-09-28T21:43:53Z) - Ontology-Based Recommendation of Editorial Products [7.1717344176500335]
Smart Book Recommender (SBR)はSpringer NatureのComputer Science編集チームをサポートし、特定の場所で商品を市場に出す。
SBRは、約27Kの編集製品の意味的に強化された表現を利用して、会議に関連する書籍、ジャーナル、会議の手続を推奨します。
sbrはまた、ユーザがなぜ特定の出版物がシステムによって提案されたのかを調査できる。
論文 参考訳(メタデータ) (2021-03-24T23:23:53Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - Scalable Recommendation of Wikipedia Articles to Editors Using
Representation Learning [1.8810916321241067]
我々は、グラフ畳み込みネットワークとDoc2Vecの上にスケーラブルなシステムを開発し、ウィキペディアの記事の表現方法を学び、編集者にパーソナライズされたレコメンデーションを提供する。
筆者らは,過去の編集結果に基づいて,最新の編集結果を予測し,編集者の履歴に基づいてモデルを検証した。
この論文で使用されるデータはすべて公開されており、ウィキペディアの記事のグラフ埋め込みなどが含まれています。
論文 参考訳(メタデータ) (2020-09-24T15:56:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。