論文の概要: Overview of the SciHigh Track at FIRE 2025: Research Highlight Generation from Scientific Papers
- arxiv url: http://arxiv.org/abs/2601.11582v1
- Date: Thu, 01 Jan 2026 16:25:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-25 16:54:51.772214
- Title: Overview of the SciHigh Track at FIRE 2025: Research Highlight Generation from Scientific Papers
- Title(参考訳): FIRE 2025「SciHigh Track」の概要
- Authors: Tohida Rehman, Debarshi Kumar Sanyal, Samiran Chattopadhyay,
- Abstract要約: SciHigh: Research Highlight Generation from Scientific Papers」は、簡潔で情報的で意味のある弾頭ハイライトを自動的に生成するタスクに焦点を当てている。
トラックにはMixSubデータセット cite10172215 が使用されている。
すべての投稿は、ROUGE、METEOR、BERTScoreといった確立したメトリクスを使用して評価され、著者によるハイライトとの整合性と全体的な情報性の両方を測定した。
- 参考スコア(独自算出の注目度): 7.474480823192324
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: `SciHigh: Research Highlight Generation from Scientific Papers' focuses on the task of automatically generating concise, informative, and meaningful bullet-point highlights directly from scientific abstracts. The goal of this task is to evaluate how effectively computational models can generate highlights that capture the key contributions, findings, and novelty of a paper in a concise form. Highlights help readers grasp essential ideas quickly and are often easier to read and understand than longer paragraphs, especially on mobile devices. The track uses the MixSub dataset \cite{10172215}, which provides pairs of abstracts and corresponding author-written highlights. In this inaugural edition of the track, 12 teams participated, exploring various approaches, including pre-trained language models, to generate highlights from this scientific dataset. All submissions were evaluated using established metrics such as ROUGE, METEOR, and BERTScore to measure both alignment with author-written highlights and overall informativeness. Teams were ranked based on ROUGE-L scores. The findings suggest that automatically generated highlights can reduce reading effort, accelerate literature reviews, and enhance metadata for digital libraries and academic search platforms. SciHigh provides a dedicated benchmark for advancing methods aimed at concise and accurate highlight generation from scientific writing.
- Abstract(参考訳): 科学論文「SciHigh: Research Highlight Generation from Scientific Papers」は、科学的な抽象から、簡潔で、情報的で、意味のある弾丸点のハイライトを自動生成するタスクに焦点を当てている。
本研究の目的は,論文の重要なコントリビューション,発見,新規性を簡潔な形式でキャプチャするハイライトを効果的に生成できるかを評価することである。
ハイライトは、読者が本質的なアイデアを素早く理解するのに役立ち、特にモバイルデバイスにおいて、長い段落よりも読みやすく理解しやすいことが多い。
このトラックは MixSub データセット \cite{10172215} を使用しており、抽象化と対応する著者によるハイライトのペアを提供する。
このトラックの第1版では、12チームが参加し、事前訓練された言語モデルを含むさまざまなアプローチを探求し、この科学的データセットからハイライトを生成する。
すべての投稿は、ROUGE、METEOR、BERTScoreといった確立したメトリクスを使用して評価され、著者によるハイライトとの整合性と全体的な情報性の両方を測定した。
チームはROUGE-Lスコアに基づいてランク付けされた。
その結果, 自動生成ハイライトは, 読解の労力を減らし, 文献レビューを加速し, デジタルライブラリや学術検索プラットフォームのメタデータを向上する可能性が示唆された。
SciHighは、科学的記述から簡潔で正確なハイライト生成を目的とした手法の進歩のための専用のベンチマークを提供する。
関連論文リスト
- SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [97.31347312130119]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning)は、トレーニングと評価のための137K命令フォローインスタンスのデータセットで、54のタスクをカバーする。
これらのタスクは、情報抽出、要約、質問応答、クレーム検証、分類の5つの中核的な科学文献理解能力にまたがる。
SciRIFFは、さまざまな科学分野にわたる研究文献から情報を抽出し、合成するための、完全に専門家によって書かれた高品質な命令追跡データセットである。
論文 参考訳(メタデータ) (2024-06-10T21:22:08Z) - Enriched BERT Embeddings for Scholarly Publication Classification [0.13654846342364302]
NSLP 2024 FoRC Task Iは、競争として組織されたこの課題に対処する。
目的は、ある論文に対する研究分野の分類法であるOpen Research Knowledge Graph (ORKG) から、123の事前定義されたクラスのうちの1つを予測することができる分類器を開発することである。
論文 参考訳(メタデータ) (2024-05-07T09:05:20Z) - Named Entity Recognition Based Automatic Generation of Research
Highlights [3.9410617513331863]
我々は,研究論文の異なるセクションを入力として,研究ハイライトを自動的に生成することを目指している。
入力に名前付きエンティティ認識を用いることで、生成したハイライトの品質が向上するかどうかを検討する。
論文 参考訳(メタデータ) (2023-02-25T16:33:03Z) - Generation of Highlights from Research Papers Using Pointer-Generator
Networks and SciBERT Embeddings [5.095525589147811]
我々は,入力トークンをSciBERT埋め込みにエンコードする入力に,カバレッジ機構を備えたポインタジェネレータネットワークとコンテキスト埋め込み層を用いる。
我々は、ベンチマークデータセットCSPubSumでモデルをテストし、また、自動研究ハイライト生成のための新しい論文の多分野コーパスであるMixSubを提示する。
論文 参考訳(メタデータ) (2023-02-14T12:45:14Z) - Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。
予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。
そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文 参考訳(メタデータ) (2022-12-08T11:53:12Z) - Neural Content Extraction for Poster Generation of Scientific Papers [84.30128728027375]
科学論文のポスター生成の問題は未解明である。
これまでの研究は主にポスターレイアウトとパネル構成に重点を置いていたが、コンテンツ抽出の重要性は無視された。
ポスターパネルのテキスト要素と視覚要素の両方を得るために,紙セクションのテキスト,図形,テーブルを同時に抽出するニューラル抽出モデルを提案する。
論文 参考訳(メタデータ) (2021-12-16T01:19:37Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。