論文の概要: SciGA: A Comprehensive Dataset for Designing Graphical Abstracts in Academic Papers
- arxiv url: http://arxiv.org/abs/2507.02212v1
- Date: Thu, 03 Jul 2025 00:21:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:15.378772
- Title: SciGA: A Comprehensive Dataset for Designing Graphical Abstracts in Academic Papers
- Title(参考訳): SciGA:学術論文におけるグラフィカル抽象化設計のための包括的データセット
- Authors: Takuro Kawada, Shunsuke Kitada, Sota Nemoto, Hitoshi Iyatomi,
- Abstract要約: 約145,000の科学論文と114万の数字からなる大規模データセットであるSciGA-145kを紹介する。
GA設計支援に向けた予備的なステップとして,(1)GA内推薦,(2)GA内推薦,(2)GA間推薦,(2)他の論文からGAを抽出して新たなGAを創出する,という2つの課題を定義した。
本稿では,モデル行動のきめ細かい分析を行う新しい推奨指標である信頼度調整トップ1基底真理比(CAR)を提案する。
- 参考スコア(独自算出の注目度): 3.7186122930334724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graphical Abstracts (GAs) play a crucial role in visually conveying the key findings of scientific papers. While recent research has increasingly incorporated visual materials such as Figure 1 as de facto GAs, their potential to enhance scientific communication remains largely unexplored. Moreover, designing effective GAs requires advanced visualization skills, creating a barrier to their widespread adoption. To tackle these challenges, we introduce SciGA-145k, a large-scale dataset comprising approximately 145,000 scientific papers and 1.14 million figures, explicitly designed for supporting GA selection and recommendation as well as facilitating research in automated GA generation. As a preliminary step toward GA design support, we define two tasks: 1) Intra-GA recommendation, which identifies figures within a given paper that are well-suited to serve as GAs, and 2) Inter-GA recommendation, which retrieves GAs from other papers to inspire the creation of new GAs. We provide reasonable baseline models for these tasks. Furthermore, we propose Confidence Adjusted top-1 ground truth Ratio (CAR), a novel recommendation metric that offers a fine-grained analysis of model behavior. CAR addresses limitations in traditional ranking-based metrics by considering cases where multiple figures within a paper, beyond the explicitly labeled GA, may also serve as GAs. By unifying these tasks and metrics, our SciGA-145k establishes a foundation for advancing visual scientific communication while contributing to the development of AI for Science.
- Abstract(参考訳): 科学論文の重要な発見を視覚的に伝達する上で,図形抽象(GA)は重要な役割を担っている。
最近の研究は、図1のような視覚素材を事実上のGAとして取り入れている一方で、科学的コミュニケーションを強化する可能性はほとんど解明されていない。
さらに、効果的なGAを設計するには高度な視覚化スキルが必要であり、広く採用される上で障壁となる。
これらの課題に対処するために,約145,000の科学論文と114万の数字からなる大規模データセットであるSciGA-145kを紹介した。
GA設計サポートに向けた予備的なステップとして、我々は2つのタスクを定義します。
1)GA内推奨は、GAとして機能するのに適した所定の紙の中の人物を識別し、
2)他の論文からGAを抽出して新たなGAを創出するためのGA間勧告。
これらのタスクに対して妥当なベースラインモデルを提供します。
さらに、モデル行動のきめ細かい分析を提供する新しい推奨指標である信頼度調整トップ1基底真理比(CAR)を提案する。
CARは、紙の中の複数の数字が明示的にラベル付けされたGAを超えてGAとして機能するケースを考慮することで、従来のランキングベースのメトリクスの制限に対処する。
これらのタスクとメトリクスを統一することにより、私たちのSciGA-145kは、AI for Scienceの発展に貢献しながら、視覚科学的コミュニケーションを促進する基盤を確立します。
関連論文リスト
- HiPerRAG: High-Performance Retrieval Augmented Generation for Scientific Insights [72.82973609312178]
HiPerRAGは360万以上の科学論文から知識をインデクシングし取り出すワークフローである。
コアとなるのはマルチモーダル文書解析のための高スループットモデルであるOreoと、クエリ対応エンコーダの微調整アルゴリズムであるColTrastだ。
HiPerRAGは、既存の科学的質問応答ベンチマークと、この研究で導入された2つの新しいベンチマークで堅牢なパフォーマンスを提供する。
論文 参考訳(メタデータ) (2025-05-07T22:50:23Z) - GFM-RAG: Graph Foundation Model for Retrieval Augmented Generation [84.41557981816077]
本稿では,新しいグラフ基盤モデル (GFM) である GFM-RAG について紹介する。
GFM-RAGは、複雑なクエリ-知識関係をキャプチャするグラフ構造を理由とする、革新的なグラフニューラルネットワークによって実現されている。
効率とニューラルスケーリング法則との整合性を維持しつつ、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-02-03T07:04:29Z) - Retrieval-Augmented Generation with Graphs (GraphRAG) [84.29507404866257]
Retrieval-augmented Generation (RAG) は、追加情報を取得することによって下流タスクの実行を向上させる強力な技術である。
グラフは、その固有の「エッジで接続されたノード」の性質により、巨大な異種情報と関係情報を符号化する。
従来のRAGとは異なり、多種多様な形式とドメイン固有の関係知識のようなグラフ構造化データのユニークさは、異なるドメインでGraphRAGを設計する際、ユニークで重要な課題を生じさせる。
論文 参考訳(メタデータ) (2024-12-31T06:59:35Z) - SimGRAG: Leveraging Similar Subgraphs for Knowledge Graphs Driven Retrieval-Augmented Generation [6.568733377722896]
そこで我々はSimGRAG(Simisal Graph Enhanced Retrieval-Augmented Generation)法を提案する。
クエリテキストとナレッジグラフの整合性という課題に効果的に対処する。
SimGRAGは、質問応答と事実検証において最先端のKG駆動RAG法より優れている。
論文 参考訳(メタデータ) (2024-12-17T15:40:08Z) - Revisiting and Benchmarking Graph Autoencoders: A Contrastive Learning Perspective [28.152560472541143]
グラフオートエンコーダ(GAE)は、グラフ構造化データの意味のある表現を学習できる自己教師型学習モデルである。
コントラスト学習の原則を利用して意味のある表現を学習する汎用的で強力なGAEフレームワークであるlrGAEを紹介する。
論文 参考訳(メタデータ) (2024-10-14T07:59:30Z) - Enriched BERT Embeddings for Scholarly Publication Classification [0.13654846342364302]
NSLP 2024 FoRC Task Iは、競争として組織されたこの課題に対処する。
目的は、ある論文に対する研究分野の分類法であるOpen Research Knowledge Graph (ORKG) から、123の事前定義されたクラスのうちの1つを予測することができる分類器を開発することである。
論文 参考訳(メタデータ) (2024-05-07T09:05:20Z) - Graph Domain Adaptation: Challenges, Progress and Prospects [61.9048172631524]
本稿では,グラフ間の効果的な知識伝達パラダイムとしてグラフ領域適応を提案する。
GDAは、ソースグラフとしてタスク関連のグラフを多数導入し、ソースグラフから学習した知識をターゲットグラフに適応させる。
研究状況と課題について概説し、分類学を提案し、代表作の詳細を紹介し、今後の展望について論じる。
論文 参考訳(メタデータ) (2024-02-01T02:44:32Z) - Exploring Sparsity in Graph Transformers [67.48149404841925]
グラフ変換器(GT)は、様々なグラフ関連タスクにおいて印象的な結果を得た。
しかし、GTsの膨大な計算コストは、特に資源制約のある環境でのデプロイメントと応用を妨げる。
我々は、GTの計算複雑性を低減するのに役立つ、包括的な textbfGraph textbfTransformer textbfSParsification (GTSP) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-09T06:21:44Z) - Analysis of the first Genetic Engineering Attribution Challenge [0.11018458069795269]
第1回遺伝子工学属性チャレンジの結果を報告する。
トップスコーリングチームは、エンジニアシーケンスの真のラボ・オブ・オリジンを特定することで、従来のモデルよりも劇的にパフォーマンスを向上しました。
あるチームは、非常に高速なニューラルネットワークのないアプローチで非常に高い精度を達成した。
論文 参考訳(メタデータ) (2021-10-14T23:21:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。