論文の概要: S2abEL: A Dataset for Entity Linking from Scientific Tables
- arxiv url: http://arxiv.org/abs/2305.00366v1
- Date: Sun, 30 Apr 2023 02:07:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-02 15:46:08.734414
- Title: S2abEL: A Dataset for Entity Linking from Scientific Tables
- Title(参考訳): S2abEL: 科学テーブルからのエンティティリンクのためのデータセット
- Authors: Yuze Lou, Bailey Kuehl, Erin Bransom, Sergey Feldman, Aakanksha Naik,
Doug Downey
- Abstract要約: 科学表におけるエンティティリンクのための最初のデータセットを提示する。
我々のデータセットであるS2abELは、機械学習結果テーブルにおけるELに焦点を当てています。
科学表上に, EL のための神経ベースライン法を導入する。
- 参考スコア(独自算出の注目度): 15.300960829210164
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Entity linking (EL) is the task of linking a textual mention to its
corresponding entry in a knowledge base, and is critical for many
knowledge-intensive NLP applications. When applied to tables in scientific
papers, EL is a step toward large-scale scientific knowledge bases that could
enable advanced scientific question answering and analytics. We present the
first dataset for EL in scientific tables. EL for scientific tables is
especially challenging because scientific knowledge bases can be very
incomplete, and disambiguating table mentions typically requires understanding
the papers's tet in addition to the table. Our dataset, S2abEL, focuses on EL
in machine learning results tables and includes hand-labeled cell types,
attributed sources, and entity links from the PaperswithCode taxonomy for 8,429
cells from 732 tables. We introduce a neural baseline method designed for EL on
scientific tables containing many out-of-knowledge-base mentions, and show that
it significantly outperforms a state-of-the-art generic table EL method. The
best baselines fall below human performance, and our analysis highlights
avenues for improvement.
- Abstract(参考訳): エンティティリンク(EL)は、知識ベースで対応するエントリへのテキスト参照をリンクするタスクであり、多くの知識集約型NLPアプリケーションにとって重要である。
科学論文の表に適用した場合、ELは高度な科学的質問応答と分析を可能にする大規模な科学的知識基盤へのステップである。
ELのための最初のデータセットを科学表に示す。
科学的な知識基盤は非常に不完全であり、曖昧な表の記述には典型的に表に加えて論文のテットを理解する必要があるため、科学的な表のELは特に困難である。
我々のデータセットであるS2abELは、機械学習結果テーブルのELに焦点を当てており、732のテーブルから8,429のセルに対してPaperswithCode分類から手書きのセルタイプ、属性ソース、エンティティリンクを含む。
本稿では,多くの既知基準を含む科学表上にEL用に設計されたニューラルベースライン法を導入し,最先端の汎用テーブルEL法を著しく上回っていることを示す。
最高のベースラインは人間のパフォーマンスよりも低く、私たちの分析は改善の道のりを強調します。
関連論文リスト
- SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [80.49349719239584]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning, SciRIFF)は、54のタスクに対して137Kの命令追従デモのデータセットである。
SciRIFFは、幅広い科学分野の研究文献から情報を抽出し、合成することに焦点を当てた最初のデータセットである。
論文 参考訳(メタデータ) (2024-06-10T21:22:08Z) - Towards Controlled Table-to-Text Generation with Scientific Reasoning [46.87189607486007]
本稿では,科学的文書分析の自動化を目的とした,科学的データに対するユーザの嗜好に合致する,流動的で論理的な記述を生成するための新しいタスクを提案する。
学術文献から抽出したテーブル記述ペアからなる新しい挑戦的データセットSciTabを構築し,強調されたセルとそれに対応するドメイン固有知識ベースを構築した。
その結果、大規模なモデルでは、ユーザの好みに合わせて正確なコンテンツを生成するのに苦労していることがわかりました。
論文 参考訳(メタデータ) (2023-12-08T22:57:35Z) - ACL-Fig: A Dataset for Scientific Figure Classification [15.241086410108512]
科学文献から図形と表を抽出するパイプラインと、視覚的特徴を用いて科学的図形を分類するディープラーニングベースのフレームワークを開発する。
ACLアンソロジーにおける56K研究論文から抽出された112,052の科学的資料からなる,最初の大規模自動注釈コーパスであるACL-Figを構築した。
ACL-Fig-Pilotデータセットには、19のカテゴリに属する1,671の科学的数字が含まれている。
論文 参考訳(メタデータ) (2023-01-28T20:27:35Z) - Data augmentation on graphs for table type classification [1.1859913430860336]
グラフニューラルネットワークを用いてテーブルの分類を行い、使用中のメッセージパッシングアルゴリズムのテーブル構造を利用する。
我々は,グラフベースの表表現に適したデータ拡張手法を提案することで,有望な予備結果を実現する。
論文 参考訳(メタデータ) (2022-08-23T21:54:46Z) - Entity Linking Meets Deep Learning: Techniques and Solutions [49.017379833990155]
本稿では,既存のディープラーニングに基づくEL手法の総合的なレビューと分析を行う。
組込み,特徴,アルゴリズムの3つの軸を用いて既存のDLベースのEL手法を整理する新しい分類法を提案する。
データセット上でのDLに基づくEL法の定量的性能解析を行う。
論文 参考訳(メタデータ) (2021-09-26T07:57:38Z) - Tab2Know: Building a Knowledge Base from Tables in Scientific Papers [6.514665180383298]
本稿では,学術論文の表から知識ベースを構築するための,新たなエンドツーエンドシステムであるTab2Knowを紹介する。
統計に基づく分類器と論理に基づく推論の両方を利用するパイプラインを提案する。
コンピュータサイエンス分野における論文のコーパスを用いたアプローチの実証評価は,満足度を回復した。
論文 参考訳(メタデータ) (2021-07-28T11:56:53Z) - LNN-EL: A Neuro-Symbolic Approach to Short-text Entity Linking [62.634516517844496]
本稿では,解釈可能なルールとニューラルネットワークの性能を併用したニューラルシンボリックアプローチであるLNN-ELを提案する。
ルールの使用に制約があるにもかかわらず、LNN-ELはSotAのブラックボックスニューラルアプローチと競合する。
論文 参考訳(メタデータ) (2021-06-17T20:22:45Z) - Tab.IAIS: Flexible Table Recognition and Semantic Interpretation System [84.39812458417246]
完全テーブル認識処理を行い、最も頻繁なテーブル形式をサポートする2つのルールベースのアルゴリズムを開発する。
意味情報の抽出をテーブル認識プロセスに組み込むため,グラフに基づくテーブル解釈法を開発した。
我々のテーブル認識アプローチは、最先端のアプローチと競合する結果を得る。
論文 参考訳(メタデータ) (2021-05-25T12:31:02Z) - Learning to Reason for Text Generation from Scientific Tables [100.61286775597947]
SciGenは、テキスト間のデータ生成を推論するタスクのための新しいチャレンジデータセットです。
科学的なテーブルの記述は表の内容の表面的な実現を越えて、テーブルの価値上の推論を要求します。
本研究は,scigenにおける最先端データ対テキスト生成モデルの有効性について検討し,共通指標と人的評価を用いて結果を評価する。
論文 参考訳(メタデータ) (2021-04-16T18:01:36Z) - TCN: Table Convolutional Network for Web Table Interpretation [52.32515851633981]
テーブル内情報とテーブル間情報の両方を考慮した新しいテーブル表現学習手法を提案する。
カラムタイプ予測ではf1の4.8%、カラム対関係予測ではf1の4.1%で競合ベースラインを上回ることができる。
論文 参考訳(メタデータ) (2021-02-17T02:18:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。