論文の概要: Enhancing Identification of Structure Function of Academic Articles
Using Contextual Information
- arxiv url: http://arxiv.org/abs/2111.14110v2
- Date: Thu, 2 Dec 2021 04:19:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-04 14:32:12.737437
- Title: Enhancing Identification of Structure Function of Academic Articles
Using Contextual Information
- Title(参考訳): 文脈情報を用いた学術論文の構造関数の同定の促進
- Authors: Bowen Ma, Chengzhi Zhang, Yuzhuo Wang, Sanhong Deng
- Abstract要約: 本稿では,学術論文の構造的機能を明らかにするためのコーパスとして,ACLカンファレンスの記事を取り上げる。
従来の機械学習モデルとディープラーニングモデルを用いて、様々な特徴入力に基づいて分類器を構築する。
2) に触発された本論文は,ディープラーニングモデルに文脈情報を導入し,重要な結果を得た。
- 参考スコア(独自算出の注目度): 6.28532577139029
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the enrichment of literature resources, researchers are facing the
growing problem of information explosion and knowledge overload. To help
scholars retrieve literature and acquire knowledge successfully, clarifying the
semantic structure of the content in academic literature has become the
essential research question. In the research on identifying the structure
function of chapters in academic articles, only a few studies used the deep
learning model and explored the optimization for feature input. This limits the
application, optimization potential of deep learning models for the research
task. This paper took articles of the ACL conference as the corpus. We employ
the traditional machine learning models and deep learning models to construct
the classifiers based on various feature input. Experimental results show that
(1) Compared with the chapter content, the chapter title is more conducive to
identifying the structure function of academic articles. (2) Relative position
is a valuable feature for building traditional models. (3) Inspired by (2),
this paper further introduces contextual information into the deep learning
models and achieved significant results. Meanwhile, our models show good
migration ability in the open test containing 200 sampled non-training samples.
We also annotated the ACL main conference papers in recent five years based on
the best practice performing models and performed a time series analysis of the
overall corpus. This work explores and summarizes the practical features and
models for this task through multiple comparative experiments and provides a
reference for related text classification tasks. Finally, we indicate the
limitations and shortcomings of the current model and the direction of further
optimization.
- Abstract(参考訳): 文献資源の充実により、研究者は情報爆発と知識過剰の増大する問題に直面している。
研究者が文学を修得し知識を得るのを助けるため、学術文献の内容の意味構造を明らかにすることが本質的な研究課題となっている。
学術論文における章の構造関数の同定に関する研究において,深層学習モデルを用いて特徴入力の最適化を検討した研究はごくわずかであった。
これにより、研究課題に対するディープラーニングモデルの応用、最適化の可能性を制限する。
本稿ではACLカンファレンスの記事をコーパスとして取り上げる。
従来の機械学習モデルとディープラーニングモデルを用いて、様々な特徴入力に基づいて分類器を構築する。
実験結果から,(1)章の内容と比較すると,章題は学術論文の構造的機能を明らかにするのに有用であることが示唆された。
2) 相対的な位置は、伝統的なモデルを構築する上で価値のある特徴である。
3)(2)に触発され,さらに深層学習モデルに文脈情報を導入し,有意な結果を得た。
一方,200サンプルの非トレーニングサンプルを含むオープンテストでは,良好なマイグレーション能力を示す。
また,過去5年間のaclメイン・カンファレンスの論文にベスト・プラクティス・パフォーマンス・モデルに基づいて注釈を付け,コーパス全体の時系列分析を行った。
本研究は,複数の比較実験を通じて,本課題の実践的特徴とモデルを探索,要約し,関連するテキスト分類タスクへの参照を提供する。
最後に,現在のモデルの限界と欠点,さらなる最適化の方向性を示す。
関連論文リスト
- Why do you cite? An investigation on citation intents and decision-making classification processes [1.7812428873698407]
本研究は,引用意図を信頼して分類することの重要性を強調する。
本稿では,citation Intent Classification (CIC) のための高度なアンサンブル戦略を用いた研究について述べる。
我々のモデルの1つは、SciCiteベンチマークで89.46%のマクロF1スコアを持つ新しい最先端(SOTA)として設定されている。
論文 参考訳(メタデータ) (2024-07-18T09:29:33Z) - Retrieval-Enhanced Machine Learning: Synthesis and Opportunities [60.34182805429511]
検索エンハンスメントは機械学習(ML)の幅広い範囲に拡張できる
この研究は、MLの様々な領域の文献を、現在の文献から欠落している一貫した表記で合成することで、このパラダイムの正式なフレームワークであるRetrieval-Enhanced Machine Learning (REML)を導入する。
本研究の目的は、様々な分野の研究者に対して、検索強化モデルの包括的、正式に構造化された枠組みを付与し、学際的な将来の研究を促進することである。
論文 参考訳(メタデータ) (2024-07-17T20:01:21Z) - Learn From Model Beyond Fine-Tuning: A Survey [78.80920533793595]
Learn From Model (LFM) は、モデルインターフェースに基づいた基礎モデル(FM)の研究、修正、設計に焦点を当てている。
LFM技術の研究は、モデルチューニング、モデル蒸留、モデル再利用、メタラーニング、モデル編集の5つの分野に大別できる。
本稿では, LFM の観点から, FM に基づく現在の手法を概観する。
論文 参考訳(メタデータ) (2023-10-12T10:20:36Z) - A Survey on Few-Shot Class-Incremental Learning [11.68962265057818]
FSCIL(Few-shot class-incremental Learning)は、ディープニューラルネットワークが新しいタスクを学習する上で重要な課題である。
本稿では, FSCILに関する包括的調査を行う。
FSCILはコンピュータビジョンの様々な分野で大きな成果を上げている。
論文 参考訳(メタデータ) (2023-04-17T10:15:08Z) - Algorithmic Ghost in the Research Shell: Large Language Models and
Academic Knowledge Creation in Management Research [0.0]
本稿では,学術知識創造における大規模言語モデルの役割について考察する。
これには、書き込み、編集、レビュー、データセットの作成、キュレーションが含まれる。
論文 参考訳(メタデータ) (2023-03-10T14:25:29Z) - What Makes Good Contrastive Learning on Small-Scale Wearable-based
Tasks? [59.51457877578138]
本研究では,ウェアラブル型行動認識タスクにおけるコントラスト学習について検討する。
本稿では,PyTorchライブラリのtextttCL-HAR について述べる。
論文 参考訳(メタデータ) (2022-02-12T06:10:15Z) - Neural Ranking Models for Document Retrieval [11.886543741028127]
ランキングに対するいくつかのアプローチは、手作りの機能セットを使った従来の機械学習アルゴリズムに基づいている。
ディープラーニングモデルは、ランキングタスクの生データから機能を抽出するためにエンドツーエンドでトレーニングされる。
さまざまなディープラーニングモデルが提案されており、各モデルはランキングに使用される特徴を抽出するためのニューラルネットワークコンポーネントのセットを提示している。
論文 参考訳(メタデータ) (2021-02-23T19:30:37Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - Method and Dataset Entity Mining in Scientific Literature: A CNN +
Bi-LSTM Model with Self-attention [21.93889297841459]
MDERと呼ばれる新しいエンティティ認識モデルを提案し、科学的論文から効果的にメソッドとデータセットを抽出することができる。
我々は,NLP,CV,データマイニング,AIの4つの研究分野の論文から構築したデータセットのモデルを評価する。
論文 参考訳(メタデータ) (2020-10-26T13:38:43Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Rethinking Generalization of Neural Models: A Named Entity Recognition
Case Study [81.11161697133095]
NERタスクをテストベッドとして、異なる視点から既存モデルの一般化挙動を分析する。
詳細な分析による実験は、既存のニューラルNERモデルのボトルネックを診断する。
本論文の副産物として,最近のNER論文の包括的要約を含むプロジェクトをオープンソース化した。
論文 参考訳(メタデータ) (2020-01-12T04:33:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。