論文の概要: The Nature of NLP: Analyzing Contributions in NLP Papers
- arxiv url: http://arxiv.org/abs/2409.19505v2
- Date: Sun, 01 Jun 2025 23:12:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-03 20:53:52.973456
- Title: The Nature of NLP: Analyzing Contributions in NLP Papers
- Title(参考訳): NLPの性質:NLP論文における貢献の分析
- Authors: Aniket Pramanick, Yufang Hou, Saif M. Mohammad, Iryna Gurevych,
- Abstract要約: 我々は,NLP研究論文の要約として,NLPコントリビューション(NLPコントリビューション)の分類法を提案し,NLPコントリビューション(NLPコントリビューション)を導入した。
NLPの研究は、1970年代から80年代にかけて言語と人間中心の研究に焦点が当てられ、1990年代と2000年代に打ち切られ、2010年代後半から再び上昇し始めた。
私たちのデータセットと分析は、研究トレンドをトレースするための強力なレンズを提供し、インフォグラフィックでデータ駆動の文献調査を生成する可能性を提供します。
- 参考スコア(独自算出の注目度): 77.31665252336157
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Natural Language Processing (NLP) is an established and dynamic field. Despite this, what constitutes NLP research remains debated. In this work, we address the question by quantitatively examining NLP research papers. We propose a taxonomy of research contributions and introduce NLPContributions, a dataset of nearly $2k$ NLP research paper abstracts, carefully annotated to identify scientific contributions and classify their types according to this taxonomy. We also introduce a novel task of automatically identifying contribution statements and classifying their types from research papers. We present experimental results for this task and apply our model to $\sim$$29k$ NLP research papers to analyze their contributions, aiding in the understanding of the nature of NLP research. We show that NLP research has taken a winding path -- with the focus on language and human-centric studies being prominent in the 1970s and 80s, tapering off in the 1990s and 2000s, and starting to rise again since the late 2010s. Alongside this revival, we observe a steady rise in dataset and methodological contributions since the 1990s, such that today, on average, individual NLP papers contribute in more ways than ever before. Our dataset and analyses offer a powerful lens for tracing research trends and offer potential for generating informed, data-driven literature surveys.
- Abstract(参考訳): 自然言語処理(NLP)は、確立された動的分野である。
それにもかかわらず、NLP研究を構成するものについては議論が続いている。
本研究では,NLP研究論文を定量的に検討し,この問題に対処する。
我々は,NLP研究論文の要約として,NLPコントリビューション(NLPコントリビューション)の分類を提案し,NLPコントリビューション(NLPコントリビューション)を導入し,科学的コントリビューションの同定と分類を行う。
また,コントリビューションステートメントを自動的に識別し,それらのタイプを研究論文から分類する新たなタスクも導入する。
本研究は,NLP研究の性質の理解を支援するため,NLP研究論文の分析に$$29k$$$\simに本研究モデルを適用した。
NLPの研究は、1970年代から80年代にかけて言語と人間中心の研究に焦点が当てられ、1990年代と2000年代に打ち切られ、2010年代後半から再び上昇し始めた。
この回復とともに、1990年代以降、データセットや方法論的な貢献が着実に増加し、現在、個々のNLP論文がこれまで以上に多くの方法で貢献しているのを観察する。
私たちのデータセットと分析は、研究トレンドをトレースするための強力なレンズを提供し、インフォグラフィックでデータ駆動の文献調査を生成する可能性を提供します。
関連論文リスト
- Towards Systematic Monolingual NLP Surveys: GenA of Greek NLP [2.3499129784547663]
本研究は, 体系的かつ総合的な単言語NLPサーベイを作成する手法を導入することで, ギャップを埋めるものである。
構造化された検索プロトコルによって特徴づけられ、出版物を選定し、NLPタスクの分類によってそれらを整理することができる。
本手法の適用により,2012年から2022年にかけて,ギリシャNLPの体系的文献レビューを行った。
論文 参考訳(メタデータ) (2024-07-13T12:01:52Z) - From Insights to Actions: The Impact of Interpretability and Analysis Research on NLP [28.942812379900673]
解釈可能性と分析(IA)研究は、NLP内の成長するサブフィールドである。
我々は,IA研究がNLPの幅広い分野に与える影響を定量化する。
論文 参考訳(メタデータ) (2024-06-18T13:45:07Z) - Culturally Aware and Adapted NLP: A Taxonomy and a Survey of the State of the Art [70.1063219524999]
文化的に認識され、適応された自然言語処理への関心の高まりは、近年の研究にインスピレーションを与えている。
文化」概念の共通理解の欠如は、この新興地域の進歩を評価するのを困難にしている。
本稿では,研究の進展を分析し,理解するための体系的な枠組みを提供する,文化の要素の広範な分類法を提案する。
論文 参考訳(メタデータ) (2024-06-06T10:16:43Z) - What Can Natural Language Processing Do for Peer Review? [173.8912784451817]
現代の科学ではピアレビューが広く使われているが、それは難しく、時間がかかり、エラーを起こしやすい。
ピアレビューに関わるアーティファクトは大部分がテキストベースであるため、自然言語処理はレビューを改善する大きな可能性を秘めている。
筆者らは、原稿提出からカメラ対応リビジョンまでの各工程について詳述し、NLP支援の課題と機会について論じる。
論文 参考訳(メタデータ) (2024-05-10T16:06:43Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - Ling-CL: Understanding NLP Models through Linguistic Curricula [17.44112549879293]
我々は精神言語学と言語習得研究から言語複雑性の特徴づけを取り入れている。
我々は、モデルがNLPタスクに対処するために学習する基礎となる言語知識を理解するために、データ駆動型カリキュラムを開発する。
論文 参考訳(メタデータ) (2023-10-31T01:44:33Z) - To Build Our Future, We Must Know Our Past: Contextualizing Paradigm
Shifts in Natural Language Processing [14.15370310437262]
我々は、NLPを文化、インセンティブ、インフラなどの分野として形成する要因について研究する。
インタビュアーは、フィールドにおける循環パターンと、過去の並列性のない新しいシフトを識別する。
我々は、NLPの将来へのビジョン、関心、希望を共有することで結論付ける。
論文 参考訳(メタデータ) (2023-10-11T17:59:36Z) - Exploring the Landscape of Natural Language Processing Research [3.3916160303055567]
NLP関連のいくつかのアプローチが研究コミュニティで調査されている。
確立したトピックを分類し、傾向を特定し、今後の研究分野を概説する総合的研究はいまだに残っていない。
その結果,NLPにおける研究分野の分類,最近のNLPの発展分析,研究成果の要約,今後の研究の方向性について概説した。
論文 参考訳(メタデータ) (2023-07-20T07:33:30Z) - A Diachronic Analysis of Paradigm Shifts in NLP Research: When, How, and
Why? [84.46288849132634]
本稿では、因果発見と推論技術を用いて、科学分野における研究トピックの進化を分析するための体系的な枠組みを提案する。
我々は3つの変数を定義し、NLPにおける研究トピックの進化の多様な側面を包含する。
我々は因果探索アルゴリズムを用いてこれらの変数間の因果関係を明らかにする。
論文 参考訳(メタデータ) (2023-05-22T11:08:00Z) - Beyond Good Intentions: Reporting the Research Landscape of NLP for
Social Good [115.1507728564964]
NLP4SG Papersは3つのタスクを関連づけた科学データセットである。
これらのタスクはNLP4SGの論文を特定し、NLP4SGのランドスケープを特徴付けるのに役立つ。
現状のNLPモデルを用いてこれらのタスクに対処し、ACLアンソロジー全体においてそれらを使用する。
論文 参考訳(メタデータ) (2023-05-09T14:16:25Z) - Application of Transformers based methods in Electronic Medical Records:
A Systematic Literature Review [77.34726150561087]
本研究は,異なるNLPタスクにおける電子カルテ(EMR)のトランスフォーマーに基づく手法を用いて,最先端技術に関する体系的な文献レビューを行う。
論文 参考訳(メタデータ) (2023-04-05T22:19:42Z) - An Inclusive Notion of Text [69.36678873492373]
テキストの概念の明確さは再現可能で一般化可能なNLPにとって不可欠である,と我々は主張する。
言語的および非言語的要素の2層分類を導入し,NLPモデリングに使用することができる。
論文 参考訳(メタデータ) (2022-11-10T14:26:43Z) - State-of-the-art generalisation research in NLP: A taxonomy and review [87.1541712509283]
NLPにおける一般化研究の特徴付けと理解のための分類法を提案する。
我々の分類学は、一般化研究の広範な文献レビューに基づいている。
私たちは、一般化をテストする400以上の論文を分類するために分類を使います。
論文 参考訳(メタデータ) (2022-10-06T16:53:33Z) - A Decade of Knowledge Graphs in Natural Language Processing: A Survey [3.3358633215849927]
知識グラフ(KG)は学術と産業の両方から関心を集めている。
実体間の意味関係の表現として、KGは自然言語処理に特に関係があることが証明されている。
論文 参考訳(メタデータ) (2022-09-30T21:53:57Z) - Reproducibility Beyond the Research Community: Experience from NLP
Beginners [6.957948096979098]
我々は,最近のNLP論文の成果を再現した入門NLP講座で,93名の学生を対象に調査を行った。
意外なことに、我々の結果は、彼らの技術スキル(つまりプログラミングの経験)が、演習の完了に費やした労力に限られた影響を与えていることを示唆している。
私たちは、研究著者によるアクセシビリティの取り組みが、詳細なドキュメントや必要なモデルやデータセットへのアクセスなど、成功した経験の鍵になることに気付きました。
論文 参考訳(メタデータ) (2022-05-04T16:54:00Z) - Meta Learning for Natural Language Processing: A Survey [88.58260839196019]
ディープラーニングは自然言語処理(NLP)分野において主要な技術である。
ディープラーニングには多くのラベル付きデータが必要です。
メタ学習は、より良いアルゴリズムを学ぶためのアプローチを研究する機械学習の分野である。
論文 参考訳(メタデータ) (2022-05-03T13:58:38Z) - An Empirical Survey of Data Augmentation for Limited Data Learning in
NLP [88.65488361532158]
豊富なデータへの依存は、低リソース設定や新しいタスクにNLPモデルを適用するのを防ぐ。
NLPにおけるデータ効率を改善する手段として,データ拡張手法が検討されている。
限定ラベル付きデータ設定におけるNLPのデータ拡張に関する最近の進展を実証的に調査する。
論文 参考訳(メタデータ) (2021-06-14T15:27:22Z) - A Survey of Data Augmentation Approaches for NLP [12.606206831969262]
データ拡張は最近、低リソースドメインでの作業の増加、新しいタスク、大規模ニューラルネットワークの人気により、NLPへの関心が高まっている。
この最近の騒動にもかかわらず、この領域は、おそらく言語データの離散的な性質によって生じる課題のために、まだ比較的未調査です。
文献を構造化した方法で要約することにより,NLPのデータ拡張に関する包括的かつ統一的な調査を行う。
論文 参考訳(メタデータ) (2021-05-07T06:03:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。