論文の概要: The Nature of NLP: Analyzing Contributions in NLP Papers
- arxiv url: http://arxiv.org/abs/2409.19505v1
- Date: Sun, 29 Sep 2024 01:29:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 22:47:59.961501
- Title: The Nature of NLP: Analyzing Contributions in NLP Papers
- Title(参考訳): NLPの性質:NLP論文における貢献の分析
- Authors: Aniket Pramanick, Yufang Hou, Saif M. Mohammad, Iryna Gurevych,
- Abstract要約: 我々は,NLP研究を構成するものについて,研究論文から定量的に検討する。
以上の結果から,NLPにおける機械学習の関与は,90年代前半から増加傾向にあることが明らかとなった。
2020年以降、言語と人々への関心が復活した。
- 参考スコア(独自算出の注目度): 77.31665252336157
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Natural Language Processing (NLP) is a dynamic, interdisciplinary field that integrates intellectual traditions from computer science, linguistics, social science, and more. Despite its established presence, the definition of what constitutes NLP research remains debated. In this work, we quantitatively investigate what constitutes NLP by examining research papers. For this purpose, we propose a taxonomy and introduce NLPContributions, a dataset of nearly $2k$ research paper abstracts, expertly annotated to identify scientific contributions and classify their types according to this taxonomy. We also propose a novel task to automatically identify these elements, for which we train a strong baseline on our dataset. We present experimental results from this task and apply our model to $\sim$$29k$ NLP research papers to analyze their contributions, aiding in the understanding of the nature of NLP research. Our findings reveal a rising involvement of machine learning in NLP since the early nineties, alongside a declining focus on adding knowledge about language or people; again, in post-2020, there has been a resurgence of focus on language and people. We hope this work will spark discussions on our community norms and inspire efforts to consciously shape the future.
- Abstract(参考訳): 自然言語処理(NLP)は、コンピュータ科学、言語学、社会科学などの知的な伝統を統合する、動的で学際的な分野である。
確立された存在にもかかわらず、NLP研究を構成するものの定義については議論が続いている。
本研究では,NLPを構成するものについて,研究論文から定量的に検討する。
そこで本研究では,NLPコントリビューション(NLPコントリビューション)の分類法を提案する。NLPコントリビューション(NLPコントリビューション)は,研究論文を要約したもので,科学的コントリビューションの同定と分類を専門的に行っている。
また、これらの要素を自動的に識別する新しいタスクを提案し、データセット上で強力なベースラインをトレーニングします。
この課題から得られた実験結果と,NLP研究の性質の理解を支援するため,NLP研究論文の$\sim$29k$にモデルを適用した。
以上の結果から,NLP における機械学習の関与は,言語や人に関する知識の付加に焦点を絞るとともに,90年代初めから増加しており,また,2020 年以降も言語や人への注目が復活していることが明らかとなった。
この作業がコミュニティの規範に関する議論を引き起こし、未来を意識的に形作る努力を促すことを願っています。
関連論文リスト
- Towards Systematic Monolingual NLP Surveys: GenA of Greek NLP [2.3499129784547663]
本研究は, 体系的かつ総合的な単言語NLPサーベイを作成する手法を導入することで, ギャップを埋めるものである。
構造化された検索プロトコルによって特徴づけられ、出版物を選定し、NLPタスクの分類によってそれらを整理することができる。
本手法の適用により,2012年から2022年にかけて,ギリシャNLPの体系的文献レビューを行った。
論文 参考訳(メタデータ) (2024-07-13T12:01:52Z) - From Insights to Actions: The Impact of Interpretability and Analysis Research on NLP [28.942812379900673]
解釈可能性と分析(IA)研究は、NLP内の成長するサブフィールドである。
我々は,IA研究がNLPの幅広い分野に与える影響を定量化する。
論文 参考訳(メタデータ) (2024-06-18T13:45:07Z) - Culturally Aware and Adapted NLP: A Taxonomy and a Survey of the State of the Art [70.1063219524999]
文化的に認識され、適応された自然言語処理への関心の高まりは、近年の研究にインスピレーションを与えている。
文化」概念の共通理解の欠如は、この新興地域の進歩を評価するのを困難にしている。
本稿では,研究の進展を分析し,理解するための体系的な枠組みを提供する,文化の要素の広範な分類法を提案する。
論文 参考訳(メタデータ) (2024-06-06T10:16:43Z) - What Can Natural Language Processing Do for Peer Review? [173.8912784451817]
現代の科学ではピアレビューが広く使われているが、それは難しく、時間がかかり、エラーを起こしやすい。
ピアレビューに関わるアーティファクトは大部分がテキストベースであるため、自然言語処理はレビューを改善する大きな可能性を秘めている。
筆者らは、原稿提出からカメラ対応リビジョンまでの各工程について詳述し、NLP支援の課題と機会について論じる。
論文 参考訳(メタデータ) (2024-05-10T16:06:43Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - Ling-CL: Understanding NLP Models through Linguistic Curricula [17.44112549879293]
我々は精神言語学と言語習得研究から言語複雑性の特徴づけを取り入れている。
我々は、モデルがNLPタスクに対処するために学習する基礎となる言語知識を理解するために、データ駆動型カリキュラムを開発する。
論文 参考訳(メタデータ) (2023-10-31T01:44:33Z) - To Build Our Future, We Must Know Our Past: Contextualizing Paradigm
Shifts in Natural Language Processing [14.15370310437262]
我々は、NLPを文化、インセンティブ、インフラなどの分野として形成する要因について研究する。
インタビュアーは、フィールドにおける循環パターンと、過去の並列性のない新しいシフトを識別する。
我々は、NLPの将来へのビジョン、関心、希望を共有することで結論付ける。
論文 参考訳(メタデータ) (2023-10-11T17:59:36Z) - Exploring the Landscape of Natural Language Processing Research [3.3916160303055567]
NLP関連のいくつかのアプローチが研究コミュニティで調査されている。
確立したトピックを分類し、傾向を特定し、今後の研究分野を概説する総合的研究はいまだに残っていない。
その結果,NLPにおける研究分野の分類,最近のNLPの発展分析,研究成果の要約,今後の研究の方向性について概説した。
論文 参考訳(メタデータ) (2023-07-20T07:33:30Z) - A Diachronic Analysis of Paradigm Shifts in NLP Research: When, How, and
Why? [84.46288849132634]
本稿では、因果発見と推論技術を用いて、科学分野における研究トピックの進化を分析するための体系的な枠組みを提案する。
我々は3つの変数を定義し、NLPにおける研究トピックの進化の多様な側面を包含する。
我々は因果探索アルゴリズムを用いてこれらの変数間の因果関係を明らかにする。
論文 参考訳(メタデータ) (2023-05-22T11:08:00Z) - Beyond Good Intentions: Reporting the Research Landscape of NLP for
Social Good [115.1507728564964]
NLP4SG Papersは3つのタスクを関連づけた科学データセットである。
これらのタスクはNLP4SGの論文を特定し、NLP4SGのランドスケープを特徴付けるのに役立つ。
現状のNLPモデルを用いてこれらのタスクに対処し、ACLアンソロジー全体においてそれらを使用する。
論文 参考訳(メタデータ) (2023-05-09T14:16:25Z) - Application of Transformers based methods in Electronic Medical Records:
A Systematic Literature Review [77.34726150561087]
本研究は,異なるNLPタスクにおける電子カルテ(EMR)のトランスフォーマーに基づく手法を用いて,最先端技術に関する体系的な文献レビューを行う。
論文 参考訳(メタデータ) (2023-04-05T22:19:42Z) - An Inclusive Notion of Text [69.36678873492373]
テキストの概念の明確さは再現可能で一般化可能なNLPにとって不可欠である,と我々は主張する。
言語的および非言語的要素の2層分類を導入し,NLPモデリングに使用することができる。
論文 参考訳(メタデータ) (2022-11-10T14:26:43Z) - State-of-the-art generalisation research in NLP: A taxonomy and review [87.1541712509283]
NLPにおける一般化研究の特徴付けと理解のための分類法を提案する。
我々の分類学は、一般化研究の広範な文献レビューに基づいている。
私たちは、一般化をテストする400以上の論文を分類するために分類を使います。
論文 参考訳(メタデータ) (2022-10-06T16:53:33Z) - A Decade of Knowledge Graphs in Natural Language Processing: A Survey [3.3358633215849927]
知識グラフ(KG)は学術と産業の両方から関心を集めている。
実体間の意味関係の表現として、KGは自然言語処理に特に関係があることが証明されている。
論文 参考訳(メタデータ) (2022-09-30T21:53:57Z) - Reproducibility Beyond the Research Community: Experience from NLP
Beginners [6.957948096979098]
我々は,最近のNLP論文の成果を再現した入門NLP講座で,93名の学生を対象に調査を行った。
意外なことに、我々の結果は、彼らの技術スキル(つまりプログラミングの経験)が、演習の完了に費やした労力に限られた影響を与えていることを示唆している。
私たちは、研究著者によるアクセシビリティの取り組みが、詳細なドキュメントや必要なモデルやデータセットへのアクセスなど、成功した経験の鍵になることに気付きました。
論文 参考訳(メタデータ) (2022-05-04T16:54:00Z) - Meta Learning for Natural Language Processing: A Survey [88.58260839196019]
ディープラーニングは自然言語処理(NLP)分野において主要な技術である。
ディープラーニングには多くのラベル付きデータが必要です。
メタ学習は、より良いアルゴリズムを学ぶためのアプローチを研究する機械学習の分野である。
論文 参考訳(メタデータ) (2022-05-03T13:58:38Z) - An Empirical Survey of Data Augmentation for Limited Data Learning in
NLP [88.65488361532158]
豊富なデータへの依存は、低リソース設定や新しいタスクにNLPモデルを適用するのを防ぐ。
NLPにおけるデータ効率を改善する手段として,データ拡張手法が検討されている。
限定ラベル付きデータ設定におけるNLPのデータ拡張に関する最近の進展を実証的に調査する。
論文 参考訳(メタデータ) (2021-06-14T15:27:22Z) - A Survey of Data Augmentation Approaches for NLP [12.606206831969262]
データ拡張は最近、低リソースドメインでの作業の増加、新しいタスク、大規模ニューラルネットワークの人気により、NLPへの関心が高まっている。
この最近の騒動にもかかわらず、この領域は、おそらく言語データの離散的な性質によって生じる課題のために、まだ比較的未調査です。
文献を構造化した方法で要約することにより,NLPのデータ拡張に関する包括的かつ統一的な調査を行う。
論文 参考訳(メタデータ) (2021-05-07T06:03:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。