論文の概要: The Nature of NLP: Analyzing Contributions in NLP Papers
- arxiv url: http://arxiv.org/abs/2409.19505v1
- Date: Sun, 29 Sep 2024 01:29:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-05 22:47:59.961501
- Title: The Nature of NLP: Analyzing Contributions in NLP Papers
- Title(参考訳): NLPの性質:NLP論文における貢献の分析
- Authors: Aniket Pramanick, Yufang Hou, Saif M. Mohammad, Iryna Gurevych,
- Abstract要約: 我々は,NLP研究を構成するものについて,研究論文から定量的に検討する。
以上の結果から,NLPにおける機械学習の関与は,90年代前半から増加傾向にあることが明らかとなった。
2020年以降、言語と人々への関心が復活した。
- 参考スコア(独自算出の注目度): 77.31665252336157
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Natural Language Processing (NLP) is a dynamic, interdisciplinary field that integrates intellectual traditions from computer science, linguistics, social science, and more. Despite its established presence, the definition of what constitutes NLP research remains debated. In this work, we quantitatively investigate what constitutes NLP by examining research papers. For this purpose, we propose a taxonomy and introduce NLPContributions, a dataset of nearly $2k$ research paper abstracts, expertly annotated to identify scientific contributions and classify their types according to this taxonomy. We also propose a novel task to automatically identify these elements, for which we train a strong baseline on our dataset. We present experimental results from this task and apply our model to $\sim$$29k$ NLP research papers to analyze their contributions, aiding in the understanding of the nature of NLP research. Our findings reveal a rising involvement of machine learning in NLP since the early nineties, alongside a declining focus on adding knowledge about language or people; again, in post-2020, there has been a resurgence of focus on language and people. We hope this work will spark discussions on our community norms and inspire efforts to consciously shape the future.
- Abstract(参考訳): 自然言語処理(NLP)は、コンピュータ科学、言語学、社会科学などの知的な伝統を統合する、動的で学際的な分野である。
確立された存在にもかかわらず、NLP研究を構成するものの定義については議論が続いている。
本研究では,NLPを構成するものについて,研究論文から定量的に検討する。
そこで本研究では,NLPコントリビューション(NLPコントリビューション)の分類法を提案する。NLPコントリビューション(NLPコントリビューション)は,研究論文を要約したもので,科学的コントリビューションの同定と分類を専門的に行っている。
また、これらの要素を自動的に識別する新しいタスクを提案し、データセット上で強力なベースラインをトレーニングします。
この課題から得られた実験結果と,NLP研究の性質の理解を支援するため,NLP研究論文の$\sim$29k$にモデルを適用した。
以上の結果から,NLP における機械学習の関与は,言語や人に関する知識の付加に焦点を絞るとともに,90年代初めから増加しており,また,2020 年以降も言語や人への注目が復活していることが明らかとなった。
この作業がコミュニティの規範に関する議論を引き起こし、未来を意識的に形作る努力を促すことを願っています。
関連論文リスト
- Towards Systematic Monolingual NLP Surveys: GenA of Greek NLP [2.3499129784547663]
本研究は, 体系的かつ総合的な単言語NLPサーベイを作成する手法を導入することで, ギャップを埋めるものである。
構造化された検索プロトコルによって特徴づけられ、出版物を選定し、NLPタスクの分類によってそれらを整理することができる。
本手法の適用により,2012年から2022年にかけて,ギリシャNLPの体系的文献レビューを行った。
論文 参考訳(メタデータ) (2024-07-13T12:01:52Z) - Culturally Aware and Adapted NLP: A Taxonomy and a Survey of the State of the Art [70.1063219524999]
文化的に認識され、適応された自然言語処理への関心の高まりは、近年の研究にインスピレーションを与えている。
文化」概念の共通理解の欠如は、この新興地域の進歩を評価するのを困難にしている。
本稿では,研究の進展を分析し,理解するための体系的な枠組みを提供する,文化の要素の広範な分類法を提案する。
論文 参考訳(メタデータ) (2024-06-06T10:16:43Z) - What Can Natural Language Processing Do for Peer Review? [173.8912784451817]
現代の科学ではピアレビューが広く使われているが、それは難しく、時間がかかり、エラーを起こしやすい。
ピアレビューに関わるアーティファクトは大部分がテキストベースであるため、自然言語処理はレビューを改善する大きな可能性を秘めている。
筆者らは、原稿提出からカメラ対応リビジョンまでの各工程について詳述し、NLP支援の課題と機会について論じる。
論文 参考訳(メタデータ) (2024-05-10T16:06:43Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - Ling-CL: Understanding NLP Models through Linguistic Curricula [17.44112549879293]
我々は精神言語学と言語習得研究から言語複雑性の特徴づけを取り入れている。
我々は、モデルがNLPタスクに対処するために学習する基礎となる言語知識を理解するために、データ駆動型カリキュラムを開発する。
論文 参考訳(メタデータ) (2023-10-31T01:44:33Z) - To Build Our Future, We Must Know Our Past: Contextualizing Paradigm
Shifts in Natural Language Processing [14.15370310437262]
我々は、NLPを文化、インセンティブ、インフラなどの分野として形成する要因について研究する。
インタビュアーは、フィールドにおける循環パターンと、過去の並列性のない新しいシフトを識別する。
我々は、NLPの将来へのビジョン、関心、希望を共有することで結論付ける。
論文 参考訳(メタデータ) (2023-10-11T17:59:36Z) - Exploring the Landscape of Natural Language Processing Research [3.3916160303055567]
NLP関連のいくつかのアプローチが研究コミュニティで調査されている。
確立したトピックを分類し、傾向を特定し、今後の研究分野を概説する総合的研究はいまだに残っていない。
その結果,NLPにおける研究分野の分類,最近のNLPの発展分析,研究成果の要約,今後の研究の方向性について概説した。
論文 参考訳(メタデータ) (2023-07-20T07:33:30Z) - Beyond Good Intentions: Reporting the Research Landscape of NLP for
Social Good [115.1507728564964]
NLP4SG Papersは3つのタスクを関連づけた科学データセットである。
これらのタスクはNLP4SGの論文を特定し、NLP4SGのランドスケープを特徴付けるのに役立つ。
現状のNLPモデルを用いてこれらのタスクに対処し、ACLアンソロジー全体においてそれらを使用する。
論文 参考訳(メタデータ) (2023-05-09T14:16:25Z) - Meta Learning for Natural Language Processing: A Survey [88.58260839196019]
ディープラーニングは自然言語処理(NLP)分野において主要な技術である。
ディープラーニングには多くのラベル付きデータが必要です。
メタ学習は、より良いアルゴリズムを学ぶためのアプローチを研究する機械学習の分野である。
論文 参考訳(メタデータ) (2022-05-03T13:58:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。