論文の概要: Collaboration or Corporate Capture? Quantifying NLP's Reliance on Industry Artifacts and Contributions
- arxiv url: http://arxiv.org/abs/2312.03912v2
- Date: Sat, 22 Jun 2024 15:27:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-26 02:42:42.792289
- Title: Collaboration or Corporate Capture? Quantifying NLP's Reliance on Industry Artifacts and Contributions
- Title(参考訳): コラボレーション・コーポレート・キャプチャー : NLPの産業アーチファクト・コントリビューションへの信頼の定量化
- Authors: Will Aitken, Mohamed Abdalla, Karen Rudie, Catherine Stinson,
- Abstract要約: EMNLP 2022で発表された100の論文を調査し,研究者が業界モデルにどの程度依存しているかを調査した。
私たちの研究は、将来の研究者が、代替手段がなければ、業界とのコラボレーションがまだコラボレーションであるかどうかをより正確に解決するための足場として役立ちます。
- 参考スコア(独自算出の注目度): 2.6746207141044582
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Impressive performance of pre-trained models has garnered public attention and made news headlines in recent years. Almost always, these models are produced by or in collaboration with industry. Using them is critical for competing on natural language processing (NLP) benchmarks and correspondingly to stay relevant in NLP research. We surveyed 100 papers published at EMNLP 2022 to determine the degree to which researchers rely on industry models, other artifacts, and contributions to publish in prestigious NLP venues and found that the ratio of their citation is at least three times greater than what would be expected. Our work serves as a scaffold to enable future researchers to more accurately address whether: 1) Collaboration with industry is still collaboration in the absence of an alternative or 2) if NLP inquiry has been captured by the motivations and research direction of private corporations.
- Abstract(参考訳): 事前訓練されたモデルの印象的なパフォーマンスは大衆の注目を集め、近年ニュースの見出しを飾っている。
ほぼ常に、これらのモデルは産業と共同で生産される。
それらの使用は自然言語処理(NLP)ベンチマークと競合し、NLP研究に関連性を維持するために重要である。
我々は,EMNLP 2022で公表された100の論文を調査し,研究者が産業モデルや他のアーティファクトにどの程度依存しているか,そしてNLPの権威ある会場で出版する貢献が期待するよりも少なくとも3倍大きいことを確かめた。
私たちの研究は、将来の研究者がより正確に解決できる足場として役立ちます。
1 産業との連携は、選択肢がない状態での連携である。
2 民間企業のモチベーション及び研究の方向性により、NLP調査が達成された場合。
関連論文リスト
- The Nature of NLP: Analyzing Contributions in NLP Papers [77.31665252336157]
我々は,NLP研究を構成するものについて,研究論文から定量的に検討する。
以上の結果から,NLPにおける機械学習の関与は,90年代前半から増加傾向にあることが明らかとなった。
2020年以降、言語と人々への関心が復活した。
論文 参考訳(メタデータ) (2024-09-29T01:29:28Z) - What Can Natural Language Processing Do for Peer Review? [173.8912784451817]
現代の科学ではピアレビューが広く使われているが、それは難しく、時間がかかり、エラーを起こしやすい。
ピアレビューに関わるアーティファクトは大部分がテキストベースであるため、自然言語処理はレビューを改善する大きな可能性を秘めている。
筆者らは、原稿提出からカメラ対応リビジョンまでの各工程について詳述し、NLP支援の課題と機会について論じる。
論文 参考訳(メタデータ) (2024-05-10T16:06:43Z) - We are Who We Cite: Bridges of Influence Between Natural Language Processing and Other Academic Fields [30.550895983110806]
自然言語処理の分野横断は減少している。
NLPの引用の8%以下は言語学に関するものである。
NLPの引用の3%以下は数学と心理学に関するものである。
論文 参考訳(メタデータ) (2023-10-23T12:42:06Z) - Who should I Collaborate with? A Comparative Study of Academia and
Industry Research Collaboration in NLP [5.929956715430167]
本研究の目的は,学術と産業の連携が自然言語処理(NLP)に及ぼす影響を検討することである。
我々は,NLP論文からアフィリエイトや引用を抽出するパイプラインを作成し,これらをアカデミック,産業,ハイブリッド(アカデミックと産業の連携)の3つのカテゴリに分けた。
実証分析の結果,産業界と産業界が連携する出版物の増加傾向がみられた。
論文 参考訳(メタデータ) (2023-07-21T01:26:29Z) - Beyond Good Intentions: Reporting the Research Landscape of NLP for
Social Good [115.1507728564964]
NLP4SG Papersは3つのタスクを関連づけた科学データセットである。
これらのタスクはNLP4SGの論文を特定し、NLP4SGのランドスケープを特徴付けるのに役立つ。
現状のNLPモデルを用いてこれらのタスクに対処し、ACLアンソロジー全体においてそれらを使用する。
論文 参考訳(メタデータ) (2023-05-09T14:16:25Z) - The Elephant in the Room: Analyzing the Presence of Big Tech in Natural Language Processing Research [28.382353702576314]
我々は、78,187のNLP出版物と701のNLP出版物の包括的なメタデータを持つコーパスを使用する。
NLP作家の業界における存在感は、過去5年間で急激な増加を前に着実に推移している。
いくつかの企業は出版物の大半を占め、助成金やインターンシップを通じて学術研究者に資金を提供している。
論文 参考訳(メタデータ) (2023-05-04T12:57:18Z) - NLPeer: A Unified Resource for the Computational Study of Peer Review [58.71736531356398]
NLPeer - 5万以上の論文と5つの異なる会場からの1万1千件のレビューレポートからなる、初めて倫理的にソースされたマルチドメインコーパス。
従来のピアレビューデータセットを拡張し、解析および構造化された論文表現、豊富なメタデータ、バージョニング情報を含む。
我々の研究は、NLPなどにおけるピアレビューの体系的、多面的、エビデンスに基づく研究への道のりをたどっている。
論文 参考訳(メタデータ) (2022-11-12T12:29:38Z) - Geographic Citation Gaps in NLP Research [63.13508571014673]
この研究は、地理的な位置と出版の成功との関係について一連の疑問を呈する。
われわれはまず,ACLアンソロジーから7万件の論文のデータセットを作成し,そのメタ情報を抽出し,引用ネットワークを生成した。
論文の受理や引用において地理的に大きな差異があるだけでなく,出版場所やNLPのサブフィールドなどの変数を制御しても,これらの格差は持続することを示す。
論文 参考訳(メタデータ) (2022-10-26T02:25:23Z) - Square One Bias in NLP: Towards a Multi-Dimensional Exploration of the
Research Manifold [88.83876819883653]
我々は、最近のNLP研究論文のマニュアル分類を通して、これが事実であることを示す。
NLP研究は正方形ではなく、精度だけでなく、公平性や解釈可能性にも焦点をあてる。
論文 参考訳(メタデータ) (2022-06-20T13:04:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。