論文の概要: 'Moving On' -- Investigating Inventors' Ethnic Origins Using Supervised
Learning
- arxiv url: http://arxiv.org/abs/2201.00578v1
- Date: Mon, 3 Jan 2022 10:47:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 17:33:42.881751
- Title: 'Moving On' -- Investigating Inventors' Ethnic Origins Using Supervised
Learning
- Title(参考訳): 「動き続ける」 -- 教師付き学習による発明者の民族起源の調査
- Authors: Matthias Niggli
- Abstract要約: 特許データは、技術発明に関する豊富な情報を提供するが、発明者の民族的起源は明らかにしていない。
95'202のラベル付き名前のデータセットを構築し、長期記憶(LSTM)を用いた人工的リカレントニューラルネットワークを訓練し、民族起源を予測する。
私はこのモデルを使って、268万人の発明家の民族起源を分類し、調査し、彼らの民族起源の組成に関する新しい記述的証拠を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Patent data provides rich information about technical inventions, but does
not disclose the ethnic origin of inventors. In this paper, I use supervised
learning techniques to infer this information. To do so, I construct a dataset
of 95'202 labeled names and train an artificial recurrent neural network with
long-short-term memory (LSTM) to predict ethnic origins based on names. The
trained network achieves an overall performance of 91% across 17 ethnic
origins. I use this model to classify and investigate the ethnic origins of
2.68 million inventors and provide novel descriptive evidence regarding their
ethnic origin composition over time and across countries and technological
fields. The global ethnic origin composition has become more diverse over the
last decades, which was mostly due to a relative increase of Asian origin
inventors. Furthermore, the prevalence of foreign-origin inventors is
especially high in the USA, but has also increased in other high-income
economies. This increase was mainly driven by an inflow of non-western
inventors into emerging high-technology fields for the USA, but not for other
high-income countries.
- Abstract(参考訳): 特許データは技術発明に関する豊富な情報を提供するが、発明者の民族的起源を開示していない。
本稿では,教師あり学習技術を用いてその情報を推測する。
そのために、95'202ラベル付き名前のデータセットを構築し、長期記憶(LSTM)を用いた人工的リカレントニューラルネットワークをトレーニングし、名前に基づいて民族起源を予測する。
訓練されたネットワークは17の民族で91%のパフォーマンスを達成した。
私はこのモデルを用いて、268万人の発明家の民族起源を分類・調査し、その民族起源の構成に関する新しい記述的証拠を国や技術分野にわたって提供します。
グローバルな民族起源の組成はここ数十年で多様化しており、主にアジア起源の発明者が相対的に増加したためである。
さらに、外国のオリジン発明家の普及率は特に米国において高いが、他の高所得経済においても増加している。
この増加は、主に非西洋の発明家がアメリカの新興ハイテク分野に流入することによるものであったが、他の高所得国はそうではなかった。
関連論文リスト
- Deepfake Media Forensics: State of the Art and Challenges Ahead [51.33414186878676]
AIが生成する合成メディア、別名Deepfakesは、エンターテイメントからサイバーセキュリティまで、多くの領域に影響を与えている。
ディープフェイク検出は、微妙な矛盾やアーティファクトを機械学習技術で識別することに焦点を当て、研究の不可欠な領域となっている。
本稿では,これらの課題に対処する主要なアルゴリズムについて,その利点,限界,今後の展望について検討する。
論文 参考訳(メタデータ) (2024-08-01T08:57:47Z) - Graph Representation Learning Towards Patents Network Analysis [2.202803272456695]
この研究は、イランの公式ガゼットに登録された特許データの作成、分析、検索にグラフ表現学習アプローチを採用した。
イランの特許グラフをスクラッチから作成するために、スクラップされた特許データセットから重要なエンティティが抽出された。
新たなグラフアルゴリズムとテキストマイニング手法の活用により,イランの特許データから新たな産業分野と研究分野を特定した。
論文 参考訳(メタデータ) (2023-09-25T05:49:40Z) - Has China caught up to the US in AI research? An exploration of mimetic
isomorphism as a model for late industrializers [9.03136346887569]
我々は,中国のAI開発プロセスについて検討し,学習の迅速化と差別化を特徴とすることを示す。
2018年までに、AI研究のトピックに対処する中国と米国の間の時間ラグが消滅した。
この発見は、中国が重要な知識ギャップを効果的に橋渡しし、独立した研究軌道を踏み出そうとしている可能性を示唆している。
論文 参考訳(メタデータ) (2023-07-11T19:59:54Z) - The Future of Fundamental Science Led by Generative Closed-Loop
Artificial Intelligence [67.70415658080121]
機械学習とAIの最近の進歩は、技術革新、製品開発、社会全体を破壊している。
AIは、科学的な実践とモデル発見のための高品質なデータの大規模なデータセットへのアクセスがより困難であるため、基礎科学にはあまり貢献していない。
ここでは、科学的な発見に対するAI駆動、自動化、クローズドループアプローチの側面を調査し、調査する。
論文 参考訳(メタデータ) (2023-07-09T21:16:56Z) - Neural Machine Translation for the Indigenous Languages of the Americas:
An Introduction [102.13536517783837]
アメリカ大陸のほとんどの言語は、もしあるならば、並列データと単言語データしか持たない。
これらの言語におけるNLPコミュニティの関心が高まった結果、最近の進歩、発見、オープンな質問について論じる。
論文 参考訳(メタデータ) (2023-06-11T23:27:47Z) - NeuroComparatives: Neuro-Symbolic Distillation of Comparative Knowledge [48.17483161013775]
比較知識蒸留のための新しいフレームワークであるNeuroComparativesを紹介する。
我々のフレームワークは最大8.8Mのコーパスを1.74Mのエンティティペアで生成する。
人間による評価は、NeuroComparativesが既存のリソースよりも有効性が高いことを示している。
論文 参考訳(メタデータ) (2023-05-08T18:20:36Z) - Informed Machine Learning, Centrality, CNN, Relevant Document Detection,
Repatriation of Indigenous Human Remains [1.3299507495084417]
本稿では,データ科学者と社会科学研究者によるRRR(Research, Reconcile, Renew Network)による共同研究について報告する。
関連テキストの検索と意味分析のプロセスを自動化する機械学習ベースのソリューションの開発について、現在までの作業について説明する。
検出モデルの精度を向上させるため、専門家による文脈知識を用いたドキュメンタリーコンテンツを記述するインフォームドニューラルネットワーク(INN)モデルについて検討する。
論文 参考訳(メタデータ) (2023-03-25T14:08:21Z) - Towards Data-and Knowledge-Driven Artificial Intelligence: A Survey on Neuro-Symbolic Computing [73.0977635031713]
ニューラルシンボリック・コンピューティング(NeSy)は、人工知能(AI)の活発な研究領域である。
NeSyは、ニューラルネットワークにおける記号表現の推論と解釈可能性の利点と堅牢な学習の整合性を示す。
論文 参考訳(メタデータ) (2022-10-28T04:38:10Z) - Relying on recent and temporally dispersed science predicts breakthrough inventions [1.2930336259963562]
われわれは大量の特許のコーパスを使用し、科学分野における特許の時間的探索を特徴付ける特徴を導出する。
科学論文を引用する特許には、より多くの引用があり、ブレークスルーになる可能性がかなり高いことが分かっています。
論文 参考訳(メタデータ) (2021-07-19T22:08:33Z) - Influence of cognitive, geographical, and collaborative proximity on
knowledge production of Canadian nanotechnology [0.1529342790344802]
研究と発明による知識生産が科学的・技術的発展の鍵となる。
カナダはナノテクノロジーの研究で主要な役割を担っていると報告されている。
論文 参考訳(メタデータ) (2021-06-03T20:07:08Z) - Alpha Discovery Neural Network based on Prior Knowledge [55.65102700986668]
遺伝的プログラミング(GP)は、金融自動化機能構築タスクにおける最先端技術である。
本稿では,分散金融技術指標の自動構築が可能なニューラルネットワーク構造であるAlpha Discovery Neural Network (ADNN)を提案する。
論文 参考訳(メタデータ) (2019-12-26T03:10:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。