論文の概要: Cosmos 1.0: a multidimensional map of the emerging technology frontier
- arxiv url: http://arxiv.org/abs/2505.10591v1
- Date: Thu, 15 May 2025 02:37:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:13.26565
- Title: Cosmos 1.0: a multidimensional map of the emerging technology frontier
- Title(参考訳): Cosmos 1.0: 新興技術フロンティアの多次元マップ
- Authors: Xian Gong, Paul X. McCarthy, Colin Griffith, Claire McFarland, Marian-Andrei Rizoiu,
- Abstract要約: Cosmos 1.0データセットは、階層的なモデルに構造化された23,544技術(ET23k)の包括的なコレクションである。
宇宙では、ET100と呼ばれる100の新興テクノロジーを手動で検証します。
このデータセットには、新興技術の展望を評価するために特別に開発された指標が盛り込まれている。
- 参考スコア(独自算出の注目度): 2.740585121462547
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper describes a novel methodology to map the universe of emerging technologies, utilising various source data that contain a rich diversity and breadth of contemporary knowledge to create a new dataset and multiple indices that provide new insights into these technologies. The Cosmos 1.0 dataset is a comprehensive collection of 23,544 technologies (ET23k) structured into a hierarchical model. Each technology is categorised into three meta clusters (ET3) and seven theme clusters (ET7) enhanced by 100-dimensional embedding vectors. Within the cosmos, we manually verify 100 emerging technologies called the ET100. This dataset is enriched with additional indices specifically developed to assess the landscape of emerging technologies, including the Technology Awareness Index, Generality Index, Deeptech, and Age of Tech Index. The dataset incorporates extensive metadata sourced from Wikipedia and linked data from third-party sources such as Crunchbase, Google Books, OpenAlex and Google Scholar, which are used to validate the relevance and accuracy of the constructed indices. Moreover, we trained a classifier to identify whether they are developed "technology" or technology-related "terms".
- Abstract(参考訳): 本稿では,新興技術の宇宙を地図化するための新しい手法について述べる。これらの技術に新たな洞察を与える新しいデータセットと複数の指標を作成するために,多様な多様性と多様な現代知識を含む様々な情報源データを活用する。
Cosmos 1.0データセットは、階層的なモデルに構造化された23,544技術(ET23k)の包括的なコレクションである。
各技術は3つのメタクラスタ(ET3)と7つのテーマクラスタ(ET7)に分類され、100次元の埋め込みベクトルによって強化される。
宇宙では、ET100と呼ばれる100の新興テクノロジーを手動で検証します。
このデータセットには、Technology Awareness Index、Generality Index、Deeptech、Age of Tech Indexなど、新興技術の展望を評価するために特別に開発された指標が組み込まれている。
このデータセットには、Wikipediaからの豊富なメタデータとCrunchbase、Google Books、OpenAlex、Google Scholarといったサードパーティソースからのリンクデータが含まれており、構築されたインデックスの妥当性と正確性を検証するために使用される。
さらに、「技術」と「技術関連用語」を識別するために分類器を訓練した。
関連論文リスト
- DeepInnovation AI: A Global Dataset Mapping the AI innovation from Academic Research to Industrial Patents [2.8191246153416243]
DeepInnovationAIは3つの構造化ファイルを含む包括的なグローバルデータセットである。
DeepInnovationAIは、研究者、政策立案者、業界リーダーがトレンドを予測し、コラボレーションの機会を特定することを可能にする。
論文 参考訳(メタデータ) (2025-03-12T10:56:02Z) - MapExplorer: New Content Generation from Low-Dimensional Visualizations [60.02149343347818]
低次元の可視化や「投影マップ」は大規模で複雑なデータセットの解釈に広く用いられている。
これらの視覚化は、既存の知識空間を理解するのに役立つだけでなく、未知の領域への探索を暗黙的にガイドする。
プロジェクションマップ内の座標をコヒーレントでコンテキストに整合したテキストコンテンツに変換する新しい知識発見タスクであるMapExplorerを紹介する。
論文 参考訳(メタデータ) (2024-12-24T20:16:13Z) - Artificial Intelligence for Web 3.0: A Comprehensive Survey [76.06151253928171]
Web 3.0の現在の開発状況と、Web 3.0におけるAIテクノロジの適用について検討する。
調査では、各レイヤに存在する主な課題と課題について詳しく調べています。
私たちは、Web 3.0の基礎と成長におけるAIの重要な役割を説明します。
論文 参考訳(メタデータ) (2023-08-17T12:36:01Z) - The Semantic Scholar Open Data Platform [92.2948743167744]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - Covidex: Neural Ranking Models and Keyword Search Infrastructure for the
COVID-19 Open Research Dataset [87.47567807116204]
Covidexは最新のニューラルランキングモデルを利用する検索エンジンだ。
これは、Allen Institute for AIがキュレートしたCOVID-19 Open Researchデータセットへのアクセスを提供する。
論文 参考訳(メタデータ) (2020-07-14T16:26:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。