論文の概要: Cosmos 1.0: a multidimensional map of the emerging technology frontier
- arxiv url: http://arxiv.org/abs/2505.10591v2
- Date: Tue, 07 Oct 2025 00:57:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 15:38:20.373863
- Title: Cosmos 1.0: a multidimensional map of the emerging technology frontier
- Title(参考訳): Cosmos 1.0: 新興技術フロンティアの多次元マップ
- Authors: Xian Gong, Paul X. McCarthy, Colin Griffith, Claire McFarland, Marian-Andrei Rizoiu,
- Abstract要約: コスモス1.0データセットは23,544のテクノロジー・アジャセント・エンティティ(TA23k)と階層構造と8つの外部指標から構成されている。
このデータセットには、Technology Awareness Index、Generality Index、Deeptech、Age of Tech Indexなど、新興技術の展望を評価するために特別に開発された指標が組み込まれている。
- 参考スコア(独自算出の注目度): 0.941566456307226
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces the Cosmos 1.0 dataset and describes a novel methodology for creating and mapping a universe of technologies, adjacent concepts, and entities. We utilise various source data that contain a rich diversity and breadth of contemporary knowledge. The Cosmos 1.0 dataset comprises 23,544 technology-adjacent entities (TA23k) with a hierarchical structure and eight categories of external indices. Each entity is represented by a 100-dimensional contextual embedding vector, which we use to assign it to seven thematic tech-clusters (TC7) and three meta tech-clusters (TC3). We manually verify 100 emerging technologies (ET100). This dataset is enriched with additional indices specifically developed to assess the landscape of emerging technologies, including the Technology Awareness Index, Generality Index, Deeptech, and Age of Tech Index. The dataset incorporates extensive metadata sourced from Wikipedia and linked data from third-party sources such as Crunchbase, Google Books, OpenAlex and Google Scholar, which are used to validate the relevance and accuracy of the constructed indices.
- Abstract(参考訳): 本稿では、Cosmos 1.0データセットを紹介し、テクノロジー、隣接する概念、実体の宇宙を創造し、マッピングするための新しい方法論について述べる。
多様な多様性と多様な現代知識を含む様々な情報源データを活用している。
コスモス1.0データセットは23,544のテクノロジー・アジャセント・エンティティ(TA23k)と階層構造と8つの外部指標から構成されている。
各エンティティは100次元のコンテキスト埋め込みベクターで表現され、7つのセマンティック・テク・クラスタ(TC7)と3つのメタ・テク・クラスタ(TC3)に割り当てる。
100の新興技術(ET100)を手作業で検証する。
このデータセットには、Technology Awareness Index、Generality Index、Deeptech、Age of Tech Indexなど、新興技術の展望を評価するために特別に開発された指標が組み込まれている。
このデータセットには、Wikipediaからの豊富なメタデータとCrunchbase、Google Books、OpenAlex、Google Scholarといったサードパーティソースからのリンクデータが含まれており、構築されたインデックスの妥当性と正確性を検証するために使用される。
関連論文リスト
- DeepInnovation AI: A Global Dataset Mapping the AI innovation from Academic Research to Industrial Patents [2.8191246153416243]
DeepInnovationAIは3つの構造化ファイルを含む包括的なグローバルデータセットである。
DeepInnovationAIは、研究者、政策立案者、業界リーダーがトレンドを予測し、コラボレーションの機会を特定することを可能にする。
論文 参考訳(メタデータ) (2025-03-12T10:56:02Z) - Technology Mapping with Large Language Models [1.1900482352079937]
STARS(Semantic Technology and Retrieval System)は、LLM(Large Language Models)とSentence-BERTを利用する新しいフレームワークである。
それは、非構造化コンテンツの中に関連技術を特定し、包括的な企業プロファイルを構築し、その運用上の重要性に応じて各企業の技術をランク付けする。
実験の結果,STARSは検索精度を著しく向上させ,産業間技術マッピングのための汎用的で高性能なソリューションを提供することがわかった。
論文 参考訳(メタデータ) (2025-01-25T08:18:15Z) - MapExplorer: New Content Generation from Low-Dimensional Visualizations [60.02149343347818]
低次元の可視化や「投影マップ」は大規模で複雑なデータセットの解釈に広く用いられている。
これらの視覚化は、既存の知識空間を理解するのに役立つだけでなく、未知の領域への探索を暗黙的にガイドする。
プロジェクションマップ内の座標をコヒーレントでコンテキストに整合したテキストコンテンツに変換する新しい知識発見タスクであるMapExplorerを紹介する。
論文 参考訳(メタデータ) (2024-12-24T20:16:13Z) - Unlocking Comics: The AI4VA Dataset for Visual Understanding [62.345344799258804]
本稿では,1950年代のフレンチ・ベルジアン漫画に,深度推定,セマンティックセグメンテーション,サリエンシ検出,キャラクタ識別などのタスクを注記した新しいデータセットを提案する。
2つの異なる一貫したスタイルで構成され、自然画像から得られたオブジェクトの概念とラベルを取り入れている。
このような多様な情報を含むことで、このデータセットは計算の創造性を約束するだけでなく、アートのデジタル化やストーリーテリングの革新のための道も提供します。
論文 参考訳(メタデータ) (2024-10-27T14:27:05Z) - Measuring Technological Convergence in Encryption Technologies with
Proximity Indices: A Text Mining and Bibliometric Analysis using OpenAlex [46.3643544723237]
本研究は,サイバーセキュリティにおける新興技術間の技術的収束を明らかにする。
提案手法は,テキストマイニングとバイオロメトリ分析を統合し,技術的近接指標の定式化と予測を行う。
我々のケーススタディでは、ブロックチェーンと公開鍵暗号の間にかなりの収束が見られ、その近さが証明されている。
論文 参考訳(メタデータ) (2024-03-03T20:03:03Z) - A Survey of Blockchain, Artificial Intelligence, and Edge Computing for
Web 3.0 [22.941260278688933]
Web 3.0はWorld Wide Webの第3世代である。
Web 3.0は、よりオープンで、分散化され、インテリジェントで、相互接続されたネットワークに向かっている。
データ漏洩は、オンラインのプライバシーと個人情報のセキュリティに対する認識を高めている。
論文 参考訳(メタデータ) (2023-11-22T22:55:38Z) - Artificial Intelligence for Web 3.0: A Comprehensive Survey [76.06151253928171]
Web 3.0の現在の開発状況と、Web 3.0におけるAIテクノロジの適用について検討する。
調査では、各レイヤに存在する主な課題と課題について詳しく調べています。
私たちは、Web 3.0の基礎と成長におけるAIの重要な役割を説明します。
論文 参考訳(メタデータ) (2023-08-17T12:36:01Z) - The Semantic Scholar Open Data Platform [92.2948743167744]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - Covidex: Neural Ranking Models and Keyword Search Infrastructure for the
COVID-19 Open Research Dataset [87.47567807116204]
Covidexは最新のニューラルランキングモデルを利用する検索エンジンだ。
これは、Allen Institute for AIがキュレートしたCOVID-19 Open Researchデータセットへのアクセスを提供する。
論文 参考訳(メタデータ) (2020-07-14T16:26:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。