論文の概要: CompanyKG: A Large-Scale Heterogeneous Graph for Company Similarity
Quantification
- arxiv url: http://arxiv.org/abs/2306.10649v1
- Date: Sun, 18 Jun 2023 23:45:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 19:26:34.544188
- Title: CompanyKG: A Large-Scale Heterogeneous Graph for Company Similarity
Quantification
- Title(参考訳): CompanyKG: 企業類似性定量化のための大規模不均一グラフ
- Authors: Lele Cao, Vilhelm von Ehrenheim, Mark Granroth-Wilding, Richard
Anselmo Stahl, Andrew McCornack, Armin Catovic and Dhiana Deva Cavacanti
Rocha
- Abstract要約: 我々は,企業の特徴や関係を多様に表現し,学習するための知識グラフである企業KGを提案し,公開する。
具体的には、131万の企業が、企業記述の埋め込みに富んだノードとして表現されている。
15の異なる企業間関係は、51.06万の重み付きエッジをもたらす。
- 参考スコア(独自算出の注目度): 0.15393457051344298
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the investment industry, it is often essential to carry out fine-grained
company similarity quantification for a range of purposes, including market
mapping, competitor analysis, and mergers and acquisitions. We propose and
publish a knowledge graph, named CompanyKG, to represent and learn diverse
company features and relations. Specifically, 1.17 million companies are
represented as nodes enriched with company description embeddings; and 15
different inter-company relations result in 51.06 million weighted edges. To
enable a comprehensive assessment of methods for company similarity
quantification, we have devised and compiled three evaluation tasks with
annotated test sets: similarity prediction, competitor retrieval and similarity
ranking. We present extensive benchmarking results for 11 reproducible
predictive methods categorized into three groups: node-only, edge-only, and
node+edge. To the best of our knowledge, CompanyKG is the first large-scale
heterogeneous graph dataset originating from a real-world investment platform,
tailored for quantifying inter-company similarity.
- Abstract(参考訳): 投資業界では、市場マッピング、競合分析、合併や買収など、様々な目的のために細かな会社の類似度定量化を行うことが不可欠であることが多い。
企業の特徴と関係を表現・学習するために,企業kgという知識グラフを提案し,公開する。
具体的には、117万の企業が企業記述の埋め込みに富んだノードとして表現され、15の異なる企業間関係によって51.06百万のエッジが生成される。
企業の類似度定量化手法の包括的評価を可能にするために,類似度予測,競合検索,類似度ランキングという3つの評価タスクをアノテートした。
本稿では,11個の再現可能な予測手法について,ノードのみ,エッジのみ,ノード+エッジの3つのグループに分類した。
私たちの知る限りでは、企業間類似性を定量化するのに適した、実世界の投資プラットフォームから派生した、最初の大規模な異種グラフデータセットである。
関連論文リスト
- A Scalable Data-Driven Framework for Systematic Analysis of SEC 10-K Filings Using Large Language Models [0.0]
SEC10-Kの申請に基づいて企業の業績を分析し,評価する,新たなデータ駆動型アプローチを提案する。
提案手法は、データパイプラインを実行して視覚化を作成するためのノーコードソリューションとして、対話型GUI上に実装される。
このアプリケーションは評価結果を示し、企業業績の年次比較を提供する。
論文 参考訳(メタデータ) (2024-09-26T06:57:22Z) - Unveiling the Potential of Graph Neural Networks in SME Credit Risk
Assessment [7.33330721560182]
本稿では、グラフニューラルネットワークを技術的枠組みとして捉え、企業財務指標間の本質的な関係を統合し、企業信用リスク評価モデルを提案する。
論文 参考訳(メタデータ) (2024-09-23T22:41:54Z) - Unifying Feature and Cost Aggregation with Transformers for Semantic and Visual Correspondence [51.54175067684008]
本稿では,高密度マッチングタスク用に設計されたTransformerベースの積分機能とコスト集約ネットワークを提案する。
まず, 特徴集約とコスト集約が異なる特徴を示し, 双方の集約プロセスの司法的利用から生じる実質的な利益の可能性を明らかにした。
本フレームワークは意味マッチングのための標準ベンチマークで評価され,また幾何マッチングにも適用された。
論文 参考訳(メタデータ) (2024-03-17T07:02:55Z) - Company2Vec -- German Company Embeddings based on Corporate Websites [0.0]
本稿では,企業2Vecを用いた表現学習における新しい応用法を提案する。
このモデルは、Word2Vecと次元還元を用いて、非構造化企業のWebサイトデータからビジネス活動を分析する。
企業2Vecはセマンティック言語構造を維持しており、粒状産業に効率的な企業埋め込みを創出している。
論文 参考訳(メタデータ) (2023-07-18T15:14:09Z) - Named entity recognition using GPT for identifying comparable companies [0.0]
我々は,OpenAIのGPTのような大規模言語モデル(LLM)を用いることで,標準的なエンティティ認識(NER)手法よりも精度と成功率が高いことを示す。
定量的に高い精度を実証し、質的に言えば、適切な競合する企業同士のピアグループを作るのに使用できることを示す。
論文 参考訳(メタデータ) (2023-07-11T16:48:16Z) - Meta Architecure for Point Cloud Analysis [77.92830049514264]
我々は,3Dポイントクラウド分析手法を解釈する,PointMetaと呼ばれる統合フレームワークを提案する。
PointMetaでは、さまざまなアプローチを公平に比較することができ、迅速な実験を使用して、比較から経験的な観察や仮定を検証することができます。
既存のアプローチを簡単に微調整することで、PointMetaBaseと呼ばれる基本的なビルディングブロックを導き出すことができます。
論文 参考訳(メタデータ) (2022-11-26T02:53:40Z) - Knowledge Graph Refinement based on Triplet BERT-Networks [0.0]
本稿では,知識グラフ内のエンティティや関係に関する情報を集約する埋め込み空間を作成するトランスフォーマーベースの三重項ネットワークを採用する。
事実からテキストシーケンスを生成し、事前訓練されたトランスフォーマーベースの言語モデルのトリプルトネットワークを微調整する。
これら2つの改良作業の最先端性能に対して, GilBERT は, より優れた, あるいは同等な結果が得られることを示す。
論文 参考訳(メタデータ) (2022-11-18T19:01:21Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - Gait Recognition in the Wild: A Large-scale Benchmark and NAS-based
Baseline [95.88825497452716]
歩行ベンチマークにより、研究コミュニティは高性能歩行認識システムの訓練と評価を行うことができる。
GREWは、野生における歩行認識のための最初の大規模データセットである。
SPOSGaitはNASベースの最初の歩行認識モデルである。
論文 参考訳(メタデータ) (2022-05-05T14:57:39Z) - Exploring and Evaluating Attributes, Values, and Structures for Entity
Alignment [100.19568734815732]
エンティティアライメント(EA)は、さまざまなKGから等価なエンティティをリンクすることで、リッチコンテンツの統合知識グラフ(KG)を構築することを目的としている。
属性・トリプルは重要なアライメント信号も提供できますが、まだ十分に調査されていません。
本稿では,属性値エンコーダを用いてKGをサブグラフに分割し,属性の様々なタイプを効率的にモデル化することを提案する。
論文 参考訳(メタデータ) (2020-10-07T08:03:58Z) - Benchmarking Graph Neural Networks [75.42159546060509]
グラフニューラルネットワーク(GNN)は、グラフ上のデータから分析および学習するための標準ツールキットとなっている。
成功している分野が主流で信頼性を持つようになるためには、進捗を定量化するためにベンチマークを開発する必要がある。
GitHubリポジトリは1,800のスターと339のフォークに到達し、提案されているオープンソースフレームワークの有用性を実証している。
論文 参考訳(メタデータ) (2020-03-02T15:58:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。