論文の概要: Firm-based relatedness using machine learning
- arxiv url: http://arxiv.org/abs/2202.00458v1
- Date: Tue, 1 Feb 2022 15:12:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-02 14:37:16.767224
- Title: Firm-based relatedness using machine learning
- Title(参考訳): 機械学習を用いた企業関係性
- Authors: Giambattista Albora, Andrea Zaccaria
- Abstract要約: 本研究では、複雑なネットワークと、国家レベルのデータと企業レベルのデータに基づいてトレーニングされた機械学習アルゴリズムを比較した。
その結果,関係性はスケール依存型であることが示され,予測したいデータと同一の型で機械学習を用いて最良の評価が得られた。
国別データに基づく関連性対策は企業には適さないが、企業レベルのデータは国の発展を予測する上でも極めて有益である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The relatedness between an economic actor (for instance a country, or a firm)
and a product is a measure of the feasibility of that economic activity. As
such, it is a driver for investments both at a private and institutional level.
Traditionally, relatedness is measured using complex networks approaches
derived by country-level co-occurrences. In this work, we compare complex
networks and machine learning algorithms trained on both country and firm-level
data. In order to quantitatively compare the different measures of relatedness,
we use them to predict the future exports at country and firm-level, assuming
that more related products have higher likelihood to be exported in the near
future. Our results show that relatedness is scale-dependent: the best
assessments are obtained by using machine learning on the same typology of data
one wants to predict. Moreover, while relatedness measures based on country
data are not suitable for firms, firm-level data are quite informative also to
predict the development of countries. In this sense, models built on firm data
provide a better assessment of relatedness with respect to country-level data.
We also discuss the effect of using community detection algorithms and
parameter optimization, finding that a partition into a higher number of blocks
decreases the computational time while maintaining a prediction performance
that is well above the network based benchmarks.
- Abstract(参考訳): 経済行為者(例えば国や会社)と製品との間の関係性は、その経済活動の実現可能性の尺度である。
そのため、民間・機関レベルでの投資の原動力となっている。
伝統的に、関係性は国レベルの共起によって導かれる複雑なネットワークアプローチを用いて測定される。
本研究では、国と企業の両方で訓練された複雑なネットワークと機械学習アルゴリズムを比較した。
関連度を定量的に比較するために,より多くの関連商品が近い将来に輸出される可能性が高いと仮定して,国・企業レベルでの将来輸出予測に使用する。
その結果,関係性はスケール依存型であることが示され,予測したいデータと同一の型で機械学習を用いて最良の評価が得られた。
また、国別データに基づく関連措置は企業には適さないが、企業レベルのデータも国の発展を予測する上で非常に有益である。
この意味では、企業データに基づいて構築されたモデルは、国レベルのデータに関する関連性をよりよく評価する。
また,ネットワークベースのベンチマークをはるかに上回る予測性能を維持しつつ,高いブロック数に分割することで計算時間を短縮できることを示すことで,コミュニティ検出アルゴリズムとパラメータ最適化の効果について考察した。
関連論文リスト
- Global Inequalities in the Production of Artificial Intelligence: A Four-Country Study on Data Work [0.0]
労働力は人工知能の発展において大きな役割を担っているが、ほとんど認識されていない。
オンラインプラットフォームと下請け業者のネットワークは、AI生産の影の中でタスクを実行するためにデータワーカーを募集する。
本研究は、ベネズエラ、ブラジル、マダガスカル、フランスの富裕国における労働条件とデータ労働者のプロフィールを比較して、結果として生じる複雑さを明らかにする。
論文 参考訳(メタデータ) (2024-10-18T07:23:17Z) - Machine Learning Classification of Peaceful Countries: A Comparative Analysis and Dataset Optimization [0.0]
本稿では,グローバルメディア記事から抽出した言語パターンを用いて,各国を平和的・非平和的に分類する機械学習手法を提案する。
我々は,平和な国を効果的に識別する教師付き分類モデルを開発するために,ベクトル埋め込みとコサイン類似性を用いている。
論文 参考訳(メタデータ) (2024-10-01T19:28:03Z) - Data Similarity is Not Enough to Explain Language Model Performance [6.364065652816667]
類似度は言語モデルの性能と相関する。
類似度指標は正確性や相互に相関しない。
これは、事前学習データと下流タスクの関係が、しばしば想定されるよりも複雑であることを示している。
論文 参考訳(メタデータ) (2023-11-15T14:48:08Z) - Scaling Laws Do Not Scale [54.72120385955072]
最近の研究によると、データセットのサイズが大きくなると、そのデータセットでトレーニングされたモデルのパフォーマンスが向上する。
このスケーリング法則の関係は、モデルのアウトプットの質を異なる集団がどのように認識するかと一致しないパフォーマンスを測定するために使われる指標に依存する、と我々は主張する。
異なるコミュニティは、互いに緊張関係にある価値を持ち、モデル評価に使用されるメトリクスについて、困難で、潜在的に不可能な選択をもたらす可能性がある。
論文 参考訳(メタデータ) (2023-07-05T15:32:21Z) - Toward the Automated Construction of Probabilistic Knowledge Graphs for
the Maritime Domain [60.76554773885988]
国際海事犯罪はますます高度化しており、より広い犯罪ネットワークと結びついていることが多い。
これは、ハードデータと他のタイプのデータを組み合わせることを目的とした研究と開発に繋がった。
本稿では,確率的知識グラフの自動構築のためのプロトタイプであるMaritime DeepDiveを提案する。
論文 参考訳(メタデータ) (2023-05-04T00:24:30Z) - Striving for data-model efficiency: Identifying data externalities on
group performance [75.17591306911015]
信頼できる、効果的で責任ある機械学習システムの構築は、トレーニングデータとモデリング決定の違いが、予測パフォーマンスにどのように影響するかを理解することに集中する。
我々は、特定のタイプのデータモデル非効率性に注目し、一部のソースからトレーニングデータを追加することで、集団の重要なサブグループで評価されるパフォーマンスを実際に低下させることができる。
以上の結果から,データ効率が正確かつ信頼性の高い機械学習の鍵となることが示唆された。
論文 参考訳(メタデータ) (2022-11-11T16:48:27Z) - Product Progression: a machine learning approach to forecasting
industrial upgrading [0.0]
予測すべき重要な対象は新製品の活性化であり、木に基づくアルゴリズムは、非常に強力な自動相関ベンチマークと他の教師付きアルゴリズムの両方を明らかに上回っている。
当社のアプローチには直接的な政策上の意味があり、その国に新しい製品を導入する可能性の定量的かつ科学的に検証された指標を提供する。
論文 参考訳(メタデータ) (2021-05-31T14:59:37Z) - Can Active Learning Preemptively Mitigate Fairness Issues? [66.84854430781097]
データセットバイアスは、機械学習における不公平な原因の1つです。
不確実性に基づくALで訓練されたモデルが保護クラスの決定において公平であるかどうかを検討する。
また,勾配反転(GRAD)やBALDなどのアルゴリズム的公正性手法の相互作用についても検討する。
論文 参考訳(メタデータ) (2021-04-14T14:20:22Z) - Domain Adaptative Causality Encoder [52.779274858332656]
我々は,適応因果同定と局所化の課題に対処するために,依存木の特徴と敵対学習を活用する。
我々は、テキストにあらゆる種類の因果関係を統合する新しい因果関係データセット、MedCausを提案する。
論文 参考訳(メタデータ) (2020-11-27T04:14:55Z) - Supervised machine learning techniques for data matching based on
similarity metrics [0.0]
データマッチングは、同じ現実世界のエンティティを参照するデータのインスタンスを識別しようとするフィールドである。
本研究では,データマッチングの分野と文字列類似性関数を組み合わせた機械学習手法を提案する。
この性能は、FISCAL Technologiesのソリューションを、現在利用可能な重複解に対するベンチマークとして比較した。
論文 参考訳(メタデータ) (2020-07-08T10:04:35Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。