論文の概要: Analysis of Models for Decentralized and Collaborative AI on Blockchain
- arxiv url: http://arxiv.org/abs/2009.06756v2
- Date: Tue, 22 Sep 2020 03:14:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 12:27:10.031528
- Title: Analysis of Models for Decentralized and Collaborative AI on Blockchain
- Title(参考訳): ブロックチェーンにおける分散型協調型AIモデルの解析
- Authors: Justin D. Harris
- Abstract要約: 本稿では,自己評価のインセンティブメカニズムを用いる際のベストプラクティスを提案するために,いくつかのモデルと構成を用いて評価する。
モデルがパブリックブロックチェーン上でスマートコントラクトでホストされている場合、データセット毎にいくつかの要因を比較します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning has recently enabled large advances in artificial
intelligence, but these results can be highly centralized. The large datasets
required are generally proprietary; predictions are often sold on a per-query
basis; and published models can quickly become out of date without effort to
acquire more data and maintain them. Published proposals to provide models and
data for free for certain tasks include Microsoft Research's Decentralized and
Collaborative AI on Blockchain. The framework allows participants to
collaboratively build a dataset and use smart contracts to share a continuously
updated model on a public blockchain. The initial proposal gave an overview of
the framework omitting many details of the models used and the incentive
mechanisms in real world scenarios. In this work, we evaluate the use of
several models and configurations in order to propose best practices when using
the Self-Assessment incentive mechanism so that models can remain accurate and
well-intended participants that submit correct data have the chance to profit.
We have analyzed simulations for each of three models: Perceptron, Na\"ive
Bayes, and a Nearest Centroid Classifier, with three different datasets:
predicting a sport with user activity from Endomondo, sentiment analysis on
movie reviews from IMDB, and determining if a news article is fake. We compare
several factors for each dataset when models are hosted in smart contracts on a
public blockchain: their accuracy over time, balances of a good and bad user,
and transaction costs (or gas) for deploying, updating, collecting refunds, and
collecting rewards. A free and open source implementation for the Ethereum
blockchain and simulations written in Python is provided at
https://github.com/microsoft/0xDeCA10B. This version has updated gas costs
using newer optimizations written after the original publication.
- Abstract(参考訳): 機械学習は近年、人工知能の大きな進歩を可能にしているが、これらの結果は高度に集中できる。
必要な大規模なデータセットは一般的にプロプライエタリであり、予測はクエリ毎に販売されることが多い。
Microsoft ResearchのDecentralized and Collaborative AI on Blockchainなど、特定のタスクのためにモデルとデータを無償で提供する提案が公開されている。
このフレームワークにより、参加者はデータセットを共同で構築し、スマートコントラクトを使用して、パブリックブロックチェーン上で継続的に更新されたモデルを共有することができる。
最初の提案は、実世界のシナリオで使用されるモデルとインセンティブメカニズムの多くの詳細を省略したフレームワークの概要を提供した。
本研究では,自己評価インセンティブ(自己評価インセンティブ,自己評価インセンティブ,自己評価インセンティブ,自己評価インセンティブ)を用いて,正しいデータを提出する参加者が利益を得る機会を得られるように,複数のモデルと構成を用いてベストプラクティスを提案する。
パーセプトロン,Na\"ive Bayes,Nearest Centroid Classifierの3つのモデルについて,エンドモンドからのユーザアクティビティによるスポーツの予測,IMDBからの映画レビューに対する感情分析,ニュース記事が偽であるかどうかの3つのデータセットを用いてシミュレーションを行った。
モデルがパブリックブロックチェーン上でスマートコントラクトでホストされている場合、データセット毎に、その正確さ、良質なユーザと悪質なユーザのバランス、デプロイ、更新、返金、報酬収集のためのトランザクションコスト(あるいはガス)など、いくつかの要因を比較します。
Pythonで書かれたEthereumブロックチェーンとシミュレーションのオープンソース実装はhttps://github.com/microsoft/0xDeCA10Bで公開されている。
このバージョンは、オリジナルの出版後に書かれた新しい最適化を使用して、ガスコストを更新した。
関連論文リスト
- Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - A Collaborative Ensemble Framework for CTR Prediction [73.59868761656317]
我々は、複数の異なるモデルを活用するための新しいフレームワーク、CETNet(Collaborative Ensemble Training Network)を提案する。
ナイーブなモデルスケーリングとは違って,私たちのアプローチは,共同学習による多様性とコラボレーションを重視しています。
当社のフレームワークは,Metaの3つのパブリックデータセットと大規模産業データセットに基づいて検証する。
論文 参考訳(メタデータ) (2024-11-20T20:38:56Z) - Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Multimodal Models [146.18107944503436]
Molmoは、オープンネスのクラスで最先端のVLMの新たなファミリーである。
私たちの重要なイノベーションは、人間のアノテーションから収集された、新しくて詳細な画像キャプションデータセットです。
近い将来、モデルウェイト、キャプション、微調整データ、ソースコードをすべてリリースする予定です。
論文 参考訳(メタデータ) (2024-09-25T17:59:51Z) - Blockchain-based Federated Learning with Secure Aggregation in Trusted
Execution Environment for Internet-of-Things [20.797220195954065]
本稿では,Intel Software Guard Extension (SGX) ベースのTrusted Execution Environment (TEE) を用いたブロックチェーンベースのフェデレートラーニング(FL)フレームワークを提案する。
FLでは、ローカルモデルを攻撃者によって改ざんすることができる。従って、改ざんされたローカルモデルから生成されたグローバルモデルが誤用される可能性があるため、提案フレームワークはブロックチェーンネットワークを利用してモデルアグリゲーションをセキュアにする。
ノードは集約されたモデルの信頼性を検証し、モデルの整合性を保証するためにブロックチェーンコンセンサスメカニズムを実行し、タンパ保護ストレージのために分散台帳に追加することができる。
論文 参考訳(メタデータ) (2023-04-25T15:00:39Z) - Proof-of-Contribution-Based Design for Collaborative Machine Learning on
Blockchain [23.641069086247573]
私たちのゴールは、分散化されたコラボレーティブ/フェデレーション学習アプリケーションのためのデータマーケットプレースを設計することにあります。
私たちの設計では、プロジェクトオーナーとトレーナーの他に、分散ストレージインフラストラクチャとアグリゲータを使用します。
提案されるデータ市場は,ブロックチェーンスマートコントラクトを通じて実行します。
論文 参考訳(メタデータ) (2023-02-27T18:43:11Z) - Synthetic Model Combination: An Instance-wise Approach to Unsupervised
Ensemble Learning [92.89846887298852]
ラベル付きデータのトレーニングセットから学ぶ機会のない、新しいテストデータに対する予測を検討する。
専門家モデルのセットと予測へのアクセスと、トレーニングに使用するデータセットに関する制限された情報を提供すること。
論文 参考訳(メタデータ) (2022-10-11T10:20:31Z) - APPFLChain: A Privacy Protection Distributed Artificial-Intelligence
Architecture Based on Federated Learning and Consortium Blockchain [6.054775780656853]
APPFLChainと呼ばれる新しいシステムアーキテクチャを提案する。
これはHyperledger Fabricベースのブロックチェーンとフェデレーション学習パラダイムの統合アーキテクチャである。
我々の新しいシステムは、機密性の高い個人情報をサーバに共有する必要がないため、高いセキュリティとプライバシを維持することができる。
論文 参考訳(メタデータ) (2022-06-26T05:30:07Z) - OmniLytics: A Blockchain-based Secure Data Market for Decentralized
Machine Learning [3.9256804549871553]
我々は機械学習アプリケーションのためのセキュアなデータ取引マーケットプレースであるOmniLyticsを提案する。
データオーナは、プライベートデータをコントリビュートして、モデルオーナが要求するMLモデルを集合的にトレーニングし、データコントリビューションの補償を受けることができる。
OmniLyticsは、1)好奇心の強いデータ所有者に対するモデルセキュリティ、2)好奇心の強いモデルとデータ所有者に対するデータセキュリティ、3)有毒なモデルトレーニングに対する欠陥結果を提供する悪意のあるデータ所有者へのレジリエンス、4)支払いを回避しようとする悪意のあるモデルオーナーへのレジリエンスを提供する。
論文 参考訳(メタデータ) (2021-07-12T08:28:15Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - 2CP: Decentralized Protocols to Transparently Evaluate Contributivity in
Blockchain Federated Learning Environments [9.885896204530878]
フェデレートラーニングのための2つの新しいプロトコルからなるフレームワークである2CPを紹介する。
Crowdsource Protocolでは、アクターがトレーニングのためにモデルを前進させ、自身のデータを使用して、それに対するコントリビューションを評価することができる。
Consortium Protocolは、初期モデルを所有しておらず、データセットが利用できない場合でも、トレーナーに同じ保証を与える。
論文 参考訳(メタデータ) (2020-11-15T12:59:56Z) - AvgOut: A Simple Output-Probability Measure to Eliminate Dull Responses [97.50616524350123]
機能エンジニアリングなしで、どの発話やトークンが退屈であるかを動的に認識する対話モデルを構築します。
最初のモデルMinAvgOutは、各バッチの出力分布を通して、ダイバーシティスコアを直接最大化する。
第2のモデルであるラベルファインチューニング(LFT)は、多様性スコアによって連続的にスケールされたラベルをソースシーケンスにプリペイドし、多様性レベルを制御する。
3つ目のモデルであるRLは強化学習を採用し、多様性スコアを報奨信号として扱う。
論文 参考訳(メタデータ) (2020-01-15T18:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。