Fugu-MT 論文翻訳(概要): Decentralized AI: Permissionless LLM Inference on POKT Network

論文の概要: Decentralized AI: Permissionless LLM Inference on POKT Network

arxiv url: http://arxiv.org/abs/2405.20450v1
Date: Thu, 30 May 2024 19:50:07 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-03 18:14:59.040428
Title: Decentralized AI: Permissionless LLM Inference on POKT Network
Title（参考訳）: 分散AI: POKT ネットワーク上の無許可 LLM 推論
Authors: Daniel Olshansky, Ramiro Rodriguez Colmeiro, Bowen Li,
Abstract要約: POKT Networkの分散リモートプロシージャコールインフラストラクチャは、2020年にMainNetでローンチして以来、7400億のリクエストを突破している。この論文は、このネットワークのオープンソースでパーミッションレスな設計が、モデル研究者、ハードウェアオペレータ、APIプロバイダ、ユーザ間のインセンティブをどのように調整するかを説明している。
参考スコア（独自算出の注目度）: 8.68822221491139
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: POKT Network's decentralized Remote Procedure Call (RPC) infrastructure, surpassing 740 billion requests since launching on MainNet in 2020, is well-positioned to extend into providing AI inference services with minimal design or implementation modifications. This litepaper illustrates how the network's open-source and permissionless design aligns incentives among model researchers, hardware operators, API providers and users whom we term model Sources, Suppliers, Gateways and Applications respectively. Through its Relay Mining algorithm, POKT creates a transparent marketplace where costs and earnings directly reflect cryptographically verified usage. This decentralized framework offers large model AI researchers a new avenue to disseminate their work and generate revenue without the complexities of maintaining infrastructure or building end-user products. Supply scales naturally with demand, as evidenced in recent years and the protocol's free market dynamics. POKT Gateways facilitate network growth, evolution, adoption, and quality by acting as application-facing load balancers, providing value-added features without managing LLM nodes directly. This vertically decoupled network, battle tested over several years, is set up to accelerate the adoption, operation, innovation and financialization of open-source models. It is the first mature permissionless network whose quality of service competes with centralized entities set up to provide application grade inference.
Abstract（参考訳）: POKT Networkの分散リモートプロシージャコール(RPC)インフラストラクチャは、2020年にMainNetでローンチして以来、7400億のリクエストを突破している。この図は、モデル研究者、ハードウェアオペレータ、APIプロバイダ、およびモデルソース、サプライヤ、ゲートウェイ、アプリケーションと呼ぶユーザ間のインセンティブを、このネットワークのオープンソースおよびパーミッションレス設計がどのように整合させるかを説明している。 Relay Miningアルゴリズムを通じて、POKTは透明性のあるマーケットプレースを作成し、コストと収益は暗号的に検証された利用を直接反映する。この分散化フレームワークは、大規模なモデルAI研究者に、インフラストラクチャの維持やエンドユーザ製品の構築といった複雑さを伴わずに、自分たちの仕事を分散し、収益を生み出すための新たな道を提供する。近年で証明されているように、供給は需要とともに自然に拡大し、プロトコルのフリーマーケットのダイナミクスも変化している。 POKT Gatewayは、アプリケーション対応ロードバランサとして機能し、LLMノードを直接管理せずに付加価値機能を提供することで、ネットワークの成長、進化、採用、品質を促進する。この垂直に分離されたネットワークは、数年前にテストされ、オープンソースモデルの採用、運用、革新、財務化を加速するために設定されている。サービスの品質がアプリケーショングレードの推論を提供するために設定された集中型エンティティと競合する、最初の成熟したパーミッションレスネットワークである。

関連論文リスト

GenTorrent: Scaling Large Language Model Serving with An Overley Network [35.05892538683356]
本稿では,分散化コントリビュータの計算資源を活用するLLMサービスオーバーレイであるGenTorrentを提案する。このような分散インフラストラクチャの実現に固有の4つの重要な研究課題を特定します。この作業は、将来のAIサービス機能の民主化とスケーリングのための、新たな方向性の先駆者だと思います。
論文参考訳（メタデータ） (2025-04-27T01:08:25Z)
Large-Scale AI in Telecom: Charting the Roadmap for Innovation, Scalability, and Enhanced Digital Experiences [212.5544743797899]
大型通信モデル(LTM)は、現代の通信ネットワークが直面する複雑な課題に対処するために設計されたAIモデルである。本稿は、LTMのアーキテクチャとデプロイメント戦略から、ネットワーク管理、リソース割り当て、最適化における彼らのアプリケーションまで、幅広いトピックについて論じる。
論文参考訳（メタデータ） (2025-03-06T07:53:24Z)
Intelligent Mobile AI-Generated Content Services via Interactive Prompt Engineering and Dynamic Service Provisioning [55.641299901038316]
AI生成コンテンツは、ネットワークエッジで協調的なMobile AIGC Service Providers(MASP)を編成して、リソース制約のあるユーザにユビキタスでカスタマイズされたコンテンツを提供することができる。このようなパラダイムは2つの大きな課題に直面している: 1) 生のプロンプトは、ユーザーが特定のAIGCモデルで経験していないために、しばしば生成品質が低下する。本研究では,Large Language Model (LLM) を利用してカスタマイズしたプロンプトコーパスを生成する対話型プロンプトエンジニアリング機構を開発し,政策模倣に逆強化学習(IRL)を用いる。
論文参考訳（メタデータ） (2025-02-17T03:05:20Z)
A Learning-based Incentive Mechanism for Mobile AIGC Service in Decentralized Internet of Vehicles [49.86094523878003]
モバイルAIGCサービスアロケーションのための分散インセンティブ機構を提案する。我々は、AIGCサービスのRSUへの供給と、IoVコンテキスト内のサービスに対するユーザ要求のバランスを見つけるために、マルチエージェントの深層強化学習を採用している。
論文参考訳（メタデータ） (2024-03-29T12:46:07Z)
MobiLlama: Towards Accurate and Lightweight Fully Transparent GPT [87.4910758026772]
近年のLarge Language Models (LLM) 開発において,"Bigger the Better" が主流となっている。本稿では、リソース制約のあるデバイスに対して、正確かつ効率的なSLM(Small Language Models)を設計する上での課題に対処し、"less is more"パラダイムについて考察する。
論文参考訳（メタデータ） (2024-02-26T18:59:03Z)
Elastic Entangled Pair and Qubit Resource Management in Quantum Cloud Computing [73.7522199491117]
量子クラウドコンピューティング(QCC)は、量子コンピューティングリソースを効率的に提供するための有望なアプローチを提供する。ユーザ需要の変動と量子回路の要求は、効率的なリソース供給のために困難である。本稿では、量子コンピューティングとネットワークリソースのプロビジョニングのためのリソース割り当てモデルを提案する。
論文参考訳（メタデータ） (2023-07-25T00:38:46Z)
Relay Mining: Incentivizing Full Non-Validating Nodes Servicing All RPC Types [0.0]
リレーマイニング(Relay Mining)は、クライアントからサーバへのリモートプロシージャコール(RPC)のボリュームを推定し、証明する。デジタル署名、コミット・アンド・リベラルスキーム、Sparse Merkle Sum Tries (SMSTs)を活用して、作業の量を証明する。分散台帳上のネイティブ暗号は、アプリケーションを制限するために使われ、過剰使用を非インセンティブ化する。
論文参考訳（メタデータ） (2023-05-18T03:23:41Z)
Deep Recurrent Learning Through Long Short Term Memory and TOPSIS [0.0]
クラウドコンピューティングの安価で簡単で迅速な管理の約束により、ビジネスオーナーはモノリシックからデータセンタ/クラウドベースのERPへの移行を迫られます。クラウドERP開発には、計画、実装、テスト、アップグレードといった循環的なプロセスが伴うため、その採用はディープリカレントニューラルネットワーク問題として実現されている。我々の理論モデルは、キープレーヤー、サービス、アーキテクチャ、機能を明確にすることで、参照モデル上で検証される。
論文参考訳（メタデータ） (2022-12-30T10:35:25Z)
Evaluation of a blockchain-enabled resource management mechanism for NGNs [0.0]
本稿では,ネットワークプロバイダ間の資源管理と交渉におけるブロックチェーン技術の利用について検討する。リソース管理機構の実装はスマートコントラクト(SC)で記述され、テストベッドはそれぞれRaftとIBFTのコンセンサス機構を使用している。
論文参考訳（メタデータ） (2022-11-01T13:40:26Z)
KAIROS: Building Cost-Efficient Machine Learning Inference Systems with Heterogeneous Cloud Resources [10.462798429064277]
KAIROSは、目標達成時のクエリスループットとコスト予算を最大化する、新しいランタイムフレームワークである。産業レベルのディープラーニング(DL)モデルを用いて評価した結果,KAIROSは最適均一解のスループットを最大2倍に向上することがわかった。
論文参考訳（メタデータ） (2022-10-12T03:06:51Z)
AI in 6G: Energy-Efficient Distributed Machine Learning for Multilayer Heterogeneous Networks [7.318997639507269]
本稿では,ネットワーク層とエンティティにまたがるさまざまな機械学習手法に関連するタスクを分散する,階層ベースの新しいHetNetアーキテクチャを提案する。このようなHetNetは、複数のアクセス方式と、エネルギー効率を高めるためのデバイス間通信(D2D)を備えている。
論文参考訳（メタデータ） (2022-06-04T22:03:19Z)
Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文参考訳（メタデータ） (2021-06-30T16:49:07Z)
Regulation conform DLT-operable payment adapter based on trustless - justified trust combined generalized state channels [77.34726150561087]
物の経済(EoT)は、ピアツーピアの信頼性のないネットワークで動作するソフトウェアエージェントに基づいています。基本的価値と技術的可能性が異なる現在のソリューションの概要を述べる。我々は,暗号ベースの分散型の信頼できない要素の強みと,確立された,十分に規制された支払い手段を組み合わせることを提案する。
論文参考訳（メタデータ） (2020-07-03T10:45:55Z)
Demand-Side Scheduling Based on Multi-Agent Deep Actor-Critic Learning for Smart Grids [56.35173057183362]
家庭用家電をネットでスケジュールできるスマートメーターが各家庭に備わっている需要側エネルギー管理の問題点を考察する。目標は、リアルタイムの料金体系の下で全体のコストを最小化することです。マルコフゲームとしてスマートグリッド環境の定式化を提案する。
論文参考訳（メタデータ） (2020-05-05T07:32:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。