論文の概要: The TerraByte Client: providing access to terabytes of plant data
- arxiv url: http://arxiv.org/abs/2203.13691v1
- Date: Fri, 25 Mar 2022 14:55:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-28 16:22:40.159535
- Title: The TerraByte Client: providing access to terabytes of plant data
- Title(参考訳): TerraByteクライアント: テラバイトの植物データへのアクセスを提供する
- Authors: Michael A. Beck, Christopher P. Bidinosti, Christopher J. Henry,
Manisha Ajmani
- Abstract要約: TerraByte Clientは、Compute Canadaでホストされているデータポータルから、ユーザ定義の植物データセットをダウンロードするソフトウェアである。
これによってユーザーは、利用可能なデータの概要と、そのデータのサンプルを視覚的にチェックする簡単な方法を得ることができる。
サンプルは数秒以内にダウンロードして、データがユーザのニーズに適合していることを確認することができる。
- 参考スコア(独自算出の注目度): 0.1338174941551702
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper we demonstrate the TerraByte Client, a software to download
user-defined plant datasets from a data portal hosted at Compute Canada. To
that end the client offers two key functionalities: (1) It allows the user to
get an overview on what data is available and a quick way to visually check
samples of that data. For this the client receives the results of queries to a
database and displays the number of images that fulfill the search criteria.
Furthermore, a sample can be downloaded within seconds to confirm that the data
suits the user's needs. (2) The user can then download the specified data to
their own drive. This data is prepared into chunks server-side and sent to the
user's end-system, where it is automatically extracted into individual files.
The first chunks of data are available for inspection after a brief waiting
period of a minute or less depending on available bandwidth and type of data.
The TerraByte Client has a full graphical user interface for easy usage and
uses end-to-end encryption. The user interface is built on top of a low-level
client. This architecture in combination of offering the client program
open-source makes it possible for the user to develop their own user interface
or use the client's functionality directly. An example for direct usage could
be to download specific data on demand within a larger application, such as
training machine learning models.
- Abstract(参考訳): 本稿では,Compute Canadaでホストされているデータポータルからユーザ定義の植物データセットをダウンロードするソフトウェアであるTerraByte Clientを紹介する。
その目的のために、クライアントは2つの重要な機能を提供している: (1)どのデータが利用可能かの概要と、そのデータのサンプルを視覚的にチェックするための簡単な方法を提供する。
そのため、クライアントはデータベースにクエリの結果を受信し、検索基準を満たす画像の数を表示する。
さらに、サンプルを数秒でダウンロードして、データがユーザのニーズに合っていることを確認することもできる。
(2)ユーザは指定されたデータを自分のドライブにダウンロードすることができる。
このデータはサーバサイドにチャンクしてユーザのエンドシステムに送信され、そこで自動的に個々のファイルに抽出される。
最初のデータチャンクは、利用可能な帯域幅やデータの種類によって、1分以下の短い待ち時間後に検査することができる。
TerraByte Clientは、使いやすいグラフィカルなユーザインターフェースを備え、エンドツーエンドの暗号化を使用する。
ユーザインターフェースは低レベルのクライアント上に構築されます。
このアーキテクチャは、クライアントプログラムをオープンソースにすることで、ユーザが独自のユーザインターフェースを開発したり、クライアントの機能を直接使用したりすることが可能になります。
直接利用の例としては、機械学習モデルのトレーニングなど、大きなアプリケーション内でオンデマンドで特定のデータをダウンロードすることがある。
関連論文リスト
- Federated Graph Learning with Graphless Clients [52.5629887481768]
FGL(Federated Graph Learning)は、グラフニューラルネットワーク(GNN)などの機械学習モデルをトレーニングするタスクである。
グラフレスクライアントを用いたFGLにおける問題に対処するための新しいフレームワークFedGLSを提案する。
論文 参考訳(メタデータ) (2024-11-13T06:54:05Z) - A Privacy Measure Turned Upside Down? Investigating the Use of HTTP Client Hints on the Web [2.082364067210557]
本稿では,HTTPクライアントヒントの利用に関する長期研究について紹介する。
ほとんどすべてのWebブラウザで実装されているにもかかわらず、クライアントヒントのサーバ側使用は一般的には低い。
トラッカーと結びついているサードパーティウェブサイトの文脈では、採用率が著しく高い。
論文 参考訳(メタデータ) (2024-05-22T15:32:12Z) - Getting the Most from Eye-Tracking: User-Interaction Based Reading
Region Estimation Dataset and Models [2.9531082052924233]
ブラウザ追跡データに基づいて,地域ごとの読み出し時間を予測するモデルを構築した。
ユーザインタラクションに基づいて、メッセージレベルの読み込み時間を予測するために、マシンラーニングとディープラーニングモデルをトレーニングしました。
論文 参考訳(メタデータ) (2023-06-12T23:03:58Z) - Internet Explorer: Targeted Representation Learning on the Open Web [121.02587846761627]
現代のビジョンモデルは通常、大規模で静的なデータセットで事前訓練された微調整の汎用モデルに依存している。
本稿では,インターネットを動的に活用して,手作業で極めてうまく動作する小規模モデルを迅速に訓練することを提案する。
当社のアプローチはInternet Explorerと呼ばれ,Webを自己教師型の方法で探索することで,望ましいターゲットデータセットのパフォーマンス向上に寄与する関連事例を段階的に見つける。
論文 参考訳(メタデータ) (2023-02-27T18:59:55Z) - M3FGM:a node masking and multi-granularity message passing-based
federated graph model for spatial-temporal data prediction [6.9141842767826605]
本稿では,ノードbfseries Maskingとbfseries Multi-granularity bfseries Message passing-based Federated Graph Model (M$3$FGM) という新しいGNN指向の分割学習手法を提案する。
最初の問題として、M$3$FGMのサーバモデルは、クライアントがオフラインであるケースをシミュレートするためにMaskNodeレイヤを使用している。
また、クライアントモデルのデコーダもデュアルサブデコーダ構造を使用しており、各クライアントモデルはそのローカルデータを使用してオフライン時に独立して予測できる。
論文 参考訳(メタデータ) (2022-10-27T16:59:39Z) - Inference-Time Personalized Federated Learning [17.60724466773559]
推論時間 PFL (Inference-Time PFL) は、一連のクライアントでトレーニングされたモデルを、推論時に新しい未ラベルのクライアントで後で評価する必要がある場所である。
本稿では,ハイパーネットワークモジュールとエンコーダモジュールをベースとしたIT-PFL-HNを提案する。
IT-PFL-HNは、特に新規クライアントが大きなドメインシフトを持つ場合、現在のFL法やPFL法よりも一般化されている。
論文 参考訳(メタデータ) (2021-11-16T10:57:20Z) - Omnidata: A Scalable Pipeline for Making Multi-Task Mid-Level Vision
Datasets from 3D Scans [103.92680099373567]
本稿では,実世界の包括的3Dスキャンからマルチタスク視覚データセットをパラメトリックサンプリングし,レンダリングするパイプラインを提案する。
サンプリングパラメータを変更することで、生成されたデータセットを“ステア”して、特定の情報を強調することが可能になる。
生成されたスタータデータセットでトレーニングされた共通アーキテクチャは、複数の共通ビジョンタスクとベンチマークで最先端のパフォーマンスに達した。
論文 参考訳(メタデータ) (2021-10-11T04:21:46Z) - Federated Multi-Target Domain Adaptation [99.93375364579484]
フェデレートされた学習手法により、プライバシを保護しながら、分散ユーザデータ上で機械学習モデルをトレーニングすることが可能になります。
分散クライアントデータがラベル付けされず、集中型ラベル付きデータセットがサーバ上で利用可能となる、より実用的なシナリオを考えます。
本稿では,新しい課題に対処する効果的なDualAdapt法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:53:05Z) - FEDZIP: A Compression Framework for Communication-Efficient Federated
Learning [2.334824705384299]
Federated Learningは、無線デバイスのための分散機械学習の実装である。
各クライアントに独立して学習プロセスを割り当てる。
本稿では,クライアントとサーバ間のディープラーニングモデルから重みを転送しながら,更新サイズを大幅に削減する新しいフレームワークであるFedZipを提案する。
論文 参考訳(メタデータ) (2021-02-02T16:33:44Z) - PyODDS: An End-to-end Outlier Detection System with Automated Machine
Learning [55.32009000204512]
PyODDSは、データベースサポート付きアウトレイラ検出のための、エンドツーエンドのPythonシステムである。
具体的には,探索空間を外乱検出パイプラインで定義し,与えられた探索空間内で探索戦略を作成する。
また、データサイエンスや機械学習のバックグラウンドの有無に関わらず、統一されたインターフェイスと視覚化を提供する。
論文 参考訳(メタデータ) (2020-03-12T03:30:30Z) - Neural Data Server: A Large-Scale Search Engine for Transfer Learning
Data [78.74367441804183]
我々は,ターゲットドメインに最も有用な転送学習データを見つけるための大規模検索エンジンであるNeural Data Server (NDS)を紹介した。
NDSは、いくつかの人気のある画像データセットをインデックスするデータサーバで構成され、クライアントにデータを推奨することを目的としている。
我々は,NDSが様々な伝達学習シナリオにおいて有効であることを示し,複数のターゲットデータセットに対して最先端の性能を示す。
論文 参考訳(メタデータ) (2020-01-09T01:21:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。