論文の概要: Lirot.ai: A Novel Platform for Crowd-Sourcing Retinal Image
Segmentations
- arxiv url: http://arxiv.org/abs/2208.10100v1
- Date: Mon, 22 Aug 2022 07:19:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 13:37:22.376366
- Title: Lirot.ai: A Novel Platform for Crowd-Sourcing Retinal Image
Segmentations
- Title(参考訳): Lirot.ai: クラウドソーシング型網膜画像セグメンテーションのための新しいプラットフォーム
- Authors: Jonathan Fhima, Jan Van Eijgen, Moti Freiman, Ingeborg Stalmans and
Joachim A. Behar
- Abstract要約: 画像セグメンテーションの促進とクラウドソーシングのための新しいプラットフォームであるLirot.aiを紹介した。
Lirot.aiはiPadOSクライアントアプリケーションLirot.ai-app、バックエンドサーバLirot.ai-server、python APIネームLirot.ai-APIの3つのコンポーネントで構成されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Introduction: For supervised deep learning (DL) tasks, researchers need a
large annotated dataset. In medical data science, one of the major limitations
to develop DL models is the lack of annotated examples in large quantity. This
is most often due to the time and expertise required to annotate. We introduce
Lirot.ai, a novel platform for facilitating and crowd-sourcing image
segmentations. Methods: Lirot.ai is composed of three components; an iPadOS
client application named Lirot.ai-app, a backend server named Lirot.ai-server
and a python API name Lirot.ai-API. Lirot.ai-app was developed in Swift 5.6 and
Lirot.ai-server is a firebase backend. Lirot.ai-API allows the management of
the database. Lirot.ai-app can be installed on as many iPadOS devices as needed
so that annotators may be able to perform their segmentation simultaneously and
remotely. We incorporate Apple Pencil compatibility, making the segmentation
faster, more accurate, and more intuitive for the expert than any other
computer-based alternative. Results: We demonstrate the usage of Lirot.ai for
the creation of a retinal fundus dataset with reference vasculature
segmentations. Discussion and future work: We will use active learning
strategies to continue enlarging our retinal fundus dataset by including a more
efficient process to select the images to be annotated and distribute them to
annotators.
- Abstract(参考訳): 導入: 教師付きディープラーニング(DL)タスクには、大きな注釈付きデータセットが必要である。
医学データサイエンスにおいて、dlモデルを開発するための大きな制限の1つは、大量の注釈付き例がないことである。
これは、アノテートに必要な時間と専門知識によることが多い。
画像セグメンテーションの促進とクラウドソーシングのための新しいプラットフォームであるLirot.aiを紹介する。
メソッド: Lirot.aiは、Lirot.ai-appという名前のiPadOSクライアントアプリケーション、Lirot.ai-serverという名前のバックエンドサーバ、python APIネームのLirot.ai-APIの3つのコンポーネントで構成されている。
Lirot.ai-appはSwift 5.6で開発され、Lirot.ai-serverはファイアベースバックエンドである。
Lirot.ai-APIはデータベースの管理を可能にする。
Lirot.ai-appは必要なだけ多くのiPadOSデバイスにインストールでき、アノテータは同時にリモートでセグメンテーションを行うことができる。
私たちはapple pencilの互換性を取り入れ、セグメンテーションを他のコンピュータベースの代替品よりも高速で、より正確で、専門家にとって直感的なものにしています。
結果: 基準血管セグメンテーションを用いた網膜底部データセットの作成にLirot.aiを応用した。
議論と今後の作業:我々は、アノテートされる画像を選択し、アノテータに配布するより効率的なプロセスを含むことによって、網膜底部データセットの拡大を継続するために、アクティブラーニング戦略を使用する。
関連論文リスト
- OS-ATLAS: A Foundation Action Model for Generalist GUI Agents [55.37173845836839]
OS-AtlasはGUIグラウンディングとOODエージェントタスクに優れた基礎的なGUIアクションモデルである。
現在までに1300万以上のGUI要素を含む、オープンソースのクロスプラットフォームGUI基盤コーパスをリリースしています。
論文 参考訳(メタデータ) (2024-10-30T17:10:19Z) - TinyAgent: Function Calling at the Edge [32.174966522801746]
本稿では,エッジ上でエージェントシステムを駆動するための関数呼び出しが可能なタスク固有小言語モデルエージェントの訓練とデプロイのためのエンドツーエンドフレームワークを提案する。
駆動アプリケーションとして、テキストや音声入力によるユーザコマンドの実行が可能な、AppleのMacBook用のローカルSiriライクなシステムをデモする。
論文 参考訳(メタデータ) (2024-09-01T04:23:48Z) - AMEX: Android Multi-annotation Expo Dataset for Mobile GUI Agents [50.39555842254652]
我々は,モバイルシナリオにおけるAIエージェントの研究を進めるために,Android Multi-Annotation EXpo (AMEX)を紹介した。
AMEXは110のモバイルアプリケーションから104K以上の高解像度のスクリーンショットで構成されており、複数のレベルでアノテートされている。
AMEXには、GUIインタラクティブな要素接地、GUIスクリーンと要素機能記述、複雑な自然言語命令の3段階のアノテーションが含まれている。
論文 参考訳(メタデータ) (2024-07-03T17:59:58Z) - GenQA: Generating Millions of Instructions from a Handful of Prompts [67.54980063851605]
ほとんどの公開命令微調整データセットは、業界モデルをトレーニングするために使用されるクローズドソースデータセットと比較して比較的小さい。
本研究では,1つのプロンプトから大規模命令データセットを生成する手法について検討する。
我々のデータセットは、知識集約型リーダーボードタスクと会話評価の両方で、WizardLMとUltrachatの両方に遭遇または超過します。
論文 参考訳(メタデータ) (2024-06-14T17:44:08Z) - GUI Odyssey: A Comprehensive Dataset for Cross-App GUI Navigation on Mobile Devices [61.48043339441149]
GUI Odysseyは6つのモバイルデバイスから7,735エピソードで構成され、6種類のクロスアプリタスク、201のアプリ、1.4Kのアプリコンボで構成されている。
履歴再サンプリングモジュールを用いたQwen-VLモデルの微調整により,マルチモーダルなクロスアプリナビゲーションエージェントであるOdysseyAgentを開発した。
論文 参考訳(メタデータ) (2024-06-12T17:44:26Z) - KerasCV and KerasNLP: Vision and Language Power-Ups [9.395199188271254]
KerasCVとKerasNLPはコンピュータビジョンと自然言語処理のためのKeras APIの拡張である。
これらのドメインパッケージは、使いやすさとパフォーマンスを重視した高速な実験を可能にするように設計されている。
ライブラリは完全にオープンソース(Apache 2.0ライセンス)で、GitHubから入手できる。
論文 参考訳(メタデータ) (2024-05-30T16:58:34Z) - Pairwise GUI Dataset Construction Between Android Phones and Tablets [24.208087862974033]
Paptデータセットは、Androidスマートフォンとタブレット用に調整されたペアワイズGUIデータセットである。
本稿では,このデータセット構築のための新しいGUIコレクション手法を提案する。
論文 参考訳(メタデータ) (2023-10-07T09:30:42Z) - A Pairwise Dataset for GUI Conversion and Retrieval between Android
Phones and Tablets [24.208087862974033]
Paptデータセットは、Androidスマートフォンとタブレット間のGUI変換と検索のためのペアワイズデータセットである。
データセットには5,593の電話-タブレットアプリペアから10,035の電話-タブレットGUIページペアが含まれている。
論文 参考訳(メタデータ) (2023-07-25T03:25:56Z) - Scalable Collaborative Learning via Representation Sharing [53.047460465980144]
フェデレートラーニング(FL)とスプリットラーニング(SL)は、データを(デバイス上で)プライベートにしながら協調学習を可能にする2つのフレームワークである。
FLでは、各データ保持者がモデルをローカルにトレーニングし、集約のために中央サーバにリリースする。
SLでは、クライアントは個々のカット層アクティベーション(スマッシュされたデータ)をサーバにリリースし、そのレスポンス(推論とバックの伝搬の両方)を待つ必要があります。
本研究では, クライアントがオンライン知識蒸留を通じて, 対照的な損失を生かして協調する, プライバシ保護機械学習の新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-11-20T10:49:22Z) - Spotlight: Mobile UI Understanding using Vision-Language Models with a
Focus [9.401663915424008]
本稿では,UIのスクリーンショットと画面上の関心領域のみを入力とする視覚言語モデルを提案する。
実験の結果,本モデルではいくつかのUIタスクにおいてSoTA結果が得られ,従来手法よりも優れていたことが判明した。
論文 参考訳(メタデータ) (2022-09-29T16:45:43Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。