論文の概要: Interactive Segmentation and Visualization for Tiny Objects in
Multi-megapixel Images
- arxiv url: http://arxiv.org/abs/2204.10356v1
- Date: Thu, 21 Apr 2022 18:26:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-25 14:45:12.188035
- Title: Interactive Segmentation and Visualization for Tiny Objects in
Multi-megapixel Images
- Title(参考訳): マルチメガピクセル画像における微小物体のインタラクティブセグメンテーションと可視化
- Authors: Chengyuan Xu, Boning Dong, Noah Stier, Curtis McCully, D. Andrew
Howell, Pradeep Sen, Tobias H\"ollerer
- Abstract要約: 大規模マルチメガピクセルの高域画像における微小物体の識別・検査・編集を行う対話型画像分割・可視化フレームワークを提案する。
我々は、推論モデル、HDR画像可視化、セグメンテーションマスク検査、編集を単一のグラフィカルユーザインタフェースに統合するインタラクティブツールキットを開発した。
我々のインターフェースは、マウス制御、同期、デュアルウィンドウによる画像の可視化とセグメンテーションマスクを備えており、マルチメガピクセル画像中の小さな物体を探索するための重要な特徴である。
- 参考スコア(独自算出の注目度): 5.09193568605539
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce an interactive image segmentation and visualization framework
for identifying, inspecting, and editing tiny objects (just a few pixels wide)
in large multi-megapixel high-dynamic-range (HDR) images. Detecting cosmic rays
(CRs) in astronomical observations is a cumbersome workflow that requires
multiple tools, so we developed an interactive toolkit that unifies model
inference, HDR image visualization, segmentation mask inspection and editing
into a single graphical user interface. The feature set, initially designed for
astronomical data, makes this work a useful research-supporting tool for
human-in-the-loop tiny-object segmentation in scientific areas like
biomedicine, materials science, remote sensing, etc., as well as computer
vision. Our interface features mouse-controlled, synchronized, dual-window
visualization of the image and the segmentation mask, a critical feature for
locating tiny objects in multi-megapixel images. The browser-based tool can be
readily hosted on the web to provide multi-user access and GPU acceleration for
any device. The toolkit can also be used as a high-precision annotation tool,
or adapted as the frontend for an interactive machine learning framework. Our
open-source dataset, CR detection model, and visualization toolkit are
available at https://github.com/cy-xu/cosmic-conn.
- Abstract(参考訳): 大規模なマルチメガピクセルハイダイナミックレンジ(HDR)画像において,小さなオブジェクト(わずか数ピクセル)を識別・検査・編集するための,インタラクティブな画像分割・可視化フレームワークを提案する。
天文学的観測で宇宙線(crs)を検出することは、複数のツールを必要とする面倒なワークフローであり、モデル推論、hdr画像可視化、セグメンテーションマスク検査、編集を単一のグラフィカルユーザインタフェースに統合するインタラクティブなツールキットを開発した。
この機能は、当初天文学的なデータのために設計されたもので、バイオメディシン、材料科学、リモートセンシングなど科学分野の人間とループの小さな物体のセグメンテーションやコンピュータビジョンのための有用な研究支援ツールとなっている。
マルチメガピクセル画像中の小さな物体を識別するための重要な機能であるセグメンテーションマスクと、画像のマウス制御、同期、デュアルウィンドウ可視化を特徴とする。
ブラウザベースのツールはWeb上で簡単にホストでき、任意のデバイスに対してマルチユーザアクセスとGPUアクセラレーションを提供する。
このツールキットは、高精度のアノテーションツールとしても、インタラクティブな機械学習フレームワークのフロントエンドとしても利用できる。
当社のオープンソースデータセット、cr検出モデル、可視化ツールキットは、https://github.com/cy-xu/cosmic-connで利用可能です。
関連論文リスト
- Grad-CAMO: Learning Interpretable Single-Cell Morphological Profiles from 3D Cell Painting Images [0.0]
教師付き特徴抽出器のための新しい単一セル解釈可能性スコアであるGrad-CAMOを紹介する。
Grad-CAMOは、関心の細胞と背景の細胞に集中しているモデルの注意率を測定する。
論文 参考訳(メタデータ) (2024-03-26T11:48:37Z) - TIAViz: A Browser-based Visualization Tool for Computational Pathology
Models [0.6519788717471032]
TIAToolboxに組み込まれたPythonベースの視覚化ツールであるTIAVizを紹介する。
フレキシブルでインタラクティブで、完全にズーム可能な、幅広い情報をスライド画像全体にオーバーレイすることができる。
論文 参考訳(メタデータ) (2024-02-15T14:54:46Z) - SeeBel: Seeing is Believing [0.9790236766474201]
本稿では,全画像のセグメンテーションにおけるデータセット統計とAI性能を比較するための3つの可視化手法を提案する。
我々のプロジェクトは、画像の注意重みを可視化することで、セグメンテーションのための訓練されたAIモデルの解釈可能性をさらに高めようとしている。
我々は,コンピュータビジョンとAI領域における可視化ツールの有効性を検討するために,実際のユーザを対象に調査を行うことを提案する。
論文 参考訳(メタデータ) (2023-12-18T05:11:00Z) - Improving Human-Object Interaction Detection via Virtual Image Learning [68.56682347374422]
人間-物体相互作用(Human-Object Interaction、HOI)は、人間と物体の相互作用を理解することを目的としている。
本稿では,仮想画像学習(Virtual Image Leaning, VIL)による不均衡分布の影響を軽減することを提案する。
ラベルからイメージへの新たなアプローチであるMultiple Steps Image Creation (MUSIC)が提案され、実際の画像と一貫した分布を持つ高品質なデータセットを作成する。
論文 参考訳(メタデータ) (2023-08-04T10:28:48Z) - Detector Guidance for Multi-Object Text-to-Image Generation [61.70018793720616]
Detector Guidance(DG)は、潜在オブジェクト検出モデルを統合して、生成プロセス中に異なるオブジェクトを分離する。
人間の評価は、DGが対立する概念の融合を防ぐのに8-22%の利点をもたらすことを示した。
論文 参考訳(メタデータ) (2023-06-04T02:33:12Z) - Interactive Visual Feature Search [8.255656003475268]
視覚特徴探索(Visual Feature Search)は,任意のCNNに適応可能な,インタラクティブな可視化技術である。
このツールを使うと、ユーザーは画像領域をハイライトし、最もよく似たモデル機能を持つデータセットから画像を検索できる。
我々は,医療画像や野生生物の分類など,様々な応用実験を行うことで,モデル行動の異なる側面を解明する方法を実証する。
論文 参考訳(メタデータ) (2022-11-28T04:39:03Z) - A Simple Baseline for Multi-Camera 3D Object Detection [94.63944826540491]
周囲のカメラで3Dオブジェクトを検出することは、自動運転にとって有望な方向だ。
マルチカメラオブジェクト検出のための簡易ベースラインであるSimMODを提案する。
我々は, nuScenes の3次元オブジェクト検出ベンチマークにおいて, SimMOD の有効性を示す広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-08-22T03:38:01Z) - Vision Transformer with Convolutions Architecture Search [72.70461709267497]
本稿では,畳み込み型アーキテクチャサーチ(VTCAS)を用いたアーキテクチャ探索手法を提案する。
VTCASによって探索された高性能バックボーンネットワークは、畳み込みニューラルネットワークの望ましい特徴をトランスフォーマーアーキテクチャに導入する。
これは、特に低照度屋内シーンにおいて、物体認識のためのニューラルネットワークの堅牢性を高める。
論文 参考訳(メタデータ) (2022-03-20T02:59:51Z) - Multi-modal Transformers Excel at Class-agnostic Object Detection [105.10403103027306]
既存の手法では、人間の理解可能な意味論によって支配されるトップダウンの監視信号が欠落していると論じる。
マルチスケール特徴処理と変形可能な自己アテンションを用いた効率よく柔軟なMViTアーキテクチャを開発した。
多様なアプリケーションにおけるMViT提案の重要性を示す。
論文 参考訳(メタデータ) (2021-11-22T18:59:29Z) - Embedding-based Instance Segmentation of Microscopy Images [8.516639438995785]
Nevenらの作品をもとに、エンドツーエンドのトレーニング可能なディープラーニングメソッドである EmbedSeg を紹介します。
彼らのアプローチでは、それぞれのピクセルを任意のインスタンスのcentroidに埋め込むが、embedsegでは、生体オブジェクトの複雑な形状に動機づけられている。
組込み型インスタンスセグメンテーションは,様々な顕微鏡データセットの最先端手法と比較して,競合的な結果が得られることを示す。
論文 参考訳(メタデータ) (2021-01-25T12:06:44Z) - Learning RGB-D Feature Embeddings for Unseen Object Instance
Segmentation [67.88276573341734]
合成データからRGB-D特徴埋め込みを学習し,オブジェクトのインスタンスセグメンテーションを未確認する手法を提案する。
距離学習損失関数を用いて画素単位の機能埋め込みを学習する。
新たな2段階クラスタリングアルゴリズムにより,セグメンテーションの精度をさらに向上する。
論文 参考訳(メタデータ) (2020-07-30T00:23:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。