論文の概要: A Real-Time Region Tracking Algorithm Tailored to Endoscopic Video with
Open-Source Implementation
- arxiv url: http://arxiv.org/abs/2203.08858v1
- Date: Wed, 16 Mar 2022 18:27:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-18 15:16:23.070142
- Title: A Real-Time Region Tracking Algorithm Tailored to Endoscopic Video with
Open-Source Implementation
- Title(参考訳): オープンソース実装による内視鏡映像のリアルタイム領域追跡アルゴリズム
- Authors: Jonathan P. Epperlein, Sergiy Zhuk
- Abstract要約: 我々は、研究者が自身のコードを書くことを好まないよう、簡単に使えるインターフェイスと、使用可能なPythonモジュールを提供しています。
本稿では,使い易い映像パフォーマンスアルゴリズムを提案するアルゴリズムの実装について述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With a video data source, such as multispectral video acquired during
administration of fluorescent tracers, extraction of time-resolved data
typically requires the compensation of motion. While this can be done manually,
which is arduous, or using off-the-shelf object tracking software, which often
yields unsatisfactory performance, we present an algorithm which is simple and
performant. Most importantly, we provide an open-source implementation, with an
easy-to-use interface for researchers not inclined to write their own code, as
well as Python modules that can be used programmatically.
- Abstract(参考訳): 蛍光トレーサの投与中に取得したマルチスペクトルビデオのようなビデオデータソースでは、時間分解されたデータの抽出は通常、動きの補償を必要とする。
これは手作業で行えますが、これは大変な作業ですし、あるいは既製のオブジェクトトラッキングソフトウェアを使っており、しばしば不十分なパフォーマンスをもたらしますが、単純でパフォーマンスのよいアルゴリズムを示します。
最も重要なことは、研究者が独自のコードを書く傾向のない使いやすいインターフェースを備えたオープンソース実装と、プログラムで使用できるPythonモジュールを提供しています。
関連論文リスト
- arcjetCV: an open-source software to analyze material ablation [44.99833362998488]
arcjetCVはオープンソースのPythonソフトウェアで、アークジェットテスト映像から熱シールド材質の凹みと凹み率の時間分解測定を自動化するように設計されている。
ArcjetCVは1次元(1D)畳み込みニューラルネットワーク(CNN)を含む機械学習モデルを使用してビデオセグメンテーションプロセスを自動化する
グラフィカルユーザインタフェース(GUI)はユーザエクスペリエンスを単純化し、アプリケーションプログラミングインターフェース(API)はユーザーがスクリプトからコア関数を呼び出すことを可能にする。
論文 参考訳(メタデータ) (2024-04-17T15:47:26Z) - Dense Optical Tracking: Connecting the Dots [82.79642869586587]
DOTは、ビデオにおけるポイントトラッキングの問題を解決するための、新しくてシンプルで効率的な方法である。
OmniMotionのような高度な"ユニバーサルトラッカー"を上回り、CoTrackerのような最良のポイントトラッキングアルゴリズムと同等か、あるいはそれ以上の精度で、DOTが現在の光フロー技術よりもはるかに正確であることを示す。
論文 参考訳(メタデータ) (2023-12-01T18:59:59Z) - High Speed Human Action Recognition using a Photonic Reservoir Computer [1.7403133838762443]
我々は,「関心の時間」に基づく貯水池コンピュータの新しい訓練方法を提案する。
我々は,複数のビデオストリームをリアルタイムに処理できる点において,高い精度と速度でタスクを解く。
論文 参考訳(メタデータ) (2023-05-24T16:04:42Z) - Speeding Up Action Recognition Using Dynamic Accumulation of Residuals
in Compressed Domain [2.062593640149623]
ビデオ処理アルゴリズムに関して、時間的冗長性と生ビデオの重大性は、最も一般的な2つの問題である。
本稿では,光部分復号処理によって得られる圧縮ビデオで直接利用できる残差データの利用法を提案する。
圧縮された領域に蓄積された残留物にのみニューラルネットワークを適用することで、性能が向上する一方、分類結果は生のビデオアプローチと非常に競合する。
論文 参考訳(メタデータ) (2022-09-29T13:08:49Z) - TEACHTEXT: CrossModal Generalized Distillation for Text-Video Retrieval [103.85002875155551]
本研究では,大規模言語前訓練を利用した一般化蒸留法TeachTextを提案する。
提案手法をビデオ側モダリティに拡張し,テスト時に使用するモダリティの数を効果的に削減できることを示す。
提案手法は,いくつかのビデオ検索ベンチマークの精度を著しく向上させ,テスト時の計算オーバーヘッドを増加させない。
論文 参考訳(メタデータ) (2021-04-16T17:55:28Z) - Video Exploration via Video-Specific Autoencoders [60.256055890647595]
ヒト制御可能なビデオ探索を可能にするビデオ固有オートエンコーダを提案する。
特定のビデオの複数のフレームで訓練された単純なオートエンコーダは、さまざまなビデオ処理および編集タスクを実行できることを観察します。
論文 参考訳(メタデータ) (2021-03-31T17:56:13Z) - Learning Spatio-Temporal Transformer for Visual Tracking [108.11680070733598]
本稿では,エンコーダ・デコーダ変換器をキーコンポーネントとする新しいトラッキングアーキテクチャを提案する。
メソッド全体がエンドツーエンドであり、コサインウィンドウやバウンディングボックススムーシングのような後処理ステップは不要である。
提案されたトラッカーは、Siam R-CNNよりも6倍速いリアルタイム速度を実行しながら、5つのチャレンジングな短期および長期ベンチマークで最先端のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-03-31T15:19:19Z) - Unsupervised Deep Video Denoising [26.864842892466136]
ディープ畳み込みニューラルネットワーク(CNN)は現在、ビデオの復調において最先端のパフォーマンスを実現している。
我々は、教師なし静止画像の最近の進歩を基盤として、教師なし深層映像デノイザ(UDVD)の開発を行っている。
UDVDは、現在の最先端の教師付き手法とベンチマークデータセットで競合して動作する。
論文 参考訳(メタデータ) (2020-11-30T17:45:08Z) - Blind Video Temporal Consistency via Deep Video Prior [61.062900556483164]
視覚的ビデオの時間的整合性に対する新規で一般的なアプローチを提案する。
本手法は,一対のオリジナルビデオとプロセッシングビデオを直接トレーニングするのみである。
本稿では,Deep Video Priorを用いてビデオ上の畳み込みネットワークをトレーニングすることにより,時間的一貫性を実現することができることを示す。
論文 参考訳(メタデータ) (2020-10-22T16:19:20Z) - Multiple Instance-Based Video Anomaly Detection using Deep Temporal
Encoding-Decoding [5.255783459833821]
本稿では,監視ビデオにおける異常検出のための時間的深部符号化復号化手法を提案する。
提案手法はトレーニング期間中に異常ビデオクリップと正常ビデオクリップの両方を使用する。
提案手法は,ビデオ監視アプリケーションにおける異常検出の最先端ソリューションと同等かそれ以上に動作することを示す。
論文 参考訳(メタデータ) (2020-07-03T08:22:42Z) - LRTD: Long-Range Temporal Dependency based Active Learning for Surgical
Workflow Recognition [67.86810761677403]
本稿では,費用対効果の高い手術ビデオ解析のための新しい能動的学習法を提案する。
具体的には,非局所的再帰的畳み込みネットワーク (NL-RCNet) を提案する。
手術ワークフロー認識タスクを実行することで,大規模な手術ビデオデータセット(Cholec80)に対するアプローチを検証する。
論文 参考訳(メタデータ) (2020-04-21T09:21:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。