論文の概要: Multi-task Video Enhancement for Dental Interventions
- arxiv url: http://arxiv.org/abs/2210.16236v1
- Date: Tue, 25 Oct 2022 13:17:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 14:47:24.356780
- Title: Multi-task Video Enhancement for Dental Interventions
- Title(参考訳): 歯科介入のためのマルチタスクビデオ強調
- Authors: Efklidis Katsaros, Piotr K. Ostrowski, Krzysztof W{\l}\'odarczak,
Emilia Lewandowska, Jacek Ruminski, Damian Siupka-Mr\'oz, {\L}ukasz Lassmann,
Anna Jezierska, and Daniel W\k{e}sierski
- Abstract要約: ビデオによる歯科治療は、低照度、ノイズ、ぼかし、カメラハンドシェイクを緩和し、視覚的快適性を低下させる。
歯科シーンのマクロ視覚化を可能にするマルチタスクビデオエンハンスメントのための新しいディープネットワークを提案する。
- 参考スコア(独自算出の注目度): 1.57292030677369
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A microcamera firmly attached to a dental handpiece allows dentists to
continuously monitor the progress of conservative dental procedures. Video
enhancement in video-assisted dental interventions alleviates low-light, noise,
blur, and camera handshakes that collectively degrade visual comfort. To this
end, we introduce a novel deep network for multi-task video enhancement that
enables macro-visualization of dental scenes. In particular, the proposed
network jointly leverages video restoration and temporal alignment in a
multi-scale manner for effective video enhancement. Our experiments on videos
of natural teeth in phantom scenes demonstrate that the proposed network
achieves state-of-the-art results in multiple tasks with near real-time
processing. We release Vident-lab at https://doi.org/10.34808/1jby-ay90, the
first dataset of dental videos with multi-task labels to facilitate further
research in relevant video processing applications.
- Abstract(参考訳): 歯科用ハンドピースにしっかりと取り付けられたマイクロカメラにより、歯科医は保守的な歯科処置の進捗を継続的に監視することができる。
ビデオによる歯科治療の強化は、低照度、ノイズ、ぼかし、カメラハンドシェイクを軽減し、視覚的快適性を低下させる。
この目的のために, マルチタスク映像強調のための新しいディープネットワークを導入し, 歯科シーンのマクロ視覚化を実現する。
特に,提案するネットワークは,映像復元と時間的アライメントを複数スケールで併用して効果的映像強調を行う。
ファントムシーンにおける自然歯の映像実験により,提案するネットワークは実時間に近い処理を行う複数のタスクにおいて最先端の結果が得られることを示した。
vident-labをhttps://doi.org/10.34808/1jby-ay90でリリースします。これはマルチタスクラベルによるデンタルビデオの最初のデータセットで、関連するビデオ処理アプリケーションのさらなる研究を支援します。
関連論文リスト
- IDOL: Unified Dual-Modal Latent Diffusion for Human-Centric Joint Video-Depth Generation [136.5813547244979]
高品質な人中心型ビデオ深度生成のためのIDOL(unIfied Dual-mOdal Latent diffusion)を提案する。
我々のIDOLは2つの新しい設計で構成されている。第一に、デュアルモーダル生成を可能にし、ビデオと深度生成の間の情報交換を最大化する。
次に,映像と深度特徴運動場との整合性を実現する動きの整合性損失を提案する。
論文 参考訳(メタデータ) (2024-07-15T17:36:54Z) - JOSENet: A Joint Stream Embedding Network for Violence Detection in Surveillance Videos [4.94659999696881]
監視ビデオにおける暴力検出は、様々な実戦シーンのような追加の問題を提示する。
本稿では、監視ビデオにおける暴力検出に優れたパフォーマンスを提供する自己監視フレームワークJOSENetを紹介する。
論文 参考訳(メタデータ) (2024-05-05T15:01:00Z) - Vivim: a Video Vision Mamba for Medical Video Segmentation [52.11785024350253]
本稿では、医用ビデオセグメンテーションタスクのためのビデオビジョンマンバベースのフレームワークVivimを提案する。
我々のビビムは、長期表現を様々なスケールのシーケンスに効果的に圧縮することができる。
超音波検査では甲状腺分節,乳房病変分節,大腸内視鏡検査ではポリープ分節が有効で有効であった。
論文 参考訳(メタデータ) (2024-01-25T13:27:03Z) - Multi-Modal Video Topic Segmentation with Dual-Contrastive Domain
Adaptation [74.51546366251753]
ビデオトピックセグメンテーションは、ビデオの基礎となる粗い粒度のセマンティック構造を明らかにする。
ビデオの書き起こしとフレームの両方を利用するマルチモーダルなビデオトピックセグメンタを提案する。
提案手法は, 精度と転送性の両方の観点から, ベースライン法をはるかに上回っている。
論文 参考訳(メタデータ) (2023-11-30T21:59:05Z) - Multiclass Segmentation using Teeth Attention Modules for Dental X-ray
Images [8.041659727964305]
本研究では,スイニングトランスフォーマーとTABを用いたM-Net様構造を取り入れた新しい歯のセグメンテーションモデルを提案する。
提案したTABは、歯の複雑な構造に特化するユニークな注意機構を利用する。
提案アーキテクチャは,各歯とその周辺構造を正確に定義し,局所的およびグローバルな文脈情報を効果的に取得する。
論文 参考訳(メタデータ) (2023-11-07T06:20:34Z) - Learning Multi-modal Representations by Watching Hundreds of Surgical Video Lectures [51.78027546947034]
外科的コンピュータビジョンの最近の進歩は、言語意味論に欠ける視覚のみのモデルによって推進されている。
本稿では,eラーニングプラットフォームからの手術ビデオ講義を活用し,効果的な視覚情報と言語監督信号を提供する。
テキスト書き起こしのための複数自動音声認識システムを用いて,手術固有の言語課題に対処する。
論文 参考訳(メタデータ) (2023-07-27T22:38:12Z) - Video-Mined Task Graphs for Keystep Recognition in Instructional Videos [71.16703750980143]
手続き的活動理解には、より広いタスクの観点から人間の行動を知覚する必要がある。
本稿では,ハウツービデオからタスクグラフを自動的に発見して,人々がキーステップを実行する傾向を確率論的に表現することを提案する。
より信頼性の高いゼロショットキーステップのローカライゼーションとビデオ表現学習の改善。
論文 参考訳(メタデータ) (2023-07-17T18:19:36Z) - Generative Adversarial Networks for Dental Patient Identity Protection
in Orthodontic Educational Imaging [0.0]
本研究は, 歯科患者イメージを効果的に識別するためのGANインバージョン技術を提案する。
この手法は, 重要な歯科的特徴を保ちながら, プライバシの懸念に対処し, 歯科教育や研究に有用な資源を創出する。
論文 参考訳(メタデータ) (2023-07-05T04:14:57Z) - Enhanced Masked Image Modeling for Analysis of Dental Panoramic
Radiographs [8.397847537464534]
本研究では,マスク型画像モデリング(SimMIM)変換器上での自己拡張型自己教師学習を提案する。
マスクされたパッチの予測損失に加えて、SD-SimMIMは可視パッチの自己蒸留損失を計算する。
SD-SimMIMを歯科用パノラマX線に応用し, 歯の修復, 矯正器具の検出, 症例分割作業を行った。
論文 参考訳(メタデータ) (2023-06-18T19:20:38Z) - Weakly-supervised High-fidelity Ultrasound Video Synthesis with Feature
Decoupling [13.161739586288704]
臨床実践において、分析と診断は、動的解剖情報を得るために単一の画像ではなくアメリカのシーケンスに依存することが多い。
患者からの適切なビデオで練習することは、臨床的には実践的ではないため、初心者には学ぶことが難しい。
我々は,高忠実度US動画を合成するための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2022-07-01T14:53:22Z) - Video Exploration via Video-Specific Autoencoders [60.256055890647595]
ヒト制御可能なビデオ探索を可能にするビデオ固有オートエンコーダを提案する。
特定のビデオの複数のフレームで訓練された単純なオートエンコーダは、さまざまなビデオ処理および編集タスクを実行できることを観察します。
論文 参考訳(メタデータ) (2021-03-31T17:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。