論文の概要: BioVL-QR: Egocentric Biochemical Video-and-Language Dataset Using Micro QR Codes
- arxiv url: http://arxiv.org/abs/2404.03161v1
- Date: Thu, 4 Apr 2024 02:22:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-05 16:03:13.231228
- Title: BioVL-QR: Egocentric Biochemical Video-and-Language Dataset Using Micro QR Codes
- Title(参考訳): BioVL-QR:マイクロQRコードを用いたEgocentric Biochemical Video-and-Language Dataset
- Authors: Taichi Nishimura, Koki Yamamoto, Yuto Haneji, Keiya Kajimura, Chihiro Nishiwaki, Eriko Daikoku, Natsuko Okuda, Fumihito Ono, Hirotaka Kameko, Shinsuke Mori,
- Abstract要約: 本稿では,バイオケミカル・ビジョン・アンド・ランゲージ・データセットを提案する。
24のエゴセントリックな実験ビデオ、対応するプロトコル、そしてビデオと言語によるアライメントで構成されている。
- 参考スコア(独自算出の注目度): 2.9512318511021665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces a biochemical vision-and-language dataset, which consists of 24 egocentric experiment videos, corresponding protocols, and video-and-language alignments. The key challenge in the wet-lab domain is detecting equipment, reagents, and containers is difficult because the lab environment is scattered by filling objects on the table and some objects are indistinguishable. Therefore, previous studies assume that objects are manually annotated and given for downstream tasks, but this is costly and time-consuming. To address this issue, this study focuses on Micro QR Codes to detect objects automatically. From our preliminary study, we found that detecting objects only using Micro QR Codes is still difficult because the researchers manipulate objects, causing blur and occlusion frequently. To address this, we also propose a novel object labeling method by combining a Micro QR Code detector and an off-the-shelf hand object detector. As one of the applications of our dataset, we conduct the task of generating protocols from experiment videos and find that our approach can generate accurate protocols.
- Abstract(参考訳): 本稿では,24のエゴセントリックな実験ビデオ,対応するプロトコル,およびビデオ・アンド・ランゲージアライメントからなるバイオケミカルビジョン・アンド・ランゲージデータセットを提案する。
ウェットラブ領域の鍵となる課題は、装置、試薬、容器を検知することである。
そのため、従来の研究では、オブジェクトは手動でアノテートされ、下流のタスクに与えられると仮定していたが、これはコストと時間を要する。
そこで本研究では,オブジェクトを自動的に検出するマイクロQRコードに焦点を当てた。
予備研究では、マイクロQRコードのみを用いて物体を検出することは、研究者が物体を操作し、ぼやけや閉塞を頻繁に起こすため、依然として難しいことが判明した。
そこで本研究では,マイクロQRコード検出器とオフザシェルフハンドオブジェクト検出器を組み合わせた新しいオブジェクトラベリング手法を提案する。
データセットの応用の一つとして、実験ビデオからプロトコルを生成するタスクを実行し、我々のアプローチが正確なプロトコルを生成することができることを確かめる。
関連論文リスト
- MarvelOVD: Marrying Object Recognition and Vision-Language Models for Robust Open-Vocabulary Object Detection [107.15164718585666]
開語彙検出コンテキスト下でのVLMの偏り予測の根本原因について検討した。
私たちの観察は、非常に優れたトレーニングターゲットを生成する、単純で効果的なパラダイム、コード化されたMarvelOVDにつながります。
我々の手法は、他の最先端技術よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2024-07-31T09:23:57Z) - Predicting fluorescent labels in label-free microscopy images with pix2pix and adaptive loss in Light My Cells challenge [12.373115873950296]
そこで本研究では,Light My Cells チャレンジのためのディープラーニングに基づくサイリコラベリング手法を提案する。
本手法は, シリカラベリングにおける有望な性能を実現する。
論文 参考訳(メタデータ) (2024-06-22T03:10:23Z) - Code Generation Based Grading: Evaluating an Auto-grading Mechanism for
"Explain-in-Plain-English" Questions [0.0]
コード生成ベースグラディング(CGBG)は、人間の学年と適度に合意する。
CGBGは、コードの低レベルおよびライン・バイ・ライン記述に関して、人間のグレードラーと適度に合意する。
論文 参考訳(メタデータ) (2023-11-25T02:45:00Z) - Unified Mask Embedding and Correspondence Learning for Self-Supervised
Video Segmentation [76.40565872257709]
我々は、局所的な識別的特徴学習のためのフレーム間密度対応を同時にモデル化する統合フレームワークを開発する。
ラベルなしビデオから直接マスク誘導シーケンシャルセグメンテーションを実行することができる。
我々のアルゴリズムは、2つの標準ベンチマーク(DAVIS17とYouTube-VOS)に最先端をセットする。
論文 参考訳(メタデータ) (2023-03-17T16:23:36Z) - Seamless Iterative Semi-Supervised Correction of Imperfect Labels in
Microscopy Images [57.42492501915773]
生体内試験は、医療機器の毒性に対する動物実験の代替手段である。
人間の疲労は、深層学習を魅力的なものにするために、エラー作成に重要な役割を果たします。
我々は、不完全ラベルのシームレス反復半監督補正(SISSI)を提案する。
本手法は,物体検出に適応的な早期学習補正技術を提供する。
論文 参考訳(メタデータ) (2022-08-05T18:52:20Z) - Unsupervised multi-latent space reinforcement learning framework for
video summarization in ultrasound imaging [0.0]
新型コロナウイルス(COVID-19)のパンデミックは、超音波スキャンのトリアージを高速化するツールの必要性を強調している。
提案手法は,この方向への一歩である。
そこで我々は,新しい報酬を伴う教師なし強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-03T04:50:35Z) - TransICD: Transformer Based Code-wise Attention Model for Explainable
ICD Coding [5.273190477622007]
国際疾患分類法 (ICD) は, 医療分野の請求システムにおいて有効かつ重要であることが示されている。
現在、ICDコードは手動で臨床メモに割り当てられており、多くのエラーを引き起こす可能性がある。
本稿では,文書のトークン間の相互依存を捉えるためにトランスフォーマーベースのアーキテクチャを適用し,コードワイド・アテンション・メカニズムを用いて文書全体のコード固有表現を学習する。
論文 参考訳(メタデータ) (2021-03-28T05:34:32Z) - Comparisons among different stochastic selection of activation layers
for convolutional neural networks for healthcare [77.99636165307996]
ニューラルネットワークのアンサンブルを用いて生体医用画像の分類を行う。
ReLU, leaky ReLU, Parametric ReLU, ELU, Adaptive Piecewice Linear Unit, S-Shaped ReLU, Swish, Mish, Mexican Linear Unit, Parametric Deformable Linear Unit, Soft Root Sign。
論文 参考訳(メタデータ) (2020-11-24T01:53:39Z) - MicroAnalyzer: A Python Tool for Automated Bacterial Analysis with
Fluorescence Microscopy [0.0]
MicroAnalyzerは、顕微鏡画像解析のためのエンドツーエンドのプラットフォームである。
最先端のディープラーニングセグメンテーションモデルに基づいて、正確なセルと蛍光クラスターセグメンテーションを提供する。
初期のディープラーニングモデルトレーニングを除いて、研究者からそれ以上の入力は不要である。
論文 参考訳(メタデータ) (2020-09-26T20:45:19Z) - LabelEnc: A New Intermediate Supervision Method for Object Detection [78.74368141062797]
本稿では,オブジェクト検出システムのトレーニングを促進するため,LabelEncという新たな中間監視手法を提案する。
鍵となるアイデアは、新しいラベル符号化機能を導入し、接地木ラベルを潜伏埋め込みにマッピングすることである。
実験の結果,COCOデータセット上での検出精度は,約2%向上した。
論文 参考訳(メタデータ) (2020-07-07T08:55:05Z) - Learning Camera Miscalibration Detection [83.38916296044394]
本稿では,視覚センサ,特にRGBカメラの誤校正検出を学習するためのデータ駆動型アプローチに焦点を当てた。
コントリビューションには、RGBカメラの誤校正基準と、この基準に基づく新しい半合成データセット生成パイプラインが含まれる。
深層畳み込みニューラルネットワークをトレーニングすることにより、カメラ固有のパラメータの再校正が必要か否かを判断するパイプラインの有効性を実証する。
論文 参考訳(メタデータ) (2020-05-24T10:32:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。