論文の概要: Computer Vision for Supporting Image Search
- arxiv url: http://arxiv.org/abs/2111.08772v1
- Date: Tue, 16 Nov 2021 20:50:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-19 01:58:37.750456
- Title: Computer Vision for Supporting Image Search
- Title(参考訳): 画像検索を支援するコンピュータビジョン
- Authors: Alan F. Smeaton
- Abstract要約: トレーニングに利用可能な膨大なデータのメリットを活用しており、膨大なコンピュータ処理が利用可能であり、マシンラーニングの進化をデータ処理と正確な視覚ベースのシステム提供のための一連のテクニックとして見てきました。
我々はこれを、自動運転車のナビゲーションやセキュリティアプリケーション、例えばCCTVの検索、医療診断のための医療画像解析に利用しています。
ユーザによる画像検索やビデオ検索が普及しないアプリケーションのひとつとして,人間の記憶を調べたり,失敗したりすることで,そのような画像検索や再検索の必要性が指摘され,画像検索に対する別のアプローチの必要性が浮き彫りにされている。
- 参考スコア(独自算出の注目度): 2.18624447693809
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computer vision and multimedia information processing have made extreme
progress within the last decade and many tasks can be done with a level of
accuracy as if done by humans, or better. This is because we leverage the
benefits of huge amounts of data available for training, we have enormous
computer processing available and we have seen the evolution of machine
learning as a suite of techniques to process data and deliver accurate
vision-based systems. What kind of applications do we use this processing for ?
We use this in autonomous vehicle navigation or in security applications,
searching CCTV for example, and in medical image analysis for healthcare
diagnostics. One application which is not widespread is image or video search
directly by users. In this paper we present the need for such image finding or
re-finding by examining human memory and when it fails, thus motivating the
need for a different approach to image search which is outlined, along with the
requirements of computer vision to support it.
- Abstract(参考訳): コンピュータビジョンとマルチメディア情報処理は、過去10年で極端に進歩しており、多くのタスクは、まるで人間によって行われたか、それ以上の精度で行うことができる。
これは、トレーニングに利用可能な膨大なデータの利点を活用し、巨大なコンピュータ処理が利用可能であり、データ処理と正確なビジョンベースのシステムを提供するための一連のテクニックとして機械学習の進化を見てきたからです。
この処理にどのようなアプリケーションを使うのですか?
我々はこれを自動運転車のナビゲーションやセキュリティアプリケーション、例えばCCTVの検索、医療診断のための医療画像解析に利用しています。
広く普及していないアプリケーションは、ユーザーが直接画像や動画を検索することである。
本稿では,人間の記憶を検査し,それが失敗した場合の検索や画像検索の必要性について述べるとともに,それをサポートするコンピュータビジョンの要件とともに,アウトライン化される画像検索に対する異なるアプローチの必要性について述べる。
関連論文リスト
- Medical Image Retrieval Using Pretrained Embeddings [0.6827423171182154]
トレーニングや微調整の必要なく,事前訓練ネットワークを用いて医用画像検索を行うことが可能であることを示す。
プレトレーニングを施した埋込装置を用いて, 運動量, 身体領域, 臓器レベルでの様々なタスクに対する1のリコールを達成した。
論文 参考訳(メタデータ) (2023-11-22T17:42:33Z) - Tuning computer vision models with task rewards [88.45787930908102]
モデル予測と意図された使用法とのミスは、コンピュータビジョンモデルの展開に有害である。
自然言語処理では、モデルとタスク報酬を整合させる強化学習技術を用いて、この問題に対処することが多い。
我々はこのアプローチを採用し、オブジェクト検出、汎視的セグメンテーション、着色、画像キャプションなど、複数のコンピュータビジョンタスクにまたがる驚くべき効果を示す。
論文 参考訳(メタデータ) (2023-02-16T11:49:48Z) - A Trustworthy Framework for Medical Image Analysis with Deep Learning [71.48204494889505]
TRUDLMIAは医用画像解析のための信頼できるディープラーニングフレームワークである。
新型コロナウイルス(COVID-19)などの公衆衛生危機への対応に深層学習の活用を推進していくため、研究者や臨床医を支援することが期待されている。
論文 参考訳(メタデータ) (2022-12-06T05:30:22Z) - Computer Vision on X-ray Data in Industrial Production and Security
Applications: A survey [89.45221564651145]
本稿では,コンピュータビジョンと機械学習を用いた産業生産およびセキュリティアプリケーションにおけるX線分析に関する最近の研究をレビューする。
公開されているデータセット上でのアプリケーション、テクニック、評価メトリクス、データセット、それらのテクニックのパフォーマンス比較をカバーしている。
論文 参考訳(メタデータ) (2022-11-10T13:37:36Z) - Multi-Modal Masked Autoencoders for Medical Vision-and-Language
Pre-Training [62.215025958347105]
マルチモーダルマスク付きオートエンコーダを用いた自己教師型学習パラダイムを提案する。
我々は、ランダムにマスキングされた画像やテキストから欠落したピクセルやトークンを再構成することで、クロスモーダルなドメイン知識を学習する。
論文 参考訳(メタデータ) (2022-09-15T07:26:43Z) - CapillaryX: A Software Design Pattern for Analyzing Medical Images in
Real-time using Deep Learning [0.688204255655161]
本稿では,医療画像のリアルタイム解析をローカルかつ並列に行うことができる計算アーキテクチャを提案する。
我々は,微小循環画像中の血管の定量化という,特定の医学・工業ケーススタディに焦点を当てた。
その結果,本システムはシリアルシステムに比べて約78%高速であり,マスタスレーブ並列システムアーキテクチャよりも12%高速であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T18:47:04Z) - Automatic Image Content Extraction: Operationalizing Machine Learning in
Humanistic Photographic Studies of Large Visual Archives [81.88384269259706]
本稿では,機械学習による大規模画像アーカイブの検索と解析のための自動画像コンテンツ抽出フレームワークを提案する。
提案する枠組みは、人文科学と社会科学のいくつかの分野に適用できる。
論文 参考訳(メタデータ) (2022-04-05T12:19:24Z) - Vision Transformers in Medical Computer Vision -- A Contemplative
Retrospection [0.9677949377607575]
ビジョントランスフォーマーは、コンピュータビジョンの分野で使われている最も現代的で支配的なアーキテクチャの1つとして進化している。
画像ベース疾患分類,解剖学的構造区分,登録,領域ベース病変検出,キャプション,レポート生成など,医療コンピュータビジョンのさまざまな領域におけるビジョントランスフォーマーの適用について調査した。
また、利用可能なデータセット、採用方法論、パフォーマンス対策、課題、ソリューションについても、議論の形で光を当てています。
論文 参考訳(メタデータ) (2022-03-29T06:32:43Z) - A survey of image labelling for computer vision applications [0.0]
近年,画像コンテンツ認識のためのディープラーニングアルゴリズムが普及し,アドホックなラベリングツールが出現している。
画像ラベリングソフトウェアの基本的な概念と特徴をコンパイルするために,構造化文献レビューを行う。
論文 参考訳(メタデータ) (2021-04-18T16:01:55Z) - Factors of Influence for Transfer Learning across Diverse Appearance
Domains and Task Types [50.1843146606122]
現在の最新のコンピュータビジョンモデルでは、簡単な転送学習が一般的です。
転校学習に関するこれまでの体系的な研究は限られており、作業が期待される状況は十分に理解されていない。
本論文では,非常に異なる画像領域にまたがる転送学習の広範な実験的研究を行う。
論文 参考訳(メタデータ) (2021-03-24T16:24:20Z) - A Review on Near Duplicate Detection of Images using Computer Vision
Techniques [0.0]
ほぼ重複する物質の存在は、検索エンジンの性能に重大な影響を及ぼす。
コンピュータビジョンの主な応用は画像理解である。
画像のほぼ重複検出に関する文献の適切な調査は行われていない。
論文 参考訳(メタデータ) (2020-09-07T16:41:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。