論文の概要: Automatic Image Content Extraction: Operationalizing Machine Learning in
Humanistic Photographic Studies of Large Visual Archives
- arxiv url: http://arxiv.org/abs/2204.02149v1
- Date: Tue, 5 Apr 2022 12:19:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 18:48:21.376616
- Title: Automatic Image Content Extraction: Operationalizing Machine Learning in
Humanistic Photographic Studies of Large Visual Archives
- Title(参考訳): 自動画像コンテンツ抽出:大規模視覚アーカイブのヒューマニズム写真研究における機械学習の運用
- Authors: Anssi M\"annist\"o, Mert Seker, Alexandros Iosifidis, Jenni Raitoharju
- Abstract要約: 本稿では,機械学習による大規模画像アーカイブの検索と解析のための自動画像コンテンツ抽出フレームワークを提案する。
提案する枠組みは、人文科学と社会科学のいくつかの分野に適用できる。
- 参考スコア(独自算出の注目度): 81.88384269259706
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Applying machine learning tools to digitized image archives has a potential
to revolutionize quantitative research of visual studies in humanities and
social sciences. The ability to process a hundredfold greater number of photos
than has been traditionally possible and to analyze them with an extensive set
of variables will contribute to deeper insight into the material. Overall,
these changes will help to shift the workflow from simple manual tasks to more
demanding stages.
In this paper, we introduce Automatic Image Content Extraction (AICE)
framework for machine learning-based search and analysis of large image
archives. We developed the framework in a multidisciplinary research project as
framework for future photographic studies by reformulating and expanding the
traditional visual content analysis methodologies to be compatible with the
current and emerging state-of-the-art machine learning tools and to cover the
novel machine learning opportunities for automatic content analysis. The
proposed framework can be applied in several domains in humanities and social
sciences, and it can be adjusted and scaled into various research settings. We
also provide information on the current state of different machine learning
techniques and show that there are already various publicly available methods
that are suitable to a wide-scale of visual content analysis tasks.
- Abstract(参考訳): デジタル化された画像アーカイブに機械学習ツールを適用することは、人文科学や社会科学における視覚研究の定量的研究に革命をもたらす可能性がある。
これまで可能だった100倍の写真を処理し、それらを広範囲の変数で分析する能力は、この素材の深い洞察に寄与する。
全体として、これらの変更はワークフローを単純な手動タスクからより要求の厳しいステージにシフトするのに役立ちます。
本稿では,機械学習による大規模画像アーカイブの検索と解析のための自動画像コンテンツ抽出(AICE)フレームワークを提案する。
従来の視覚コンテンツ分析手法を、現在および最先端の機械学習ツールと互換性のあるものに修正・拡張し、自動コンテンツ解析のための新しい機械学習機会をカバーし、将来の写真研究のためのフレームワークとして多分野研究プロジェクトにおいてこのフレームワークを開発した。
提案された枠組みは人文科学や社会科学のいくつかの分野に適用でき、様々な研究領域に調整・スケールすることができる。
また、さまざまな機械学習技術の現状に関する情報も提供し、より大規模な視覚コンテンツ分析タスクに適した様々な公開手法がすでに存在することを示す。
関連論文リスト
- GalleryGPT: Analyzing Paintings with Large Multimodal Models [64.98398357569765]
美術品の分析は、個人の審美性を豊かにし、批判的思考能力を促進することができる芸術鑑賞のための重要かつ基本的な技術である。
アートワークを自動解析する以前の作業は、主に分類、検索、その他の単純なタスクに焦点を当てており、AIの目標とは程遠い。
LLaVAアーキテクチャに基づいて微調整されたGalleryGPTと呼ばれる,絵画解析のための優れた大規模マルチモーダルモデルを提案する。
論文 参考訳(メタデータ) (2024-08-01T11:52:56Z) - An Image-based Typology for Visualization [23.716718517642878]
本稿では,画像からの視覚表現の質的解析結果について述べる。
定義群を10種類に分類した。
我々は、6,833枚のタグ付き画像のデータセットと、ラベル付き画像の大規模な集合を探索および分析するために使用できるオンラインツールを提供する。
論文 参考訳(メタデータ) (2024-03-07T04:33:42Z) - Document AI: A Comparative Study of Transformer-Based, Graph-Based
Models, and Convolutional Neural Networks For Document Layout Analysis [3.231170156689185]
Document AIは、自然言語処理とコンピュータビジョン技術を活用して、文書を自動的に分析することを目的としている。
Document AIの主要なタスクの1つはドキュメントレイアウト分析であり、レイアウト、画像、テキストの内容と空間的関係を解釈することでドキュメントページを構造化する。
論文 参考訳(メタデータ) (2023-08-29T16:58:03Z) - Domain Generalization for Mammographic Image Analysis with Contrastive
Learning [62.25104935889111]
効果的なディープラーニングモデルのトレーニングには、さまざまなスタイルと品質を備えた大規模なデータが必要である。
より優れたスタイルの一般化能力を備えた深層学習モデルを実現するために,新しいコントラスト学習法が開発された。
提案手法は,様々なベンダスタイルドメインのマンモグラムや,いくつかのパブリックデータセットを用いて,広範囲かつ厳密に評価されている。
論文 参考訳(メタデータ) (2023-04-20T11:40:21Z) - Computer Vision on X-ray Data in Industrial Production and Security
Applications: A survey [89.45221564651145]
本稿では,コンピュータビジョンと機械学習を用いた産業生産およびセキュリティアプリケーションにおけるX線分析に関する最近の研究をレビューする。
公開されているデータセット上でのアプリケーション、テクニック、評価メトリクス、データセット、それらのテクニックのパフォーマンス比較をカバーしている。
論文 参考訳(メタデータ) (2022-11-10T13:37:36Z) - Leveraging Computer Vision Application in Visual Arts: A Case Study on
the Use of Residual Neural Network to Classify and Analyze Baroque Paintings [0.0]
本稿ではヨハン・クペツキーの「画家シャルル・ブルニの肖像」の分類に焦点をあてる。
残余ネットワークトレーニングで抽出した特徴は,オンラインアートコレクションの検索システム内での画像検索に有用であることを示す。
論文 参考訳(メタデータ) (2022-10-27T10:15:36Z) - A survey of image labelling for computer vision applications [0.0]
近年,画像コンテンツ認識のためのディープラーニングアルゴリズムが普及し,アドホックなラベリングツールが出現している。
画像ラベリングソフトウェアの基本的な概念と特徴をコンパイルするために,構造化文献レビューを行う。
論文 参考訳(メタデータ) (2021-04-18T16:01:55Z) - Factors of Influence for Transfer Learning across Diverse Appearance
Domains and Task Types [50.1843146606122]
現在の最新のコンピュータビジョンモデルでは、簡単な転送学習が一般的です。
転校学習に関するこれまでの体系的な研究は限られており、作業が期待される状況は十分に理解されていない。
本論文では,非常に異なる画像領域にまたがる転送学習の広範な実験的研究を行う。
論文 参考訳(メタデータ) (2021-03-24T16:24:20Z) - EXACT: A collaboration toolset for algorithm-aided annotation of images
with annotation version control [7.6457287740201]
EXACTは、オンラインおよびオフラインで画像の協調的な学際的解析を可能にする。
ソフトウェアは、スクリーニングモードでミトティックフィギュアをカウントするなど、多様なアプリケーションに適応することができる。
すでに幅広いアノテーションタスクにうまく適用されています。
論文 参考訳(メタデータ) (2020-04-30T06:07:21Z) - Image Segmentation Using Deep Learning: A Survey [58.37211170954998]
イメージセグメンテーションは、画像処理とコンピュータビジョンにおいて重要なトピックである。
深層学習モデルを用いた画像セグメンテーション手法の開発を目的とした研究が,これまでに数多く行われている。
論文 参考訳(メタデータ) (2020-01-15T21:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。