論文の概要: Identifying and Extracting Football Features from Real-World Media
Sources using Only Synthetic Training Data
- arxiv url: http://arxiv.org/abs/2209.13254v1
- Date: Tue, 27 Sep 2022 08:48:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 16:09:02.329915
- Title: Identifying and Extracting Football Features from Real-World Media
Sources using Only Synthetic Training Data
- Title(参考訳): 合成学習データのみを用いた実世界メディアからのサッカー特徴の同定と抽出
- Authors: Jose Cerqueira Fernandes and Benjamin Kenwright
- Abstract要約: 機械学習アルゴリズムのトレーニングに使用される実世界の画像は、しばしば非構造的で一貫性がない。
生成したタグ付きおよび構造化画像を用いて,これらの制限を克服できるアプローチを実証する。
このアプローチにより,実世界のフットボールの試合ソースから特徴を正確に抽出するロバストなソリューションを迅速に訓練し,準備することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-world images used for training machine learning algorithms are often
unstructured and inconsistent. The process of analysing and tagging these
images can be costly and error prone (also availability, gaps and legal
conundrums). However, as we demonstrate in this article, the potential to
generate accurate graphical images that are indistinguishable from real-world
sources has a multitude of benefits in machine learning paradigms. One such
example of this is football data from broadcast services (television and other
streaming media sources). The football games are usually recorded from multiple
sources (cameras and phones) and resolutions, not to mention, occlusion of
visual details and other artefacts (like blurring, weathering and lighting
conditions) which make it difficult to accurately identify features. We
demonstrate an approach which is able to overcome these limitations using
generated tagged and structured images. The generated images are able to
simulate a variety views and conditions (including noise and blurring) which
may only occur sporadically in real-world data and make it difficult for
machine learning algorithm to 'cope' with these unforeseen problems in
real-data. This approach enables us to rapidly train and prepare a robust
solution that accurately extracts features (e.g., spacial locations, markers on
the pitch, player positions, ball location and camera FOV) from real-world
football match sources for analytical purposes.
- Abstract(参考訳): 機械学習アルゴリズムのトレーニングに使用される実世界の画像は、しばしば非構造的で一貫性がない。
これらの画像の分析とタグ付けのプロセスは、コストがかかり、エラーが発生しやすい(可用性、ギャップ、法的混乱)。
しかし、本稿で示すように、実世界の情報源と区別できない正確なグラフィカル画像を生成する可能性には、機械学習のパラダイムに多くの利点がある。
この例の1つは、放送サービス(テレビジョンや他のストリーミングメディアソース)のフットボールデータである。
フットボールの試合は通常、複数のソース(カメラや電話)と解像度から記録されるが、視覚の詳細やその他のアーティファクト(ぼやけたり、風化したり、照明条件など)は正確に特徴を特定するのが困難である。
生成したタグ付きおよび構造化画像を用いて,これらの制限を克服できるアプローチを示す。
生成された画像は、現実世界のデータに散発的にのみ発生するさまざまなビューと条件(ノイズやぼやけを含む)をシミュレートすることができ、機械学習アルゴリズムがこれらの予期せぬ問題を実データで「解く」ことが困難になる。
提案手法により,実世界のフットボールの試合資料から,空間的位置,ピッチ上のマーカー,プレーヤの位置,ボールの位置,カメラFOVなどの特徴を正確に抽出する,堅牢なソリューションを迅速に訓練し,作成することができる。
関連論文リスト
- On the Effectiveness of Dataset Alignment for Fake Image Detection [28.68129042301801]
優れた検出器は、セマンティックコンテンツ、解像度、ファイルフォーマットなどの画像特性を無視しながら、生成モデル指紋に焦点を当てるべきである。
この研究では、これらのアルゴリズムの選択に加えて、堅牢な検出器をトレーニングするためには、リアル/フェイク画像の整列したデータセットも必要である、と論じる。
そこで本研究では, LDMの家族に対して, LDMのオートエンコーダを用いて実画像の再構成を行う手法を提案する。
論文 参考訳(メタデータ) (2024-10-15T17:58:07Z) - Solutions to Deepfakes: Can Camera Hardware, Cryptography, and Deep Learning Verify Real Images? [51.3344199560726]
信頼性の高い合成データから実際のデータを分離する手法を確立することが不可欠である。
この文書は、どの画像が本物かを検証するために使用できる検出と暗号に関する既知の戦略を提示することを目的としている。
論文 参考訳(メタデータ) (2024-07-04T22:01:21Z) - DeepFeatureX Net: Deep Features eXtractors based Network for discriminating synthetic from real images [6.75641797020186]
ディープラーニングアルゴリズムによって生成された合成画像であるDeepfakesは、Digital Forensicsの分野における最大の課題の1つだ。
ベースモデルと呼ばれる3つのブロックに基づく新しい手法を提案する。
そして、各ブロックから抽出された一般化特徴を処理して、入力画像の起源を判別する。
論文 参考訳(メタデータ) (2024-04-24T07:25:36Z) - Detecting Generated Images by Real Images Only [64.12501227493765]
既存の画像検出手法は、生成画像中の視覚的アーティファクトを検出したり、大規模なトレーニングによって、実画像と生成画像の両方から識別的特徴を学習する。
本稿では,新たな視点から生成した画像検出問題にアプローチする。
実画像の共通性を見つけ、特徴空間内の密接な部分空間にマッピングすることで、生成した画像は生成モデルに関係なくサブ空間の外側に投影される。
論文 参考訳(メタデータ) (2023-11-02T03:09:37Z) - PUG: Photorealistic and Semantically Controllable Synthetic Data for
Representation Learning [31.81199165450692]
制御性とリアリズムを両立する表現学習研究のための対話型環境を新たに提案する。
エンターテイメント業界で有名な強力なゲームエンジンであるUnreal Engineを使用して、表現学習のためのPUG環境とデータセットを生成します。
論文 参考訳(メタデータ) (2023-08-08T01:33:13Z) - Exploiting Raw Images for Real-Scene Super-Resolution [105.18021110372133]
本稿では,合成データと実撮影画像とのギャップを埋めるために,実シーンにおける単一画像の超解像化の問題について検討する。
本稿では,デジタルカメラの撮像過程を模倣して,よりリアルなトレーニングデータを生成する手法を提案する。
また、原画像に記録された放射情報を活用するために、2分岐畳み込みニューラルネットワークを開発した。
論文 参考訳(メタデータ) (2021-02-02T16:10:15Z) - Deep Traffic Sign Detection and Recognition Without Target Domain Real
Images [52.079665469286496]
本稿では,ターゲットドメインからの実際の画像を必要としない新しいデータベース生成手法と,(ii)交通標識のテンプレートを提案する。
この方法は、実際のデータでトレーニングを克服することではなく、実際のデータが利用できない場合に互換性のある代替手段になることを目的としている。
大規模なデータセットでは、完全に合成されたデータセットによるトレーニングは、実際のデータセットとトレーニングのパフォーマンスにほぼ一致する。
論文 参考訳(メタデータ) (2020-07-30T21:06:47Z) - Intrinsic Autoencoders for Joint Neural Rendering and Intrinsic Image
Decomposition [67.9464567157846]
合成3Dモデルからリアルな画像を生成するためのオートエンコーダを提案し,同時に実像を本質的な形状と外観特性に分解する。
実験により, レンダリングと分解の併用処理が有益であることが確認され, 画像から画像への翻訳の質的, 定量的なベースラインよりも優れた結果が得られた。
論文 参考訳(メタデータ) (2020-06-29T12:53:58Z) - Detecting Face2Face Facial Reenactment in Videos [76.9573023955201]
本研究では,再現性に基づく変化を検出する学習に基づくアルゴリズムを提案する。
提案アルゴリズムは,局所的なアーティファクトを学習し,様々な圧縮レベルで堅牢な性能を提供するマルチストリームネットワークを用いている。
その結果, 99.96%, 99.10%, 91.20%の非, 容易, 硬度圧縮係数が得られた。
論文 参考訳(メタデータ) (2020-01-21T11:03:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。