論文の概要: AugmenTory: A Fast and Flexible Polygon Augmentation Library
- arxiv url: http://arxiv.org/abs/2405.04442v1
- Date: Tue, 7 May 2024 16:07:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-08 13:31:20.790949
- Title: AugmenTory: A Fast and Flexible Polygon Augmentation Library
- Title(参考訳): AugmenTory: 高速で柔軟なポリゴン拡張ライブラリ
- Authors: Tanaz Ghahremani, Mohammad Hoseyni, Mohammad Javad Ahmadi, Pouria Mehrabi, Amirhossein Nikoofard,
- Abstract要約: データ拡張は、限られたデータセットの課題に対処するための重要なテクニックである。
特殊なライブラリの欠如は、ポリゴン増補プロセスを妨げている。
本稿では,新たに開発されたAugmenToryライブラリに具体化された新しいソリューションを紹介する。
- 参考スコア(独自算出の注目度): 0.5825410941577593
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Data augmentation is a key technique for addressing the challenge of limited datasets, which have become a major component in the training procedures of image processing. Techniques such as geometric transformations and color space adjustments have been thoroughly tested for their ability to artificially expand training datasets and generate semi-realistic data for training purposes. Data augmentation is the most important key to addressing the challenge of limited datasets, which have become a major component of image processing training procedures. Data augmentation techniques, such as geometric transformations and color space adjustments, are thoroughly tested for their ability to artificially expand training datasets and generate semi-realistic data for training purposes. Polygons play a crucial role in instance segmentation and have seen a surge in use across advanced models, such as YOLOv8. Despite their growing popularity, the lack of specialized libraries hampers the polygon-augmentation process. This paper introduces a novel solution to this challenge, embodied in the newly developed AugmenTory library. Notably, AugmenTory offers reduced computational demands in both time and space compared to existing methods. Additionally, the library includes a postprocessing thresholding feature. The AugmenTory package is publicly available on GitHub, where interested users can access the source code: https://github.com/Smartory/AugmenTory
- Abstract(参考訳): データ拡張は、限られたデータセットの課題に対処するための重要なテクニックであり、画像処理のトレーニング手順において主要なコンポーネントとなっている。
幾何変換や色空間調整といった技術は、トレーニングデータセットを人工的に拡張し、トレーニング目的のために半現実的なデータを生成する能力のために、徹底的にテストされている。
データ拡張は、限られたデータセットの課題に対処する上で最も重要な鍵である。
幾何変換や色空間調整などのデータ拡張技術は、トレーニングデータセットを人工的に拡張し、トレーニング目的のために半現実的なデータを生成する能力のために、徹底的にテストされている。
ポリゴンはインスタンスセグメンテーションにおいて重要な役割を担い、YOLOv8のような先進モデルでの利用が急増している。
人気は高まっているが、特殊図書館の欠如はポリゴン増補プロセスを妨げている。
本稿では,新たに開発されたAugmenToryライブラリに具体化された,この課題に対する新しい解決策を紹介する。
特にAugmenToryは、既存の方法と比較して時間と空間の両方で計算要求を減らしている。
さらに、ライブラリには後処理のしきい値設定機能が含まれている。
AugmenToryパッケージはGitHubで公開されている。
関連論文リスト
- Your Image is My Video: Reshaping the Receptive Field via Image-To-Video Differentiable AutoAugmentation and Fusion [35.88039888482076]
本稿では,ビデオとして処理可能な画像のバリエーションを生成するために,最初の微分可能拡張探索法(DAS)を提案する。
DASは非常に高速で柔軟性があり、GPUの1日以内で非常に大きな検索スペースを検索できる。
DASを利用して、タスク依存変換を選択することにより、空間受容場の再構成を誘導する。
論文 参考訳(メタデータ) (2024-03-22T13:27:57Z) - A survey of synthetic data augmentation methods in computer vision [0.0]
本稿では,合成データ拡張技術について概観する。
我々は、重要なデータ生成と拡張技術、アプリケーション全般の範囲、および特定のユースケースに焦点を当てる。
コンピュータビジョンモデルをトレーニングするための一般的な合成データセットの要約を提供する。
論文 参考訳(メタデータ) (2024-03-15T07:34:08Z) - Advanced Data Augmentation Approaches: A Comprehensive Survey and Future
directions [57.30984060215482]
データ拡張の背景、レビューされたデータ拡張技術の新しい包括的分類法、および各技術の強さと弱点(可能ならば)を提供する。
また、画像分類、オブジェクト検出、セマンティックセグメンテーションなどの3つの一般的なコンピュータビジョンタスクに対して、データ拡張効果の総合的な結果を提供する。
論文 参考訳(メタデータ) (2023-01-07T11:37:32Z) - Adversarial Auto-Augment with Label Preservation: A Representation
Learning Principle Guided Approach [95.74102207187545]
本研究では,事前自由な自律的データ拡張の目的が表現学習の原則から導出可能であることを示す。
そこで我々は,既存の手法にシームレスに最適化し,シームレスに統合できる目的に対して,実用的なサロゲートを提案する。
論文 参考訳(メタデータ) (2022-11-02T02:02:51Z) - A Feature-space Multimodal Data Augmentation Technique for Text-video
Retrieval [16.548016892117083]
近年,テキストビデオ検索手法が注目されている。
データ拡張技術は、目に見えないテスト例のパフォーマンスを向上させるために導入された。
特徴空間で機能し,意味的に類似したサンプルを混合して新しいビデオやキャプションを生成するマルチモーダルデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2022-08-03T14:05:20Z) - Masked Autoencoders are Robust Data Augmentors [90.34825840657774]
ディープニューラルネットワークの一般化には、画像拡張のような正規化技術が必要である。
本稿では,トレーニングプロセスの正規化に向けて,新たな拡張の視点を提案する。
このようなモデルに基づく非線形変換をデータ拡張として活用することで,高レベルの認識タスクを向上できることを示す。
論文 参考訳(メタデータ) (2022-06-10T02:41:48Z) - Feature transforms for image data augmentation [74.12025519234153]
画像分類において、多くの拡張アプローチは単純な画像操作アルゴリズムを利用する。
本研究では,14種類の拡張アプローチを組み合わせて生成した画像を追加することで,データレベルでのアンサンブルを構築する。
事前トレーニングされたResNet50ネットワークは、各拡張メソッドから派生した画像を含むトレーニングセットに基づいて微調整される。
論文 参考訳(メタデータ) (2022-01-24T14:12:29Z) - Invariance encoding in sliced-Wasserstein space for image classification
with limited training data [10.435990685398595]
我々は、ラドン累積分布変換(R-CDT)の特定の数学的性質を利用して、スライスされたワッサーシュタイン空間における最近傍部分空間分類モデルを数学的に拡張することを提案する。
特定の学習問題に対して,我々の数学的解法は,分類精度と計算複雑性の観点から,深層CNNによるデータ拡張よりも有利であることを示す。
論文 参考訳(メタデータ) (2022-01-09T10:25:27Z) - DNA: Dynamic Network Augmentation [0.0]
入力条件拡張ポリシーを学習する動的ネットワーク拡張(DNA)を導入する。
我々のモデルは動的拡張ポリシーを可能にし、入力特徴に条件付き幾何変換を持つデータに対してうまく機能する。
論文 参考訳(メタデータ) (2021-12-17T01:43:56Z) - Virtual Data Augmentation: A Robust and General Framework for
Fine-tuning Pre-trained Models [51.46732511844122]
強力な事前訓練型言語モデル(PLM)は、小さな摂動や意図的な攻撃によって騙されることがある。
VDA(Virtual Data Augmentation)は,PLMを高度に微調整するための一般的なフレームワークである。
本手法は, PLMの堅牢性を向上し, 敵攻撃時の性能劣化を軽減する。
論文 参考訳(メタデータ) (2021-09-13T09:15:28Z) - CADDA: Class-wise Automatic Differentiable Data Augmentation for EEG
Signals [92.60744099084157]
本研究では、勾配に基づく学習に適した微分可能データ拡張を提案する。
本研究は,臨床関連睡眠ステージ分類課題におけるアプローチの意義を示す。
論文 参考訳(メタデータ) (2021-06-25T15:28:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。