論文の概要: OrigamiSet1.0: Two New Datasets for Origami Classification and
Difficulty Estimation
- arxiv url: http://arxiv.org/abs/2101.05470v1
- Date: Thu, 14 Jan 2021 06:32:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-29 00:51:27.361351
- Title: OrigamiSet1.0: Two New Datasets for Origami Classification and
Difficulty Estimation
- Title(参考訳): OrigamiSet1.0: Origami分類と難易度推定のための2つの新しいデータセット
- Authors: Daniel Ma, Gerald Friedland, Mario Michael Krell
- Abstract要約: マルチメディアコモンズや他のデータベースの画像を用いた折り紙データセットを構築した。
折り紙画像の分類と難易度推定の2つのサブセットから構成される。
- 参考スコア(独自算出の注目度): 4.191355084788723
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Origami is becoming more and more relevant to research. However, there is no
public dataset yet available and there hasn't been any research on this topic
in machine learning. We constructed an origami dataset using images from the
multimedia commons and other databases. It consists of two subsets: one for
classification of origami images and the other for difficulty estimation. We
obtained 16000 images for classification (half origami, half other objects) and
1509 for difficulty estimation with $3$ different categories (easy: 764,
intermediate: 427, complex: 318). The data can be downloaded at:
https://github.com/multimedia-berkeley/OriSet. Finally, we provide machine
learning baselines.
- Abstract(参考訳): 折り紙は研究にますます関連性が増している。
しかし、まだ公開データセットはなく、機械学習でこのトピックについての研究は行われていません。
マルチメディアコモンズや他のデータベースの画像を用いた折り紙データセットを構築した。
折り紙画像の分類と難易度推定の2つのサブセットから構成される。
分類のための16000枚の画像(折り紙の半分、その他の物体の半分)と難易度推定用の1509枚の画像を取得し、それぞれ3つのカテゴリに分けて評価した(容易: 764, 中: 427, 複雑: 318)。
データはhttps://github.com/multimedia-berkeley/orisetからダウンロードできる。
最後に、機械学習のベースラインを提供します。
関連論文リスト
- Toffee: Efficient Million-Scale Dataset Construction for Subject-Driven Text-to-Image Generation [58.09421301921607]
我々は、主観的画像編集と生成のための最初の大規模データセットを構築した。
データセットは、以前の最大のデータセットの5倍のサイズですが、コストは、何万時間も低いです。
論文 参考訳(メタデータ) (2024-06-13T16:40:39Z) - mOSCAR: A Large-scale Multilingual and Multimodal Document-level Corpus [52.83121058429025]
ウェブからクロールされた最初の大規模多言語およびマルチモーダル文書コーパスであるmOSCARを紹介する。
163の言語、315万のドキュメント、214Bトークン、1.2Bイメージをカバーしている。
さまざまなマルチリンガル画像テキストタスクとベンチマークで、数ショットの学習パフォーマンスが大幅に向上している。
論文 参考訳(メタデータ) (2024-06-13T00:13:32Z) - OBELICS: An Open Web-Scale Filtered Dataset of Interleaved Image-Text
Documents [122.55393759474181]
我々は、インターリーブされた画像テキスト文書のオープンなWebスケールフィルタリングデータセットであるOBELICSを紹介する。
データセット作成プロセスを説明し、包括的なフィルタリングルールを示し、データセットの内容を分析する。
IDEFICSという名前の9~800億のパラメータのビジョンと言語モデルをトレーニングし、異なるマルチモーダルベンチマークで競合性能を得る。
論文 参考訳(メタデータ) (2023-06-21T14:01:01Z) - Meta-Album: Multi-domain Meta-Dataset for Few-Shot Image Classification [4.5202442856868625]
Meta-Album(メタアルバム)は、画像分類メタデータセットである。
40のオープンデータセットが含まれており、それぞれが少なくとも20のクラスを持ち、クラス毎に40のサンプルがあり、検証されたライセンスがある。
すべてのデータセットはプリプロセスされ、アノテートされ、一様にフォーマットされ、3つのバージョン(Micro $subset$ Mini $subset$ Extended)でユーザの計算リソースにマッチする。
論文 参考訳(メタデータ) (2023-02-16T11:07:51Z) - Hierarchical Multi-Label Classification of Scientific Documents [47.293189105900524]
我々はSciHTCと呼ばれる科学論文の階層的多ラベルテキスト分類のための新しいデータセットを提案する。
このデータセットは、ACM CCSツリーから186,160の論文と1,233のカテゴリを含んでいる。
我々の最良のモデルでは、マクロF1スコアが34.57%に達し、このデータセットが大きな研究機会を提供することを示す。
論文 参考訳(メタデータ) (2022-11-05T04:12:57Z) - Oracle-MNIST: a Realistic Image Dataset for Benchmarking Machine
Learning Algorithms [57.29464116557734]
我々は,古文字30,222文字の28ドルのグレースケール画像からなるOracle-MNISTデータセットを紹介した。
トレーニングセットは完全に27,222枚の画像で構成され、テストセットにはクラス毎に300枚の画像が含まれている。
論文 参考訳(メタデータ) (2022-05-19T09:57:45Z) - Harnessing Interpretable Machine Learning for Origami Feature Design and
Pattern Selection [6.725348756525192]
本研究は, 決定木機械学習手法が, 折り紙の逆設計に特に適していることを示す。
提案フレームワークは, メタマテリアル, 展開可能な構造, ソフトロボット, バイオメディカルデバイスなど, 様々な用途に有効な折り紙システムを設計するための総合的な手法を示す。
論文 参考訳(メタデータ) (2022-04-12T12:27:05Z) - MedMNIST v2: A Large-Scale Lightweight Benchmark for 2D and 3D
Biomedical Image Classification [59.10015984688104]
MedMNIST v2は、MNISTに似た大規模データセットコレクションである。
得られたデータセットは708,069個の2D画像と10,214個の3D画像で構成されている。
論文 参考訳(メタデータ) (2021-10-27T22:02:04Z) - One of these (Few) Things is Not Like the Others [0.0]
本稿では,少数の例に基づいて新しい画像の分類と,それ以前のどのグループにも属さない画像の認識を両立できるモデルを提案する。
我々は,低消費電力デバイス上で動作可能な小型のセットアップを含む,モデルアーキテクチャのスペクトル上での性能を評価する。
論文 参考訳(メタデータ) (2020-05-22T21:49:35Z) - Building a Manga Dataset "Manga109" with Annotations for Multimedia
Applications [33.45306086398143]
漫画109(まんが109)は、日本の漫画109冊(94編、21,142ページ)からなるデータセット。
このデータセットは多くのマンガイメージとアノテーションを提供しており、機械学習アルゴリズムでの使用には有益である。
本稿では、データセットの詳細を説明し、マルチメディア処理アプリケーションのいくつかの例を示す。
論文 参考訳(メタデータ) (2020-05-09T12:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。