論文の概要: Exploring Data Pipelines through the Process Lens: a Reference Model
forComputer Vision
- arxiv url: http://arxiv.org/abs/2107.01824v1
- Date: Mon, 5 Jul 2021 07:15:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 20:50:59.759979
- Title: Exploring Data Pipelines through the Process Lens: a Reference Model
forComputer Vision
- Title(参考訳): プロセスレンズによるデータパイプライン探索: コンピュータビジョンのための参照モデル
- Authors: Agathe Balayn, Bogdan Kulynych, Seda Guerses
- Abstract要約: 我々は、プロセス指向のレンズを通してCVデータパイプラインを調べることで、害の分析をさらに体系化することができると論じる。
プロセス指向レンズの育成に向けた第一歩として,CVデータパイプラインの実証的研究を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Researchers have identified datasets used for training computer vision (CV)
models as an important source of hazardous outcomes, and continue to examine
popular CV datasets to expose their harms. These works tend to treat datasets
as objects, or focus on particular steps in data production pipelines. We argue
here that we could further systematize our analysis of harms by examining CV
data pipelines through a process-oriented lens that captures the creation, the
evolution and use of these datasets. As a step towards cultivating a
process-oriented lens, we embarked on an empirical study of CV data pipelines
informed by the field of method engineering. We present here a preliminary
result: a reference model of CV data pipelines. Besides exploring the questions
that this endeavor raises, we discuss how the process lens could support
researchers in discovering understudied issues, and could help practitioners in
making their processes more transparent.
- Abstract(参考訳): 研究者は、コンピュータビジョン(CV)モデルのトレーニングに使用されるデータセットを、有害な結果の重要なソースとして特定し、人気のあるCVデータセットを調べて、その害を明らかにする。
これらの作業は、データセットをオブジェクトとして扱うか、データ運用パイプラインの特定のステップに集中する傾向がある。
ここでは、これらのデータセットの生成、進化、使用をキャプチャするプロセス指向レンズを通してCVデータパイプラインを調べることで、害の分析をさらに体系化することができると論じる。
プロセス指向レンズの育成に向けたステップとして,手法工学の分野から情報を得たcvデータパイプラインの実証研究に着手した。
本稿では,CVデータパイプラインの参照モデルとして,予備的な結果を示す。
この取り組みが提起する疑問の探索に加えて、プロセスレンズが未調査の問題発見において研究者を支援し、実践者がプロセスをより透明にするのにどう役立つかについて議論する。
関連論文リスト
- Enabling Advanced Land Cover Analytics: An Integrated Data Extraction Pipeline for Predictive Modeling with the Dynamic World Dataset [1.3757956340051605]
Dynamic Worldデータセットを扱うために、フレキシブルで効率的なエンドツーエンドパイプラインを提示します。
これには、ノイズ除去に取り組む前処理および表現フレームワーク、大量のデータの効率的な抽出、LULCデータの再表現が含まれる。
パイプラインのパワーを実証するために、都市化予測問題のためのデータを抽出し、優れたパフォーマンスで機械学習モデルのスイートを構築する。
論文 参考訳(メタデータ) (2024-10-11T16:13:01Z) - A Systematic Review of Available Datasets in Additive Manufacturing [56.684125592242445]
視覚およびその他のセンサー技術を組み込んだその場監視により、追加製造プロセス中に広範なデータセットの収集が可能になる。
これらのデータセットは、製造された出力の品質を判断し、機械学習を使用して欠陥を検出する可能性がある。
本稿では,AMプロセスから派生したオープン画像ベースデータセットの利用可能性について検討する。
論文 参考訳(メタデータ) (2024-01-27T16:13:32Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Demonstration of InsightPilot: An LLM-Empowered Automated Data
Exploration System [48.62158108517576]
本稿では,データ探索プロセスの簡略化を目的とした自動データ探索システムであるInsightPilotを紹介する。
InsightPilotは、理解、要約、説明などの適切な分析意図を自動的に選択する。
簡単に言うと、IQueryはデータ分析操作の抽象化と自動化であり、データアナリストのアプローチを模倣しています。
論文 参考訳(メタデータ) (2023-04-02T07:27:49Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - A Tour of Visualization Techniques for Computer Vision Datasets [4.5916483318867]
我々はコンピュータビジョン(CV)データセットを解析するための多くのデータ可視化手法を調査した。
これらの手法は、データセットレベルの分析を適用することで、そのようなデータの特性や潜伏パターンを理解するのに役立ちます。
CVモデルにおけるデータセット特性の潜在的な影響を予測する上で,このような分析がいかに役立つかを示す。
論文 参考訳(メタデータ) (2022-04-19T01:04:28Z) - Omnidata: A Scalable Pipeline for Making Multi-Task Mid-Level Vision
Datasets from 3D Scans [103.92680099373567]
本稿では,実世界の包括的3Dスキャンからマルチタスク視覚データセットをパラメトリックサンプリングし,レンダリングするパイプラインを提案する。
サンプリングパラメータを変更することで、生成されたデータセットを“ステア”して、特定の情報を強調することが可能になる。
生成されたスタータデータセットでトレーニングされた共通アーキテクチャは、複数の共通ビジョンタスクとベンチマークで最先端のパフォーマンスに達した。
論文 参考訳(メタデータ) (2021-10-11T04:21:46Z) - On The State of Data In Computer Vision: Human Annotations Remain
Indispensable for Developing Deep Learning Models [0.0]
高品質ラベル付きデータセットは機械学習(ML)の発展に重要な役割を果たす
2012年にImageNetデータセットとAlexNetモデルが登場して以来、新しいオープンソースのラベル付きビジョンデータセットのサイズはほぼ一定である。
コンピュータビジョンコミュニティの少数の出版物は、Imagenetよりも桁違いの大きさのデータセットの教師付き学習に取り組む。
論文 参考訳(メタデータ) (2021-07-31T00:08:21Z) - From ImageNet to Image Classification: Contextualizing Progress on
Benchmarks [99.19183528305598]
ImageNet作成プロセスにおける特定の設計選択が、結果のデータセットの忠実性に与える影響について検討する。
私たちの分析では、ノイズの多いデータ収集パイプラインが、結果のベンチマークと、それがプロキシとして機能する実世界のタスクとの間に、体系的なミスアライメントをもたらす可能性があることを指摘しています。
論文 参考訳(メタデータ) (2020-05-22T17:39:16Z) - A Common Operating Picture Framework Leveraging Data Fusion and Deep
Learning [0.7348448478819135]
本稿では,処理,爆発,拡散のソリューションを高速化するためのデータ融合フレームワークを提案する。
私たちのプラットフォームは、ディープラーニングやその他の処理手段を活用することで、複数のデータソースから情報を抽出するサービスの集合体です。
最初のイテレーションでは、ビジュアルデータ(FMV, WAMI, CCTV/PTZ-Cameras, オープンソースビデオなど)とAISデータストリーム(衛星と地上ソース)に焦点を当てました。
論文 参考訳(メタデータ) (2020-01-16T18:32:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。