論文の概要: A Philosophy of Data
- arxiv url: http://arxiv.org/abs/2004.09990v2
- Date: Wed, 20 May 2020 12:36:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 03:58:10.426404
- Title: A Philosophy of Data
- Title(参考訳): データ哲学という哲学
- Authors: Alexander M. Mussgnug
- Abstract要約: 我々は、統計計算に必要な基本特性から統計データの定義まで研究する。
我々は、有用なデータの必要性は、プロパティを根本的にユニークか等しく理解することを規則化する必要があると論じている。
データとデータ技術への依存度が高まるにつれて、この2つの特徴は現実の集合概念に影響を与えます。
- 参考スコア(独自算出の注目度): 91.3755431537592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We argue that while this discourse on data ethics is of critical importance,
it is missing one fundamental point: If more and more efforts in business,
government, science, and our daily lives are data-driven, we should pay more
attention to what exactly we are driven by. Therefore, we need more debate on
what fundamental properties constitute data. In the first section of the paper,
we work from the fundamental properties necessary for statistical computation
to a definition of statistical data. We define a statistical datum as the
coming together of substantive and numerical properties and differentiate
between qualitative and quantitative data. Subsequently, we qualify our
definition by arguing that for data to be practically useful, it needs to be
commensurable in a manner that reveals meaningful differences that allow for
the generation of relevant insights through statistical methodologies. In the
second section, we focus on what our conception of data can contribute to the
discourse on data ethics and beyond. First, we hold that the need for useful
data to be commensurable rules out an understanding of properties as
fundamentally unique or equal. Second, we argue that practical concerns lead us
to increasingly standardize how we operationalize a substantive property; in
other words, how we formalize the relationship between the substantive and
numerical properties of data. Thereby, we also standardize the interpretation
of a property. With our increasing reliance on data and data technologies,
these two characteristics of data affect our collective conception of reality.
Statistical data's exclusion of the fundamentally unique and equal influences
our perspective on the world, and the standardization of substantive properties
can be viewed as profound ontological practice, entrenching ever more pervasive
interpretations of phenomena in our everyday lives.
- Abstract(参考訳): ビジネス、政府、科学、日々の生活におけるより多くの努力がデータ駆動であるなら、私たちは正確に何が駆動されているのかにもっと注意を払うべきです。
したがって、データを構成する基本的な性質についてさらに議論する必要がある。
本論文の第一節では,統計計算に必要な基本的な性質から統計データの定義までについて述べる。
統計ダタムを実体特性と数値特性の結合として定義し,定性的データと定量的データを区別する。
その後、統計的手法によって関連する洞察を創出できる有意義な差異を明らかにする方法で、データが実用的に有用であるためには、コンメンサブルでなければならない、という私たちの定義に適合する。
第2のセクションでは、データの概念がデータ倫理に関する談話にどんな貢献ができるかに焦点を当てます。
第一に、有用データの必要性は、プロパティを根本的にユニークか等しく理解することを規定するものである。
第二に、実際的な懸念は、どのように従属的性質を運用するかをますます標準化し、つまりデータの従属的性質と数値的性質の関係を形式化するかを議論する。
これにより、プロパティの解釈も標準化される。
データとデータ技術への依存が高まるにつれ、この2つのデータの特徴は現実の集団的概念に影響を与えます。
統計データは、基本的に一意で平等な現象の排除は、我々の世界観に影響を与え、従属的性質の標準化は、我々の日常生活における現象のより広く解釈されるように、深い存在論的実践と見なすことができる。
関連論文リスト
- Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト・イズ・キー (Context is Key) (CiK) は、時系列予測ベンチマークであり、様々な種類のテキストコンテキストと数値データをペアリングする。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
実験では、文脈情報の導入の重要性を強調し、LLMに基づく予測モデルを用いた場合の驚くべき性能を示すとともに、それらの重要な欠点を明らかにした。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - Inherent Inconsistencies of Feature Importance [6.02357145653815]
特徴重要度は、予測結果に対する個々の特徴の寄与にスコアを割り当てる手法である。
本稿では,特徴重要度スコアの異なる文脈間のコヒーレントな関係を確立するために設計された公理的枠組みを提案する。
論文 参考訳(メタデータ) (2022-06-16T14:21:51Z) - Measuring Fairness of Text Classifiers via Prediction Sensitivity [63.56554964580627]
加速度予測感度は、入力特徴の摂動に対するモデルの予測感度に基づいて、機械学習モデルの公正度を測定する。
この計量は、群フェアネス(統計パリティ)と個人フェアネスという特定の概念と理論的に関連付けられることを示す。
論文 参考訳(メタデータ) (2022-03-16T15:00:33Z) - Faking feature importance: A cautionary tale on the use of
differentially-private synthetic data [3.631918877491949]
本稿では,生データから得られる特徴量と合成データから得られる特徴量との一致を実証的に分析する。
プライバシのレベルによって異なるため、さまざまなユーティリティー対策を適用して、特徴的重要性の合意を定量化します。
この研究は、金融や医療といった分野において、高感度データセットの合成バージョンを開発する上で重要な意味を持つ。
論文 参考訳(メタデータ) (2022-03-02T19:11:43Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Domain Adaptative Causality Encoder [52.779274858332656]
我々は,適応因果同定と局所化の課題に対処するために,依存木の特徴と敵対学習を活用する。
我々は、テキストにあらゆる種類の因果関係を統合する新しい因果関係データセット、MedCausを提案する。
論文 参考訳(メタデータ) (2020-11-27T04:14:55Z) - Between Subjectivity and Imposition: Power Dynamics in Data Annotation
for Computer Vision [1.933681537640272]
本稿では,産業的文脈における画像データアノテーションの実践について検討する。
我々は、アノテータがラベルを使ってデータに意味を割り当てる、センスメイキングの実践としてデータアノテーションを定義します。
論文 参考訳(メタデータ) (2020-07-29T15:02:56Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Jointly Predicting Job Performance, Personality, Cognitive Ability,
Affect, and Well-Being [42.67003631848889]
本研究では,身体的および生理的行動,心理的状態と特徴,職能を統合した個人予測分析のためのベンチマークを作成する。
我々は、データマイニング技術をベンチマークとして設計し、ウェアラブルセンサから得られた真のノイズと不完全なデータを用いて、12の標準化された精確なテストに基づいて19の構造を予測する。
論文 参考訳(メタデータ) (2020-06-10T14:30:29Z) - Really Useful Synthetic Data -- A Framework to Evaluate the Quality of
Differentially Private Synthetic Data [2.538209532048867]
プライバシ保護の原則を付加する合成データ生成の最近の進歩は、プライバシ保護の方法で統計情報を共有するための重要なステップである。
データプライバシとデータ品質のトレードオフを最適化するためには、後者について詳しく考える必要があります。
本研究では,応用研究者の視点から,差分的にプライベートな合成データの質を評価する枠組みを開発する。
論文 参考訳(メタデータ) (2020-04-16T16:24:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。