論文の概要: Tournesol: A quest for a large, secure and trustworthy database of
reliable human judgments
- arxiv url: http://arxiv.org/abs/2107.07334v1
- Date: Sat, 29 May 2021 19:21:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 12:07:15.527338
- Title: Tournesol: A quest for a large, secure and trustworthy database of
reliable human judgments
- Title(参考訳): Tournesol: 信頼性の高い人的判断の大規模でセキュアで信頼性の高いデータベース
- Authors: L\^e-Nguy\^en Hoang, Louis Faucon, Aidan Jungo, Sergei Volodin, Dalia
Papuc, Orfeas Liossatos, Ben Crulis, Mariame Tighanimine, Isabela Constantin,
Anastasiia Kucherenko, Alexandre Maurer, Felix Grimberg, Vlad Nitu, Chris
Vossen, S\'ebastien Rouault and El-Mahdi El-Mhamdi
- Abstract要約: emphTournesolはオープンソースプラットフォームで、urlhttps://tournesol.app.comで利用可能です。
Tournesolは、アルゴリズムが広く推奨すべきものに関する、人間の判断の大規模なデータベースを集めることを目指している。
Tournesolデータベースの構造、Tournesolプラットフォームの主要な特徴、そしてプロジェクトを成功させるために克服しなければならない主なハードルについて概説する。
- 参考スコア(独自算出の注目度): 43.502862912899886
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Today's large-scale algorithms have become immensely influential, as they
recommend and moderate the content that billions of humans are exposed to on a
daily basis. They are the de-facto regulators of our societies' information
diet, from shaping opinions on public health to organizing groups for social
movements. This creates serious concerns, but also great opportunities to
promote quality information. Addressing the concerns and seizing the
opportunities is a challenging, enormous and fabulous endeavor, as intuitively
appealing ideas often come with unwanted {\it side effects}, and as it requires
us to think about what we deeply prefer.
Understanding how today's large-scale algorithms are built is critical to
determine what interventions will be most effective. Given that these
algorithms rely heavily on {\it machine learning}, we make the following key
observation: \emph{any algorithm trained on uncontrolled data must not be
trusted}. Indeed, a malicious entity could take control over the data, poison
it with dangerously manipulative fabricated inputs, and thereby make the
trained algorithm extremely unsafe. We thus argue that the first step towards
safe and ethical large-scale algorithms must be the collection of a large,
secure and trustworthy dataset of reliable human judgments.
To achieve this, we introduce \emph{Tournesol}, an open source platform
available at \url{https://tournesol.app}. Tournesol aims to collect a large
database of human judgments on what algorithms ought to widely recommend (and
what they ought to stop widely recommending). We outline the structure of the
Tournesol database, the key features of the Tournesol platform and the main
hurdles that must be overcome to make it a successful project. Most
importantly, we argue that, if successful, Tournesol may then serve as the
essential foundation for any safe and ethical large-scale algorithm.
- Abstract(参考訳): 今日の大規模なアルゴリズムは、何十億もの人間が毎日露出しているコンテンツを推奨し、中途半端にしている。
彼らは私たちの社会の情報ダイエットの事実上の規制機関であり、公衆衛生に関する意見を形作り、社会運動のためのグループを組織する。
これは重大な懸念を生じさせるだけでなく、品質情報を促進する大きな機会も生み出します。
関心事に対処し、機会を掴むことは、挑戦的で、巨大で素晴らしい取り組みであり、直感的に魅力的なアイデアには、望ましくない副作用がしばしば伴います。
今日の大規模アルゴリズムがどのように構築されているかを理解することは、どの介入が最も効果的かを決定する上で重要である。
これらのアルゴリズムが {\it machine learning} に大きく依存していることを考えると、我々は以下の重要な観察を行う: 制御されていないデータに基づいてトレーニングされたemph{anyアルゴリズムは信頼されてはならない。
実際、悪意のあるエンティティがデータをコントロールし、危険な操作で作られた入力でそれを汚染することで、トレーニングされたアルゴリズムを極めて安全にすることができる。
したがって、安全で倫理的な大規模アルゴリズムへの第一歩は、信頼できる人間の判断による大規模で安全で信頼できるデータセットの収集である必要がある。
これを実現するために、私たちは \url{https://tournesol.app} で利用可能なオープンソースプラットフォームである \emph{tournesol} を紹介します。
Tournesolは、アルゴリズムが広く推奨すべきもの(そして広く推奨すべきもの)について、人間の判断の大規模なデータベースを集めることを目指している。
Tournesolデータベースの構造、Tournesolプラットフォームの主要な特徴、そしてプロジェクトを成功させるために克服しなければならない主なハードルについて概説する。
最も重要なことは、もし成功したら、Tournesolは安全で倫理的な大規模アルゴリズムにとって不可欠な基礎となるかもしれないということです。
関連論文リスト
- Secure Multiparty Generative AI [1.4433703131122861]
生成的AIツールの使用が急上昇するにつれ、これらのモデルに暴露される機密情報の量は警告される。
本研究では、サードパーティのAIプロバイダに機密データやモデルを公開しない、生成人工知能のためのセキュアでプライベートな方法論を提案する。
論文 参考訳(メタデータ) (2024-09-27T19:55:49Z) - User Strategization and Trustworthy Algorithms [81.82279667028423]
ユーザストラテジゼーションがプラットフォームを短期間で支援できることが示されています。
そして、それがプラットフォームのデータを破壊し、最終的に反実的な決定を下す能力を損なうことを示します。
論文 参考訳(メタデータ) (2023-12-29T16:09:42Z) - Factuality Challenges in the Era of Large Language Models [113.3282633305118]
大規模言語モデル(LLM)は、誤った、誤った、あるいは誤解を招くコンテンツを生成する。
LLMは悪意のあるアプリケーションに利用することができる。
これは、ユーザーを欺く可能性があるという点で、社会に重大な課題をもたらす。
論文 参考訳(メタデータ) (2023-10-08T14:55:02Z) - Efficient First-Order Contextual Bandits: Prediction, Allocation, and
Triangular Discrimination [82.52105963476703]
統計的学習、オンライン学習、その他における繰り返しのテーマは、低騒音の問題に対してより速い収束率が可能であることである。
1次保証は統計的およびオンライン学習において比較的よく理解されている。
三角識別と呼ばれる対数損失と情報理論量が一階保証を得る上で基本的な役割を担っていることを示す。
論文 参考訳(メタデータ) (2021-07-05T19:20:34Z) - Strategyproof Learning: Building Trustworthy User-Generated Datasets [5.586191108738563]
私たちは、おそらく驚くべきことに、データの誤レポートのインセンティブは致命的なものではないことを示しています。
実証可能な戦略の安全性を保証するために,最初のパーソナライズされた協調学習フレームワークであるLicchaviを提案する。
論文 参考訳(メタデータ) (2021-06-04T10:24:49Z) - From Handcrafted to Deep Features for Pedestrian Detection: A Survey [148.35460817092908]
歩行者検出はコンピュータビジョンにおいて重要であるが難しい問題である。
過去10年間で、手作りの機能と深い機能によって、大幅な改善が見られた。
単スペクトル歩行者検出に加えて,多スペクトル歩行者検出も検討した。
論文 参考訳(メタデータ) (2020-10-01T14:51:10Z) - The Future AI in Healthcare: A Tsunami of False Alarms or a Product of
Experts? [3.8244083622687306]
これらの出版物や商用アルゴリズムのほとんどは、いくつかの根本的な誤りを犯している、と私は主張する。
多くのアルゴリズムをまとめて投票し、全体的なパフォーマンス、相互独立性、コンテキストを定義する機能のセットを重み付けする必要があります。
論文 参考訳(メタデータ) (2020-07-20T21:56:36Z) - Faster Secure Data Mining via Distributed Homomorphic Encryption [108.77460689459247]
ホモモルフィック暗号化(HE)は、最近、暗号化されたフィールド上で計算を行う能力により、ますます注目を集めている。
本稿では,スケーリング問題の解決に向けて,新しい分散HEベースのデータマイニングフレームワークを提案する。
各種データマイニングアルゴリズムとベンチマークデータセットを用いて,新しいフレームワークの有効性と有効性を検証する。
論文 参考訳(メタデータ) (2020-06-17T18:14:30Z) - Decentralised, privacy-preserving Bayesian inference for mobile phone
contact tracing [0.0]
多くの国で、接触追跡を行うためにスマートフォンアプリの利用が準備されている。
AppleとGoogleは、iOSとAndroidにコンタクトトレーシング機能を導入する。
Apple/Googleのコンタクトトレースアルゴリズムのプライバシー保護の性質は、これらの決定の集中的なキュレーションが不可能であることを意味している。
本稿では,バイエルンのウイルス感染確率を推定する分散アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-11T13:13:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。