論文の概要: Training Data Attribution (TDA): Examining Its Adoption & Use Cases
- arxiv url: http://arxiv.org/abs/2501.12642v1
- Date: Wed, 22 Jan 2025 05:03:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-23 16:53:10.467795
- Title: Training Data Attribution (TDA): Examining Its Adoption & Use Cases
- Title(参考訳): 研修データ属性(TDA)導入事例の検討
- Authors: Deric Cheng, Juhan Bae, Justin Bullock, David Kristofferson,
- Abstract要約: 本稿では,TDA(Training Data Attribution)とそのAIからの極端なリスク軽減のための重要度とトラクタビリティについて検討する。
我々は、既存のTDA研究成果を現在の状態から、TDA推論の効率的かつ正確なツールへと導くために必要な、その可能性と労力について論じる。
我々は、TDAによって実現される可能性のある一連のポリシーとシステムをリストアップし、議論する。
- 参考スコア(独自算出の注目度): 5.256285764938807
- License:
- Abstract: This report investigates Training Data Attribution (TDA) and its potential importance to and tractability for reducing extreme risks from AI. First, we discuss the plausibility and amount of effort it would take to bring existing TDA research efforts from their current state, to an efficient and accurate tool for TDA inference that can be run on frontier-scale LLMs. Next, we discuss the numerous research benefits AI labs will expect to see from using such TDA tooling. Then, we discuss a key outstanding bottleneck that would limit such TDA tooling from being accessible publicly: AI labs' willingness to disclose their training data. We suggest ways AI labs may work around these limitations, and discuss the willingness of governments to mandate such access. Assuming that AI labs willingly provide access to TDA inference, we then discuss what high-level societal benefits you might see. We list and discuss a series of policies and systems that may be enabled by TDA. Finally, we present an evaluation of TDA's potential impact on mitigating large-scale risks from AI systems.
- Abstract(参考訳): 本稿では,TDA(Training Data Attribution)とそのAIからの極端なリスク軽減のための重要度とトラクタビリティについて検討する。
まず、既存のTDA研究を現在の状態から、フロンティアスケールのLLM上で実行可能なTDA推論の効率的かつ正確なツールへと導くために必要な、その可能性と労力について論じる。
次に、AIラボがこのようなTDAツールを使用することで期待する数多くの研究成果について論じる。
そして、そのようなTDAツールが一般公開されるのを制限する重要なボトルネックである、AIラボのトレーニングデータを開示する意思について論じる。
我々は、AIラボがこれらの制限に対処する方法を提案し、政府にそのようなアクセスを委任する意思について論じる。
AIラボがTDA推論へのアクセスを積極的に提供すると仮定すると、我々は次に、あなたが見ているような高いレベルの社会的利益について議論する。
我々は、TDAによって実現される可能性のある一連のポリシーとシステムをリストアップし、議論する。
最後に、AIシステムからの大規模リスク軽減に対するTDAの潜在的影響を評価する。
関連論文リスト
- Artificial Intelligence of Things: A Survey [14.204632921719933]
IoT(Internet of Things)とAI(Modern Artificial Intelligence)の統合により、AIoT(Artificial Intelligence of Things)と呼ばれる新しいパラダイムが生まれました。
我々は,センサ,コンピューティング,ネットワークおよび通信に関連するAIoT文献について検討する。
これらの分野での進歩に加えて、さまざまな重要なアプリケーションドメイン用に設計されたドメイン固有のAIoTシステムについてもレビューする。
論文 参考訳(メタデータ) (2024-10-25T22:45:58Z) - Using AI Alignment Theory to understand the potential pitfalls of regulatory frameworks [55.2480439325792]
本稿では、欧州連合の人工知能法(EU AI法)を批判的に検討する。
人工知能における技術的アライメントの潜在的な落とし穴に焦点を当てたアライメント理論(AT)研究からの洞察を利用する。
これらの概念をEU AI Actに適用すると、潜在的な脆弱性と規制を改善するための領域が明らかになる。
論文 参考訳(メタデータ) (2024-10-10T17:38:38Z) - Towards User-Focused Research in Training Data Attribution for Human-Centered Explainable AI [17.453208581487495]
XAIはAIを人間にとって理解しやすく有用なものにすることを目標としているが、形式主義や解法主義に頼りすぎていると批判されている。
我々は,XAI研究コミュニティがユーザ関連性を確保するために,トップダウンでユーザ中心の視点を採用する方法を示す。
論文 参考訳(メタデータ) (2024-09-25T14:40:26Z) - AI for IT Operations (AIOps) on Cloud Platforms: Reviews, Opportunities
and Challenges [60.56413461109281]
IT運用のための人工知能(AIOps)は、AIのパワーとIT運用プロセスが生成するビッグデータを組み合わせることを目的としている。
我々は、IT運用活動が発信する重要なデータの種類、分析における規模と課題、そしてどのように役立つかについて深く議論する。
主要なAIOpsタスクは、インシデント検出、障害予測、根本原因分析、自動アクションに分類します。
論文 参考訳(メタデータ) (2023-04-10T15:38:12Z) - Dataset Distillation: A Comprehensive Review [76.26276286545284]
データセット蒸留(DD)は、トレーニングされたモデルが元のデータセットでトレーニングされたデータセットに匹敵するパフォーマンスを得るために、合成サンプルを含むはるかに小さなデータセットを導出することを目的としている。
本稿ではDDの最近の進歩とその応用について概説する。
論文 参考訳(メタデータ) (2023-01-17T17:03:28Z) - The Role of AI in Drug Discovery: Challenges, Opportunities, and
Strategies [97.5153823429076]
この分野でのAIのメリット、課題、欠点についてレビューする。
データ拡張、説明可能なAIの使用、従来の実験手法とAIの統合についても論じている。
論文 参考訳(メタデータ) (2022-12-08T23:23:39Z) - Exploring Adversarially Robust Training for Unsupervised Domain
Adaptation [71.94264837503135]
Unsupervised Domain Adaptation (UDA)メソッドは、ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送することを目的としている。
本稿では、UDAのドメイン不変性を学習しながら、ATを介してラベルなしデータのロバスト性を高める方法について検討する。
本稿では,ARTUDA と呼ばれる UDA の適応的ロバストトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-02-18T17:05:19Z) - EvaLDA: Efficient Evasion Attacks Towards Latent Dirichlet Allocation [9.277398460006394]
ラテント・ディリクレ配置モデルが推論時間における逆摂動に対して脆弱かどうかを検討する。
そこで我々は,新しい効率的なアルゴリズムであるevaldaを提案する。
私たちの仕事は、LDAモデルへの回避攻撃の力と制限に関する重要な洞察を提供します。
論文 参考訳(メタデータ) (2020-12-09T04:57:20Z) - Artificial Intelligence for UAV-enabled Wireless Networks: A Survey [72.10851256475742]
無人航空機(UAV)は次世代無線通信ネットワークにおいて有望な技術であると考えられている。
人工知能(AI)は近年急速に成長し、成功している。
UAVベースのネットワークにおけるAIの潜在的な応用について概観する。
論文 参考訳(メタデータ) (2020-09-24T07:11:31Z) - On the Convergence of Artificial Intelligence and Distributed Ledger
Technology: A Scoping Review and Future Research Agenda [0.0]
人工知能(AI)とDLT(Distributed Ledger Technology)の発展は、アカデミックと実践において活発な議論を引き起こしている。
DLTは、不確実な環境で参加者のグループ間でデータに関するコンセンサスを生み出す可能性がある。
論文 参考訳(メタデータ) (2020-01-29T18:57:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。