論文の概要: CaTE Data Curation for Trustworthy AI
- arxiv url: http://arxiv.org/abs/2508.14741v1
- Date: Wed, 20 Aug 2025 14:40:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.483175
- Title: CaTE Data Curation for Trustworthy AI
- Title(参考訳): 信頼できるAIのためのCaTEデータキュレーション
- Authors: Mary Versa Clemens-Sewall, Christopher Cervantes, Emma Rafkin, J. Neil Otte, Tom Magelinski, Libby Lewis, Michelle Liu, Dana Udwin, Monique Kirkman-Bey,
- Abstract要約: このレポートは、AI対応システムを設計または開発するチームにガイダンスを提供する。
開発チームが信頼できるAI対応システムを構築するための一連のステップについて説明する。
これらのステップの説明には、強み、弱点、前提条件、結果、関連するオープンソースソフトウェアツールの実装が含まれる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This report provides practical guidance to teams designing or developing AI-enabled systems for how to promote trustworthiness during the data curation phase of development. In this report, the authors first define data, the data curation phase, and trustworthiness. We then describe a series of steps that the development team, especially data scientists, can take to build a trustworthy AI-enabled system. We enumerate the sequence of core steps and trace parallel paths where alternatives exist. The descriptions of these steps include strengths, weaknesses, preconditions, outcomes, and relevant open-source software tool implementations. In total, this report is a synthesis of data curation tools and approaches from relevant academic literature, and our goal is to equip readers with a diverse yet coherent set of practices for improving AI trustworthiness.
- Abstract(参考訳): 本報告は,AIを活用したシステムの設計や開発を行うチームに対して,データキュレーションフェーズにおける信頼性向上のための実践的なガイダンスを提供する。
このレポートでは、まずデータ、データキュレーションフェーズ、信頼性を定義します。
次に、開発チーム、特にデータサイエンティストが信頼できるAI対応システムを構築するための一連のステップを説明します。
代替手段が存在するコアステップとトレース並列パスのシーケンスを列挙する。
これらのステップの説明には、強み、弱点、前提条件、結果、関連するオープンソースソフトウェアツールの実装が含まれる。
このレポートは、関連する学術文献からデータキュレーションツールとアプローチを総合的に合成するものであり、私たちの目標は、AIの信頼性を改善するための、多種多様な一貫性のあるプラクティスを読者に提供することです。
関連論文リスト
- Towards Agentic Intelligence for Materials Science [73.4576385477731]
この調査は、コーパスキュレーションからプレトレーニングから、シミュレーションと実験プラットフォームに面した目標条件付きエージェントまで、ユニークなパイプライン中心の視点を推し進める。
コミュニティをブリッジし、参照の共有フレームを確立するために、まず、AIと材料科学をまたいだ用語、評価、ワークフローの段階を整列する統合レンズを提示する。
論文 参考訳(メタデータ) (2026-01-29T23:48:43Z) - Enhancing Transparency and Traceability in Healthcare AI: The AI Product Passport [0.8341070049162322]
AI Product Passportは、心不全AIツールに焦点を当てたAI4HFプロジェクト内で開発された。
我々は、メタデータをキャプチャするリレーショナルデータモデルを設計するために、規制フレームワーク(EU AI Act, FDAガイドライン)と既存の標準を分析した。
オープンソースのプラットフォームは、自動証明追跡のためにPythonライブラリで実装されている。
論文 参考訳(メタデータ) (2025-12-04T08:35:22Z) - What's the next frontier for Data-centric AI? Data Savvy Agents [71.76058707995398]
我々は、エージェントシステムの設計において、データに精通する能力が最優先すべきであると主張している。
本稿では,このビジョンを実現するための4つの重要な機能を提案する。プロアクティブデータ取得,ソフシフィケートデータ処理,インタラクティブテストデータ合成,連続的適応。
論文 参考訳(メタデータ) (2025-11-02T17:09:29Z) - Standards in the Preparation of Biomedical Research Metadata: A Bridge2AI Perspective [1.0389904886733017]
Bridge2AIは、データセットがAI対応をレンダリングするために必要な基準を定義した。
これらの基準には、FAIRness、profance、キャラクタリゼーションの度合い、説明可能性、持続可能性、計算可能性が含まれる。
本報告は,Bridge2AIグランドチャレンジにおけるメタデータ作成と標準化の状況を評価する。
論文 参考訳(メタデータ) (2025-09-12T17:38:46Z) - CoCoNUTS: Concentrating on Content while Neglecting Uninformative Textual Styles for AI-Generated Peer Review Detection [60.52240468810558]
我々は、AI生成ピアレビューの詳細なデータセットの上に構築されたコンテンツ指向ベンチマークであるCoCoNUTSを紹介する。
また、マルチタスク学習フレームワークを介してAIレビュー検出を行うCoCoDetを開発し、レビューコンテンツにおけるAIのより正確で堅牢な検出を実現する。
論文 参考訳(メタデータ) (2025-08-28T06:03:11Z) - Graphs Meet AI Agents: Taxonomy, Progress, and Future Opportunities [117.49715661395294]
データ構造化は、複雑で非組織的なデータをよく構造化された形式に変換することで、有望な役割を果たす。
この調査では、グラフがAIエージェントにどのように権限を与えるかを、初めて体系的にレビューする。
論文 参考訳(メタデータ) (2025-06-22T12:59:12Z) - Bridging the Data Gap in AI Reliability Research and Establishing DR-AIR, a Comprehensive Data Repository for AI Reliability [4.769924694900377]
AI信頼性の研究における大きな課題は、特に学界の人々にとって、利用可能なAI信頼性データが不足していることである。
本稿では、利用可能なAI信頼性データの総合的なレビューを行い、AI信頼性データのためのデータレポジトリであるDR-AIRを確立する。
論文 参考訳(メタデータ) (2025-02-17T23:50:36Z) - Survey and Taxonomy: The Role of Data-Centric AI in Transformer-Based Time Series Forecasting [36.31269406067809]
データ中心のAIは、AIモデルのトレーニング、特にトランスフォーマーベースのTSFモデルの効率的なトレーニングに不可欠である、と私たちは主張する。
我々は、データ中心のAIの観点から、これまでの研究成果をレビューし、トランスフォーマーベースのアーキテクチャとデータ中心のAIの将来の開発のための基礎的な作業を行うつもりです。
論文 参考訳(メタデータ) (2024-07-29T08:27:21Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - Data-centric Artificial Intelligence: A Survey [47.24049907785989]
近年、AIにおけるデータの役割は大幅に拡大し、データ中心AIという新たな概念が生まれた。
本稿では,データ中心型AIの必要性について論じ,続いて3つの一般的なデータ中心型目標の全体像を考察する。
これは、データライフサイクルのさまざまな段階にわたるタスクのグローバルなビューを提供する、初めての総合的な調査である、と私たちは信じています。
論文 参考訳(メタデータ) (2023-03-17T17:44:56Z) - DC-Check: A Data-Centric AI checklist to guide the development of
reliable machine learning systems [81.21462458089142]
データ中心のAIは、信頼できるエンドツーエンドパイプラインを可能にする統一パラダイムとして登場しています。
データ中心の考慮事項を抽出する実行可能なチェックリストスタイルのフレームワークであるDC-Checkを提案する。
この開発におけるデータ中心のレンズは、システム開発に先立って思考力と透明性を促進することを目的としている。
論文 参考訳(メタデータ) (2022-11-09T17:32:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。