Fugu-MT 論文翻訳(概要): A multi-language toolkit for the semi-automated checking of research outputs

論文の概要: A multi-language toolkit for the semi-automated checking of research outputs

arxiv url: http://arxiv.org/abs/2212.02935v3
Date: Tue, 26 Nov 2024 10:53:40 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-05 22:54:39.502042
Title: A multi-language toolkit for the semi-automated checking of research outputs
Title（参考訳）: 研究成果の半自動チェックのための多言語ツールキット
Authors: Richard J. Preen, Maha Albashir, Simon Davy, Jim Smith,
Abstract要約: 本稿では、セキュアなデータ環境におけるプライバシー開示のための研究出力(SACRO)の半自動チェックをサポートする、フリーでオープンソースのツールキットについて述べる。 SACROは、研究者が分析を行う際に、最も実践的な原理に基づく統計開示制御(SDC)技術を適用したフレームワークである。このツールキットは、テーブル、プロット、統計モデルなどの出力を生成するよく知られた分析ツールの上に置かれる軽量のPythonパッケージで構成されている。
参考スコア（独自算出の注目度）: 0.44998333629984877
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This article presents a free and open source toolkit that supports the semi-automated checking of research outputs (SACRO) for privacy disclosure within secure data environments. SACRO is a framework that applies best-practice principles-based statistical disclosure control (SDC) techniques on-the-fly as researchers conduct their analyses. SACRO is designed to assist human checkers rather than seeking to replace them as with current automated rules-based approaches. The toolkit is composed of a lightweight Python package that sits over well-known analysis tools that produce outputs such as tables, plots, and statistical models. This package adds functionality to (i) automatically identify potentially disclosive outputs against a range of commonly used disclosure tests; (ii) apply optional disclosure mitigation strategies as requested; (iii) report reasons for applying SDC; and (iv) produce simple summary documents trusted research environment staff can use to streamline their workflow and maintain auditable records. This creates an explicit change in the dynamics so that SDC is something done with researchers rather than to them, and enables more efficient communication with checkers. A graphical user interface supports human checkers by displaying the requested output and results of the checks in an immediately accessible format, highlighting identified issues, potential mitigation options, and tracking decisions made. The major analytical programming languages used by researchers (Python, R, and Stata) are supported by providing front-end packages that interface with the core Python back-end. Source code, packages, and documentation are available under MIT license at https://github.com/AI-SDC/ACRO
Abstract（参考訳）: 本稿では、セキュアなデータ環境におけるプライバシー開示のための研究出力(SACRO)の半自動チェックをサポートする、フリーでオープンソースのツールキットについて述べる。 SACROは、研究者が分析を行う際に、最も実践的な原理に基づく統計開示制御(SDC)技術を適用したフレームワークである。 SACROは、現在の自動ルールベースのアプローチのように、人間のチェッカーを支援するように設計されている。このツールキットは、テーブル、プロット、統計モデルなどの出力を生成するよく知られた分析ツールの上に置かれる軽量のPythonパッケージで構成されている。このパッケージには機能が追加される。 i) 一般的に使用される開示試験の範囲に対する潜在的な開示出力を自動的に識別すること。 2 任意開示緩和策を請求通りに適用すること。三) SDCの適用理由の報告及び (4)信頼性研究環境のスタッフは、ワークフローの合理化と監査可能な記録の維持に使用できる簡易な要約文書を作成する。これにより、SDCは研究者によって行われるものではなく、研究者によって行われるもので、チェッカーとのより効率的なコミュニケーションを可能にする。グラフィカルユーザインタフェースは、要求された出力とチェックの結果をすぐにアクセス可能な形式で表示し、特定された問題、潜在的な緩和オプション、決定の追跡をハイライトすることによって、ヒューマンチェッカーをサポートする。研究者(Python、R、およびSta)が使用する主要な分析プログラミング言語は、コアPythonバックエンドとインターフェースするフロントエンドパッケージを提供することでサポートされている。ソースコード、パッケージ、ドキュメントはMITライセンスでhttps://github.com/AI-SDC/ACROで入手できる。

関連論文リスト

A Browser-based Open Source Assistant for Multimodal Content Verification [5.0488681454219675]
生成的AIが生み出す偽情報や偽コンテンツは、ジャーナリストやファクトチェッカーにとって大きな課題となっている。説得技術、主観性、機械生成テキストなどの信頼性信号を検出するためのNLPモデルが多数存在する。本稿では,このギャップを埋めるために設計されたブラウザベースのツールである VerIFICATION ASSISTANT について述べる。
論文参考訳（メタデータ） (2026-03-03T10:39:32Z)
Sponge Tool Attack: Stealthy Denial-of-Efficiency against Tool-Augmented Agentic Reasoning [58.432996881401415]
最近の作業では、エージェント推論を可能にするために、外部ツールで大きな言語モデル(LLM)を拡張している。本稿では,入力プロンプトを書き換えることのみでエージェント推論を妨害するスポンジツールアタック(STA)を提案する。 STAは、意味的忠実度の高い原文からの良心的な即興的な書き直しを生成する。
論文参考訳（メタデータ） (2026-01-24T19:36:51Z)
ARETE: an R package for Automated REtrieval from TExt with large language models [0.5541644538483946]
発生データから種の発生を抽出するマシン・ツー・マシン・アプローチを提案する。 GBIFデータを用いて作成した範囲マップと100種の自動抽出マップを比較し,本手法の有用性を実証した。新たに抽出されたデータにより、既知の絶滅危惧種をマグニチュードで拡大し、過去に不規則種が発見された新しい地域を明らかにした。
論文参考訳（メタデータ） (2025-11-06T17:26:48Z)
DRBench: A Realistic Benchmark for Enterprise Deep Research [81.49694432639406]
DRBenchは、エンタープライズ環境で複雑でオープンなディープリサーチタスクでAIエージェントを評価するためのベンチマークである。セールス、サイバーセキュリティ、コンプライアンスなど10のドメインにわたる15のディープリサーチタスクをリリースしています。
論文参考訳（メタデータ） (2025-09-30T18:47:20Z)
How Can Input Reformulation Improve Tool Usage Accuracy in a Complex Dynamic Environment? A Study on $τ$-bench [58.114899897566964]
マルチターンの会話環境では、大きな言語モデル(LLM)は、一貫性のある推論とドメイン固有のポリシーへの固執にしばしば苦労する。本稿では,関連するドメインルールを付加したユーザクエリを自動的に再構成するIRMA(Input-Reformulation Multi-Agent)フレームワークを提案する。 IRMAはReAct、Function Calling、Self-Reflectionをそれぞれ16.1%、12.7%、19.1%で大きく上回っている。
論文参考訳（メタデータ） (2025-08-28T15:57:33Z)
Transforming Sensitive Documents into Quantitative Data: An AI-Based Preprocessing Toolchain for Structured and Privacy-Conscious Analysis [0.0]
大規模分析は、機密性の高い個人識別可能な情報の存在によって妨げられる。埋め込み型解析のためのテキストデータを作成するモジュラーツールチェーンを提案する。スウェーデンの裁判所判決10,842件のコーパス上で,このツールチェーンを実証した。
論文参考訳（メタデータ） (2025-07-11T11:58:36Z)
Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文参考訳（メタデータ） (2025-03-31T07:31:32Z)
GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics [9.549568621873386]
GateLensはAlgebraベースのツールで、自動車分野のデータセットを分析する。高いF1スコアを達成し、より堅牢な複雑で曖昧なクエリを処理する。高い精度と信頼性を維持しながら、分析時間を80%以上削減する。
論文参考訳（メタデータ） (2025-03-27T17:48:32Z)
RobPy: a Python Package for Robust Statistical Methods [1.2233362977312945]
RobPyはPythonで幅広い堅牢なメソッドを提供し、NumPy、SciPy、Scikit-learnといった既存のライブラリ上に構築されている。本稿では、RobPyパッケージの構造を示し、実例を通してその機能を実証し、その機能を他の統計ソフトウェアにおける既存の実装と比較する。
論文参考訳（メタデータ） (2024-11-04T10:27:30Z)
forester: A Tree-Based AutoML Tool in R [0.0]
ForesterはオープンソースのAutoMLパッケージで、Rで実装され、高品質なツリーベースのモデルをトレーニングする。バイナリとマルチクラスの分類、回帰、部分生存分析タスクを完全にサポートする。データ品質に関する問題を検出し、前処理パイプラインを準備し、ツリーベースのモデルのトレーニングとチューニングを行い、結果を評価し、さらなる分析のためにレポートを作成することができる。
論文参考訳（メタデータ） (2024-09-07T10:39:10Z)
DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文参考訳（メタデータ） (2024-07-01T18:58:22Z)
Are you still on track!? Catching LLM Task Drift with Activations [55.75645403965326]
タスクドリフトは攻撃者がデータを流出させたり、LLMの出力に影響を与えたりすることを可能にする。そこで, 簡易線形分類器は, 分布外テストセット上で, ほぼ完全なLOC AUCでドリフトを検出することができることを示す。このアプローチは、プロンプトインジェクション、ジェイルブレイク、悪意のある指示など、目に見えないタスクドメインに対して驚くほどうまく一般化する。
論文参考訳（メタデータ） (2024-06-02T16:53:21Z)
Quantitative Assurance and Synthesis of Controllers from Activity Diagrams [4.419843514606336]
確率的モデル検査は、定性的および定量的な性質を自動検証するために広く用いられている形式的検証手法である。これにより、必要な知識を持っていない研究者やエンジニアにはアクセスできない。本稿では,確率時間の新しいプロファイル,品質アノテーション,3つのマルコフモデルにおけるADの意味論的解釈,アクティビティ図からPRISM言語への変換ルールのセットなど,ADの総合的な検証フレームワークを提案する。最も重要なことは、モデルをベースとした手法を用いて、完全自動検証のための変換アルゴリズムを開発し、QASCADと呼ばれるツールで実装したことです。
論文参考訳（メタデータ） (2024-02-29T22:40:39Z)
A Semi-Automated Solution Approach Recommender for a Given Use Case: a Case Study for AI/ML in Oncology via Scopus and OpenAI [0.6749750044497732]
提案するツールであるSARBOLD-LLMは,与えられた問題に関連するメソッドの発見と選択を可能にする。意思決定の洞察を導き出すために、文学における彼らの使用に関する追加情報を提供する。調査を最初に行う方法を選択し、調査を補完する上で有用なツールである。
論文参考訳（メタデータ） (2023-07-10T14:07:28Z)
Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文参考訳（メタデータ） (2023-07-05T20:16:20Z)
Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文参考訳（メタデータ） (2023-06-12T17:56:01Z)
Methodology to Create Analysis-Naive Holdout Records as well as Train and Test Records for Machine Learning Analyses in Healthcare [0.0]
ホルトアウトサンプルの目的は、全データセットから分析的かつランダムに選択される研究研究のためのデータを保存することである。ホールドアウトを作成するための方法論は、ランダム化を考慮し、3方向分割を効率的に行うk倍のクロスバリデーションの修正である。
論文参考訳（メタデータ） (2022-05-09T00:51:08Z)
Autoregressive Search Engines: Generating Substrings as Document Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文参考訳（メタデータ） (2022-04-22T10:45:01Z)
PyODDS: An End-to-end Outlier Detection System with Automated Machine Learning [55.32009000204512]
PyODDSは、データベースサポート付きアウトレイラ検出のための、エンドツーエンドのPythonシステムである。具体的には,探索空間を外乱検出パイプラインで定義し,与えられた探索空間内で探索戦略を作成する。また、データサイエンスや機械学習のバックグラウンドの有無に関わらず、統一されたインターフェイスと視覚化を提供する。
論文参考訳（メタデータ） (2020-03-12T03:30:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。