論文の概要: Surrogate Representation Inference for Noisy Text and Image Annotations
- arxiv url: http://arxiv.org/abs/2509.12416v1
- Date: Mon, 15 Sep 2025 20:09:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:52.749282
- Title: Surrogate Representation Inference for Noisy Text and Image Annotations
- Title(参考訳): ノイズのあるテキストと画像アノテーションに対する代理表現推論
- Authors: Kentaro Nakamura,
- Abstract要約: 代理表現推論(Surrogate Representation Inference)は、構造化されていないデータが人間のアノテーションと構造化変数の関係を完全に仲介していると仮定する。
複数の人間のアノテーションが利用できる場合、SRIは人間のアノテーションに存在する可能性のある非微分測定誤差をさらに補正することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As researchers increasingly rely on machine learning models and LLMs to annotate unstructured data, such as texts or images, various approaches have been proposed to correct bias in downstream statistical analysis. However, existing methods tend to yield large standard errors and require some error-free human annotation. In this paper, I introduce Surrogate Representation Inference (SRI), which assumes that unstructured data fully mediate the relationship between human annotations and structured variables. The assumption is guaranteed by design provided that human coders rely only on unstructured data for annotation. Under this setting, I propose a neural network architecture that learns a low-dimensional representation of unstructured data such that the surrogate assumption remains to be satisfied. When multiple human annotations are available, SRI can further correct non-differential measurement errors that may exist in human annotations. Focusing on text-as-outcome settings, I formally establish the identification conditions and semiparametric efficient estimation strategies that enable learning and leveraging such a low-dimensional representation. Simulation studies and a real-world application demonstrate that SRI reduces standard errors by over 50% when machine learning prediction accuracy is moderate and provides valid inference even when human annotations contain non-differential measurement errors.
- Abstract(参考訳): 研究者たちは、テキストや画像などの非構造化データの注釈付けに機械学習モデルやLLMをますます頼りにしているため、下流統計分析のバイアスを正すために様々なアプローチが提案されている。
しかし、既存のメソッドは大きな標準エラーを発生させる傾向があり、エラーのない人間のアノテーションが必要になる。
本稿では、非構造化データが人間のアノテーションと構造化変数の関係を完全に仲介していると仮定するサロゲート表現推論(SRI)を導入する。
この仮定は、人間のコーダーがアノテーションのために構造化されていないデータのみに依存するという設計によって保証される。
本稿では,非構造データの低次元表現を学習し,サロゲート仮定を満足させるニューラルネットワークアーキテクチャを提案する。
複数の人間のアノテーションが利用できる場合、SRIは人間のアノテーションに存在する可能性のある非微分測定誤差をさらに補正することができる。
テキスト・アズ・アウトのセッティングに着目し,このような低次元表現の学習と活用を可能にする識別条件と半パラメトリック・効率的な評価戦略を正式に確立する。
シミュレーション研究と実世界の応用により、機械学習予測精度が適度である場合、SRIは標準誤差を50%以上削減し、人間のアノテーションが非微分測定誤差を含む場合でも有効な推論を提供することを示した。
関連論文リスト
- Deceptive Risk Minimization: Out-of-Distribution Generalization by Deceiving Distribution Shift Detectors [13.676316138121395]
本稿では,分布外一般化のメカニズムとしての偽造を提案する。
トレーニングデータを独立して、観測者に同一に配布するデータ表現を学習することにより、突発的な相関を排除した安定した特徴を識別できる。
論文 参考訳(メタデータ) (2025-09-15T16:11:55Z) - A Unifying Framework for Robust and Efficient Inference with Unstructured Data [2.07180164747172]
本稿では、非構造化データから導出されるパラメータの効率的な推論を行うための一般的な枠組みを提案する。
提案手法は,既存の推論手法を統一し拡張するフレームワークであるMAR-Sで定式化する。
このフレームワーク内では、記述的および因果推定の両方のための堅牢で効率的な推定器を開発する。
論文 参考訳(メタデータ) (2025-05-01T04:11:25Z) - Boosting Semi-Supervised Scene Text Recognition via Viewing and Summarizing [71.29488677105127]
既存のシーンテキスト認識(STR)手法は、特に芸術的で歪んだ文字に対して、挑戦的なテキストを認識するのに苦労している。
人的コストを伴わずに、合成データと実際のラベルなしデータを活用して、対照的な学習ベースのSTRフレームワークを提案する。
本手法は,共通ベンチマークとUnion14M-Benchmarkで平均精度94.7%,70.9%のSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-11-23T15:24:47Z) - Leveraging Variational Autoencoders for Parameterized MMSE Estimation [10.141454378473972]
条件付き線形最小二乗誤差推定器のパラメータ化のための変分オートエンコーダに基づくフレームワークを提案する。
導出した推定器は、推定問題の生成前として変分オートエンコーダを用いて最小平均2乗誤差推定器を近似する。
提案手法と最小平均二乗誤差推定器の差分を限定して厳密な解析を行う。
論文 参考訳(メタデータ) (2023-07-11T15:41:34Z) - Bring Your Own Data! Self-Supervised Evaluation for Large Language
Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。
閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。
自己監督評価と人監督評価との間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-06-23T17:59:09Z) - Towards Fine-Grained Information: Identifying the Type and Location of
Translation Errors [80.22825549235556]
既存のアプローチでは、エラーの位置と型を同期的に考慮することはできない。
我々はtextbf の追加と textbfomission エラーを予測するために FG-TED モデルを構築した。
実験により,本モデルではエラータイプと位置の同時同定が可能であり,最先端の結果が得られた。
論文 参考訳(メタデータ) (2023-02-17T16:20:33Z) - Debiasing Vision-Language Models via Biased Prompts [79.04467131711775]
本稿では,テキスト埋め込みにおけるバイアスのある方向を投影することで,視覚言語基盤モデルを疎外する一般的な手法を提案する。
偏平投影行列を組み込んだテキストのみをデバイアスすることで、ロバストな分類器と公正な生成モデルが得られることを示す。
論文 参考訳(メタデータ) (2023-01-31T20:09:33Z) - ASR in German: A Detailed Error Analysis [0.0]
この研究は、ドイツ語で事前訓練されたASRモデルアーキテクチャの選択を示し、様々なテストデータセットのベンチマークで評価する。
クロスアーキテクチャの予測エラーを特定し、それらをカテゴリに分類し、カテゴリ毎のエラーソースをトレーニングデータにトレースする。
論文 参考訳(メタデータ) (2022-04-12T08:25:01Z) - A Correspondence Variational Autoencoder for Unsupervised Acoustic Word
Embeddings [50.524054820564395]
そこで本稿では,変数分割音声セグメントを固定次元表現にマッピングするための教師なしモデルを提案する。
結果として得られる音響単語の埋め込みは、低リソース言語とゼロリソース言語のための検索、発見、インデックスシステムの基礎を形成することができる。
論文 参考訳(メタデータ) (2020-12-03T19:24:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。