論文の概要: Deterministic Preprocessing and Interpretable Fuzzy Banding for Cost-per-Student Reporting from Extracted Records
- arxiv url: http://arxiv.org/abs/2603.04905v1
- Date: Thu, 05 Mar 2026 07:47:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.128252
- Title: Deterministic Preprocessing and Interpretable Fuzzy Banding for Cost-per-Student Reporting from Extracted Records
- Title(参考訳): 抽出記録からの費用対コストレポートのための決定論的前処理と解釈可能なファジィバンド
- Authors: Shane Lee, Stella Ng,
- Abstract要約: 決定論的でルールに依存したファイルベースのワークフローはcad_processor.pyで実装されている。
このスクリプトは、Casual Academic Database (CAD)エクスポートワークブックを取り込み、コストと学生の総計を、主観年数と学年数に集約する。
プロセッシング・サマリー(ラン・レコードとカウンタ)、トレンド・アナリティクス(学年毎学費マトリックス)、レポート(全体主観レベルテーブル)、ファジィ・バンド(年間アンカー、会員重量、バンドレーベル)の4枚からなる加工ワークブックを執筆している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Administrative extracts are often exchanged as spreadsheets and may be read as reports in their own right during budgeting, workload review, and governance discussions. When an exported workbook becomes the reference snapshot for such decisions, the transformation can be checked by recomputation against a clearly identified input. A deterministic, rule-governed, file-based workflow is implemented in cad_processor.py. The script ingests a Casual Academic Database (CAD) export workbook and aggregates inclusive on-costs and student counts into subject-year and school-year totals, from which it derives cost-per-student ratios. It writes a processed workbook with four sheets: Processing Summary (run record and counters), Trend Analysis (schoolyear cost-per-student matrix), Report (wide subject-level table), and Fuzzy Bands (per-year anchors, membership weights, and band labels). The run record includes a SHA-256 hash of the input workbook bytes to support snapshot-matched recomputation. For within-year interpretation, the workflow adds a simple fuzzy banding layer that labels finite, positive school-year cost-per-student values as Low, Medium, or High. The per-year anchors are the minimum, median, and maximum of the finite, positive ratios. Membership weights are computed using left-shoulder, triangular, and right-shoulder functions, with deterministic tie-breaking in a fixed priority order (Medium, then Low, then High). These weights are treated as decision-support signals rather than probabilities. A worked example provides a reproducible calculation of a band assignment from the reported anchors and ratios. Supplementary material includes a claim-to-evidence matrix, a reproducibility note, and a short glossary that links selected statements to code and workbook artefacts.
- Abstract(参考訳): 管理的抽出は、しばしばスプレッドシートとして交換され、予算、ワークロードのレビュー、ガバナンスの議論の間、自分自身でレポートとして読むことができる。
エクスポートされたワークブックがそのような決定の参照スナップショットとなると、その変換は、明確に識別された入力に対する再計算によってチェックできる。
決定論的でルールに依存したファイルベースのワークフローはcad_processor.pyで実装されている。
このスクリプトは、カジュアル・アカデミック・データベース(CAD)の輸出ワークブックを取り込み、コストと学生の総計を主観年数と学年数に集約し、学生一人当たりのコスト比を導出する。
プロセッシング・サマリー(ラン・レコードとカウンタ)、トレンド・アナリティクス(学年毎学費マトリックス)、レポート(全体主観レベルテーブル)、ファジィ・バンド(年間アンカー、会員重量、バンドレーベル)の4つのシートからなる加工ワークブックを執筆している。
実行レコードには、スナップショットマッチング再計算をサポートする入力ワークブックバイトのSHA-256ハッシュが含まれている。
年内に解釈するために、ワークフローは単純なファジィなバンドリング層を追加し、有限でポジティブな学年ごとのコストを低、中、高とラベル付けする。
1年あたりのアンカーは、有限、正の比率の最小、中央、最大である。
メンバシップウェイトは、固定された優先度順序(Medium, then Low, then High)で決定論的タイブレーキングを持つ左shoulder, triangular, and right-shoulder関数を用いて計算される。
これらの重みは確率よりも決定支援信号として扱われる。
動作する例は、報告されたアンカーと比率からバンド割り当ての再現可能な計算を提供する。
補足資料には、クレーム・トゥ・エビデンス・マトリックス、再現性ノート、コードやワークブックのアーティファクトに選択されたステートメントをリンクする短い用語集が含まれる。
関連論文リスト
- Quantifying Memory Use in Reinforcement Learning with Temporal Range [51.98491034847041]
時間的範囲(Temporal Range)は、時間的影響プロファイルとして、時間的ウィンドウから入力シーケンスへの複数のベクトル出力の1次感度を扱うモデルに依存しない計量である。
また、タスクレベルメモリのプロキシ読み出しとして、タスク上で訓練されたコンパクトなLong Expressive Memory(LEM)ポリシーについて、テンポラルレンジを報告する。
論文 参考訳(メタデータ) (2025-12-05T22:58:09Z) - Spatial ModernBERT: Spatial-Aware Transformer for Table and Key-Value Extraction in Financial Documents at Scale [0.5062312533373298]
空間埋め込みを付加したトランスモデルであるSpatial ModernBERTを導入する。
監査、データ分析、自動請求処理といった業務には、財務文書からテーブルとキー-バリューペアを抽出することが不可欠である。
論文 参考訳(メタデータ) (2025-07-09T14:40:40Z) - The Power of Summary-Source Alignments [62.76959473193149]
多文書要約(MDS)は難しい課題であり、しばしばサリエンスと冗長性検出のサブタスクに分解される。
参照要約とそのソース文書間の対応する文のアライメントを利用して、トレーニングデータを生成する。
本稿では,よりきめ細かな提案スパンレベルで適用することで,要約ソースアライメントフレームワークを拡張することを提案する。
論文 参考訳(メタデータ) (2024-06-02T19:35:19Z) - Relation Extraction as Open-book Examination: Retrieval-enhanced Prompt
Tuning [109.7767515627765]
本稿では,関係抽出のための新たな半パラメトリックなプロンプトチューニング手法を提案する。
我々のモデルは、トレーニング中に重みに格納された知識を通して関係を推測する。
本手法は,標準的な教師付き設定と少数ショット設定の両方で最先端を実現することができる。
論文 参考訳(メタデータ) (2022-05-04T23:38:37Z) - Does Recommend-Revise Produce Reliable Annotations? An Analysis on
Missing Instances in DocRED [60.39125850987604]
テキスト修正方式は, 偽陰性サンプルと, 人気エンティティや関係性に対する明らかな偏見をもたらすことを示す。
より信頼性の高いドキュメントREモデルのテストセットとして機能するように、relabeledデータセットがリリースされている。
論文 参考訳(メタデータ) (2022-04-17T11:29:01Z) - Using Self-Supervised Pretext Tasks for Active Learning [7.214674613451605]
本稿では,自己教師付きプレテキストタスクとユニークなデータサンプリング機能を利用して,困難かつ代表的なデータを選択する,新しいアクティブラーニング手法を提案する。
プレテキストタスク学習者は、未ラベルのセットでトレーニングされ、未ラベルのデータは、そのプレテキストタスクの損失によって、バッチにソートされ、グループ化される。
各イテレーションでは、メインタスクモデルを使用して、アノテートされるバッチで最も不確実なデータをサンプリングする。
論文 参考訳(メタデータ) (2022-01-19T07:58:06Z) - Truth Discovery in Sequence Labels from Crowds [12.181422057560201]
Amazon Mechanical Turk (AMT)のようなクラウドソーシングプラットフォームは、この目的のためにデプロイされている。
アノテーションアグリゲーションにおける既存の文献は、アノテーションは独立しており、シーケンシャルなラベルアグリゲーションタスクを扱う際の課題に直面していると仮定している。
逐次ラベリングタスクにおいて,作業者が提供するアノテーションを用いて,真理ラベルを推測する最適化手法を提案する。
論文 参考訳(メタデータ) (2021-09-09T19:12:13Z) - How to distribute data across tasks for meta-learning? [59.608652082495624]
タスクごとのデータポイントの最適な数は予算に依存しますが、それは大きな予算のためのユニークな一定の値に収束します。
この結果から,データ収集の簡便かつ効率的な手順が示唆された。
論文 参考訳(メタデータ) (2021-03-15T15:38:47Z) - Leverage Unlabeled Data for Abstractive Speech Summarization with
Self-Supervised Learning and Back-Summarization [6.465251961564605]
神経抽象的要約のための改良されたアプローチは、構築にコストがかかる大きな注釈付きコーパスを必要とする。
本稿では,ミーティング音声記録の自動書き起こしに基づいて,レポートが予測される,フランスの会議要約タスクを提案する。
本報告では,2つの評価セットの両アプローチのベースラインに対して,以前のベースラインと比較して大きな改善点を報告した。
論文 参考訳(メタデータ) (2020-07-30T08:22:47Z) - Structured Prediction with Partial Labelling through the Infimum Loss [85.4940853372503]
弱い監督の目標は、収集コストの安いラベル付け形式のみを使用してモデルを学習できるようにすることである。
これは、各データポイントに対して、実際のものを含むラベルのセットとして、監督がキャストされる不完全なアノテーションの一種です。
本稿では、構造化された予測と、部分的なラベリングを扱うための無限損失の概念に基づく統一的なフレームワークを提供する。
論文 参考訳(メタデータ) (2020-03-02T13:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。