論文の概要: Correlation Is Not Enough: Embedding Human Metadata for Individual Causal Discovery
- arxiv url: http://arxiv.org/abs/2606.09672v1
- Date: Mon, 08 Jun 2026 15:54:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:07.488432
- Title: Correlation Is Not Enough: Embedding Human Metadata for Individual Causal Discovery
- Title(参考訳): 個人の因果発見に人間のメタデータを埋め込むのは、相関ではない
- Authors: Suraj Biswas, Saurabh Gupta, Pritam Mukherjee,
- Abstract要約: オフザシェルフのバイオメディカルエンコーダは、答えがゼロに近い場合、無関係なクロスドメインペアをスコアする。
AMXを搭載したIntel Xeon 6737Pでは、OpenVINOはシングルクエリのレイテンシを1367msから10ms (133x)に削減し、毎秒555文に達する。
FP16は、各サービスバッチサイズにおいて、このシリコン上のINT8を破る。
- 参考スコア(独自算出の注目度): 6.037612853769194
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ask a pretrained biomedical language model whether "cortisol 28 ug/dL" and "stock-market volatility" are related, and it returns a cosine similarity of 0.83 on a scale where 1.0 means identical. The two share no mechanism. This is not a corner case: every off-the-shelf biomedical encoder we tested (BioBERT, PubMedBERT, BioM-ELECTRA) scores unrelated cross-domain pairs between 0.76 and 0.92 when the answer should be near zero. Accuracy on cross-domain discrimination is 0%. Retrieval systems survive this, because a language model downstream filters the noise. A Large Behavioural Model (LBM), a foundation model whose subject is a person rather than a sentence, does not: it reasons over a graph of a user's life and treats embedding proximity as evidence that two events are causally linked. False proximity writes a false causal edge, and everything downstream inherits the error. Here, embedding geometry is not a tuning knob; it is correctness. We report the fix. A contrastive pass over 72,034 pairs raises PubMedBERT BIOSSES correlation from 0.633 to 0.828 and within-vs-across-domain separation from 1.05x to 1.63x. A second pass, BODHI, mines hard negatives from edges absent in a biomedical knowledge graph and lifts separation to 2.30x and the discrimination gap to +0.392, at a 4.5% BIOSSES cost. On an Intel Xeon 6737P with AMX, OpenVINO cuts single-query latency from 1367 ms to 10 ms (133x) and reaches 555 sentences/sec. One finding contradicts standard advice: FP16 beats INT8 on this silicon at every serving batch size, and we explain why. The same model on a no-AMX Ice Lake instance runs 13-27x slower. We release the benchmark suite, training corpora, the BODHI generator, and the OpenVINO scripts.
- Abstract(参考訳): コルチゾール28 ug/dL" と "ストックマーケットのボラティリティ" が関連しているかどうかを事前訓練されたバイオメディカル言語モデルに問うと、1.0 が同一の尺度でコサイン類似度 0.83 を返す。
2人はメカニズムを共有しません。
BioBERT, PubMedBERT, BioM-ELECTRA) は、解答が0に近い場合、0.76から0.92の間の無関係なクロスドメイン対をスコアする。
クロスドメイン識別の精度は0%である。
言語モデルがノイズをフィルタするので、検索システムはこれを生き残る。
LBM(Large Behavioural Model, 大規模行動モデル)は、対象が文ではなく人である基礎モデルであり、ユーザの生活のグラフに理由を置いて、2つの事象が因果的にリンクされているという証拠として、埋め込み近接を扱います。
粗悪な近接性は誤った因果エッジを書き、下流のすべてがエラーを継承する。
ここで、埋め込み幾何学はチューニングノブではなく、正確性である。
私たちはその修正を報告します。
72,034対を超える対照的なパスはPubMedBERT BIOSSES相関を 0.633 から 0.828 に引き上げ、vs-アクロス領域を 1.05x から 1.63x に分離する。
第2のパスであるBODHIは、バイオメディカル知識グラフにないエッジからハードネガティブをマイニングし、分離を2.30倍に、識別ギャップを+0.392に、BIOSSESの4.5%のコストで引き上げる。
AMXを搭載したIntel Xeon 6737Pでは、OpenVINOはシングルクエリのレイテンシを1367msから10ms (133x)に削減し、毎秒555文に達する。
FP16は、このシリコン上のINT8をバッチサイズごとに上回り、その理由を説明します。
AMXでないIce Lakeインスタンス上の同じモデルは、13-27倍遅く動作する。
ベンチマークスイート,コーパスのトレーニング,BODHIジェネレータ,OpenVINOスクリプトをリリースする。
関連論文リスト
- Reliable Extraction of Clinical Follow-Up Instructions: A Hybrid Neural-Symbolic Pipeline [43.0484058393522]
我々は,ニューラルシンボリックなハイブリッドパイプラインを直接生成に対して試験する。
本研究は,2000点の合成外用コーパスについて検討した。
論文 参考訳(メタデータ) (2026-05-26T05:14:33Z) - Amplifying, Not Learning: Fine-Tuned AI Text Detectors Amplify a Pretrained Direction [51.56484100374058]
テキスト検出器は、事前訓練された典型軸を増幅する。
タスク監督前の生エンコーダでは、3つのアーキテクチャでNYT-vs-HC3 AUROC 0.806/0.944/0.834を達成する。
RoBERTaベースでは、生のプロジェクションは微調整を超えるが、RoBERTaベースでは、フル微調整は、試験された流線型人口の双方で生よりも識別を小さくする。
論文 参考訳(メタデータ) (2026-05-20T19:08:38Z) - Lying Is Just a Phase: The Hidden Alignment Transition in Language Model Scaling [0.0]
16家系の63塩基モデルにおける推論と真理の結合度を測定した。
我々は、家族依存の臨界スケール(N_c$)以下の損失曲線を目に見えない体制変化を発見し、その上、彼らは協力する。
論文 参考訳(メタデータ) (2026-05-13T03:14:09Z) - The Geometry of Forgetting: Temporal Knowledge Drift as an Independent Axis in LLM Representations [50.43168858368539]
大規模言語モデルは自信を持って時代遅れの回答を生成し、既存の方法では検出できない。
これは工学的な失敗ではなく構造的な失敗であり、時間的ドリフトは、幾何的に残留流の方向として、正確性と不確実性の両方に符号化される。
論文 参考訳(メタデータ) (2026-05-09T22:27:31Z) - HEOM-in-Calibration-Loop: Exposing Non-Markovian Bath Signatures That Markovian Calibration Elides in Superconducting-Qubit Tune-Up [2.3774562616857717]
我々は、Tier-1/f Burkardバスで駆動されるQuTiP 5.x階層型運動方程式をマルチプロトコールキャリブレーションDAGに統合する。
パルスレベルシミュレータの凍結プラットフォーム上で, セゾルデとメゾルデとを比較した。
論文 参考訳(メタデータ) (2026-04-23T09:15:13Z) - Sparse Regression under Correlation and Weak Signals: A Reproducible Benchmark of Classical and Bayesian Methods [1.6679662639178268]
合成データに対する6つのスパース回帰法をベンチマークした。
ベイズ法は予測誤差(MSE 72 vs. 108-267)で勝利し、ホースシューは95%近くをカバーしている(94.8%)。
可変選択の場合、F1 0.47のラッソとスパイク・アンド・スラブのネクタイは、後部が不要な場合に事実上のデフォルトとなる。
論文 参考訳(メタデータ) (2026-04-04T15:46:44Z) - PRISM: Differentiable Analysis-by-Synthesis for Fixel Recovery in Diffusion MRI [1.3063136334195184]
この研究は、多部構成のフォワードモデルとエンドツーエンドの脳脊髄モデルに適合する、微分可能な分析バイシンセシスフレームワークを紹介します。
PRISMは高速MSE目標と情報無しで共同で学習するリッチ陰性対数類似度(NLL)をサポートする。
PRISMは、95%のリコールが最良基準線よりも1.9倍低い3.5度の角誤差を達成している。
論文 参考訳(メタデータ) (2026-03-31T21:22:49Z) - HyFormer-Net: A Synergistic CNN-Transformer with Interpretable Multi-Scale Fusion for Breast Lesion Segmentation and Classification in Ultrasound Images [0.0]
HyFormer-Netは、本質的に解釈可能な同時セグメンテーションと分類のためのハイブリッドCNN変換器である。
BUSIデータセットでは、HyFormer-NetがDice Score 0.761 +/-0.072と精度93.2%を獲得し、U-Net、Attention U-Net、TransUNetを上回っている。
乳房超音波におけるハイブリッドCNN変換器のクロスデータセット一般化研究を初めて行った。
論文 参考訳(メタデータ) (2025-11-02T17:06:12Z) - Impact of Labeling Inaccuracy and Image Noise on Tooth Segmentation in Panoramic Radiographs using Federated, Centralized and Local Learning [46.232038247686745]
フェデレートラーニング(FL)は、歯科診断AIにおけるプライバシー制約、不均一なデータ品質、一貫性のないラベル付けを緩和する。
複数のデータ破損シナリオを対象としたパノラマX線撮影において,FLと集中学習(CL)と局所学習(LL)を比較した。
論文 参考訳(メタデータ) (2025-09-08T11:07:47Z) - Predicting Survival Time of Ball Bearings in the Presence of Censoring [44.99833362998488]
本研究では,ボール軸受の故障時期を生存解析を用いて予測する新しい手法を提案する。
我々は、周波数領域におけるベアリングデータを解析し、Kullback-Leiblerの発散と標準偏差を比較することで、ベアリングが故障した場合にアノテートする。
我々は、注釈付きデータに基づいて失敗する時間を推定するために、いくつかの生存モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T08:30:31Z) - MSED: a multi-modal sleep event detection model for clinical sleep
analysis [62.997667081978825]
ポリソムノグラムで睡眠イベントを共同検出する,単一のディープニューラルネットワークアーキテクチャを設計した。
モデルの性能は,F1,精度,リコールスコア,および指標値と臨床値との相関で定量化した。
論文 参考訳(メタデータ) (2021-01-07T13:08:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。