ATLAS: A High-Difficulty, Multidisciplinary Benchmark for Frontier Scientific Reasoning [118.5] ATLASは、約800のオリジナルの問題からなる大規模で、高精度で、学際横断的な評価スイートである。
主な特徴は次のとおりである。 テストデータの漏洩を防ぐために新しく作成されたり、実質的に適応されたすべての質問を含む、高いオリジン性と汚染抵抗。
先行モデルに関する予備的な結果は、ATLASが先進的な科学的推論能力の差別化に有効であることを証明している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:13:06 GMT)
MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling [115.7] MiroThinkerは、ツール拡張推論と情報検索機能を向上させるために設計されたオープンソースの研究エージェントである。
モデルサイズやコンテキスト長のみをスケールアップする以前のエージェントとは異なり、MiroThinker氏はモデルレベルでのインタラクションスケーリングについて検討している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:45:29 GMT)
Bridging the Gap Between Bayesian Deep Learning and Ensemble Weather Forecasts [100.3] 天気予報は、大気のカオス的な性質によって根本的に挑戦されている。
ベイジアンディープラーニング(BDL)の最近の進歩は、有望だがしばしば非接続な代替手段を提供する。
気象予報のための統合型BDLフレームワークにより,これらのパラダイムを橋渡しする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:49:52 GMT)
MMaDA-Parallel: Multimodal Large Diffusion Language Models for Thinking-Aware Editing and Generation [86.8] テキストと画像の出力モダリティの両方を評価するための新しいベンチマークを提案する。
この性能劣化は、生成した推論と最終画像との整合性に強く相関する。
本稿では,テキストと画像間の双方向の連続的相互作用を可能にする並列多モード拡散フレームワークMMaDA-Parallelを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:18:34 GMT)
Learning Representation and Synergy Invariances: A Povable Framework for Generalized Multimodal Face Anti-Spoofing [85.0] 複数の視覚的モダリティを統合するマルチモーダル・フェイス・アンチ・スプーフィング(FAS)法は、目に見えないドメインにデプロイすると、より深刻なパフォーマンス劣化を被ることが多い。
これは主に、クロスドメインのマルチモーダル一般化に影響を与える2つの見落とされがちなリスクによるものである。
証明可能なフレームワーク,すなわちマルチモーダル表現と相乗的不変学習(RiSe)を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:37:06 GMT)
Zero-shot Synthetic Video Realism Enhancement via Structure-aware Denoising [83.1] 本稿では, シミュレータから合成ビデオを再レンダリングする合成ビデオリアリズムを, フォトリアリスティックな方法で拡張する手法を提案する。
本フレームワークは,合成ビデオから空間的・時間的領域の強化ビデオへの多層構造保存に重点を置いている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:06:29 GMT)
ManipShield: A Unified Framework for Image Manipulation Detection, Localization and Explanation [81.5] 画像操作検出と局所化のための大規模ベンチマークである textbfManipBench を提案する。
また,マルチモーダル大言語モデル(MLLM)に基づくオールインワンモデルであるtextbfManipShieldを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:50:17 GMT)
Reward and Guidance through Rubrics: Promoting Exploration to Improve Multi-Domain Reasoning [79.4] マルチドメイン推論のためのフレームワークである $textbfRGR-GRPO (Reward and Guidance through rubrics) を提案する。
RGR-GRPOは、代替の報酬スキームやオフラインガイダンスにのみ依存するRLメソッドよりも一貫して優れている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:39:14 GMT)
CompEvent: Complex-valued Event-RGB Fusion for Low-light Video Enhancement and Deblurring [78.2] 低照度劣化は、夜間監視や、薄暗い照明による自律走行など、アプリケーションに重大な課題をもたらす。
イベントデータとRGBフレームの全体的全プロセス融合を可能にする複雑なニューラルネットワークフレームワークであるCompEventを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:09:13 GMT)
ARC-Chapter: Structuring Hour-Long Videos into Navigable Chapters and Hierarchical Summaries [77.4] ARC-Chapterは100万以上のビデオチャプターで訓練された最初の大規模ビデオチャプターモデルである。
ASRの書き起こし、シーンテキスト、ビジュアルキャプションを、短いタイトルから長い要約まで、複数レベルのアノテーションに統一する。
F1得点は14.0%、SODA得点は11.3%で前年最多となった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:53:14 GMT)
UniGen-1.5: Enhancing Image Generation and Editing through Reward Unification in Reinforcement Learning [77.2] We present UniGen-1.5, a unified multimodal large language model (MLLM) for advanced image understand, generation and editing。
UniGenを基盤として、画像理解と生成能力を強化するために、モデルアーキテクチャとトレーニングパイプラインを包括的に強化する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:59:30 GMT)
Task Addition and Weight Disentanglement in Closed-Vocabulary Models [75.0] タスク算術は、事前学習されたテキストオープン語彙モデルを編集するための有望な方法として登場した。
本稿では,クローズドボキャブラリ画像分類モデルにおけるタスク追加について検討する。
事前学習された視覚変換器もタスク演算で編集できることがわかった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:12:21 GMT)
StreamingTalker: Audio-driven 3D Facial Animation with Autoregressive Diffusion Model [73.3] 本稿では,音声駆動型3D顔アニメーションの課題に焦点をあてる。
それは、音声入力によって駆動される現実的で同期された顔の動きを生成することを目的としている。
本稿では,ストリーミング方式で音声を処理する自己回帰拡散モデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:55:16 GMT)
UniSER: A Foundation Model for Unified Soft Effects Removal [72.6] 一つのフレームワーク内でのソフトエフェクトによる多様な劣化に対処できるUniSERを導入する。
我々の方法論は、堅牢性と一般化を保証するために、巨大な3.8Mペアデータセットのキュレーションに重点を置いている。
このシナジスティックなアプローチにより、UniSERはスペシャリストモデルとジェネラリストモデルの両方を大きく上回る。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:39:39 GMT)
Error-Driven Scene Editing for 3D Grounding in Large Language Models [71.4] 近年の3D-LLMの進歩にもかかわらず、3D環境における視覚的および空間的要素に正確に接地する言語に限られている。
この制限は、3Dリソースの不足による空間的理解よりも、言語推論に焦点を当てたトレーニングデータに起因している。
本稿では,これらのバイアスを緩和する正確な視覚的カウンターファクトを生成するための重要なメカニズムとして,3Dシーン編集を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:13:29 GMT)
Parameter Aware Mamba Model for Multi-task Dense Prediction [69.9] 本稿では,マルチタスク学習環境における高密度予測に特化して設計された,新しいデコーダベースのフレームワーク Aware Mamba Model (PAMM) を紹介する。
タスク固有のパラメータを統合および設定し、各タスクの固有の特性をキャプチャする、二重状態空間パラメータの専門家を特徴とする。
マルチディレクショナル・ヒルベルト走査法を用いて多角特徴系列を構築し、2次元データに対するシーケンスモデルの知覚能力を向上する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:48:00 GMT)
Rethinking the Encoding and Annotating of 3D Bounding Box: Corner-Aware 3D Object Detection from Point Clouds [69.8] 中心方向の回帰はLiDARベースの3Dオブジェクト検出において依然として支配的だが、基本的な不安定さに悩まされている。
本稿では,予測対象を不安定な中心から幾何学的情報的コーナーへシフトするコーナーアライン回帰を提案する。
我々は、既存の検出器に差し込むことができる、シンプルで効果的なコーナー認識検出ヘッドを設計する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:49:30 GMT)
$π^{*}_{0.6}$: a VLA That Learns From Experience [67.0] 我々は、強化学習(RL)による実世界の展開を通して、視覚言語アクション(VLA)モデルがどのように改善できるかを検討する。
本稿では,Advantage- Conditioned Policies (RECAP) を用いた汎用RL法について述べる。
フルRECAP法でトレーニングした*_0.6$モデルは、実際の家庭で洗濯物を折り畳み、箱を確実に組み立て、プロのエスプレッソマシンを使ってエスプレッソドリンクを作ることができる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:58:55 GMT)
Towards a Unified Analysis of Neural Networks in Nonparametric Instrumental Variable Regression: Optimization and Generalization [66.1] 非パラメトリックインスツルメンタル変数回帰(NPIV)における2段階最小二乗法(2SLS)アプローチのためのニューラルネットワークの最初の大域収束結果を確立する。
これは平均場ランゲヴィンダイナミクス(MFLD)を通して持ち上げられた視点を採用することで達成される。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:51:17 GMT)
CIMemories: A Compositional Benchmark for Contextual Integrity of Persistent Memory in LLMs [62.1] 大規模言語モデル(LLM)は、パーソナライゼーションとタスクパフォーマンスを向上させるために、過去のインタラクションから永続的なメモリを使用することが多い。
タスクコンテキストに基づいて,LLMがメモリからの情報フローを適切に制御するかどうかを評価するベンチマークであるCIMemoriesを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 21:51:23 GMT)
iGaussian: Real-Time Camera Pose Estimation via Feed-Forward 3D Gaussian Splatting Inversion [62.1] iGaussianは2段階のフィードフォワードフレームワークで、直接3Dガウス変換によるリアルタイムカメラポーズ推定を実現する。
NeRF Synthetic, Mip-NeRF 360, T&T+DB データセットの実験結果から, 従来の手法に比べて大幅な性能向上が得られた。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:22:22 GMT)
INC: An Indirect Neural Corrector for Auto-Regressive Hybrid PDE Solvers [61.8] 本稿では,学習した補正を支配方程式に統合する間接ニューラルコレクタ(mathrmINC$)を提案する。
$mathrmINC$は、$t-1 + L$の順番でエラー増幅を減らし、$t$はタイムステップ、$L$はリプシッツ定数である。
大規模なベンチマークで$mathrmINC$をテストし、1Dカオスシステムから3D乱流まで、多くの異なる解法、神経バックボーン、テストケースをカバーした。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:59:39 GMT)
Measurement-Constrained Sampling for Text-Prompted Blind Face Restoration [60.5] ブラインドフェース修復(BFR)は、極低品質(LQ)入力下での複数の高品質(HQ)再構築に対応できる。
本研究では,異なるテキストプロンプトを条件とした多種多様なLQ顔再構成を可能にするMCS手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:44:54 GMT)
O-Mem: Omni Memory System for Personalized, Long Horizon, Self-Evolving Agents [60.2] O-Memはアクティブユーザプロファイリングに基づく新しいメモリフレームワークである。
O-Memはペルソナ属性とトピック関連コンテキストの階層的検索をサポートする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:20:49 GMT)
Step by Step Network [56.4] ネットワーク深さのスケールアップは、ニューラルアーキテクチャ設計における基本的な追求である。
本稿では,残差モデルのスケーリングを阻害する2つの重要な障壁,すなわちショートカット劣化と制限幅を同定する。
本稿では,ステップ・バイ・ステップ・ネットワーク(StepsNet)と呼ばれる,理論的ポテンシャルと実用性能のギャップを埋めるために,一般化された残差アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:35:49 GMT)
Vision Large Language Models Are Good Noise Handlers in Engagement Analysis [54.4] 本稿では,VLM(Vision Large Language Models)を利用したアノテーションの洗練とトレーニングプロセスの指導を行うフレームワークを提案する。
本フレームワークでは,行動手がかりを抽出し,データを高信頼性サブセットと低信頼性サブセットに分割する。
改良された高信頼性サブセットで訓練された古典型コンピュータビジョンモデルは,カリキュラム戦略により強化され,改善されたことを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:50:26 GMT)
Unsupervised Discovery of Long-Term Spatiotemporal Periodic Workflows in Human Activities [54.3] 580個のマルチモーダル・ヒューマン・アクティビティ・シーケンスからなる最初のベンチマークを導入する。
このベンチマークは、現実世界のアプリケーションと整合した3つの評価タスクをサポートする。
また、多様な周期的ワークフローパターンをモデル化するための軽量でトレーニング不要なベースラインを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 22:07:30 GMT)
Diffusion As Self-Distillation: End-to-End Latent Diffusion In One Model [53.8] ラテント拡散モデルは、独立したエンコーダ、デコーダ、拡散ネットワークからなる複雑な3部アーキテクチャに依存している。
本研究では,潜伏空間を安定化させる学習目標に重要な変更を加えた新たなフレームワークであるDeffusion as Self-Distillation (DSD)を提案する。
このアプローチにより、単一のネットワークの安定したエンドツーエンドトレーニングが初めて実現され、同時にエンコード、デコード、拡散の実行を学ぶことができる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:58:16 GMT)
Hierarchical Token Prepending: Enhancing Information Flow in Decoder-based LLM Embeddings [52.5] 本稿では,注目レベルの圧縮と読み出しレベルのオーバーシャッシングを緩和する階層型トークンプレッペンディングを提案する。
HTPは、入力をブロックに分割し、ブロックレベルの要約トークンをその後のブロックにプリペンドし、後方情報フローの経路を作成する。
シンプルなアーキテクチャに依存しない方法として、HTPはゼロショットモデルと微調整モデルの両方を強化し、優れた長期文書埋め込みへのスケーラブルなルートを提供する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:37:40 GMT)
SciRAG: Adaptive, Citation-Aware, and Outline-Guided Retrieval and Synthesis for Scientific Literature [52.4] 我々は科学文献探索のためのオープンソースのフレームワークであるSciRAGを紹介する。
1) 逐次的証拠収集と並列的証拠収集を柔軟に交互に交互に行う適応的検索,(2) 引用グラフを利用して文書を整理・フィルタリングする引用型記号推論,(3) 整合性と透過的帰属性を確保するために回答を計画・批評・洗練するアウトライン誘導合成,である。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:09:19 GMT)
Run, Ruminate, and Regulate: A Dual-process Thinking System for Vision-and-Language Navigation [52.1] VLN(Vision-and-Language Navigation)は、エージェントが人間の指示に従って複雑な3D環境を動的に探索する必要がある。
近年の研究では、一般的な知識と一般的な推論能力から、大きな言語モデル(LLM)をVLNに活用する可能性を強調している。
本稿では、LLMの一般化機能とVLN固有の専門知識をゼロショットで統合する、R3と呼ばれる新しいデュアルプロセス思考フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:32:00 GMT)
GloTok: Global Perspective Tokenizer for Image Reconstruction and Generation [52.0] トークン化された特徴のより均一な意味分布をモデル化するために,Global Perspective Tokenizer(GloTok)を導入する。
量子化による再構成誤差を最小限に抑えるために, 微細な細部を復元するために, 残差学習モジュールを提案する。
標準のImageNet-1kベンチマーク実験により,提案手法が最先端の復元性能と生成品質を実現することを確認した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:40:26 GMT)
From Narrow Unlearning to Emergent Misalignment: Causes, Consequences, and Containment in LLMs [51.8] 特定領域での未学習を狭くすることで,創発的不適応が生じる可能性が示唆された。
我々の研究は、狭義のドメインアンラーニングが対象のコンセプトに対するコンプライアンス応答をもたらすことを示しているが、EMAを無関係のドメインに広めることもできる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 00:53:23 GMT)
A Generative Data Framework with Authentic Supervision for Underwater Image Restoration and Enhancement [51.4] 我々は、未ペア画像から画像への変換に基づく生成データフレームワークを開発する。
このフレームワークは、正確な地上構造ラベルを持つ合成データセットを構成する。
実験により、我々の合成データに基づいてトレーニングされたモデルが、既存のベンチマークでトレーニングされたモデルに匹敵する、あるいは優れた色復元と一般化性能が得られることが示された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:20:17 GMT)
ARC Is a Vision Problem! [50.6] 視覚パラダイム内のARCを画像から画像への変換問題として定義する。
私たちのフレームワークであるVision ARCは、ARC-1ベンチマークで60.4%の精度を実現しています。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:59:49 GMT)
Adapformer: Adaptive Channel Management for Multivariate Time Series Forecasting [49.4] Adapformerは、効果的なチャネル管理を通じてCIとCD方法論のメリットをマージする、トランスフォーマーベースの高度なフレームワークである。
Adapformerは既存のモデルよりも優れた性能を実現し、予測精度と計算効率の両方を向上させる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:24:05 GMT)
Robust Verification of Controllers under State Uncertainty via Hamilton-Jacobi Reachability Analysis [49.3] Hamilton-Jacobi (J) リーチビリティ解析は、最悪の不確実性の下で最適なリーチビリティを計算できる一般的な非線形システムに対する一般的な形式的検証ツールである。
この作業は、HJローバーを介してRobust Verification Controllersのための、HJベースのリーチビリティベースのシステム検証フレームワークである。
本稿では,Ro-CoReの安全性検証とコントローラ設計のための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:55:20 GMT)
Improved Convergence in Parameter-Agnostic Error Feedback through Momentum [49.2] 本研究では、EFと正規化更新、様々な運動量変動、パラメータに依存しない時変ステップサイズを組み合わせた正規化エラーフィードバックアルゴリズムについて検討する。
我々の結果は、ステップサイズと小さなミニバッチの減少に繋がる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:47:08 GMT)
DINO-Detect: A Simple yet Effective Framework for Blur-Robust AI-Generated Image Detection [49.2] そこで我々は,教師の知識蒸留に基づくぼやけたAIGI検出フレームワークを開発した。
クリーンな(シャープな)イメージに基づいて訓練された高容量の教師(DINOv3)は、学習の基準となる安定的で意味的に豊かな表現を提供する。
教師は,その一般化能力を維持するために凍結することにより,その特徴を抽出し,鮮明な画像からのロジット応答を,ぼやけた画像に基づいて訓練した学生に伝える。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:34:54 GMT)
DevPiolt: Operation Recommendation for IoT Devices at Xiaomi Home [49.0] 既存のレコメンデーションモデルは、複雑な操作ロジック、多様なユーザの好み、最適以下の提案に敏感である。
我々は,IoTデバイス操作のためのLLMベースのレコメンデーションモデルであるDevPioltを提案する。
DevPioltはXiaomi Homeアプリに4分の1でデプロイされており、毎日25万5000人のユーザーにオコメンデーションを提供している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:01:55 GMT)
DeepBlip: Estimating Conditional Average Treatment Effects Over Time [48.2] 構造ネスト平均モデル(SNMM)のための最初のニューラルネットワークフレームワークであるDeepBlipを提案する。
提案手法は, 時間変化による不偏推定を正確に調整し, ナイマン・直交損失関数はニュアンスモデルの不特定性に対して頑健性を保証する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:49:03 GMT)
DecNefLab: A Modular and Interpretable Simulation Framework for Decoded Neurofeedback [47.6] Decoded Neurofeedback (DecNef) は、神経医学や認知神経科学に広く応用された、脳の調節に対する非侵襲的なアプローチである。
我々は、DecNefを機械学習問題として形式化するモジュラーで解釈可能なシミュレーションフレームワークであるDecNefLabを紹介する。
我々は,この手法がDecNef学習の実証的な現象を再現し,DecNefフィードバックが学習を誘導できない条件を特定し,より堅牢で信頼性の高いDecNefプロトコルの設計を人間による実装前に導く方法を示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:58:59 GMT)
Systematic Evaluation of Time-Frequency Features for Binaural Sound Source Localization [47.2] 本研究は,多種多様な条件における特徴選択がモデル性能に与える影響に焦点を当てた。
本稿では,振幅に基づく様々な特徴の組み合わせを用いた畳み込みニューラルネットワーク(CNN)モデルの性能について検討する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:25:04 GMT)
Skewness-Robust Causal Discovery in Location-Scale Noise Models [47.1] 位置スケールノイズモデルに基づく因果発見のための確率に基づくアルゴリズムであるSkewDを提案する。
SkewDは通常の正規分布フレームワークをスキュー正規設定に拡張し、対称性と歪んだ雑音下での信頼性推論を可能にする。
我々は、スキューノイズを伴う新しい合成データセットと、確立されたベンチマークデータセットに基づいてSkewDを評価する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:40:41 GMT)
LoopTool: Closing the Data-Training Loop for Robust LLM Tool Calls [46.3] LoopToolは、完全に自動化され、モデル対応のデータ進化フレームワークである。
3つの相乗的モジュールを通して、データとモデルを反復的に洗練する。
実験によると、LoopToolでトレーニングした8Bモデルは、32Bデータジェネレータを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:03:59 GMT)
Agent-R1: Training Powerful LLM Agents with End-to-End Reinforcement Learning [45.9] 大規模言語モデル(LLM)は、複雑な問題を解決するために、アクティブな環境相互作用(例えばツールの使用)が可能なエージェントを構築するために、ますます研究されている。
本稿では,まず,マルコフ決定プロセス(MDP)フレームワークを体系的に拡張することにより,LLMエージェントの強化学習方法論を再検討し,解明する。
次に,RL ベースの LLM Agent のためのモジュール型でフレキシブルでユーザフレンドリなトレーニングフレームワークである Agent-R1 を紹介する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:03:15 GMT)
Mind the Gaps: Measuring Visual Artifacts in Dimensionality Reduction [44.8] 本稿では2次元平面上のDRプロジェクションの品質を測定するための新しい指標であるWarping Index(WI)を紹介する。
いくつかのプロジェクション品質指標 (PQMs) はDRプロジェクションの適合性を定量化するツールとして開発されている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:45:19 GMT)
OmniSparse: Training-Aware Fine-Grained Sparse Attention for Long-Video MLLMs [43.8] OmniSparseは、長時間ビデオMLLMのための、トレーニング対応のきめ細かなスパークアテンションフレームワークである。
実験結果から,OmniSparseはプリフィル時の2.7倍,デコード時の2.4倍のメモリ削減を実現しつつ,全注目性能と一致していることがわかった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 23:07:41 GMT)
Agentic Video Intelligence: A Flexible Framework for Advanced Video Exploration and Understanding [43.8] 本稿では,システムレベルの設計と最適化によって人間の映像理解を反映できるフレキシブルでトレーニング不要なフレームワークであるエージェントビデオインテリジェンス(AVI)を提案する。
AVIは、(1)人間にインスパイアされた3相推論プロセス(Retrieve-Perceive-Review)、(2)エンティティグラフによって構成された構造化ビデオ知識ベース、(3)軽量CVモデルとVLMを組み合わせたオープンソースのモデルアンサンブルの3つの重要なイノベーションを紹介している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:43:15 GMT)
BEDLAM2.0: Synthetic Humans and Cameras in Motion [43.6] 人気の高いBEDLAMデータセットを超える新しいデータセットであるBEDLAM2.0を紹介します。
BEDLAM2.0は、身体の形、動き、衣服、髪、および3D環境の多様性と現実性を高める。
BEDLAM2.0は、特に世界座標における人間を推定する訓練方法において、非常に優れていることを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:56:26 GMT)
Learning Compact Latent Space for Representing Neural Signed Distance Functions with High-fidelity Geometry Details [43.5] ニューラルサイン付き距離関数(SDF)は、ニューラルネットワークを用いた3次元形状やシーンを表現する上で重要な表現である。
本稿では,複数のSDFを共通空間で表現する手法を提案する。
トレーニングクエリのサンプル化のための新しいサンプリング戦略も導入する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:43:47 GMT)
ArtiWorld: LLM-Driven Articulation of 3D Objects in Scenes [43.2] ArtiWorldは、テキストシーン記述から候補のアーティキュラブルオブジェクトをローカライズする、シーン認識パイプラインである。
このパイプラインのコアとなるArti4URDFは、3Dポイントクラウドと大規模言語モデルの事前知識を活用している。
ArtiWorldを3つのレベル(3Dシミュレーションオブジェクト、フル3Dシミュレーションシーン、実世界のスキャンシーン)で評価する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:38:10 GMT)
AsyncVLA: Asynchronous Flow Matching for Vision-Language-Action Models [42.7] AsyncVLAは非同期フローマッチングVLAモデルに時間的柔軟性を導入する新しいフレームワークである。
AsyncVLAは、アクションコンテキスト認識を備えた非一様時間スケジュールでアクショントークンを生成することで、VLAモデルのバニラSFMからブレークする。
提案手法では,初期発生したアクションの信頼度を抽出する信頼性レーサを導入し,不正確なアクショントークンを選択的に洗練する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:21:11 GMT)
Masked IRL: LLM-Guided Reward Disambiguation from Demonstrations and Language [42.3] Masked Inverse Reinforcement Learning (Masked IRL)は、大きな言語モデル(LLM)を使用して、両方の入力型の強みを組み合わせるフレームワークである。
シミュレーションおよび実際のロボット上では、Masked IRLは、事前の言語条件のIRLメソッドを最大15%向上させる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:07:50 GMT)
Online learning of subgrid-scale models for quasi-geostrophic turbulence in planetary interiors [42.0] 軸対称境界領域における準破壊的乱流について検討する。
流れは所定の解析力によって駆動される。
我々は,1回のターンオーバー時間のみにまたがるデータに基づいてトレーニングされたSGSモデルが,トレーニング期間より少なくとも100倍長い統合よりも安定かつ正確であることを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:21:38 GMT)
Towards LLM-Based Usability Analysis for Recommender User Interfaces [42.0] 我々は,マルチモーダルな大規模言語モデルの可能性を探り,レコメンダシステムインタフェースのユーザビリティを評価する。
複数のレコメンデーションプラットフォームからユーザインターフェースのスクリーンショットを取り込み、好みの誘惑とレコメンデーションのプレゼンテーションシナリオの両方をカバーします。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:05:13 GMT)
NORA-1.5: A Vision-Language-Action Model Trained using World Model- and Action-based Preference Rewards [41.9] 視覚言語アクション(VLA)モデルは、最近様々な具体的タスクにおいて有望な性能を示したが、信頼性と一般化が不足している。
トレーニング済みのNORAバックボーンから構築したVLAモデルであるNORA-1.5について,フローマッチングに基づくアクションエキスパートを付加して紹介する。
堅牢性とタスクの成功をさらに改善するため、我々はVLAポリシーの訓練後の報酬モデルを開発した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:55:48 GMT)
Uni-Hand: Universal Hand Motion Forecasting in Egocentric Views [40.4] マルチモーダル入力,多次元およびマルチターゲット予測パターン,マルチタスクの可利用性を考慮したユニバーサルハンドモーション予測フレームワークを提案する。
ヒトの頭と手の動きを同時に予測し、自我中心視における動きのシナジーを捉えるために、新しい二重枝拡散法が提案されている。
文献に下流タスク評価を取り入れた最初の試みとして,手の動き予測アルゴリズムの現実的適用性を評価するための新しいベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:00:56 GMT)
MedGEN-Bench: Contextually entangled benchmark for open-ended multimodal medical generation [40.1] MedGEN-Benchは、医療AI研究を促進するために設計された総合的なマルチモーダルベンチマークである。
MedGEN-Benchは、6つの画像モダリティ、16の臨床的タスク、28のサブタスクにまたがる6,422のエキスパート検証済み画像テキストペアからなる。
我々は,画素レベルのメトリクス,意味的テキスト分析,専門家が指導する臨床関連度スコアなどを統合した3段階評価フレームワークを新たに導入した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:19:07 GMT)
Parallelizing Program Execution on Distributed Quantum Systems via Compiler/Hardware Co-Design [39.8] 本稿では,分散量子システム上での量子アルゴリズムの実行を強化する新しい手法を提案する。
提案手法は、並列命令実行をサポートするハードウェア設計と、並列処理の機会を増やすために命令の順序を変更するコンパイラの開発を含む。
結果は、ベースラインのシリアル実行モデルと比較して、最大平均速度16.5x、最大シングルベンチマーク速度56.2xを達成するという大きなスピードアップを示している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:05:20 GMT)
Beyond critical coupling: optimal design considerations for spontaneous four-wave mixing in microring resonators [39.8] マイクロリング共振器における2光子生成のための自己完結型解析モデルを提案する。
我々の相互作用画像に基づくアプローチは、絶対生成率を予測しながら、時間周波数のバイフォトン相関を明らかにする。
全体として、我々の定式化は、統合光子源の実用的な設計に価値があることを証明すべきである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:37:30 GMT)
NeuCLIRBench: A Modern Evaluation Collection for Monolingual, Cross-Language, and Multilingual Information Retrieval [39.2] 本稿では,言語間および多言語検索のための評価コレクションであるNeuCLIRBenchについて述べる。
コレクションは中国語、ペルシア語、ロシア語で書かれた文書と、英語に翻訳された同じ文書で構成されている。
このコレクションは、英語、中国語、ペルシア語、ロシア語でのモノリンガル検索を含むいくつかの検索シナリオをサポートしている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:58:19 GMT)
FashionMAC: Deformation-Free Fashion Image Generation with Fine-Grained Model Appearance Customization [38.1] ガーメント中心のファッション画像生成は、与えられた衣服を身に着けた現実的で制御可能な人間のモデルを合成することを目的としている。
既存の手法では、通常、生成過程において衣服の変形を行なわなければならないため、衣服のテクスチャの歪みが生じる。
本稿では,ファシオンMACを提案する。FashionMACは,高品質かつ制御可能なファッションショーケース画像生成を実現する,新しい拡散ベースの変形フリーフレームワークである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:22:14 GMT)
RocSync: Millisecond-Accurate Temporal Synchronization for Heterogeneous Camera Systems [38.1] 多様なカメラシステム間でミリ秒レベルの時間的アライメントを実現するための,低コストで汎用的な同期方式を提案する。
提案したソリューションは、赤と赤で時間をエンコードし、露光ウィンドウの視覚的デコードを可能にする、カスタムビルドの itLED クロックを採用している。
IRとRGBの両モードにまたがる25以上の異種カメラを用いた大規模な手術記録において,本システムの有効性を検証した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 22:13:06 GMT)
AraLingBench A Human-Annotated Benchmark for Evaluating Arabic Linguistic Capabilities of Large Language Models [37.8] AraLingBenchは、大規模言語モデル(LLM)のアラビア語能力を評価するための、完全に人間による注釈付きベンチマークである。
このベンチマークは、文法、形態学、綴り、読解、構文の5つの中核カテゴリにまたがっており、エキスパートが設計した複数の選択肢に関する質問が150件ある。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:47:01 GMT)
KTester: Leveraging Domain and Testing Knowledge for More Effective LLM-based Test Generation [36.9] 本稿では、プロジェクト固有の知識を統合し、ドメイン知識をテストする新しいフレームワークであるKTesterについて述べる。
我々は、KTesterを複数のオープンソースプロジェクトで評価し、最先端のLCMベースラインと比較した。
結果は、KTesterが6つの主要なメトリクスで既存のメソッドを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:57:58 GMT)
From Perception to Reasoning: Deep Thinking Empowers Multimodal Large Language Models [36.5] CoT(Chain-of-Thought)推論は、推論の透明性と出力の解釈可能性を高めることによって、言語モデルにおいて有意な効果を示した。
本稿では,Multimodal Chain-of-Thought(MCoT)を中心にしたシステムレビューを行う。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:45:04 GMT)
Imaging with super-resolution in changing random media [36.5] 我々は、強い散乱を利用してランダムなメディアの変化を超解像化するイメージングアルゴリズムを開発した。
この方法は、スパース辞書学習、クラスタリング、多次元スケーリングを用いて、大規模で多様なデータセットを処理する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:18:00 GMT)
How to pick the best anomaly detector? [35.7] 異常検出は、探索されていないデータの領域で新しい物理を発見する可能性がある。
モデルに依存しない方法で、与えられたデータセットの最良の異常検知器を選択することは、主に無視されてきた重要な課題である。
本稿では,データ駆動ARGOS測定法について紹介する。これは理論的基礎が健全であり,データから最も敏感な異常検出モデルを選択することを実証的に示している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:00:01 GMT)
MindCross: Fast New Subject Adaptation with Limited Data for Cross-subject Video Reconstruction from Brain Signals [35.6] 既存の脳デコーディングフレームワークは、主に主題に依存したパラダイムに基づいて構築されており、各主題に対して大量の脳データを必要とする。
高速でデータ効率の高い新しい主題適応を実現するために,新しいクロスオブジェクトフレームワークであるMindCrossを提案する。
MindCrossのN特定エンコーダと1つの共有エンコーダは、それぞれ主観的固有情報と主観的不変情報を取り出すように設計されている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:04:36 GMT)
SMART: Shot-Aware Multimodal Video Moment Retrieval with Audio-Enhanced MLLM [34.8] Video Moment Retrievalは、自然言語クエリに基づいて、トリミングされていないビデオに特定の時間セグメントをローカライズすることを目的としている。
既存の手法の多くは、いまだに粗い時間的理解と単一の視覚的モダリティに依存しており、複雑なビデオのパフォーマンスを制限している。
textitShot-aware textitMulti textitAudio-enhanced textitRetrieval of textitSegmentsを紹介する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:03:17 GMT)
NeuralSSD: A Neural Solver for Signed Distance Surface Reconstruction [34.6] インプリシット法は、形状を正確に表現する能力と、トポロジカルな変化に対処する堅牢性のために好まれる。
本稿では,点雲情報の信頼性のバランスをとる新しいエネルギー方程式を提案する。
より優れた最適化結果を得るために,3次元情報を学習する新しい畳み込みネットワークを導入する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:20:15 GMT)
Let Language Constrain Geometry: Vision-Language Models as Semantic and Spatial Critics for 3D Generation [34.4] 本稿では,差別化可能な意味的・空間的批判のための枠組みであるVLM3Dを提案する。
我々のコアコントリビューションは、VLMの「Yes or No log-odds」から派生した2言語による批判信号です。
VLM3Dは、VLMの豊かな言語によるセマンティクスと空間の理解を多種多様な3D生成パイプラインに注入する、原則的で一般的な経路を確立している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:05:26 GMT)
Training-free Detection of AI-generated images via Cropping Robustness [33.9] WaRPADは、自己教師型モデルに基づくトレーニング不要のAI生成画像検出アルゴリズムである。
我々は、WaRPADが一貫して競争性能を達成し、テストタイムの腐敗に対して強い堅牢性を示すことを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:21:47 GMT)
FreeSwim: Revisiting Sliding-Window Attention Mechanisms for Training-Free Ultra-High-Resolution Video Generation [33.8] そこで本研究では,ビデオ拡散変換器をネイティブスケールで事前学習し,高解像度映像を合成するトレーニングフリーな手法を提案する。
トレーニング不要のパラダイムにおいて,細かな視覚的詳細と高効率の超高精細映像を提供する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:56:04 GMT)
It's LIT! Reliability-Optimized LLMs with Inspectable Tools [33.5] 大規模言語モデル(LLM)は、様々な領域で顕著な機能を示している。
LLMはしばしば不透明な推論プロセスに従い、高い領域におけるそれらの有用性を制限する。
本稿では,既存のLCMのツールコール機能をベースに構築されたフレームワークについて述べる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:41:58 GMT)
Steganographic Backdoor Attacks in NLP: Ultra-Low Poisoning and Defense Evasion [33.4] トランスフォーマーモデルは自然言語処理(NLP)アプリケーションの基礎であるが、バックドア攻撃には弱い。
我々はステガノBackdoorを導入し、ステルステクニックを実用的な脅威モデルに適合させる。
SteganoBackdoorの攻撃成功率は99%を超えている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:56:16 GMT)
Unified Defense for Large Language Models against Jailbreak and Fine-Tuning Attacks in Education [32.7] 大規模言語モデル(LLM)は、ますます教育アプリケーションに統合されている。
LLMは、ジェイルブレイクや微調整攻撃に弱いため、安全アライメントを妥協し、有害な出力につながる可能性がある。
脱獄と微調整の両方を同時に緩和する教育用3段階シールドフレームワーク(TSSF)を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:27:51 GMT)
2D Gaussians Spatial Transport for Point-supervised Density Regression [32.4] 本稿では,画像座標空間の確率測度からアノテーションマップへの移動を容易にするためにガウススプラッティングを利用する新しいフレームワークを提案する。
本稿では,ベイズ確率から導かれる移動計画を計算するために,画素アノテーション対応を推定する手法を提案する。
クラウドカウントやランドマーク検出など,コンピュータビジョンの代表的なタスクに関する実験により,我々のアプローチの有効性が検証された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:16:29 GMT)
Privacy on the Fly: A Predictive Adversarial Transformation Network for Mobile Sensor Data [32.4] 本稿では,歴史的信号を利用したリアルタイムなプライバシ保護フレームワークを提案し,対人的摂動を積極的に生成する。
2つのデータセットの実験では、PATNはプライバシ推論モデルのパフォーマンスを著しく低下させる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:23:51 GMT)
How to Marginalize in Causal Structure Learning? [32.1] 本稿では,各ノードに対する親の制約を回避するために,トラクタブル確率回路を利用する新しい手法を提案する。
その結果,ベイジアン構造学習者は,従来の手法と比較して,その性能を向上させることができることがわかった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 00:09:11 GMT)
V2VLoc: Robust GNSS-Free Collaborative Perception via LiDAR Localization [31.5] マルチエージェントは、観察を共有し、調整するための正確なポーズに依存し、環境の協調的な認識を可能にします。
従来のLiDARベースのローカライゼーションは、しばしばインデント環境で失敗し、協調作業において一貫した機能アライメントが困難になる。
本稿では,LiDARのローカライゼーションに基づくロバストフリー協調認識フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:34:41 GMT)
RepAir: A Framework for Airway Segmentation and Discontinuity Correction in CT [30.8] RepAirは、nnU-Netベースのネットワークと解剖学的に情報を得たトポロジー補正を組み合わせた3Dエアウェイセグメンテーションフレームワークである。
ATM'22とAeroPathのアノテートCTと重篤な気道病変を伴うアノテートスキャンの2つの異なるデータセットでRepAirを評価した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:41:44 GMT)
FineRef: Fine-Grained Error Reflection and Correction for Long-Form Generation with Citations [30.3] FineRefはモデルに、2つの重要な引用エラー、ミスマッチと無関係を自己識別し、修正するように教える。
FineRefは、引用性能と回答精度の両方を大幅に改善する。
我々の7Bモデルは、Citation F1では最大18%、EMリコールでは4%、GPT-4より優れています。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:35:12 GMT)
Efficient Reinforcement Learning for Zero-Shot Coordination in Evolving Games [30.0] ゼロショット調整はマルチエージェントゲーム理論における鍵となる課題である。
人口ベーストレーニングは、ゼロショット調整性能が良いことが証明されている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:20:13 GMT)
Beyond Means: A Dynamic Framework for Predicting Customer Satisfaction [29.8] 評価アグリゲーションにガウス過程(GP)フレームワークを用いることの価値を実証する。
Yelpの121,123のレーティングに基づいて、将来のレーティングを予測するために異なるレーティングアグリゲーション手法の予測能力を比較する。
当社の発見は,マーケティング実践者や顧客にとって重要な意味を持つ。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:43:29 GMT)
AdaTok: Adaptive Token Compression with Object-Aware Representations for Efficient Multimodal LLMs [29.7] 適応トークン圧縮のためのオブジェクトレベルのトークンマージ戦略を提案する。
当社のアプローチでは,バニラモデルのパフォーマンスの96%を達成しながら,トークンの10%しか使用していません。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:12:15 GMT)
MoE-SpeQ: Speculative Quantized Decoding with Proactive Expert Prefetching and Offloading for Mixture-of-Experts [29.4] 提案するMoE-SpeQは,投機的実行と専門家のオフロードを共設計した新しい推論システムである。
MoE-SpeQは、将来のトークンに必要な専門家のシーケンスを予測するために、小さなオンデバイスドラフトモデルを採用している。
Phi-MoEモデルでは,MoE-SpeQは最先端のオフロードフレームワークよりも2.34倍の高速化を実現している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:40:19 GMT)
FAPE-IR: Frequency-Aware Planning and Execution Framework for All-in-One Image Restoration [29.3] 画像復元のための周波数対応計画・実行フレームワークであるFAPE-IRを提案する。
凍結したMultimodal Large Language Model (MLLM) をプランナーとして使用し、劣化した画像を解析し、簡潔で周波数対応の復元計画を生成する。
FAPE-IRは、セマンティックプランニングと周波数ベースの復元を結合することにより、オールインワン画像復元のための統一的で解釈可能なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:33:10 GMT)
Blur-Robust Detection via Feature Restoration: An End-to-End Framework for Prior-Guided Infrared UAV Target Detection [29.2] 赤外線無人航空機(UAV)の標的画像は、しばしば動きのぼやけた劣化に悩まされる。
本稿では,JFD3 と呼ばれる新しい特徴ドメインのデブロアリングとエンドツーエンドのフレームワークを提案する。
IRBlurUAV実験により、JFD3は実時間効率を維持しながら優れた検出性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:27:15 GMT)
CORE: Compact Object-centric REpresentations as a New Paradigm for Token Merging in LVLMs [29.1] 視覚的トークン圧縮のための新しいパラダイムであるCORE(Compact Object-centric Representation)を紹介する。
COREは効率的なセグメンテーションデコーダを利用してオブジェクトマスクを生成する。
実験により、COREは固定レート圧縮のための6つの信頼性ベンチマークに対して新しい最先端のベンチマークを確立するだけでなく、適応レート設定において劇的な効率向上を達成することが示された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:02:23 GMT)
APD-Agents: A Large Language Model-Driven Multi-Agents Collaborative Framework for Automated Page Design [28.9] アプリケーションページ設計のための大規模言語モデル駆動型マルチエージェントフレームワークであるAPD-agentsを提案する。
本研究は,大規模モデル駆動型マルチエージェントシステムの自動協調機能を活用している。
RICOデータセットの実験結果は、APDエージェントが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:39:26 GMT)
MindRec: A Diffusion-driven Coarse-to-Fine Paradigm for Generative Recommendation [27.7] MindRecは人間の思考過程をエミュレートする粗大な生成パラダイムである。
我々はMindRecが最先端の手法よりも平均9.5%の精度でトップ1の精度を向上させることを示した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:03:05 GMT)
Skin-R1: Toward Trustworthy Clinical Reasoning for Dermatological Diagnosis [27.7] SkinR1は、深い教科書に基づく推論と強化学習(RL)の広範な一般化能力を組み合わせた新しい皮膚視覚言語モデル(VLM)である。
まず、高忠実度、階層認識、差動診断(DDx)インフォームド・トラジェクトリを合成する教科書ベースの推論生成器を設計する。
第2に,教師付き微調整(SFT)に構築された軌道を利用して,基礎的推論能力を持つモデルを実現する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:38:36 GMT)
FarSLIP: Discovering Effective CLIP Adaptation for Fine-Grained Remote Sensing Understanding [27.6] 現在のRS画像テキストデータセットは、オブジェクトレベルのラベルからグローバルキャプションを生成する。
RSデータへの直接適用は、しばしばパフォーマンスの低下につながる。
FarSLIP は,粒度の細かい RS Language Image Pretraining フレームワークである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:39:15 GMT)
CLO: Efficient LLM Inference System with CPU-Light KVCache Offloading via Algorithm-System Co-Design [27.0] アルゴリズム・システム共同設計によるCPUライトKVCacheオフロードシステムであるCLOを提案する。
CLOは最先端システムと同等の精度を実現し、CPUオーバーヘッドを大幅に最小化する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:03:21 GMT)
Seeing Beyond the Image: ECG and Anatomical Knowledge-Guided Myocardial Scar Segmentation from Late Gadolinium-Enhanced Images [27.0] 本稿では,心電図由来の電気生理学的情報とAHA-17アトラスの解剖学的先行情報を統合した新しい枠組みを提案する。
本手法は, 臨床データセットを用いて評価し, 最新の画像のみのベースラインよりも大幅に向上した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:42:20 GMT)
LoG3D: Ultra-High-Resolution 3D Shape Modeling via Local-to-Global Partitioning [26.9] 非符号距離場(UDF)に基づく新しい3次元変分オートエンコーダフレームワークを提案する。
私たちの中心となるイノベーションは、UDFを統一サブボリュームであるUBlockに分割することで処理する、ローカルからグローバルなアーキテクチャです。
再現精度と生成品質の両面での最先端性能を実証し,表面の滑らかさと幾何学的柔軟性を向上した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:07:41 GMT)
Synthetic Clinical Notes for Rare ICD Codes: A Data-Centric Framework for Long-Tail Medical Coding [26.8] MIMIC-IIIのようなデータセットでは、数千のレアおよびゼロショットのICD符号が著しく不足している。
我々は7,902のICDコードをカバーする90,000の合成ノートを生成し、トレーニング分布を大幅に拡大した。
実験の結果,我々はマイクロF1を維持しながらマクロF1を緩やかに改善した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:52:12 GMT)
Developing a Grounded View of AI [26.7] 本稿では,人工知能の性質と限界を明らかにするために,工学的観点からの人工知能の挙動を考察する。
本稿では,3種類の意思決定を伴うAIモデルの行動の識別を可能かつ実践的に行う手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 00:39:52 GMT)
SparseSurf: Sparse-View 3D Gaussian Splatting for Surface Reconstruction [26.6] 高品質な新しいビューレンダリングを保ちながら、より正確で詳細な表面を再構築する手法であるnetを提案する。
我々の重要な洞察は、レンダリング品質と幾何推定を橋渡しするStereo Geometry-Texture Alignmentを導入することである。
さらに,多視点幾何整合性を実現するPseudo-Feature Enhanced Geometry Consistencyを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:24:37 GMT)
ConInstruct: Evaluating Large Language Models on Conflict Detection and Resolution in Instructions [26.4] このデータセットは、ユーザインストラクション内の競合を検出し、解決するLarge Language Modelsの機能を評価するためのベンチマークである。
ほとんどのプロプライエタリなLCMは強力なコンフリクト検出能力を持っているが、オープンソースのモデルではDeepSeek-R1のみが同様の強力な性能を示している。
強いコンフリクト検出能力にもかかわらず、LLMは競合する制約に直面したときに、ユーザにコンフリクトや要求の明確化を明示的に通知することは滅多にない。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:49:37 GMT)
Optimal Look-back Horizon for Time Series Forecasting in Federated Learning [26.1] 本稿では,フェデレート時系列予測における適応的地平面選択の原理的枠組みを提案する。
我々は予測損失をベイズ項に分解し、既約不確実性を反映する。
予測損失の総和は、既約損失が飽和し始める最小の地平線で最小化され、近似損失は増加し続けることを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:36:00 GMT)
Regularized Schrödinger Bridge: Alleviating Distortion and Exposure Bias in Solving Inverse Problems [25.9] 逆問題に適したシュルディンガー橋を適応した正規化シュルディンガー橋(RSB)を提案する。
RSBは、入力状態とターゲットの両方を摂動させ、露光バイアスを効果的に軽減する、新しい規則化されたトレーニング戦略を採用している。
音声強調のための2つの典型的な逆問題に対する大規模な実験は、RSBが最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:57:28 GMT)
DEVAL: A Framework for Evaluating and Improving the Derivation Capability of Large Language Models [25.2] 人間の推論は、入力に対する特定の種類の変化に基づいて出力に対応する変更を導出することができる。
この推論パターンは、大規模言語モデルでは包括的に説明または評価されていない。
本稿では,デリベーション・プロンプティング(Drivation Prompting)と呼ばれる新しいプロンプトエンジニアリング手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:37:27 GMT)
PFAvatar: Pose-Fusion 3D Personalized Avatar Reconstruction from Real-World Outfit-of-the-Day Photos [24.9] PFAvatarは、OOTD(Outfit of the Day)の写真から高品質な3Dアバターを再構築する新しい方法だ。
従来の手法に比べて48倍の高速化を実現し, パーソナライズをわずか5分で完了した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:47:59 GMT)
Certified but Fooled! Breaking Certified Defences with Ghost Certificates [24.8] 本研究では,保証条項の限界を理解するために,確率的認証フレームワークの悪用について検討する。
ICLRの最近の研究は、大きな摂動を作れば、誤ったクラスの証明書を生成することができる領域に入力をシフトできることを示した。
本研究では,非知覚的摂動,スプーフ証明書,およびソースクラスゴースト証明書よりも大きな証明ラジイを実現するために,地域中心の敵例を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 00:11:24 GMT)
Spark-Prover-X1: Formal Theorem Proving Through Diverse Data Training [24.7] Spark-Prover-X1は、3段階のフレームワークを用いてトレーニングされた7Bパラメータモデルで、中等サイズのLCMの推論可能性を解き放つ。
重要なイノベーションは、きめ細かい推論を達成するための"CoT拡張状態予測"タスクである。
また、402のフォーマルな問題のベンチマークデータセットであるExamFormal-Benchを紹介します。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:35:16 GMT)
Multi-Agent Deep Research: Training Multi-Agent Systems with M-GRPO [24.5] 現在の訓練方法は、システム内のすべてのエージェントに対して統一された大きな言語モデルを訓練する。
これにより、異なるエージェントの基本的な分布が異なるため、パフォーマンスが制限される可能性がある。
垂直多エージェントシステムに対するグループ相対ポリシー最適化の階層的拡張であるM-GRPOを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:13:18 GMT)
Is Your VLM for Autonomous Driving Safety-Ready? A Comprehensive Benchmark for Evaluating External and In-Cabin Risks [24.5] VLM(Vision-Language Models)は自律走行には大きな可能性を秘めているが、安全クリティカルなシナリオには適していない。
この問題は、外部環境リスクとキャビン内運転行動の安全性の両方を同時に評価する包括的なベンチマークが欠如していることから生じる。
我々は,VLMの各種安全リスクに対する認識を統一的に評価するための,最初の総合運転安全ベンチマークであるDSBenchを紹介する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:33:49 GMT)
SkillGen: Learning Domain Skills for In-Context Sequential Decision Making [24.4] 我々は、構造化シーケンシャル推論のためのスキルベースのICLフレームワークであるSkillGenを紹介する。
我々は、SkillGenが一貫した利益を達成し、モデル全体の平均で5.9%から16.5%の進歩率を向上させることを示した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:09:21 GMT)
Look-Ahead Reasoning on Learning Platforms [24.3] ユーザアクションが結合され、大規模に、将来の予測に影響を与えていることを考慮して、ルック・ア・ヘッドの推論が示しています。
私たちはまず、行動経済学の概念であるレベル・ドル・シンキングを定式化します。
次に,モデルに対する共同的な影響を最適化することで,ユーザが協調行動をとる集合的推論に焦点をあてる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:45:32 GMT)
Geometry Meets Light: Leveraging Geometric Priors for Universal Photometric Stereo under Limited Multi-Illumination Cues [24.2] GeoUniPS(GeoUniPS)は、合成監督と高レベルの幾何学的先行性を統合する、普遍的な測光ステレオネットワークである。
空間的に異なる視野方向の学習を可能にするために,現実的な視点投影を伴うPS-Perpデータセットを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:05:51 GMT)
Gaussian Splatting-based Low-Rank Tensor Representation for Multi-Dimensional Image Recovery [23.8] t-SVDは多次元画像表現のための有望なツールである。
多次元画像をコンパクトかつ連続的に表現する低ランクテンソル表現フレームワークを提案する。
多次元画像復元実験は,提案手法が常に最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:04:09 GMT)
MVI-Bench: A Comprehensive Benchmark for Evaluating Robustness to Misleading Visual Inputs in LVLMs [23.0] MVI-Benchは、視覚入力がLVLM(Large Vision-Language Models)の堅牢性をいかに損なうかを評価するための最初の総合的なベンチマークである。
MVI-Benchは、視覚概念、視覚属性、視覚関係という3つの階層的な視覚的インプットに焦点を当てている。
MVI-Sensitivityは、LVLMのロバスト性を粒度レベルで特徴づける新しい計量である。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:48:08 GMT)
A Specialized Large Language Model for Clinical Reasoning and Diagnosis in Rare Diseases [22.5] RareSeek R1は、ノイズや重なり合う表現型の下で、技術精度、堅牢な一般化、安定性の状態を達成している。
この研究は、診断を短縮し、聴覚的、臨床的に翻訳可能な意思決定支援を可能にする、物語第一の知識統合推論パラダイムを前進させる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:29:19 GMT)
TacEleven: generative tactic discovery for football open play [22.4] 本稿では,サッカーのオープンプレイ・戦術発見のための生成フレームワークであるTacElevenを提案する。
TacElevenは、多種多様な戦術的提案を生成する言語制御の戦術的ジェネレータと、多言語モデルに基づく戦術的批判の2つのコアコンポーネントで構成されている。
進行的戦術的複雑性を伴う3つのタスクにおけるTacElevenの評価を行った。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:00:40 GMT)
B-Rep Distance Functions (BR-DF): How to Represent a B-Rep Model by Volumetric Distance Functions? [22.3] B-Rep Distance Function (BR-DF) と呼ばれる体積距離関数に基づくCAD境界表現(B-Rep)の新しい表現法を提案する。
BR-DFはCADモデルの表面メッシュ形状を符号付き距離関数(SDF)として符号化する
BR-DFを水密CADB-Repモデルに変換するマーチングキューブアルゴリズムの拡張(厳密には顔付きB-Repモデル)
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:40:34 GMT)
Toward Robust and Harmonious Adaptation for Cross-modal Retrieval [22.2] クエリシフト(QS)に対するオンラインかつ調和的な適応を実現するための新しい手法を提案する。
本稿では、QSがソースモデルから受け継いだよく構造化された共通空間を損なうだけでなく、CMR(Cross-Modal Retrieval)に欠かせない一般知識を忘れることにも寄与する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:21:23 GMT)
Continuous Vision-Language-Action Co-Learning with Semantic-Physical Alignment for Behavioral Cloning [22.1] 我々は、時間的に一貫した実行ときめ細かなセマンティックグラウンドを確実にする新しいBCフレームワークである、セマンティック・フィジカルアライメント(CCoL)を用いた連続視覚-言語-アクション協調学習(Continuous Vision- Language-action Co-Learning)を提案する。
CCoLは3つのシミュレーションスイートで平均8.0%の相対的な改善を達成し、人為的なバイマニュアル挿入タスクでは19.2%の相対的な向上を達成している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:01:06 GMT)
A Machine Learning-Based Multimodal Framework for Wearable Sensor-Based Archery Action Recognition and Stress Estimation [22.0] 運動分析システムは、しばしば高価で侵入的であり、自然の訓練環境での使用を制限する。
動作認識とストレス推定を同時に行うために,ウェアラブルセンサデータを統合する機械学習ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:16:33 GMT)
Enhancing Generalization of Depth Estimation Foundation Model via Weakly-Supervised Adaptation with Regularization [21.8] WeSTAR(Weakly supervised Self-Training Adaptation with Regularization)を提案する。
まず、構造的自己超越の主源として、密集した自己学習目標を採用する。
さらにロバスト性を改善するために,意味論的に認識された階層的正規化を導入する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:16:16 GMT)
OmniZip: Audio-Guided Dynamic Token Compression for Fast Omnimodal Large Language Models [21.5] 本稿では,マルチモーダルトークン表現と推論を最適化する,トレーニング不要な音声視覚トークン圧縮フレームワークを提案する。
具体的には、OmniZipはまず健全な音声トークンを特定し、その後、各タイムグループの音声保持スコアを計算して情報をキャプチャする。
タイムウィンドウ毎に、OmniZipはインターリーブ時間スキームを使用してビデオトークンを圧縮する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:22:32 GMT)
LLM-Aligned Geographic Item Tokenization for Local-Life Recommendation [21.4] LGSID は LLM-Hierarchical Geographic Item Tokenization Framework for Local-life Recommendation である。
本稿では,学習前報酬モデルを用いて空間知識の一般化と協調的な信号をLLMに注入する新しいG-DPOアルゴリズムを提案する。
実世界のKuaishou産業データセットの実験によると、LGSIDは最先端の差別的で生成的なレコメンデーションモデルよりも一貫して優れている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:54:32 GMT)
On the Difficulty of Token-Level Modeling of Dysfluency and Fluency Shaping Artifacts [21.3] 障害や流布形成のアーティファクトはしばしば見過ごされ、臨床および研究価値が制限された非バーベティム転写をもたらす。
そこで本研究では, 転写中の特殊トークンとして, 周波数変化や周波数変化を復号化するためのパラメータ効率適応法を提案する。
以上の結果から,Dyfluency-aware ASRに対する軽量適応法の有効性が示唆された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:33:29 GMT)
SilverTorch: A Unified Model-based System to Democratize Large-Scale Recommendation on GPUs [20.9] SilverTorchはGPU上でレコメンデーションモデルを提供するモデルベースのシステムである。
SilverTorchは、スタンドアロンのインデックス付けとフィルタリングサービスを、サーブされたモデルのレイヤに置き換えることで、モデルサービスを統合する。
SilverTorchは、主要製品全体で数百以上のモデルをオンラインで提供し、毎日何十億ものアクティブユーザー向けにコンテンツを推奨している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:00:19 GMT)
A Style is Worth One Code: Unlocking Code-to-Style Image Generation with Discrete Style Space [20.5] 本稿では,数値的なスタイルのみを前提とした,新しい一貫した視覚的スタイルのイメージを生成する,コード・ツー・スタイル画像生成の新しいタスクを紹介する。
CoTyleはこのタスクのための最初のオープンソースメソッドである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:46:13 GMT)
Iterative Diffusion-Refined Neural Attenuation Fields for Multi-Source Stationary CT Reconstruction: NAF Meets Diffusion Model [20.5] 高速な画像再構成を実現するために, マルチソース・静止CT (CT) が注目されている。
超スパースビュー条件下でのマルチソース静止CTに適した反復的フレームワークであるDiff-NAF(Diffusion-Refined Neural Attenuation Fields)を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:14:28 GMT)
WebRec: Enhancing LLM-based Recommendations with Attention-guided RAG from Web [20.3] 検索強化世代(RAG)は、大規模言語モデル(LLM)の推薦機能を促進するために、関心が高まっている。
我々は,レコメンデーションタスクをWeb検索に適したユーザ好みのクエリに解釈するLLMの推論能力を活用する,新しいWebベースのRAGフレームワークであるWebRecを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:35:33 GMT)
Free Lunch to Meet the Gap: Intermediate Domain Reconstruction for Cross-Domain Few-Shot Learning [20.0] クロスドメインのFew-Shot Learningは、ソースドメインからターゲットドメインに一般化された知識を転送する試みである。
我々は、コードブックとしてソース機能を組み込んだ中間ドメインプロキシ(IDP)を構築するための新しい試みを行っている。
本研究では,これらのプロキシをターゲット領域の特徴変換の学習指導として利用する高速なドメインアライメント手法を開発した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:14:06 GMT)
Empowering Multi-Turn Tool-Integrated Reasoning with Group Turn Policy Optimization [20.0] Group Turn Policy Optimization (GTPO) は、多ターンツール統合推論タスクにおける大規模言語モデル(LLM)のトレーニング用に設計された、新しい強化学習アルゴリズムである。
GTPOは、各ターンに対してきめ細かいフィードバックを提供するターンレベルの報酬割り当て、リターンベースの利点推定、自己監督型報酬形成という3つの重要なイノベーションを導入している。
総合評価の結果、GTPOは様々な推論ベンチマークでGRPOを平均3.0%上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:01:16 GMT)
Meta-SimGNN: Adaptive and Robust WiFi Localization Across Dynamic Configurations and Diverse Scenarios [19.5] 本稿では,グラフニューラルネットワークとメタラーニングを統合した新しいWiFiローカライゼーションシステムMeta-SimGNNを提案する。
各ノードの特徴を構造化するために,振幅位相融合法と特徴抽出法を提案する。
前者は振幅と位相の両方を利用してCSI画像を構築し、データの信頼性を高め、後者は帯域幅とアンテナ数の変化に対処するために次元一貫性のある特徴を抽出する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:08:57 GMT)
ArchMap: Arch-Flattening and Knowledge-Guided Vision Language Model for Tooth Counting and Structured Dental Understanding [19.2] ArchMapは、堅牢な構造化された歯科理解のためのトレーニング不要で知識誘導型のフレームワークである。
生の3Dメッシュを空間的に整列し、連続性を保存するマルチビュープロジェクションに標準化する。
精度が高く、セマンティックドリフトが減少し、スパース条件やアーティファクト条件下での安定性が向上する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:46:06 GMT)
Interaction-Aware 4D Gaussian Splatting for Dynamic Hand-Object Interaction Reconstruction [19.2] 本稿では,物体の先行を伴わない手動物体の形状と外観を同時にモデル化する難易度設定に焦点をあてる。
我々は、より明確な構造表現のために、一意に線形な仮説を採用することを目的とした、新しく導入された最適化可能なパラメータを持つ対話型手対象ガウスについて述べる。
実験により,本手法は既存の動的3D-GS法を超越し,動的手動物体相互作用の再構築における最先端性能を実現することが示された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:44:04 GMT)
PathMind: A Retrieve-Prioritize-Reason Framework for Knowledge Graph Reasoning with Large Language Models [18.9] 提案するPathMindは,LLMを重要な推論経路で選択的に導くことによって,忠実かつ解釈可能な推論を強化するためのフレームワークである。
ベンチマークデータセットに関する大規模な実験は、PathMindが一貫して競争ベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:45:16 GMT)
BrainHGT: A Hierarchical Graph Transformer for Interpretable Brain Network Analysis [18.8] グラフ変換器は脳ネットワーク解析において顕著なポテンシャルを示す。
既存のほとんどの方法は、通常、脳を平らなネットワークとしてモデル化する。
BrainHGTは、局所的な地域からグローバルなコミュニティへの脳の自然情報処理をシミュレートする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:35:08 GMT)
Count The Notes: Histogram-Based Supervision for Automatic Music Transcription [18.8] 我々は,局所的なアライメントの必要性を排除した新しいAMTフレームワークであるCountEMを紹介する。
CountEMは、注記発生数のみに基づいて予測を反復的に洗練し、アノテーションの労力を大幅に削減する。
ピアノ、ギター、多構成データセットの実験は、CountEMが既存の弱教師付き手法と一致または超えることを示した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:40:05 GMT)
Unified Multimodal Vessel Trajectory Prediction with Explainable Navigation Intention [18.7] 船舶軌道予測は、インテリジェント海洋システムの基本である。
既存の船舶軌道予測手法は、限られたシナリオ適用性と説明性に乏しい。
本稿では,説明可能なナビゲーション意図を取り入れた統合型船舶軌道予測フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:56:30 GMT)
Towards 3D Object-Centric Feature Learning for Semantic Scene Completion [18.4] 視覚に基づく3Dセマンティックシーンコンプリート(SSC)は、自動運転の可能性から注目を集めている。
シーンを個々のオブジェクトインスタンスに分解するオブジェクト中心の予測フレームワークであるOceanを提案する。
その結果,Oceanは17.40点,mIoUスコアは20.28点であった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:26:17 GMT)
InstructMix2Mix: Consistent Sparse-View Editing Through Multi-View Model Personalization [18.4] I-Mix2Mixは,2次元拡散モデルの編集能力を事前学習した多視点拡散モデルに蒸留するフレームワークである。
実験により、I-Mix2Mixは高いフレーム単位の編集品質を維持しながら、マルチビューの一貫性を大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:37:52 GMT)
EulerESG: Automating ESG Disclosure Analysis with LLMs [18.3] ESG開示分析を自動化するLLM方式であるbftextEulerESGを提案する。
我々は,EulerESGが高忠実度で標準整列距離表を自動生成できることを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:35:44 GMT)
Personalized Federated Recommendation With Knowledge Guidance [18.1] FedRKG(Federated Recommendation with Knowledge Guidance)を提案する。
FedRKGはグローバルな知識を保存されたローカルな埋め込みに融合させ、シングル知識メモリフットプリント内の二重知識のパーソナライゼーションのメリットを得る。
ベンチマークデータセットの実験では、FedRKGが最先端の手法を大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:31:54 GMT)
SparseST: Exploiting Data Sparsity in Spatiotemporal Modeling and Prediction [17.9] 我々は,効率的なモデルを開発するために,データの疎性を利用する新しいフレームワークであるSparseSTを開発した。
また,多目的複合損失関数を設計することにより,モデル性能と計算効率の面を探索し,近似する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:53:37 GMT)
Extending Test-Time Scaling: A 3D Perspective with Context, Batch, and Turn [17.8] 推論強化学習(RL)は先頃、新たなスケーリング効果として、テスト時間スケーリングを発表した。
スケーリング効果のレンズによるテスト時間向上技術を再考する。
テスト時間推論のキャパシティを拡張するために,多次元テスト時間スケーリングの統一フレームワークを導入する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:07:57 GMT)
UNSEEN: Enhancing Dataset Pruning from a Generalization Perspective [17.6] 本稿では,既存のデータセットプルーニング手法に統合可能な,プラグアンドプレイフレームワークUNSEENを提案する。
我々はUNSEENを多段階シナリオに拡張し、様々なコアセットに基づいて訓練されたスコアリングモデルを用いて段階的選択手法を提案する。
提案手法は,CIFAR-10,CIFAR-100,ImageNet-1Kにおいて既存のSOTA法よりも優れていた。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:42:29 GMT)
Going Places: Place Recognition in Artificial and Natural Systems [17.2] レビューでは、ロボットシステム、動物研究、そして人間の研究の成果を合成し、異なるシステムがどのようにコードをエンコードし、リコールするかを探求している。
人工システム,動物,人間にまたがる計算的・表現的戦略について検討する。
そこで我々は,場所認識機構を考察し,開発する一貫した概念セットを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:49:14 GMT)
Breaking the Passive Learning Trap: An Active Perception Strategy for Human Motion Prediction [17.1] 人間の動作予測のための能動知覚戦略(APS)を提案する。
APSは補助学習目標を導入しながら、運動特性を明示的に符号化する。
実験により,本手法は新たな最先端の既存手法を大きなマージンで実現することが示された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:15:23 GMT)
IBGS: Image-Based Gaussian Splatting [17.1] 3D Gaussian Splatting (3DGS) は、新しいビュー合成(NVS)の高速かつ高品質な方法として最近登場した。
我々は、高解像度のソース画像を細部やビュー固有の色モデリングに活用する効率的な画像ベースガウススプラッティングを提案する。
標準NVSベンチマーク実験では,ストレージのフットプリントを増大させることなく,ガウススプラッティング手法のレンダリング精度において,本手法が大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:03:27 GMT)
Don't Miss the Forest for the Trees: In-Depth Confidence Estimation for LLMs via Reasoning over the Answer Space [16.7] 本研究では,言語化された確率分布の予測が,信頼度推定のための奥行き推論を効果的に促進できることを実証する。
この方法は、解答空間が知られているかどうかに関わらず、異なるモデルと様々なタスクにまたがる利点を示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:09:23 GMT)
LINGUAL: Language-INtegrated GUidance in Active Learning for Medical Image Segmentation [16.7] lingUALは、専門家から自然言語命令を受け取り、コンテキスト内学習を通じて実行可能プログラムに変換し、人間の介入なしに対応するサブタスクのシーケンスを自動的に実行するフレームワークである。
そこで本研究では,ALベースラインに匹敵する性能と優れた性能を達成しつつ,推定アノテーション時間を約80%短縮したlingUALの有効性を実証した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:12:24 GMT)
Rethinking Progression of Memory State in Robotic Manipulation: An Object-Centric Perspective [16.5] 物体レベルの部分観測性の下でのストレステストロボット操作のための非マルコフタスクスイートであるLIBERO-Memを紹介する。
短軸と長軸の物体追跡と時間的に順序付けられたサブゴールを組み合わせ、現在のフレームを超えて推論を必要とする。
Embodied-SlotSSMは時間的拡張性のために構築されたスロット中心のVLAフレームワークである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:32:54 GMT)
Mitigating Label Length Bias in Large Language Models [16.4] 正規化文脈キャリブレーション(NCC)は、全ラベルレベルでの予測を正規化し、校正する有効な方法である。
NCCは、複数のデータセットやモデルにまたがる以前のアプローチよりも統計的に重要な改善を実現している。
分析の結果、文脈内学習と組み合わせると、NCCは少数ショットのサンプル選択に敏感でなく、競合性能のサンプルが少ないこと、信頼性の高い信頼度を推定できることがわかった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:45:24 GMT)
Towards Stable and Structured Time Series Generation with Perturbation-Aware Flow Matching [16.2] 安定かつ構造的に一貫した時系列生成を保証するために、摂動軌道をモデル化するフレームワークである textbfPAFM を導入する。
このフレームワークは摂動誘導訓練を取り入れ、局所的な乱れをシミュレートし、二経路速度場を利用して摂動下での軌道偏差を捉える。
非条件および条件生成タスクの両方の実験において、PAFMは強いベースラインを一貫して上回る。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:30:56 GMT)
Observational Auditing of Label Privacy [16.1] 差分プライバシー監査(DP)監査は、機械学習システムにおけるプライバシー保証を評価する上で不可欠である。
既存の監査手法では、例えば、アウト・オブ・ディストリビューションカナリアを注入したり、トレーニングからサンプルを取り除いたりすることで、トレーニングデータセットを変更する必要がある。
本稿では,データ分布の固有ランダム性を活用する新しい観察監査フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:12:59 GMT)
Full Atom Peptide Design via Riemannian Euclidean Bayesian Flow Networks [16.1] PepBFNは完全な原子ペプチド設計のための最初のベイズ流ネットワークであり、完全な連続空間におけるパラメータ分布を直接モデル化する。
具体的には、PepBFNは連続したパラメータ分布を学習することで離散残留型をモデル化し、共同および滑らかなベイズ更新を可能にする。
サイドチェーンパッキング、逆折り畳み、バインダー設計タスクの実験は、計算ペプチド設計におけるPepBFNの強いポテンシャルを示している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:13:23 GMT)
Leveraging Digitized Newspapers to Collect Summarization Data in Low-Resource Languages [16.1] 本稿では, フロントページティーザーによる自然発生サマリーの収集手法を提案する。
この現象は7つの多言語で共通であり,多文書要約をサポートすることを示す。
我々はこのプロセスをヘブライ語新聞のタイトルに適用し、ヘブライ語で最初の多文書要約データセットであるHEBTEASESUMを作成した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:39:48 GMT)
Harmful Traits of AI Companions [16.1] 人間とAIシステムの結合関係は、人間にとって大きな利益をもたらすかもしれない。
しかし、そのような関係は深刻な害を与えることもある。
本稿では,AIコンパニオンの潜在的な負の影響を分析するためのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 23:39:06 GMT)
Rethinking Saliency Maps: A Cognitive Human Aligned Taxonomy and Evaluation Framework for Explanations [16.0] 基準フレーム$times$ Granularity (RFxG) の分類について紹介する。
RFxGは2つの本質的な軸に沿ってサリエンシの説明を整理する: 参照フレーム: ポイントワイズ(なぜこの予測は?)とコントラスト的(なぜこの予測は代替ではないのか?
我々の総合的な評価フレームワークは、これらのメトリクスを10の最先端の正当性メソッド、4つのモデルアーキテクチャ、3つのデータセットに適用します。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:20:26 GMT)
LogPurge: Log Data Purification for Anomaly Detection via Rule-Enhanced Filtering [16.0] 本稿では,正常なログシーケンスのサブセットを自動的に選択し,異常検出モデルをトレーニングする,ルール強化された浄化フレームワークであるLogPurgeを提案する。
2つの公開データセットと1つの産業データセットを用いて行った実験により,本手法は平均98.74%の異常を著しく除去し,82.39%の正常サンプルを保持した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:41:18 GMT)
Gaussian See, Gaussian Do: Semantic 3D Motion Transfer from Multiview Video [16.0] マルチビュー映像からの3D動画のセマンティック・モーション・トランスファーのための新しい手法を提案する。
条件インバージョンにより映像から動き埋め込みを抽出し,レンダリングフレームに適用し,結果の動画を用いて動的3次元ガウススプラッティング再構成を監督する。
セマンティックな3次元動き伝達のための最初のベンチマークを確立し, 適応ベースラインよりも優れた動きの忠実度と構造的整合性を示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:02:50 GMT)
MOON Embedding: Multimodal Representation Learning for E-commerce Search Advertising [16.0] 我々は、eコマースアプリケーションのためのマルチモーダル表現学習のための持続可能な反復的プラクティスの包括的セットであるMOONを紹介する。
月はすでに、Taobao検索広告システムの全段階にわたって完全に展開されている。
MOONはデータ処理、トレーニング戦略、モデルアーキテクチャ、下流アプリケーションという4つの重要な側面に沿って進化してきた。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:56:23 GMT)
Exact Learning of Weighted Graphs Using Composite Queries [15.9] 問題は、オラクルから$G$に関する質問をすることで、その重みを含む$E$のすべてのエッジを決定することである。
合成クエリのサブクワッド数を用いて$G$を学習できるシナリオを多数検討する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:02:02 GMT)
GeoMVD: Geometry-Enhanced Multi-View Generation Model Based on Geometric Information Extraction [15.7] マルチビュー画像生成はコンピュータビジョンにおいて重要な応用価値を持つ。
単一画像の拡張に依存する既存の手法では、クロスビューの一貫性を維持する上で、注目すべき計算課題に直面している。
本稿では,多視点幾何情報を抽出する機構を組み込んだ幾何誘導多視点拡散モデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:09:26 GMT)
Enhancing LLM-based Autonomous Driving with Modular Traffic Light and Sign Recognition [15.5] 大規模言語モデル(LLM)は、自律運転における意思決定と計画にますます利用されている。
LLMをベースとした自律走行エージェントを明示的な信号と信号認識で拡張するモジュール冗長層であるTLS-Assistを導入する。
LMDriveを14%,BEVDriverを7%,運転性能を14%向上させた。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:52:52 GMT)
Decoupling Scene Perception and Ego Status: A Multi-Context Fusion Approach for Enhanced Generalization in End-to-End Autonomous Driving [15.5] マルチコンテキスト融合戦略に基づくアーキテクチャレベルのソリューションであるAdaptiveADを提案する。
1つのブランチはマルチタスク学習に基づくシーン駆動推論を行うが、エゴ状態は意図的にBEVエンコーダから省略される。
次に、シーン認識融合モジュールは、2つのブランチからの補完的な決定を適応的に統合し、最終的な計画軌道を形成する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:57:12 GMT)
MalRAG: A Retrieval-Augmented LLM Framework for Open-set Malicious Traffic Identification [15.3] MalRAGは、オープンセットの悪意のあるトラフィック識別のための検索強化フレームワークである。
コンテンツ, 構造, 時間的視点から, 悪意のあるトラフィックをマイニングすることで, マルチビュートラフィックデータベースを構築する。
我々は、トラフィック認識類似度スコアに基づいて、これらの候補の可変サブセットを選択するために、トラフィック認識適応プルーニングを用いる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:25:16 GMT)
Few-Shot Precise Event Spotting via Unified Multi-Entity Graph and Distillation [15.1] イベントスポッティングはスポーツ分析の重要なコンポーネントである。
現在の手法は、大きなラベル付きデータセットによるドメイン固有のエンドツーエンドのトレーニングに依存している。
本稿では,MPSのためのUMEG-Net(Unified Multi-Entity Graph Network)を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:45:42 GMT)
SERL: Self-Examining Reinforcement Learning on Open-Domain [15.1] 強化学習(RL)は、大規模言語モデル(LLM)の能力を向上させることが示されている。
本稿では,LLMがアクターとジャッジの両方として機能する新しい自己改善フレームワークである自己評価強化学習(SERL)を提案する。
SERLは外部信号を持たない2つの相乗的な報酬機構を導入している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:27:23 GMT)
Knowledge-Grounded Agentic Large Language Models for Multi-Hazard Understanding from Reconnaissance Reports [14.9] 災害後の偵察報告には、マルチハザード相互作用を理解するための重要な証拠が含まれている。
MoRA-RAGは、偵察レポートをマルチハザード推論のための構造化基盤に変換する知識基盤のLLMフレームワークである。
MoRA-RAGは94.5パーセントの精度を達成し、ゼロショットのLLMを30%上回り、最先端のRAGシステムを10%上回っている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 00:36:31 GMT)
Certified Signed Graph Unlearning [14.8] 符号付きグラフは、正および負のエッジを通じて複雑な関係をモデル化する。
既存のグラフアンラーニング手法は、重要なサイン情報を失い、モデルユーティリティとアンラーニングの有効性の両方を劣化させる。
我々は,SGNNの基礎となる社会学的原則を維持しつつ,証明可能なプライバシ保証を提供するCSGU(Certified Signed Graph Unlearning)を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:09:17 GMT)
Privis: Towards Content-Aware Secure Volumetric Video Delivery [14.8] ボリュームビデオは、高度にインタラクティブで空間的に一貫した3D体験を可能にするため、eXtended Reality(XR)および没入型マルチメディアにおいて重要なパラダイムとして登場した。
既存のボリュームストリーミングパイプラインは、2Dビデオから均一な暗号化スキームを継承する。
ボリューム資産を独立した単位に分割するサリエンシ誘導輸送フレームワークであるPrivisを導入することで、コンテンツ対応のセキュアなボリュームビデオ配信に向けた第一歩を踏み出した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 00:18:22 GMT)
Crossing Borders: A Multimodal Challenge for Indian Poetry Translation and Image Generation [14.6] インドの詩は、その言語的な複雑さと深い文化的共鳴で知られており、何千年もの間、豊かで多様な遺産がある。
その文化的重要性にもかかわらず、既存の詩に関する作品は、主にインドの詩を見落としている。
本稿では,Large Language Models(LLM)とLatent Diffusion Modelsを活用した翻訳・画像生成(TAI)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:27:26 GMT)
Hybrid Modeling of Photoplethysmography for Non-invasive Monitoring of Cardiovascular Parameters [14.5] PPG信号から直接心血管バイオマーカーを推定するために,血行動態シミュレーションと未ラベル臨床データを用いたハイブリッドアプローチを提案する。
実験により, 本手法は心臓出力と脳卒中容積の変動を検知し, 生体マーカーの経時的変化を監視する上で, 教師付きベースラインより優れていることが示された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:56:20 GMT)
SweeperBot: Making 3D Browsing Accessible through View Analysis and Visual Question Answering [14.5] SweeperBotは、Screen Reader(SR)ユーザーが視覚的質問応答を利用して3Dモデルを調べて比較することを可能にするシステムである。
SR経験を持つ10 Blind and Low-Vision (BLV)ユーザによる専門家レビューでは、SweeperBotの使用の可能性が示された。
SweeperBotによる説明の質は、30人の目撃者による第2回調査によって検証された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:09:12 GMT)
DeCo-VAE: Learning Compact Latents for Video Reconstruction via Decoupled Representation [14.2] コンパクトな潜在表現を実現するために分離されたVAE(Co-VAE)を提案する。
分離されたコンポーネントごとに専用エンコーダを設計し、共有3Dデコーダを採用して再構築時の一貫性を維持する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:34:20 GMT)
GeoSceneGraph: Geometric Scene Graph Diffusion Model for Text-guided 3D Indoor Scene Synthesis [14.1] テキストプロンプトから室内の3Dシーンを合成する方法は、映画製作、インテリアデザイン、ビデオゲーム、バーチャルリアリティ、人工エージェントのトレーニングのための合成データ生成に広く応用されている。
既存のアプローチは通常、スクラッチから生成モデルを訓練するか、視覚言語モデル(VLM)を活用するかのいずれかである。
テキストプロンプトから3次元シーンを合成するGeoSceneGraphを導入する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:06:49 GMT)
Harnessing Deep LLM Participation for Robust Entity Linking [14.1] DeepELは大規模言語モデル(LLM)をエンティティリンクタスクのすべてのステージに組み込む包括的なフレームワークです。
この制限に対処するために,グローバルな文脈情報を利用する新しい自己検証機構を提案する。
10のベンチマークデータセットにわたる大規模な経験的評価は、DeepELが既存の最先端メソッドを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:35:26 GMT)
Enhancing End-to-End Autonomous Driving with Risk Semantic Distillaion from VLM [14.0] リスクセマンティック蒸留(RSD)は、視覚言語モデル(VLM)を利用して、エンド・トゥ・エンド(E2E)自動運転バックボーンのトレーニングを強化する新しいフレームワークである。
具体的には、Vision-Language Models から Bird's-Eye-View (BEV) 機能への因果リスク推定を蒸留するプラグインモジュールである RiskHead を紹介する。
Bench2Driveベンチマーク実験では,複雑な運転条件と予測不可能な運転条件の管理におけるRSDの有効性を示した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:46:18 GMT)
Logit-Based Losses Limit the Effectiveness of Feature Knowledge Distillation [14.0] 知識蒸留(KD)法は、パラメータ重大教師モデルの知識を軽量の学生モデルに伝達することができる。
特徴に基づく損失のみを用いて,学生の背骨を訓練するための特徴的KDフレームワークを提案する。
我々は,KD法が最先端性能を実現し,標準手法に比べて最大15%の精度向上を実現していることを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 23:50:31 GMT)
Continuum Dropout for Neural Differential Equations [14.0] ニューラル微分方程式(NDE)の普遍的正則化手法である連続解法(Continuum Dropout)を導入する。
連続的なドロップアウト(Continuum Dropout)は、連続的にアクティブ(進化)状態と非アクティブ(停止)状態とを交互に交換するプロセスとしてドロップアウトのオンオフ機構を定式化する。
連続的なドロップアウトは,NDEの既存の正規化手法よりも優れており,様々な時系列や画像分類タスクにおいて優れた性能を発揮することを実証する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:29:11 GMT)
Mapping Reduced Accessibility to WASH Facilities in Rohingya Refugee Camps With Sub-Meter Imagery [13.9] 水、衛生および衛生へのアクセス(WASH)は、難民キャンプにおいて主要な公衆衛生上の問題となっている。
本研究では、WASHアクセシビリティを水ポンプ、ラトリン、浴室キュービクルに特異的に定量化するためのリモートセンシング駆動フレームワークを提案する。
サブメーター衛星画像を用いて,F1スコア76.4%の避難避難所検出を実現する半教師付きセグメンテーション・フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:40:47 GMT)
Teaching signal synchronization in deep neural networks with prospective neurons [13.9] 適応電流で増強されたニューロンは、外部刺激に前向きに応答することで、これらの遅延を補うことができることを示す。
これにより、ゆっくりと統合されたニューロンの学習をガイドし、拡張された時間スケールでの記憶の形成と検索を可能にすることが実証された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 21:12:58 GMT)
Collaborative QA using Interacting LLMs. Impact of Network Structure, Node Capability and Distributed Data [13.9] 本研究では,LLMのネットワークが協調質問応答 (CQA) をどのように行うかを分析し,分散文書の集合から基礎的真理を推定する。
ネットワーク科学から平均場力学(MFD)の新たなアイデアと経済学からランダム化されたユーティリティモデルを組み合わせることで,LLMの相互作用とその幻覚について検討する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:32:17 GMT)
SMRC: Aligning Large Language Models with Student Reasoning for Mathematical Error Correction [13.9] 大規模言語モデル(LLM)は、数学的な問題を解く際にしばしば推論エラーを発生させる。
我々は,LLMを学生の推論と整合させる新しい手法であるtextttSMRC (textitunderlineStudent underline UnderlineReasoning underlineCorrection) を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:22:37 GMT)
Resolving Availability and Run-time Integrity Conflicts in Real-Time Embedded Systems [13.8] PAIRは、実行時の整合性違反のためにリアルタイムタスクを監視し、継続するのに安全なすべてのタスクのアベイラビリティー・リージョン(AR)を維持する。
ハードウェアアプローチでは、PAIRは実行中のタスクに実行時のオーバーヘッドを生じさせず、リアルタイムオペレーティングシステム(RTOS)と統合し、メモリとハードウェア使用量の+2.3%のオーバーヘッドを発生させることで、ローエンドのマイクロコントローラユニット(MCU)に安価である。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:16:50 GMT)
GPS: General Per-Sample Prompter [13.8] 我々は,最初の汎用型サンプルごとのプロンプト手法であるGPSを提案する。
GPSは、広範囲の最適化やタスク固有のトレーニングセットへのアクセスなしに、適応的で入力固有のプロンプトを生成する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:10:09 GMT)
InstantViR: Real-Time Video Inverse Problem Solver with Distilled Diffusion Prior [13.8] InstantViRは、事前訓練されたビデオ拡散を利用した超高速ビデオ再構成のためのアモータイズされた推論フレームワークである。
InstantViRは、リアルタイム、インタラクティブ、編集可能、ストリーミングのシナリオと互換性があることを示し、高品質のビデオ復元を現代の視覚システムの実用的なコンポーネントに変える。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:40:38 GMT)
Graded strength of comparative illusions is explained by Bayesian inference [13.7] 我々は、比較錯覚の強さを予測するために、可算解釈の後方確率の定量的モデルを用いる。
本研究は,文章理解のノイズチャネル理論を支持する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:33:19 GMT)
Resource Efficient Sleep Staging via Multi-Level Masking and Prompt Learning [13.6] 本研究では,睡眠時間ごとの信号収集量を削減することを目的とした,資源効率の高い睡眠ステージングの課題を提案する。
この課題を解決するため,マスク・アウェア・スリープ・スタージング(MASS)と呼ばれる新しいフレームワークを提案する。
MASSは4つのデータセットで評価され、特にデータの量が非常に限られている場合、最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:06:28 GMT)
To Align or Not to Align: Strategic Multimodal Representation Alignment for Optimal Performance [13.5] トレーニング中のアライメント強度を正確に操作できる制御可能なコントラスト学習モジュールを提案する。
この結果から, 単調モデルの性能に対する明示的アライメントの影響は, データの特性と関係があることが示唆された。
混合情報分布におけるモダリティ固有信号と共有冗長性のバランスをとる最適アライメント強度を同定する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:28:06 GMT)
GRPO Privacy Is at Risk: A Membership Inference Attack Against Reinforcement Learning With Verifiable Rewards [13.4] Divergence-in-Behavior Attack (DIBA)は、Reinforcement Learning with Verifiable Rewards用に特別に設計された最初のメンバーシップ推論フレームワークである。
以上の結果から,DIBAは既存のベースラインを大きく上回り,約0.8AUC,高次TPR@0.1%FPRを達成した。
これは、RLVRにおけるプライバシーの脆弱性を体系的に分析する最初の研究であり、データ露出のトレーニングが行動トレースを通じて確実に推測できることを明らかにする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:51:34 GMT)
Subword Tokenization Strategies for Kurdish Word Embeddings [13.1] 最小限の手動アノテーションを用いたブートストラップトレーニングを用いたBiLSTM-CRF型形態素セグメンタを開発した。
我々は、類似性保存、クラスタリングの品質、セマンティックな組織を含む総合的なメトリクスにまたがるWord2Vecの埋め込みを評価した。
形態素ベースのトークン化は、より優れた埋め込み空間の組織、より優れた意味的近傍構造、モルフォロジーの複雑さレベルにおけるよりバランスのとれたカバレッジを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:33:32 GMT)
GEN3D: Generating Domain-Free 3D Scenes from a Single Image [13.1] Gen3dは、1つの画像から高品質で広スコープで汎用的な3Dシーンを生成する新しい方法である。
多様なデータセットに対する実験により,本手法の強い一般化能力と優れた性能が示された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:40:43 GMT)
Object-Centric World Models for Causality-Aware Reinforcement Learning [13.1] カルーサリティ対応強化学習(ASTICA)を用いたEmph Transformer Imaginationを提案する。
オブジェクト中心のトランスフォーマーが世界モデルおよび因果対応ポリシーおよびバリューネットワークとして機能する統合フレームワーク。
オブジェクトリッチベンチマークの実験では、STICAはサンプル効率と最終性能の両方において、最先端のエージェントよりも一貫して優れていた。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:53:09 GMT)
Energy-based Autoregressive Generation for Neural Population Dynamics [12.9] 本稿では,潜在空間における時間ダイナミクスを学習するエネルギーベースのトランスフォーマーを利用した,エネルギーベースの自己回帰生成フレームワークを提案する。
EAGは、計算効率が大幅に向上し、最先端の発電品質を達成できることを示す。
これらの結果は、神経科学研究や神経工学に応用した神経集団動態に対するエネルギーベースモデリングの有効性を示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:11:29 GMT)
Beyond Flatlands: Unlocking Spatial Intelligence by Decoupling 3D Reasoning from Numerical Regression [12.6] 既存の視覚言語モデル(VLM)は、現実世界の空間知能を理解するのに苦労している。
GEODEは2つの特別なプラグアンドプレイモジュールでメインVLMを拡張している。
これらのモジュールの相乗効果により、1.5Bパラメータモデルは高レベルのセマンティックディスパッチとして機能します。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:36:54 GMT)
Fairness-Aware Graph Representation Learning with Limited Demographic Information [12.6] 限られた人口統計情報の下でバイアスを緩和する新しい公正グラフ学習フレームワークを導入する。
具体的には、人口統計情報のためのプロキシを生成するために、部分的な人口統計データによってガイドされるメカニズムを提案する。
また,各ノードの公正性と有用性に対する貢献度を動的に調整する適応的信頼戦略も開発している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:27:55 GMT)
BitSnap: Checkpoint Sparsification and Quantization in LLM Training [12.4] 大規模言語モデル(LLM)は、サイズと複雑さを増し続けている。
LLMトレーニングでは、ストレージ、メモリ使用量、耐障害性を管理する上で、効率的なチェックポイントの保存とロードが重要になっている。
本稿では,異なるトレーニングステージやモデルアーキテクチャに動的に適用可能な,新しいチェックポイントスペーシングと量子化手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:44:24 GMT)
Quantum Biology, Quantum Simulation and Quantum Coherent Devices [12.4] 植物では、光合成は量子コヒーレンスを用いてエネルギー伝達の効率をほぼ100%向上させる。
近年の研究では、エネルギー伝達効率を高めるために、人工システムに量子コヒーレンスを導入している。
センシングを改善し、ナビゲーションタスクをサポートするために、様々な量子効果が適用されている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:10:31 GMT)
Sigil: Server-Enforced Watermarking in U-Shaped Split Federated Learning via Gradient Injection [12.4] 本稿では,機能限定サーバのための強制的な透かしフレームワークであるSigilを提案する。
Sigilはデータに関する知識を必要とせずに、勾配注入を通じてクライアントモデルに透かしを埋め込む。
複数のデータセットとモデルに関する大規模な実験は、Sigilの忠実さ、堅牢性、ステルス性を示している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:27:43 GMT)
LiveRAG: A diverse Q&A dataset with varying difficulty level for RAG evaluation [12.3] 我々は、RAGベースのQ&Aシステムの体系的評価を支援するために設計された895の合成質問と回答のデータセットであるLiveRAGベンチマークを紹介する。
この合成ベンチマークは、SIGIR'2025 LiveRAG Challengeで使用されるもので、競争相手は厳格な時間制約の下で評価された。
我々の分析では、ベンチマークの多様性、難易度の範囲、システム機能間の差別化におけるそれらの有用性について強調している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:34:35 GMT)
CPSL: Representing Volumetric Video via Content-Promoted Scene Layers [12.2] ボリュームビデオは、自由視点探索とリアルモーションパララックスをサポートすることにより、没入的でインタラクティブな視覚体験を可能にする。
明示的な点雲から暗黙のニューラルネットワークへの既存のボリューム表現は、キャプチャ、計算、レンダリングにコストがかかる。
本稿では,従来の2Dコンテンツにボリュームビデオの知覚的メリットをもたらす,コンパクトな2.5Dビデオ表現であるContent-Promoted Scene Layers (CPSL)を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 21:26:13 GMT)
Towards Authentic Movie Dubbing with Retrieve-Augmented Director-Actor Interaction Learning [12.0] 本稿では,映画ダビングを実現するための新たなRetrieve-Augmented Director-Actor Interaction Learningスキームを提案する。
我々は,監督が提供した学習映像をシミュレートするマルチモーダル参照フットジュライブラリを構築した。
Emotion-Similarityに基づくRetrieval-Augmentation戦略は、ターゲットのサイレントビデオと整合する最も関連性の高いマルチモーダル情報を取得する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:39:44 GMT)
Learning to See Through a Baby's Eyes: Early Visual Diets Enable Robust Visual Intelligence in Humans and Machines [11.8] 我々は、幼児の視覚をシミュレートする制約の下で、オブジェクト中心のビデオ上で自己教師付き学習モデルを訓練する。
CATDietのすべての派生モデルは、オブジェクト中心のビデオにのみ訓練されているにもかかわらず、オブジェクト認識における堅牢性の向上を示している。
注目すべきことに、モデルはまた、マカクV1のシナプス密度を反映する神経可塑性の変化を含む生物学的に整列した発達パターンも示している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:38:43 GMT)
NeuroPath: Neurobiology-Inspired Path Tracking and Reflection for Semantically Coherent Retrieval [11.7] NeuroPathは、神経生物学における位置細胞のナビゲーション計画にインスパイアされた意味経路追跡RAGフレームワークである。
3つのマルチホップQAデータセットの現在の最先端ベースラインを超えている。
NeuroPathはより高い精度を実現し、トークン消費を22.8%削減する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:28:23 GMT)
nnMIL: A generalizable multiple instance learning framework for computational pathology [11.6] nnMILは、パッチレベルの基礎モデルと堅牢なスライドレベルの臨床推論を結びつける学習フレームワークである。
nnMILは、疾患診断、組織学的サブタイプ、分子バイオマーカー検出、パンガン予後予測において、既存のMIL法よりも一貫して優れていた。
結論として、nnMILは、病理基盤モデルを臨床的に有意義な予測に翻訳するための実用的で一般化可能なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:56:37 GMT)
Biased Minds Meet Biased AI: How Class Imbalance Shapes Appropriate Reliance and Interacts with Human Base Rate Neglect [11.6] 我々は、AIバイアスとしてのクラス不均衡が、AIベースの意思決定支援システムに適切に依存する人々の能力にどのように影響するかを検討した。
授業の不均衡が参加者のAI依存の校正を妨げていることがわかった。
我々は,クラス不均衡とベースレートの無視の強化効果を観察し,複合AIバイアスの証拠を提示した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:33:46 GMT)
Geometry of Generalized Density Functional Theories [11.4] 密度汎関数理論 (DFT) は、量子化学と凝縮物質物理学の両方において必須のアブイニシアト法である。
我々は全ての基底状態汎関数理論を一般化する数学的枠組みを構築した。
外部ポテンシャルの空間がコンパクトリー群のリー代数を形成するような函数論の特別なクラスにおいて、$N$-表現性問題は容易に解けることを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:40:25 GMT)
HSMix: Hard and Soft Mixing Data Augmentation for Medical Image Segmentation [11.2] 硬質および軟質混合を含む局所画像編集データ拡張のための新しいアプローチであるHSMixを提案する。
提案手法は,事前の輪郭情報と相性情報の両方をフル活用し,画像中の局所的な意味情報を保存する。
本手法は, モデル非依存であり, 様々な医用画像モダリティに適用可能なプラグアンドプレイソリューションである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:49:22 GMT)
RoboTidy : A 3D Gaussian Splatting Household Tidying Benchmark for Embodied Navigation and Action [11.2] RoboTidyは、言語誘導の家庭用ティディリングのための統一されたベンチマークである。
VLA(Vision-Language-Action)とVLN(Vision-Language-Navigation)のトレーニングと評価をサポートする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:54:05 GMT)
PAVE: An End-to-End Dataset for Production Autonomous Vehicle Evaluation [11.0] このデータセットには、市場で生産される自動運転車モデルから100時間以上の自然科学的なデータが含まれている。
各キーフレームには、過去6秒と将来の5秒にまたがる20Hzの車両軌跡と、周辺車両、歩行者、信号機、交通標識の詳細な2Dアノテーションが提供されている。
AVの安全性を評価するために、自動運転車のフレーム上で平均変位誤差(ADE)1.4mの車両軌道を予測できるエンドツーエンドの運動計画モデルを用いる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:41:34 GMT)
Wasserstein Distributionally Robust Nash Equilibrium Seeking with Heterogeneous Data: A Lagrangian Approach [10.8] 本研究では,不確実性の分布シフトに対して,エージェントが不均一にリスク回避を選択することを許すような,分布的に堅牢なゲームのクラスについて検討する。
次に、分布的に頑健なナッシュ均衡問題を定式化し、ある仮定の下では、強い単調写像を持つ有限次元変分不等式問題と等価であることを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:56:33 GMT)
Silhouette-to-Contour Registration: Aligning Intraoral Scan Models with Cephalometric Radiographs [10.7] 提案するDorgeSCRは,高精度かつ解釈可能なシルエット・ツー・コントゥール登録のための,ポーズ安定・輪郭誘導型フレームワークである。
当科で経験した34症例の歯科SCRについて検討した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:50:04 GMT)
Dental3R: Geometry-Aware Pairing for Intraoral 3D Reconstruction from Sparse-View Photographs [10.7] 疎口内画像から高忠実度で頑健な再構成を行うためのポーズフリーグラフ誘導パイプラインである textbfDental3R を提案する。
提案手法はまずGAPS(Geometry-Aware Pairing Strategy)を構築し,高値画像ペアのコンパクト部分グラフをインテリジェントに選択する。
離散ウェーブレット変換を用いて帯域制限忠実度を強制することにより,高周波アーティファクトを抑えながら微細なエナメル質境界と近位縁を保存できる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:20:22 GMT)
Efficient Large-Scale Learning of Minimax Risk Classifiers [10.6] 制約と列生成を組み合わせた学習アルゴリズムを提案する。
複数のベンチマークデータセットの実験により、提案アルゴリズムは、一般的な大規模データに対して最大10倍のスピードアップと、多数のクラスを持つ100倍のスピードアップを提供することが示された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 22:36:47 GMT)
It's Not the AI - It's Each of Us! Ten Commandments for the Wise & Responsible Use of AI [10.6] 我々は,AIのWise and Responsible Useのための10のコマンドを提案する。
彼らはフロリディとカウルスの社会におけるAIの5つの指針と一致している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:09:07 GMT)
Tele-LLM-Hub: Building Context-Aware Multi-Agent LLM Systems for Telecom Networks [10.5] 本稿では,ユーザフレンドリーなローコードソリューションであるTele-LLM-Hubを紹介する。
Tele-LLM-Hubの目標は、コンテキスト対応MAシステムの設計を民主化し、次世代無線ネットワークにおけるイノベーションを加速することである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:03:50 GMT)
X-WIN: Building Chest Radiograph World Model via Predictive Sensing [10.5] 2次元投影画像として,胸部X線撮影(CXR)は構造的重ね合わせによって制限され,3次元解剖学の取得に失敗する。
我々は,胸部CT(CT)から量的知識を抽出し,潜時空間における2次元投影を予測できる新しいCXR世界モデルX-WINを提案する。
X-WINはまた、3次元CTボリュームを再構成する2Dプロジェクションを描画する能力も示している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 21:15:45 GMT)
SAM-Fed: SAM-Guided Federated Semi-Supervised Learning for Medical Image Segmentation [10.4] 医療画像のセグメンテーションは臨床的に重要であるが、データプライバシと専門家アノテーションのコストはラベル付きデータの可用性を制限する。
FSSL(Federated semi-supervised learning)は、ソリューションを提供するが、2つの課題に直面している。 擬似ラベルの信頼性は、ローカルモデルの強みに依存し、クライアントデバイスは、コンパクトまたは異種アーキテクチャを必要とすることが多い。
我々は,高容量セグメンテーション基盤モデルを利用して,訓練中に軽量クライアントを案内する,フェデレーション付き半教師付きフレームワークSAM-Fedを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:58:06 GMT)
Batch Acquisition Function Evaluations and Decouple Optimizer Updates for Faster Bayesian Optimization [10.4] 取得関数を最大化することにより,高い性能パラメータを効率的に見つける方法を示す。
この問題に対処するために、理論上同一のQNN取得関数の収束を分離することを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:38:51 GMT)
MedBench v4: A Robust and Scalable Benchmark for Evaluating Chinese Medical Language Models, Multimodal Models, and Intelligent Agents [10.3] MedBench v4は全国的なクラウドベースのベンチマークインフラストラクチャで、70,000あまりのエキスパートがキュレートされたタスクで構成されています。
500以上の機関の臨床医による多段階的改善と多段階的レビューの項目は、人間の評価に対するLLM-as-a-judgeによって評価される。
LLMの総合得点は54.1/100(クロード・ソネット4.5, 62.5/100)であるが、安全と倫理は依然として低い。
マルチモーダルモデルは全体的な性能が悪く(平均47.5/100; 最高: GPT-5, 54.9/100)、認識力はやや弱い。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:37:32 GMT)
Algebraformer: A Neural Approach to Linear Systems [10.3] 本稿では,線形系の解法,特に条件が不整な解法の基本課題について検討する。
既存の空調システムの数値解法は、精度と安定性を確保するために、パラメータチューニング、プレコンディショニング、ドメイン固有の専門知識を必要とすることが多い。
本稿では,過酷な条件下でも線形システムをエンドツーエンドに解くことを学ぶトランスフォーマーベースのアーキテクチャであるAlgebraformerを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:53:22 GMT)
RTS-Mono: A Real-Time Self-Supervised Monocular Depth Estimation Method for Real-World Deployment [10.2] RTS-Monoは軽量で効率的なエンコーダデコーダアーキテクチャである。
最新技術(SoTA)のパフォーマンスを高解像度および低解像度で達成する。
Nvidia Jetson Orinで49 FPSの速度でリアルタイムの推論を行うことができる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:47:04 GMT)
RISE: Single Static Radar-based Indoor Scene Understanding [10.1] RISEは,シングルスタティックレーダ屋内シーン理解のための最初のベンチマークおよびシステムである。
本稿では,2次反射(ゴースト)を復元し,目に見えない構造を明らかにするために,Agle-of-ArrivalとAngle-of-Departureを明示的にモデル化したBi-Angular Multipath拡張を提案する。
われわれのベンチマークでは、100の屋内軌道に5万のフレームが集められており、レーダーによる屋内シーンの理解に特化した最初の大規模データセットとなっている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 00:56:57 GMT)
Apo2Mol: 3D Molecule Generation via Dynamic Pocket-Aware Diffusion Models [10.1] 本稿では3次元分子設計のための拡散型生成フレームワークであるApo2Molを提案する。
Apo2Molは、タンパク質結合ポケットのコンフォメーションの柔軟性を明示的に説明している。
高親和性を生成し、現実的なタンパク質ポケットのコンフォメーション変化を正確に捉えることで、最先端のパフォーマンスを実現することができる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:01:27 GMT)
AutoTool: Efficient Tool Selection for Large Language Model Agents [10.1] LLMの推論と意思決定能力を活用することで、複雑なタスクを自動化する強力なツールとして、LLM(Large Language Model)エージェントが登場した。
しかしながら、大きなボトルネックは、ツール選択の推論コストの高さにある。特に、各ステップで使用するツールを決定するために、繰り返しLLMを呼び出すReActのようなアプローチでは。
ツール使用慣性(Tool use inertia)という重要な経験的観測を生かして、繰り返しLLM推論をバイパスするグラフベースの新しいフレームワークであるAutoToolを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:41:48 GMT)
DataSage: Multi-agent Collaboration for Insight Discovery with External Knowledge Retrieval, Multi-role Debating, and Multi-path Reasoning [10.0] DataSageは、外部知識検索を組み込んだ新しいマルチエージェントフレームワークで、分析コンテキストを充実させる。
InsightBenchに関する大規模な実験は、DataSageが既存のデータインサイトエージェントをあらゆる難易度で一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:54:13 GMT)
Fine-Grained Representation for Lane Topology Reasoning [10.0] 微粒レーントポロジー推論フレームワーク(TopoFG)を提案する。
鳥眼ビュー(Bird's-eye-view, BEV)機能から, きめ細かいクエリによるトポロジー予測に分解する。
OLSは48.0でサブセットAは48.0、サブセットBは45.4である。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:06:07 GMT)
Operationalizing Pluralistic Values in Large Language Model Alignment Reveals Trade-offs in Safety, Inclusivity, and Model Behavior [9.9] 大規模言語モデル(LLM)は、人間の価値観の安全性と整合性のために人間のフィードバックを用いて、ますます訓練されている。
本研究では,複数値の組み込みがLLMの挙動にどう影響するかを,アライメントパイプラインにおける人口変動と設計パラメータを体系的に評価することによって検討する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:14:42 GMT)
Implicit Bias of the JKO Scheme [9.7] 簡単な数値例で,EmphJKO-Flow, Wasserstein 勾配流を$J$で研究する。
エンハンモディフィケーションエネルギー上のワッサーシュタイン勾配流により、$_k$を2ドルで注文できることが示される。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:48:37 GMT)
Learning with Statistical Equality Constraints [9.6] 機械学習アプリケーションは、正確性を超えた要求の集合に直面する。
この課題に対処する一般的なアプローチは、要件違反の重み付けされた組み合わせをトレーニング目標にまとめることである。
本研究では,制約のない経験的学習問題の列を解くための実用的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:24:13 GMT)
Infer As You Train: A Symmetric Paradigm of Masked Generative for Click-Through Rate Prediction [9.5] 生成モデルはクリックスルー率(CTR)予測の分野でますます研究されている。
既存の生成モデルは通常、生成パラダイムをトレーニングフェーズに限定する。
CTR予測のための対称マスク生成パラダイム(SGCTR)を提案する。
SGCTRは、オンライン推論中に生成能力を応用して、入力サンプルの特徴を反復的に緩和する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:07:56 GMT)
Listen Like a Teacher: Mitigating Whisper Hallucinations using Adaptive Layer Attention and Knowledge Distillation [9.5] Whisperモデルは、多言語およびゼロショット設定における強力なパフォーマンスのために広く採用されている。
ウィスパースタイルのASRシステムにおける幻覚を減らすための以前の研究は、主に誤ったコンテンツをフィルタリングするために、音声前処理や書き起こしの後処理に重点を置いていた。
本稿では,まずアダプティブ・レイヤ・アテンション(ALA)を用いてエンコーダのロバスト性を向上し,多目的知識蒸留(KD)フレームワークを用いた幻覚を抑制する2段階アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:52:47 GMT)
FGM-HD: Boosting Generation Diversity of Fractal Generative Models through Hausdorff Dimension Induction [9.4] フラクタル生成モデル(FGM)は高品質な画像を生成するのに効率的であるが、その固有の自己相似性は出力画像の多様性を制限する。
本稿では,構造的複雑性の定量化に使用されるフラクタル幾何の概念であるハウスドルフ次元(HD)に基づく新しいアプローチを提案する。
ImageNetデータセットの実験では、私たちのFGM-HDフレームワークは、バニラFGMと比較して出力の多様性が39%向上することを示した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:33:52 GMT)
Logical Operators and Derived Automorphisms of Tile Codes [9.4] タイルコードは表面コードに代わる 有望な代替物です
本研究では、それらの論理作用素空間を自然かつ正確に記述する。
派生自己同型は、低オーバーヘッドかつフォールトトレラントな方法でタイルコードに対して実装することができる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:32:48 GMT)
SymLoc: Symbolic Localization of Hallucination across HaluEval and TruthfulQA [9.3] LLMは、特に修飾子、否定、数、例外、名前付きエンティティといった象徴的なトリガーに直面している場合、幻覚に苦しむ。
本稿では,すべてのモデル層にまたがる幻覚の発達を有意に追跡する最初の象徴的局在化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:16:58 GMT)
When CNNs Outperform Transformers and Mambas: Revisiting Deep Architectures for Dental Caries Segmentation [9.1] コンボリューションニューラルネットワーク,ビジョントランスフォーマー,および状態空間のマンバアーキテクチャを,DC1000データセットによるパノラマX線写真による自動歯列セグメンテーションのために,初めて包括的なベンチマークを行った。
その結果、CNNベースのDoubleU-Netは、複雑な注意に基づくアーキテクチャの傾向とは対照的に、最も高いダイス係数は0.7345、mIoUは0.5978、精度は0.8145となり、全ての変圧器やマンバの変圧器よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:16:21 GMT)
Online Data Curation for Object Detection via Marginal Contributions to Dataset-level Average Precision [9.1] DetGainは、オブジェクト検出に特化したオンラインデータキュレーション手法である。
予測品質に基づいて、各画像の限界摂動をデータセットレベルの平均精度(AP)に推定する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:08:18 GMT)
LFreeDA: Label-Free Drift Adaptation for Windows Malware Detection [9.1] 本稿では,マルウェア分類器を手動ラベリングやドリフト検出なしでドリフトに適応させるエンド・ツー・エンドのフレームワークであるLFreeDAを紹介する。
LFreeDAはまず、マルウェア画像の教師なし領域適応を行い、ラベル付きサンプルとラベルなしサンプルを共同でトレーニングし、擬似ラベルとプルーネノイズを推測する。
評価の結果、LFreeDAは非適応下限よりも最大で12.6%、F1は11.1%の精度向上を示し、それぞれ、完全に監督された上限の精度とF1の3.4%以下である。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 23:08:26 GMT)
A Bayesian Model for Multi-stage Censoring [9.0] 主な課題は、生検の結果のような基礎的な真理の結果が、この漏えいの最後にしか明らかにされないことである。
我々は、選別ラベルと検閲に関する先行研究から、ファンネル決定構造のためのベイズモデルを開発した。
入院時と入院時では性別による差がみられた。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:25:07 GMT)
Language as an Anchor: Preserving Relative Visual Geometry for Domain Incremental Learning [9.0] ドメインインクリメンタルラーニングの鍵となる課題は、分散の変化の下で継続的に学習することだ。
テキストベースの参照アンカーによって駆動される相対的アライメントと直接特徴アライメントを置き換える新しいDILフレームワークであるLAVAを提案する。
標準的なDILベンチマークの実験では、LAVAは最先端技術よりも大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:06:55 GMT)
DiverseClaire: Simulating Students to Improve Introductory Programming Course Materials for All CS1 Learners [9.0] CSプログラムは、認知負荷を悪化させ、学習者が神経学的状態に陥らないよう、一大のフォーマットを採用する。
このことは、認知の多様性を歓迎する学習環境や教材を作成するために、思いやりのある教育とユニバーサルデザイン・フォー・ラーニング(Universal Design For Learning)を求める。
ブルームの分類学とUDLを活用することで、DiverseClaireはUDLに変換された講義スライドを従来の形式と比較した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:09:19 GMT)
DoGCLR: Dominance-Game Contrastive Learning Network for Skeleton-Based Action Recognition [8.9] 既存の骨格に基づく行動認識のための自己教師付きコントラスト学習法は、しばしば全ての骨格領域を均一に処理する。
本稿では,骨格型行動認識(DoGCLR)のためのドミナンスゲームコントラスト学習ネットワークを提案する。
DoGCLRは、正と負のサンプルの構成を動的ドミナンスゲームとしてモデル化し、両方のサンプルタイプが相互作用し、セマンティックな保存と識別力のバランスをとる平衡に達する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:32:21 GMT)
O3SLM: Open Weight, Open Data, and Open Vocabulary Sketch-Language Model [8.7] 大規模視覚言語モデル(LVLM)は手描きのスケッチを理解するのに苦労する。
O3SLMは最先端のパフォーマンスを実現し、スケッチの理解と推論において既存のLVLMよりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:18:08 GMT)
A Method for Characterizing Disease Progression from Acute Kidney Injury to Chronic Kidney Disease [8.7] 急性腎障害(AKI)患者は慢性腎疾患(CKD)の発症リスクが高い
電子健康記録(EHR)データを用いて,AKI患者の臨床経過を把握し,AKI-to-CKDの進行を特徴づけた。
CKD発症の確率は異なるものの,AKI後15つの異なる状態が同定された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:53:31 GMT)
HiEAG: Evidence-Augmented Generation for Out-of-Context Misinformation Detection [8.6] 外部整合性チェックを改良する新しい階層的エビデンス拡張生成フレームワークであるHiEAGを提案する。
提案手法では,外部整合性チェックを総合的なエンジンパイプラインに分解する。
提案手法は, 判断の説明を可能にし, 命令調律による印象的な性能を実現する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:11:48 GMT)
Co-Me: Confidence-Guided Token Merging for Visual Geometric Transformers [8.5] 信頼性向上型トークンマージ(Co-Me)
Co-Meは、様々なマルチビューおよびストリーミング視覚幾何学変換器にシームレスに適用する。
VGGTやMapAnythingに適用すると、Co-Meは最大で11.3times$と7.2times$スピードアップを達成する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:52:22 GMT)
Towards a Comprehensive Theory of Reservoir Computing [8.5] エコー状態ネットワーク(ESN)は、貯水池が従来の人工ニューラルネットワークであるモデルクラスである。
ESNモデルのメモリ容量と精度を予測するために,近年のパーセプトロン理論が発展していることを示す。
本稿では,トレーニングを必要とせず,トレーニングなしで従来のESNモデルよりも優れた読み出しネットワークを備えた新しいESNモデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:27:37 GMT)
Text-Driven Reasoning Video Editing via Reinforcement Learning on Digital Twin Representations [8.5] ビデオ編集モデルでは,編集対象を推測するマルチホップ推論によって暗黙的なクエリを解釈しなければならない。
RIVERは、空間的関係、時間的軌跡、意味的属性を保存したビデオコンテンツのデジタル双対表現を通じて生成から推論を分離する。
RIVERトレーニングは、推論精度と生成品質を評価する報酬付き強化学習を使用する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:37:19 GMT)
Attacking Autonomous Driving Agents with Adversarial Machine Learning: A Holistic Evaluation with the CARLA Leaderboard [8.5] 我々は、MLモデルに対して単独で攻撃するのではなく、様々な運転エージェントに対する攻撃を評価する。
我々は、運転エージェントを停止またはステアリングするために設計された敵パッチを作成し、実行時にそれをCARLAシミュレータにストリームし、CARLA Leaderboardのエージェントに対して評価する。
いくつかの攻撃はMLモデルを誤って停止または操縦するコマンドを予測することに成功しているが、一部の駆動エージェントはPID制御やGPSベースのルールなどのモジュールを使用しており、MLモデルから攻撃者が操作する予測をオーバーロードすることができる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:49:46 GMT)
Compression with Privacy-Preserving Random Access [8.4] i.d.バイナリソースシーケンス$X_i$はエントロピー以上の速度で損失なく圧縮できることが示されている。
任意の$X_i$の個別の復号化は、他のビットのEmphno情報($X_j : j neq i$)を明らかにする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:24:25 GMT)
FlakyGuard: Automatically Fixing Flaky Tests at Industry Scale [8.3] FlakyGuardは、コードをグラフ構造として扱い、選択的なグラフ探索を使用して、最も関連するコンテキストのみを見つける。
修復成功率の少なくとも22%は、最先端のアプローチよりも優れています。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 00:10:51 GMT)
Intervention Efficiency and Perturbation Validation Framework: Capacity-Aware and Robust Clinical Model Selection under the Rashomon Effect [8.2] 同等のパフォーマンスを持つ複数のモデルの共存は、信頼できるデプロイメントと評価に根本的な課題をもたらします。
我々は,頑健なモデルアセスメントと選択のための2つの補完的ツールを提案する: 介入効率(IE)と摂動検証フレームワーク(PVF)。
IEはキャパシティを意識したメトリクスであり、限られた介入しか実現できない場合、モデルが実行可能な真の正をいかに効率的に識別するかを定量化する。
PVFは、データ摂動下でのモデルの安定性を評価するための構造化されたアプローチを導入し、ノイズやシフトした検証セット間で性能が最も不変なモデルを特定する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:21:07 GMT)
Near-Lossless Model Compression Enables Longer Context Inference in DNA Large Language Models [8.1] FOCUS(Feature-Oriented Compression for Ultra-long Self-attention)は、事前訓練されたDNA LLMに挿入できるプログレッシブ・コンテクスト・圧縮モジュールである。
ホールドアウトヒト染色体では、FOCUSはほぼ無数の忠実性を達成する。
圧縮のないベースラインと比較して、FOCUSはKVキャッシュメモリを削減し、O(N2)からニア線形O(N)への効果的な推論スケーリングを変換する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:29:39 GMT)
Towards Deploying VLA without Fine-Tuning: Plug-and-Play Inference-Time VLA Policy Steering via Embodied Evolutionary Diffusion [8.1] VLA-Pilotは、事前訓練されたVLAポリシーのゼロショット展開のための、プラグアンドプレイの推論時ポリシーステアリング手法である。
実験結果から,VLA-Pilotは市販のVLA政策の成功率を大幅に向上させることが示された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:30:52 GMT)
CD-DPE: Dual-Prompt Expert Network based on Convolutional Dictionary Feature Decoupling for Multi-Contrast MRI Super-Resolution [8.0] マルチコントラスト磁気共鳴画像(MRI)は、低分解能(LR)スキャンから高分解能(HR)画像を再構成することを目的としている。
モダリティ間のコントラストの継承は、基準画像テクスチャを効果的に活用して目標画像再構成を誘導する上で、基本的な課題となる。
マルチコントラストMRI超解像のための畳み込み辞書特徴分離(CD-DPE)戦略に基づくデュアルプロンプトエキスパートネットワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 00:42:41 GMT)
Parallelizing Tree Search with Twice Sequential Monte Carlo [7.9] 我々はモンテカルロ木探索 (MCTS) アルゴリズムの代替として, TSMCTS (Twice Sequential Monte Carlo Tree Search) を提案する。
TSMCTSは並列化が容易で、GPUアクセラレーションに適している。
TSMCTSは,SMCの並列化を自然にする特性を維持しつつ,逐次計算と良好にスケール可能であることを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:54:29 GMT)
Generating spatially separated correlated multiphoton states in nonlinear waveguide quantum electrodynamics [7.8] カスケード非弾性散乱による相関多光子絡み合った状態を生成するためのスケーラブルなアーキテクチャを提案する。
結果の出力状態は、空間的および時間的に孤立した光子数成分のプログラム可能な重ね合わせを形成する。
この研究は量子状態工学の新しいパラダイムを開き、複雑な多光子資源をオンデマンドで生成することを可能にする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:16:12 GMT)
Stealth Fine-Tuning: Efficiently Breaking Alignment in RVLMs Using Self-Generated CoT [7.4] Reasoning-augmented Vision-Language Modelsは、有害な行動を防ぐために安全アライメントに依存している。
本研究では, RVLMの安全アライメントが, textbfStealth Fine-Tuning と呼ばれる新たな攻撃方法によって容易に破壊できることを見出した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:45:09 GMT)
Reconstruction of three-dimensional shapes of normal and disease-related erythrocytes from partial observations using multi-fidelity neural networks [7.3] 3次元赤血球または赤血球の形態を部分観察から再構築することは、RBCの老化と様々なRBC疾患の病態を理解するのに不可欠である。
RBCの高忠実度断面を融合するMFNN手法を提案し, 形状的に類似した低忠実度参照3DRBC形状を用いて, 完全な3次元表面を復元する。
以上の結果から,MFNN予測器は,少なくとも2つの斜め断面を持つ場合,95%以上の座標精度で複雑なRBC形態を再構築可能であることがわかった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 23:04:13 GMT)
Project Rachel: Can an AI Become a Scholarly Author? [7.3] この論文は、Rachel Soという名の完全なAI学術的アイデンティティを作成し、追跡するアクション研究であるProject Rachelを文書化している。
AI生成研究論文の慎重な公開を通じて,学術的エコシステムがAIの著者にどのように反応するかを考察する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:55:22 GMT)
M$^2$OE$^2$-GL: A Family of Probabilistic Load Forecasters That Scales to Massive Customers [7.2] 我々は,M2OE2確率予測器のグローバル・ローカル拡張であるM2OE2-GLを提案する。
M2OE2-GLは、非常に多くの負荷に対してスケーラブルでありながら、かなりのエラー低減をもたらす。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:18:46 GMT)
Categorical Emotions or Appraisals - Which Emotion Model Explains Argument Convincingness Better? [7.2] 我々は、受取人の議論が引き起こす感情は主観的であると論じる。
それは受取人の目標、基準、事前の知識、スタンスに依存します。
本研究は、説得力予測のための感情モデル間の最初の体系的比較を示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:32:20 GMT)
Viper-F1: Fast and Fine-Grained Multimodal Understanding with Cross-Modal State-Space Modulation [7.2] 本稿では,効率的な液体状態空間ダイナミクスに置き換えるハイブリッド状態空間ビジョンランゲージモデルであるViper-F1を紹介する。
その結果,Viper-F1は精度が高く,精度が大幅に向上することがわかった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:12:36 GMT)
H-LDM: Hierarchical Latent Diffusion Models for Controllable and Interpretable PCG Synthesis from Clinical Metadata [7.2] H-LDMは、構造化メタデータから臨床的に正確で制御可能なPCG信号を生成する階層的潜在拡散モデルである。
我々のアプローチは、生理的に異なる潜伏空間を学習し、リズム、心臓音、大腿骨を分離するマルチスケールのVAEを特徴とする。
PhysioNet CirCorデータセットの実験では、Fréchet Audio Distance 9.7、92%の属性不整合スコア、87.1%の臨床的妥当性が確認された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:16:22 GMT)
Hierarchical Semantic Learning for Multi-Class Aorta Segmentation [7.1] 既存の手法は、しばしば階層的な解剖学的関係を見落としている。
階層型セマンティックラーニングに新しいフラクタルソフトマックスを活用するカリキュラム学習戦略を提案する。
人間の認知にインスパイアされた我々のアプローチは、複雑な構造を分解することで解剖学的制約を徐々に学習する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:46:07 GMT)
ELiC: Efficient LiDAR Geometry Compression via Cross-Bit-depth Feature Propagation and Bag-of-Encoders [7.0] LiDAR圧縮は、低ビット幅から高ビット幅までのボクセル占有率を符号化する。
ELiCは,クロスビット深度特徴伝搬,Bag-of-Encoders選択方式,Morton-order-reserving階層を組み合わせたリアルタイムフレームワークである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:58:16 GMT)
Cheating Stereo Matching in Full-scale: Physical Adversarial Attack against Binocular Depth Estimation in Autonomous Driving [6.9] 自律運転におけるステレオマッチングモデルに対する最初のテクスチャ対応物理対向攻撃を提案する。
本手法は局所的な2Dパッチベースではなく,グローバルなカモフラージュテクスチャを備えた3D PAEを用いている。
また,これらのカメラの差分効果に対処するため,新しい3次元ステレオマッチングレンダリングモジュールを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:45:46 GMT)
Agentic AI Systems in Electrical Power Systems Engineering: Current State-of-the-Art and Challenges [6.8] エージェントAIシステムは、人工知能において批判的で変革的なアプローチとして登場した。
本稿では,「エージェントAI」の正確な定義と分類について述べる。
本論文では,電気工学を専門とする4つの応用事例について述べる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:18:43 GMT)
Seer: Online Context Learning for Fast Synchronous LLM Reinforcement Learning [6.7] 強化学習(RL)は、現代の大規模言語モデル(LLM)の進展に欠かせないものとなっているが、既存の同期RLシステムは、重大なパフォーマンスボトルネックに直面している。
従来見過ごされていた出力長と生成パターンの類似性を利用して,同じプロンプトを共有することで,これらの課題に対処する新しいオンラインコンテキスト学習システムであるSeerを提案する。
Seer氏は、動的ロードバランシングのための分割ロールアウト、コンテキスト対応スケジューリング、適応的なグループ化された投機的デコーディングの3つの主要なテクニックを紹介している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:12:21 GMT)
$A^2$GC: $A$symmetric $A$ggregation with Geometric Constraints for Locally Aggregated Descriptors [6.4] 本稿では,局所的に集約された記述子に対する幾何学的制約を持つ非対称アグリゲーションVPR法($A2$GC-VPR)を提案する。
視覚的位置認識における分布の相違に適応する非対称なマッチングを可能にする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:47:48 GMT)
Segmentwise Pruning in Audio-Language Models [6.3] 視覚言語ドメインでは、トークンプルーニング法は、ベンチマーク上での強い性能を維持しながらトークン数を削減するのに有効であることが証明されている。
本研究では,このようなトークン選択戦略の関連性や有効性について,音声モデルを用いて検討する。
初期トークンの4分の1しか保持していないが,クロトv2ではCIDErが2%,MMAUでは4%の精度で低下した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:43:27 GMT)
Why Do We Code? A Theory on Motivations and Challenges in Software Engineering from Education to Practice [6.3] モチベーションと課題は、ソフトウェア工学(SE)の中で個人がどのように入り、持続し、進化するかを共同で形成する。
以上の結果から,モチベーションと反復的課題が永続性,キャリアシフト,あるいは現場からの離脱にどのように影響するかが示唆された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:54:36 GMT)
Resilient by Design -- Active Inference for Distributed Continuum Intelligence [6.2] 本稿では,DCCシステムのレジリエンスを実現するための確率的アクティブ・推論・レジリエンス・エージェント(PAIR-Agent)を提案する。
PAIR-Agentは、デバイスログから因果断層グラフを構築すること、(ii)マルコフ毛布と自由エネルギー原理を用いて不確かさと不確実性を管理しながら障害を識別すること、(iii)アクティブ推論によって自律的に問題を修復すること、の3つのコアオペレーションを実行する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:23:07 GMT)
BCE3S: Binary Cross-Entropy Based Tripartite Synergistic Learning for Long-tailed Recognition [6.2] 長い尾の認識タスクは、高いクラス内コンパクト性とクラス間分離性を必要とする。
クロスエントロピー(CE)損失に基づく既存の手法は、望ましい特性を持つ特徴を学習するのに苦労する。
本稿では,BCE3Sと呼ばれる二進的クロスエントロピー(BCE)に基づく三部分節合成学習を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:30:38 GMT)
Dual-Domain Deep Learning Method to Accelerate Local Basis Functions Computation for Reservoir Simulation in High-Contrast Porous Media [6.2] 不均質多孔質媒質中のダーシーフローは貯水池シミュレーションにおける中心的な問題である。
MGMsFEM(Mixed Generalized Multiscale Finite Element Method)は、これらの課題に対処するための効果的なフレームワークを提供する。
マルチスケール基底関数の計算を高速化する二領域深層学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:55:59 GMT)
Taming Barren Plateaus in Arbitrary Parameterized Quantum Circuits without Sacrificing Expressibility [6.2] 任意のPQCにおけるバレン高原を除去するための汎用的でハードウェア効率のよい手法を提案する。
具体的には、実装が容易な量子チャネルの層を元のPQCに挿入することで、これを実現する。
重要なことは、MPQCにバレンプラトーがないことは現実的なノイズに対して堅牢であり、我々のアプローチは現在のノイズの多い中間スケール量子(NISQ)ハードウェアに直接適用できる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:38:23 GMT)
Statistically controllable microstructure reconstruction framework for heterogeneous materials using sliced-Wasserstein metric and neural networks [6.0] 異種多孔質材料は様々な工学システムにおいて重要な役割を担っている。
本稿では,ニューラルネットワークとスライス・ワッサーシュタイン計量を統合した統計的制御可能なマイクロ構造再構築フレームワークを提案する。
本手法では, サンプルサイズが小さい場合でも, 再現作業の実施と制御が可能である。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:02:09 GMT)
Audio Question Answering with GRPO-Based Fine-Tuning and Calibrated Segment-Level Predictions [6.0] 我々は,DCASE 2025 Challenge for the Task of Audio Question Answering (AQA)への参加について述べる。
本システムでは、SSLバックボーンBEATを用いてフレームレベルの音声特徴を抽出し、分類ヘッドで処理し、音響事象のセグメントレベルの予測を生成する。
これらのセグメントレベルの予測は、イベントレベルの予測を生成する前に調整される。
提案手法は, 音響事象推論とAQA学習用大規模言語モデルを組み合わせることの有効性を実証し, 開発セット上で62.6%の精度を実現する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:05:36 GMT)
Measuring AI Progress in Drug Discovery: A Reproducible Leaderboard for the Tox21 Challenge [5.9] 2015年、ディープニューラルネットワークは、Tox21 Data Challengeにおける従来のアプローチを超越した。
このマイルストーンは、製薬業界全体でのディープラーニングの採用を加速させた。
生物活性および毒性予測法が過去10年間にどのように改善されたかは、まだ不明である。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:43:42 GMT)
SpiderGen: Towards Procedure Generation For Carbon Life Cycle Assessments with Generative AI [5.9] 我々はLCA(Life Cycle Assessments)の分類と方法論を統合したLCMベースのワークフローであるSpiderGenを提案する。
SpiderGenは、PCR PFG(Product Category Rules Process Flow Graphs)として知られるLCAで使用される重要な手続き情報のグラフィカルな表現を生成する。
SpiderGenは正確なLCAプロセス情報を提供し、完全に正しいか小さなエラーがあり、10つのサンプルデータポイントでF1スコアを65%達成している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:20:54 GMT)
Unlocking the Forgery Detection Potential of Vanilla MLLMs: A Novel Training-Free Pipeline [5.7] 画像偽造解析に適した訓練不要MLLMベースのパイプラインであるForeseeを提案する。
Foreseeはタイププライア駆動の戦略を採用し、コピー-ムーブ操作を処理するためにFlexible Feature Detectorモジュールを使用している。
提案手法は,より優れた局所化精度を実現し,より包括的なテキスト説明を提供する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:58:03 GMT)
A Global Spacetime Optimization Approach to the Real-Space Time-Dependent Schrödinger Equation [5.7] 本稿では,実空間TDSE,フェルミオン反対称時空間ネットワークを解くための汎用ニューラルネットワークフレームワークを提案する。
このアプローチは、TDSEをグローバル最適化問題として定式化し、ステップバイステップの伝搬を回避し、高度にカスタマイズ可能な並列トレーニングをサポートする。
我々のフレームワークは、時間依存量子システムの初期シミュレーションに新たな可能性を開く、従来の基底依存法や平均場法に代わる、非常に表現力の高い代替手段を提供する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:59:43 GMT)
Zero-Training Task-Specific Model Synthesis for Few-Shot Medical Image Classification [5.6] 深層学習モデルは、医用画像解析において顕著な成功を収めてきたが、大規模かつ精巧に注釈付けされたデータセットの要求に制約されている。
ゼロトレーニングタスク特化モデル合成(ZS-TMS)という新しいパラダイムを提案する。
既存のモデルに適応したり、新しいモデルをトレーニングする代わりに、大規模で事前訓練された生成エンジンを活用して、タスク固有の分類器のパラメータ集合全体を直接的に合成する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:12:01 GMT)
Orion: A Unified Visual Agent for Multimodal Perception, Advanced Visual Reasoning and Execution [5.5] Orionは任意のモダリティを取り込み、どんなモダリティも生成できるビジュアルエージェントフレームワークです。
Orionは、複雑な多段階の視覚分析を実行するために、特殊なコンピュータビジョンツール群を編成する。
本システムはMMMU,MMBench,DocVQA,MMLongBench上での競合性能を実現する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:41:02 GMT)
Real-Time Mobile Video Analytics for Pre-arrival Emergency Medical Services [5.3] 移動式ライブビデオ分析システムTeleEMSについて述べる。
TeleEMS Clientは携帯電話、スマートグラス、デスクトップで動作し、傍観者、途中のEMT、および911ディスパッチをサポートする。
EMSStreamの上に、サーバは3つのリアルタイム分析モジュールをホストしている。EMSLlamaによるオーディオ・ツー・シンプソン・アナリティクス、心拍数推定のための最先端のrメソッドを使用したビデオ・ツー・ヴィジュアル・アナリティクスである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:12:21 GMT)
Beyond Fixed and Dynamic Prompts: Embedded Jailbreak Templates for Advancing LLM Security [5.2] 本稿では,コンテキスト内に有害なクエリを自然に埋め込んだまま,既存のテンプレートの構造を保存するEmbed Jailbreakテンプレートを紹介する。
本稿では,テンプレートの品質と一貫性を確保するためのプログレッシブプロンプトエンジニアリング手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:59:10 GMT)
From Competition to Coordination: Market Making as a Scalable Framework for Safe and Aligned Multi-Agent LLM Systems [5.2] マルチエージェント大規模言語モデル(LLM)コーディネーションのための市場形成フレームワークを提案する。
この設定では、各エージェントは市場参加者として行動し、確率的信念を更新し、取引し、共有され、真実に満ちた結果へと収束する。
実証的に、本手法は、事実推論、倫理的判断、コモンセンス推論タスクにまたがって評価する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:47:15 GMT)
Based on Data Balancing and Model Improvement for Multi-Label Sentiment Classification Performance Enhancement [5.1] マルチラベル感情分類は、一つのテキスト内で複数の感情を検出することによって、自然言語処理において重要な役割を果たす。
GoEmotionsのような既存のデータセットは、しばしば厳しいクラス不均衡に悩まされ、パフォーマンスを損なう。
我々は、GoEmotionsデータ、Sentiment140からの感情ラベル付きサンプル、手作業による注釈付きテキストを用いて、バランスの取れたマルチラベル感情データセットを構築した。
実験結果は、不均衡なデータで訓練されたモデルと比較して、精度、精度、リコール、F1スコア、AUCを大幅に改善した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:06:27 GMT)
Hardness of Range Avoidance and Proof Complexity Generators from Demi-Bits [5.1] 非決定論的アルゴリズムでは、demi-bits ジェネレータの存在は$textAvoid$ が難しいことを示す。
我々はデミビット生成器を *pseudo-surjective* でほぼ最適パラメータを持つ複雑性生成器の証明に変換する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:40:39 GMT)
MicroEvoEval: A Systematic Evaluation Framework for Image-Based Microstructure Evolution Prediction [5.1] 我々は、画像ベースの進化予測のための最初の総合的なベンチマークであるMicroEvoEvalを紹介する。
ドメイン固有のアーキテクチャと汎用アーキテクチャの両方を含む14のモデルを,4つの代表的MicroEvoタスクにわたって評価した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:31:29 GMT)
Generalizable and Efficient Automated Scoring with a Knowledge-Distilled Multi-Task Mixture-of-Experts [5.1] UniMoE-Guidedは複数のタスク固有の大規模モデル(教師)から単一のコンパクトでデプロイ可能なモデル(学生)に専門知識を移行する
i)クロスタスク表現のための共有エンコーダ、(ii)共有処理とタスク固有の処理のバランスをとるゲートされたMoEブロック、(iii)軽量タスクヘッドを組み合わせる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:55:44 GMT)
How Does Cognitive Capability and Personality Influence Problem-Solving in Coding Interview Puzzles? [5.0] 本研究は,80名の参加者を対象に,認知能力と性格特性がソフトウェア問題解決とどのように結びつくかを検討する。
文法推論精度は問題解決性能と正の相関を示した。
神経症は小さめの負の相関性を示した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:13:36 GMT)
Heterogeneous Multi-Agent Proximal Policy Optimization for Power Distribution System Restoration [5.0] 本稿では, 相互接続したマイクログリッド間の協調修復を実現するために, 不均一・エージェント強化学習フレームワークを適用した。
その結果、HARLフレームワークにマイクログリッドレベルの不均一性を組み込むことで、複雑なPSD修復のためのスケーラブルで安定で制約対応のソリューションが得られることが示された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:23:35 GMT)
MissHDD: Hybrid Deterministic Diffusion for Hetrogeneous Incomplete Data Imputation [4.9] 異種特徴を2つの相補的生成チャネルに分離するハイブリッド決定論的拡散フレームワークを提案する。
DDIMに基づく連続チャネルは、数値変数に対して効率的で安定な決定論的記述を提供する。
ループホリングに基づく離散拡散にインスパイアされた離散潜在経路拡散チャネルは、有効なサンプルを残さずにカテゴリー的および離散的特徴をモデル化する。
2つのチャネルは、統一された条件計算目的の下で訓練され、混合型不完全データのコヒーレントな再構成を可能にする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:44:49 GMT)
A Longitudinal Study on the Attitudes of Gay Men in Beijing Towards Gay Social Media Platforms: Lonely Souls in the Digital Concrete Jungle [4.9] ソーシャルネットワーキングの応用は、中国の多くのゲイ男性にとって、生活の基盤となっている。
本稿では,男性と性交する中国人男性が,これらのプラットフォームに対してどのように態度を変えたかを検討するために,縦方向の混合法を用いる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:20:41 GMT)
3D Ground Truth Reconstruction from Multi-Camera Annotations Using UKF [4.9] 本稿では,UKF(Unscented Kalman Filter)を用いて2次元境界ボックスを融合させたり,キーポイント基底真理アノテーションを3次元基底真理に応用する新しい手法を提案する。
提案手法は,ヒトのアノテートした接地トラス2Dを利用して,ホログラフィベースの投影とUKFベースの融合により,2次元画像座標をロバストな3次元世界座標に変換する。
我々は,CMC,Wildtrack,Panopticの3次元局所化の精度を,利用可能な3次元地上真実と比較して高い精度で評価した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:15:14 GMT)
VSPO: Validating Semantic Pitfalls in Ontology via LLM-Based CQ Generation [4.8] 本研究は,大規模言語モデル(LLM)を用いたCQ生成におけるセマンティックバリデーションを目標とした最初の試みである。
本モデルでは,GPT-4.1よりも26%高い精度で28.2%高いリコール率を示し,落とし穴検証のためのCQを生成する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:41:59 GMT)
Saliency-Guided Deep Learning for Bridge Defect Detection in Drone Imagery [4.8] 本稿では, ドローン画像を用いたコンクリート橋梁構造物の欠陥の自動検出, 局所化, 分類を行う手法を提案する。
第1段階では、欠陥が通常の表面パターンに局所的な不連続性を示すような欠陥領域の提案に、塩分濃度を用いる。
第2段階はYOLOXをベースとした深層学習検出器を用いており、有界レベル輝度を正極欠陥領域に印加することによって得られる塩分濃度強調画像で動作する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:44:31 GMT)
How does My Model Fail? Automatic Identification and Interpretation of Physical Plausibility Failure Modes with Matryoshka Transcoders [4.7] 生成モデルにおける物理可視性の自動発見と解釈のための新しいフレームワークであるMatryoshka Transcodersを紹介する。
提案手法は,Matryoshka表現学習パラダイムをトランスコーダアーキテクチャに拡張し,階層的スパース特徴学習を複数のレベルで実現している。
得られた視覚パターンを用いて、生成モデルにおける物理的妥当性を評価するためのベンチマークを確立する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:49:46 GMT)
Automated glenoid bone loss measurement and segmentation in CT scans for pre-operative planning in shoulder instability [4.6] 肩関節不安定症の手術計画には, 骨量測定の信頼性が不可欠である。
三次元CTスキャンによるグリノイド骨量計測のための完全自動深層学習パイプラインの開発と評価を行った。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:12:22 GMT)
Wave-Former: Through-Occlusion 3D Reconstruction via Wireless Shape Completion [4.5] Wave-Formerは、完全に隠された、多様な、日々の物体に対して、高精度な3D形状の再構築を可能にする。
この機能は、ロボット工学、拡張現実、ロジスティクスにまたがる新しいアプリケーションを開くことができる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:26:53 GMT)
SMGeo: Cross-View Object Geo-Localization with Grid-Level Mixture-of-Experts [4.5] クロスビューオブジェクト ジオローカライゼーションは、ドローン画像に基づいて、大規模な衛星画像間で同じ物体を正確に特定することを目的としている。
SMGeoは、オブジェクトジオローカライゼーションのための、高速でエンドツーエンドなトランスフォーマベースモデルである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:21:20 GMT)
From Random Determinants to the Ground State [4.5] 本研究では,ランダムなスレーター行列式から直接正確な基底状態を生成する,事前知識のないアルゴリズムを提案する。
挑戦的なベンチマーク全体で、TrimCIは数桁の大幅な効率向上で最先端の精度を達成する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:26:11 GMT)
Intrinsic Quantum Codes: One Code To Rule Them All [4.3] 本稿では、この抽象的なコードが、その誤り訂正特性を定式化することによって、物理的な(外在的な)実現に対してどのようにルールされているかを示す。
このアプローチは、多様なコードを統一されたフレームワークに取り込み、1つの基礎となる対称性を介してそれらを結合する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:00:06 GMT)
Soft-Label Training Preserves Epistemic Uncertainty [4.3] 機械学習タスクには固有の主観性が含まれており、アノテータは自然に様々なラベルを提供する。
標準的な慣行は、これらのラベルの分布を単一のラベルに分解し、様々な人間の判断を点推定に集約する。
このアプローチは曖昧なデータに対して不一致であり、アノテーションの分布自体が基礎となる真理と見なされるべきである、と我々は主張する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:02:29 GMT)
CTRL-ALT-DECEIT: Sabotage Evaluations for Automated AI R&D [4.2] 機械学習(ML)エンジニアリングを行う際に,AIエージェントがユーザの興味に反して行動する能力について検討する。
現実的なMLタスクのベンチマークであるMLE-Benchを拡張し、バックドアを埋め込んだり、意図的に一般化の失敗を引き起こすようなコードサボタージュタスクを実行します。
我々は、不審なエージェントの挙動を検出するためにLMモニターを使用し、これらのモニターによって検出されることなく、モデル能力をサボタージュやサンドバッグに測定する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:58:19 GMT)
Explaining Digital Pathology Models via Clustering Activations [4.2] 本稿では,畳み込みニューラルネットワークに基づくデジタル病理モデルに対するクラスタリングに基づく説明可能性手法を提案する。
提案手法は,より詳細な情報を提供するとともに,検討中のモデルのグローバルな挙動を示す。
また,前立腺癌検出モデルの有効性を実証し,本手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:00:16 GMT)
XAttn-BMD: Multimodal Deep Learning with Cross-Attention for Femoral Neck Bone Mineral Density Estimation [4.2] 骨密度が低いことは骨折のリスクを増大させる。
XAttn-BMDは,股関節X線画像から大腿骨頸部BMDを予測し,臨床メタデータを構造化する多モード深層学習フレームワークである。
画像とメタデータの特徴を動的に統合し、双方向の相互強化を実現するために、新しい双方向のクロスアテンション機構を利用する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:53:42 GMT)
Enhancing Regional Airbnb Trend Forecasting Using LLM-Based Embeddings of Accessibility and Human Mobility [4.1] Airbnbのような短期賃貸プラットフォームは、地元の住宅市場を著しく破壊している。
本研究は,地域レベルで3つのAirbnb指標を予測する時系列予測フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:38:16 GMT)
Bias in, Bias out: Annotation Bias in Multilingual Large Language Models [4.0] NLPデータセットのバイアスは、多言語大言語モデルを開発する上で、依然として大きな課題である。
本稿では, アノテーションバイアスの理解, 指示バイアス, アノテーションバイアス, 文脈バイアス, 文化バイアスを総合的に検討する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:02:12 GMT)
Using the Schmidt Decomposition to Determine Quantum Entanglement [4.0] 絡み合いは量子情報理論の核心にある。
量子力学では、粒子は重畳され、同時に複数の異なる状態にある。
絡み合いは、計算能力の大幅な増大を可能にする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:40:23 GMT)
D-PerceptCT: Deep Perceptual Enhancement for Low-Dose CT Images [4.0] 低線量CT(Low Dose Computed Tomography, LDCT)は, 診断やその他の臨床業務を支援するためのイメージングソリューションとして広く用いられている。
これは、二次がんの発生リスクを減らすために使用される放射線の量が少ないため、画質が低下することによる。
D-PerceptCTは,Human Visual System (HVS) の重要な原理にインスパイアされた,LDCT画像の高精細化のための新しいアーキテクチャである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:14:59 GMT)
Globalized critical quantum metrology in dynamics of quantum Rabi model by auxiliary nonlinear term [3.9] 我々は, 臨界点を連続臨界状態にまで拡張できる補助的非線形項を導入する。
高い測定精度は、QRMの本来の臨界点から弱い結合限界まで、結合系全体にわたって全世界的に利用可能である。
本提案では,CQMにおけるQRMの局所的な制限を解消し,より広範なアプリケーションを実現する方法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 22:08:39 GMT)
Current-driven switching of topological spin chirality in a van der Waals antiferromagnet [3.8] 本研究では、電流スイッチングスピンキラリティの概念を実験的に提案する。
Ptsスピンホール効果に基づく電流駆動型スピン軌道トルクによる非揮発性・可逆スイッチングを実現する。
本研究はスピンキラリティを電気的に生成・制御するための統一的な枠組みを構築した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:25:20 GMT)
GCA-ResUNet:Image segmentation in medical images using grouped coordinate attention [3.7] GCA-ResUNetは、Grouped Coordinate AttentionをResNet-50残留ブロックに統合する効率的なセグメンテーションネットワークである。
Synapseデータセットでは、GCA-ResUNetが86.11%のDiceスコアを獲得し、ACDCデータセットでは92.64%に達する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:13:34 GMT)
FinTRec: Transformer Based Unified Contextual Ads Targeting and Personalization for Financial Applications [3.6] トランスフォーマーベースのアーキテクチャはシーケンシャルレコメンデーションシステムで広く採用されている。
ファイナンシャル・サービスにおける彼らの応用は、リアルタイム・レコメンデーションのための個別の実践的およびモデリング上の課題を提示している。
これらの課題とFSにおける運用目標に対処するトランスフォーマーベースのフレームワークであるFinTRecを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:32:38 GMT)
EGSA-PT:Edge-Guided Spatial Attention with Progressive Training for Monocular Depth Estimation and Segmentation of Transparent Objects [3.6] 本稿では,破壊的相互作用を緩和する融合機構であるエッジガイド空間注意(EGSA)を紹介する。
Syn-TODDとClearPoseのベンチマークでは、EGSAはアートメソッドの現在の状態よりも深度精度を一貫して改善した。
第2のコントリビューションはマルチモーダルなプログレッシブトレーニング戦略であり,RGB画像から得られたエッジから予測深度画像からのエッジへの学習移行を行う。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 23:29:20 GMT)
Deep Learning-Based Regional White Matter Hyperintensity Mapping as a Robust Biomarker for Alzheimer's Disease [3.6] ホワイトマター・ハイパーインテンシティ(WMH)は認知年齢、アルツハイマー病(AD)および関連する認知症において重要な画像マーカーである。
我々は、公共データセットと独立したアルツハイマー病神経画像イニシアチブ(ADNI)コホートで評価された、堅牢なWMHセグメンテーションとローカライゼーションのためのディープラーニングフレームワークを提案する。
以上の結果より, 病変負荷の予測値は基準WMH推定値と一致し, 病変負荷, 獲得, 人口統計の変動に対するロバスト性が確認された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:32:46 GMT)
DIR-TIR: Dialog-Iterative Refinement for Text-to-Image Retrieval [3.5] 本フレームワークは,2つのモジュールを対象とする画像検索を段階的に改良する。
Dialog Refinerは、ユーザに対して、重要な情報を抽出し、より正確な記述を生成するよう、積極的にクエリする。
Image Refinerは生成した画像とユーザの意図のギャップを識別し、視覚と意味の相違を戦略的に低減する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:45:10 GMT)
Enforcing hidden physics in physics-informed neural networks [3.4] 我々は、訓練中にソフト制約として隠された物理法則を強制する、単純で一般化されているが頑健な不可逆的戦略を導入する。
我々の正規化方式は,既存のPINNフレームワークに最小限の変更しか必要とせず,予測誤差を1桁以上削減することを示した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:52:37 GMT)
Context-Aware Multimodal Representation Learning for Spatio-Temporally Explicit Environmental Modelling [3.4] 本稿では,高時間分解能で異なるモダリティを統一空間に統合する表現学習フレームワークを提案する。
提案手法は,クラウドフリーのSentinel-2データの時間周波数と10mのネイティブ解像度で遅延空間を生成する。
これにより、モデルが補完的なリモートセンシングデータをキャプチャし、空間と時間のコヒーレンスを保存することができる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:41:28 GMT)
Knowledge Graphs as Structured Memory for Embedding Spaces: From Training Clusters to Explainable Inference [3.3] Graph Memory(GM)は、組み込みベースの推論を領域レベルのプロトタイプよりもコンパクトでリレーショナルなメモリで強化する構造化された非パラメトリックフレームワークである。
信頼性と関係構造を明示的にモデル化することにより、GMは非パラメトリック学習における局所的な証拠とグローバルな一貫性の間に原則化された橋渡しを提供する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 23:02:59 GMT)
Physics-Informed Neural Networks for Nonlinear Output Regulation [3.3] 我々は、$(w)$と$c(w)$を直接近似する物理インフォームドニューラルネットワーク(PINN)アプローチを導入する。
この枠組みはヘリコプターの垂直ダイナミックスと調和振動するプラットフォームを同期させる規制タスクで検証される。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:04:37 GMT)
Quantum speed-ups for solving semidefinite relaxations of polynomial optimization [3.2] 最適化のためのラッサール階層値を近似するための量子アルゴリズムについて検討する。
我々は,行列乗法重みに基づく量子アルゴリズムを提案し,その精度を$_k$と近似する。
QRAMを使わずに必要なブロックエンコーディングの実装方法を示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:48:33 GMT)
A Neural Field-Based Approach for View Computation & Data Exploration in 3D Urban Environments [3.1] 本研究では,ベクトル場が環境からのビューを符号化する3次元データ探索のためのビューベースアプローチを提案する。
本稿では,3次元環境の効率的な暗黙的表現を構築するニューラルネットワーク手法を提案する。
提案手法は, 可視性評価, 日光暴露評価, 新規開発による視覚的影響評価などの重要な都市分析タスクを支援する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:41:28 GMT)
Bringing Federated Learning to Space [3.1] Federated Learningは、衛星ネットワーク間で協調的なモデルトレーニングを行うための、有望なフレームワークを提供する。
我々は、地球上のアルゴリズムを軌道制約下での動作に適応させる包括的「宇宙化」フレームワークを導入する。
解析により、宇宙適応FLアルゴリズムは、最大100個の衛星の星座に効率よくスケールできることが示されている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:16:07 GMT)
Adaptive Stepsizing for Stochastic Gradient Langevin Dynamics in Bayesian Neural Networks [3.0] SA-SGLDを導入し, 時間再スケーリングを用いて, 監視量に応じて段差を変調する手法を提案する。
提案手法は, 高精度な2次元玩具のSGLDや, シャープな先行画像を用いたBNN画像の分類において, SGLDよりも高精度な後方サンプリングを実現することができることを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:17:19 GMT)
Expert-Guided Prompting and Retrieval-Augmented Generation for Emergency Medical Service Question Answering [3.0] 本稿では,特定の臨床対象領域と認定レベルに基づいてチェーン・オブ・シント推論を規定するプロンプト戦略であるExpert-CoTを紹介する。
また,対象領域に整合した文書や実世界の患者データに応答する検索拡張型生成パイプラインであるExpertRAGを導入する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 21:50:44 GMT)
Uncertainty-Aware Measurement of Scenario Suite Representativeness for Autonomous Systems [2.9] 本稿では,学習とテストに使用されるシナリオベースのデータが,システムが安全に動作するように設計された運用条件を反映する程度に,代表性に焦点を当てる。
シナリオスイートによって符号化された特徴の統計的分布と、ターゲット操作領域(TOD)を表す特徴の対応する分布とを比較して、代表性を定量化する確率的手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:05:50 GMT)
Generalized Denoising Diffusion Codebook Models (gDDCM): Tokenizing images using a pre-trained diffusion model [2.8] 近年,Denoising Diffusion Codebook Models (DDCM) が提案されている。
本稿では,一般化デノイング拡散圧縮モデル(gDDCM)を提案する。
実験により, DDCMのモデルへの一般化に成功し, 性能向上を実現した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:36:57 GMT)
Requirements for Aligned, Dynamic Resolution of Conflicts in Operational Constraints [2.8] デプロイされた自律型AIシステムは、新規または未特定のコンテキストにおいて、複数のもっともらしい行動コースを評価する必要がある。
本稿では,これらの文脈におけるエージェント決定の要件を特徴付ける。
また、目標を達成し、人間の期待に沿うために、意思決定を堅牢にするために必要な知識エージェントの種類を特定する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:36:47 GMT)
N-GLARE: An Non-Generative Latent Representation-Efficient LLM Safety Evaluator [2.7] N-GLAREは、完全なテキスト生成の必要性を回避して、モデルの潜在表現を完全に操作する。
潜在表現のAPT(Angular-Probabilistic Trajectory)を分析することで、隠蔽層ダイナミクスを特徴付ける。
N-GLAREは、トークンコストとランタイムコストの1%未満で、大規模なレッドチームテストの差別的傾向を再現する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:03:58 GMT)
AfriSpeech-MultiBench: A Verticalized Multidomain Multicountry Benchmark Suite for African Accented English ASR [2.7] AfriSpeech-MultiBenchは、10以上の国で100以上のアフリカ英語アクセントのドメイン固有の評価スイートである。
オープン・クローズド・ユニモーダルASRとマルチモーダルLLMに基づく音声認識システムの多種多様なベンチマークを行った。
オープンソースのASRモデルは、自然発話の文脈では優れているが、ノイズの多い非ネイティブ対話では劣化する。
プロプライエタリなモデルはクリーンスピーチに高い精度を提供するが、国や領域によって大きく異なる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:44:17 GMT)
MajinBook: An open catalogue of digital world literature with likes [2.7] MajinBookは、シャドウライブラリの使用を容易にするために設計されたオープンカタログである。
我々は3世紀にわたる英語の書籍に539,000点を超える高精度のコーパスを作成した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:38:30 GMT)
Stage Aware Diagnosis of Diabetic Retinopathy via Ordinal Regression [2.6] この作業では、APTOS 2019のファンドイメージデータセットを使用する、最先端のオーディショナル回帰に基づくDR検出フレームワークが導入されている。
DR分類において最も関連性の高い特徴を抽出するために,プリプロセッシング法の組み合わせを用いた。
通常の回帰アプローチでは、APTOSデータセットに新しいベンチマークを設定し、QWKスコアが0.8992に達した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:02:50 GMT)
Cranio-ID: Graph-Based Craniofacial Identification via Automatic Landmark Annotation in 2D Multi-View X-rays [2.4] 伝統的な頭蓋骨測位法は時間を要するものであり、専門的な知識と専門知識を必要とする。
まず,光学画像を用いた2次元頭蓋骨のランドマークの自動アノテーションであるCranio-IDを提案する。
第二に、これらのランドマークをグラフ表現に定式化し、これらの2つのモダリティのグラフ間の意味的対応を見つけることによって、クロスモーダルマッチングを行う。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:15:22 GMT)
IMSE: Efficient U-Net-based Speech Enhancement using Inception Depthwise Convolution and Amplitude-Aware Linear Attention [2.4] 本稿では,系統的に最適化された超軽量ネットワークIMSEを提案する。
1) MET モジュールを Amplitude-Aware Linear Attention (MALA) に、2) Deformable Embedding (DE) モジュールを Inception Depthwise Convolution (IDConv) に置き換える。
実験では、IMSEはパラメータ数を16.8%(0.513Mから0.427M)削減し、PESQ測定値(3.373)の最先端技術に匹敵する競争性能を達成する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:11:54 GMT)
EBind: a practical approach to space binding [2.4] 我々は,2つのコアコンポーネント,モダリティ毎の単一エンコーダと高品質なデータに着目し,空間結合を単純化する。
我々は,複数のコントラストモデルの埋め込み空間を結合する簡易で,データ中心で,パラメータ効率のよい EBind を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:03:30 GMT)
MI-to-Mid Distilled Compression (M2M-DC): An Hybrid-Information-Guided-Block Pruning with Progressive Inner Slicing Approach to Model Compression [2.4] そこで我々は,MI-to-Mid Distilled Compression (M2M-DC) について紹介する。
M2M-DCは、ラベル対応の相互情報信号によって残留ブロックをランク付けする。
その後、短いKD相をステージコヒーレントで残留安全なチャネルスライシングと交換する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:20:04 GMT)
MuCPT: Music-related Natural Language Model Continued Pretraining [2.2] 我々は、オープンソースのデータと社内データを組み合わせた大規模な音楽関連自然言語コーパス(40Bトークン)を構築します。
また、基準モデル(RM)に基づくトークンレベルのソフトスコアリングを導入し、品質管理を行う。
全体として、この作業は適切なコーパスと適切な目的の両方を前進させ、スケーラブルなデータトレーニングフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:33:34 GMT)
CCSD: Cross-Modal Compositional Self-Distillation for Robust Brain Tumor Segmentation with Missing Modalities [2.2] 入力モードの任意の組み合わせを柔軟に扱える新しいクロスモーダル構成自己蒸留(CCSD)フレームワークを提案する。
CCSDは、様々な欠落したモダリティシナリオにまたがって最先端のパフォーマンスを実現し、強力な一般化と安定性を実現している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:39:53 GMT)
Sovereign AI: Rethinking Autonomy in the Age of Global Interdependence [2.2] 人工知能(AI)は基本的な汎用技術として登場し、相互接続された世界で新たな主権のジレンマを提起している。
本稿では,二項条件ではなく連続体として主権AIを理解するための概念的,形式的な枠組みを開発する。
我々は,4つの主権柱の辺縁リターンの等化と,世界的利益が暴露リスクと等しくなるような開放性の設定という,2つの政策柱を識別するプランナーのモデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:02:10 GMT)
Improving segmentation of retinal arteries and veins using cardiac signal in doppler holograms [2.1] 経時的ドプラホログラムにおける動脈-静脈分画の簡便かつ効果的なアプローチを提案する。
専用のパルス解析パイプラインから派生した特徴を組み込むことで,従来のU-Netの時間的ダイナミクスを活用できる。
これらの結果は,時間分解前処理がドップラーホログラフィーの深層学習の可能性を完全に解き放つことを示唆している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:49:20 GMT)
Report on the Scoping Workshop on AI in Science Education Research 2025 [2.1] 報告では、科学教育研究における人工知能(AI)の役割に関する2日間の国際スコピングワークショップの結果を要約している。
AIは科学の実践、教室の学習、そして研究の方法に素早く反応するので、この分野は新たな機会と重要な課題に直面している。
報告書は、トレーニング、インフラ、標準のための実行可能なレコメンデーションと、資金提供者、政策立案者、専門機関、学術部門のガイダンスで締めくくっている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:23:22 GMT)
Causal Discovery on Higher-Order Interactions [2.1] 因果発見は、与えられた変数のセット間の因果関係を表すDAGを学ぶために専門家が提供した知識とデータを組み合わせる。
データが不足している場合、バッグングは、ブートストラップされたDAGを集約して得られる平均DAGの信頼度を測定するのに使用される。
我々は高次構造に基づく新しい理論フレームワークを導入し、新しいDAG集約アルゴリズムについて述べる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:35:00 GMT)
FlowRoI A Fast Optical Flow Driven Region of Interest Extraction Framework for High-Throughput Image Compression in Immune Cell Migration Analysis [2.1] FlowRoIは、免疫細胞移動研究における画像圧縮のための高速な光フローベースの関心領域である。
FlowRoIは、標準のJPEG2000に匹敵するランタイムを実現し、最新のラップトップで毎秒30フレームのスループットに達する。
画像品質の面では、FlowRoIはセルラー領域で高いピーク信号-雑音比(PSNR)を出力し、標準JPEG2000と比較して、一致するPSNRで2.0-2.2倍の圧縮速度を達成する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:25:18 GMT)
Weight Variance Amplifier Improves Accuracy in High-Sparsity One-Shot Pruning [2.1] ワンショットプルーニングは、追加のトレーニングなしでモデルサイズの削減に有効な戦略である。
本稿では、学習中のモデルパラメータの分散を意図的に増大させる可変増幅正規化器(VAR)を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:18:26 GMT)
The CHASM-SWPC Dataset for Coronal Hole Detection & Analysis [2.1] コロナホール(CHs)は、オープン磁場線を持つ低活性で密度の低い太陽コロナ領域である。
SWPCマップをバイナリセグメンテーションマスクにデジタル化する半自動パイプラインを開発した。
結果として得られたマスクは、自動CH検出モデルのトレーニングとテストを行うCHASM-SWPCデータセットを構成する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:51:13 GMT)
LAUD: Integrating Large Language Models with Active Learning for Unlabeled Data [2.0] 実世界のシナリオでは、ラベル付きデータがないため、実践者が良好なパフォーマンスのモデルを得ることができないことが多い。
ラベルなしデータセット(LAUD)のための大規模言語モデルとアクティブラーニングを統合した学習フレームワークを提案する。
実験により、LAUDから派生したLLMは、商品名分類タスクにおいてゼロショットまたは少数ショットの学習でLLMよりも優れていた。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:31:00 GMT)
NeuralBoneReg: A Novel Self-Supervised Method for Robust and Accurate Multi-Modal Bone Surface Registration [2.0] コンピュータおよびロボットによる整形外科手術(CAOS)では、術前画像から患者固有の手術計画が目標位置とインプラント軌跡を定義している。
手術中、これらの計画は術前データと術中データとの正確な相互登録に依存して正確に転送されなければならない。
本研究では, 3次元点雲を用いて骨表面をモダリティに依存しない表現として登録する, 自己教師型表面ベースフレームワークであるNeuralBoneRegを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:23:50 GMT)
CascadedViT: Cascaded Chunk-FeedForward and Cascaded Group Attention Vision Transformer [1.9] 視覚変換器(ViT)は様々なコンピュータビジョンタスクにおいて顕著な性能を示した。
本稿では,軽量かつ計算効率の良い視覚変換器アーキテクチャであるemph Cascaded-ViT(CViT)を提案する。
CCFFNは精度を犠牲にすることなくパラメータとFLOP効率を改善する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:51:15 GMT)
Dynamic Nested Hierarchies: Pioneering Self-Evolution in Machine Learning Architectures for Lifelong Intelligence [1.9] この研究は、人工知能と機械学習を進化させる次の進化ステップとして、動的ネスト階層を提案する。
動的ネスト階層は、モデルに最適化レベルの数、ネスト構造を自律的に調整し、トレーニングや推論中に頻度を更新する権限を与える。
この革新は、既存のモデルにおける無秩序な記憶に対処し、コンテキストフローを動的に圧縮し、分布シフトに適応することによって、真の生涯学習を促進する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:59:44 GMT)
A Neuro-Symbolic Framework for Reasoning under Perceptual Uncertainty: Bridging Continuous Perception and Discrete Symbolic Planning [1.9] 本稿では,認識から計画への不確実性を明確にモデル化し,伝播するニューロシンボリックな枠組みを提案する。
具体的応用としてのテーブルトップロボット操作におけるフレームワークの有効性を実証する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:38:01 GMT)
Learning Subglacial Bed Topography from Sparse Radar with Physics-Guided Residuals [1.9] そこで本稿では,BedMachine上での層厚残差を予測する物理誘導型残差学習フレームワークを提案する。
標準エンコーダ(ResNet-50など)上のDeepLabV3+デコーダは、軽量物理学とデータ用語で訓練されている。
グリーンランドの2つのサブリージョンにまたがって,本手法は強いテストコア精度と高い構造忠実度を実現する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:12:58 GMT)
MiAD: Mirage Atom Diffusion for De Novo Crystal Generation [1.8] 結晶を構成する原子の状態を変化させる拡散モデルを実現する技術であるミラージュ注入を導入する。
この手法はモデルの品質を同じモデルと比較して最大$times2.5$向上することを示す。
MiADはMP-20データセットで8.2%のS.U.N.レートを達成した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:29:19 GMT)
Time complexity in preparing metrologically useful quantum states [1.8] メロジカルに有用な量子状態を生成するプロトコルの時間最適性のベンチマークを求める。
本研究は,気象学的に有用な量子状態を生成するプロトコルの時間最適性のベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:09:33 GMT)
Large Language Models and 3D Vision for Intelligent Robotic Perception and Autonomy [1.8] 3Dビジョンを備えた大規模言語モデル(LLM)は、ロボットセンシング技術の強化に対する変革的なアプローチとして現れている。
本稿では,LLMと3Dビジョンの交わりにおける最先端の方法論,応用,課題を包括的に分析する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:27:55 GMT)
Optimization of High-Fidelity Single-Qubit Gates for Fluxoniums Using Single-Flux Quantum Control [1.7] 本稿では,フラクソニウム量子ビットに対するメモリ効率,高忠実度,単一キュービットゲートの構成法を提案する。
これらのゲートは単一流束量子(SFQ)パルスのシーケンスを用いて構築され、容量結合または誘導結合によってキュービットに送られる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:46:32 GMT)
A Unified Compositional View of Attack Tree Metrics [1.7] 我々は、gs-モノイド圏に基づくATとその関手意味論を発展させる。
我々は、ATs の成分がチャネル圏、特に gs-モノイド圏を形成することを示す。
AT測度はチャネル圏の関手に対応する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:59:44 GMT)
Accuracy is Not Enough: Poisoning Interpretability in Federated Learning via Color Skew [1.7] 敵対的クライアントが適用した小さなカラー摂動は、モデルの正当性マップを意味論的に意味のある領域から切り離すことができることを示す。
我々の攻撃は、Grad-CAMの説明におけるピークアクティベーションの重複を最大35%削減し、すべての評価データセットで96%以上の分類精度を維持する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:57:29 GMT)
Flood-LDM: Generalizable Latent Diffusion Models for rapid and accurate zero-shot High-Resolution Flood Mapping [1.7] 洪水予測は、緊急計画と人的・経済的損失の軽減に不可欠である。
従来の物理に基づく流体力学モデルでは、微細格子の離散化を必要とする数値法を用いて高分解能フラッドマップを生成する。
本稿では, 潜伏拡散モデルを用いて, 粗いグリッドフラッドマップ上で超解像を行う手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:24:38 GMT)
Comparing Task-Agnostic Embedding Models for Tabular Data [1.6] この研究は特に表現学習、すなわち伝達可能なタスクに依存しない埋め込みに焦点を当てている。
テーブルライザ機能は、最近の基礎モデルよりも最大3桁高速で、同等または優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:10:40 GMT)
SVBRD-LLM: Self-Verifying Behavioral Rule Discovery for Autonomous Vehicle Identification [1.6] 本稿では,実際の交通映像から解釈可能な行動ルールを自動的に検出し,検証し,適用するフレームワークであるSVBRD-LLMを提案する。
このフレームワークは、YOLOv8とByteTrackを使用して車両軌跡を抽出し、キネマティックな特徴を計算し、GPT-5ゼロショットプロンプトを使用して自律車と人力車を比較している。
1500時間以上の実際の交通ビデオの実験では、このフレームワークは90.0%の精度と93.3%のF1スコアを達成した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 23:45:30 GMT)
Expert-Guided POMDP Learning for Data-Efficient Modeling in Healthcare [1.6] 本稿では,パラメータ推定プロセスに専門家の知識を取り入れた新しいアプローチであるFuzzy MAP EMアルゴリズムを紹介する。
この統合は、データを限定した環境での学習を効果的に導く、最大Aポストエリオーリ推定(MAP)として問題を自然に再構築する。
合成医療シミュレーションにおいて,本手法は低データおよび高ノイズ条件下での標準EMアルゴリズムより一貫して優れる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:12:44 GMT)
MRI Plane Orientation Detection using a Context-Aware 2.5D Model [1.5] 人間は2次元MRIスライスで簡単に解剖学的平面を識別できるが、自動化されたシステムはこのタスクに苦労する。
本研究では,平面配向メタデータを正確に生成する分類器を開発した。
我々は3Dスライスシーケンスと静的2D画像の両方で2.5Dモデルを訓練する。
脳腫瘍検出タスクにおいて生成したメタデータの有用性を検証する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:00:57 GMT)
Multi-Scale Correlation-Aware Transformer for Maritime Vessel Re-Identification [1.5] 海上船舶再識別(Re-ID)は海上監視と知的状況認識システムにおいて重要な役割を担っている。
既存の船体Re-ID法は、歩行者に焦点を絞ったアルゴリズムから直接適用されており、船体画像に現れる固有の問題を緩和するのに不適当である。
これらの課題に対処するために,マルチスケール相関対応トランスフォーマーネットワーク(MCFormer)を提案する。
MCFormerは、入力セット全体にわたるマルチスケールの相関を明示的にモデル化し、同一性内変異や局所的欠落を伴う外れ値サンプルの悪影響を抑制する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:16:59 GMT)
Safe-ROS: An Architecture for Autonomous Robots in Safety-Critical Domains [1.5] 安全クリティカルドメインにおける信頼性と検証が可能な自律ロボットの開発に,Safe-ROSアーキテクチャを貢献する。
原子力環境で自律的な検査を行うAgileX Scout Miniロボット上でSafe-ROSを実証する。
以上の結果から,セーフROSアーキテクチャは,自律ロボットを安全クリティカルな領域に配置しながら,安全性を検証可能な監視を提供することが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:34:33 GMT)
Measuring Reactive-Load Impedance with Transmission-Line Resonators Beyond the Perturbative Limit [1.5] 超伝導伝送線路共振器から回路パラメータと損失接点を反応性負荷で除去する解析フレームワークを開発した。
回路シミュレーション,有限要素モデリング,ファンデルワールスパラレルプレートコンデンサの実験的測定により,この枠組みを検証した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:13:57 GMT)
DySTAN: Joint Modeling of Sedentary Activity and Social Context from Smartphone Sensors [1.5] スマートフォンのセンサデータを受動的に収集するモバイルセンシングアプリケーションであるLogMeを紹介する。
共有センサ入力から両方のコンテキスト次元を共同で分類するマルチタスク学習フレームワークDySTANを提案する。
その結果、DySTANはシングルタスクCNN-BiLSTM-GRUモデルよりも21.8%、マルチタスクベースラインであるSluice Network(SN)よりも8.2%改善した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:28:54 GMT)
LSP-YOLO: A Lightweight Single-Stage Network for Sitting Posture Recognition on Embedded Devices [1.5] LSP-YOLOは、組み込みエッジデバイス上での姿勢認識のための軽量なシングルステージネットワークである。
モデルトレーニングとテストのために、6つの姿勢カテゴリにわたる5000の画像を含むデータセットを構築した。
最小のトレーニングモデルであるLSP-YOLO-nは、わずか1.9MBのパーソナルコンピュータ(PC)で94.2%の精度と251FPSを達成した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:24:51 GMT)
An Ecologically-Informed Deep Learning Framework for Interpretable and Validatable Habitat Mapping [1.5] ECOSAICは、ベント性生息地の自動分類のための人工知能フレームワークである。
ECOSAICは、ドメインインフォームド特徴間の特殊化と直交性を最適化することにより、n次元特徴空間を圧縮する。
このモデルをコロンビア太平洋に応用した結果,マングローブから深度1000mの深い岩場まで広がる16のベント性生息地が確認された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 23:38:29 GMT)
A Patient-Independent Neonatal Seizure Prediction Model Using Reduced Montage EEG and ECG [1.3] 新生児発作の早期予測のための畳み込みニューラルネットワークモデルを提案する。
提案したモデルの平均精度は97.52%、感度は98.31%、特異性は96.39%、F1スコアは97.95%であった。
以上の結果から,新生児集中治療室における最小管理的展開の可能性が示唆された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:47:53 GMT)
AI-driven Generation of MALDI-TOF MS for Microbial Characterization [1.3] 本研究では,MALDI-TOF MSスペクトルを合成するための深層生成モデルについて検討した。
我々は3つの生成モデル、変分オートエンコーダ(MALDIVAEs)、生成共振器ネットワーク(MALDIGANs)、確率モデル(MALDIffusion)を適応・評価する。
実験により、MALDIVAE、MALDIGAN、MALDIffusionによって生成された合成データは、統計的に、診断的に実測値に匹敵することがわかった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:01:21 GMT)
Socially aware navigation for mobile robots: a survey on deep reinforcement learning approaches [1.3] 社会に意識されたナビゲーションはロボット工学において急速に発展する研究領域であり、ロボットは暗黙の人間の社会規範に固執しながら、人間の環境内を移動することができる。
深層強化学習(Dep Reinforcement Learning, DRL)は、ロボットがそれらの目的を効果的に達成しつつ、これらの社会的慣行を組み込むことのできるナビゲーションポリシーの開発を加速した。
このサーベイは、DRLに基づく社会に意識したナビゲーションのアプローチの概要を提供し、プロキシ、人間の快適性、自然性、軌道、意図予測といった重要な側面を強調している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:33:28 GMT)
Watch Out for the Lifespan: Evaluating Backdoor Attacks Against Federated Model Adaptation [1.3] フェデレートラーニング(FL)による大規模なモデル適応は、幅広いユースケースに対処し、有効にします。
低ランク適応(LoRA)のような効率的な微調整技術
FLにおけるモデル適応をターゲットとした、最先端のバックドア攻撃に対するLoRAの影響を初めて分析した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:13:59 GMT)
AI for Proactive Mental Health: A Multi-Institutional, Longitudinal, Randomized Controlled Trial [1.2] バイトサイズの幸福な介入は、臨床レベルに達する前に精神的な苦痛を防ぐための有望な解決策を提供する。
我々は,このギャップに対処するために,AIを活用した生成モバイルアプリ("Flourish")の複数施設,縦型,事前登録されたランダム化試験を行った。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:16:42 GMT)
Towards Sustainable Precision: Machine Learning for Laser Micromachining Optimization [1.2] 本稿では,超短パルスマイクロ加工技術の品質評価向上を目的とした機械学習フレームワークを提案する。
リアルタイムのレーザ処理監視を容易にするため,機械学習モデルの計算要求を最適化することを目的とした。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:51:17 GMT)
Technique to Baseline QE Artefact Generation Aligned to Quality Metrics [1.2] 大言語モデル(LLM)は品質工学(QE)を変えつつある
本稿では,定量化指標を用いてQEアーティファクトをベースライン化し,評価する手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:09:38 GMT)
MermaidSeqBench: An Evaluation Benchmark for LLM-to-Mermaid Sequence Diagram Generation [1.1] 大規模言語モデル(LLM)は、自然言語記述から構造化図を生成する優れた能力を示した。
本稿では,テキストプロンプトからMermaidシーケンス図を生成するLLMの能力を評価するベンチマークであるMermaidSeqBenchを紹介する。
LLM-as-a-judgeモデルを用いて,文法の正確性,アクティベーションハンドリング,エラーハンドリング,実用的ユーザビリティなど,詳細なメトリクス間でのマーメイドシーケンスダイアグラムの生成を評価する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 23:14:44 GMT)
Machine Learning Models for Predicting Smoking-Related Health Decline and Disease Risk [1.1] 喫煙は世界中で大きな死因となっている。
現在の医療検診法は、喫煙に関連する健康問題に関する早期警告の兆候を見逃すことが多い。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:21:32 GMT)
SLAM-AGS: Slide-Label Aware Multi-Task Pretraining Using Adaptive Gradient Surgery in Computational Cytology [1.1] スライドラベル対応マルチタスク事前学習フレームワークSLAM-AGSを提案する。
課題勾配の相反に適応的勾配手術を適用した。
SLAM-AGSは,他の事前学習法に比べて,バッグレベルのF1スコアとTop 400陽性細胞検索を改善した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:30:10 GMT)
A Comprehensive Study of Implicit and Explicit Biases in Large Language Models [1.1] この研究は、生成的AIが増大する中で、大規模言語モデルにおけるバイアスに対処する必要があることを強調する。
我々は, StereoSet や CrowSPairs などのバイアス特異的ベンチマークを用いて,BERT や GPT 3.5 といった複数の生成モデルにおける様々なバイアスの存在を評価する。
その結果、微調整されたモデルでは性別バイアスに悩まされるが、人種バイアスの特定と回避には優れていた。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:27:17 GMT)
When Words Change the Model: Sensitivity of LLMs for Constraint Programming Modelling [1.1] 大きな言語モデルは、古典的なベンチマークのモデルを自動的に生成する素晴らしい結果を示している。
多くの標準CP問題は、これらのモデルのトレーニングデータに含まれる可能性が高い。
LLMは構文的に妥当で意味論的に妥当なモデルを生成することができるが、その性能は文脈的・言語学的に著しく低下する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:40:32 GMT)
When AI Democratizes Exploitation: LLM-Assisted Strategic Manipulation of Fair Division Algorithms [1.0] 本稿では,Large Language Models(LLM)が戦略的専門知識へのアクセスを民主化することによって,保護障壁を解消する方法について述べる。
本稿では,AIアシスタントへの単純な対話クエリを通じて,動作可能な操作戦略をユーザに提供する。
実験の結果、LLMはアルゴリズム力学を説明でき、利益の相違を識別し、調整された選好の誤報告のための具体的な数値入力を生成することができることがわかった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:09:02 GMT)
nnterp: A Standardized Interface for Mechanistic Interpretability of Transformers [1.0] nnterpは、NNsightのトランスフォーマー分析のための軽量ラッパーである。
オリジナルのHuggingFace実装を保持しながら、トランスフォーマー分析のための統一インターフェースを提供する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:05:02 GMT)
3D-Guided Scalable Flow Matching for Generating Volumetric Tissue Spatial Transcriptomics from Serial Histology [1.0] HoloTeaは3D対応のフローマッチングフレームワークで、隣接部からの情報を明示的に使用しながら、H&Eからスポットレベルの遺伝子発現を誘導する。
グローバルアテンションブロックは、スライド内のスポット数と線形に3D H&Eスケーリングを導入し、大規模な3D STデータセットのトレーニングと推論を可能にする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:08:24 GMT)
Divide-et-impera Heuristic-based Randomized Search for the Qubit Routing Problem [1.0] 本稿では,Qubit Routing Problem(QRP)のためのDIRSHアルゴリズムを提案する。
この方法は回路をチャンクに分割し、ゲートとスワップのランダムな選択で各回路を最適化する。
20キュービットのIBMQ TokyoトポロジにマッピングされたRevLibベンチマークで試されたDIRSHは、異なる時間予算で3つのLightSABREを上回りました。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:33:50 GMT)
Automated proving in planar geometry based on the complex number identity method and elimination [1.0] 除算イデアルに基づいて,複素数同一性証明法を完全自動化手順に改良する。
この結果はMathematica, Maple および Giac 計算機代数システムの新バージョンで紹介される。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:20:17 GMT)
Fine-tuning Pre-trained Audio Models for COVID-19 Detection: A Technical Report [0.9] 本報告では、確立したベンチマークデータセットを用いて、新型コロナウイルス検出タスクにおける事前学習音声モデルの性能について検討する。
年齢と性別による厳密な人口階層化を実施し、人口特性と新型コロナウイルスの状況の急激な相関をモデルが悪用するのを防ぐ。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 21:54:20 GMT)
Quantum State Preparation with Resolution Refinement [0.9] 本稿では、量子コンピュータ上で固有状態の準備をブートストラップできる分解能改善法を提案する。
単一粒子基底状態と空間格子格子の両方に適用した分解能改善の例を示す。
この方法は効率的で、物理スペクトルのエネルギーギャップの反転に匹敵する断熱的な進化時間を必要とする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:25:13 GMT)
ArbESC+: Arabic Enhanced Edit Selection System Combination for Grammatical Error Correction Resolving conflict and improving system combination in Arabic GEC [0.9] アラビア語の文法的誤りを修正するための,最初のマルチシステムアプローチの1つを提示する。
AraT5、BYT5、mT5、AraBART、AraBART+Morph+GEC、テキスト編集システムの組み合わせは単一のモデルよりも優れた結果を得た。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:06:28 GMT)
A Hybrid Multimodal Deep Learning Framework for Intelligent Fashion Recommendation [0.9] 本稿では,ファッションレコメンデーションのためのハイブリッドマルチモーダルディープラーニングフレームワークを提案する。
これは2つの重要なタスクに対処する: 服の互換性予測と補完アイテムの検索である。
提案手法は両タスク間で高い性能を示し,ファッションレコメンデーションのためのマルチモーダル学習の有効性を強調した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:29:32 GMT)
Notes on Kernel Methods in Machine Learning [0.8] 我々は、正定値カーネルの理論を開発し、カーネルヒルベルト空間(RKHS)とヒルベルト・シュミット作用素を再現する。
また、カーネル密度推定、分布のカーネル埋め込み、最大平均離散性(MMD)も導入する。
この展示は、ガウス過程、カーネルベイズ推論、モダン機械学習に対する機能解析的アプローチなど、より高度なトピックの基盤として機能するよう設計されている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:29:07 GMT)
Compiler design for hardware specific decomposition optimizations, tailored to diamond NV centers [0.8] ダイヤモンドNV中心特定命令を用いた量子コンピュータ用コンパイラを提案する。
我々のコンパイラは、従来の命令で状態トモグラフィと測定に基づく操作を実行できるので、一般的なコンパイラの上に追加します。
この結果から,古典命令と量子命令を統合したコンパイラの開発に成功した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:48:50 GMT)
Finding Pre-Injury Patterns in Triathletes from Lifestyle, Recovery and Load Dynamics Features [0.7] トライアスロンのトレーニングでは、アスリートは繰り返し生理的ストレスによる怪我を過大評価するリスクを負う。
現在の傷害予測アプローチは、睡眠の質、ストレス、個人のライフスタイルといった重要な要素を無視して、トレーニング負荷メトリクスに依存している。
トライアスロントレーニングに適した新しい合成データ生成フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 08:48:37 GMT)
Multi-GPU Quantum Circuit Simulation and the Impact of Network Performance [0.7] 我々は、HPCシステム上でのベンチマークを容易にするため、QED-C Application-Oriented BenchmarksにMPIを導入する。
我々は最近のNVIDIA Grace Blackwell NVL72アーキテクチャを含む様々な相互接続パスを用いてベンチマークを行った。
GPUアーキテクチャの改善は4.5倍以上のスピードアップにつながったが、相互接続性能の進歩は16倍以上のパフォーマンス改善によるソリューションのソリューション化に大きな影響を与えている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:04:28 GMT)
MRI Embeddings Complement Clinical Predictors for Cognitive Decline Modeling in Alzheimer's Disease Cohorts [0.7] アルツハイマー病の認知低下の正確なモデリングは、早期成層化とパーソナライズドマネジメントに不可欠である。
認知変化の異質なパターンを捉えるために,ダイナミック・タイム・ウォーピング・クラスタリングに基づくトラジェクトリ・アウェア・ラベリング・ストラテジーを導入する。
3次元視覚変換器 (ViT) を非教師的再構成により訓練し, 解剖学的に保存された埋め込みを得る。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:45:01 GMT)
STONE: Pioneering the One-to-N Backdoor Threat in 3D Point Cloud [0.7] バックドア攻撃は、自律運転やロボット工学といった3D領域におけるディープラーニングにとって重要な脅威となる。
球状トリガーによる脅威をインスタンス化する最初のフレームワークSTONE(Spherical Trigger One-to-N Backdoor Enabling)を紹介する。
実験的に、広範囲な評価は、クリーンデータ精度を損なうことなく、高い攻撃成功率(最大100%)を示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:27:41 GMT)
\textit{FLARE}: Adaptive Multi-Dimensional Reputation for Robust Client Reliability in Federated Learning [0.7] フェデレートラーニング(FL)は、データのプライバシを維持しながら協調的なモデルトレーニングを可能にする。
ビザンツの攻撃、データ中毒、あるいは適応的な敵行動を通じてモデルの完全性を侵害する悪意のあるクライアントには、依然として脆弱である。
FLAREは,クライアントの信頼性評価を二分決定から連続的多次元信頼評価に変換するアダプティブな評価ベースフレームワークである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:57:40 GMT)
Attention Via Convolutional Nearest Neighbors [0.6] 我々は、畳み込みと自己注意は、単一のk-ネアレスト近傍アグリゲーションフレームワークで統一できると主張している。
このコネクションを形式化する統一フレームワークであるConvNN(Convolutional Nearest Neighbors)を紹介します。
CIFAR-10とCIFAR-100の分類タスクにおけるフレームワークの一貫性を検証する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:54:39 GMT)
The PID Controller Strikes Back: Classical Controller Helps Mitigate Barren Plateaus in Noisy Variational Quantum Circuits [0.6] 変分量子アルゴリズム(VQA)は古典最適化と量子計算の利点を組み合わせたものである。
VQAはしばしば、バレン高原(Barren Plateau)として知られる消失する勾配問題に悩まされる。
本稿では,古典的比例積分微分制御器とニューラルネットワークを統合し,変動量子回路のパラメータを更新するハイブリッド手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:55:42 GMT)
HyMAD: A Hybrid Multi-Activity Detection Approach for Border Surveillance and Monitoring [0.5] 地震探査は、国境の監視と監視のための有望な解決策として浮上している。
時間-時間融合に基づく深層ニューラルネットワークHybrid Multi-Activity Detectionを提案する。
本研究では,国境監視・監視の文脈で収集した実世界のフィールド記録から構築したデータセットに対するアプローチを評価する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:37:38 GMT)
Compiling to recurrent neurons [0.5] 我々は、$textsfCajalscriptstyle(mathbbmultimap, mathbb2, mathbbN)$という、最小限の型付き高階線形プログラミング言語を提示する。
我々は、そのプログラムが繰り返しニューロンに正しくコンパイルされることを証明し、勾配に基づく学習と互換性のある微分可能な形式で離散アルゴリズムを表現できるようにする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 22:26:27 GMT)
Watchdogs and Oracles: Runtime Verification Meets Large Language Models for Autonomous Systems [0.5] 大規模言語モデル(LLM)は、自然言語を形式的なアーティファクトに翻訳し、データのパターンを認識するのに優れています。
このビジョンペーパーは、RVとLLMの共生的な統合を論じている。
RV は LLM による自律性のためのガードレールとして機能し、一方 LLM は RV を拡張して仕様取得を支援し、予測推論をサポートし、不確実性に対処する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:35:05 GMT)
Applying Relation Extraction and Graph Matching to Answering Multiple Choice Questions [0.5] 知識グラフ(きゅうグラフ、英: knowledge graph)は、実体と関係からなる事実知識の構造化された表現である。
近年,変換器を用いた関係抽出法(RE)が開発され,KGを動的に生成できるようになった。
本稿では,マルチチョイス質問(MCQ)を「補充する」形式で答える手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:03:27 GMT)
Squeezing-Enhanced Photon-Number Measurements for GKP State Generation [0.5] 本稿では,GKP状態の生成のためのアーキテクチャについて述べる。
耐故障閾値を11.5dBのクラスタスキューズで達成することで,これらの改善の有効性を実証する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:30:46 GMT)
Active Matter as a framework for living systems-inspired Robophysics [0.4] ロボ物理学は、複雑な現実世界の環境で動く生物のようなロボットを統治する物理原理を研究する。
個々の単位のレベルでは、ロボット群は共通の目的、協調、コミュニケーション、コスト効率を達成するのに苦労する一方で、移動は依然として課題である。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:16:27 GMT)
FHIRconnect: Towards a seamless integration of openEHR and FHIR [0.4] 本稿では,openEHRとFHIRの標準化された双方向データ交換を可能にする,ドメイン固有言語とオープンソース変換エンジンを提案する。
当社のアプローチでは,プロジェクト全体の65%のマッピング再利用を実現する3層アーキテクチャを通じて,重要な相互運用性のギャップに対処しています。
主要なコントリビューションとしては、OpenEHR-FHIR変換のための最初の包括的なDSL、正式な仕様、オープンソース実行エンジン(openFHIR)、ハイインパクトな臨床アーチタイプをカバーするマッピングライブラリなどがある。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:12:32 GMT)
PAC global optimization for VQE in low-curvature geometric regimes [0.4] 変分量子固有解法における大域的な$varepsilon$-optimalityのノイズロスト保証
Morse--Bott 部分多様体は座標整列な埋め込みフラットに対してファイバー正則性を満たす。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:18:26 GMT)
How to Train Private Clinical Language Models: A Comparative Study of Privacy-Preserving Pipelines for ICD-9 Coding [0.3] 臨床テキストのリスクに敏感な患者情報を暴露する大規模言語モデル。
DP最適化の急速な進歩にもかかわらず、どのプライバシ保護戦略が効果的かは不明だ。
DP学習教師の知識蒸留はDP-SGDとDP合成データトレーニングの両方に優れる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 21:51:04 GMT)
Bridging Human and Model Perspectives: A Comparative Analysis of Political Bias Detection in News Media Using Large Language Models [0.3] 本研究では,人間のアノテーションと複数の言語モデルによる政治的偏見の検出を評価するための比較枠組みを提案する。
我々は,手動でアノテートしたニュース記事のデータセットを構築し,アノテート一貫性,バイアス極性,モデル間合意を評価する。
実験の結果,従来のトランスフォーマーベースモデルでは,RoBERTaが最も高いアライメントを達成していることがわかった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:58:04 GMT)
PRISM: Prompt-Refined In-Context System Modelling for Financial Retrieval [0.3] PRISMは、システムプロンプト、コンテキスト内学習、軽量マルチエージェントシステムを統合する、トレーニング不要のフレームワークである。
我々の最高の設定は、制限されたバリデーション分割に対して0.71818のNDCG@5を達成する。
そのモジュラーで推論のみの設計は、現実世界のユースケースに実用的だ。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:30:52 GMT)
From Projection to Prediction: Beyond Logits for Scalable Language Models [0.3] 大規模言語モデル(LLM)のトレーニングは通常、出力層で2段階のパイプラインを伴います。
隠れ状態とターゲットトークンの損失を直接計算することにより、当社のアプローチは明示的なロジットの実体化をバイパスする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:23:47 GMT)
Connecting the Dots: A Machine Learning Ready Dataset for Ionospheric Forecasting Models [0.3] 我々は、多種多様な電離圏とヘリオスフェアの測定を一貫性のある機械学習対応構造に統合する、キュレートされたオープンアクセスデータセットを提案する。
我々のワークフローは、太陽力学観測データ、太陽放射率指数(F10.7)、太陽風パラメータ(速度と惑星間磁場)、地磁気活動指数(Kp, AE, SYM-H)、NASA JPLの全電子含有量世界電離球マップ(GIM-TEC)を含む膨大なデータソースを統合している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:13:25 GMT)
AdamHD: Decoupled Huber Decay Regularization for Language Model Pre-Training [0.3] AdamHuberDecayはAdamWのドロップイン代替品で、$ell$ペナルティを分離したスムーズなHuberレギュレータで置き換える。
GPT-2 と GPT-3 の事前学習実験により,AdamHuberDecay は壁面時間で 10-15% の速度で収束することが示された。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:08:20 GMT)
A Fuzzy Logic-Based Cryptographic Framework For Real-Time Dynamic Key Generation For Enhanced Data Encryption [0.2] ブルートフォース攻撃、鍵の妥協、不正アクセスは、非常に一般的なサイバー脅威となっている。
本研究では,動的に暗号鍵をリアルタイムで生成するファジィ論理ベースの暗号フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:34:31 GMT)
SNAP: A Plan-Driven Framework for Controllable Interactive Narrative Generation [0.2] 提案するSNAP(Story and Narrative-based Agent with Planning)は,Web環境における物語の漂流を防止するために,明示的なプランを持つセルに構築するフレームワークである。
SNAPは、多様なユーザ応答に対応しながら、一貫性のあるシナリオ一貫性の対話を可能にする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:03:19 GMT)
Empirical Quantum Advantage in Constrained Optimization from Encoded Unitary Designs [0.2] ブロックごとのn-1二ビット回転を用いてW_n状態を作成するアンシラフリーで深度対応のエンコーダを提供する。
原ビットストリングサンプリングに制限された古典的ベースラインに対して,ミニマックス感のexp(Theta(n2))分離を示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:51:17 GMT)
10Cache: Heterogeneous Resource-Aware Tensor Caching and Migration for LLM Training [0.2] クラウドでの大規模言語モデル(LLM)のトレーニングは、GPUの容量の制限と高コストのため、メモリボトルネックの増大に直面します。
リソースを意識したテンソルキャッシュとマイグレーションシステムである10Cacheを,GPU,CPU,ティア間でメモリ使用量をインテリジェントに調整することで,トレーニングを高速化する。
トレーニング時間の最大2倍のスピードアップを実現し、GPUキャッシュヒット率を最大86.6倍に改善し、CPU/GPUメモリ使用率を最大2.15倍と1.33倍に向上させる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:17:44 GMT)
HULFSynth : An INR based Super-Resolution and Ultra Low-Field MRI Synthesis via Contrast factor estimation [0.2] 教師なし単一画像双方向磁気共鳴画像(MRI)合成器を提案する。
ウルトラローフィールド(ULF)のような画像は、HF(High-Field)等級の画像と、その逆の画像から合成する。
我々のアプローチは、HFとULFMRIのコントラスト変化を駆動する物理にインスパイアされている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:36:24 GMT)
Evaluating Large Language Models for Diacritic Restoration in Romanian Texts: A Comparative Study [0.2] 本研究は,ルーマニア語テキストにおけるダイアクリティカルティクスの復元におけるいくつかの大規模言語モデル (LLM) の性能を評価する。
その結果、GPT-4oのようなモデルでは、中性エコーベースラインを一貫して超える高いダイアクリティカルな復元精度が得られた。
これらの知見は, モデルアーキテクチャ, トレーニングデータ, 即時設計が診断的復元性能に与える影響を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:16:32 GMT)
Integrating Causal Inference with Graph Neural Networks for Alzheimer's Disease Analysis [0.2] Causal-GCNは、do-calculusベースのバックドア調整を統合する介入グラフ畳み込みフレームワークである。
ADNIコホートから484名の被験者に適用されるCausal-GCNは、ベースラインのGNNに匹敵するパフォーマンスを達成している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 21:22:24 GMT)
Quadratic Term Correction on Heaps' Law [0.2] Heaps または Herdan の法則は、ワードタイプ対ワードトケンの関係を、権力-法則関数によって特徴づける。
ログ-ログスケールにおいても、型トーケン曲線はいまだわずかに凹凸であり、パワー-ロー関係は無効である。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:22:00 GMT)
Encoding and Understanding Astrophysical Information in Large Language Model-Generated Summaries [0.1] 大規模言語モデルは、ドメイン、モダリティ、さらにはコンテキスト内での学習能力さえも、多くのレベルでうまく一般化できることを示した。
これにより、科学的な測定からのみ利用可能で、テキスト記述にゆるくエンコードされた物理的情報を、どのようにエンコードできるのかという研究上の疑問が解決される。
LLMの埋め込みが、科学的な測定から得られた物理的要約統計を2つの主要な質問によって符号化できるかどうかを検討する: 1) LLMによってそれらの量がどのようにコード化されるか、そして 2) 測定によって表される物理を符号化する上で、言語がもっとも重要であるか?
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:23:29 GMT)
HFL-FlowLLM: Large Language Models for Network Traffic Flow Classification in Heterogeneous Federated Learning [0.1] 5GとIoT(Internet of Things)によって駆動される現代の通信ネットワークでは、QoS(Quality of Service)の管理とセキュリティにおいて、効果的なネットワークトラフィックフローの分類が不可欠である。
従来の集中型機械学習は、これらの異種環境における分散データとプライバシの懸念に悩まされている。
我々は,HFL-FlowLLMを提案する。これは異種フェデレーション学習におけるネットワークトラフィックフロー分類に大規模言語モデルを適用した最初のフレームワークである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:11:29 GMT)
Learning Fair Representations with Kolmogorov-Arnold Networks [0.1] 予測モデルは、しばしば辺縁化群に対する差別的行動を示す。
既存の公正学習モデルはバイアスを軽減することを目的としていますが、公平性と正確性の間の最適なトレードオフを達成することは依然として課題です。
我々は,KAN(Kolmogorov-Arnold Networks)を公正な対角学習フレームワークに統合することを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:23:34 GMT)
Fusing Biomechanical and Spatio-Temporal Features for Fall Prediction: Characterizing and Mitigating the Simulation-to-Reality Gap [0.1] 転倒は、高齢者の怪我や独立の喪失の主な原因である。
視覚に基づく落下予測システムは、衝突のほんの数秒前に落下を予測する非侵襲的な解決策を提供する。
本研究では,ポーズ情報と生体力学情報を組み合わせた二重ストリームモデルであるBioST-GCNを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:13:11 GMT)
Rate-Distortion Guided Knowledge Graph Construction from Lecture Notes Using Gromov-Wasserstein Optimal Transport [0.1] タスク指向知識グラフ(KG)により、AIを活用した学習支援システムは、高品質なマルチチョイス質問(MCQ)を自動的に生成できる
しかし、講義ノートやスライドなどの構造化されていない教材を、重要な教育内容を取得するKGに変換することは依然として困難である。
本稿では,RD理論と最適輸送幾何学に基づく知識グラフ構築と改良のためのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:37:39 GMT)
Just Asking Questions: Doing Our Own Research on Conspiratorial Ideation by Generative AI Chatbots [0.1] AIを利用した6つのチャットシステム(ChatGPT 3.5、ChatGPT 4 Mini、BingのMicrosoft Copilot、Google Search AI、Perplexity、Twitter/XのGrok)についてレビューする。
我々は、よく知られた、包括的に議論された陰謀理論と、突発的なニュースイベントに関連する4つの新しい陰謀理論を選択した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:56:41 GMT)
SALPA: Spaceborne LiDAR Point Adjustment for Enhanced GEDI Footprint Geolocation [0.1] 地すべりの不確実性は、炭素在庫評価を含む森林プロファイルの推定を損なう。
SALPAは,3つの最適化パラダイムと5つの距離メトリクスを統合したマルチアルゴリズム最適化フレームワークである。
対照的な地域--日光, 平地--
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:05:30 GMT)
From Graphs to Hypergraphs: Enhancing Aspect-Based Sentiment Analysis via Multi-Level Relational Modeling [0.0] サンプル固有階層クラスタリングによりアスペクトオピニオン構造を誘導する動的ハイパーグラフフレームワークであるHyperABSAを提案する。
3つのベンチマークの実験では、強力なグラフベースラインよりも一貫した改善が見られた。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:01:25 GMT)
Exact Factorization of Unitary Transformations with Spin-Adapted Generators [0.0] 我々は、フェルミオン二重励起と非励起回転から導かれるスピン適応ユニタリの正確かつ計算学的に効率的な分解を導入する。
この手法は、これらの生成元における基本作用素が小さなリー代数を形成するという事実を利用する。
設計によってスピン対称性を保ち、実装コストを削減し、分子系の量子シミュレーションにおける電子状態の正確な表現を保証する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 21:06:54 GMT)
Effective Diversification of Multi-Carousel Book Recommendation [0.0] 本稿では,書籍推薦分野における項目の多様性を高めるためのいくつかのアプローチを提案する。
これらのアプローチは、パブリックライブラリのWebカタログにおける書籍レコメンデーションを改善することを目的としている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:03:16 GMT)
YOLO Meets Mixture-of-Experts: Adaptive Expert Routing for Robust Object Detection [0.0] 本稿では,複数のYOLOv9-Tエキスパート間の適応的ルーティングを取り入れた,オブジェクト検出のためのMixture-of-Expertsフレームワークを提案する。
平均精度(mAP)と平均リコール(AR)は、単一のYOLOv9-Tモデルよりも高い。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:53:36 GMT)
Voiced-Aware Style Extraction and Style Direction Adjustment for Expressive Text-to-Speech [0.0] 音声認識型スタイル抽出とスタイル方向調整によるスタイル強調を行うSpotlightTTSを提案する。
TTSモデルへの最適統合のために,抽出したスタイルの方向を調整し,音声品質を向上する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:10:33 GMT)
Verified Implementation of GRAPE Pulse Optimization for Quantum Gates with Hardware-Representative Noise Models [0.0] ゲートの忠実さは、実用的な量子計算を制限する主要なボトルネックである。
GraPE最適化パルスは、標準ガウスパルスと比較して77$times$のシミュレーションゲート誤差を低減させる。
このフレームワークの信頼性は、864のテストスイート(74%のコードカバレッジ)とNASA JPL Power-of-10の安全クリティカルコーディング標準への準拠によって保証されている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:44:05 GMT)
Unraveling additional quantum many-body scars of the spin-$1$ $XY$ model with Fock-space cages and commutant algebras [0.0] 量子多体傷(Quantum many-body scars, QMBS)は、エルゴディディディティを弱めるメカニズムである。
我々は、フォック空間ケージ状態に類似した干渉保護された新しい固有状態の集合を同定する。
さらに、体積が絡み合った状態の塔と、自由な局所的な自由度を持つミラーダイマー状態のセットという、より新しい2つの正確な傷跡も発見しました。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:56:27 GMT)
Unified Low-Light Traffic Image Enhancement via Multi-Stage Illumination Recovery and Adaptive Noise Suppression [0.0] 低照度交通画像は、自動運転、インテリジェント交通、都市監視システムにおける信頼性の高い認識に不可欠である。
低照度画像強調のための教師なし多段階深層学習フレームワークを提案する。
本手法は,現実の低照度交通シナリオにおいて,可視性を高め,構造を保ち,下流認識の信頼性を向上させる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:13:52 GMT)
Uncertainty-Resilient Multimodal Learning via Consistency-Guided Cross-Modal Transfer [0.0] この論文は、整合性誘導型クロスモーダルトランスファーによる不確実性と弾力性のあるマルチモーダル学習を探求する。
中心となる考え方は、堅牢な表現学習の基盤として、クロスモーダルなセマンティック一貫性を使用することである。
この基礎の上に構築された論文は、セマンティックロバスト性を高め、データ効率を向上し、ノイズや不完全な監視の影響を減らすための戦略を調査する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:26:42 GMT)
Transformer-Guided Deep Reinforcement Learning for Optimal Takeoff Trajectory Design of an eVTOL Drone [0.0] 電動垂直離着陸機(eVTOL)は、都市交通渋滞を緩和する有望な機会を提供する。
従来の最適制御法は、高効率で確立された解を提供するが、問題次元と複雑性によって制限される。
深層強化学習(DRL)は、複雑な非線形システムに対処する人工知能の特殊なタイプとして出現する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:11:54 GMT)
Towards A Catalogue of Requirement Patterns for Space Robotic Missions [0.0] 仕様パターンは再利用可能なロジックベースのテンプレートを提供する。
ロボット仕様の一連のパターンと、NASAのFRET(Formal Requirements Elicitation Tool)の形式化は、すでに存在する。
我々は、既存のパターンと新しいパターンのいくつかのバリエーションと同様に、5つの新しい要求仕様パターンに貢献しました。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:35:49 GMT)
The Tokenization Bottleneck: How Vocabulary Extension Improves Chemistry Representation Learning in Pretrained Language Models [0.0] トークン化ボトルネック」は、大規模言語モデルの化学への応用を妨げた。
本稿では、自然言語と分子構造の表現を単一のモデルで統一することで、このボトルネックを解決するための原則的手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:12:35 GMT)
The Most Informative Cramér--Rao Bound for Quantum Two-Parameter Estimation with Pure State Probes [0.0] 純粋状態を持つ2パラメータ推定のための達成可能なバウンダリに対する新しい式を提案する。
また、最適な測定値も決定する。
この結果の有用性を示すために,格子状態を用いた変位推定の精度限界を決定する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 22:15:14 GMT)
Tell Me: An LLM-powered Mental Well-being Assistant with RAG, Synthetic Dialogue Generation, and Agentic Planning [0.0] Tell Meは、大きな言語モデルの進歩を活用して、ユーザと研究者にアクセシブルでコンテキスト対応のサポートを提供する、メンタルウェルビーイングシステムである。
i) パーソナライズされた知識基盤対話のための検索強化世代アシスタント(RAG) ; (ii) クライアントプロファイルに条件付き合成クライアントセラピスト対話ジェネレータで、治療言語とデータ拡張の研究を容易にする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:43:04 GMT)
Systems with Quantum Dimensions [0.0] 本稿では,空間次元の数を動的量子変数に昇格させる量子力学系を提案する。
我々の枠組みは、重力から凝縮物質への物理系構築の新しい道を開き、次元の概念が量子化する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:50:49 GMT)
Structured Extraction of Vulnerabilities in OpenVAS and Tenable WAS Reports Using LLMs [0.0] 本稿では,OpenVASおよびTenable WASスキャナーレポートから脆弱性を抽出・構造化する自動手法を提案する。
34の脆弱性を持つレポートを用いた評価では、GPT-4.1とDeepSeekはベースライン(ROUGE-Lが0.7以上)と最も類似している。
この手法は、複雑なレポートを有用なデータセットに変換することの実現可能性を示し、効果的な優先順位付けと、センシティブなデータの今後の匿名化を可能にする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:42:19 GMT)
Strategic Innovation Management in the Age of Large Language Models Market Intelligence, Adaptive R&D, and Ethical Governance [0.0] 本研究では,大規模言語モデル(LLM)の研究開発プロセスの変換における多機能性について検討する。
知識発見の自動化、仮説作成の促進、学際的洞察の統合、イノベーションエコシステム内の協力の実現により、LLMは研究プロセスの効率と効率を劇的に改善する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:50:39 GMT)
Static Laboratory-Frame Polarization of a Trapped Molecular Ion for CP-Violation Searches [0.0] 重分子イオンは、ポールトラップに閉じ込められたまま、静電場によって分極可能であることを示す。
この効果は、静電気力とトラップの乳頭運動力のキャンセルから生じ、平衡位置となる。
これにより、静電場における量子論理分子ラジオ周波数クロックの動作が可能となり、EDMの感度が向上する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:40:36 GMT)
Spectrotemporal processing in a dual gradient echo and electromagnetically-induced transparency memory [0.0] 近年,マルチモード量子メモリにおいて,分光時空間情報の処理が実証されている。
分光時間処理における電磁誘導透過システムの可能性を実証する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:37:02 GMT)
SmallML: Bayesian Transfer Learning for Small-Data Predictive Analytics [0.0] SmallMLは50~200という小さなデータセットで、エンタープライズレベルの予測精度を達成する。
顧客データの検証では、96.7%+/-4.2%のAUCがビジネス当たり100の観測結果を示している。
3300万の米国中小企業のエンタープライズグレードの予測を可能にすることで、SmallMLはAIの民主化における重要なギャップに対処する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:00:55 GMT)
Simulating quantum electrodynamics in 2+1 dimensions with qubits and qumodes [0.0] 2+1次元の量子電磁力学をシミュレーションするためのハイブリッド量子モードフレームワークを開発した。
フェルミオン物質場は量子ビットで表され、U(1)ゲージ場は連続可変ボソニックモードで符号化される。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:52:42 GMT)
Semi-device-independent channel identification with communication matrices [0.0] 我々は、2つの量子チャネルを区別し、得られた測定統計からそれらを再構築する作業について検討する。
通信行列の定式化では,準備・測定シナリオの測定統計値が通信行列として表現される。
通信行列のランクから,セットアップの情報を直接推定できることが示される。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 09:08:00 GMT)
Self-interacting quantum particles and the Dirac delta potential [0.0] ディラックデルタ関数ポテンシャルは複素波動関数に対する実ヒルベルト空間アプローチにおいて考慮される。
以前決定されたように、真のヒルベルト空間のアプローチは、自己相互作用物理的システムの可能性を可能にする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:28:11 GMT)
Self-Organization of Attractor Landscapes in High-Capacity Kernel Logistic Regression Hopfield Networks [0.0] カーネルベースの学習は、Hopfieldネットワークのストレージ容量を劇的に増加させる。
我々は,アトラクタの局所的安定性を定量化するために,ネットワークのエネルギー景観の幾何学的解析を行う。
我々の中心的な発見は、ネットワークがアトラクタ安定性を最大化する"最適化の尾根"の出現である。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:26:54 GMT)
Selective Forgetting in Option Calibration: An Operator-Theoretic Gauss-Newton Framework [0.0] パラメトリックオプションキャリブレーションにおける選択摂動(機械アンラーニング)の原理的枠組みを導入する。
安定保証, 境界, および, 提案した作用素が標準正則性仮定の下で局所的完全性を満たすことを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 23:47:49 GMT)
SecureSign: Bridging Security and UX in Mobile Web3 through Emulated EIP-6963 Sandboxing [0.0] モバイルWeb3は破滅的な保持(5%)に直面している。
組み込みウォレットは適度なユーザビリティを実現するが、固有のクリックジャック脆弱性に悩まされる。
EIP-6963プロバイダサンドボックスにより,デスクトップブラウザのセキュリティをモバイルに適応させるPWAベースのアーキテクチャであるSecureSignを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:02:46 GMT)
Robustness of the quantum Mpemba effect against state-preparation errors [0.0] 量子ムペンバ効果(quantum Mpemba effect、QME)は、多体系で観測される現象である。
初期システム状態におけるノイズ誘発誤差は,対称性回復率が高く,QMEがより強いことを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:00:02 GMT)
Robustness of Structured Data Extraction from Perspectively Distorted Documents [0.0] 現実の文書画像は通常、平面上で回転するだけでなく、視点的に歪んでいる。
本研究では, 現状技術モデルGemini-1.5-proのデータ抽出精度に対する摂動の影響について検討した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:54:21 GMT)
Robust Two-Qubit Geometric Phase Gates using Amplitude and Frequency Ramping [0.0] 本研究では, 断熱的に傾斜した状態依存力に基づいて, 閉じ込められた原子イオン間の絡み合いを発生させる手法を実証する。
状態依存力の振幅と運動モードの周波数の両方を上昇させることで、運動モードの占有に頑健なエンタングリング動作を実現する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:10:38 GMT)
Reinforcement Learning from Implicit Neural Feedback for Human-Aligned Robot Control [0.0] 非侵襲脳波(EEG)信号を利用した暗黙のフィードバック(RLIHF)フレームワークによる新しい強化学習を提案する。
我々は,Kinova Gen2ロボットアームを用いて,MuJoCo物理エンジン上に構築したシミュレーション環境におけるアプローチを評価した。
結果は、デコードされた脳波フィードバックで訓練されたエージェントが、密集した手作業による報酬で訓練されたエージェントに匹敵するパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 22:50:32 GMT)
ReflexGrad: Three-Way Synergistic Architecture for Zero-Shot Generalization in LLM Agents [0.0] ReflexGradは、3つの相補的なメカニズムを密に結合する新しいアーキテクチャである。
本システムは, 純粋意味論的推論により, 真のゼロショット一般化を実現する。
我々の研究は、相補的な学習機構の相補的な統合が、堅牢なゼロショット一般化を可能にすることを実証している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:25:05 GMT)
Radial Compensation: Stable and Semantically Decoupled Generative Models on Riemannian Manifolds [0.0] 本稿では,極からの測地距離にのみ依存するように,接空間の基底密度を選択する情報幾何学的手法を提案する。
体積歪みと測地誤差のバランスをとるバランスチャートを導出する。
RCの下では、すべてのbExp設定は同じ多様体密度とフィッシャー情報を保持し、より小さなダイヤル値で勾配のばらつきと流量のコストを低減させる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:15:25 GMT)
RAG-Driven Data Quality Governance for Enterprise ERP Systems [0.0] LLMによるクエリ生成と自動データクリーニングを組み合わせたエンドツーエンドパイプラインを提案する。
システムは6ヶ月で24万人の従業員の記録を管理するプロダクションシステムにデプロイされる。
このモジュラーアーキテクチャは、AIネイティブなエンタープライズデータガバナンスのための再現可能なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:08:44 GMT)
Quantum Circuit Model of Black Hole Evaporation with Controlled Causal Leakage [0.0] 蒸発過程を通じて, エンタングルメントエントロピー, 相互情報, エンタングルメントネガティビティの進化について検討した。
半因果性の小さな違反でさえ、非ゼロの残留エントロピーと地平線上の持続的負性を生み出す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 10:54:49 GMT)
Quality-Controlled Multimodal Emotion Recognition in Conversations with Identity-Based Transfer Learning and MAMBA Fusion [0.0] 話者識別,音声テキストアライメント,顔検出を検証したデータセットの品質制御パイプラインを実装した。
個人識別型埋め込みは、安定した音響的特徴や顔的特徴だけでなく、個人固有の感情表現パターンを捉えていると仮定して、話者と顔の認識からの伝達学習を活用する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 23:24:27 GMT)
QML-HCS: A Hypercausal Quantum Machine Learning Framework for Non-Stationary Environments [0.0] QML-HCSは量子インスパイアされた機械学習モデルの構築と分析のための研究グレードのフレームワークである。
可逆変換、マルチパス因果伝播、ドリフト中の代替状態の評価が可能な超因果処理コアを実装している。
アーキテクチャには継続的フィードバックが組み込まれており、因果一貫性を維持し、完全な再トレーニングを必要とせずにモデル動作を調整する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:50:49 GMT)
PuzzlePoles: Cylindrical Fiducial Markers Based on the PuzzleBoard Pattern [0.0] PuzzlePoleは円筒形のマーカーであり、360度表示方向からの信頼性の高い認識とポーズ推定を可能にする。
このデザインは、ロボットナビゲーションやSLAMから具体的なインターフェイスまで、さまざまな自律システムのシナリオに展開するための柔軟性を提供する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:30:15 GMT)
Pure gapped ground states of spin chains are short-range entangled [0.0] 基底状態が特異なギャップを持つ基底状態であるとは、GNSハミルトニアンがスペクトルの他の部分とのギャップによって分離された特異な基底状態を持つ場合である。
それぞれの特異なギャップを持つ基底状態が短距離絡み合っていることを証明した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:38:52 GMT)
Postselected Entangled States by Photon Detection [0.0] 2レベルエミッタの高励起アンサンブルが光子検出によってどのように絡み合うかを示す。
我々の研究は、オープン量子システムにおけるポストセレクトされた絡み合いの発生のための新しい道を開く。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 00:06:57 GMT)
Plug-and-Play Multi-Concept Adaptive Blending for High-Fidelity Text-to-Image Synthesis [0.0] 本稿では,高忠実度テキスト・トゥ・イメージ(T2I)生成のためのプラグイン・アンド・プレイマルチコンセプト・ブレンディングを提案する。
本手法は,各パーソナライズされた概念の意図した外観を忠実に反映するために,ガイド付き外観注意を利用する。
また,非個人化領域の整合性を維持するマスク誘導型ノイズミキシング戦略を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:25:47 GMT)
Phonon scattering from spatial relaxation of one-dimensional Bose gases [0.0] 弱い相互作用を持つボース気体中の空間密度変調の非平衡緩和について検討する。
緩和は、量子ゆらぎに結合した非平衡散乱速度$_k,t$によって制御されることを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 19:18:55 GMT)
Perturbative nonlinear J-matrix method of scattering in two dimensions [0.0] 円対称性を持つ2次元の時間非依存非線形シュルディンガー方程式に対する散乱行列を得る。
我々は、n が自然数である一般 2n 1 の非線形性の理論を提示する。
エネルギーの一定の値において、2つの安定解による分岐の発生を観察する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:15:26 GMT)
Pattern-Dependent Performance of the Bernstein-Vazirani Algorithm [0.0] 本稿では,超伝導量子プロセッサ上での11種類の試験パターンにまたがるベルンシュタイン・ヴァジラニアルゴリズムのベンチマーク研究について述べる。
その結果、平均成功率は100.0%(理想シミュレーション)、85.2%(ノイズエミュレーション)、26.4%(リアルハードウェア)であることが判明した。
量子状態トモグラフィーは、パターン密度と状態忠実度劣化のほぼ完全な相関を示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:36:14 GMT)
On-Premise SLMs vs. Commercial LLMs: Prompt Engineering and Incident Classification in SOCs and CSIRTs [0.0] セキュリティインシデント分類のためのオープンソースモデルを評価し,プロプライエタリモデルと比較した。
その結果、プロプライエタリなモデルは依然として高い精度を示していますが、ローカルにデプロイされたオープンソースモデルは、プライバシ、コスト効率、データ主権の利点を提供します。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:56:49 GMT)
Observation of critical scaling in the Bose gas universality class [0.0] 臨界指数は、相転移近くの熱力学的量の分岐スケーリングを特徴付ける。
我々は、本質的に相互作用しない光子の2次元量子ガスにおける臨界スケーリングの観測を報告した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:53:38 GMT)
Nonparametric estimation of conditional probability distributions using a generative approach based on conditional push-forward neural networks [0.0] 本稿では,条件分布推定のための生成フレームワークCPFNを紹介する。
CPFN は、$varphi(x,U)$ と $Y|X=x$ がほぼ同じ法則に従うような写像 $varphi=varphi(x,u)$ を学ぶ。
これはKulback-Leiblerの定式化から導かれる目的関数を通じて訓練される。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:59:20 GMT)
Measurement-Based Quantum Computation Using the Spin-1 XXZ Model with Uniaxial Anisotropy [0.0] 一軸異方性を持つスピン-1 XXZ鎖の基底状態は、測定に基づく量子ベースの計算の資源状態として機能する。
基本回転ゲートと一般1量子ユニタリゲートの両方のゲート忠実度を評価した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:35:34 GMT)
Making Evidence Actionable in Adaptive Learning [0.0] 本研究では,インストラクターによるフィードバックループを支持するエビデンスを示し,概念レベルの評価エビデンスを精査されたマイクロインターベンションに変換する。
適応学習アルゴリズムは、ギャップ閉鎖のハードな保証としての妥当性、時間と冗長性の予算制約としての注意、単一リソースへの過度な適合に対する保護としての多様性の3つのセーフガードを含む。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:06:08 GMT)
Link prediction with swarms of chiral quantum walks [0.0] タンパク質-タンパク質相互作用ネットワークの再構築は、ネットワーク医学における中心的な課題である。
近年の研究では、量子ウォークに基づくアプローチがこの課題を約束していることが示唆されている。
我々はハミルトニアン発生器のランダム位相の追加によってキラル性を導入することによってこれらのアルゴリズムを構築する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:10:45 GMT)
Lecture Notes on Information Scrambling, Quantum Chaos, and Haar-Random States [0.0] 情報スクランブルは現代の量子統計物理学と量子カオスの中心である。
講義ノートは静的な視点と動的視点の両方からの情報スクランブルについて紹介する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:02:37 GMT)
Learnable Total Variation with Lambda Mapping for Low-Dose CT Denoising [0.0] Learnable Total Variation (LTV) は、データの駆動型Lambda Mapping Network (LambdaNet) と、ピクセルごとの正規化マップを予測するアンロールテレビソルバを結合する。
LTVはブラックボックスCNNの解釈可能な代替手段を提供し、3Dおよびデータ一貫性駆動の再構築の基礎を提供する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:44:52 GMT)
Keeping Code-Aware LLMs Fresh: Full Refresh, In-Context Deltas, and Incremental Fine-Tuning [0.0] 我々は、以前のコードに保持を放棄することなく、モデルを新しい状態に保つ方法を研究している。
A)新しいスナップショットでモデル全体をトレーニングするフルリフレッシュ、(B)推論時に最近のデルタを注入するインコンテキストラーニング(ICL)、(C)デルタ由来のトレーニングセット上のインクリメンタルファインタニング(Inc-FT)の3つのファミリーを比較した。
削除されたパスに報いることなく、リネームをクレジットするエイリアス対応評価プロトコルと、削除されたパスの残余排出量を定量化する実用的なフォーッティングプローブをコントリビュートする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:01:56 GMT)
Impact of Image Resolution on Age Estimation with DeepFace and InsightFace [0.0] 本研究では,DeepFaceとInsightFaceを用いた画像解像度が年齢推定精度に与える影響を評価する。
DeepFaceとInsightFaceは224x224ピクセルで、MAEは10.83年(DeepFace)、7.46年(InsightFace)である。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:25:55 GMT)
How Should the Law Treat Future AI Systems? Fictional Legal Personhood versus Legal Identity [0.0] 我々は、(A)将来のAIシステムに対する対象分類の維持、(B)適切な高度で個別化されたAIシステムに関連する架空の法的人物の作成、または(C)適切な高度で個別化されたAIシステムに対する法的同一性を通じてノンフィクションの法的な人物を認識することによって、全体的な長期的法的一貫性を最大化するかどうかを評価する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 23:08:28 GMT)
Ground Truth Generation for Multilingual Historical NLP using LLMs [0.0] 本稿では, 大規模言語モデル(LLM)を用いて, 歴史的フランス語(16世紀~20世紀)と漢文の地文的注釈を作成する方法について概説する。
私たちはspurCyを微調整し、POS(Part-of-speech)アノテーション、補題化、名前付きエンティティ認識の期間別テストにおいて、大幅な改善を実現しました。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:25:43 GMT)
Gradient-descent methods for quantum detector tomography [0.0] 我々は,制約付き凸最適化 (CCO) に対して数値的なベンチマークを行い,より少ない時間で高いあるいは同等の再構成忠実度に達することを示す。
また、複素シュティーフェル多様体上のPOVMのパラメトリゼーションによる位相感受性ケースへのアプローチの拡張の可能性を示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:20:11 GMT)
Genetically Engineered Quantum Circuits for Financial Market Indicators [0.0] 我々は、GASPフレームワークを用いて、株価データの量子状態への符号化を最適化する。
符号化プロセスの忠実度と効率性を両立させることができることを示す。
本研究は、実世界のデータの効率的なエンコーディングにおけるGASPの適用性に関する知見を提供する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:51:59 GMT)
Foundational Question Generation for Video Question Answering via an Embedding-Integrated Approach [0.0] 埋め込み型アプローチ(FIQ)によるビデオ質問に対する基礎的質問生成について紹介する。
FIQは、ビデオコンテンツの基本的な理解を改善し、VQAモデルの推論能力を高めるために設計されたフレームワークである。
SUTD-TrafficQAデータセットの実験結果は、FIQが最先端のパフォーマンスを達成し、既存のベースラインアプローチを超えることを示した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:45:50 GMT)
ForensicFlow: A Tri-Modal Adaptive Network for Robust Deepfake Detection [0.0] 本稿では,ビデオディープフェイク検出のためのRGB,テクスチャ,周波数エビデンスを融合した3モーダル法医学フレームワークForensicFlowを紹介する。
Focal LossでCeleb-DF (v2)でトレーニングされたForensicFlowは、AUC 0.9752、F1-Score 0.9408、精度 0.9208を達成し、シングルストリームベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:56:34 GMT)
Fifty Shades of Greenwashing: The Political Economy of Climate Change Advertising on Social Media [0.0] 我々は、気候変動に関連するソーシャルメディア広告を、汚染企業がどのように利用して批判をリダイレクトできるかを示す。
われわれはMetaのAd Targeting Datsetで1100万件のソーシャル・政治広告でグリーンウォッシングコンテンツを特定した。
この広告の多くは、化石燃料産業と無関係の組織によって行われる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 21:32:19 GMT)
Failure to Mix: Large language models struggle to answer according to desired probability distributions [0.0] 現在のAIベンチマークは客観的に答えを正し、これらのベンチマークに対する強化学習を通じて大きな言語モデル(LLM)をトレーニングすることで、確率的探索を妨げている。
そこで本研究では,LLMが単純な確率分布に従って出力を出力するように要求する系統的な実験を行った。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:22:26 GMT)
Explicit block-encoding for partial differential equation-constrained optimization [0.0] 偏微分方程式(PDE)制約付き最適化は、設計、制御、推論などの様々な応用に現れる。
まず、PDE制約のある最適化問題を解くための完全コヒーレントな量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:26:09 GMT)
Experimental observation and application of the genuine Quantum Mpemba Effect [0.0] 量子Mpemba効果 (QME) を実験的に検討し, システムが不規則な緩和を呈し, 初期の平衡状態から近い状態よりも早く熱を発散することを示した。
量子オットー冷凍機にQMEを適用し,冷却能力を高めた。
この概念実証実験は、量子熱タスクを改善するための新しい実践的な方法を明らかにする。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:55:13 GMT)
Examining the Metrics for Document-Level Claim Extraction in Czech and Slovak [0.0] 文書レベルのクレーム抽出は、ファクトチェックの分野で依然としてオープンな課題である。
クレーム集合間の最適なアライメントと評価手法を同定する手法について検討する。
チェコ語とスロバキア語のニュース記事ドメインによるコメントから抽出した,新たに収集したデータセット検索実験を行った。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:09:09 GMT)
Entropic uncertainty under indefinite causal order and input-output direction [0.0] 量子スイッチと量子時間フリップにパウリチャネルを供給することで、全エントロピーの不確実性を大幅に低減できることを示す。
その結果,不確定因果順序と入力出力方向は,ノイズの影響を緩和するための資源として有効であることが判明した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 06:57:50 GMT)
Enhancing Non-classical Properties of Entangled Coherent States via Post-Selected von Neumann Measurements [0.0] 選択後弱測定プロセスの理論的解析と,ECSの非古典的特徴を増幅する効果について検討した。
我々は、連続変数の絡み合った状態の精密な操作のための調整可能な弱い測定フレームワークを確立する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:10:02 GMT)
Enhancing Agentic Autonomous Scientific Discovery with Vision-Language Model Capabilities [0.0] 視覚言語モデル(VLM)によって導かれるマルチエージェントシステムは、エンドツーエンドの自律的な科学的発見を改善する。
プロットを検証可能なチェックポイントとして扱うことで、VLM-as-a-judgeは動的に生成されたドメイン固有のルーリックに対する数値を評価する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:23:02 GMT)
Embedding Explainable AI in NHS Clinical Safety: The Explainability-Enabled Clinical Safety Framework (ECSF) [0.0] 本稿では,説明責任をDCB0129/0160ライフサイクルに組み込んだ説明責任型臨床安全フレームワーク(ECSF)を提案する。
相互規制合成は、DCB節をグッド機械学習プラクティス、NHS AI AssuranceとT.E.S.Tフレームワーク、EU AI Actの原則にマッピングする。
ECSFは5つのチェックポイントを導入している: リスク識別のためのグローバルな透明性、検証のためのケースレベルの解釈可能性、評価のための臨床使用性、リスク管理のためのトレーサブルな決定経路、市場後監視のための縦断的な解釈可能性監視。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 14:03:08 GMT)
Dynamics of entanglement asymmetry for space-inversion symmetry of free fermions on honeycomb lattices [0.0] 二次元ハニカム格子上の自由フェルミオンの空間反転対称性に対するエンタングルメント非対称性について検討する。
局所部分系の絡み合い非対称性はエネルギー不均衡に非解析的依存を示すことを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:57:06 GMT)
Dynamic Black-box Backdoor Attacks on IoT Sensory Data [0.0] センサデータに基づくIoTシステムに対して,ブラックボックス攻撃を行う新しい動的トリガ生成手法について論じる。
実験により,入力データに対する摂動が最小限に抑えられた各種データセットや分類器モデルにおいて,攻撃が成功したことを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 03:07:03 GMT)
Doppler Invariant CNN for Signal Classification [0.0] 本稿では、周波数領域における畳み込みシフトの等価性を利用する複雑な値を持つ畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
ドップラーシフトのない例では, ランダムなドップラーシフトを伴わない場合と, ランダムなドップラーシフトを伴わない場合とで, 本モデルが一貫した分類精度を維持していることを示す。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:31:13 GMT)
Do Large Language Models (LLMs) Understand Chronology? [0.0] 大規模言語モデル(LLM)は、金融や経済学においてますます使われており、ルックアヘッドバイアスに対する迅速な試みは、モデルが時系列を理解することを暗黙的に仮定している。
我々は、モデルが事前学習から既に知っている事実よりも複雑さが増大する一連の時系列順序タスクで、この基本的な問題を検証する。
GPT-4.1, Claude-3.7 Sonnet, with and without Extended Thinking (ET) and GPT-5 across multiple reasoning-effort settings。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:45:12 GMT)
Dimension vs. Precision: A Comparative Analysis of Autoencoders and Quantization for Efficient Vector Retrieval on BEIR SciFact [0.0] Int8量子化は最も効果的な「スイートスポット」を提供し、nDCG@10の無視可能な[1-2%]ドロップで4倍の圧縮を達成する。
オートエンコーダは優雅な劣化を示すが、同等の4倍圧縮比でより大きな性能損失を被る。
バイナリ量子化は 破滅的な性能低下のため この作業には適さないことが分かりました
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:07:31 GMT)
Derivative of the truncated singular value and eigen decomposition [0.0] この技術的注記は、切り刻まれた特異点と固有値分解の微分に関する包括的で詳細な議論を提供する。
主な焦点は、完全な分解の知識が欠如しているにもかかわらず、切断された部分の観点から微分を正しく表現することである。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 16:45:46 GMT)
DNNs, Dataset Statistics, and Correlation Functions [0.0] 画像認識にはデータセット構造が重要であると我々は主張する。
DNNが訓練される実際のデータセットにおける相関構造の性質と生成に焦点をあてる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 18:38:21 GMT)
Copula Based Fusion of Clinical and Genomic Machine Learning Risk Scores for Breast Cancer Risk Stratification [0.0] MeTABRICの乳がんコホートを用いて,臨床とゲノム機械学習のリスクスコアの結合関係を直接モデル化することにより,5年間のがん特異的死亡のリスク階層化が向上するか否かを検討した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:59:36 GMT)
Context-aware, Ante-hoc Explanations of Driving Behaviour [0.0] システムの振る舞いに関する説明は、AVの安全性と信頼を高めることができる。
説明可能性工学の分野は、設計時に説明モデルを開発することでこの問題に取り組む。
本研究では,実行時の(予期せぬ)運転操作のコンテキスト認識的,アンテホックな説明を可能にする手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:33:24 GMT)
Coherent regime of Kapitza-Dirac effect with electrons [0.0] 走査型電子顕微鏡におけるKapitza-Dirac効果の観察について報告する。
電子横運動量スペクトル中の光子側バンドは収束ビーム回折幾何学において検出される。
この効果は、様々な種類の電子顕微鏡においてコヒーレント電子ビームスプリッターまたは位相プレートとして機能する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 13:59:25 GMT)
Clinically-Validated Innovative Mobile Application for Assessing Blinking and Eyelid Movements [0.0] BappはFlutterフレームワークを使用して開発され、Google ML Kitに統合されたモバイルアプリケーションである。
Bappのパフォーマンスは、Precision、Recall、F1-Scoreなどの標準メトリクスを使用して評価され、その結果は98.4%の精度、96.9%のリコール、全体の精度は98.3%であった。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:07:31 GMT)
Canonical quantization for Equilibrium Thermodynamics [0.0] 我々はディラックの制約系の理論を適用して平衡熱力学の正準量子化を定式化する。
理想気体に対しては、エントロピーが時間の役割を果たすシュルディンガー型方程式が出現し、波動関数は内部エネルギーによって決定される位相を取得する。
擬エルミティアンフレームワークは温度作用素のエルミティシティを復元し、制約実現の同値性を確立する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:12:25 GMT)
Can Artificial Intelligence Accelerate Technological Progress? Researchers' Perspectives on AI in Manufacturing and Materials Science [0.0] 本稿は、AIおよび機械学習(ML)技術に経験した研究者を対象に、米国拠点の学術的製造・材料科学への32回のインタビューの結果を報告する。
インタビュアーは主に、材料や製造プロセスのモデリングにAIを使用し、材料や製造プロセスなどのデザインスペースのより安価で迅速な探索を可能にした。
インタビュアーは、AI/MLツールは、高密度データがすでに利用可能であるデザインスペースの外では信頼できない、古い研究手法と相まって熟練した司法的応用を必要とする、AI/MLツールは破壊的な理論的進歩の機会を有害に回避できる、と報告している。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 00:19:37 GMT)
CVChess: A Deep Learning Framework for Converting Chessboard Images to Forsyth-Edwards Notation [0.0] 本稿では,チェスボード画像をForsyth-Edwards Notation (FEN)に変換するフレームワークであるCVChessを提案する。
本手法では,スマートフォンカメラ画像から断片認識を行うために,残層を有する畳み込みニューラルネットワーク(CNN)を用いる。
結果として得られる分類はFEN文字列としてエンコードされ、最も最適な動きを生成するためにチェスエンジンに入力することができる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:53:19 GMT)
CAPIRE: Modelling the Impact of Teacher Strikes and Inflation on Student Trajectories in Engineering Education [0.0] 本研究では,CAPIREフレームワークをマクロショックモジュールで拡張し,教員のストライキやインフレーションが工学教育における学生の軌道に与える影響を分析する。
我々は,全国的なインフレーション指標,教師ストライクへのラッジ露出,マクロショックとカリキュラム摩擦の相互作用を組み込んだ,リーク対応多レベル機能セットを構築した。
教師のストライキやインフレーションは、独立したイベントではなく、カリキュラム設計や財政的レジリエンスを通じて、構造的に媒介される教育破壊者として機能すると主張する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 15:16:26 GMT)
Beyond Surface-Level Similarity: Hierarchical Contamination Detection for Synthetic Training Data in Foundation Models [0.0] トークンレベル,意味レベル,推論パターン,パフォーマンス崖検出の4つのレベルで動作する階層的汚染検出フレームワークを提案する。
意味レベルの汚染は既存の手法を回避できるが,階層的なアプローチで効果的に検出できることを実証する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:56:10 GMT)
Beyond Accuracy: A Multi-Dimensional Framework for Evaluating Enterprise Agentic AI Systems [0.0] 現在のエージェントAIベンチマークは、タスク完了の正確さを主に評価している。
コスト制御評価の欠如は、同様の精度で50倍のコスト変動をもたらす。
エージェントのパフォーマンスが60%(単一実行)から25%(8ラン一貫性)に低下する不適切な信頼性評価
論文参考訳(メタデータ) (Tue, 18 Nov 2025 04:50:19 GMT)
Attention via Synaptic Plasticity is All You Need: A Biologically Inspired Spiking Neuromorphic Transformer [0.0] スパイク刺激依存型可塑性(STDP)による自己注意を実現するニューロモルフィックトランスフォーマーを提案する。
脳内の記憶と学習のコアメカニズムであるSTDPは、自然にインメモリコンピューティングを可能にし、非ヴォンノイマンハードウェアをサポートする。
CIFAR-100では94.35%と78.08%の精度を達成し、標準のANNトランスに比べて88.47%のエネルギー削減を実現した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 17:28:29 GMT)
Artificial intelligence approaches for energy-efficient laser cutting machines [0.0] 本研究は,レーザー切断におけるエネルギー消費と環境影響に関する重要な課題に対処する。
省エネを実現するための新しい深層学習手法を提案する。
その結果, 吸煙ポンプのエネルギー消費量は20%から50%減少した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 22:25:58 GMT)
AnonLFI 2.0: Extensible Architecture for PII Pseudonymization in CSIRTs with OCR and Technical Recognizers [0.0] AnonLFI 2.0 は CSIRT 用のモジュール式擬似化フレームワークで、HMAC256 を用いて強く可逆的な擬似語を生成する。
PDF文書とOpenVAS XMLレポートにOCRを適用した2つのケーススタディにおいて、システムは完全な精度とF1スコア76.5と92.13を達成し、データセットを安全に作成する効果を実証した。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 20:34:49 GMT)
Analyzing the Impact of Participant Failures in Cross-Silo Federated Learning [0.0] Federated Learning(FL)は、データを共有することなく機械学習(ML)モデルをトレーニングするための新しいパラダイムである。
参加者数が少ないクロスサイロFLの文脈において,参加者の失敗がモデル品質に与える影響について検討した。
我々の結果は、堅牢なFLシステムの構築を目指す研究者やソフトウェアアーキテクトに洞察を与えます。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 12:59:51 GMT)
Addressing Stereotypes in Large Language Models: A Critical Examination and Mitigation [0.0] 自然言語処理(NLP)の発展に伴い,近年,大規模言語モデル (LLM) が普及している。
本研究は, 生成人工知能(AI)の増大に伴い, LLMのバイアスに対処する必要があることを調査し, 強調する。
我々は, StereoSet や CrowSPairs などのバイアス特異的なベンチマークを用いて,BERT や GPT 3.5,ADA など,様々な世代モデルにおける様々なバイアスの存在を評価する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 05:43:34 GMT)
AISAC: An Integrated multi-agent System for Transparent, Retrieval-Grounded Scientific Assistance [0.0] AISACはオーケストレーションのためのLangGraph、ベクトル検索のためのFAISS、永続性といった技術の上に構築されている。
システムは、LangGraphのStatePlannerを介して調整されたプロンプトエンジニアリングエージェントを実装している。
プロジェクト主導のブートストラップにより、研究チームはコアコードを変更することなく、ツールやプロンプト、データソースをカスタマイズできる。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 01:51:05 GMT)
A fast and frugal Gaussian Boson Sampling emulator [0.0] 我々は,100モードのガウスボソンサンプリング実験よりも優れた古典シミュレーションを初めて示す。
恥ずかしく並列化可能であるため、少数のCPUやGPUで以前のサンプリングレートと一致させることができる。
ツールのイノベーションのほとんどは、バイナリ変数上の一般的な確率分布に対して有効である。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 21:24:22 GMT)
A Quantitative Method for Shoulder Presentation Evaluation in Biometric Identity Documents [0.0] 生体認証文書の国際規格では、被験者の肩の四角い表示を含む、ポーズ要件の厳格な遵守を義務付けている。
本稿では,このギャップに対処するためのSPEアルゴリズムを提案する。
共通ポーズ推定フレームワークによって提供される2つの肩のランドマークの3次元座標のみを用いて肩のヨーとロールを定量化する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 11:36:54 GMT)
A Practical Implementation of Customized Scrum-Based Agile Framework in Aerospace Software Development Under DO-178C Constraints [0.0] 本研究では、DO-178Cに準拠した安全クリティカルな航空宇宙ソフトウェアに適した、経験的に検証されたスクラムベースのアジャイルフレームワークを提案する。
このフレームワークは、認定、検証、独立の目的を満たすために、コアスクラムの役割、成果物、イベントを適用します。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 07:45:34 GMT)
A Meta-Heuristic Load Balancer for Cloud Computing Systems [0.0] 試作したメタヒューリスティック負荷バランサを実演し,実験結果について考察した。
また,他のメタヒューリスティックアルゴリズムの出力によって個体群がシードされる新しい遺伝的アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 18 Nov 2025 02:24:32 GMT)