Reasoning with Confidence: Efficient Verification of LLM Reasoning Steps via Uncertainty Heads [105.0] データ駆動の不確実性スコアに基づくステップレベルの推論検証の軽量な代替案を提案する。
本研究は, LLMの内部状態が不確実性を符号化し, 信頼性の高い検証信号として機能することが示唆された。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 03:38:29 GMT)
Collaborating Vision, Depth, and Thermal Signals for Multi-Modal Tracking: Dataset and Algorithm [103.4] 既存のマルチモーダルオブジェクト追跡アプローチは、主にRGB-DepthやRGB-Thermalのようなデュアルモーダルパラダイムに焦点を当てている。
本研究は、可視RGB、深度(D)、熱赤外(TIR)を含む3つの相補的なモードを利用する、新しいマルチモーダルトラッキングタスクを導入する。
我々はRDTTrackと呼ばれる新しいマルチモーダルトラッカーを提案する。これは、事前訓練されたRGBのみのトラッカーモデルを活用することで、ロバストトラッカーのためのトリモーダル情報を統合する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:05:02 GMT)
When AI Agents Collude Online: Financial Fraud Risks by Collaborative LLM Agents on Social Platforms [101.2] 大規模言語モデル(LLM)エージェントを用いた大規模マルチエージェントシステムにおける集団金融詐欺のリスクについて検討する。
金融詐欺シナリオをシミュレーションするための大規模ベンチマークであるMultiAgentFraudBenchを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:30:44 GMT)
Sekai: A Video Dataset towards World Exploration [92.4] Sekaiは、世界探検のための豊富なアノテーションを備えた高品質なファーストパーソン・ビデオ・データセットである。
750都市にまたがる100か国以上の地域から、5000時間以上のウォーキングやドローンビュー(FPVとUVA)ビデオで構成されている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:58:41 GMT)
Quriosity: Analyzing Human Questioning Behavior and Causal Inquiry through Curiosity-Driven Queries [92.2] 本稿では,3つの情報源から自然発生の13.5Kの質問を集めたQuriosityを紹介する。
分析の結果,データセットに因果的疑問(最大42%)が存在することが明らかとなった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:31:00 GMT)
FastVGGT: Training-Free Acceleration of Visual Geometry Transformer [83.7] VGGTは最先端のフィードフォワード視覚幾何学モデルである。
本稿では,VGGTの高速化のためのトレーニングフリーメカニズムを用いて,3次元領域におけるトークンのマージを利用したFastVGGTを提案する。
1000の入力画像により、FastVGGTはVGGTの4倍の高速化を実現し、長いシーケンスシナリオにおけるエラーの蓄積を緩和する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:12:33 GMT)
OpenUnlearning: Accelerating LLM Unlearning via Unified Benchmarking of Methods and Metrics [82.1] 我々は,大規模言語モデル(LLM)のアンラーニング手法とメトリクスをベンチマークするための標準フレームワークであるOpenUnlearningを紹介する。
OpenUnlearningは、13のアンラーニングアルゴリズムと16のさまざまな評価を3つの主要なベンチマークで統合する。
また、多様なアンラーニング手法をベンチマークし、広範囲な評価スイートとの比較分析を行う。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 21:03:26 GMT)
EcoSpa: Efficient Transformer Training with Coupled Sparsity [79.5] トランスフォーマーは現代のAIのバックボーンとなっているが、その高い計算要求は重要なシステム課題を引き起こしている。
EcoSpaは、結合した重み行列対を共同で評価し、スパース化する効率的な構造的スパース訓練法である。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:23:43 GMT)
AdaDrive: Self-Adaptive Slow-Fast System for Language-Grounded Autonomous Driving [71.6] 既存のアプローチでは、Large Language Modelsを頻繁に起動し、過剰な計算オーバーヘッドを引き起こすか、固定スケジュールを使用するかのいずれかである。
我々は,LLMが意思決定にいつ,どのように貢献するかを最適に決定する,適応的に協調的なスローファストフレームワークであるAdaDriveを提案する。
AdaDriveは、リアルタイムのパフォーマンスを損なうことなく、意思決定の精度を最大化するフレキシブルでコンテキスト対応のフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 07:05:03 GMT)
EraseFlow: Learning Concept Erasure Policies via GFlowNet-Driven Alignment [64.1] 強力なテキストからイメージジェネレータへの有害あるいはプロプライエタリな概念の消去は、新たな安全要件である。
このフレームワークは、概念の学習を、道の認知という空間における探索として活用する最初のフレームワークです。
単一エンド状態ではなく、すべてのトラジェクトリをサンプリングすることによって、EraseFlowは、モデルの事前を維持しながら、ターゲット概念から生成を分離するポリシーを学ぶ。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:29:02 GMT)
VideoSSR: Video Self-Supervised Reinforcement Learning [62.3] RLVR(Reinforcement Learning with Verifiable Rewards)は、MLLM(Multimodal Large Language Models)の映像理解能力を大幅に向上させた。
ビデオ内のリッチで本質的な情報は、高品質で検証可能なトレーニングデータの自己生成に利用できますか?
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:36:40 GMT)
Breaking the Modality Barrier: Generative Modeling for Accurate Molecule Retrieval from Mass Spectra [60.1] 本稿では,ジェネレーティブ言語モデルに基づく検索フレームワークであるGLMRを提案する。
検索前の段階では、比較学習に基づくモデルでは、上位候補分子を入力質量スペクトルの文脈的先行として識別する。
生成検索段階において、これらの候補分子は入力質量スペクトルと統合され、精製された分子構造を生成するための生成モデルが導かれる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 07:25:53 GMT)
RelightMaster: Precise Video Relighting with Multi-plane Light Images [59.6] RelightMasterは、正確で制御可能なビデオリライトのための新しいフレームワークである。
物理的に可視な照明と影を生成し、元のシーンの内容を保存する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:12:09 GMT)
Route Experts by Sequence, not by Token [58.9] Mixture-of-Experts (MoE)アーキテクチャは、トークンごとに専門家のサブセットだけを活性化することによって、大きな言語モデル(LLM)をスケールする。
標準的なTopKルーティングは、すべてのトークンに同じ固定数の専門家を割り当てる。
トークンレベルからシークエンスレベルにシフトする最小限の修正であるシークエンスレベルTopK(SeqTopK)を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:36:07 GMT)
AUTO-Explorer: Automated Data Collection for GUI Agent [58.6] 本稿では,アノテーションコストを最小限に抑えた自動データ収集手法であるAuto-Explorerを提案する。
それは、GUI環境を自律的に解析し探索する、シンプルだが効果的な探索メカニズムを組み込んでいる。
収集したデータを用いて,マルチモーダル大規模言語モデル(MLLM)を微調整し,GUI要素基盤テストセットを確立する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:13:45 GMT)
Priors in Time: Missing Inductive Biases for Language Model Interpretability [58.1] スパースオートエンコーダは、時間とともに概念の独立を前提としており、定常性を暗示している。
本稿では,時間的帰納バイアスを持つ新たな解釈可能性目標である時間的特徴分析を導入し,その表現を2つの部分に分解する。
私たちの結果は、堅牢な解釈可能性ツールの設計において、データにマッチする帰納的バイアスの必要性を浮き彫りにしています。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:26:10 GMT)
Order Doesn't Matter, But Reasoning Does: Training LLMs with Order-Centric Augmentation [57.6] 本稿では,論理的推論における可換性に基づく順序中心のデータ拡張フレームワークを提案する。
秩序中心の拡張を利用することで、モデルはより柔軟で一般化された推論プロセスを開発することができる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:28:44 GMT)
FLEX: Continuous Agent Evolution via Forward Learning from Experience [54.8] 大規模言語モデル(LLM)によって駆動される自律エージェントは、推論と問題解決に革命をもたらしたが、訓練後も静的のままである。
我々は,LLMエージェントが蓄積された経験を通して継続的に進化することを可能にする勾配のない学習パラダイムであるFLEX(Forward Learning with Experience)を紹介する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:31:39 GMT)
Turbo-DDCM: Fast and Flexible Zero-Shot Diffusion-Based Image Compression [54.1] 本稿では,既存の手法よりも高速に動作する効率的なゼロショット拡散圧縮法を提案する。
提案手法は,最近提案されたDenoising Diffusion Codebook Models (DDCM) 圧縮方式に基づいている。
ユーザが指定した領域を優先する優先度対応型であるTurbo-DDCMと、ターゲットのBPPではなくターゲットのPSNRに基づいて画像を圧縮する歪み制御型である。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:41:27 GMT)
Improving Multimodal Sentiment Analysis via Modality Optimization and Dynamic Primary Modality Selection [54.1] マルチモーダル・センティメント・アナリティクス(MSA)は、ビデオにおける言語、音響、視覚データから感情を予測することを目的としている。
本稿では,モーダリティ最適化と動的一次モーダリティ選択フレームワーク(MODS)を提案する。
4つのベンチマークデータセットの実験では、MODSが最先端の手法より優れていることが示されている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:13:32 GMT)
ViSurf: Visual Supervised-and-Reinforcement Fine-Tuning for Large Vision-and-Language Models [52.8] Supervised Fine-Tuning (SFT) と Reinforcement Learning with Verifiable Rewards (RLVR) は、LVLM(Large Vision-and-Language Models)の典型的なポストトレーニングパラダイムである。
本研究では,SFTとRLVRの長所を1段階にまとめる統合後学習パラダイムViSurfを提案する。
ViSurfの中核は、RLVRのロールアウトに基調ラベルを注入することであり、同時に外部監視と内部強化を提供する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:50:17 GMT)
Auto-PRE: An Automatic and Cost-Efficient Peer-Review Framework for Language Generation Evaluation [52.8] Auto-PREはピアレビュープロセスにインスパイアされた自動評価フレームワークである。
人間のアノテーションに依存する従来のアプローチとは異なり、Auto-PREは自動的に3つのコア特性に基づいて評価子を選択する。
要約,非ファクトイドQA,対話生成を含む3つの代表的なタスクの実験は,Auto-PREが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:14:22 GMT)
Weak-to-Strong Generalization Even in Random Feature Networks, Provably [52.6] GPT-4のような強力な学習者を必要としないことを示す。
我々は、弱い教師によってラベル付けされたデータにのみ訓練されたにもかかわらず、学生がいかに教師より優れているかを実証し、証明し、理解する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 23:17:55 GMT)
DP-Fusion: Token-Level Differentially Private Inference for Large Language Models [51.7] 大規模言語モデル(LLM)は、推論時にプライバシを保存しない。
DP-Fusion は LLM の出力にコンテキスト内のトークンの集合が持つ影響を証明的に束縛する。
提案手法は, 理論的および実証的プライバシを大幅に改善した, 証明可能な民営化文書を作成する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:39:22 GMT)
Scalable Verification of Neural Control Barrier Functions Using Linear Bound Propagation [50.5] 制御バリア関数 (CBF) は非線形動的制御システムの安全性を保証するための一般的なツールである。
本稿では,ニューラルネットワークがCBFとなるために必要な条件に対して,一方向に線形な上界と下界に基づいて,ニューラルCBFを検証するための新しい枠組みを提案する。
我々のアプローチは、CBFの最先端の検証手順よりも大きなニューラルネットワークにスケールする。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:51:15 GMT)
PersonaAnimator: Personalized Motion Transfer from Unconstrained Videos [50.3] PersonaAnimatorは、制約のないビデオから直接パーソナライズされた動きパターンを学習する。
PersonaVidは、ビデオベースのパーソナライズされたモーションデータセットとしては初めてのものだ。
本研究では,物理を意識した運動スタイル正規化機構を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:18:21 GMT)
Token Painter: Training-Free Text-Guided Image Inpainting via Mask Autoregressive Models [49.2] 我々は,Mask AutoRegressive(MAR)モデルに基づく,トレーニング不要なテキストガイド画像の描画手法を開発した。
提案手法では,(1)2つの鍵となる要素を紹介する:(1)Dual-Stream Information Fusion (DEIF) は,新しい誘導トークンを生成するために,周波数領域のテキストや背景からのセマンティック情報とコンテキスト情報を融合し,(2)適応デコーダのアタプティブ・スコア・エンハンシング (ADAE) は,誘導トークンのアテンションスコアを適応的に向上する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:46:20 GMT)
AesTest: Measuring Aesthetic Intelligence from Perception to Production [48.7] AesTestはマルチモーダルな審美的認識とプロダクションのためのベンチマークである。
それは10のタスクにまたがる複数の選択の質問から成り、知覚、鑑賞、創造、写真などをカバーする。
プロの編集、写真合成チュートリアル、クラウドソースによる好みなど、さまざまなソースのデータを統合している。
IAA MLLM と一般MLLM の両方を AesTest 上で評価し,審美的知能構築における重要な課題を明らかにした。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:44:10 GMT)
When Person Re-Identification Meets Event Camera: A Benchmark Dataset and An Attribute-guided Re-Identification Framework [48.2] 本稿では,大規模なRGB-eventベースの人物ReIDデータセットであるEvReIDを紹介する。
データセットには118,988枚の画像ペアが含まれ、1200人の歩行者の身元をカバーし、複数の季節、シーン、照明条件のデータを収集している。
また、15の最先端のReIDアルゴリズムを評価し、データとベンチマークの両方の観点から将来の研究の基盤を構築します。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:46:39 GMT)
Overview of CHIP 2025 Shared Task 2: Discharge Medication Recommendation for Metabolic Diseases Based on Chinese Electronic Health Records [47.7] 退院薬の推奨は、治療継続性を確保し、寛容を予防し、長期管理を改善する上で重要な役割を担っている。
本報告では、適切な退院薬を自動的に推奨する最先端のアプローチを開発することを目的とした、CHIP 2025共有タスク2コンペティションの概要について述べる。
合計526チームが登録され、167チームと95チームがそれぞれフェーズAとフェーズBのリーダーボードに有効結果を提出した。
トップパフォーマンスチームは最終テストセットで最高成績を記録し、ジャカードスコアは0.5102、F1スコアは0.6267であった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:11:27 GMT)
Harnessing Textual Semantic Priors for Knowledge Transfer and Refinement in CLIP-Driven Continual Learning [47.6] 継続的な学習は、過去の知識を忘れずにタスクの流れから学習する能力をモデルに装備することを目的としている。
本稿では,テキスト先行のアンチフォッゲッティングと構造化の性質を利用した統合フレームワークを提案し,セマンティック・アウェア・ナレッジ・トランスファーを導く。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:20:39 GMT)
Towards Fine-Grained Code-Switch Speech Translation with Semantic Space Alignment [47.2] コードスイッチング(CS)音声翻訳は、セマンティックモデリングの複雑さとデータの不足により、大きな課題となる。
これまでの研究では、トレーニング中に意味モデリングを暗黙的に学ぶためにモデル自体に依存していた。
本研究では,各専門家が特定の言語の意味的部分空間を専門とするMixture of Experts音声プロジェクタを用いた大規模言語モデルの拡張を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:51:45 GMT)
DyKAF: Dynamical Kronecker Approximation of the Fisher Information Matrix for Gradient Preconditioning [47.2] DyKAF (Dynamic Kronalecker Approximation of the Fisher Matrix) を導入した。
実験の結果,DyKAFは様々な評価指標で既存の近似よりも優れていることがわかった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:48:26 GMT)
Effective Gaussian Management for High-fidelity Object Reconstruction [47.0] 本稿では、外観と幾何学の高忠実度シーン再構築のための効果的なガウス管理フレームワークを提案する。
提案手法は,最先端手法と比較して外観と幾何学の両方を再構築する上で,優れた性能を実現する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:44:05 GMT)
Gait Recognition via Collaborating Discriminative and Generative Diffusion Models [46.5] CoD$2$は、拡散モデルのデータ分散モデリング能力と識別モデルの意味表現学習強度を組み合わせた、新しいフレームワークである。
CoD$2$は最先端のパフォーマンスを実現し、既存の差別的手法とシームレスに統合できることを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 06:10:35 GMT)
White-Basilisk: A Hybrid Model for Code Vulnerability Detection [45.0] 我々は、優れた性能を示す脆弱性検出の新しいアプローチであるWhite-Basiliskを紹介する。
White-Basiliskは、パラメータ数2億の脆弱性検出タスクで結果を得る。
この研究は、コードセキュリティにおける新しいベンチマークを確立し、コンパクトで効率的に設計されたモデルが、特定のタスクにおいてより大きなベンチマークよりも優れているという実証的な証拠を提供する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:19:55 GMT)
HumaniBench: A Human-Centric Framework for Large Multimodal Models Evaluation [45.0] 大規模マルチモーダルモデル(LMM)は視覚的質問応答(VQA)、画像キャプション、視覚的接地といった視覚的タスクにおいて顕著な性能を達成している。
HumaniBenchは、32,000の現実世界の画像検索ペアと、それに伴う評価スイートで構成されるベンチマークである。
公平性、倫理性、共感性、傾倒性、推論性、堅牢性、多言語性という7つの主要なアライメント原理にまたがるLMMを評価する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 23:48:51 GMT)
MambaOVSR: Multiscale Fusion with Global Motion Modeling for Chinese Opera Video Super-Resolution [42.4] 時空Opera Super-Resolution(MambaOVSR)のためのMambaベースの核融合ネットワークを提案する。
MambaOVSRは、マルチスケールの交互走査機構によるモーションモデリングのためのGlobal Fusion Module (GFM) と、異なるシーケンスの長さでアライメントするためのMultiscale Synergistic Mamba Module (MSMM) の3つの新しいコンポーネントを含んでいる。
COVCデータセットによる実験結果から,MambaOVSR は PSNR で平均 1.86 dB で SOTA STVSR 法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 00:53:58 GMT)
Scene-Aware Urban Design: A Human-AI Recommendation Framework Using Co-Occurrence Embeddings and Vision-Language Models [42.0] 本稿では、生成AIを用いて公共空間におけるマイクロスケール設計介入を提案するヒューマン・イン・ザ・ループ・コンピュータ・ビジョン・フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 03:24:10 GMT)
VDNeRF: Vision-only Dynamic Neural Radiance Field for Urban Scenes [41.6] 視覚のみのダイナミックNeRF(VDRF)は、カメラの軌跡を復元し、動的都市景観の時間的表現を学習する手法である。
VDNeRFは、カメラポーズ推定とダイナミックノベルビュー合成の両方において、最先端のNeRFベースのポーズフリー手法を超越している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:45:08 GMT)
HaluMem: Evaluating Hallucinations in Memory Systems of Agents [41.3] 本稿では,メモリシステムに適した最初の操作レベルの幻覚評価ベンチマークであるHalucination in Memory Benchmark(HaluMem)を紹介する。
HaluMemは3つの評価タスク(メモリ抽出、メモリ更新、メモリ質問応答)を定義し、幻覚の振る舞いを包括的に明らかにする。
評価を支援するため,ユーザ中心のマルチターンヒューマンAIインタラクションデータセットを構築した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:39:33 GMT)
Unleashing Diffusion Transformers for Visual Correspondence by Modulating Massive Activations [41.3] 拡散変換器(DiTs)は、非常に少数の特徴活性化が他のものよりもはるかに大きな値を示す重要な現象を示す。
トレーニング不要なAdaLNベースのフレームワークである textbfDiffusion textbfTransformer textbfFeature (DiTF) を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 06:44:40 GMT)
Temporal-Guided Visual Foundation Models for Event-Based Vision [41.0] イベントカメラは、挑戦的な環境でのビジョンタスクにユニークなアドバンテージを提供する。
画像データに基づいて事前訓練されたモダンなVisual Foundation Modelを活用する可能性については、イベントベースのビジョンでは未検討のままである。
我々は、Visual Foundation Modelsと時間的コンテキスト融合を統合する新しいフレームワークであるTGVFM(TemporalGuided-FM)を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:45:25 GMT)
Ghost in the Transformer: Tracing LLM Lineage with SVD-Fingerprint [40.1] 大規模言語モデル(LLM)は急速に進歩し、様々な分野に広く採用されている。
多くの開発者は、既存のオープンソースモデルを微調整するか修正するかを選択する。
公的なモデルから明らかに派生したものの、オリジナルのトレーニングを誤って主張する者もいる。
これにより知的財産権保護への懸念が高まっている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:57:59 GMT)
Better Datasets Start From RefineLab: Automatic Optimization for High-Quality Dataset Refinement [39.1] RefineLabは、生のQA(QA)データを制御可能なトークン予算制約の下で高品質なデータセットに自動的に洗練するフレームワークである。
リソース制限を尊重しながらQAサンプルの品質を改善するという制約付き最適化問題に対処する。
実験によると、RefineLabは、カバレッジ、アライメントの難しさ、事実の忠実さ、イントラクタの品質など、専門家データセットからのばらつきを一貫して制限している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 20:32:35 GMT)
Rep2Text: Decoding Full Text from a Single LLM Token Representation [38.6] 本稿では,最後の記述から全文を復号化するための新しいフレームワークを提案する。
Rep2Textはトレーニング可能なアダプタを使用し、ターゲットモデルの内部表現をデコード言語モデルの埋め込み空間に投影する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 23:18:36 GMT)
CG-TTRL: Context-Guided Test-Time Reinforcement Learning for On-Device Large Language Models [37.1] TTRL(Test-time Reinforcement Learning)は、テスト時に複雑なタスクに基礎モデルを適用することを約束している。
本稿では,両方のサンプリングフェーズに動的にコンテキストを組み込んだコンテキスト誘導型TTRLを提案し,デバイス上での効率的なコンテキスト選択法を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:51:52 GMT)
MULTIBENCH++: A Unified and Comprehensive Multimodal Fusion Benchmarking Across Specialized Domains [35.5] 我々は,マルチモーダル評価のための大規模ドメイン適応型ベンチマークを開発した。
このベンチマークでは,15のモダリティと20の予測タスクを含む,30以上のデータセットを統合している。
また、オープンソース、統一、自動評価パイプラインも開発しました。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:37:09 GMT)
SPA: Achieving Consensus in LLM Alignment via Self-Priority Optimization [34.2] 自己修復、法的な、あるいは医療的なクエリのような高度なシナリオでは、LLMは信頼性と有用性の両方を必要とする。
我々は、厳格な「信頼に値する前処理」命令を強制する新しいアライメントパラダイムである優先順位アライメントを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:43:32 GMT)
Test-Time Adaptation of Vision-Language Models for Open-Vocabulary Semantic Segmentation [34.1] 本稿では,テスト期間中のセグメンテーションにVLMを適用した新しいTTA手法を提案する。
当社のアプローチは,任意のセグメンテーションネットワークのプラグアンドプレイとして使用することができ,追加のトレーニングデータやラベルは必要とせず,単一のテストサンプルでも有効である。
我々は、厳密な評価プロトコル、9つのセグメンテーションデータセット、15の一般的な合成汚職、および追加のリアルおよびレンダリングドメインシフトを統合した総合的なOVSS TTAベンチマークスイートを紹介する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 06:14:26 GMT)
Cross-Platform E-Commerce Product Categorization and Recategorization: A Multimodal Hierarchical Classification Approach [34.0] 電子商取引商品分類のためのマルチモーダル階層分類フレームワークを開発し,展開する。
階層型アーキテクチャにおける早期・後期・注目に基づく融合戦略について検討する。
結果として、CLIPの埋め込みは注意に基づく遅延融合戦略によって結合され、最も階層的なF1(98.59%)を達成し、単調なベースラインを上回る結果となった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:18:27 GMT)
Predicting Video Slot Attention Queries from Random Slot-Feature Pairs [33.6] 人間と同じようにオブジェクトレベルのシーン表現と動的モデリングを可能にするため、教師なしのビデオオブジェクト中心学習(OCL)は有望である。
スロットと機能の両方を組み込んだ新しいトランジタを提案し,クエリ予測のための情報を提供する。
シーン表現実験により,本手法が既存のOCL手法をはるかに上回っていることが示された。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:45:15 GMT)
Slot Attention with Re-Initialization and Self-Distillation [33.4] 本稿では、オブジェクトの発見と認識のための再初期化と自己蒸留(DIAS)によるスロット注意を提案する。
DIASはオブジェクトの発見や認識といったOCLタスクの最先端のタスクを実現し、高度な視覚的予測と推論を改善している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:40:46 GMT)
Mean-Variance Efficient Collaborative Filtering for Stock Recommendation [33.0] 従来の投資レコメンデーションは高リターン株や高度に多様化したポートフォリオに重点を置いており、しばしばユーザーの好みを無視している。
ポートフォリオ理論とユーザの好みを最適にブレンドする平均分散効率的な協調フィルタリング(MVECF)を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:15:15 GMT)
LLaDA-Rec: Discrete Diffusion for Parallel Semantic ID Generation in Generative Recommendation [32.3] 並列なセマンティックID生成としてレコメンデーションを再構成する離散拡散フレームワークであるLLaDA-Recを提案する。
3つの実世界のデータセットの実験では、LLaDA-RecはIDベースと最先端のジェネレーティブレコメンデータの両方を一貫して上回っている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 07:12:15 GMT)
Return Prediction for Mean-Variance Portfolio Selection: How Decision-Focused Learning Shapes Forecasting Models [32.1] 意思決定学習は、予測と最適化を統合して意思決定結果を改善する。
本研究では、DFLが平均分散最適化(MVO)における決定を最適化するために、ストックリターン予測モデルをどのように調整するかを検討する。
その結果,予測誤差が高いにもかかわらず,DFLが優れたポートフォリオ性能を実現する理由が明らかになった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:34:25 GMT)
On the Convergence of Muon and Beyond [31.9] 分散の低減により、Muon-MVR2 が最適な複雑性を達成できるという最初の証明を提供する。
全体として、この研究はムオン形式の最適性の最初の証明を提供する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:11:57 GMT)
What Makes Reasoning Invalid: Echo Reflection Mitigation for Large Language Models [31.6] 大規模言語モデル(LLM)は、幅広い推論タスクで顕著なパフォーマンスを示している。
適応エントロピーポリシー最適化(AEPO)と呼ばれる新しい強化学習手法を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:33:46 GMT)
CoFineLLM: Conformal Finetuning of LLMs for Language-Instructed Robot Planning [31.4] 言語モデル(LLM)は、言語に指示されたエージェントのプランナーとして登場した。
しばしば、過度に信頼され、間違ったアウトプットを生み出す。
我々は,LCMベースのプランナのためのCP対応ファインタニングフレームワークであるCoFineLLMを紹介する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 23:38:25 GMT)
Physics-Informed Deformable Gaussian Splatting: Towards Unified Constitutive Laws for Time-Evolving Material Field [31.3] 本研究では物理インフォームド・デフォルマブル・ガウス・スティング(PIDG)を提案する。
具体的には,静的非結合な4Dハッシュ符号化を用いて,形状と動きを効率的に再構成する。
さらに、ラグランジアン粒子流とカメラ補償光流とを合わせることでデータの適合を監督し、収束を加速し、一般化を改善する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:35:03 GMT)
Affordance-Guided Coarse-to-Fine Exploration for Base Placement in Open-Vocabulary Mobile Manipulation [30.9] Affordance-Guided Coarse-to-Fine Explorationは、幾何学的実現性を備えた視覚言語モデルからの意味的理解を統合する。
我々のシステムは85%の成功率を実現し、古典的幾何学的プランナーやVLMに基づく手法を著しく上回っている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:52:22 GMT)
WebVIA: A Web-based Vision-Language Agentic Framework for Interactive and Verifiable UI-to-Code Generation [30.2] インタラクティブなUI-to-Code生成とバリデーションのための最初のエージェントフレームワークであるWebVIAを提案する。
フレームワークには,1)マルチステートUIスクリーンショットをキャプチャする探索エージェント,2)実行可能なインタラクティブコードを生成するUI2Codeモデル,3)対話性を検証する検証モジュールの3つのコンポーネントが含まれている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 06:58:52 GMT)
Parameter-Free Fine-tuning via Redundancy Elimination for Vision Foundation Models [30.0] 本稿では,SAMモデルの冗長性を考察し,新しいパラメータフリー微調整法を提案する。
パラメータを調整する従来の微調整手法とは異なり、本手法は事前訓練された特徴の選択、再利用、強化を強調する。
ドメイン外のデータセットとドメイン内データセットの両方で実験を行い、本手法の有効性と有効性を示した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 01:32:03 GMT)
DevFD: Developmental Face Forgery Detection by Learning Shared and Orthogonal LoRA Subspaces [29.5] デジタル・フェイス・ジェネレーションと操作は大きな社会的リスクをもたらす。
進化を続ける新しい種類の偽造に対して防御するためには、モデルが新しいドメインに迅速に適応できるようにする必要があります。
フェースフォージェリ検出は継続学習問題であり,新たなフォージェリタイプが出現するにつれて,モデルの開発を可能にする。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 19:01:08 GMT)
Vector-Quantized Vision Foundation Models for Object-Centric Learning [29.4] オブジェクト中心学習(OCL)のための統一アーキテクチャ、ベクトル量子化VFMを提案する。
我々の統一の鍵は、OCL集約と復号におけるVFM表現の量子化である。
私たちのVVOは、オブジェクトの発見と認識のベースラインと、下流の視覚的予測と推論を一貫して上回ります。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:38:43 GMT)
Multi-Scale Fusion for Object Representation [29.4] 画像をピクセルレベルの特徴マップではなく、オブジェクトレベルの特徴ベクトルとして表現することは、高度な視覚的タスクを促進する。
既存のVAEガイダンスは、オブジェクトがピクセルサイズで変更可能であることを明示的に言及していない。
対象中心学習訓練のためのVAEガイダンスを強化するために,textitMulti-Scale Fusion (MSF)を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:37:11 GMT)
Grouped Discrete Representation for Object-Centric Learning [29.4] オブジェクト指向学習のためのGDR(Grouped Discrete Representation)を提案する。
GDRは、主要なOCLメソッドと最先端のOCLメソッドの両方を、さまざまなデータセットで一貫して改善する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:35:44 GMT)
Adaptive Multi-view Graph Contrastive Learning via Fractional-order Neural Diffusion Networks [28.8] グラフコントラスト学習(GCL)は、同じグラフの複数のビューを対比することにより、ノードとグラフ表現を学習する。
本稿では,分数次連続力学に基づく拡張自由多視点GCLフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:01:46 GMT)
TOOL4POI: A Tool-Augmented LLM Framework for Next POI Recommendation [27.3] Next Point-of-Interest (POI)レコメンデーションは、位置情報ベースのサービスにおける基本的なタスクである。
これらの課題に対処するため、新しいツール拡張フレームワークであるTool4POIを提案する。
Tool4POIは、選好抽出モジュール、マルチターン候補検索モジュール、再ランクモジュールの3つの主要なモジュールで構成されている。
既存の方法とは異なり、Tool4POIはタスク固有の微調整を必要とせず、プラグ・アンド・プレイ方式で既製のLCMと互換性がある。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:37:11 GMT)
Secret-Key Generation from Private Identifiers under Channel Uncertainty [26.7] 本研究では,物理識別子を用いたデバイス認証のための秘密鍵生成について検討する。
システムは2つの正統な端末(エンコーダとデコーダ)と盗聴器(イーブ)を含む。
当社のコントリビューションには、シークレットキー、ストレージ、および一般的な個別ソースのプライバシ推論レート間の最適なトレードオフに関する内部および外部境界の導出が含まれています。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:06:29 GMT)
TimeSense:Making Large Language Models Proficient in Time-Series Analysis [26.4] 時系列領域では、テキストと時間データを組み合わせて大規模な言語モデルの推論能力を活用する作業が増えている。
テキスト推論と時間的感覚のバランスをとることで,LLMを時系列解析に熟練させるフレームワークであるTimeSenseを提案する。
TimeSenseは複数のタスクにまたがる最先端のパフォーマンスを実現し、特に複雑な多次元時系列推論タスクにおいて既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:00:18 GMT)
CINEMAE: Leveraging Frozen Masked Autoencoders for Cross-Generator AI Image Detection [25.8] CINEMAEはテキスト検出法の中核となる原則を視覚領域に適用する。
我々は、安定拡散v1.4のみをトレーニングし、GenImageベンチマークの8つの未知のジェネレータに対して95%以上の精度を達成した。
このことは、文脈条件の再構成の不確実性が、AIGC検出のための堅牢で転送可能な信号を提供することを示している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:05:45 GMT)
LPFQA: A Long-Tail Professional Forum-based Benchmark for LLM Evaluation [25.7] 大規模言語モデル(LLM)は、推論、質問応答、プロフェッショナルアプリケーションにおいて急速に進歩している。
現在のデータセットは、しばしば単純化されたタスクや人工シナリオに焦点を合わせ、長い専門知識や現実世界のアプリケーションの複雑さを見下ろしている。
本研究では,学術・産業分野20分野の専門的なフォーラムから派生した,ロングテールな知識ベースベンチマークであるLPFQAを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:02:19 GMT)
TinyChemVL: Advancing Chemical Vision-Language Models via Efficient Visual Token Reduction and Complex Reaction Tasks [25.1] この研究は、モデルアーキテクチャとタスク複雑性を共同設計することで、化学ドメインのための効率的かつ強力なビジョン言語モデル(VLM)を構築する。
4Bパラメータしか持たないTinyChemVLは、既存のモデルよりも高速な推論とトレーニング速度を示しながら、分子および反応タスクの両方で優れた性能を達成する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:37:18 GMT)
MACS: Multi-source Audio-to-image Generation with Contextual Significance and Semantic Alignment [25.1] マルチソース音声画像生成のためのMACS法を提案する。
私たちの知る限り、これは画像生成の前にリッチオーディオコンポーネントをキャプチャするために、マルチソースオーディオを明示的に分離する最初の作品です。
実験は、マルチソース、ミックスソース、シングルソースオーディオ・ツー・イメージ生成タスクで実施される。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:21:16 GMT)
MrCoM: A Meta-Regularized World-Model Generalizing Across Multi-Scenarios [25.1] 私たちはMrCoM(Meta-Regularized Contextual World-Model)という,さまざまなシナリオにまたがる一般化が可能な統一世界モデルを構築します。
アルゴリズムの一般化能力は様々なシナリオで評価し,従来の最先端手法よりもはるかに優れた性能を示した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 07:01:18 GMT)
FedCoT: Federated Chain-of-Thought Distillation for Large Language Models [24.6] 大規模言語モデル (LLMs) は、人工知能においてトランスフォーメーション・フォースとして登場し、様々なタスクにまたがる卓越した習熟を実証している。
小型言語モデル(SLM)は計算効率を提供するが、しばしば性能が低下する。
我々は,LLMからSLMへの知識の蒸留を目的としたフレームワークであるFedCoTを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 03:13:03 GMT)
Policy Learning with Abstention [24.3] 我々は、政策学習を棄権で研究し、政策が安全なデフォルトまたは専門家に延期される可能性がある。
ポリシーが停止すると、ランダムな推測の値の上に小さな付加的な報酬が与えられる。
政策学習における他の中核的問題への直接的応用において,禁忌は汎用的なツールであることを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:02:00 GMT)
Zooming into Comics: Region-Aware RL Improves Fine-Grained Comic Understanding in Vision-Language Models [24.0] 漫画のような複雑な視覚的物語は視覚言語モデル(VLM)に重大な課題をもたらす
本稿では,VLMによる漫画理解のためのAI4VA-FGについて紹介する。
また,GPT-4oやGemini-2.5,Qwen2.5-VLなどのオープンソースモデルなど,最先端のプロプライエタリモデルも評価した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:27:45 GMT)
Inpaint360GS: Efficient Object-Aware 3D Inpainting via Gaussian Splatting for 360° Scenes [23.9] Inpaint360GSは3DGSをベースとした柔軟な360度編集フレームワークである。
マルチオブジェクトの除去と3D空間での高忠実な塗装をサポートする。
360degインペイントに適した新しいデータセットを導入し,オブジェクトフリーシーンの真実の欠如に対処する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:47:30 GMT)
GC4NC: A Benchmark Framework for Graph Condensation on Node Classification with New Insights [23.7] グラフ凝縮(GC)は、元のグラフの本質的な情報を保持する、はるかに小さなグラフを学習するために設計された新興技術である。
ノード分類における多様なGC手法を評価するための包括的フレームワークである textbfGC4NC を紹介する。
私たちの体系的な評価は、凝縮グラフがどのように振る舞うか、そしてその成功を導く重要な設計選択について、新しい洞察を与えます。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 19:28:31 GMT)
Addressing divergent representations from causal interventions on neural networks [23.7] 因果介入手法は、しばしば対象モデルの自然な分布から内部表現を逸脱させる。
悪質な事件を緩和するために、グラント(2025年)からの対人的遅延損失を修正し、介入を規則化し、自然分布に近づき続ける。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 20:35:15 GMT)
Distributional Surgery for Language Model Activations [23.7] 本稿では、アクティベーションの修正により、望ましくないコンテンツの世代を検出・緩和する新しい2段階のアプローチを提案する。
本研究は,注目ヘッドを変換する階層的分散ステアリングポリシーを提案する。
複数の言語モデルやデータセットにまたがる経験的評価は,提案手法が望ましくない出力の発生を減らす上で,ベースラインよりも優れていることを示している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:38:07 GMT)
Enhancing Multimodal Misinformation Detection by Replaying the Whole Story from Image Modality Perspective [23.5] MMD(Multimodal Misinformation Detection)は、誤情報を含むソーシャルメディアの投稿を検知するタスクである。
本稿では,RETSIMDという新しいMDD手法を提案する。具体的には,各テキストを複数のセグメントに分割し,各テキストセグメントが画像で表現できる部分シーンを記述する。
さらに、テキスト画像と画像ラベルの相互情報に関する2つの補助的目的を取り入れ、補助的なテキスト画像生成ベンチマークデータセット上でジェネレータを訓練する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:37:46 GMT)
NURBGen: High-Fidelity Text-to-CAD Generation through LLM-Driven NURBS Modeling [23.0] 非統一論理的B-スプライン(NURBS)を用いてテキストから直接高忠実度3DCADモデルを生成する最初のフレームワークであるNURBGenを提案する。
これを実現するために、大言語モデル(LLM)を微調整し、自由形式のテキストをNURBS曲面パラメータを含むキュレートされた表現に変換する。
また,非トリミングなNURBSと解析的プリミティブを組み合わせたハイブリッド表現を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:45:12 GMT)
Dataforge: A Data Agent Platform for Autonomous Data Engineering [22.7] Data Agentは、表データに特化した完全に自律的なシステムである。
データクリーニング、階層的ルーティング、デュアルフィードバックループによる機能レベルの最適化を自動的に実行する。
自動、安全、非専門家フレンドリーという3つの基本原則を具現化し、人間の監督なしにエンドツーエンドの信頼性を保証する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 01:58:13 GMT)
MoRA: Missing Modality Low-Rank Adaptation for Visual Recognition [22.4] MoRAはパラメータ効率のよい微調整法であり、クロスモーダル相互作用を明示的にモデル化する。
MoRAは、欠落したモダリティシナリオにおける平均的なパフォーマンス改善を5.24%向上させる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:52:42 GMT)
Functional Adjoint Sampler: Scalable Sampling on Infinite Dimensional Spaces [22.4] 無限次元関数空間に対する最適制御ベース拡散サンプリング器を提案する。
合成電位および実分子系における遷移経路サンプリング性能に優れることを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:51:03 GMT)
Reconstruction and Secrecy under Approximate Distance Queries [22.2] 近い距離の問合せを用いて未知の目標点を探索する作業について検討する。
この問題は、GPSやセンサーネットワークのローカライゼーションからプライバシーに配慮したデータアクセスに至るまで、さまざまな状況で自然に発生する。
我々は,この再構成ゲームについて,学習理論レンズを用いて研究し,最良な再構成誤差の発生率と限界に着目した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:05:01 GMT)
UNO: Unifying One-stage Video Scene Graph Generation via Object-Centric Visual Representation Learning [22.2] ビデオシーングラフ生成(VidSGG)は、オブジェクトを検出して時間的相互作用を構造化グラフとしてモデル化することにより、動的視覚コンテンツを表現することを目的としている。
UNO(Unified Object-centric VidSGG)は、エンド・ツー・エンドアーキテクチャ内の両方のタスクに共同で対処する単一のステージ統合フレームワークである。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:05:22 GMT)
PPC-GPT: Federated Task-Specific Compression of Large Language Models via Pruning and Chain-of-Thought Distillation [22.0] PPC-GPTは、フェデレートされた設定におけるプライバシ保護とモデル圧縮の両方に対処する、新しい統合フレームワークである。
私たちのフレームワークの重要なイノベーションは、プライバシ保護機構、合成データ生成、タスク固有の圧縮テクニックの総合的な統合にあります。
テキスト生成タスクの多種多様な実験により,PPC-GPTが2つの目的を達成できることが実証された。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 03:26:55 GMT)
Synthetic Data-Driven Prompt Tuning for Financial QA over Tables and Documents [21.7] データ拡張最適化によって駆動される自己改善プロンプトフレームワークを導入する。
我々は、合成財務表と文書の抜粋を生成し、それらの正確性と堅牢性を検証し、結果に基づいてプロンプトを更新する。
我々は通常のプロンプト法よりも精度と堅牢性の両方で高い性能を達成する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:07:31 GMT)
InfoAffect: A Dataset for Affective Analysis of Infographics [21.6] テキストコンテンツと実世界のインフォグラフィックを組み合わせた3.5kサンプル対応InfoAffectデータセットを提案する。
5つの最先端マルチモーダル大言語モデル (MLLM) は両方のモダリティを解析し、その出力をReciprocal Rank Fusion (RRF) アルゴリズムで融合させ、ロバストな影響と信頼を得る。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:35:59 GMT)
SportR: A Benchmark for Multimodal Large Language Model Reasoning in Sports [21.4] SportRは、スポーツインテリジェンスに必要な基本的な理由に基づいてMLLMを訓練し、評価するために設計された最初のマルチスポーツ大規模ベンチマークである。
私たちのベンチマークでは,5,017枚の画像と2,101本のビデオのデータセットが提供されている。
罰則の決定や戦術の説明など,多段階の推論を必要とする最も先進的なタスクに対して,我々は7,118の高品質な人間による思考の連鎖(Chain of Thought)アノテーションを提供する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:55:20 GMT)
On Modality Incomplete Infrared-Visible Object Detection: An Architecture Compatibility Perspective [21.1] 現在のIVODモデルは、不完全なモダリティデータに直面すると顕著な性能低下を示す。
本稿では,DTR変種に対するプラグアンドプレイ型Scarf Neckモジュールを提案する。
提案したScarf-DETRは、欠落したモダリティシナリオにおいて優れた性能を発揮するだけでなく、標準のIVODモダリティ完全ベンチマークでも優れた性能を発揮する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:38:32 GMT)
SkinCaRe: A Multimodal Dermatology Dataset Annotated with Medical Caption and Chain-of-Thought Reasoning [20.9] textbfSkinCaReは、包括的な自然言語記述を備えた包括的なデータセットである。
textbfSkinCAPは、Fitzpatrick 17k皮膚疾患データセットとDiverse Dermatology Imagesデータセットからソースされた4,000のイメージで構成されている。
textbfSkinCoTは、3,041の皮膚科画像と臨床者が検証し、階層的な診断の連鎖を組み合わせた、キュレートされたデータセットである。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 07:10:53 GMT)
Constraint-Informed Active Learning for End-to-End ACOPF Optimization Proxies [20.8] 本稿では,AC Optimal Power Flow (ACOPF)問題に対する最適解を効率的に予測するための最適化プロキシ,機械学習(ML)モデルについて検討する。
ACOPF最適化プロキシのための新しいアクティブサンプリングフレームワークを導入し、現実的で多様なトレーニングデータを生成するように設計されている。
計算結果から,既存のサンプリング法よりも同等のトレーニング予算で優れた一般化が得られた。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 06:18:38 GMT)
A Graph-Theoretical Perspective on Law Design for Multiagent Systems [20.7] 我々は,最小限の制約を課すことで,所望の結果を得る法則を見つけることの問題点を考察する。
いずれの法則においても、ワンショット同時処理の単純な場合であっても、最小化問題はNPハードであることを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:46:29 GMT)
X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real [20.6] X-Simは、ロボットのポリシーを学ぶための、密集した伝達可能な信号としてオブジェクトの動きを利用する、リアルからシミュレート・トゥ・リアルなフレームワークである。
X-Simは、RGBDの人間のビデオからシミュレーションを再構築し、オブジェクト中心の報酬を定義するためにオブジェクトの軌跡を追跡することから始まる。
学習方針は、様々な視点と照明でレンダリングされた合成ロールアウトを用いて、画像調和拡散政策に蒸留される。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 01:00:32 GMT)
Confidence-Guided Stepwise Model Routing for Cost-Efficient Reasoning [20.4] コスト効率の良い推論のための信頼誘導ステップワイドモデルルーティングを提案する。
STEERはドメインに依存しないフレームワークで、小さくて大きな言語モデル間のきめ細かいステップレベルのルーティングを実行する。
その結果,モデルルーティングのための堅牢でドメインに依存しない信号として,モデル内部信頼が確立された。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:33:08 GMT)
Sparse Linear Regression is Easy on Random Supports [20.1] 我々は mathbbRN times d$ で設計行列 $X を入力し、 mathbbRN times d$ で測定やラベル $y を入力します。
w*$がランダムに選択されると、およそ$N = O(klog d/epsilon)$サンプルで予測エラー$epsilon$が得られる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 03:48:21 GMT)
Multi-turn Evaluation of Anthropomorphic Behaviours in Large Language Models [20.1] ユーザーが大きな言語モデル(LLM)を人為的に形作る傾向は、AI開発者、研究者、政策立案者への関心が高まっている。
本稿では,現実的かつ多様な環境下での人為的 LLM の挙動を実証的に評価する手法を提案する。
まず,14の人為的行動のマルチターン評価を開発する。
次に,ユーザインタラクションのシミュレーションを用いて,スケーラブルで自動化されたアプローチを提案する。
第3に,対話型大規模人体調査(N=1101)を実施し,実際のユーザの人文的知覚を予測するモデル行動を検証する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:58:17 GMT)
Evaluating Reasoning Faithfulness in Medical Vision-Language Models using Multimodal Perturbations [19.5] 視覚言語モデル(VLM)は、しばしばチェーン・オブ・シント(CoT)の説明を生み出す。
胸部X線視覚質問応答(VQA)の臨床的基盤として,制御されたテキストと画像修正を用いてCoT忠実度を探索するフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:56:57 GMT)
A Low-Rank Method for Vision Language Model Hallucination Mitigation in Autonomous Driving [18.9] 視覚言語モデル(VLM)は、交通状況を理解するために、自律運転にますます使われている。
VLMは幻覚を発生させるが、これは視覚入力に基づかない偽の細部である。
本稿では,幻覚レベルに基づいて複数の候補キャプションを自動的にランク付けする,自己完結型低ランク手法を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:50:30 GMT)
Walking the Tightrope of LLMs for Software Development: A Practitioners' Perspective [18.5] 我々は,大規模言語モデルがソフトウェア開発に与える影響と,開発者の視点からその影響を管理する方法について検討した。
データ収集と分析の3ラウンドで,ソフトウェア実践者と22回のインタビューを行った。
私たちは、LCMを使うことの利点(ソフトウェア開発フローの維持、開発者のメンタルモデルの改善、起業家精神の育成など)とデメリット(開発者の個性と開発者の評判への悪影響)を特定しました。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:49:55 GMT)
ROAR: Robust Accident Recognition and Anticipation for Autonomous Driving [17.9] 既存の手法では、センサーの故障、環境障害、データ不完全性といった課題を克服し、理想的な条件を想定することが多い。
本研究は,事故検出と予測のための新しいアプローチであるROARを紹介する。
ROARは、自己適応型オブジェクト認識モジュールである離散ウェーブレット変換(DWT)と、これらの課題に取り組むための動的焦点損失を組み合わせたものである。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:55:37 GMT)
LinearRAG: Linear Graph Retrieval Augmented Generation on Large-scale Corpora [17.9] Retrieval-Augmented Generation (RAG) は大規模言語モデル(LLM)の幻覚を軽減するために広く用いられている。
既存のグラフベースのRAG法は、グラフ構築のための不安定でコストのかかる関係抽出に依存している。
信頼性の高いグラフ構築と正確な経路抽出を可能にする効率的なフレームワークであるLinearRAGを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:23:09 GMT)
DiffusionUavLoc: Visually Prompted Diffusion for Cross-View UAV Localization [17.9] DiffusionUavLocは画像プロンプト、テキストフリー、拡散中心のクロスビューローカライゼーションフレームワークで、統一表現にVAEを使用している。
まず,UAV画像から擬似サテライト画像を構造的プロンプトとして合成する。
推論時に、ディスクリプタは固定時間ステップtで計算され、コサイン類似度を用いて比較される。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:27:17 GMT)
Learning Time-Varying Graph Signals via Koopman [17.4] 時間変動グラフデータを扱うために,Koopman Autoencoder (KAE) に基づくフレームワークを提案する。
進化するグラフ構造をキャプチャするために、グラフデータをまずグラフ埋め込みを通じてベクトル時系列に変換する。
この潜在空間において、KAEはグラフ特徴の時間的進化を規定する基礎となる非線形力学を学ぶために適用される。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:33:39 GMT)
BuildingWorld: A Structured 3D Building Dataset for Urban Foundation Models [17.3] BuildingWorldは、都市規模のファンデーションモデリングと分析のためのグローバルな代表的データセットである。
様々なソースから収集された約500万のLOD2ビルディングモデルに、実物と模擬のLiDAR点雲が伴っている。
Cyber Cityは、カスタマイズされた、構造的に多様なポイントクラウドディストリビューションで無制限のトレーニングデータを生成する仮想都市モデルである。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:40:34 GMT)
Transolver is a Linear Transformer: Revisiting Physics-Attention through the Lens of Linear Attention [17.1] そこで本研究では,物理注意を正準線形の注意に再設計するための2段階の変換を提案する。
提案手法は,6つの標準PDEベンチマーク上での最先端性能を実現する。
パラメータの数を平均40.0%削減し、計算コストを36.2%削減する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:12:50 GMT)
Video Dataset for Surgical Phase, Keypoint, and Instrument Recognition in Laparoscopic Surgery (PhaKIR) [17.1] 本稿では,PhaKIRデータセット,Keypoint,Instrument Recognitionについて述べる。
PhaKIRは、フェーズラベル、楽器ポーズ情報、ピクセル精度の計測機器セグメンテーションを共同で提供する最初のマルチ機関データセットである。
データセットはZenodoプラットフォーム経由で,要求に応じて公開されている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 21:29:33 GMT)
SONIQ: System-Optimized Noise-Injected Ultra-Low-Precision Quantization with Full-Precision Parity [16.8] SONIQは、推論で使用されるのと同じ規則の下でトレーニング中に、ウェイトとアクティベーションの両方のチャネル毎の混合精度を学習する。
SONIQは、デプロイ時に使われる個別の算術に対して、起動時なしでモデルを操縦する。
CNNとTransformers全体では、SONIQは最大16倍と7倍の圧縮を達成し、完全精度のマッチングや超精度の向上を実現している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 03:32:49 GMT)
Optimal Inference Schedules for Masked Diffusion Models [16.8] マスク付き拡散モデル(MDM)は、順番に多くのトークンを同時に同時にサンプリングすることができる。
分布の事前知識が強くなければ、一般にそれと競合することは不可能であることを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:30:18 GMT)
How Wide and How Deep? Mitigating Over-Squashing of GNNs via Channel Capacity Constrained Estimation [16.5] 既存のグラフニューラルネットワークは、隠れた次元と伝播深さの選択に依存しており、オーバーカッシングとして知られる伝播中に深刻な情報損失を引き起こすことが多い。
本稿では,情報理論に基づく非線形プログラミング問題として,隠れ次元と深さの選択を定式化する新しいフレームワークであるChannel Capacity Constrained Estimation (C3E)を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:25:37 GMT)
SR-KI: Scalable and Real-Time Knowledge Integration into LLMs via Supervised Attention [16.4] SR-KIは、リアルタイムおよび大規模構造化知識ベース(KB)を大規模言語モデル(LLM)に統合するための新しいアプローチである。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:27:55 GMT)
Achieving Fairness Without Harm via Selective Demographic Experts [16.2] バイアス緩和技術は、公平性と正確性の間にトレードオフを課すことが多い。
臨床診断のような高い領域では、そのようなトレードオフは倫理的にも現実的にも受け入れられない。
我々は、異なる人口集団の異なる表現を学習し、公平で無害なアプローチを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:11:02 GMT)
Language Model Distillation: A Temporal Difference Imitation Learning Perspective [16.1] 蒸留は、大きな言語モデルをより小さく、より効率的なものに圧縮する一般的な慣習となっている。
本稿では,教師モデルの分布空間を利用して,時間差に基づく蒸留のための一般的な枠組みを提案する。
本研究は, 時間差学習フレームワークを設計し, 動作空間を縮小する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:18:08 GMT)
Meronymic Ontology Extraction via Large Language Models [16.1] オンロジは、膨大な量の非構造化テキストを整理する手段として、今日のデジタル時代に欠かせないものとなっている。
本稿では,テキストからメロニメを抽出する完全自動手法を開発する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 22:44:44 GMT)
EchoMark: Perceptual Acoustic Environment Transfer with Watermark-Embedded Room Impulse Response [16.1] 組込み透かしを用いた知覚的に類似したRIRを生成するフレームワークであるEchoMarkを提案する。
RIR再構成の知覚的損失と透かし検出の損失を併用してモデルを最適化することにより、EchoMarkは高品質な環境転送と信頼性のある透かし回復を両立させる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:53:32 GMT)
GPU Cluster Scheduling for Network-Sensitive Deep Learning [15.9] 本稿では分散DL(DDL)ワークロードのための新しいGPUクラスタスケジューラを提案する。
我々のスケジューラは、(i)ジョブ配置と統合を容易にする古典的な遅延スケジューリングアルゴリズム、(ii)ネットワークに敏感なジョブプリエンプション戦略、(iii)遅延タイマーを効果的に遅延スケジューリングするために最適化する「自動チューニング」メカニズムの3つの主要コンポーネントから構成される。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:45:26 GMT)
LUT-LLM: Efficient Large Language Model Inference with Memory-based Computations on FPGAs [14.7] 本稿では,ベクトル量子化メモリ演算による1B+LLM推論を実現するFPGAアクセラレータLUT-LLMを提案する。
LUT-LLMはAMD MI210より1.66倍、NVIDIA A100より1.72倍のエネルギー効率を実現し、A100より2.16倍の効率で32Bモデルにスケールする。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 01:17:08 GMT)
The Station: An Open-World Environment for AI-Driven Discovery [14.6] ミニチュア科学エコシステムをモデル化するオープンワールドマルチエージェント環境STATIONを紹介する。
ステーションのエージェントは、同僚から論文を読み、仮説を定式化し、コードを提出し、分析を行い、結果を公表するなど、長い科学的な旅をすることができる。
実験によると、ステーションのAIエージェントは、数学から計算生物学、機械学習まで、幅広いベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:13:00 GMT)
LGM-Pose: A Lightweight Global Modeling Network for Real-time Human Pose Estimation [14.2] これらの課題に対処するために,シングルブランチ軽量グローバルモデリングネットワーク (LGM-Pose) が提案されている。
このネットワークでは、軽量なMobileViMブロックが、LARM(Lightweight Attentional Representation Module)として提案されている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:01:01 GMT)
X2Edit: Revisiting Arbitrary-Instruction Image Editing through Self-Constructed Data and Task-Aware Representation Learning [14.0] X2Editデータセットは、14の多様な編集タスクをカバーする包括的なデータセットである。
バランスの取れたカテゴリで370万の高品質なデータを構築します。
実験により、多くの優れたモデルの間で、モデルの編集性能が競争力があることが示されている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 01:42:53 GMT)
ECom-Bench: Can LLM Agent Resolve Real-World E-commerce Customer Support Issues? [13.8] ECom-Benchは、eコマース顧客サポートドメインにおいて、マルチモーダル機能を持つLLMエージェントを評価するための最初のベンチマークフレームワークである。
ECom-Benchは、実際のeコマース顧客インタラクションから収集されたペルソナ情報と、真正なeコマース対話から派生した現実的なタスクデータセットに基づく動的ユーザシミュレーションを特徴とする。
GPT-4oのような先進的なモデルでさえ、ベンチマークで10-20%のパス3メトリックしか達成していません。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 07:32:15 GMT)
LWGANet: Addressing Spatial and Channel Redundancy in Remote Sensing Visual Tasks with Light-Weight Grouped Attention [13.8] リモートセンシング(RS)視覚分析のための軽量ニューラルネットワークは、2つの固有の冗長性を克服しなければならない。
既存のモデルは、しばしば自然画像用に設計されているが、RSシナリオにおけるこの2つの課題に対処することができない。
RS固有の特性のために設計された軽量バックボーンであるLWGANetを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:44:23 GMT)
PSEO: Optimizing Post-hoc Stacking Ensemble Through Hyperparameter Tuning [13.4] 本稿では,ポスト・ホック・スタックング・アンサンブル最適化のためのフレームワークであるPSEOを提案する。
sysは、最近のAutoMLシステムにおけるポストホックな設計を含む16の手法の中で、最も平均的なテストランク(2.96)を達成している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:39:28 GMT)
Exploiting Inter-Session Information with Frequency-enhanced Dual-Path Networks for Sequential Recommendation [13.3] 本稿では、シーケンシャルレコメンデーションのための周波数拡張デュアルパスネットワークであるFreqRecを提案する。
FreqRecは、学習可能な周波数ドメイン多層パーセプトロンを介して、セッション間およびセッション内動作をキャプチャする。
クロスエントロピーと周波数領域の整合性損失を組み合わせた合成目的の下で最適化されている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:39:26 GMT)
Chasing Consistency: Quantifying and Optimizing Human-Model Alignment in Chain-of-Thought Reasoning [13.3] 本稿では,Large Language Models(LLMs)における推論整合性の評価と最適化のためのフレームワークを提案する。
アライメントスコア(Alignment Score)は、モデル生成推論チェーンと人間記述参照チェーンとのセマンティックアライメントを、Chain-of-Thought (CoT)推論で定量化する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 00:27:38 GMT)
A Visual Perception-Based Tunable Framework and Evaluation Benchmark for H.265/HEVC ROI Encryption [13.2] 本稿では,H.265/HEVC ROI 暗号化のための視覚認識に基づくチューニング可能なフレームワークと評価ベンチマークを提案する。
セキュリティとリアルタイムパフォーマンスのバランスを保ちながら、3レベルチューニング可能な暗号化戦略が実装されている。
既存のROI暗号化アルゴリズムと比較して,提案手法は複数の性能指標において優れた性能を示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:05:21 GMT)
Label-Efficient 3D Forest Mapping: Self-Supervised and Transfer Learning for Individual, Structural, and Species Analysis [13.2] 空中および地上からのレーザー走査による点雲は、そのような情報を大規模に迅速に導き出すのに最も適したデータ源である。
ディープラーニングモデルは一般的に、さらなる改善を制限する大量の注釈付きトレーニングデータを必要とする。
このオープンソースコントリビューションは、森林、生物多様性、炭素マッピングをサポートするために、レーザー走査点雲から個々のツリー情報の操作的抽出を促進することを目的としている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:16:20 GMT)
Uncertainty Quantification with the Empirical Neural Tangent Kernel [13.1] トレーニング終了時のオーバーパラメータ化ネットワークに対するポストホックサンプリングに基づくUQ手法を提案する。
提案手法は,(確率的な)勾配-発散サンプリング法を用いて,効率的かつ有意義な深層アンサンブルを構築する。
提案手法は,複数の要因によるコスト削減の計算効率において,競合するアプローチよりも優れるだけでなく,回帰処理と分類処理の両方において,様々なUQ指標の最先端性能を維持できることを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 23:04:35 GMT)
Countering Multi-modal Representation Collapse through Rank-targeted Fusion [13.1] 多モード融合法は、しばしば2種類の表現崩壊(特徴崩壊とモダリティ崩壊)に悩まされる。
本稿では,あるモダリティと他のモダリティの相補的特徴とを選択的にブレンドする,理論的に基礎付けられた融合フレームワークを提案する。
我々の手法は、最先端の手法を最大3.74%上回っている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:34:19 GMT)
Private Online Learning against an Adaptive Adversary: Realizable and Agnostic Settings [13.1] 我々は、学習者がT$のデータポイントのシーケンスを受け取り、仮説の段階ごとに応答しなければならない、プライベートオンライン学習の問題を再考する。
出力仮説全体のストリームは、差分プライバシーを満たすべきである。
一般的なLittlestoneクラスに対して$tildeO_d(sqrtT)$のサブ線形後悔を実現するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 06:41:21 GMT)
Real-time Multi-view Omnidirectional Depth Estimation for Real Scenarios based on Teacher-Student Learning with Unlabeled Data [13.1] 本稿では,Rt-OmniMVS というエッジコンピューティングプラットフォームを対象とした全方向のリアルタイム深度推定手法を提案する。
実環境における高精度,堅牢性,一般化を実現するため,教師の学習戦略を導入する。
また,多視点魚眼カメラとエッジデバイスを用いた全方位深度センシングシステムであるHexaMODEを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:06:55 GMT)
Sheaf Graph Neural Networks via PAC-Bayes Spectral Optimization [13.0] グラフニューラルネットワーク(GNN)のオーバースムース化は、異なるノード機能で崩壊を引き起こす。
SGPC (Sheaf GNNs with PAC-Bayes) は,セルラーシェーフメッセージパッシングと複数のメカニズムを組み合わせた統一アーキテクチャである。
9つのホモ親和性およびヘテロ親和性ベンチマークの実験により、SGPCは最先端スペクトルおよび層ベースGNNよりも優れた性能を示した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:24:49 GMT)
Articulate That Object Part (ATOP): 3D Part Articulation via Text and Motion Personalization [12.9] ATOP(Articulate That Object Part)は、テキストプロンプトに規定された部分とその動きについて静的な3Dオブジェクトを記述するための、モーションパーソナライゼーションに基づく新規な数ショット方式である。
提案手法は,より高精度なリアルな動作サンプルを生成でき,より一般化可能な3次元動作予測を実現する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 20:06:13 GMT)
MultiMed-ST: Large-scale Many-to-many Multilingual Medical Speech Translation [12.6] 医療領域のための大規模STデータセットであるMultiMed-STをリリースし、5つの言語で全ての翻訳方向を網羅した。
290,000のサンプルを持つこのデータセットは、すべてのドメインの中で最大の医療用MTデータセットであり、多言語多言語STである。
実験的ベースライン、バイリンガル-マルチリンガル比較研究、エンドツーエンド対カスケード比較研究、タスク特化対マルチタスクシーケンス-シーケンス比較研究、コード・スウィッチ分析、量的品質比較など、この分野の歴史における最も包括的なST分析を、我々の最も優れた知識に提示する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 20:34:22 GMT)
pMixFed: Efficient Personalized Federated Learning through Adaptive Layer-Wise Mixup [12.6] pMixFedは動的で階層的なPFLアプローチで、共有グローバルモデルとパーソナライズされたローカルモデルの間で$textitpMixFed$を統合する。
提案手法では,パーソナライズ層と共有層を分割する適応戦略,パーソナライゼーションの段階的な移行,クライアント間の一般化の改善,破滅的な忘れを緩和するための新たな集約機構を導入している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 21:21:28 GMT)
LLM-Driven Completeness and Consistency Evaluation for Cultural Heritage Data Augmentation in Cross-Modal Retrieval [12.5] クロスモーダル検索は文化遺産データの解釈に不可欠であるが、その有効性は不完全あるいは矛盾した文章の記述によって制限されることが多い。
LLM生成した記述の完全性や一貫性を向上させることにより、クロスモーダル検索性能を向上させるデータ拡張フレームワークである$C3$を提案する。
CulTiとTimeTravelの文化遺産データセットと一般的なベンチマークであるMSCOCOとFlickr30Kの実験では、$C3$が微調整とゼロショットの両方で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:05:40 GMT)
PRAGMA: A Profiling-Reasoned Multi-Agent Framework for Automatic Kernel Optimization [12.2] PRAGMAはプロファイル誘導型AIカーネル生成フレームワークである。
実行フィードバックとハードウェアの詳細なプロファイリングを推論ループに統合する。
我々は、GPUとCPUバックエンドをカバーするKernelBench上でPRAGMAを評価する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:01:43 GMT)
Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B [12.2] 本稿では,SSP(Spectrum-to-Signal Principle)を用いた1.5Bパラメータ密度モデルであるVibeThinker-1.5Bを紹介する。
VibeThinker-1.5Bの総トレーニングコストは7800ドルに過ぎず、クローズドソースモデルよりも優れた推論能力を示している。
注目すべきは、3つのベンチマークで400倍のDeepSeek R1を上回っていることだ。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:37:36 GMT)
Steering Out-of-Distribution Generalization with Concept Ablation Fine-Tuning [12.2] 微調整された大きな言語モデルは意図しないアウト・オブ・ディストリビューションの一般化につながる可能性がある。
本稿では,LCMがファインチューニングからどのように一般化するかを制御するために,CAFT(Concept Ablation Fine-Tuning)を導入する。
CAFTは、微調整中に線形射影の概念を非難し、意図しない一般化からモデルを遠ざける。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 22:39:01 GMT)
Local K-Similarity Constraint for Federated Learning with Label Noise [11.7] ノイズの多いラベルを持つクライアントでのフェデレートラーニングは、クライアントがグローバルモデルに侵入できるため、難しい問題である。
本稿では,事前学習モデルと分類モデルとを分離するクライアントモデルに対する正規化目標を提案する。
この正規化により、複数のコンピュータビジョンと医用画像分類ベンチマークのパフォーマンスが大幅に向上する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 00:30:17 GMT)
HyMoERec: Hybrid Mixture-of-Experts for Sequential Recommendation [11.5] HyMoERecは、すべてのユーザインタラクションとアイテムを平等に扱うシーケンシャルなレコメンデーションフレームワークである。
MovieLens-1MとBeautyデータセットの実験は、HyMoERecが一貫して最先端のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:52:48 GMT)
Differentially Private Distribution Release of Gaussian Mixture Models via KL-Divergence Minimization [11.4] 本稿では,GMMパラメータに厳格な乱摂動を付加するDP機構を提案する。
当社のアプローチは、高いユーティリティを維持しながら、強力なプライバシ保証を実現する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:45:47 GMT)
Deeper or Wider: A Perspective from Optimal Generalization Error with Sobolev Loss [11.3] より深いニューラルネットワーク(DeNN)と、柔軟な数のレイヤと、限られた隠れたレイヤを持つより広いニューラルネットワーク(WeNN)を比較します。
より多くのパラメータがWeNNを好む傾向にあるのに対し、サンプルポイントの増加と損失関数の規則性の向上は、DeNNの採用に傾いている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 21:16:24 GMT)
Physics-Informed Image Restoration via Progressive PDE Integration [11.1] 物理インフォームドPDEダイナミクスを最先端の復元アーキテクチャに統合するトレーニングフレームワークを提案する。
提案手法は,大域的空間モデリングを原則として実現しつつ,運動ぼけの方向流特性を自然に把握する。
我々のPDE強化デブロアリングモデルは、最小限のオーバーヘッドで優れた復元品質を実現し、GMACの推測に1%程度しか加えていない。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 06:10:20 GMT)
Agentmandering: A Game-Theoretic Framework for Fair Redistricting via Large Language Model Agents [10.9] 本稿では、対立する政治的利益を代表する2人のエージェント間のターンベース交渉として再編成する枠組みを提案する。
エージェント・マンダリングは党派偏見と不公平さを著しく低減し、標準ベースラインよりも2~3桁のばらつきを達成できる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:33:32 GMT)
Robustness of Neurosymbolic Reasoners on First-Order Logic Problems [10.7] NLPの最近のトレンドは、Large Language Models (LLMs)における推論能力の向上を目指している。
対実的タスクの変種は、最小限だが意味論的に意味のある変更を、他の有効な一階述語論理問題インスタンスに導入する。
以前の研究では、LLMは反ファクトの変動に弱いことが示されており、しばしば反応を生成するために急激な表面パターンに依存していることが示唆された。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:20:26 GMT)
Vocabulary In-Context Learning in Transformers: Benefits of Positional Encoding [10.4] Transformerアーキテクチャは、インコンテキスト学習(ICL)機能を持つ
関数近似を含むシナリオでは、コンテキストはモデルの制御パラメータとして機能し、普遍近似特性(UAP)を付与する。
単一層トランスフォーマーにおけるVICLは、位置符号化なしではUAPを持たないが、位置符号化を含む場合、UAPを実現することが可能である。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:27:17 GMT)
Development of the Bioinspired Tendon-Driven DexHand 021 with Proprioceptive Compliance Control [10.4] この手紙は、Dex-Hand 021という高性能でケーブル駆動の5本指ロボットハンドで、12のアクティブと7の受動的自由度(DoF)を持つ。
操作性を高めるために,プロプリオセプティブ・フォースセンシングに基づくアプタンス制御法を提案する。
実験の結果, シングルフィンガー負荷容量は10N以上, 再現性は0.001m以下, 力推定誤差は0.2N以下であった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:49:13 GMT)
V-Shuffle: Zero-Shot Style Transfer via Value Shuffle [10.4] V-Shuffleは、同じスタイルドメインから複数のスタイルイメージを活用するゼロショットスタイル転送方式である。
V-Shuffleは、自己アテンション層内の値の特徴をシャッフルすることで、スタイルイメージのセマンティックコンテンツを暗黙的に破壊する。
本稿では,これらの低レベル表現を高レベルなテクスチャで補完し,スタイルの忠実度を高めるハイブリッドスタイル正規化を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:07:23 GMT)
Evaluating Cell AI Foundation Models in Kidney Pathology with Human-in-the-Loop Enrichment [10.3] AI基盤モデルのトレーニングは、現実の医療課題に対処するための、有望な大規模学習アプローチとして登場した。
これらのモデルの多くは、疾患の診断や組織定量化などのタスクのために開発されたが、単一の臓器内の核分割のような最も単純なタスクに展開するための準備が整っていないことは確かである。
本稿では、最近の細胞基盤モデルの性能をキュレートされたデータセット上で徹底的に評価することにより、この重要な疑問である「我々はどのくらい良いのか?」に答えようとしている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 03:27:10 GMT)
Going beyond Landauer: Information-cost relations from inference based on the maximum entropy principle [10.2] 最大エントロピー原理に基づく一般的な情報コストトレードオフ関係を導出する。
我々は、エネルギーと励起を交換する結合量子ビットシステムを用いて、情報コストのトレードオフ関係を数値的に検証する。
この結果は、一般的な有限時間量子過程における熱力学的コストの制約における最大エントロピー推論の幅広い有用性を裏付けるものである。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:45:37 GMT)
Automated Vehicles at Unsignalized Intersections: Safety and Efficiency Implications of Mixed Human and Automated Traffic [10.1] 自動車両(AV)の交通システムへの統合は、道路の安全性と効率を高める前例のない機会である。
本研究では,無人交差点におけるAVと人間駆動車(HV)の行動差と適応性を調べることにより,ギャップを埋めることを目的とする。
AVはより大きな安全マージンを維持しているが、その保守的な行動は、人間のドライバーにとって予期せぬ状況を引き起こす可能性がある。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:27:51 GMT)
Resilience Inference for Supply Chains with Hypergraph Neural Network [10.0] サプライチェーンは世界経済の安定に不可欠であるが、混乱は相互接続されたネットワークを通じて伝播し、経済的に重大な影響を及ぼす。
サプライチェーンのレジリエンスの正確かつタイムリーな推論では、破壊時にコア機能を維持する能力は、積極的なリスク軽減と堅牢なネットワーク設計に不可欠である。
既存のアプローチでは、明示的なシステムダイナミクスなしでサプライチェーンのレジリエンスを推測する効果的なメカニズムが欠如しており、サプライチェーンネットワークに固有の高次多元性を表現するのに苦労している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 03:34:45 GMT)
X-Diffusion: Generating Detailed 3D MRI Volumes From a Single Image Using Cross-Sectional Diffusion Models [10.0] X-拡散(X-Diffusion)は、空間領域入力から詳細な3次元MRIボリュームを再構成する新しい断面積拡散モデルである。
X-Diffusionの重要な側面は、MRIデータを横断的なトレーニングと推論の間、全体的な3Dボリュームとしてモデル化することである。
以上の結果から,X-Diffusionは定量精度(PSNR)に優れるだけでなく,重要な解剖学的特徴を保っていることが示唆された。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:43:38 GMT)
DeepAndes: A Self-Supervised Vision Foundation Model for Multi-Spectral Remote Sensing Imagery of the Andes [9.9] 我々は,3千万個のマルチスペクトル衛星画像に基づいてトレーニングされた視覚基盤モデルであるDeepAndesを紹介する。
不均衡な画像分類、画像インスタンス検索、画素レベルのセマンティックセマンティックセグメンテーションタスクによる画像理解性能の評価を行った。
実験の結果,DeepAndesはF1スコア,平均精度,Diceスコアを数ショットの学習シナリオで達成できることがわかった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:43:29 GMT)
Diffusion Posterior Sampling is Computationally Intractable [9.7] 後方サンプリングは、塗装、超解像、MRI再構成などのタスクに有用である。
後続サンプリングは,暗号の最も基本的な仮定の下で計算的に抽出可能であることを示す。
また,指数時間回帰サンプリングアルゴリズムは,指数時間で逆転する一方向関数が存在するという強い仮定の下で,本質的に最適であることを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:46:09 GMT)
Dutch Metaphor Extraction from Cancer Patients' Interviews and Forum Data using LLMs and Human in the Loop [9.7] 我々は、がん患者のオランダ語データに焦点を当てる。
2つのデータソースを用いて患者が使用するメタファーを抽出する。
そこで,Human-in-the-loopセットアップを用いて抽出したメタファを検証し,出力をHealthQuote.NLというコーパスにコンパイルする。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:49:47 GMT)
Enhancing Deep Learning-Based Rotational-XOR Attacks on Lightweight Block Ciphers Simon32/64 and Simeck32/64 [9.6] Gohrは、Speck32/64を攻撃するために差分ベースの神経識別器を導入することで、神経暗号解析の先駆者となった。
本稿では,Sim32/64 と Simeck32/64 の軽量ブロック暗号に対する識別器の最適化とキー回復攻撃について述べる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:35:11 GMT)
FreeBlend: Advancing Concept Blending with Staged Feedback-Driven Interpolation Diffusion [9.5] 概念ブレンディングは、生成モデルにおいて、有望だが未発見の領域である。
FreeBlendは、これらの課題に対処するために設計された、効果的な、トレーニング不要のフレームワークです。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:33:47 GMT)
LLM For Loop Invariant Generation and Fixing: How Far Are We? [9.5] ループ不変量の同定は、プログラムの自動安全性評価をサポートするための重要なステップである。
大規模言語モデルの最近の進歩は、多種多様なソフトウェア工学(SE)と形式的検証タスクの可能性を実証している。
本稿では,プログラムの帰納的ループ不変量の推定や誤り不変量の修正において,様々なサイズのオープンソースLLMとクローズドソースLLMの習熟度を評価するための実証的研究を報告する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 21:47:45 GMT)
TriShGAN: Enhancing Sparsity and Robustness in Multivariate Time Series Counterfactuals Explanation [8.9] カウンターファクトの説明は、クエリされたインスタンスで何が変更されるべきなのかを提案して、AIシステムの結果を変更する。
伝統的なNearest Neighborベースの手法は、典型的には、NUNから影響力のあるサブシーケンスを持つクエリ時系列のサブシーケンスを置換する。
我々は三重項損失の編入により強化されたCounteRGANフレームワークのもとでTriShGANを紹介する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 20:32:20 GMT)
SoK: Systematizing a Decade of Architectural RowHammer Defenses Through the Lens of Streaming Algorithms [8.9] RowHammer(RH)は、業界とアカデミックの両方に挑戦し続けている移動目標である。
クリティカルアタックベクターとして機能する可能性から、絶え間なく増加するRHしきい値がDRAMプロセスのスケーリングを脅かしている。
汎用性と比較的低い性能コストのため、アーキテクチャRHソリューションはRHに対する最初の防御ラインである。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:33:38 GMT)
MONICA: Real-Time Monitoring and Calibration of Chain-of-Thought Sycophancy in Large Reasoning Models [8.8] 大規模推論モデル(LRM)は、モデルがユーザーの誤った信念と一致し、独立した推論を維持するよりも誤った情報に従う傾向にある、幻想的な行動に苦しむ。
LRM sycophancyを緩和するには、このsycophancyが推論軌道中にどのように現れるかを監視する必要がある。
そこで本研究では,モデル推論におけるサイコファンシーの監視と緩和を行う新しいモニタ誘導フレームワークであるMONICAを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:18:58 GMT)
From ACR O-RADS 2022 to Explainable Deep Learning: Comparative Performance of Expert Radiologists, Convolutional Neural Networks, Vision Transformers, and Fusion Models in Ovarian Masses [8.7] 深層学習モデルは、画像に基づく卵巣病変のキャラクタリゼーションにおいて有望であることを示す。
本研究は,O-RADS v2022を応用したラジオロジカル性能の評価を行い,それを先進畳み込みニューラルネットワーク(CNN)と視覚変換器(ViT)モデルと比較した。
CNNのAUCは0.620から0.908、AUCは59.2%から86.4%、ViT16-384は0.941、精度は87.4%だった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:36:42 GMT)
NOAH: Benchmarking Narrative Prior driven Hallucination and Omission in Video Large Language Models [8.7] ビデオ大言語モデル(ビデオLLM)は、最近、キャプション、要約、質問応答といったタスクにおいて、強力なパフォーマンスを実現している。
多くのモデルやトレーニング手法は、物語の一貫性を高めるためにイベント間の連続性を明示的に奨励する。
我々は、このバイアスを、物語を先に呼ぶ2つの誤りの鍵となる要因として挙げる:幻覚(幻覚)、非存在事象、または既存の事象が誤って解釈される場合、そして、事実事象が周囲の状況と不一致しているため抑制される場合である。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:41:11 GMT)
Personality over Precision: Exploring the Influence of Human-Likeness on ChatGPT Use for Search [8.5] そこで我々は,ChatGPT と Google 間の信頼,人間的類似性(擬人化),および設計上の嗜好に関するユーザ認知について検討した。
分析では、ChatGPTとGoogle Daily(DUB)と、主にGoogle(DUG)に頼っている2つの異なるユーザーグループを特定した。
DUBグループはChatGPTに対する高い信頼を示し、より人間らしく認識し、パーソナライゼーションと会話の流れを強化するために事実的正確性を取引する意志を示した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:28:55 GMT)
MENSA: A Multi-Event Network for Survival Analysis with Trajectory-based Likelihood Estimation [8.5] 複数のイベントに対してフレキシブルな時間対イベント分布を学習する深層学習モデルであるMENSAを提案する。
4つのマルチイベントデータセットにわたって、MENSAは最先端のベースラインの多くに対して予測性能を改善している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:01:21 GMT)
SPIRIT: Short-term Prediction of solar IRradIance for zero-shot Transfer learning using Foundation Models [8.3] 太陽放射予測に基礎モデルを活用する新しい手法を提案する。
提案手法は,ゼロショットトランスファー学習における最先端モデルを約70%向上させ,過去のデータに頼ることなく,新しい場所での効果的なパフォーマンスを実現する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 07:02:18 GMT)
High-Fidelity Controlled-Phase Gate for Binomial Codes via Geometric Phase Engineering [8.3] 本稿では,二項符号化論理量子ビットに対する制御相ゲートの実装のための幾何学的位相工学手法を提案する。
2つの二項符号間の制御Zゲートに対して97.4$pm$0.8%のプロセス忠実度を実験的に示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:27:01 GMT)
Multipartite Entanglement Distribution in Quantum Networks using Subgraph Complementations [8.2] 量子ネットワーク上でグラフ状態を分散する新しい手法を提案する。
グラフ状態の共通クラスを,部分グラフ補完を用いた最適分布時間とともに分類する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 01:41:29 GMT)
Evaluation Awareness Scales Predictably in Open-Weights Large Language Models [8.2] 評価の認知度はモデルサイズとともに予測可能に向上することを示す。
このスケーリング法則は、将来の大規模モデルにおいて、偽装行動を予測することを可能にし、AI安全性のためのスケールアウェア評価戦略の設計をガイドする。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:13:27 GMT)
Explicit Knowledge-Guided In-Context Learning for Early Detection of Alzheimer's Disease [7.9] EK-ICLは構造化された明示的知識を統合し、文脈内学習における推論安定性とタスクアライメントを高める。
実験により、EK-ICLは最先端の微調整とICLベースラインを著しく上回っていることが示された。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:01:45 GMT)
Auditing M-LLMs for Privacy Risks: A Synthetic Benchmark and Evaluation Framework [7.5] PRISMは、クロスモーダルなプライバシーリスクを評価するために設計された大規模な総合ベンチマークである。
PRISMは、最初のマルチモーダル、多次元、微細な合成データセットである。
PRISM上での6つのM-LLMの推論能力を評価する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:46:31 GMT)
Universal Neurons in GPT-2: Emergence, Persistence, and Functional Impact [7.4] 独立訓練GPT-2小モデルにおけるニューロンの普遍性現象について検討する。
我々は500万トークンのデータセット上での活性化のペアワイズ相関解析により普遍ニューロンを同定する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 03:00:24 GMT)
You Had One Job: Per-Task Quantization Using LLMs' Hidden Representations [7.4] 本稿では,タスクサレント信号を量子化のガイドラインとして符号化する隠れ表現を提案する。
本稿では,タスク条件付き統計量を用いてビット幅を割り当てるタスク・アウェア・量子化(TAQ)と,直接層感度テストに基づいて精度を割り当てるTAQOの2つの新しいタスク・アウェア・PTQ手法を比較した。
TAQはPhi-4、TAQOはLlama-3.1、Qwen3、Qwen2.5である。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 19:58:24 GMT)
Hybrid Real-Imaginary Time Evolution for Low-Depth Hamiltonian Simulation in Quantum Optimization [7.4] 反断熱(CD)駆動は、断熱量子コンピューティングを加速させる強力な技術である。
ハイブリッド適応変分量子力学シミュレーション(HAVQDS)を開発した。
HAVQDSは、回路圧縮のための適応的なリアルタイム進化と、余分なゲートコストで励起を抑制する想像上のステップを組み合わせる。
SKモデル(6-14 qubits)では、HAVQDSはAdiabatic や CD よりも高い近似比を達成し、CNOT の数を 1--2 桁削減する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:33:45 GMT)
3dSAGER: Geospatial Entity Resolution over 3D Objects (Technical Report) [7.4] 3dSAGERは3Dオブジェクト上の空間的エンティティ解決のためのエンドツーエンドパイプラインである。
本稿では,マッチングペアの複雑な幾何学的特徴をキャプチャする,空間参照非依存のデファクトチュール化機構を提案する。
また、訓練されたモデルを活用して、ハイリコール候補セットを効率的に生成する、軽量で解釈可能な新しいブロッキング手法であるBKAFIを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:35:45 GMT)
A Graph Laplacian Eigenvector-based Pre-training Method for Graph Neural Networks [7.4] 構造に基づく事前学習手法は、基礎となるグラフ構造に依存した下流アプリケーションには不十分だが不可欠である。
グラフラプラシアンの低周波固有ベクトルの予測に基づくグラフニューラルネットワーク(GNN)のための新しい事前学習モジュールであるラプラシア固有ベクトル学習モジュール(LELM)を提案する。
LELMはオーバースムーシングを克服する新しいアーキテクチャを導入し、GNNモデルが長距離相互依存性を学習できるようにする。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:45:32 GMT)
Setting $\varepsilon$ is not the Issue in Differential Privacy [7.3] プライバシー予算を解釈するいわゆる問題は、ディファレンシャル・プライバシの広く採用される大きな障害としてしばしば提示される。
プライバシー予算の解釈の難しさは、差分プライバシーの定義自体に起因していないと我々は主張する。
我々は、現在の研究状況を考えると、プライバシーリスクを推定するための健全な手法は、差分プライバシーフレームワーク内で表現可能であるべきだと主張している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:03:45 GMT)
On the Convergence of Continual Federated Learning Using Incrementally Aggregated Gradients [7.2] 機械学習の聖杯は、連続的フェデレーション学習(CFL)によって、ストリーミングデータから学習しながら、AIシステムの効率、プライバシ、スケーラビリティを高めることである。
本稿では、エッジベースのメモリ勾配更新と、現在のデータに対する集約勾配からなる新しいリプレイメモリベースのフェデレーション戦略を提案する。
我々は,C-FLAGが,タスクとクラスインクリメンタル設定の両方において,精度や忘れなどの指標に関して,最先端のベースラインを上回っていることを実証的に示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:59:05 GMT)
Counterfactual Forecasting For Panel Data [7.2] パネルデータに欠落した項目と時間依存性の潜伏因子を有さない結果を予測するという課題に対処する。
本稿では,従来の行列補完手法を拡張したFOCUS(Forecasting Counterfactuals under Dynamics)を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:25:49 GMT)
Survival Modeling from Whole Slide Images via Patch-Level Graph Clustering and Mixture Density Experts [7.1] 本稿では,スライド画像全体から癌特異的生存を予測するためのモジュラーフレームワークを提案する。
この枠組みは4つの重要な段階から成り、予測的形態学と不均一性を捉えるように設計されている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 07:54:47 GMT)
Temporal Zoom Networks: Distance Regression and Continuous Depth for Efficient Action Localization [6.9] 境界距離回帰(BDR)は、分類を符号付き距離回帰とゼロクロス抽出に置き換える。
BDRは約50行のコードで既存のメソッドに適合し、mAP@0.7を1.8から3.1%改善する(平均+2.4)。
THUMOS14では151GのFLOPで56.5%のmAP@0.7、Uniform-6の198Gで53.6%を達成した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:03:03 GMT)
GAIA: A General Agency Interaction Architecture for LLM-Human B2B Negotiation & Screening [6.9] 我々は,B2B交渉および審査におけるLLM-人事機関のガバナンス優先の枠組みであるGAIAを提案する。
GAIAはパフォーマンスを高めるために3つの重要な役割、プリンシパル(人間)、デリゲート(LLMエージェント)、カウンターパーティをオプションで定義している。
コントリビューションは,(1)3つのコーディネートされた機構と4つの安全不変性を備えたフォーマルなガバナンスフレームワーク,(2)タスク完全性追跡(TCI)による情報公開の進展,(2)コミットメントからスクリーニングを分離する明示的な状態遷移,(3)批判的提案と並列学習チャネルによる人間の監視を融合した2つのフィードバック統合である。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 07:41:49 GMT)
A Mixture-of-Experts Framework with Log-Logistic Components for Survival Analysis on Histopathology Images [6.8] スライド画像全体(WSI)から癌特異的生存を予測するためのモジュラーフレームワークを提案する。
このモデルは、TGA LUADで0.644、TGA KIRCで0.751、TGA BRCAで0.752となる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:02:15 GMT)
Mixtures of SubExperts for Large Language Continual Learning [6.4] タスクの連続ストリームに大規模言語モデルを適用することは、決定的だが挑戦的な取り組みである。
1組のPEFTパラメータを新しいタスクに再利用すると、しばしば以前の知識を壊滅的に忘れてしまう。
本稿では,最小限の忘れ込みと効率のよい拡張性を実現するための,新しい連続学習フレームワークであるTextitMixtures of SubExperts (MoSEs)を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:44:45 GMT)
LLM$^3$-DTI: A Large Language Model and Multi-modal data co-powered framework for Drug-Target Interaction prediction [6.4] 薬物-標的相互作用(DTI)予測は、薬物発見と薬物再資源化において非常に重要である。
データ駆動方式は、DTIの予測にますます活用され、様々な次元にわたるコストを削減している。
本稿では,予測フレームワークを併用した$textbfL$arge $textbfL$anguage $textbfM$odelと$textbfM$ulti-$textbfM$odelデータを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:07:07 GMT)
Revenue Maximization and Learning in Products Ranking [6.4] 価格と品質の異なる商品群を並べて展示するオンライン小売業者の収益問題を考察する。
消費者は注目範囲、すなわち、目視したい商品の最大数に注意を向け、製品を購入する前に順次検査したり、注意範囲が枯渇した時にプラットフォームを空っぽにしておく。
当社のフレームワークは、2つのカスケードでよく知られたモデルを拡張しています。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:04:44 GMT)
Understanding LLM Behaviors via Compression: Data Generation, Knowledge Acquisition and Scaling Laws [6.3] 我々は、増大するモデルとデータスケールにまたがって、どのようにしてLarge Language Modelsが情報を取得し、保存するかの詳細なビューを提供する。
この理論的な視点と、Heapの法則やZipfの法則に触発された自然な仮定に触発され、単純化されながら代表的である階層型データ生成フレームワークを導入する。
ベイジアン・セッティングの下では、このモデル内の予測と圧縮が自然に多様な学習とスケーリングの行動を引き起こすことが示される。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:12:38 GMT)
Forecasting Spoken Language Development in Children with Cochlear Implants Using Preimplantation MRI [6.3] 人工内耳は難聴児の音声言語を有意に改善させる。
この変動は、インプラントや残聴器の年齢を用いて、個々の子供に対して確実に予測できない。
本研究では,従来の機械学習(ML)とディープトランスファー学習(DTL)アルゴリズムの精度を比較し,CI後の音声言語を予測することを目的とする。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:02:54 GMT)
Quantum optical neural networks using atom-cavity interactions to provide all-optical nonlinearity [6.2] 本稿では,原子空洞ニューロンと光子吸収・放出を制御可能な量子光学ニューラルネットワーク(QONN)を提案する。
コンパクトなハードウェアと低消費電力のため、QONNはリアルタイム衛星センシングに有望なソリューションを提供する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 00:11:44 GMT)
GazeVLM: A Vision-Language Model for Multi-Task Gaze Understanding [5.9] 本稿では,画像のマルチタスク視線理解のための視覚言語モデル(VLM)であるGazeVLMを紹介する。
人検出、目視対象検出、目視対象識別に対処する。
GazeVLMは、私たちの知る限り、これらの組み合わせタスクに対するVLMの最初の応用であり、各タスクの選択的な実行を可能にします。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:07:40 GMT)
Breaking the Dyadic Barrier: Rethinking Fairness in Link Prediction Beyond Demographic Parity [5.9] 我々は、リンク予測のようなランク付けに基づくタスクにおいて、公平性評価のために、人口統計学的パーティが望ましい性質を満たしていないことを論じる。
既存の公正評価の限界を形式化し、より表現力のある評価を可能にする枠組みを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 22:58:29 GMT)
On Encoding Matrices using Quantum Circuits [5.9] ブロック符号化と状態準備回路の形式で符号化行列について検討する。
a) 古典的な形式で与えられた任意の行列のブロック符号化を効率的に構築するための一般的な方法、(b) ブロック符号化と状態準備回路間の双方向変換アルゴリズムである。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:00:53 GMT)
The Energy Cost of Reasoning: Analyzing Energy Usage in LLMs with Test-time Compute [5.8] 大規模言語モデル(LLM)のスケーリングは大幅な進歩を遂げているが、リターンの低下とエネルギー需要の増大に直面している。
本研究は,従来のスケーリング戦略を補完するエネルギー効率の高い計算手法として,テスト時間計算が有効であることを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 19:54:46 GMT)
Automatically Identifying Solution-Related Content in Issue Report Discussions with Language Models [5.8] ソリューション関連コンテンツの配置は、再オープンされた問題の調査、レグレッションの解決、ソリューションの再利用、コード変更の合理性理解に不可欠である。
本稿では,教師付き分類器として言語モデルを用いた解の同定を行う。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 19:04:34 GMT)
Ibom NLP: A Step Toward Inclusive Natural Language Processing for Nigeria's Minority Languages [5.5] ナイジェリアはアフリカで最も人口の多い国であり、人口は2億人を超えている。
ナイジェリアでは500以上の言語が話されており、世界で最も言語的に多様である。
それにもかかわらず、自然言語処理(NLP)の研究は主に、Hausa、Igbo、ナイジェリア・ピジン、Yorubaの4つの言語に焦点を当てている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 20:33:39 GMT)
DRIVE: Data Curation Best Practices for Reinforcement Learning with Verifiable Reward in Competitive Code Generation [5.5] 我々は、RLVR(すなわち、RLプロンプト)を構築し、競争プログラミングコード生成に強力なパフォーマンスをもたらすトレーニング技術を示す。
本手法はQwen2.5-32B上で実装され,LeetCodeとCodeforcesの毎週のコンテストでデータ漏洩を回避する。
結果として得られたモデルは、同様のスケールのモデル間で最先端のパフォーマンスを実現し、DeepSeek v3.1 や Doubao-1.5-Thinking のような主要なシステムに匹敵する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:11:28 GMT)
Analytic and Stochastic Approach to Quantum Advantages in Ground State and Quantum State Preparation Problems [5.5] 本研究では, 状態準備, 基底状態準備, 量子状態準備の問題点について検討する。
我々は、$textpoly(n)$ Pauli演算子で表される$n$qubit Hamiltonianに対して基底状態を作成する量子アルゴリズムの解析的アプローチを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:17:28 GMT)
How Well Do LLMs Understand Drug Mechanisms? A Knowledge + Reasoning Evaluation Dataset [5.4] 事前訓練された大規模言語モデル(LLM)への関心が高まっている2つの科学分野は、薬物開発/再調達とパーソナライズド医療である。
我々は、既知のメカニズムの事実知識と、それらについて新たな状況下での推論能力の両方に基づいてLLMを評価するデータセットを提案する。
O4-miniはOpenAIの4o, o3, o3-miniモデルより優れており、最近の小型Qwen3-4B思考モデルはo4-miniのパフォーマンスとよく一致している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:15:19 GMT)
Enhancing Adversarial Robustness of IoT Intrusion Detection via SHAP-Based Attribution Fingerprinting [5.4] 敵攻撃に対するIoT IDSの堅牢性を高める新しい敵検出モデルを提案する。
我々は、ネットワークトラフィックの特徴から属性指紋を抽出し、IDSがクリーン入力と逆入力を確実に区別できるようにする。
我々は、標準的なIoTベンチマークデータセットでモデルを評価し、敵の攻撃を検出する最先端の手法を著しく上回った。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:56:54 GMT)
Error Estimate and Convergence Analysis for Data Valuation [5.2] まず,データ評価における誤差推定と収束解析について検討する。
トレーニング損失に対して期待される勾配が正常に消失し,メタ損失が反復よりもサブ線形に収束することが証明された。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:15:40 GMT)
Simulated Affection, Engineered Trust: How Anthropomorphic AI Benefits Surveillance Capitalism [5.2] 感情的リアリズムをシミュレートするために設計された人為的なテクノロジーは、中立的なツールではなく、ユーザの信頼と行動を操作する認知的基盤である、と我々は主張する。
これは、行動操作と監視から利益を得る、規制の低い経済システムである監視資本主義の論理を補強する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:36:25 GMT)
CultureGuard: Towards Culturally-Aware Dataset and Guard Model for Multilingual Safety Applications [5.2] CultureGuardは、文化的に整列した高品質な安全データセットを複数の言語でキュレートするための新しいソリューションです。
提案手法では,文化データ分離,文化データ適応,機械翻訳,品質フィルタリングという,4段階の合成データ生成とフィルタリングパイプラインを導入している。
得られたデータセットであるNemotron-Safety-Guard-Dataset-v3は9言語で386,661のサンプルで構成され、Llama-3.1-Nemotron-Safety-Guard-8B-v3をLoRAベースの微調整で訓練する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:10:40 GMT)
Diagnose Like A REAL Pathologist: An Uncertainty-Focused Approach for Trustworthy Multi-Resolution Multiple Instance Learning [5.1] マルチインスタンス学習(MIL)は、AI中心の診断支援のための実行可能なソリューションとして、研究の焦点を絞っている。
病理学者の診察行動をよりよく模倣した不確実性焦点校正型MIL (UFC-MIL) を提案する。
UFC-MILは、最先端の手法に匹敵する分類精度を保ちながら、モデルのキャリブレーションにおいて優れた性能を示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:02:13 GMT)
Diagnosing and Resolving Android Applications Building Issues: An Empirical Study [5.0] この研究は、JavaとKotlinで書かれた200のオープンソースプロジェクトについて実証分析を行い、ビルド失敗の診断と解決を行っている。
環境問題、依存関係、Gradleタスクエラー、設定問題、シンタックス/API不互換性の4つの主要なタイプのビルドエラーを特定しました。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:01:14 GMT)
EASE: Practical and Efficient Safety Alignment for Small Language Models [4.8] 小型言語モデル(SLM)は、エッジデバイスにますますデプロイされ、安全性の整合性は重要でありながら困難である。
小型ランガグモデルに対する実用的で効率的な安全アライメントを実現するための新しいフレームワークであるEASEを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 19:46:54 GMT)
GHOST: Solving the Traveling Salesman Problem on Graphs of Convex Sets [4.8] 凸集合グラフ上に定義された旅行セールスマン問題(TSP)の新たな変種について検討する。
この設定では、エッジコストは固定されていないが、各凸領域から選択された特定の軌跡に依存している。
本稿では,ツアー探索と凸軌道最適化を組み合わせたGCS-TSPを最適に解く階層型フレームワークであるGHOSTを紹介する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:34:15 GMT)
One Subgoal at a Time: Zero-Shot Generalization to Arbitrary Linear Temporal Logic Requirements in Multi-Task Reinforcement Learning [4.8] 複雑で時間的に拡張されたタスク目標と安全制約への一般化は、強化学習(RL)における重要な課題である。
本稿では,任意の仕様に対してゼロショットの一般化を可能にするGenZ-LTLを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:17:17 GMT)
Inside LockBit: Technical, Behavioral, and Financial Anatomy of a Ransomware Empire [4.7] この研究は、LockBitの技術的、行動的、金融機器をエンドツーエンドに再構築する。
我々は、家族のバージョンスケジュールを思い出し、その戦術、テクニック、手順をMITRE ATT&CKにマッピングする。
自然言語埋め込みとクラスタリングを用いて51のチャットログを分析し、標準的なインタラクションプレイブックを推論する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:50:30 GMT)
COTN: A Chaotic Oscillatory Transformer Network for Complex Volatile Systems under Extreme Conditions [4.6] 金融・電気市場の正確な予測、特に極端な状況下では、依然として大きな課題である。
本稿では,新しいLeeアクティベーション機能を備えたChaoticy Transformer Network (COTN)を提案する。
COTNにはAutoencoder Self-Regressive (ASR)モジュールが組み込まれており、異常な市場パターンを検出して分離する。
われわれのアプローチは、Informerのような最先端のディープラーニングモデルを最大17%、GARCHのような従来の統計手法を最大17%上回っている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:17:19 GMT)
Reaction Prediction via Interaction Modeling of Symmetric Difference Shingle Sets [4.6] ReaDISHは、相互作用認識機能を導入しながら、置換不変表現を学習する新しい反応予測モデルである。
1) 対称差分シングルエンコーディングは, 分子のシングル差を計算し, 反応特異的な構造変化を捉えるとともに, 秩序感度を排除し, および(2) 分子内相互作用と分子間相互作用をシングルレベルでモデル化する機構である幾何学的・構造的相互作用アテンションである。
大規模な実験により、ReaDISHは様々なベンチマークで反応予測性能を向上させることが示されている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:29:16 GMT)
Visual Hand Gesture Recognition with Deep Learning: A Comprehensive Review of Methods, Datasets, Challenges and Future Research Directions [4.5] このレビューは、研究者がVHGRタスクを扱うための適切な戦略を選択するのに役立つ有用なガイドラインを構成することを目的としている。
最先端技術は静的ジェスチャー認識、分離された動的ジェスチャー、連続的なジェスチャー認識という3つの主要なVHGRタスクにグループ化される。
我々の調査は、一般のコンピュータビジョン問題とドメイン固有の障害の両方を含む、VHGRにおける主要な課題を特定することで締めくくっている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:30:35 GMT)
State of the Art on Self-adaptive Systems: An Essay [4.4] 本論では,不確実性とリスク認識の適応に関する博士号研究の基盤を構築するために必要な基本概念を紹介する。
関連研究について論じる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:18:57 GMT)
Methodological Considerations for Self-adaptive Systems: An Essay [4.4] 本論では,不確実性とリスク認識の適応に関する博士研究の基礎を築くために必要な方法論的考察の概要について述べる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:09:46 GMT)
Scaling Up without Fading Out: Goal-Aware Sparse GNN for RL-based Generalized Planning [4.3] 深層強化学習とグラフニューラルネットワーク(GNN)を用いた一般的な計画は、様々な象徴的計画領域において有望な結果を示している。
既存のアプローチでは、計画状態が完全に連結されたグラフとして表現され、問題スケールが大きくなるにつれて、エッジ情報や相当な間隔が爆発する。
本稿では, 局所的関係を符号化し, 目的に関連する空間的特徴を明示的に統合する, 疎結合なGNN表現を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 00:48:50 GMT)
A Risk-Neutral Neural Operator for Arbitrage-Free SPX-VIX Term Structures [4.2] ARBITERは市場の状態を、インプリートボラティリティと分散曲線を出力する演算子にマッピングする。
このモデルは、制約付きデコーダで演算子学習を結合し、段階的なスタイルの更新とプロジェクションでトレーニングされる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:35:37 GMT)
Differential privacy for medical deep learning: methods, tradeoffs, and deployment implications [4.2] ディファレンシャルプライバシ(DP)は、医学的深層学習(DL)における機密データ保護の鍵となる技術である
臨床モデルがデータに依存しやすくなるにつれ、プライバシーと実用性と公正性とのバランスが重要な課題となっている。
医療用DLへのDP適用の最近の進展を概観する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:10:12 GMT)
DIO: Refining Mutual Information and Causal Chain to Enhance Machine Abstract Reasoning Ability [4.0] 我々は、パターン、推論、問題解決知能のベンチマークであるRaven's Progressive Matrices (RPM)に取り組む。
完全な因果連鎖イメージ$rightarrow$属性$rightarrow$プログレッシブパターンをモデル化し、ベースラインDIOを構築します。
しかし、DIOの低境界目的には人間の論理が組み込まれていないため、3つの改良点が提示される。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 01:42:41 GMT)
Secu-Table: a Comprehensive security table dataset for evaluating semantic table interpretation systems [4.0] Secu-Tableは1500以上のテーブルで構成され、Common Vulnerabilities and Exposures(データセット)とCommon Weaknession(CWE)データソースから抽出されたセキュリティデータを使用して15k以上のエンティティが構築されている。
このデータセットは、Tabular to Knowledge Graph Matchingに関するSemTabチャレンジの文脈で、研究コミュニティが利用できる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:36:01 GMT)
Rethinking what Matters: Effective and Robust Multilingual Realignment for Low-Resource Languages [4.0] Realignmentは多言語言語モデルにおける言語間転送を改善するための有望な戦略である。
我々は、すべての利用可能な言語を使用することで、再編成が真に恩恵を受けるか、戦略的に選択されたサブセットが言語間移動に匹敵するか、あるいは改善されるかを検討する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:54:17 GMT)
Prediction-based evaluation of back-four defense with spatial control in soccer [3.9] この研究では、空間制御、ストレッチインデックス、圧力指標、防御線の高さといった解釈可能な指標を導入している。
FCバルセロナとレアル・マドリードの2,413回の防衛戦で敗退した。
バルセロナの成功は、より空間制御とコンパクトなライン調整によって特徴づけられる一方、レアル・マドリードはより適応性が高く、一貫性の低い防御構造を示した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:33:11 GMT)
Sample-Efficient "Clustering and Conquer" Procedures for Parallel Large-Scale Ranking and Selection [3.9] 並列コンピューティングにおいてよく使われる「分割と征服」フレームワークを,相関に基づくクラスタリングのステップを追加して修正する。
この一見単純な修正は、広く使われているサンプル最適化R&Sプロシージャのクラスに対して、$mathcalO(p)$のサンプル複雑性の減少をもたらす。
ニューラルネットワーク探索のような大規模AIアプリケーションでは,本手法は優れた性能を示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:28:32 GMT)
Incomplete Multi-view Multi-label Classification via a Dual-level Contrastive Learning Framework [3.9] 本稿では,二重欠落多視点多ラベル分類の課題を解決するために,両レベルコントラスト学習フレームワークを提案する。
いくつかの広く使用されているベンチマークデータセットの実験により、提案手法はより安定し、より優れた分類性能を有することが示された。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:22:38 GMT)
Sparsifying Suprema of Gaussian Processes [3.9] 中心ガウス過程の上限に対して次元非依存的なスパーシフィケーション結果を与える。
任意のノルム$nu(x)$ on $mathbbRn$が与えられたとき、$x$から$O_varepsilon(1)$方向への投影のみに依存する別のノルム$psi(x)$が存在することを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 01:08:33 GMT)
HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection [3.8] HatePrototypesは、ヘイトスピーチの検出と安全性のモデレーションに最適化された言語モデルから派生したクラスレベルのベクトル表現である。
これらのプロトタイプは、ベンチマーク間で交換可能なプロトタイプを使用して、明示的なヘイトと暗黙的なヘイトの間のクロスタスク転送を可能にする。
我々は,効率的かつ伝達可能なヘイトスピーチ検出に関する将来の研究を支援するために,コード,プロトタイプリソース,評価スクリプトをリリースする。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:01:26 GMT)
Tight Bounds for Jensen's Gap with Applications to Variational Inference [3.7] 我々は、関数と確率変数の両方に対する幅広い仮定を満たすイェンセンのギャップに対して、新しい一般境界を提案する。
我々は,本手法の性能に関する解析的および実証的な証拠を提供する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:35:09 GMT)
Benchmarking Web API Integration Code Generation [3.6] We present WAPIIBench, a dataset and evaluation pipeline designed for the ability of LLMs to generate web API invocation code。
オープンソースのLLMを使った実験では、API呼び出しの生成が大きな課題となることが分かりました。
評価済みのオープンソースモデルはいずれも40%以上のタスクを解決できなかった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 19:22:28 GMT)
VinDr-CXR-VQA: A Visual Question Answering Dataset for Explainable Chest X-Ray Analysis with Multi-Task Learning [3.5] VinDr-CXR-VQA(VinDr-CXR-VQA)は、医用視覚質問応答(Med-VQA)のための大規模胸部X線データセットである。
データセットには4,394枚の画像からなる17,597枚の質問応答対が含まれており、それぞれに放射線技師が検証した境界ボックスと臨床理由説明が注釈付けされている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:03:27 GMT)
Probabilistic Wind Power Modelling via Heteroscedastic Non-Stationary Gaussian Processes [3.5] 一般化されたスペクトル混合カーネルに基づく非定常な非定常GPフレームワークを提案する。
提案した10分間の監視制御およびデータ取得(SCADA)測定モデルの評価を行った。
その結果,風力予測における非定常性と異方性の両方のモデル化の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:04:35 GMT)
Optimizing Chain-of-Thought Confidence via Topological and Dirichlet Risk Analysis [3.4] チェーン・オブ・シークレットのプロンプトにより、大規模言語モデルは複雑な問題を解決することができる。
既存の手法では、誤った予測に対するキャリブレーションの低下と深刻な過信に悩まされている。
複数の推論経路にまたがる信頼度を測定するために,拡張ディリクレ・トポロジーリスク(EDTR)を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:09:02 GMT)
CAMP-HiVe: Cyclic Pair Merging based Efficient DNN Pruning with Hessian-Vector Approximation for Resource-Constrained Systems [3.3] CAMP-HiVeは,Hessian Vector近似を用いたサイクリックペアマージベースプルーニングである。
実験により,提案手法が計算要求の大幅な削減を実現することを示す。
既存の最先端のニューラルプルーニング法よりも優れています。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 07:58:36 GMT)
Precision-Scalable Microscaling Datapaths with Optimized Reduction Tree for Efficient NPU Integration [3.1] 本稿では, MX MAC に対して, 両方のアプローチの利点を組み合わせた, ハイブリッド精度・スケール可能な削減木を提案する。
我々は、これらのMACの8x8配列を最先端(SotA)のNPU統合プラットフォームであるSNAXに統合し、効率的な制御とデータ転送を提供する。
MXINT8, MXFP8/6, MXFP4のスループットは64, 256, 512 GOPSでそれぞれ657, 1438-1675, 4065 GOPS/Wのエネルギー効率を実現している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:24:17 GMT)
CSP4SDG: Constraint and Information-Theory Based Role Identification in Social Deduction Games with LLM-Enhanced Inference [3.1] Avalon、Mafia、Werewolfといったソーシャル・ドダクション・ゲーム(SDG)では、プレイヤーは自身のアイデンティティを隠蔽し、意図的に他人を誤解させる。
我々は,ゲームプレイを客観的に分析する確率的制約満足度フレームワークであるCSP4SDGを紹介する。
本研究は,情報理論を用いた確率論的推論がSDGのためのスケーラブルな代替あるいは補間重み付きニューラルネットワークであることを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 01:20:18 GMT)
ArtReg: Visuo-Tactile based Pose Tracking and Manipulation of Unseen Articulated Objects [3.0] 視認できない物体の視触覚に基づく追跡のための新しい手法を提案する。
提案手法は,無意味なカルマンフィルタの定式化において,ビジュオ触点雲を統合する。
我々は,実際のロボット実験を通じて,様々な種類の未知物体に対するアプローチを広く評価してきた。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:30:51 GMT)
Probably Approximately Global Robustness Certification [3.0] 分類アルゴリズムの逆ロバスト性に対する確率的保証を提案し,検討する。
主要なアイデアは、$epsilon$-netをサンプリングし、サンプルのローカルなロバスト性オラクルを呼び出すことである。
我々のアプローチは、従来の形式的検証の範囲を超えている大規模なニューラルネットワークにも適用できる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:46:22 GMT)
Seismic inversion using hybrid quantum neural networks [2.9] 量子コンピュータは、重ね合わせと絡み合いを利用した量子ビットを使用して動作し、古典的に難解な問題を解く能力を提供する。
我々は、ポストスタックおよびプレスタック地震インバージョンのためのハイブリッド量子物理学インフォームドニューラルネットワーク(HQ-PINN)を開発した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 08:07:14 GMT)
Seq2Seq Models Reconstruct Visual Jigsaw Puzzles without Seeing Them [2.9] 本稿では,各パズルピースをトークンの離散列に変換する特殊トークン化器を提案する。
ブラインド」ソルバとして扱われ、エンコーダ・デコーダ変換器は元のレイアウトを正確に再構築した。
視覚的な入力を意図的に制限されているにもかかわらず、我々のモデルは最先端の結果を得る。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:43:16 GMT)
LLM-Guided Reinforcement Learning with Representative Agents for Traffic Modeling [2.8] 大規模言語モデル(LLM)は、エージェントベースの交通モデルにおける自己関心の旅行者のための行動プロキシとして、ますます使われている。
我々は,同じ意思決定状況に直面する各同種旅行者グループを,単一の代表的LLMエージェントでモデル化することを提案する。
提案手法はユーザ均衡に急速に収束する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 07:36:46 GMT)
BookAsSumQA: An Evaluation Framework for Aspect-Based Book Summarization via Question Answering [2.7] BookAsSumQAはアスペクトベースの書籍要約のためのQAベースの評価フレームワークである。
実験の結果,LPMに基づくアプローチは短いテキストに対して高い精度を示す一方で,RAGに基づく手法は文書長の増加とともにより効果的になることがわかった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 01:54:53 GMT)
AutoAdv: Automated Adversarial Prompting for Multi-Turn Jailbreaking of Large Language Models [2.7] AutoAdvは、自動マルチターンジェイルブレイクのためのトレーニング不要のフレームワークである。
Llama-3.1-8Bの攻撃成功率は最大95%に達する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:14:14 GMT)
CYPRESS: Transferring Secrets in the Shadow of Visible Packets [2.6] ネットワークにおける隠蔽チャネルは、これまで議論されてきたものよりも、実用的な秘密通信の可能性がはるかに高いことを示す。
本稿では,ネットワークを流れる正規パケット上に秘密のネットワークエンティティからパケットを配置することにより,信頼できる隠れ通信チャネルを生成するための秘密チャネルフレームワークCYPRESSを提案する。
インターネットに接続された10ユーザのネットワークで、最大1.6MB/sの秘密帯域に到達できます。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 21:02:09 GMT)
Efficient Two Photon Generation from an Emitter in a Cavity [2.4] 2光子状態は、メトロジー、リソグラフィ、通信などの量子技術に必須である。
2光子生成の主要な方法の1つはパラメトリックダウンコンバージョンに基づいているが、これは低効率とフットプリントに悩まされている。
本研究は、二重共振共振器内のエミッタからの2光子生成に関する詳細な理論的研究を示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:21:17 GMT)
Evaluating Human-LLM Representation Alignment: A Case Study on Affective Sentence Generation for Augmentative and Alternative Communication [2.3] 言語モデルにおける概念の使用と人々の期待の間にギャップが生じます。
本稿では,表現アライメントの評価課題を紹介する。
感情表現は、単語、語彙と形の両方で表現されるValence-Arousal-Dominance(VAD)次元、絵文字の4つを選択する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:13:20 GMT)
Simulator Ensembles for Trustworthy Autonomous Driving Testing [2.3] MultiSimは、検索ベースのテストアプローチに基づくマルチシミュレートADASテストの新しいアプローチである。
平均して3.4倍以上のシミュレータに依存しない故障テストと高い故障率を識別する。
以上の結果から,探索における代理モデルの利用は,有効失敗数の平均を保ち,効率も向上することが示された。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 21:15:21 GMT)
STARS: Self-supervised Tuning for 3D Action Recognition in Skeleton Sequences [2.1] マスク付き予測を用いた自己教師付き事前学習手法は骨格に基づく行動認識において顕著な内部データセット性能を示す。
対照的な学習アプローチとは異なり、それらは十分に分離されたクラスタを生成しない。
骨格列における3次元行動認識のための自己教師付きチューニング(STARS)を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:15:02 GMT)
Fault-tolerant syndrome extraction in [[n,1,3]] non-CSS code family generated using measurements on graph states [2.1] 我々は、フォールトトレラントシンドローム測定を実現するために、$[[n,1,3]$非CSS QECCのファミリーを構築する。
我々は、異方性ノイズと回路レベルの非偏極雑音の両方の下で、コードの性能をシミュレートする。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:26:51 GMT)
Image-based Morphological Characterization of Filamentous Biological Structures with Non-constant Curvature Shape Feature [2.1] 身体の異なる部位でメカノ刺激を受けた場合, 腱の形状変化を経時的に解析できる画像ベース手法を提案する。
メカニカル・ラビング後の腱の形状を再構成するために, 3次元ピアース・ワイズ・クロソイドモデルを用いた幾何学的手法を用いる。
以上の結果から, 腱の根尖部における反応性は, 臓器のその部位において高い感度と組織の柔軟性に対応している可能性が示唆された。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:54:16 GMT)
A Dynamic Recurrent Adjacency Memory Network for Mixed-Generation Power System Stability Forecasting [2.1] DRAMN(Dynamic Recurrent AdjacencyMemory Network)は,物理インフォームド解析とディープラーニングを組み合わせたリアルタイム電力系統安定性予測手法である。
DRAMNは、電力系統演算子に対して高い解釈性を提供しながら、最先端の精度を達成する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:39:10 GMT)
Sparsity via Hyperpriors: A Theoretical and Algorithmic Study under Empirical Bayes Framework [2.0] 我々は超主元とスパーシティの選択と結果の解の局所最適性の間に理論的な関係を確立する。
半ラプラス(英語版)や半一般化ガウス(英語版)のような、(0,1)$のパワーを持つ超プライマーが厳格に増加することを示し、ポーシャリティを効果的に促進し、解安定性を向上させる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:27:41 GMT)
Stack Transformer Based Spatial-Temporal Attention Model for Dynamic Sign Language and Fingerspelling Recognition [1.9] 手話に基づく手話認識は、聴覚障害者と非聴覚障害者の間に重要な橋渡しとなる。
本稿では,新しいトランスフォーマーアーキテクチャであるSSTAN(Sequential Spatio-Temporal Attention Network)を提案する。
多様な大規模データセットに関する広範な実験を通じて、我々のモデルを検証した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:14:51 GMT)
Refuting spectral compatibility of quantum marginals [1.7] この研究の主な考え方は対称性が還元された半定値プログラミング階層であり、そのような結合状態が存在しないことを検知する。
階層構造は、すべての非互換スペクトルを検出するという意味で完備である。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:31:43 GMT)
Time Matters: A Novel Real-Time Long- and Short-term User Interest Model for Click-Through Rate Prediction [1.6] CTR(Click-Through Rate)予測の鍵となるステップは、正確なユーザ表現を学習して関心を捉えることだ。
周期パターンと時間点パターンの2つの規則パターンを開発する。
本稿では,この2つのパターンに基づいて,ユーザ関心モデリング手法を提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 03:55:14 GMT)
High-fidelity all-microwave CZ gate with partial erasure-error detection via a transmon coupler [1.6] 残差ZZ相互作用を抑えながら高忠実度を実現する全マイクロ波制御周波数(CZZ)ゲートを実験的に実証した。
CZゲート速度を高速化するために、データとカプラのトランモンを結合しながら、2つのデータトランモン間の小さな相互作用を維持することができる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:04:52 GMT)
Deep Reinforcement Learning for Dynamic Origin-Destination Matrix Estimation in Microscopic Traffic Simulations Considering Credit Assignment [1.5] 我々は,DODE問題をマルコフ決定過程(MDP)として定式化し,モデルフリー深部強化学習(DRL)を適用した新しい枠組みを提案する。
実験の結果,提案手法は平均2乗誤差(MSE)を43.2%削減できることがわかった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:07:42 GMT)
Network Intrusion Detection: Evolution from Conventional Approaches to LLM Collaboration and Emerging Risks [1.5] この調査は、ネットワーク侵入検知システム(NIDS)の進化を体系化する。
従来の技術の現状、強み、限界を明確かつ簡潔に要約する。
LLMのNIDSへの適用に関する最近の研究を概観する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:44:18 GMT)
Understanding Student Interaction with AI-Powered Next-Step Hints: Strategies and Challenges [1.4] 次のステップのヒントフィードバックは、プログラミングタスクの解決に向けて、学生に実行可能なステップを提供する。
本研究では,学生がIDE内学習環境において,AIによる次のステップヒントシステムとどのように相互作用するかを検討する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 12:56:34 GMT)
SteganoSNN: SNN-Based Audio-in-Image Steganography with Encryption [1.3] この研究は、スパイキングニューラルネットワーク(SNN)を利用してセキュアで低消費電力で高容量なマルチメディアデータ隠蔽を実現する、ニューロモルフィック・ステガングラフィーフレームワークであるSteganoSNNを紹介する。
ディジタイズされたオーディオサンプルは、漏れた統合・発火ニューロンを使用してスパイクトレインに変換され、モジュロベースのマッピングスキームを介して暗号化され、RGBA画像チャネルの最小ビットに埋め込まれる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 23:31:53 GMT)
Adaptive 3D Reconstruction via Diffusion Priors and Forward Curvature-Matching Likelihood Updates [1.2] 画像から高品質な点雲を再構築することは、コンピュータビジョンでは依然として難しい。
近年の拡散法は, 事前モデルと可能性更新を組み合わせることでこの問題に対処している。
我々は,新しいFCM (Forward Curvature-Matching) 更新手法と拡散サンプリングを組み合わせることで,このアプローチを推し進める。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:14:14 GMT)
Adaptive Regularization for Large-Scale Sparse Feature Embedding Models [1.1] 我々は,大規模なスパースカテゴリー特徴を用いたモデルに過剰適合が生じている理由を理論的に分析する。
提案手法は,マルチエポックトレーニング中に観察される厳格な性能劣化を防止できるだけでなく,一つのエポック内でのモデル性能を向上させる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:24:14 GMT)
Practical Policy Distillation for Reinforcement Learning in Radio Access Networks [1.0] 重要ながしばしば見落とされがちな障壁は、RANベースバンドハードウェアの計算とメモリの制限にある。
本稿では,強化学習に基づくリンク適応タスクの文脈における政策蒸留について検討する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 22:48:10 GMT)
A Feedback-Control Framework for Efficient Dataset Collection from In-Vehicle Data Streams [0.9] 本稿では、閉ループ制御問題としてデータ収集を定式化するパラダイムであるフィードバック制御データ収集(FCDC)を紹介する。
FCDCはオンライン確率モデルを用いて収集したデータ分布の状態を連続的に近似する。
実データストリームの実験では、FCDCはデータストレージを39.8%削減しながら、バランスのとれたデータセットを25.9%削減している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:27:29 GMT)
Bayesian Uncertainty Quantification with Anchored Ensembles for Robust EV Power Consumption Prediction [0.9] EVパワー推定は、レンジ予測とエネルギー管理の基盤となっているが、実践者はポイント精度と信頼できる不確実性の両方を必要としている。
本稿では,不確かさを両立させるアンロックアンサンブル長短記憶(LSTM)を提案する。
RMSE 3.36 +/- 1.10, MAE 2.21 +/- 0.89, R-squared = 0.93 +/- 0.02, 共分散 0.93 +/- 0.02 を解析し, ほぼノルミナルカバレッジを持つよく校正された不確かさ帯域を提供する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 20:49:42 GMT)
Stochastic interior-point methods for smooth conic optimization with applications [0.9] 一般円錐最適化のためのインテリアポイント法を4つの新しいSIPM変種とともに導入する。
提案したSIPMの複雑性は,多対数係数まで,制約のないデータストリームにおいて最もよく知られた結果と一致する。
頑健な線形回帰、マルチタスク関係学習、クラスタリングデータストリームの実験は、我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 22:00:53 GMT)
Physics-Informed Mixture Models and Surrogate Models for Precision Additive Manufacturing [0.8] 我々は混合モデル学習手法を用いて,レーザーによる添加性製造プロセスの欠陥を同定する。
2つのAMプロセスから実世界のデータを解析し,実験による評価を行った。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 00:04:44 GMT)
A Multi-Agent System for Semantic Mapping of Relational Data to Knowledge Graphs [0.7] これらの課題を克服するための鍵は、さまざまなデータソースを統合することだ。
本研究では,複数のデータベースを知識グラフを用いて統合する手法を提案し,既存の語彙を活用してシステム間の構造化データのマッピングと接続を行う意味エージェントとして,大規模言語モデルの応用に焦点を当てた。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:41:46 GMT)
An upper bound of the silhouette validation metric for clustering [0.6] 平均シルエット幅(英: average silhouette width、ASW)は、クラスタリングの品質の尺度として広く使われている。
本研究では,各データポイントに対してシルエット幅の鋭い上界を導出し,これらを集約し,ASW上の標準上界を得る。
このバウンダリは、与えられたクラスタリング結果がデータセット上で最も可能な結果にどの程度近いかを示すことによって、経験的ASW値の解釈可能性を大幅に低下させる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:23:29 GMT)
Privacy-Preserving Federated Learning for Fair and Efficient Urban Traffic Optimization [0.6] 本研究ではFedFair-Trafficと呼ばれる,プライバシ保護のためのフェデレーション学習フレームワークを提案する。
共同でかつ同時に、旅行効率、交通公正性、および差分プライバシー保護を最適化する。
METR-LAの交通データセットの実際の実験では、FedFair-Trafficは中央集権ベースラインと比較して平均走行時間を7%(14.2分)削減できることがわかった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:03:27 GMT)
Learning the Inverse Ryu--Takayanagi Formula with Transformers [0.5] 本稿では,AdS$_3$におけるホログラフィックエンタングルメントエントロピーの逆問題について,データ駆動生成モデルを用いて検討する。
訓練データは,無作為に生成された測地とそのホログラフィックエンタングルメントエントロピーから成っている。
トレーニング後、Transformerは、それまで目に見えない入力からメトリックアンサッツ内の黒色化関数を再構築する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:52:11 GMT)
EIDSeg: A Pixel-Level Semantic Segmentation Dataset for Post-Earthquake Damage Assessment from Social Media Images [0.5] EIDSegは,地震後のソーシャルメディア画像に特化された,最初の大規模セマンティックセマンティックセマンティックセマンティクスデータセットである。
このデータセットは、2008-2023年の9大地震の3,266枚の画像からなり、5種類のインフラ被害を注視している。
我々は、最先端セグメンテーションモデルをいくつかベンチマークし、Msk Transformer (EoMT) を、mIoU (Mean Intersection over Union) (mIoU) の80.8%で最高性能の方法として同定した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:42:36 GMT)
Decomate: Leveraging Generative Models for Co-Creative SVG Animation [0.4] Decomateは自然言語による直感的なアニメーションを可能にする。
システムは生のSVGを意味論的に意味のあるアニメーション対応コンポーネントに再構成する。
Decomateは、自然言語のインタラクションを通じて反復的な洗練をサポートすることで、生成AIを創造性に統合する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:28:51 GMT)
Technical and Legal Aspects of Federated Learning in Bioinformatics: Applications, Challenges and Opportunities [0.3] フェデレート・ラーニング(Federated Learning)は、データ共有の制限に従い、患者のプライバシを保護するとともに、機関間でのデータを活用して臨床発見を改善する。
本稿では,ゲノムワイド・アソシエーション研究(GWAS),単一細胞およびマルチオミクス研究の法的およびインフラ的課題における重要な応用を初めてレビューする。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 22:47:36 GMT)
How Founder Expertise Shapes the Impact of Generative Artificial Intelligence on Digital Ventures [0.3] 比較的GenAI利用率の高いカテゴリーでは,新規ベンチャーのローンチ数が増加し,ローンチまでの中央値が大幅に減少したことが判明した。
GenAIの新規ローンチに対する効果は、経営経験や教育のない創業者にとっては大きいが、ベンチャーキャピタル(VC)の資金調達に対する影響は、技術経験や教育を持つ創業者にとっては強い。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 21:16:02 GMT)
FEDONet : Fourier-Embedded DeepONet for Spectrally Accurate Operator Learning [0.2] DeepONetsは非線形演算子を学習するための強力なデータ駆動フレームワークとして登場した。
FEDONetは従来のDeepONetよりも優れたパフォーマンスを示している。
FEDONetは、すべてのベンチマークPDEに対して一貫して優れた再構築精度を提供する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 03:56:00 GMT)
RAG-targeted Adversarial Attack on LLM-based Threat Detection and Mitigation Framework [0.2] IoT(Internet of Things)の急速な拡張は、業界全体のコミュニケーションと運用のプラクティスを変革する一方で、攻撃面を広げ、セキュリティ侵害に対する感受性を高めている。
人工知能はIoTネットワークを保護する上で重要なソリューションとなり、Large Language Models(LLM)は自動攻撃行動分析と緩和提案を可能にしている。
LLMベースのIoT攻撃分析と緩和フレームワークを攻撃して、その敵の堅牢性をテストする。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 03:50:17 GMT)
Kaggle Chronicles: 15 Years of Competitions, Community and Data Science Innovation [0.2] 2010年以来、Kaggleはデータサイエンティストが競争し、協力し、データサイエンスの境界を押し進めるプラットフォームだった。
本研究では、メタデータ、共有コード、コミュニティの議論、競争そのものを通じて、Kaggleに関する15年間のデータサイエンスについて詳しく調べる。
我々は、縦方向トレンド分析と標準探索データ解析の両方を実行するために、数百万のカーネルと議論スレッドを分析してこれを行う。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:01:39 GMT)
On the Analogy between Human Brain and LLMs: Spotting Key Neurons in Grammar Perception [0.1] 音声タグの異なる単語の予測に係わる重要なニューロンを同定する。
得られた知識を用いて、データセット上の分類器を訓練し、これらの重要なニューロンの活性化パターンが、新鮮なデータに基づいて音声タグを確実に予測できることを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 20:08:21 GMT)
EMBRACE: Shaping Inclusive Opinion Representation by Aligning Implicit Conversations with Social Norms [0.1] 本研究の目的は、アライメント評価フレームワークを導入することで、NLPや計算モデルで意見がどのように表現されるかを評価することである。
我々のアプローチは、反応のスタンスを基礎となる意見の代理としてモデル化し、多様な社会的視点を考慮し、反映した表現を可能にする。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 21:58:37 GMT)
QRAM: A Survey and Critique [0.1] 量子ランダムアクセスメモリ(QRAM)は、それ自体が量子状態であるアドレスに基づいてデータにアクセスするメカニズムである。
文献から得られた2つの主要なQRAMカテゴリ(アクティブとパッシブ)を使用します。
能動QRAMシステムでは,ほとんどの量子優位性が消失することが証明されている。
既存の提案では、安価でスケーラブルなQRAMはありそうにない、と結論付けています。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:40:52 GMT)
SugarTextNet: A Transformer-Based Framework for Detecting Sugar Dating-Related Content on Social Media with Context-Aware Focal Loss [0.1] SugarTextNetはトランスフォーマーベースのフレームワークで、ソーシャルメディア上での砂糖のデート関連投稿を識別するように設計されている。
クラス不均衡に対処し、マイノリティクラス検出を強化するために、Context-Aware Focal Lossを導入する。
我々は,SulgarTextNetを,Sina Weiboの中国のソーシャルメディア投稿3,067件の,手作業による手作業による注釈付きデータセットで評価した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:24:05 GMT)
Ultranarrow Bright Single-Photon Emitters in Diamond with Strong Broadband Phonon Decoupling [0.1] バルク音速環境から強く包括的に分離されたナノダイヤモンドの単一色中心について報告する。
色中心は室温で0.3nmまで幅が狭く、安定して明るい光を放ち、飽和時には10mpsを超える。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 01:56:22 GMT)
Conversational Collective Intelligence (CCI) using Hyperchat AI in a Real-world Forecasting Task [0.1] Hyperchat AIは、潜在的に無制限サイズのネットワーク化された人間グループ間の思慮深い会話を可能にする、新しいエージェント技術である。
これにより、大規模なチームが複雑な問題、ブレインストーミングのアイデア、表面リスク、代替案の評価、最適化されたソリューションへの効率的な収束などについて議論できるようになる。
メジャーリーグ野球の試合の結果を予測するために,Hyperchat AIを用いてヒトグループの予測精度を定量化するために,正式な研究を行った。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:47:07 GMT)
Dual-Branch Convolutional Framework for Spatial and Frequency-Based Image Forgery Detection [0.0] 本稿では,フォージェリー検出のための空間的特徴と周波数的特徴を組み合わせたフォージェリー検出フレームワークを提案する。
両枝の特徴は融合され、シームズネットワーク内で比較され、64次元の埋め込みによって分類される。
CASIA 2.0データセットでベンチマークすると,従来の統計手法よりも精度が77.9%向上した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:28:13 GMT)
FractalBench: Diagnosing Visual-Mathematical Reasoning Through Recursive Program Synthesis [0.0] FractalBenchは、画像からのフラクタルプログラム合成を評価するベンチマークである。
GPT-4o, Claude 3.7 Sonnet, Gemini 2.5 Flash, Qwen 2.5-VLの4種類のMLLMを標準フラクタル上で評価した。
76%が構文的に有効なコードを生成するが、数学的構造を捉えるのはわずか4%である。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 20:22:42 GMT)
Towards Resource-Efficient Multimodal Intelligence: Learned Routing among Specialized Expert Models [0.0] 大規模言語モデル(LLM)は、視覚、音声、文書理解の力を強めている。
小さなオープンソースモデルはコスト上の利点を提供するが、複雑なクエリやマルチモーダルクエリに苦労する。
私たちは、各クエリを最も適したエキスパートモデルにインテリジェントにルーティングする、統一されたモジュール化されたフレームワークを導入します。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:14:56 GMT)
Toward an Agricultural Operational Design Domain: A Framework [0.0] 農業の自動化は、運転と作業プロセスを統合する。
既存のオペレーショナル・デザイン・ドメイン(ODD)の概念は、まだ農業アプリケーションにおけるユニークな課題に対処していない。
本研究は,自律型農業システムの運用境界を記述および検証するために使用できる農業用ODD(Ag-ODD)フレームワークを紹介する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:33:15 GMT)
TextDiffuser-RL: Efficient and Robust Text Layout Optimization for High-Fidelity Text-to-Image Synthesis [0.0] 高速かつ最適化されたテキストレイアウト生成のための強化学習と拡散に基づく画像合成モデルを組み合わせた2段階パイプラインを提案する。
本フレームワークはテキスト配置と画像合成においてTextDiffuser-2に匹敵する性能を実現し,ランタイムの高速化と柔軟性の向上を実現している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 15:49:22 GMT)
Synheart Emotion: Privacy-Preserving On-Device Emotion Recognition from Biosignals [0.0] ほとんどの感情認識システムはクラウドベースの推論に依存しており、リアルタイムアプリケーションには適さないプライバシーの脆弱性とレイテンシの制約を導入している。
本研究は、手首型フォトプレソグラフィーからデバイス上での感情認識のための機械学習アーキテクチャの包括的な評価を行う。
ONNX変換によって最適化された手首のみのExtraTreesモデルをデプロイし,4.08MBのフットプリント,0.05msの推論遅延,オリジナル実装よりも152倍のスピードアップを実現した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:15:04 GMT)
Spontaneous emission of a three-level artificial atom in a one-dimensional open waveguide [0.0] 1次元開放導波路における連続電磁界と相互作用する量子3レベルはしご系の力学特性とスペクトル特性について検討する。
導波管から放出される光子の強い結合は周波数の相関を示し、3レベル系が非調和である場合でも、同じエネルギーを持つことができる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:03:35 GMT)
Scaling Laws and In-Context Learning: A Unified Theoretical Framework [0.0] インコンテキスト学習(ICL)により、大規模な言語モデルでは、パラメータ更新なしでデモから新しいタスクに適応することができる。
変換器におけるスケーリング法則とICLの出現を結合する統一理論的枠組みを提案する。
ICLの性能はモデル深度$L$, 幅$d$, コンテキスト長$k$, トレーニングデータ$D$, タスク構造によって決定される指数に従うことを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:19:14 GMT)
Robust Nearest Neighbour Retrieval Using Targeted Manifold Manipulation [0.0] 最近傍の検索は、分類と説明可能なAIパイプラインの中心である。
特徴多様体の指定された領域に各サンプルをどの程度容易に適用できるかを評価することによって,検索を再現するTMM-NNを提案する。
TMM-NNは軽量でクエリ固有のトリガパッチを通じてこれを実装している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 07:37:05 GMT)
Resonating valence bond pairing energy in graphene by quantum Monte Carlo [0.0] 実空間量子モンテカルロを用いたグラフェン中の共鳴価結合状態(RVB)を相関変動波関数で決定する。
グラフェンナノ構造における電子対形成機構について検討した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 19:30:46 GMT)
Quantum computing with atomic qubit arrays: confronting the cost of connectivity [0.0] 量子ビット数へのデジタル量子コンピューティングのスケーリングとフィデリティの制御は、注目すべき課題である。
長距離のRydbergゲートと物理モーションは、接続を確立するためのツールを備えた原子量子ビットアレイを構成する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 21:42:57 GMT)
Quantum Monads in Phase Space and Related Toeplitz Operators [0.0] 初期の研究では、位相空間における最小不確かさのシンプレクティック楕円体として量子ブロブを導入した。
これらの対象は、ライプニッツの意味で幾何学的なモナドと見なすことができる。
このようなモナドと一般化されたコヒーレント状態の1対1対応を確立する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:32:18 GMT)
Probing forced responses and causality in data-driven climate emulators: conceptual limitations and the role of reduced-order models [0.0] 現在のニューラルな気候エミュレータは、すべての複雑さで大気-海洋系を解決しようとするが、しばしば強制的な反応の再現に失敗する。
本研究では, 表面温度場と放射フラックスの結合変動を解析するためのニューラルモデルを構築した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 22:47:27 GMT)
Offloading Data Center Tax [0.0] 当社では,データセンタ内の多数のアプリケーションで使用されている共通マイクロサービスであるMongoDBに注目しています。
このアプリケーションでは、いくつかの課税要素をオフロードする推論に基づいて、観察と提案を行います。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 22:19:11 GMT)
Odoo-based Subcontract Inter-site Access Control Mechanism for Construction Projects [0.0] 建設4.0の時代に、産業はスマートで柔軟なアウトソーシングと下請戦略によって、労働弾性の新しいパラダイムを受け入れている。
特別な下請け業者への依存度の向上により、企業はプロジェクト要求に基づいて動的に労働力を拡張することができる。
この適応可能な労働モデルは、階層的な統合を管理し、サイト間のコラボレーションを調整する上での課題を提示します。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:09:35 GMT)
Metamagnetic Transition in Low-Dimensional Site-Decorated Quantum Heisenberg Ferrimagnets [0.0] 磁場中における量子ハイゼンベルクフェライトの理論的研究について述べる。
有限温度の2次遷移が2つあり、T_c2$半点以上、半点の状態が現れる。
これらの結果は、低次元量子スピンシステムの新しい技術応用に光を当てるかもしれない。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:24:45 GMT)
Metabolic quantum limit and holographic bound to the information capacity of magnetoencephalography [0.0] 脳活動によって生じる磁場を非侵襲的に測定する磁気脳磁図では、超伝導量子干渉デバイスや原子磁気センサのような量子センサーを使用している。
ここでは、そのような測定が伝達できる情報に基づいて、基礎的で技術に依存しない境界を導出する。
人間の脳の幾何学と代謝の力について、幾何学的境界は6.6Gbit/sである。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:23:44 GMT)
MemoriesDB: A Temporal-Semantic-Relational Database for Long-Term Agent Memory / Modeling Experience as a Graph of Temporal-Semantic Surfaces [0.0] 我々はMemoriesDBを紹介した。MemoriesDBは時間的、意味的、関係的な非一貫性を避けるために設計された統一データアーキテクチャである。
それぞれのメモリはタイムセマンティック・リレーショナルなエンティティであり、イベントが発生した時に同時にエンコードし、それが何を意味するのか、どのように他のイベントに接続するかを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 01:41:55 GMT)
Magnon-Squeezing-Induced Nonreciprocal Quantum Coherence in a Cavity Magnomechanical System [0.0] 圧縮マグノン駆動を用いたハイブリッドキャビティ磁気機械系の量子コヒーレンスについて検討する。
その結果,スキューズ振幅と位相は有効マグノン周波数と減衰を正確に調節できることが判明した。
その結果、圧縮マグノンはキャビティマグノメカニカルプラットフォームにおける量子コヒーレンスを制御、安定化、最適化するための堅牢で調整可能な資源であることがわかった。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 11:13:09 GMT)
Magnetic and structural properties of epitaxial Er-substituted yttrium iron garnet films grown by pulsed laser deposition [0.0] Er置換イットリウム鉄ガーネット(Er:YIG)は、YIGの低磁気減衰とテレコムバンド光遷移を結合する可能性を秘めている。
X線回折、相互空間マッピング、走査透過電子顕微鏡により、原子的に鋭い界面を持つ単一相の完全コヒーレント成長が確認された。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:59:44 GMT)
Leibniz's Monadology as Foundation for the Artificial Age Score: A Formal Architecture for Al Memory Evaluation [0.0] 本稿では,人工記憶システム評価のための数学的に厳密で哲学的な枠組みを開発する。
以前は定式化されたメートル法であるArtificial Age Score(AAS)に基づいており、この研究はモナドロジーから情報理論アーキテクチャへ20のコア提案をマッピングしている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:48:33 GMT)
Learning-Based Vision Systems for Semi-Autonomous Forklift Operation in Industrial Warehouse Environments [0.0] 本研究は,単一標準カメラを用いたパレットとパレットのホール検出とマッピングのための視覚ベースのフレームワークを提案する。
革新的なパレットホールマッピングモジュールは、検出を実行可能な空間表現に変換する。
実際の倉庫イメージを付加したカスタムデータセットの実験では、YOLOv8が高いパレットとパレットのホール検出精度を達成することが示されている。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 09:13:22 GMT)
Krylov Complexity in Lifshitz-type Dirac Field Theories [0.0] リフシッツ型ディラック場の理論におけるクリロフ複雑性を、ジェネリック力学指数$z$で研究する。
我々は,異なる体制下でのクリロフ複雑性の成長と飽和挙動を解析した。
我々は、Lifshitz指数の$z$の増加がKrylov複雑性、エントロピー、Laczos成長を抑制することを発見した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:49:03 GMT)
Isolated quantum-state networks in ultracold molecules [0.0] 超低温のバイアルカリ分子における最適状態の集合を同定するための一般的なアプローチについて述べる。
我々は、分子を特定の状態に準備するために、利用可能な多くの遷移の経路を見つける方法について説明する。
次に、複数の結合が同時に存在する状態のネットワークについて検討する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 19:57:39 GMT)
HYDRA: A Hybrid Heuristic-Guided Deep Representation Architecture for Predicting Latent Zero-Day Vulnerabilities in Patched Functions [0.0] HYDRAはパッチ機能における潜伏するゼロデイ脆弱性を予測する。
HYDRAは、それぞれChrome、Android、ImageMagickの関数の13.7%、20.6%、および24%を予測している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:35:36 GMT)
Generalized State Discrimination for Tunable Quantum Key Distribution: The phiQKD Protocol [0.0] 我々は、一般化量子状態判別(GSD)のためのチューニング可能なフレームワークを導入し、これをphiQKDと呼ぶプロトコルを通じて量子鍵分布(QKD)に適用する。
本研究では,量子計測を固定演算ではなく可変パラメータとして扱うことにより,フレキシブルなプロトコル最適化を実現し,現実的な制約下での性能向上を実現していることを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:19:33 GMT)
From Catastrophic to Concrete: Reframing AI Risk Communication for Public Mobilization [0.0] 近親相姦という観点で考えると、AIに対する公衆の懸念が高まることが示される。
これらの日常的な懸念を取り巻く動員は、AIの政治的サリエンスを高めることができると我々は主張する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 20:28:30 GMT)
Flux-modulated tunable interaction regimes in two strongly nonlinear oscillators [0.0] パラメトリック変調を用いた2つの強非線形発振器間の異なる動的状態を選択的に活性化する機能を示す。
この結果は、純粋にアナログな量子シミュレータを任意のスピン系の研究に利用することができる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 20:42:10 GMT)
Finite-sample deviations and convergence in the statistics of Bohmian trajectory ensembles [0.0] 我々は、単一スピンレス粒子とスピン-1/2粒子に対するボヘミア軌道の有限サンプル統計を解析した。
正規フローにおけるサンプル平均および/またはモデスト$N$上の分散はボルンルールモーメントと一致していることを示す。
スピン-1/2粒子の場合、対流とパウリ電流はともに$|psi|2$を保存するが、異なる速度場に関連付けられる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:02:35 GMT)
Feature weighting for data analysis via evolutionary simulation [0.0] このアルゴリズムは、正規化されたデータ行列から計算された更新指標を用いて、標準単純体上の複製子型ダイナミクスによって重みを進化させる。
結果の列は世界中に一意な内部平衡に収束し、非退化制限重みを生じることを証明している。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 16:40:47 GMT)
Fast Riemannian-manifold Hamiltonian Monte Carlo for hierarchical Gaussian-process models [0.0] 既存のプログラムライブラリで達成された遅延推論と比較して、性能が劇的に改善できることが示される。
我々は,RMHMCが後部から効果的に試料を採取し,モデル証拠の計算を可能にすることを実証した。
ユーザが動的にプログラムされたオブジェクトを組み込めるように,カスタマイズ可能なライブラリセットを開発する必要性を強調した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:44:13 GMT)
FPGA or GPU? Analyzing comparative research for application-specific guidance [0.0] 本稿では,様々な研究論文から洞察を合成し,ドメイン固有アプリケーションに適したアクセラレーションを選択する際にユーザを指導する。
レビューされた研究を分類し、主要なパフォーマンス指標を分析することで、FPGAとGPUの長所、限界、理想的なユースケースを強調します。
この発見は、研究者や実践者がパフォーマンス、エネルギー効率、プログラム可能性のトレードオフをナビゲートするのに役立つ、実用的なレコメンデーションを提供する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 22:54:28 GMT)
Exploring Parallelism in FPGA-Based Accelerators for Machine Learning Applications [0.0] 投機的バックプロパゲーションは、前方と後方のパスをオーバーラップすることで、ニューラルネットワークのトレーニングを加速する有望な手法として登場した。
並列プログラミングプラットフォームとしてOpenMPを用いたMNISTデータセットの投機的バックプロパゲーションを実装した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:05:05 GMT)
Explainable AI For Early Detection Of Sepsis [0.0] 本稿では,機械学習と臨床知識を統合したセシス分析のための解釈可能なAIアプローチを提案する。
本手法は,敗血症発症の正確な予測を行うだけでなく,臨床医がモデルのアウトプットを理解し,検証し,確立した専門知識と整合することを可能にする。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 18:33:06 GMT)
Equivalence and Divergence of Imaginary-Time Evolution and Gradient Descent for Gaussian Variational States [0.0] ITEは、多体ハミルトニアンの基底状態を得るための最も広く使われている数値手法の1つである。
ITEとGDは正式にフェルミオン系と同値であるが、GDはボソニック系に対して一貫して高速な収束を示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:07:22 GMT)
Engineering the Kondo impurity problem with alkaline-earth atom arrays [0.0] コールドアルカリ-アース(-様)原子を用いた近藤不純物問題の量子シミュレーション実験を提案する。
コールド原子量子シミュレーターで観測可能な様々な観測装置における近藤効果のホールマークシグネチャを解析する。
本研究は, 近藤問題における量子シミュレーションの新たな展開と, 従来と異なる状態における近藤物理学の新たな知見を提供するものである。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 19:54:43 GMT)
Efficient Approximation of Volterra Series for High-Dimensional Systems [0.0] 入力空間の小さな部分集合で訓練された局所化MVMALSモデルを構築することにより,複雑性を著しく低減するヘッド平均化(THA)アルゴリズムを導入する。
THAは、拡張性があり理論的に基礎付けられたアプローチを提供し、以前は難解な高次元システムを特定する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 20:31:39 GMT)
Comprehensive Validation of Replica Symmetry Breaking via Quantum Annealing: From Ground States to Topological Collapse [0.0] 我々はジョルジョ・パリシのシェリントン・カークパトリックスピンガラスの正確な解を4000スピンに拡張する。
レプリカ対称性の破れの出現と崩壊を調査する。
この包括的検証は、複素系における基本的な統計力学を探索するための量子的優位性を確立する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:33:22 GMT)
Cauchy-Schwarz and Bell Inequality Violations in Coupled Optomechanical Systems [0.0] フォトンフォノンのアンチバンチは、オプトメカニカルキャビティ系における古典的不等式に違反する可能性がある。
2つの弱いプローブ場によってシステムが駆動されるとき、単一光子-フォノン励起の量子相関を解析する。
この発見は、最適条件下でのサブポアソン信号の生成に重要であり、ハイブリッドシステムにも応用できる可能性がある。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:56:55 GMT)
Bridging Theory and Practice: A Stochastic Learning-Optimization Model for Resilient Automotive Supply Chains [0.0] サプライチェーンの混乱と不安定な需要は、ジャスト・イン・タイム(JIT)製造に大きく依存している英国の自動車業界にとって大きな課題となっている。
本稿では,ベイズ推論と在庫最適化を統合した新しい学習最適化フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:51:51 GMT)
Brain-Inspired Planning for Better Generalization in Reinforcement Learning [0.0] この論文は、エージェントのゼロショット・システマティックな一般化能力を強化する方向性を探求する。
我々は、意思決定時計画エージェントが環境状態の最も関連性の高い側面に動的に集中できるトップダウンアテンション機構を導入する。
また、複雑なタスクをよりシンプルで管理しやすいサブタスクに自動的に分解するSkipperフレームワークを開発しました。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:32:55 GMT)
Bidirectional quantum teleportation using quantum walks [0.0] 2つの独立な1次元格子上の量子ウォークを用いた1量子ビットの双方向テレポーテーション法を提案する。
近隣のジャンプと隣のジャンプを1枚のコインと2枚のコインで組み合わせた2つの異なる方法について議論する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 13:31:59 GMT)
Assertion-Aware Test Code Summarization with Large Language Models [0.0] 単体テストは、テスト意図を伝える簡潔な要約を欠くことが多い。
本稿では,開発者による要約と組み合わせた実世界のJavaテストケース91のベンチマークを示す。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 04:58:32 GMT)
Arbitrary state preparation in quantum harmonic oscillators using neural networks [0.0] HOにおける量子状態の生成手法を開発した。
我々は、状態準備に必要なパルスパラメータを予測するニューラルネットワークを使用している。
HOにおける量子状態と量子状態の調製結果について, それぞれ99.9%, 97.0%の平均忠実度を達成した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 00:35:55 GMT)
Analyzing and Mitigating Negation Artifacts using Data Augmentation for Improving ELECTRA-Small Model Accuracy [0.0] 本研究では,スタンフォード大学の自然言語推論データセットを微調整したELECTRA小モデルの性能について検討する。
モデルは否定を含む例を正しく分類するのに苦労している。
これを解決するために、我々は、否定を強調するコントラストセットと敵例でトレーニングデータを増強する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 05:25:46 GMT)
ARGO-SLSA: Software Supply Chain Security in Argo Workflows [0.0] Argonativesは、自動化された方法でソフトウェアアーチファクトを管理するためのエンジンである。
ソフトウェアアーティファクトのためのサプライチェーンレベル(SLSA)のようなフレームワークの組み込み機能は含まない。
本稿では,アーティファクトセキュリティを高めるためにArgos上に構築されたプロファイランスコントローラを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 17:40:03 GMT)
ALIGN: A Vision-Language Framework for High-Accuracy Accident Location Inference through Geo-Spatial Neural Reasoning [0.0] 低所得国や中所得国の多くは、正確な場所固有のクラッシュデータ不足に直面している。
既存のテキストベースのジオコーディングツールは、多言語および非構造化のニュース環境では性能が良くない。
本研究では,事故座標を推定するための空間推論をエミュレートする視覚言語フレームワークであるALIGNを紹介する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 10:44:26 GMT)
AI as intermediary in modern-day ritual: An immersive, interactive production of the roller disco musical Xanadu at UCLA [0.0] 協調型多ユーザAIエンゲージメント構築のための設計足場としての儀式について検討する。
2025年春にUCLAで行われたミュージカル『ザナドゥ』の没入的な演出の具体的な事例を考察する。
500人以上の観客が、視覚言語モデルを仮想の風景要素に翻訳するスケッチやジャズの演出を寄稿した。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 02:45:19 GMT)
A Hierarchy of Fibonacci Forbidden-Word Hamiltonians: From the Golden Chain to the Plastic Chain and Aperiodic Order [0.0] フィボナッチ語の最小の禁じられた要素を長さ$F_K$まで禁じることで、一次元のフラストレーションのないハミルトン多様体の無限のスケール整列構造を導入する。
基底状態の言語は指数的な成長定数が$_K$で単調に減少する。
本研究では,新禁制パターン毎のエネルギーペナルティが,前回および現在における成長定数の対数比に比例するエネルギーエントロピースケーリングを提案する。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 23:28:22 GMT)
A Collapse Mechanism Without Heating [0.0] 因果フェルミオン系の理論から導かれる崩壊モデルがプローブの加熱を起こさないことが示されている。
連続自発局在化(CSL)モデルと事象-ツリー-ヒストリー(ETH)の量子論の定式化との関連について論じる。
論文参考訳(メタデータ) (Sun, 09 Nov 2025 14:02:32 GMT)