Semantics and Content Matter: Towards Multi-Prior Hierarchical Mamba for Image Deraining [95.0] 画像デライニングのためのマルチPrior Hierarchical Mamba (MPHM) ネットワーク
MPHMは、タスクレベルのセマンティックガイダンスのためのマクロセマンティックテキスト先行(CLIP)と、シーン認識構造情報のためのマイクロ構造視覚先行(DINOv2)を統合している。
実験ではMPHMの最先端のパフォーマンスを実証し、Rain200Hデータセットで0.57dBのPSNRゲインを達成した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:08:59 GMT)
LoCoBench-Agent: An Interactive Benchmark for LLM Agents in Long-Context Software Engineering [90.8] textbfLoCoBench-Agentは,大規模言語モデル(LLM)エージェントを現実的,長期的ソフトウェア工学で評価するための総合的な評価フレームワークである。
我々のフレームワークは、LoCoBenchの8000のシナリオを対話型エージェント環境に拡張し、マルチターン会話の体系的評価を可能にする。
我々のフレームワークは,8つの特殊なツール(ファイル操作,検索,コード解析)をエージェントに提供し,それを10Kから1Mトークンの範囲で評価する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:57:24 GMT)
Scaling Spatial Intelligence with Multimodal Foundation Models [90.3] マルチモーダル・ファンデーション・モデルは 空間知能に 驚くべき欠陥をみせています
我々は、高性能で堅牢な空間知性を構築するために、原則的なアプローチをとる。
SenseNova-SIは、幅広い空間インテリジェンスベンチマークで前例のない性能を示している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:59:33 GMT)
MMaDA-Parallel: Multimodal Large Diffusion Language Models for Thinking-Aware Editing and Generation [86.8] テキストと画像の出力モダリティの両方を評価するための新しいベンチマークを提案する。
この性能劣化は、生成した推論と最終画像との整合性に強く相関する。
本稿では,テキストと画像間の双方向の連続的相互作用を可能にする並列多モード拡散フレームワークMMaDA-Parallelを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:05:46 GMT)
ViSS-R1: Self-Supervised Reinforcement Video Reasoning [84.1] 本稿では,新しい自己教師付き強化学習GRPOアルゴリズム(Pretext-GRPO)を標準R1パイプライン内に導入する。
また、プリテキストタスクに基づく自己教師型学習をMLLMのR1ポストトレーニングパラダイムに直接統合するViSS-R1フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:00:42 GMT)
P1: Mastering Physics Olympiads with Reinforcement Learning [84.1] 我々は、強化学習(RL)を通して完全に訓練されたオープンソースの物理推論モデルのファミリーであるP1を紹介する。
P1-235B-A22Bは、最新の国際物理オリンピック(IPhO 2025)でゴールドメディカルのパフォーマンスを持つ最初のオープンソースモデルであり、2024/2025年に13の国際・地域物理学コンペで12個の金メダルを獲得した。
P1-235B-A22B+PhysicsMinionsはIPhO 2025で総合1位を獲得し、13の物理学コンペティションで最高スコアを獲得した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:18:13 GMT)
Free-Form Scene Editor: Enabling Multi-Round Object Manipulation like in a 3D Engine [83.0] 実世界の画像に対して直感的で物理的に一貫性のあるオブジェクト編集を可能にする3D対応フレームワークであるFFSEを提案する。
画像空間で動作したり、遅くてエラーを起こしやすい3D再構成を必要とする従来のアプローチとは異なり、FFSEは学習された3D変換のシーケンスとして編集する。
マルチラウンド3Dオブジェクト操作の学習を支援するために,3DObjectEditorを導入する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:57:39 GMT)
Reconstructing 3D Scenes in Native High Dynamic Range [82.9] 本研究では,HDR観測を直接モデル化した3次元シーン再構成法を提案する。
bf Native High Dynamic Range 3D Gaussian Splatting (NH-3DGS)を提案する。
NH-3DGSは, 再構成品質と動的レンジ保存において, 既存の手法よりも有意に優れる合成多視点HDRデータセットと実HDRデータセットの両方を実証した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:33:31 GMT)
AutoMalDesc: Large-Scale Script Analysis for Cyber Threat Research [81.0] 脅威検出のための自然言語の説明を生成することは、サイバーセキュリティ研究において未解決の問題である。
本稿では,大規模に独立して動作する自動静的解析要約フレームワークAutoMalDescを紹介する。
アノテーション付きシード(0.9K)データセットや方法論,評価フレームワークなど,100万以上のスクリプトサンプルの完全なデータセットを公開しています。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:05:25 GMT)
GeoX-Bench: Benchmarking Cross-View Geo-Localization and Pose Estimation Capabilities of Large Multimodal Models [79.0] GeoX-BenchはLMMの機能を調べ評価するために設計された総合的なアンダーラインベンチマークである。
49カ国の128都市にまたがる10,859枚のパノラマ・サテライトイメージペアと、対応する755,976個の質問回答(QA)ペアを含んでいる。
GeoX-Benchに基づいて,25の最先端LMMがクロスビューなジオローカライゼーションおよびポーズ推定タスクに与える影響を評価する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:19:07 GMT)
Beat the long tail: Distribution-Aware Speculative Decoding for RL Training [75.8] モデル出力を変更することなくRLロールアウトを高速化する分散Aware Speculativeデコーディングフレームワークを提案する。
数学とコード推論タスクの実験は、DASが同一のトレーニング曲線を保ちながらロールアウト時間を最大50%短縮することを示している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:02:12 GMT)
Generative Photographic Control for Scene-Consistent Video Cinematic Editing [75.5] CineCtrlはプロのカメラパラメータを細かく制御する最初の映像編集フレームワークである。
本稿では、カメラの動きを写真入力から切り離すための分離されたクロスアテンション機構を提案する。
本モデルでは,ユーザの指定した写真カメラ効果を正確に制御した高忠実度ビデオを生成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:17:23 GMT)
VOPE: Revisiting Hallucination of Vision-Language Models in Voluntary Imagination Task [73.8] 本稿では,自発的想像課題におけるLVLMの幻覚を評価するために,自発的物体存在評価(VOPE)を導入する。
VOPEはリチェックベースの質問を行い、LVLMが想像対象の存在を自身の反応で解釈する方法を評価する。
モデル解釈と画像におけるオブジェクトの存在との間の一貫性は、モデルが応答を生成する際に幻覚を引き起こすかどうかを決定するために使用される。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:32:06 GMT)
MeanFlow Transformers with Representation Autoencoders [71.5] MeanFlow(MF)は、ノイズからデータへのジャンプを直接学習することで、効率的な数ステップ生成を可能にする拡散動機付き生成モデルである。
我々は、表現オートエンコーダ(RAE)の潜在空間におけるMFの効率的なトレーニングとサンプリング手法を開発する。
1ステップのFIDが2.03であり,バニラMFの3.43を上回っ,GFLOPSのサンプリングを38%削減し,ImageNet 256のトレーニングコストを83%削減した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:17:08 GMT)
Cross-Learning from Scarce Data via Multi-Task Constrained Optimization [70.9] 本稿では,データ不足を克服するマルチタスク・エンフクロス学習フレームワークを提案する。
我々はこの結合推定を制約付き最適化問題として定式化する。
本研究では, 画像分類や伝染病の伝播を含む実データを用いて, クロスラーニング手法の有効性を示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:35:59 GMT)
OlmoEarth: Stable Latent Image Modeling for Multimodal Earth Observation [68.1] オルモアース(OlmoEarth)は、地球観測領域向けに設計された、多モードでシーケンシャルな基礎モデルである。
OlmoEarthは12のファンデーションモデルと比較して最先端のパフォーマンスを実現している。
我々はOlmoEarthを、データ収集、ラベル付け、トレーニング観察、地球観測モデルの推測のためのエンドツーエンドプラットフォームのバックボーンとして配置する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:06:26 GMT)
PhysX-Anything: Simulation-Ready Physical 3D Assets from Single Image [67.8] PhysX-Anythingは最初のシミュレーション可能な物理3D生成フレームワークである。
高品質なsim-ready 3Dアセットを明示的な幾何学、調音、物理的特性で生成する。
トークンの数を193倍に減らし、標準VLMトークン予算内で明示的な幾何学的学習を可能にする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:59:53 GMT)
MergeDNA: Context-aware Genome Modeling with Dynamic Tokenization through Token Merging [65.1] 本稿では,動的ゲノミクストークンと潜在トランスフォーマーをコンテキスト対応事前学習タスクで協調的に最適化する階層型アーキテクチャを提案する。
MergeDNAは3つの人気のあるDNAベンチマークと、微調整やゼロショット評価を伴う複数のマルチオミクスタスクにおいて優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:27:41 GMT)
Donors and Recipients: On Asymmetric Transfer Across Tasks and Languages with Parameter-Efficient Fine-Tuning [61.6] 大規模言語モデル(LLM)はタスクや言語間で強く機能する。
あるタスクや言語の改善が他のタスクや言語にどのように影響するか、それらの組み合わせはいまだに理解されていない。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:41:31 GMT)
A Lightweight 3D Anomaly Detection Method with Rotationally Invariant Features [60.8] 3D異常検出(AD)は、ポイントクラウドデータから異常点や領域を特定することを目的として、コンピュータビジョンにおいて重要なタスクである。
既存の手法は、方向と位置の変化を伴う点雲を扱う場合、結果として得られる特徴が著しく異なるため、課題に遭遇する可能性がある。
本稿では、3次元ADのための新しい回転不変特徴量(RIF)フレームワークを提案し、各点を回転不変空間にマッピングして表現の整合性を維持する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:16:05 GMT)
Omni Memory System for Personalized, Long Horizon, Self-Evolving Agents [60.2] O-Memはアクティブユーザプロファイリングに基づく新しいメモリフレームワークである。
O-Memはペルソナ属性とトピック関連コンテキストの階層的検索をサポートする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:55:19 GMT)
Uni-Inter: Unifying 3D Human Motion Synthesis Across Diverse Interaction Contexts [59.8] We present Uni-Inter, a unified framework for human motion generation that support a wide range of interaction scenarios。
Uni-Interは、異種インタラクティブエンティティを共有空間にエンコードするボリューム表現であるUnified Interactive Volume (UIV)を導入している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:32:38 GMT)
Sensing and Understanding the World over Air: A Large Multimodal Model for Mobile Networks [59.2] 無線ネイティブなマルチモーダル大モデル(WMLM)は、マルチモーダルデータによって物理世界を理解し、理解することができる。
我々は、GPTスタイルのWMLMモデルを構築し、それを現実世界の大規模データセット上で訓練し、無線信号をコントラスト学習のためのアンカーモダリティとして活用した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:33:46 GMT)
Video Spatial Reasoning with Object-Centric 3D Rollout [58.1] 我々は,ロバストなビデオ空間推論を実現するために,OCR(Object-Centric 3D Rollout)を提案する。
OCRは、トレーニング中に選択した物体の3次元形状に構造的摂動を導入する。
OCRはモデルを補完し、全体にわたって論理的にソートする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:53:41 GMT)
TokenSqueeze: Performance-Preserving Compression for Reasoning LLMs [57.2] TokenSqueezeは、パフォーマンスを保ち、自己生成データにのみ依存しながら推論パスを凝縮する新しいLong2Shortメソッドである。
TokenSqueeze は MATH500 ベンチマークの精度を維持しながらトークンの使用量を削減できることを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:38:56 GMT)
Learning Skill-Attributes for Transferable Assessment in Video [56.8] ビデオによるスキル評価は、人の身体的パフォーマンスの品質を評価し、何がより良くできるかを説明する。
当社のCrossTrainerアプローチでは,バランス,コントロール,手の位置決めといったスキル属性が検出される。
人間のスキルを表わす行動の共有を抽象化することにより,提案した映像表現は,既存のテクニックの配列よりもはるかに優れている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:53:06 GMT)
TripleFDS: Triple Feature Disentanglement and Synthesis for Scene Text Editing [56.7] STE(Scene Text Editing)は、視覚的一貫性を維持しながら、画像中のテキストを自然に修正することを目的としている。
本稿では,モジュラー属性をアンタングル化したSTEのための新しいフレームワークであるTripleFDSを提案する。
TripleFDSは、メインストリームのSTEベンチマークで最先端の画像忠実度(SSIM 44.54)とテキスト精度(ACC 93.58%)を達成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:15:03 GMT)
One-Step Generative Policies with Q-Learning: A Reformulation of MeanFlow [56.1] ノイズを直接行動にマッピングするオフライン強化学習のための一段階の生成ポリシーを,MeanFlowの残留的な再構成を通じて導入する。
本手法はオフライン・オフライン両方の強化学習環境において高い性能を実現する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:34:17 GMT)
MedDCR: Learning to Design Agentic Workflows for Medical Coding [55.5] 医療符号化は、フリーテキスト臨床ノートを標準化された診断および手続きコードに変換する。
本稿では,設計を学習問題として扱うクローズドループフレームワークであるMedDCRを提案する。
ベンチマークデータセットでは、MedDCRは最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:30:51 GMT)
Mem-PAL: Towards Memory-based Personalized Dialogue Assistants for Long-term User-Agent Interaction [55.2] PAL-Benchは、長期ユーザエージェントインタラクションにおけるサービス指向アシスタントのパーソナライズ機能を評価するために設計された新しいベンチマークである。
サービス指向のインタラクションをパーソナライズするために、階層的で異質なメモリフレームワークであるH$2$Memoryを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:22:32 GMT)
UnSAMv2: Self-Supervised Learning Enables Segment Anything at Any Granularity [54.4] 人間のアノテーションなしでどんな粒度でもセグメンテーションできるUnSAMv2を紹介します。
UnSAMv2は、マスクと粒度のペアを豊富に発見することで、UnSAMの分割・対戦略を拡張している。
粒度を意識した自己教師付き学習手法により,少量のラベル付きデータが視覚基礎モデルの可能性を解き放つことを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:58:34 GMT)
PerTouch: VLM-Driven Agent for Personalized and Semantic Image Retouching [54.4] 本稿ではPerTouchと呼ばれる拡散型画像修正フレームワークを提案する。
本手法は,グローバルな美学を維持しつつ,セマンティックレベルのイメージリタッチをサポートする。
我々は,強力なユーザ命令と弱いユーザ命令の両方を扱えるVLMエージェントを開発した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:39:15 GMT)
SciAgent: A Unified Multi-Agent System for Generalistic Scientific Reasoning [54.2] SciAgentは、一般的な科学的推論のために設計された統合マルチエージェントシステムである。
コーディネータエージェントは、各問題のドメインと複雑性を解釈し、特別なWorker Systemsを動的にオーケストレーションします。
これらの労働者システムは、記号推論、概念モデリング、数値計算、検証のための相互作用的推論サブエージェントで構成されている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:32:09 GMT)
VVS: Accelerating Speculative Decoding for Visual Autoregressive Generation via Partial Verification Skipping [52.6] 投機的復号法(SD)は視覚ARモデルの高速化に有効であることが証明されている。
部分的検証スキップによる視覚AR生成を高速化する新しいフレームワークVVSを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:50:58 GMT)
AutoSAGE: Input-Aware CUDA Scheduling for Sparse GNN Aggregation (SpMM/SDDMM) and CSR Attention [52.2] AutoSAGEは入力ごとにタイリングとマッピングを選択するインプット対応スケジューラである。
Reddit OGBN-Productsでは、カーネルレベルの最大4.7倍のスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:25:51 GMT)
Departures: Distributional Transport for Single-Cell Perturbation Prediction with Neural Schrödinger Bridges [51.8] 遺伝子機能解析における大きなボトルネックは、単細胞データの未成熟の性質である。
我々は、SB(Schrdinger Bridge)を近似して、単セル摂動データに対処する。
本モデルは,異種単一セル応答を効果的に捉え,最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:27:13 GMT)
MGCA-Net: Multi-Grained Category-Aware Network for Open-Vocabulary Temporal Action Localization [51.6] OV-TALは、ビデオ内の任意のアクションカテゴリのインスタンスを認識し、ローカライズすることを目的として、すべてのカテゴリのトレーニングデータを明示的にキュレートする。
既存の方法は、主に単一の粒度のアクションカテゴリを認識し、ベースと新規の両方のアクションカテゴリの認識精度を低下させる。
本稿では、ローカライザ、アクション存在予測器、従来の分類器、粗大な分類器からなる多機能カテゴリー認識ネットワーク(MGCA-Net)を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:40:02 GMT)
FuseSampleAgg: Fused Neighbor Sampling and Aggregation for Mini-batch GNNs [51.6] FuseSampleAggは、隣人の平均アグリゲーションをGraphSAGEの1つのパスにフューズし、サンプリングする。
Operatorは決定論的であり、標準のPyTorchと統合され、CSVログからすべてのテーブルとフィギュアを再現するスクリプトが同梱されている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:57:18 GMT)
On the Gradient Complexity of Private Optimization with Private Oracles [51.0] 我々は,リプシッツ損失の個人的経験的/人口的リスクの1次オラクルクエリーの観点から,ランニング時間について検討した。
予測ランニングタイム$(minfracsqrtd2, fracdlog(1/))$は、$dgeq 1/2$のときの次元の問題に対して$$$過剰なリスクを達成するために必要であることを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:58:11 GMT)
Self-Correction Distillation for Structured Data Question Answering [51.0] 小型言語モデル(LLM)は、構造化クエリの生成時にエラーを起こしやすい。
小型LCMの構造データQA能力を向上させるための自己補正蒸留(SCD)法を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:08:41 GMT)
CloseUpShot: Close-up Novel View Synthesis from Sparse-views via Point-conditioned Diffusion Model [50.9] 3Dシーンを再構築し、スパースインプットビューから新しいビューを合成することは、非常に難しい作業である。
ビデオ拡散モデルの最近の進歩は、強い時間的推論能力を示している。
点条件付きビデオ拡散によるスパース入力からのクローズアップ新規ビュー合成のための拡散に基づくフレームワークであるCloseUpShotを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:20:06 GMT)
PIGEON: VLM-Driven Object Navigation via Points of Interest Selection [50.8] 視覚言語モデル(VLM)を用いたオブジェクトナビゲーションのための興味あるガイド探索点PIGEONを提案する。
我々は、PIGEON-VLと呼ばれる大規模な視覚言語モデル(VLM)を用いて、探索中に形成された関心のポイント(PoI)を選択し、次に低レベルのプランナーを用いて行動出力を行い、決定頻度を増大させる。
従来のオブジェクトナビゲーションベンチマークの実験では、我々のゼロショット転送方式は最先端のパフォーマンスを達成する一方、RLVRはモデルのセマンティックガイダンス機能をさらに強化し、リアルタイムナビゲーションにおける深い推論を可能にしている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:19:13 GMT)
Semantic Prioritization in Visual Counterfactual Explanations with Weighted Segmentation and Auto-Adaptive Region Selection [50.7] 本研究は,自動適応候補編集ネットワーク(WSAE-Net)を用いた重み付きセマンティックマップ(Weighted Semantic Map)という,革新的な手法を提案する。
重み付きセマンティックマップの生成は、計算される必要のある非意味的特徴単位の削減を最大化するように設計されている。
自動適応型候補編集シーケンスは、処理すべき特徴ユニット間の最適な計算順序を決定するように設計されている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:34:10 GMT)
CASL: Curvature-Augmented Self-supervised Learning for 3D Anomaly Detection [49.7] 本稿では,再編成パラダイムに基づくCASL(Curvature-Augmented Self-supervised Learning)フレームワークを提案する。
提案手法では,各点の空間座標を予測するためにデコーダを誘導するマルチスケール曲率プロンプトを導入する。
単純な異常分類の微調整により、先導的な検出性能を実現する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:58:09 GMT)
CalibrateMix: Guided-Mixup Calibration of Image Semi-Supervised Models [49.6] CalibrateMixは、SSLモデルのキャリブレーションを改善することを目的とした、ミックスアップベースのアプローチである。
提案手法は,既存のSSL手法と比較して,期待校正誤差(ECE)の低減と精度の向上を実現している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:43:53 GMT)
Fine-Tuned LLMs Know They Don't Know: A Parameter-Efficient Approach to Recovering Honesty [48.6] 大規模言語モデル(LLM)は、高い領域での安全なデプロイメントにおいてますます重要になっている。
既存のリカバリ手法はデータ集約的なグローバルパラメータ調整に依存しており、SFTがモデルの知識境界を認識する能力を深く損なうことを暗黙的に仮定している。
我々は,この抑制された能力を外科的に修復するために,Honesty-Critical Neurons Restoration (HCNR)を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:30:48 GMT)
Uncovering and Mitigating Transient Blindness in Multimodal Model Editing [48.1] マルチモーダルモデル編集は、マルチモーダルモデルにおける誤った知識の修正を目的としている。
テキストモデル編集から適応した既存の評価手法は、低相似性やランダムな入力に依存してオーバステートを成功させる。
本稿では,ランダム画像の局所性,非画像の局所性,一貫した局所性という3つの重要な側面を網羅した包括的局所性評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:04:33 GMT)
Can World Simulators Reason? Gen-ViRe: A Generative Visual Reasoning Benchmark [48.0] ビデオ生成モデルは、Chain-of-Frames (CoF)推論を通じて、潜在的な世界シミュレータとして登場した。
既存のベンチマークは、忠実さやアライメントに重点を置いており、CoFの推論を評価していない。
我々は,認知科学と実世界のAI応用を基盤としたフレームワークであるGen-ViReを紹介する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:11:39 GMT)
Systematic evaluation of time-frequency features for binaural sound source localization [47.2] 本研究は,多種多様な条件における特徴選択がモデル性能に与える影響に焦点を当てた。
本稿では,振幅に基づく様々な特徴の組み合わせを用いた畳み込みニューラルネットワーク(CNN)モデルの性能について検討する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:25:49 GMT)
Emergent Convergence in Multi-Agent LLM Annotation [46.7] 大規模言語モデル(LLM)はますます協調的な設定でデプロイされているが、ブラックボックスエージェントとして扱われる際のコーディネートについてはほとんど分かっていない。
我々は、7500個のマルチエージェント、複数ラウンドの議論をインダクティブコーディングタスクでシミュレートし、最終アノテーションと対話履歴の両方をキャプチャする125,000以上の発話を生成する。
コーディネーションのダイナミクスを追跡するために、コードの安定性、セマンティックな自己整合性、感情と収束の度合いを伴う語彙的信頼といったプロセスレベルのメトリクスを導入します。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:42:56 GMT)
Segment Anything Across Shots: A Method and Benchmark [46.4] 本研究は,マルチショット半教師付きビデオオブジェクトセグメンテーション(MVOS)に焦点をあて,複数のショットでビデオ全体を通して初期マスクで示される対象オブジェクトをセグメンテーションすることを目的とする。
単発データを用いたクロスショット一般化を可能にするデータ拡張戦略(TMA)の移行を提案する。
MVOSにおける評価と今後の研究を支援するために,高密度マスクアノテーション,多種多様なオブジェクトカテゴリ,高周波トランジションを備えた新しいMVOSベンチマークであるCut-VOSを紹介する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:58:40 GMT)
Edge-aware baselines for ogbn-proteins in PyTorch Geometric: species-wise normalization, post-hoc calibration, and cost-accuracy trade-offs [45.9] PyTorch Geometric におけるogbnタンパク質の再現可能なエッジ認識ベースラインを提案する。
最強のベースラインは、和ベースのエッジ・ツー・ノード機能を備えたGraphSAGEです。
レーベルごとの温度スケーリングとラベルごとの閾値は、AUCの変更を無視して、マイクロF1と期待キャリブレーション誤差(ECE)を大幅に改善する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:09:46 GMT)
ArtiWorld: LLM-Driven Articulation of 3D Objects in Scenes [45.4] ArtiWorldは、テキストシーン記述から候補のアーティキュラブルオブジェクトをローカライズする、シーン認識パイプラインである。
このパイプラインのコアとなるArti4URDFは、3Dポイントクラウドと大規模言語モデルの事前知識を活用している。
ArtiWorldを3つのレベル(3Dシミュレーションオブジェクト、フル3Dシミュレーションシーン、実世界のスキャンシーン)で評価する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:59:21 GMT)
SLMQuant:Benchmarking Small Language Model Quantization for Practical Deployment [45.2] SLMQuantは,Small Language Models (SLM) に適用した場合に圧縮技術を評価するための最初の体系的ベンチマークである。
我々は,SLM上での最先端量子化手法の動作を解析する。
有効なSLM量子化を規定する重要な要因を特定し,SLM調整圧縮のための実用的な設計原理を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:20:33 GMT)
FDP: A Frequency-Decomposition Preprocessing Pipeline for Unsupervised Anomaly Detection in Brain MRI [44.5] 我々は脳MRIのための教師なし異常検出(UAD)アプローチを開発した。
病的シグネチャの最初の系統的周波数領域解析を行う。
周波数分割前処理(FDP)フレームワークは,周波数領域再構成を同時に行うことで,病態の抑制と解剖学的保存を同時に行うことができることを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:40:14 GMT)
Low-Level Dataset Distillation for Medical Image Enhancement [44.2] 医用画像強調のための第1級低レベルデータセット蒸留法を提案する。
まず、患者間で解剖学的類似性を利用して、共有解剖学的先行性を構築する。
この前者は、Structure-Preserving Personalized Generation (SPG)モジュールを使用して各患者にパーソナライズされる。
低レベルの異なるタスクに対して、蒸留されたデータはタスク固有の高品質と低品質のトレーニングペアを構築するために使用される。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:05:07 GMT)
Text Annotation via Inductive Coding: Comparing Human Experts to LLMs in Qualitative Data Analysis [44.1] この研究は、6つのオープンソースの大規模言語モデル(LLM)の性能を、人間の専門家と比較して評価する。
人間のコーダーは、複雑な文をラベル付けするときに常にうまく機能するが、単純な文では苦労するが、LSMは反対の傾向を示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:03:27 GMT)
Cog-RAG: Cognitive-Inspired Dual-Hypergraph with Theme Alignment Retrieval-Augmented Generation [43.7] 本稿では,テーマ・アライン・デュアルハイパグラフRAGフレームワークを提案する。テーマ・アライン・デュアルハイパグラフ(Cog-RAG)は,テーマ・ハイパーグラフを用いて,チャンク間セマンティック構造とエンティティ・ハイパーグラフをキャプチャし,高階意味関係をモデル化する。
実験の結果,Cog-RAGは既存の最先端のベースラインアプローチを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:10:33 GMT)
SAINT: Service-level Integration Test Generation with Program Analysis and LLM-based Agents [43.3] SAINTは、エンタープライズJavaアプリケーションのサービスレベルのテストのための、新しいホワイトボックステストアプローチである。
SAINTは静的解析、大規模言語モデル(LLM)、LLMベースのエージェントを組み合わせて、エンドポイントとシナリオベースのテストを自動的に生成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:29:42 GMT)
ICLR: Inter-Chrominance and Luminance Interaction for Natural Color Restoration in Low-Light Image Enhancement [43.1] 低照度画像強調(LLIE)タスクは、低照度で撮影された画像の詳細とテクスチャを復元しながらコントラストを改善することを目的としている。
HVI色空間は、色と輝度の正確な分離を可能にすることで、このタスクにおいて大きな進歩を遂げた。
本稿では,Dual-stream Interaction Enhancement Module (DIEM)とCovariance Correction Loss (CCL)を含むICLR(Inter-Chrominance and Luminance Interaction)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:12:46 GMT)
TiViBench: Benchmarking Think-in-Video Reasoning for Video Generative Models [42.8] TiViBench(TiViBench)は、画像対ビデオ(I2V)生成モデルの推論能力を評価するために設計された階層型ベンチマークである。
我々は、好みの最適化にインスパイアされた、シンプルで効果的なテストタイム戦略であるVideoTPOを紹介する。
TiViBenchとVideoTPOは共に、ビデオ生成モデルにおける推論の評価と進歩の道を開いた。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:52:44 GMT)
FusionFM: All-in-One Multi-Modal Image Fusion with Flow Matching [42.2] 我々は、画像融合をソースモーダルから融合画像分布への直接確率的輸送として定式化する。
タスク毎に最も信頼性の高い擬似ラベルを選択するためにタスク認識選択関数を用いる。
マルチタスクシナリオでは、弾力的な重み強化と経験的再生機構を統合し、クロスタスク性能を維持する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:56:48 GMT)
Scaling Generative Verifiers For Natural Language Mathematical Proof Verification And Selection [42.2] 大規模言語モデルは、最終解答問題において顕著な成功を収めた。
しかし、これらのソリューションの根底にある理由はしばしば欠陥がある。
モデル性能のより信頼性の高い尺度を得るために,証明ベースと最終回答推論の両方を評価した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:25:35 GMT)
TabFlash: Efficient Table Understanding with Progressive Question Conditioning and Token Focusing [42.2] 我々は、テーブル理解を改善するために、情報的かつコンパクトな視覚的特徴を生成することを目指している。
まず,視覚変換器層に問合せを注入する問合せ条件を提案する。
冗長性を低減するため,背景トークンを破棄し,効率を向上するプルーニング戦略を導入する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:00:23 GMT)
ParallelKittens: Systematic and Practical Simplification of Multi-GPU AI Kernels [40.9] 既存のシステムは、計算通信の重複によってこれを緩和するが、しばしばワークロードと新しいアクセラレータ間の理論的帯域幅を満たさない。
演算子固有のテクニックの代わりに、簡単な再利用可能な原則の小さなセットが、ワークロードの最適なパフォーマンスを導くことができるかどうかを問う。
PKKittens(PK)カーネルは、最大2.33倍の並列ワークロードを実現する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:48:33 GMT)
Auditing Google's AI Overviews and Featured Snippets: A Case Study on Baby Care and Pregnancy [40.7] Google Search、AI Overviews(AIO)やFeatured Snippets(FS)などの機能を通じてAI生成コンテンツのサーフェスを強化
本稿では, 実際の乳児ケアと妊娠関連クエリの体系的アルゴリズム監査により, これらの情報表示の品質と一貫性を評価する。
その結果, AIO と FS の情報を同一検索結果ページ上に表示した場合, 33% のケースで相互に一致しない情報一貫性の欠如が明らかとなった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:16:36 GMT)
Uni-Hand: Universal Hand Motion Forecasting in Egocentric Views [40.4] EgoLocと呼ばれる新しいゼロショットアプローチを提案し、エゴセントリックなビデオで手動接触と切り離しタイムスタンプをローカライズする。
EgoLocは、視覚言語モデルを利用して、コンタクト/セパレーション属性を特定し、特定のタイムスタンプをローカライズし、さらなる改善のためにクローズドループフィードバックを提供する。
エゴセントリックな視覚とロボット操作タスクにおいて、複数の下流の応用を効果的に促進することが検証されている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:14:13 GMT)
Can You Learn to See Without Images? Procedural Warm-Up for Vision Transformers [40.2] 形式文法のような単純なアルゴリズムでデータを生成するので、結果は自然画像と合成画像のどちらとも関係がない。
我々は、この手続き的に生成されたデータを用いて、視覚パッチの埋め込み機構をバイパスするウォームアップフェーズでViTを事前訓練する。
標準的なイメージベースのトレーニングに続いて、このウォームアップはデータ効率、収束速度、下流のパフォーマンスを大幅に改善する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 22:00:59 GMT)
FGNet: Leveraging Feature-Guided Attention to Refine SAM2 for 3D EM Neuron Segmentation [40.2] 本稿では,Segment Anything 2 (SAM2) から EM ドメインへの知識伝達を効果的に行う新しいフレームワークを提案する。
ドメインギャップを埋めるために、SAM2のセマンティックキューを利用して軽量エンコーダをガイドするFeature-Guided Attentionモジュールを導入します。
本手法は,SAM2重みを凍結したSOTA(State-of-the-art)手法に匹敵する性能を実現する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:11:07 GMT)
Recurrent Autoregressive Diffusion: Global Memory Meets Local Attention [40.1] 本稿では,メモリ更新と検索のためのフレームワイズ自動回帰を行う,新しい自己回帰拡散(RAD)フレームワークを提案する。
メモリとMinecraftデータセットの実験は、長時間のビデオ生成におけるRADの優位性を実証している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:47:12 GMT)
T2I-Based Physical-World Appearance Attack against Traffic Sign Recognition Systems in Autonomous Driving [40.1] 交通信号認識(TSR)システムは、自律運転(AD)システムにおいて重要な役割を果たす。
最近の研究は、その脆弱性を物理世界の敵対的外見攻撃に暴露している。
我々は、新しいT2Iベースの外観攻撃フレームワークであるDiffSignを紹介する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:29:55 GMT)
Ghost in the Transformer: Tracing LLM Lineage with SVD-Fingerprint [40.1] 大規模言語モデル(LLM)は急速に進歩し、様々な分野に広く採用されている。
多くの開発者は、既存のオープンソースモデルを微調整するか修正するかを選択する。
公的なモデルから明らかに派生したものの、オリジナルのトレーニングを誤って主張する者もいる。
これにより知的財産権保護への懸念が高まっている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:20:58 GMT)
Single Tensor Cell Segmentation using Scalar Field Representations [39.9] 我々は,画像領域上の連続スカラー場を学習し,そのセグメンテーションが画像に存在するセルに対してロバストなインスタンスを生成する。
文献からの公開データセットに競合する結果を提示し、我々の新しい、単純かつ幾何学的に洞察に富んだアプローチが優れたセルセグメンテーション結果を得ることができることを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 22:05:56 GMT)
Case study of a differentiable heterogeneous multiphysics solver for a nuclear fusion application [39.7] 本研究は核融合領域からの異種多物理分解器のケーススタディを示す。
マクロスケールでは、JAXの自己微分可能なODEソルバが圧縮Zピンチのパルスパワー回路とバルクプラズマパラメータの進化を計算する。
ODEソルバは, ルートフィリングによって得られるプラズマ負荷のインピーダンスを各タイミングで遮断する必要があり, 勾配に基づくニュートン反復法を用いて効率よく解くことができる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:23:16 GMT)
VLMs Guided Interpretable Decision Making for Autonomous Driving [39.3] 我々は、高度な意思決定タスクにおいて、最先端のオープンソースビジョン言語モデル(VLM)を評価する。
本稿では,VLMの役割を直接決定ジェネレータからセマンティックエンハンサーへシフトさせるアプローチを提案する。
提案手法は,VLMを信頼性・解釈可能なADシステムに統合する上で有望な方向を提供することにより,最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:57:51 GMT)
Agent-Oriented Visual Programming for the Web of Things [39.2] マルチエージェント指向ビジュアルプログラミングのアプローチを紹介し,議論する。
これは、プログラミングの経験がなく、特定のターゲットドメインの知識を持って、自律的なソフトウェアを設計(再設定)することを目的としています。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:06:00 GMT)
Person-AI Bidirectional Fit - A Proof-Of-Concept Case Study Of Augmented Human-Ai Symbiosis In Management Decision-Making Process [39.1] 本稿では,人間の意思決定者と人工知能システムの間にある,継続的に進化し,文脈に敏感なアライメントを主認識するペルソナAIの双方向適合の概念を発展させる。
本研究は,シニアAIリーダの実際の採用プロセスを含む概念実証ケーススタディを通じて,経営決定におけるP-AIの役割について検討した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:22:30 GMT)
MedGEN-Bench: Contextually entangled benchmark for open-ended multimodal medical generation [38.9] 我々は,医療用AI研究の進展を目的とした総合的マルチモーダルベンチマークであるtextscMedGEN-Benchを紹介する。
MedGEN-Benchは、6つの画像モダリティ、16の臨床的タスク、28のサブタスクにまたがる6,422のエキスパート検証済み画像テキストペアからなる。
我々は,画素レベルのメトリクス,意味的テキスト分析,専門家が指導する臨床関連度スコアなどを統合した3段階評価フレームワークを新たに導入した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:41:56 GMT)
SOMA: Feature Gradient Enhanced Affine-Flow Matching for SAR-Optical Registration [38.5] 本稿では,構造的勾配を深い特徴に統合し,ハイブリッドマッチング戦略によりアライメントを改良する密度の高い登録フレームワークを提案する。
実験の結果、SOMAは登録精度を大幅に改善し、CMR@1pxはSEN1-2データセットで12.29%、GFGE_SOデータセットで18.50%増加した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:14:56 GMT)
Zipf-Gramming: Scaling Byte N-Grams Up to Production Sized Malware Corpora [38.3] 新しいトップkのn-gram抽出器は、以前のベストな代替品よりも35倍速い。
新しいZipf-Grammingアルゴリズムを使用して、プロダクショントレーニングセットをスケールアップし、新しいマルウェアを検出するためのAUCを最大30%改善することができる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:46:23 GMT)
Is your VLM Sky-Ready? A Comprehensive Spatial Intelligence Benchmark for UAV Navigation [38.2] VLM(Vision-Language Models)はその強力な視覚認識と推論能力を活用し、無人航空機(UAV)のタスクに広く応用されている。
しかし、UAVシナリオにおける既存のVLMの空間的知能能力は、まだほとんど解明されていない。
本稿では,UAVナビゲーションにおけるVLMの空間的インテリジェンス能力を評価するためのベンチマークであるSpatialSky-Benchを紹介する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:39:20 GMT)
Building Egocentric Procedural AI Assistant: Methods, Benchmarks, and Challenges [36.8] 本稿では,ego-centric Procedural AI Assistant(EgoProceAssist)の概念を紹介した。
これらのタスクは、新しい分類学におけるEgoProceAssistの本質的な機能を定義する。
提案するEgoProceAssistと既存のVLMベースのAIアシスタントとのギャップを明らかにするため,新しい実験を導入し,代表的VLMベースの手法の包括的評価を行う。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:21:42 GMT)
From Perception to Reasoning: Deep Thinking Empowers Multimodal Large Language Models [36.5] CoT(Chain-of-Thought)推論は、推論の透明性と出力の解釈可能性を高めることによって、言語モデルにおいて有意な効果を示した。
本稿では,Multimodal Chain-of-Thought(MCoT)を中心にしたシステムレビューを行う。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 01:22:37 GMT)
Part-X-MLLM: Part-aware 3D Multimodal Large Language Model [35.8] Part-X-MLLMは、ネイティブな3Dマルチモーダルな大規模言語モデルである。
構造化された実行可能な文法でプログラムとして定式化することで、多様な3Dタスクを統一する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:59:52 GMT)
TR-Gaussians: High-fidelity Real-time Rendering of Planar Transmission and Reflection with 3D Gaussian Splatting [35.3] TR-ガウスアン(TR-Gaussian)は、平面透過と反射の高忠実性レンダリングのための新しい3D-ガウス表現である。
異なるデータセットの実験では、TR-ガウスアンがリアルタイムで高忠実な新奇なビュー合成を実現することが示されている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:09:21 GMT)
Are Graph Transformers Necessary? Efficient Long-Range Message Passing with Fractal Nodes in MPNNs [34.8] 実世界のネットワークで観測されるフラクタル構造から着想を得たフラクタルノードという新しい概念を提案する。
フラクタルノードは、直接のショートカット接続を提供することにより、オーバースカッシング問題を緩和することを示す。
実験の結果,MPNNの表現能力は向上し,グラフ変換器の性能も向上した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:11:52 GMT)
Parametric Expensive Multi-Objective Optimization via Generative Solution Modeling [34.3] 本稿では,この逆モデルについて,獲得駆動探索モデルと生成モデルとの交互に学習した最初のパラメトリック多目的ベイズモデルを提案する。
我々はタスク対応ガウス過程を通じてタスク間シナジーを活用することにより、より高速な収束を理論的に正当化する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:24:12 GMT)
DAP: A Discrete-token Autoregressive Planner for Autonomous Driving [34.3] 本稿では,BEVのセマンティクスとエゴの軌跡を共同で予測する離散的な自己回帰プランナであるDAPを紹介する。
我々は、報酬誘導改善を注入しながら、教師付き行動クローンを保存できる強化学習に基づく微調整を取り入れた。
DAPは、オープンループメトリクスの最先端のパフォーマンスを達成し、NAVSIMベンチマークで競合するクローズループ結果を提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:31:33 GMT)
Finding Kissing Numbers with Game-theoretic Reinforcement Learning [34.0] 我々は,高次元空間を効率的に探索するゲーム理論強化学習システムであるPackingStarを訓練する。
PackingStarは以前の設定を再現し、25から31の次元から既知のすべてのレコードを上回ります。
14次元やその他の次元で6000以上の新しい構造が発見された。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:02:00 GMT)
Incoherent Beliefs & Inconsistent Actions in Large Language Models [33.5] 現実世界のタスクや環境は、大きな言語モデル(LLM)が一般的に評価される静的データセットとは異なる。
LLMのパフォーマンスの2つの重要な要素について検討する: LLMが彼らの信念を一貫性を持って更新する能力と、彼らが取っている行動がそれらの信念と整合している範囲である。
本結果は,複雑な実世界の環境下でのLCMの挙動を予測することの難しさを浮き彫りにする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:04:00 GMT)
Towards High-Consistency Embodied World Model with Multi-View Trajectory Videos [33.5] 身体的世界モデルは、視覚的な観察と行動を通じて物理的世界と予測し、相互作用することを目的としている。
MTV-Worldは正確なビジュモータ予測のためのマルチビュートラジェクトリ・ビデオ制御を導入した。
MTV-Worldは、複雑なデュアルアームシナリオにおける正確な制御実行と正確な物理的相互作用モデリングを実現する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:17:04 GMT)
FoleyBench: A Benchmark For Video-to-Audio Models [33.0] ビデオオーディオ生成(V2A)は、映画ポストプロダクション、AR/VR、サウンドデザインなどの領域において重要性が増している。
FoleyBenchは、FoleyスタイルのV2A評価のために明示的に設計された最初の大規模ベンチマークである。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:34:59 GMT)
RAC-DMVC: Reliability-Aware Contrastive Deep Multi-View Clustering under Multi-Source Noise [33.0] マルチビュークラスタリング(MVC)は、マルチビューデータを教師なしの方法で別々のクラスタに分離することを目的としている。
マルチソースノイズ下でのMVCは、ノイズや観測ノイズの欠如を含む、より困難な課題に対処する。
本稿では,ノイズの多い環境下での堅牢な表現学習を支援する信頼性グラフを構築するための,信頼度に配慮した深層多視点クラスタリング(RAC-DMVC)を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:28:12 GMT)
Data Value in the Age of Scaling: Understanding LLM Scaling Dynamics Under Real-Synthetic Data Mixtures [32.9] 大規模言語モデル(LLM)は、実データと合成データをブレンドするデータセット上に構築されている。
合成データはスケーラビリティとコスト効率を提供するが、しばしば系統的な分散の相違をもたらす。
本稿では,大規模データセットにスケールする効果的なデータ評価手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:53:12 GMT)
CorrectAD: A Self-Correcting Agentic System to Improve End-to-end Planning in Autonomous Driving [32.6] 我々はPM-Agentを導入し、データ要求を定式化し、障害ケースと同様のデータを集める。
次に、データ収集とアノテーションの両方をシミュレートできる生成モデルを使用します。
そこで本研究では,PM-Agentが要求する3Dアノテーションに沿った一貫したビデオを生成するDriveSoraを提案する。
これらのコンポーネントを自己修正エージェントであるSystem CorrectADに統合します。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:21:03 GMT)
Shedding Light on VLN Robustness: A Black-box Framework for Indoor Lighting-based Adversarial Attack [32.5] Indoor Lighting-based Adversarial Attack (ILA) は,ビジョン・アンド・ランゲージ・ナビゲーション(VLN)エージェントを妨害するために,グローバル照明を操作するブラックボックス・フレームワークである。
ILAは軌道効率を低下させながら失敗率を著しく向上させ、VLN剤の未認識の脆弱性を現実的な室内照明のバリエーションに明らかにした。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:39:29 GMT)
VocalBench-zh: Decomposing and Benchmarking the Speech Conversational Abilities in Mandarin Context [32.4] 本稿では,マンダリン文脈に適応した能力レベル分割評価スイートであるVocalBench-zhを提案する。
14の主流モデルに対する評価実験は、現在のルートに対する共通の課題を明らかにしている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:39:12 GMT)
Semantic Document Derendering: SVG Reconstruction via Vision-Language Modeling [32.2] SliDerは視覚言語モデルを用いてスライド画像をコンパクトかつ編集可能なSVG表現としてデレンダする新しいフレームワークである。
SliDerは0.069のLPIPSを復元し、最強のゼロショットVLMベースラインに比べて82.9%のケースでヒト評価者によって好まれる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:16:13 GMT)
The changing surface of the world's roads [32.1] 我々は,920万kmの幹線道路において,道路舗装と幅のグローバルな多時的データセットを作成した。
惑星スケールでは、舗装の変化率が国の発達軌道の堅牢なプロキシであることを示す。
全国規模では、未舗装道路が経済的接続の脆弱なバックボーンをどのように構成しているかを定量化する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:38:43 GMT)
Reasoning Shapes Alignment: Investigating Cultural Alignment in Large Reasoning Models with Cultural Norms [32.0] 本稿では,文化規範と整合する強力な推論能力をモデルに活用する,文化規範に基づく文化的アライメント(CNCA)フレームワークを提案する。
2つのアライメントパラダイムについて検討する: コンテキスト内アライメント法と微調整に基づく手法で、改良されたChain-of-Thoughtトレーニングデータを通じて規範を内部化する。
本研究は、文化的に情報を得たアライメント戦略により、推論モデルが多種多様な人間の価値をよりよく反映する可能性を強調した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:29:22 GMT)
CapeNext: Rethinking and refining dynamic support information for category-agnostic pose estimation [31.8] 本稿では,階層的相互モーダル相互作用とデュアルストリーム機能改善を融合した新しいフレームワークを提案する。
MP-100データセットの実験では、CapeNextは最先端のCAPEメソッドを大きなマージンで一貫して上回っている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:56:01 GMT)
Semi-Supervised High Dynamic Range Image Reconstructing via Bi-Level Uncertain Area Masking [31.4] 低ダイナミックレンジ(LDR)バーストからの高ダイナミックレンジ(GT)画像の再構成は、計算写真において重要な役割を果たす。
本研究は、教師モデルがGTのないLDRサンプルに対して擬似的なHDR GTを生成するという半教師付き学習の観点からこの問題に対処しようとするものである。
この障害を取り除くために, 疑似GTの信頼できない部分を画素レベルとパッチレベルの両方で破棄する不確実性に基づくマスキング法を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:46:58 GMT)
Mitigating Recommendation Biases via Group-Alignment and Global-Uniformity in Representation Learning [31.0] 協調フィルタリング(CF)は現代のレコメンデータシステムにおいて重要な役割を担っている。
CFベースの手法は、トレーニングデータの不均衡によってしばしばバイアスに遭遇する。
本稿では,表現分布の観点からバイアスを緩和する枠組みを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:42:29 GMT)
Yanyun-3: Enabling Cross-Platform Strategy Game Operation with Vision-Language Models [30.6] 本稿では,戦略ゲームにおける自律的クロスプラットフォーム操作を実現する汎用エージェントフレームワークYanyun-3を紹介する。
Qwen2.5-VLの視覚言語推論とUI-TARSの正確な実行能力を統合することで、Yanyun-3はコアタスクをうまく実行した。
静止画像(MV+S)を混合しながら、マルチイメージとビデオデータを融合するハイブリッド戦略が、フルフュージョンを大幅に上回ることがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:45:15 GMT)
The Quick Red Fox gets the best Data Driven Classroom Interviews: A manual for an interview app and its associated methodology [30.4] Data Driven Classroom Interviews (DDCIs) は、研究者がデジタル学習環境とのインタラクションをコンテキスト化できるようにする。
このマニュアルは、トリガーとインタビュー技術の開発に関わるプロセスのトレーニングを提供しながら、この技術を文書化する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:08:47 GMT)
Efficient Reinforcement Learning for Zero-Shot Coordination in Evolving Games [30.0] 人口ベーストレーニングは、ゼロショット調整性能が良いことが証明されている。
本稿では,効率的な学習フレームワークであるScaPT(Scalable Population Training)を提案する。
エージェント間でパラメータを選択的に共有することで、効率的に集団を実現するメタエージェントと、集団の多様性を保証する相互情報レギュレータとから構成される。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:48:54 GMT)
Distribution Matching Distillation Meets Reinforcement Learning [29.7] 本稿では,RL(Reinforcement Learning)技術と蒸留プロセスを組み合わせた新しいフレームワークDMDRを提案する。
数ステップのジェネレータのRLでは、MDD損失自体が従来のジェネレータよりも効果的な正規化であることを示す。
実験により、DMDRは目立った視覚的品質を達成でき、数ステップの手法間のコヒーレンスを促進でき、多ステップの教師を超えるパフォーマンスを発揮できることが示された。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:59:54 GMT)
A Unified Convergence Analysis for Semi-Decentralized Learning: Sampled-to-Sampled vs. Sampled-to-All Communication [29.7] 半分散化フェデレーション学習では、デバイスはデバイス間通信に依存するが、時には中央サーバと対話する。
その実用的重要性にもかかわらず、これらの2つの戦略の厳密な理論的および実証的な比較はいまだに残っていない。
我々は,キーシステムパラメータを考慮に入れた統合収束フレームワークにおいて,S2SとS2Aを解析する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:43:56 GMT)
WebCoach: Self-Evolving Web Agents with Cross-Session Memory Guidance [29.6] WebCoachはモデルに依存しない自己進化フレームワークで、Webブラウジングエージェントに永続的なクロスセッションメモリを提供する。
WebCoachは、新しいナビゲーショントラジェクトリから連続的にエピソードメモリをキュレートすることで、自己進化を実現する。
WebVoyagerベンチマークの評価は、WebCoachがブラウザ使用エージェントのパフォーマンスを一貫して改善していることを示している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:38:50 GMT)
Generalist Foundation Models Are Not Clinical Enough for Hospital Operations [29.5] 我々は、NYU Langone HealthのEHRsと627Bのトークンから80Bのクリニカルトークンを混合した専用コーパスで事前訓練されたモデル群であるLang1を紹介する。
実世界の環境でLang1を厳格に評価するために、668,331 EHRの指標であるRealistic Medical Evaluation (ReMedE)を開発した。
ラング1-1Bは70倍、0ショットモデルが671倍、AUROCが3.64%-6.75%、1.66%-23.6%向上した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:52:22 GMT)
Grounded by Experience: Generative Healthcare Prediction Augmented with Hierarchical Agentic Retrieval [29.4] 大規模言語モデル(LLM)は、豊富なパラメトリック知識に基づいて、医療の予測を強化するための有望な道を提供する。
LLMは、組み込み知識の信頼性とカバレッジに制限があるため、事実的不正確な傾向にある。
GHARは,医療におけるサブモジュール間の協調をいつ取得するか,どのように最適化するかを同時に解決する下線構造下線下線下線RAGフレームワークである。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:15:46 GMT)
Segmenting Collision Sound Sources in Egocentric Videos [29.1] 本研究の目的は、衝突音の原因となる物体を音声の視覚入力に分割することである。
孤立した音のイベントとは異なり、衝突音は2つの物体間の相互作用から生じ、衝突の音響的シグネチャは両方に依存する。
基礎モデル(CLIPとSAM2)を利用した音声条件セグメンテーションの弱教師付き手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:27:01 GMT)
Conditional Diffusion Model for Multi-Agent Dynamic Task Decomposition [28.2] 動的タスク分解のための条件拡散モデル(C$textDtext3$T)
サブタスクとコーディネーションパターンを自動的に推論するように設計された2階層型MARLフレームワーク。
エージェントは、割り当てられたサブタスク内で特別なスキルを共同で学び、共有する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:46:31 GMT)
CoS: Towards Optimal Event Scheduling via Chain-of-Scheduling [28.0] 本稿では,大規模言語モデル(LLM)のイベントスケジューリング機能を活性化するChain-of-Scheduling(CoS)フレームワークを提案する。
実験結果から,CoSは実世界の3つのデータセットに対して高い効率でほぼ理論的に最適であることがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:01:47 GMT)
GREAT: Generalizable Representation Enhancement via Auxiliary Transformations for Zero-Shot Environmental Prediction [27.3] 補助変換(GREAT)による一般化可能な表現の促進
GREATは、利用可能なデータセットを効果的に拡張し、完全に見えない地域での予測を改善するフレームワークである。
米国東部の6つの生態学的に多様な流域におけるGREATの有効性を実証する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:11:03 GMT)
MTP: Exploring Multimodal Urban Traffic Profiling with Modality Augmentation and Spectrum Fusion [26.9] 本稿では,都市交通プロファイリングのための新しいマルチモーダルフレームワーク MTP を提案する。
数値的、視覚的、テキスト的視点を通じてマルチモーダルな特徴を学習する。
6つの実世界のデータセットの実験は、最先端のアプローチよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 01:59:07 GMT)
DocSLM: A Small Vision-Language Model for Long Multimodal Document Understanding [26.8] LVLM(Large Vision-Language Models)は、長い複雑な文書に対して強力なマルチモーダル推論能力を示す。
本稿では,制約されたリソース下での長期文書理解のために設計された,効率的なスモールビジョン言語モデルDocSLMを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:52:48 GMT)
Efficient Calibration for Decision Making [26.8] HuとWu(FOCS'24)はこれを、キャリブレーション決定損失(mathsfCDL$)と呼ばれる近似キャリブレーション尺度を定義するために使用する。
我々は、$mathsfCDL_K$が情報理論および計算学的に抽出可能なときの包括的理論を開発する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:52:00 GMT)
Protein Secondary Structure Prediction Using 3D Graphs and Relation-Aware Message Passing Transformers [26.0] 本研究では,タンパク質一次配列から二次構造を予測するという課題に取り組む。
タンパク質残基グラフを用いて、空間情報の強化を図り、様々な形態の逐次的または構造的接続を導入する。
複数の畳み込み層を積み重ねて、タンパク質の空間グラフから組み合わせた洞察を効率的に学習する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:39:13 GMT)
Region-Point Joint Representation for Effective Trajectory Similarity Learning [25.7] textbfRePoは、textbfRegion-wiseと textbfPoint-wiseの機能をエンコードして、空間コンテキストと微細な移動パターンの両方をキャプチャする新しい方法である。
実験結果から、RePoはSOTAベースラインよりも22.2%の精度向上を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:28:18 GMT)
Birth of a Painting: Differentiable Brushstroke Reconstruction [25.6] 絵画は視覚的なストーリーテリングのユニークな形態を具現化しており、創造過程は最終作品と同じくらい重要である。
我々のアプローチはリアルでスタイリッシュな外観を生み出し、デジタル絵画の統一モデルを提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:55:53 GMT)
Dual-LoRA and Quality-Enhanced Pseudo Replay for Multimodal Continual Food Learning [25.4] 食品分析における既存の大規模マルチモーダルモデル(LMM)は、新しいタスクを学習する際に破滅的な忘れに苦しむ。
本稿では、Dual-LoRAアーキテクチャとQuality-Enhanced Pseudo Replayを統合した、マルチモーダル食品学習のための新しい連続学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:16:48 GMT)
VEIL: Jailbreaking Text-to-Video Models via Visual Exploitation from Implicit Language [25.4] テキスト・ツー・ビデオ(T2V)モデルに対する以前の攻撃は、通常、明らかに安全でないプロンプトに敵の摂動を追加する。
我々は、リッチで暗黙的な手がかりを含む良心的なプロンプトがT2Vモデルを誘導し、セマンティックなアンセーフなビデオを生成することを示した。
本稿では,モジュール型プロンプト設計により,T2Vモデルの相互関連パターンを活用するジェイルブレイクフレームワークVEILを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:31:43 GMT)
Hierarchical Prompt Learning for Image- and Text-Based Person Re-Identification [25.4] 人物再識別 (ReID) は、視覚的クエリ (image-to-image, I2I) とテキスト記述 (text-to-image, T2I) のいずれかを対象とする歩行者画像の検索を目的とする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:39:49 GMT)
Back to Basics: Let Denoising Generative Models Denoise [25.1] 本稿では,クリーンデータの予測とノイズ量の予測が根本的に異なることを示唆する。
画素上の大きなパッチ変換器は強力な生成モデルであることを示す。
256と512の解像度で、ImageNet上で16と32の大きなパッチサイズを持つJITを用いて、競合する結果を報告した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:59:57 GMT)
DeepSport: A Multimodal Large Language Model for Comprehensive Sports Video Reasoning via Agentic Reinforcement Learning [25.0] DeepSportは、マルチタスク、マルチスポーツビデオ理解のために設計された、エンドツーエンドでトレーニングされた最初のMLLMフレームワークである。
我々の研究は、多様なスポーツの複雑さに対処するために、ドメイン固有のビデオ推論のための新しい基盤を確立する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:57:15 GMT)
Scalable learning of macroscopic stochastic dynamics [25.0] マイクロシステムシミュレーションのみを用いて,大規模システムのマクロ力学を学習するフレームワークを提案する。
我々は、様々な空間拡張システムを通して、我々のフレームワークの精度と堅牢性を実証的に実証した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 00:11:06 GMT)
PFAvatar: Pose-Fusion 3D Personalized Avatar Reconstruction from Real-World Outfit-of-the-Day Photos [24.9] PFAvatarは、高品質な3DアバターをOOTD(Outfit of the Day)の写真から再構築する新しい方法だ。
提案手法はパーソナライズをわずか5分で完了し,従来の手法と比較して48$Times$の高速化を実現した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:40:43 GMT)
A Trajectory-free Crash Detection Framework with Generative Approach and Segment Map Diffusion [24.9] 個別の交通動態データを記録した道路セグメントマップは、直接クラッシュ検出に供された。
有理な将来の道路セグメントマップを生成するために, 新たな2段階無軌道事故検出フレームワークが導入された。
実世界の衝突実験は、事故を正確に検出する2段階法の有効性を示している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:50:00 GMT)
Spark-Prover-X1: Formal Theorem Proving Through Diverse Data Training [24.7] Spark-Prover-X1は、3段階のフレームワークを用いてトレーニングされた7Bパラメータモデルで、中等サイズのLCMの推論可能性を解き放つ。
重要なイノベーションは、きめ細かい推論を達成するための"CoT拡張状態予測"タスクである。
また、402のフォーマルな問題のベンチマークデータセットであるExamFormal-Benchを紹介します。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:44:02 GMT)
ActVAR: Activating Mixtures of Weights and Tokens for Efficient Visual Autoregressive Generation [24.6] 既存の静的プルーニングメソッドは、重みやトークンを永久に削除することでパフォーマンスを低下させる。
本稿では,モデル重みとトークンシーケンスにまたがって二重間隔を導入する動的アクティベーションフレームワークであるAct VARを提案する。
ImageNet $256times 256$ベンチマークの実験では、Act VARはパフォーマンスの低下を最小限に抑え、最大で21.2%のFLOPs削減を実現している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:28:06 GMT)
Towards Non-Stationary Time Series Forecasting with Temporal Stabilization and Frequency Differencing [24.6] 時系列はしばしば時間分布シフトやスペクトルの変動を含む非定常性を示す。
本稿では、時間領域と周波数領域の両方で非定常性に対処する二分岐フレームワークDTAFを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:04:56 GMT)
FreeAskWorld: An Interactive and Closed-Loop Simulator for Human-Centric Embodied AI [24.5] FreeAskWorldは対話型シミュレーションフレームワークで、大規模言語モデルを統合して、ハイレベルな振る舞い計画とセマンティックな基礎的なインタラクションを実現する。
我々のフレームワークはスケーラブルでリアルなヒューマンエージェントシミュレーションをサポートし、多様な実施タスクに適したモジュラーデータ生成パイプラインを含んでいる。
再構成環境,6種類のタスクタイプ,16のコアオブジェクトカテゴリ,63,429の注釈付きサンプルフレーム,17時間以上のインタラクションデータからなる大規模ベンチマークデータセットであるFreeAskWorldを公開・公開する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:58:46 GMT)
Multi-Agent Deep Research: Training Multi-Agent Systems with M-GRPO [24.5] 現在の訓練方法は、システム内のすべてのエージェントに対して統一された大きな言語モデルを訓練する。
これにより、異なるエージェントの基本的な分布が異なるため、パフォーマンスが制限される可能性がある。
垂直多エージェントシステムに対するグループ相対ポリシー最適化の階層的拡張であるM-GRPOを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:06:30 GMT)
Naga: Vedic Encoding for Deep State Space Models [24.4] Naga(ナガ)は、ヴェーダ数学の構造的概念にインスパイアされたディープ・ステート・スペース・モデル(SSM)の符号化手法である。
本研究では, ETTh1, ETTh2, ETTm1, ETTm2, 天気, 交通, ILIなど, 長期連続予測(LTSF)ベンチマークを用いて長の評価を行った。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:43:49 GMT)
Uncertainty-Calibrated Prediction of Randomly-Timed Biomarker Trajectories with Conformal Bands [24.3] 臨床データからバイオマーカー軌跡の不確実性判定のためのコンフォメーション手法を提案する。
提案手法は,非整合性スコアを用いたランダム時間軌道の設定に共形予測を拡張した。
アルツハイマー病の進行リスクの高い被験者を同定する上で, コンフォメーションバンドの臨床的有用性を示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:04:14 GMT)
Referring Camouflaged Object Detection With Multi-Context Overlapped Windows Cross-Attention [22.8] Referring camouflaged object detection (Ref-COD)は、画像やテキスト記述などの参照情報を組み込んで隠れた物体を識別することを目的としている。
本研究では,多言語融合による高精細画像特徴と擬似オブジェクト特徴の融合による性能向上手法を検討する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:08:50 GMT)
WinMamba: Multi-Scale Shifted Windows in State Space Model for 3D Object Detection [22.5] WinMambaは、WinMambaブロックを積み重ねた新しいMambaベースの3Dフィーチャエンコードバックボーンである。
堅牢なマルチスケール表現でバックボーンを強化するため、WinMambaブロックにはウィンドウスケール適応モジュールが組み込まれている。
KITTIとデータセットの実験は、WinMambaがベースラインを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:46:54 GMT)
Unsupervised Motion-Compensated Decomposition for Cardiac MRI Reconstruction via Neural Representation [22.3] MoCo-INRは、暗黙の神経表現(INR)と従来のモーション補償(MoCo)フレームワークを統合する、新しい教師なしの手法である。
明示的な運動モデリングとINRの連続的先行により、MoCo-INRは正確な心臓運動の分解と高品質なCMR再構成を実現できる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:14:44 GMT)
Explore and Establish Synergistic Effects Between Weight Pruning and Coreset Selection in Neural Network Training [22.1] 軽量プルーニングとコアセット選択は、計算効率を向上させるために提案される2つの新しいパラダイムである。
我々は,重み付けとコアセット選択を交互に行う同時重み付け機構(SWaST)を開発し,訓練における相乗効果を確立する。
実験ではプルーニングとコアセットの選択の間に様々なプルーンレートとコアセットサイズの間で強い相乗効果が示され、精度は最大で17.83%向上し、10%から90%のFLOPが減少する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:30:42 GMT)
DualTAP: A Dual-Task Adversarial Protector for Mobile MLLM Agents [21.9] 個人識別情報保護のためのDual-Task Adversarial Protector(DualTAP)を提案する(PII)。
DualTAPは2つの重要なイノベーションを使って軽量発電機を訓練する。
これにより、平均的なプライバシー漏洩率を31.6ポイント削減できる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:08:45 GMT)
Infinite-Story: A Training-Free Consistent Text-to-Image Generation [21.9] Infinite-Storyは、一貫したテキスト・ツー・イメージ(T2I)生成のためのトレーニング不要のフレームワークである。
本手法は, 整合性T2I生成における2つの重要な課題, 同一性不整合とスタイル不整合に対処する。
提案手法は,既存の高速なT2Iモデルよりも6倍高速な推論(画像1枚あたり1.72秒)を提供するとともに,最先端の生成性能を実現する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:46:16 GMT)
Near-optimal Linear Predictive Clustering in Non-separable Spaces via Mixed Integer Programming and Quadratic Pseudo-Boolean Reductions [21.8] 線形予測クラスタリング(LPC)は、特徴変数と対象変数の間の共有線形関係に基づいてサンプルを分割する。
LPCで一般的に使用されるグレディ最適化法はクラスタリングと線形回帰を交互に行うが、大域的最適性は欠いている。
この研究は、LPCのグローバル最適化の効率を改善する2つの新しいアプローチを導入するために、制約付き最適化パラダイムに基づいている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:13:44 GMT)
Functional Mean Flow in Hilbert Space [21.8] 無限次元ヒルベルト空間で定義される一段階生成モデルとして関数平均流(FMF)を提案する。
FMFは、関数型フローマッチングの理論的な定式化と、効率的なトレーニングとサンプリングのための実践的な実装を提供することにより、一段階の平均フローフレームワークを機能ドメインに拡張する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:38:28 GMT)
OTARo: Once Tuning for All Precisions toward Robust On-Device LLMs [21.6] OTARoはデバイス上の大規模言語モデルで量子化精度を柔軟に切り替えることができる新しい手法である。
すべての精度で一貫して強固で堅牢なパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:56:27 GMT)
SportR: A Benchmark for Multimodal Large Language Model Reasoning in Sports [21.4] SportRは、スポーツインテリジェンスに必要な基本的な理由に基づいてMLLMを訓練し、評価するために設計された最初のマルチスポーツ大規模ベンチマークである。
私たちのベンチマークでは,5,017枚の画像と2,101本のビデオのデータセットが提供されている。
罰則の決定や戦術の説明など,多段階の推論を必要とする最も先進的なタスクに対して,我々は7,118の高品質な人間による思考の連鎖(Chain of Thought)アノテーションを提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:11:19 GMT)
Beyond One-Size-Fits-All: Neural Networks for Differentially Private Tabular Data Synthesis [21.2] 本稿では,統計モデルのアルゴリズム設計をニューラルネットワークに組み込んだMargNetを提案する。
MargNetは適応的な辺縁選択戦略を適用し、ニューラルネットワークをトレーニングして、選択した辺縁に適合するデータを生成する。
さらに重要なのは、密集した相関データセットに基づいて、MargNetは新たな最先端技術を確立し、前回の最高値と比較してフィリティエラーを最大26%削減する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:33:34 GMT)
Seeing isn't Hearing: Benchmarking Vision Language Models at Interpreting Spectrograms [21.2] VLMが高度に訓練された音声学者として機能する程度をベンチマークする。
我々は、スタイリスティックな一貫したスペクトル図と波形図とともに、4k+の英単語を分離した新しいデータセットを合成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:41:07 GMT)
SoK: The Last Line of Defense: On Backdoor Defense Evaluation [21.1] バックドア攻撃は、悪意のある入力によってアクティベート可能な隠れた脆弱性を埋め込むことで、ディープラーニングモデルに重大な脅威をもたらす。
本研究は,総合的な文献レビューと実証的評価を通じて,バックドアディフェンスの系統的(メタ-)分析を行う。
私たちは2018年から2025年にかけて発行された183件のバックドア・ディフェンス・ペーパーを分析した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:51:18 GMT)
Extracting Events Like Code: A Multi-Agent Programming Framework for Zero-Shot Event Extraction [21.1] 本稿では,AEC(Agent-Event-Coder)について紹介する。
AECはZSEEを特別なサブタスク(検索、計画、コーディング、検証)に分解する。
5つの異なる領域と6つのLSMにわたる実験により、AECはゼロショットベースラインを一貫して上回っていることが示された。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:17:15 GMT)
SpectralAdapt: Semi-Supervised Domain Adaptation with Spectral Priors for Human-Centered Hyperspectral Image Reconstruction [21.0] ハイパースペクトルイメージングは、豊富なスペクトル情報のために医療にとって大きな可能性を秘めている。
しかし、HSIデータの取得は費用がかかり技術的に要求される。
一般と人中心のHSIデータセット間のドメインギャップを埋めるフレームワークであるSpectralAdaptを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:17:13 GMT)
Hint-Augmented Re-ranking: Efficient Product Search using LLM-Based Query Decomposition [21.0] LLMは,eコマースクエリにおいて最下位の意図を明らかにすることができることを示す。
提案手法では,クエリを検索と同時に生成した属性値ヒントに分解する。
本手法はMAPにおける検索効率を10.9ポイント改善し,ベースライン上のMRRにおいて5.9ポイントのランク付けを行う。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:53:25 GMT)
Concept Regions Matter: Benchmarking CLIP with a New Cluster-Importance Approach [20.9] クラスタベースの概念重要度(CCI)は、新しい解釈可能性手法である。
CCIは、忠実度ベンチマークの新たな最先端を定めている。
今回,18種類のCLIPの包括的評価を行った。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:01:24 GMT)
AtlasMorph: Learning conditional deformable templates for brain MRI [20.7] 本研究では,対象属性に条件付きテンプレートを出力する関数を学習する機械学習フレームワークを提案する。
提案手法は3次元脳MRIデータセットのコンピレーションに応用し, 個体群を代表する高品質なテンプレートを学習できることを実証する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:13:58 GMT)
RobustGait: Robustness Analysis for Appearance Based Gait Recognition [20.6] 本稿では、外見に基づく歩行認識システムのきめ細かい頑健性評価のためのフレームワークRobustGaitを提案する。
このベンチマークでは、CASIA-B、CCPG、SUSTech1Kの5つの重大レベルに15の汚職タイプを導入し、MEVIDの中間検証を行い、6つの最先端歩行システムを評価する。
RGBレベルでのノイズの適用は、現実世界の劣化を反映し、シルエット抽出によって下流歩行認識システムに歪みがどのように伝播するかを明らかにする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:12:06 GMT)
From Power to Precision: Learning Fine-grained Dexterity for Multi-fingered Robotic Hands [20.5] 人間の握力は、大まかに2つのタイプに分類できる。
今日のマルチフィンガーロボットハンドは、パワーグリップに効果があるが、精度を必要とするタスクでは、パラレルグリップが広く採用されている。
マルチフィンガーハンドの制御設計とハードウェア設計を共同で最適化することで,このギャップを埋める。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:56:50 GMT)
CoordAR: One-Reference 6D Pose Estimation of Novel Objects via Autoregressive Coordinate Map Generation [20.5] CoordARは、一参照6Dポーズ推定のための新しい自動回帰フレームワークである。
1) 離散化された3次元空間上での確率的予測を可能にする新しい座標マップのトークン化,2) RGBの外観と座標キューを別々に符号化するモダリティデカップリング符号化戦略,3) 両方の位置整列クエリ特徴に条件付き自己回帰変換器デコーダを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:15:46 GMT)
Hybrid-Domain Adaptative Representation Learning for Gaze Estimation [20.4] 本稿では,頑健な視線表現を学習するためのハイブリッドドメイン適応表現学習フレームワークを提案する。
高品質近眼画像から抽出した特徴をアライメントすることで、低品質の顔画像から視線関連表現を遠ざけることを提案する。
EyeDiap、MPIIFaceGaze、Gaze360データセットの実験は、我々のアプローチが最先端の精度を達成することを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:38:50 GMT)
Laplace Learning in Wasserstein Space [20.3] グラフに基づく半教師付き学習手法を考察するために,多様体仮説を仮定する。
特に、ワッサーシュタイン空間におけるラプラス学習について検討する。
離散グラフ p-ディリクレエネルギーの変分収束を連続体に対して証明する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:49:36 GMT)
Advanced Black-Box Tuning of Large Language Models with Limited API Calls [20.3] ブラックボックスチューニングは、より大きな言語モデル(LLM)を望ましい振る舞いに適応するための新たなパラダイムである。
限られたAPI呼び出しを持つLLMのための新しい高度なブラックボックスチューニング手法を提案する。
提案手法では,事前学習した言語モデルの精度を55.92%から86.85%に引き上げ,APIクエリの頻度を1.38%に削減する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:54:02 GMT)
Personalized Federated Learning with Bidirectional Communication Compression via One-Bit Random Sketching [20.0] フェデレートラーニング(FL)は、分散データ間の協調トレーニングを可能にする。
pFed1BSは,1ビットのランダムスケッチによる極端な通信圧縮を実現する,パーソナライズされたFLフレームワークである。
本フレームワークでは,クライアントが高度に圧縮された1ビットのスケッチを送信し,サーバが集約し,グローバルな1ビットのコンセンサスをブロードキャストする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:55:22 GMT)
Medal S: Spatio-Textual Prompt Model for Medical Segmentation [19.9] Medal Sは、エンドツーエンドのトレーニング可能なフレームワーク内で、ネイティブ解像度の空間プロンプトとテキストプロンプトをサポートする。
複数のネイティブ解像度マスクを並列に処理し、マルチクラスのセグメンテーション性能を向上させる。
軽量な3D畳み込みモジュールは、両方のプロンプト型によってガイドされる正確なボクセル空間の洗練を可能にする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:44:19 GMT)
Thermally Activated Dual-Modal Adversarial Clothing against AI Surveillance Systems [19.8] 敵パッチは、AI駆動監視システムに抵抗する一般的なプライバシー保護アプローチとして現れている。
本研究では,現実環境における適応性と有効性を確保するために,熱活性化型対向ウェアラブルを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:14:26 GMT)
Live-SWE-agent: Can Software Engineering Agents Self-Evolve on the Fly? [19.8] 大規模言語モデル(LLM)は、ソフトウェア工学を含むほぼすべての産業を再構築している。
我々は,実世界のソフトウェア問題を解決する際に,自律的かつ連続的に自己進化できる,初のライブソフトウェアエージェントであるLive-SWE-agentを提案する。
広範に研究されているSWE-bench Verifiedベンチマークでは,Live-SWE-agentがテスト時間スケーリングなしで75.4%の精度で解決できることが示されている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:58:18 GMT)
Alpha Divergence Losses for Biometric Verification [19.8] $$$-divergence loss関数は、CosFaceやArcFaceのようなマージンベースのSoftmax損失に代わる魅力的な代替手段を提供する。
本稿では,Q-MarginとA3Mの2つの新しいマージンベース$$-divergence損失について検討する。
本手法は,IJB-BとIJB-Cの顔評価ベンチマークにおいて,高い性能向上を実現している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:27:28 GMT)
CreBench: Human-Aligned Creativity Evaluation from Idea to Process to Product [19.6] 1)創造的アイデアからプロセスから製品までの複数の次元をカバーする評価ベンチマーク,2) 多様なソースを持つ2.2Kのマルチモーダルデータと79.2Kのヒューマンフィードバック,4.7Mのマルチタイプインストラクションからなるマルチモーダル創造性評価データセットであるCreMITを提案する。
CreBenchをベースとして、オープンソースの汎用MLLMを微調整し、マルチモーダルなクリエイティビティ評価エキスパートモデルであるCreExpertを実現した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:34:05 GMT)
Reinforcing Trustworthiness in Multimodal Emotional Support Systems [19.6] 感情的支援に対するマルチモーダルなアプローチは、多種多様なデータソースを統合することで、共感的、文脈的に関係のある応答を提供する。
我々は、ビデオ、オーディオ、テキストからのマルチモーダル埋め込みを活用し、感情的要素を予測し、専門的な治療基準に沿った応答を生成する新しいフレームワーク、textsc MultiMoodを紹介した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:26:54 GMT)
InterMoE: Individual-Specific 3D Human Interaction Generation via Dynamic Temporal-Selective MoE [18.9] 動的時間選択型エキスパート混合に基づく新しいフレームワークであるInterMoEを紹介する。
InterMoEは、高レベルのテキストセマンティクスと低レベルのモーションコンテキストの両方を使用して、時間的動作の特徴を専門の専門家にディスパッチする。
実験により、InterMoEは個人固有の高忠実度3次元ヒューマンインタラクション生成において最先端の性能を達成することが示された。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:26:10 GMT)
DS-ATGO: Dual-Stage Synergistic Learning via Forward Adaptive Threshold and Backward Gradient Optimization for Spiking Neural Networks [18.9] 脳にインスパイアされたスパイクニューラルネットワーク(SNN)は、効率的で低エネルギーのニューロモルフィックコンピューティングを実現するための有望な道として認識されている。
本稿では,前方適応しきい値と後方動的SGを実現する2段相乗学習アルゴリズムを提案する。
実験結果から,本手法は性能を著しく向上することが示された。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:54:21 GMT)
A Disentangled Low-Rank RNN Framework for Uncovering Neural Connectivity and Dynamics [18.9] Disentangled Recurrent Neural Network (DisRNN)は、潜在力学の集団的独立性を前提とした、生成的なlrRNNフレームワークである。
DisRNNは、低次元空間における学習されたニューラルネットワーク軌道の絡み合いと解釈性を一貫して改善する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:49:58 GMT)
Learning Quantized Continuous Controllers for Integer Hardware [18.7] 組み込みハードウェア上での継続的制御強化学習には、厳密なレイテンシと電力予算が必要である。
小さなFPGAはこれらを提供することができるが、高価な浮動小数点パイプラインが避けられる場合のみである。
本稿では,低ビットポリシーを自動的に選択し,Artix-7 FPGAに合成する学習型ハードウェアパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:47:04 GMT)
Larger Datasets Can Be Repeated More: A Theoretical Analysis of Multi-Epoch Scaling in Linear Regression [18.7] 本稿では,線形回帰学習における一般的な回避策,エポックトレーニング,リマプショントレーニングの理論的解析について述べる。
我々は、データセットが成長しなければならない乗算因子として定義するデータのテキスト有効再利用率である$E(K, N)$を用いてこれを定量化する。
以上の結果から,K$が$E(K, N)の近似値である最大$K$は,データサイズと分布に依存することが明らかとなった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:34:03 GMT)
Learning from the Undesirable: Robust Adaptation of Language Models without Forgetting [18.7] 言語モデル(LM)は、ダウンストリームタスクに特化するために、教師付き微調整(SFT)によって適応されることが多い。
微調整データに制限がある典型的なシナリオでは、SFTはLMを過度に適合させ、急激なパターンに依存する。
本研究では,SFT がデータ制限のある LM を微調整する際の問題を緩和するための,単純かつ効果的な正規化手法であるLfU を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:57:44 GMT)
Esim: EVM Bytecode Similarity Detection Based on Stable-Semantic Graph [18.4] 一般的なコードの再利用と、限られたオープンソースコントリビューションは、ブロックチェーンエコシステムに重大な課題をもたらしています。
従来のバイナリ類似性検出方法は典型的には命令ストリームや制御フローグラフに基づいている。
安定意味グラフ(SSG)と呼ばれる新しいEVMバイトコード表現を提案する。
異種グラフニューラルネットワークを用いた類似性検出のために,SSGを行列に埋め込んだプロトタイプEsimを実装した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:48:52 GMT)
Real-time prediction of breast cancer sites using deformation-aware graph neural network [18.4] 本研究では, 生検中の乳癌部位をリアルタイムで正確に予測できるグラフニューラルネットワーク(GNN)モデルを開発した。
このモデルをファントムと実際の患者データセットを用いて検証し,癌リンパ節変位の精度を0.2ミリメートル (mm) 以内で達成した。
提案した変形認識型GNNモデルは,乳房生検におけるリアルタイムな腫瘍変位予測に有望なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:32:28 GMT)
Towards 3D Object-Centric Feature Learning for Semantic Scene Completion [18.4] 視覚に基づく3Dセマンティックシーンコンプリート(SSC)は、自動運転の可能性から注目を集めている。
シーンを個々のオブジェクトインスタンスに分解するオブジェクト中心の予測フレームワークであるOceanを提案する。
その結果,Oceanは17.40点,mIoUスコアは20.28点であった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:28:26 GMT)
Dropouts in Confidence: Moral Uncertainty in Human-LLM Alignment [18.3] 人間は道徳的なジレンマに直面したとき、かなりの不確実性を示す。
近年の研究では、機械生成応答の自信過剰な傾向が確認されている。
この研究は、古典的なトロリー問題において、不確実性が道徳的決定にどのように影響するかを検討する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:13:15 GMT)
DGS-Net: Distillation-Guided Gradient Surgery for CLIP Fine-Tuning in AI-Generated Image Detection [18.1] 本稿では、タスク非関連コンポーネントを抑えつつ、転送可能な事前学習を保存できる新しいフレームワークを提案する。
50の生成モデルに対する実験により,本手法は平均マージン6.6で最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:05:31 GMT)
Personalized Federated Recommendation With Knowledge Guidance [18.1] FedRKG(Federated Recommendation with Knowledge Guidance)を提案する。
FedRKGはグローバルな知識を保存されたローカルな埋め込みに融合させ、シングル知識メモリフットプリント内の二重知識のパーソナライゼーションのメリットを得る。
ベンチマークデータセットの実験では、FedRKGが最先端の手法を大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:35:53 GMT)
Simple Lines, Big Ideas: Towards Interpretable Assessment of Human Creativity from Drawings [18.1] 図面からの自動的かつ解釈可能な創造性評価のためのデータ駆動型フレームワークを提案する。
これら2つの相補的な次元の関数として創造性のスコアを再解釈する。
本稿では,豊かなデータセットに基づいて,創造性のスコアを同時に予測し,コンテンツタイプを分類し,スタイリスティックな特徴を抽出するマルチモーダル・マルチタスク学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:16:01 GMT)
Preference-Based Learning in Audio Applications: A Systematic Analysis [17.8] 音声アプリケーションでは、嗜好学習が著しく過小評価されている。
この結果から,選好学習は音声に有望であることを示す一方で,標準化されたベンチマーク,高品質なデータセット,時間的要因が選好学習の枠組みにどう影響するかを体系的に調査する必要があることが示唆された。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:42:01 GMT)
RegionMarker: A Region-Triggered Semantic Watermarking Framework for Embedding-as-a-Service Copyright Protection [17.7] RegionMarkerは低次元空間内のトリガ領域を定義し、これらの領域に関連するテキスト埋め込みに透かしを注入する。
トリガ領域全体に透かしを埋め込んでテキストを埋め込むことで、RereaMarkerはパラフレージングとディメンションと摂動攻撃の両方に耐性がある。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:04:36 GMT)
H-CNN-ViT: A Hierarchical Gated Attention Multi-Branch Model for Bladder Cancer Recurrence Prediction [17.7] 膀胱癌再発予測に特化して設計された多系列多モードMRIデータセットについて紹介する。
次に,H-CNN-ViTを提案する。H-CNN-ViTは,グローバル (ViT) パスとローカル (CNN) パスからの特徴を選択的に重み付けできる階層的Gated Attention Multi-Branchモデルである。
我々のデータセットから評価すると、H-CNN-ViTは78.6%のAUCを達成し、最先端のモデルを上回っている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:39:22 GMT)
UNSEEN: Enhancing Dataset Pruning from a Generalization Perspective [17.6] 本稿では,既存のデータセットプルーニング手法に統合可能な,プラグアンドプレイフレームワークUNSEENを提案する。
我々はUNSEENを多段階シナリオに拡張し、様々なコアセットに基づいて訓練されたスコアリングモデルを用いて段階的選択手法を提案する。
提案手法は,CIFAR-10,CIFAR-100,ImageNet-1Kにおいて既存のSOTA法よりも優れていた。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:17:39 GMT)
RSPose: Ranking Based Losses for Human Pose Estimation [17.6] 提案した損失は一般的な熱マップ損失(MSE, KL-Divergence)よりも優れていることを示す。
私たちの損失は、信頼度スコアとローカライゼーション品質の相関を著しく増大させます。
我々の知る限りでは、人間のポーズ推定のための評価基準(mAP)に沿う損失を最初に提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:20:25 GMT)
DiffPixelFormer: Differential Pixel-Aware Transformer for RGB-D Indoor Scene Segmentation [17.6] RGB-D屋内シーンセグメンテーションのための差動画素対応変換器DiffPixelFormerを提案する。
イントラインターモーダル・インタラクション・ブロック(IIMIB)は、イントラモードの長距離依存関係をキャプチャする。
SUN RGB-D と NYUDv2 ベンチマークの実験では、DiffPixelFormer-L は 54.28% と 59.95% に達し、それぞれ DFormer-L を 1.78% と 2.75% で上回った。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:51:07 GMT)
Monocular 3D Lane Detection via Structure Uncertainty-Aware Network with Curve-Point Queries [17.5] MonoUncは、BEV(Bird's-eye view)のない3Dレーン検出器で、局所的な車線構造から得られるアレタリックな不確実性を明示的にモデル化する。
ONCE-3DLanesとOpenLaneデータセットの実験は、MonoUncが以前の最先端(SoTA)メソッドより優れていることを示した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:01:10 GMT)
Difficulty-Aware Label-Guided Denoising for Monocular 3D Object Detection [17.5] そこで本研究では,MonoDLGDを提案する。
MonoDLGDは、検出の不確実性に基づいて、地絡ラベルを適応的に摂動し、再構築する。
KITTIベンチマークの実験は、MonoDLGDがあらゆる難易度で最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:02:18 GMT)
Approximate Message Passing for Quantum State Tomography [17.2] 低ランク量子トモグラフィ(QST)におけるメッセージパッシング(AMP)の有効性を示す。
AMPは大規模システムに対して最適な性能保証を提供する。
我々の研究は低ランクQSTの状態を前進させ、他の量子トモグラフィープロトコルにも適用できるかもしれない。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 01:05:11 GMT)
Revisiting Data Scaling Law for Medical Segmentation [17.1] 本研究は,医学的解剖学的セグメンテーションの文脈におけるデータサイズとのスケーリング関係に焦点を当てた。
解剖学的セグメンテーションのスケーリング法則を15のセマンティックタスクと4つの画像モダリティで解析する。
解剖学的構造を共有する画像のトポロジカルアイソモーフィズムにより、変形誘導増強戦略の影響を評価した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:09:12 GMT)
LEMUR: Large scale End-to-end MUltimodal Recommendation [16.6] 生データからエンドツーエンドにトレーニングした,初の大規模マルチモーダルレコメンデーションシステムであるLEMURを提案する。
実世界の産業シナリオにおけるエンド・ツー・エンドのマルチモーダル・レコメンデーションの優位性を検証した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:54:07 GMT)
BootOOD: Self-Supervised Out-of-Distribution Detection via Synthetic Sample Exposure under Neural Collapse [16.5] アウト・オブ・ディストリビューション(OOD)検出は、画像分類器を安全に敏感な環境に配置するために重要である。
我々は,IDデータからのみブートストラップを行う,完全に自己管理されたOOD検出フレームワークであるBootOODを提案する。
この結果から,BootOODはポストホック法よりも優れ,アウトレイラ露光のないトレーニングベースの手法を超越し,最先端のアウトレイラ露光手法と競合することを示した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:12:31 GMT)
EL3DD: Extended Latent 3D Diffusion for Language Conditioned Multitask Manipulation [16.5] 本稿では,ロボットの正確な軌道を生成するために,ビジュモータポリシフレームワーク内での拡散モデルの有用性を活用することを目的とする。
トレーニング中に参照デモを利用することで、ロボットの即時環境内でテキストコマンドによって指定された操作タスクを実行することができる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:47:18 GMT)
A General Highly Accurate Online Planning Method Integrating Large Language Models into Nested Rollout Policy Adaptation for Dialogue Tasks [16.4] 目標指向の対話タスクでは、主な課題は、限られた回数のターンで、与えられた目標に対する対話を操ることである。
既存のアプローチは、精巧なプロンプトエンジニアリングに依存するか、ポリシーネットワークと事前訓練されたポリシーモデルを統合するかのどちらかである。
本稿では,新たな対話ポリシー計画手法であるNested Rollout Policy Adaptation for Goal-oriented Dialogue (NRPA-GD)を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:48:37 GMT)
Minimax Multi-Target Conformal Prediction with Applications to Imaging Inverse Problems [16.3] 画像逆問題において、不確実性定量化は、特に安全クリティカルな応用において、依然として根本的な課題である。
本稿では,複数対象の共形予測に対する最小限のアプローチを提案する。
我々は,既存のマルチターゲット共形予測法と比較して,ミニマックス法の利点を数値的に示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:06:37 GMT)
Can We Predict the Next Question? A Collaborative Filtering Approach to Modeling User Behavior [16.2] 大規模言語モデル(LLM)は、言語理解と生成に優れ、高度な対話とレコメンデーションシステムの動力となっている。
本稿では,言語モデリングと行動シーケンスモデリングのギャップを埋めるために,協調フィルタリングによる質問予測フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:01:20 GMT)
A Secure Semantic Communication System Based on Knowledge Graph [16.2] 本研究では,意味コミュニケーションシステムにおけるテキストデータ送信の安全性を確保するための新しい手法を提案する。
送信者が受信機にテキスト情報を送信し、潜在的な盗聴者が情報を傍受しようとする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:08:19 GMT)
An LLM-based Quantitative Framework for Evaluating High-Stealthy Backdoor Risks in OSS Supply Chains [16.1] オープンソースのソフトウェアサプライチェーンは、効率的で便利なエンジニアリングプラクティスに貢献しています。
基盤となる依存関係のメンテナンスの欠如とコミュニティ監査の不十分は、ソースコードのセキュリティを確保する上での課題を生み出します。
オープンソースソフトウェアにおけるバックドアリスク評価のためのきめ細かいプロジェクト評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:10:36 GMT)
Rethinking Saliency Maps: A Cognitive Human Aligned Taxonomy and Evaluation Framework for Explanations [16.0] 基準フレーム$times$ Granularity (RFxG) の分類について紹介する。
RFxGは2つの重要な軸に沿ってサリエンシの説明を整理する: 参照フレーム: ポイントワイズ(なぜこの予測は?)とコントラスト的(なぜこれは代替ではないのか?)の説明。
我々の総合的な評価フレームワークは、これらのメトリクスを10の最先端の正当性メソッド、4つのモデルアーキテクチャ、3つのデータセットに適用します。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:29:25 GMT)
Fault2Flow: An AlphaEvolve-Optimized Human-in-the-Loop Multi-Agent System for Fault-to-Workflow Automation [16.0] 電力グリッド技術者は、厳密な規制から推論ロジックを手作業で抽出しなければならない。
これら2つの異なる知識ソースを単一の、検証され、実行可能なワークフローに統合する既存のフレームワークはありません。
Fault2Flowは、PASTA形式のフォールトツリーに制御ロジックを体系的に抽出する。
専門家の知識をヒューマン・イン・ザ・ループ・インタフェースを通じて統合して検証する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:07:40 GMT)
APT: Affine Prototype-Timestamp For Time Series Forecasting Under Distribution Shift [15.8] Affine Prototype Timestamp (APT) は,グローバルな分散機能を正規化予測パイプラインに注入する軽量で柔軟なプラグインモジュールである。
APTは入力と出力の両方を変調するアフィンパラメータを生成し、バックボーンは自己管理型の分散対応クラスタリングインスタンスから学習することができる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:56:53 GMT)
Synthetic Forgetting without Access: A Few-shot Zero-glance Framework for Machine Unlearning [15.7] 機械学習は、トレーニングされたモデルから特定のデータの影響を排除し、プライバシコンプライアンスを保証することを目的としている。
GFOESは、生成フィードバックネットワーク(GFN)と2相微調整処理からなる新しいフレームワークである。
GFN は Optimal Erasure Samples (OES) を合成し、ターゲットクラスに高い損失を与える。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:16:08 GMT)
SF-Recon: Simplification-Free Lightweight Building Reconstruction via 3D Gaussian Splatting [15.6] SF-Reconは、ポストホックメッシュを単純化することなく、多視点画像から軽量な建築表面を直接再構築する手法である。
提案したSFデータセットに基づいて,実験結果から,多視点画像から軽量建築モデルを直接再構築できることが実証された。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:50:52 GMT)
Cost-Effective Communication: An Auction-based Method for Language Agent Interaction [15.5] 本稿では,動的オークションベース言語エージェント(DALA, Dynamic Auction-based Language Agent)について紹介する。
私たちのDALAは、MMLUの84.32%、HumanEvalの91.21%パス@1レートを含む、7つの挑戦的な推論ベンチマークで、最先端のパフォーマンスを新たに達成しています。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:00:20 GMT)
Decoupling Scene Perception and Ego Status: A Multi-Context Fusion Approach for Enhanced Generalization in End-to-End Autonomous Driving [15.5] マルチコンテキスト融合戦略に基づくアーキテクチャレベルのソリューションであるAdaptiveADを提案する。
1つのブランチはマルチタスク学習に基づくシーン駆動推論を行うが、エゴ状態は意図的にBEVエンコーダから省略される。
次に、シーン認識融合モジュールは、2つのブランチからの補完的な決定を適応的に統合し、最終的な計画軌道を形成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:27:55 GMT)
On the Fundamental Limits of LLMs at Scale [15.5] 大きな言語モデル(LLM)は、スケーリングから非常に恩恵を受けていますが、これらの利益には5つの基本的な制限があります。
この研究は、LLMスケーリングの本質的に理論的な天井を形式化する統一された証明インフォームド・フレームワークを提示する。
確率に基づくトレーニングは、推論よりもパターン補完を優先し、トークン制限下での検索はセマンティックドリフトとカップリングノイズに苦しむこと、マルチモーダルスケーリングが浅度なクロスモーダルアライメントをいかに継承するかを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 01:55:33 GMT)
Graph Out-of-Distribution Detection via Test-Time Calibration with Dual Dynamic Dictionaries [15.4] グラフアウト・オブ・ディストリビューション(OOD)検出の鍵となる課題は、トレーニング中に接地トルースOODサンプルが存在しないことである。
動的に動的に更新された辞書を用いてOODスコアを校正する,BaCaと呼ばれる新しいテスト時間グラフOOD検出法を提案する。
BaCaは、OOD検出における既存の最先端メソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:14:48 GMT)
Beyond Darkness: Thermal-Supervised 3D Gaussian Splatting for Low-Light Novel View Synthesis [15.3] 非常に低照度な条件下では、新しいビュー合成(NVS)は幾何、色調、ラジオメトリック安定性の点で深刻な劣化に直面している。
本稿では,レチネックスにインスパイアされた照明分解と熱誘導型3次元ガウス散乱を密結合した統合フレームワークDTGSを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:12:53 GMT)
Souper-Model: How Simple Arithmetic Unlocks State-of-the-Art LLM Performance [15.2] 本稿では,モデルスープの原則的アプローチである Soup Of Category Experts (SoCE) を紹介する。
SoCEは、弱相関カテゴリクラスタごとに「エキスパート」モデルを識別し、最適化された重み付け平均化を用いてそれらを結合する。
提案手法は,複数の領域にまたがる性能とロバスト性の向上を実証する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:13:34 GMT)
GRLoc: Geometric Representation Regression for Visual Localization [15.0] 絶対的なPose回帰は、視覚的ローカライゼーションの魅力的なパラダイムとして現れています。
本研究では,幾何学的な代替案を提案する。
7-ScenesとCambridge Landmarksのデータセットで最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:30:22 GMT)
Robust Client-Server Watermarking for Split Federated Learning [14.8] Split Federated Learning (SFL)は、プライバシー保護の性質と計算オーバーヘッドの低さで有名である。
本稿では,SFL用クライアントサーバ透かし埋め込みを用いたロバストモデル知的財産保護スキームRISEを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:58:33 GMT)
Crossing Borders: A Multimodal Challenge for Indian Poetry Translation and Image Generation [14.6] インドの詩は、その言語的な複雑さと深い文化的共鳴で知られており、何千年もの間、豊かで多様な遺産がある。
その文化的重要性にもかかわらず、既存の詩に関する作品は、主にインドの詩を見落としている。
本稿では,Large Language Models(LLM)とLatent Diffusion Modelsを活用した翻訳・画像生成(TAI)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:41:16 GMT)
Artificial Intelligence-Enabled Spirometry for Early Detection of Right Heart Failure [14.5] 右心不全 (RHF) は右心室の構造や機能に異常を特徴とする疾患である。
肺疾患はしばしば右室負荷を増大させ、RHFを引き起こす。
コープルモネール患者からRHFを早期に検出するための自己教師付き表現学習法を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:03:04 GMT)
Generalization Bounds for Semi-supervised Matrix Completion with Distributional Side Information [14.1] 本稿では, 基底真理$R$行列と未知のサンプリング分布$P$が低ランク行列である行列完備化問題について検討する。
真の一般化誤差は、それぞれ$P$と基底真理行列$ground$の見積もりに対応する独立した誤差項に分解されることを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:53:50 GMT)
Self-Supervised Compression and Artifact Correction for Streaming Underwater Imaging Sonar [14.0] 実時間撮像ソナーは、光センシングが信頼性の低い環境下での水中監視において重要なツールとなっている。
クリーンノイズペアや合成仮定を使わずに圧縮とアーティファクトの補正を共同で行う自己教師型フレームワークSCOPEを提案する。
SCOPEは太平洋岸北西部の3つの河川に数ヶ月間展開され、野生でのリアルタイムサケの列挙と環境モニタリングを支援している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:19:15 GMT)
Insight-A: Attribution-aware for Multimodal Misinformation Detection [14.0] 本稿では,マルチモーダルな誤情報検出のためのMLLMインサイトによる属性探索を行うInsight-Aを提案する。
我々は、認知と推論の高度な相関をモデル化するために、クロス属性プロンプト(CAP)を考案する。
また,画像キャプション(IC)を設計し,相互整合性検査の精度向上を図る。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:33:36 GMT)
Hierarchical Retrieval with Out-Of-Vocabulary Queries: A Case Study on SNOMED CT [14.0] 本稿では,OoVクエリを用いたSNOMED CTからの階層的概念検索の問題に焦点をあてる。
評価のために,SNOMED CTの概念に適応したOOVクエリを構築した。
提案手法は,SBERTと2つの語彙マッチング法を含むベースラインよりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:18:10 GMT)
Quantifying and Mitigating Selection Bias in LLMs: A Transferable LoRA Fine-Tuning and Efficient Majority Voting Approach [13.8] 大規模言語モデル(LLM)の性能評価手法として,MCQ (Multiple Choice Questioning) が広く用いられている。
LLMはMCQタスクにおいて選択バイアスを示し、その選択は内容よりも答えの位置やオプション記号などの要因に影響される。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:31:37 GMT)
DriveLiDAR4D: Sequential and Controllable LiDAR Scene Generation for Autonomous Driving [13.7] マルチモーダル条件と新しいシーケンシャルノイズ予測モデルLiDAR4DNetからなる新しいLiDAR生成パイプラインであるDriveLiDAR4Dを紹介する。
我々の知る限りでは、これはLiDARシーンの逐次的な生成とフルシーン操作機能に対処する最初の試みである。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:43:26 GMT)
Simultaneous variances of Pauli strings, weighted independence numbers, and a new kind of perfection of graphs [13.6] 可換性構造を符号化するグラフ、すなわちフラストレーショングラフによって、グラフ理論と量子情報の間の自然なインターフェースを提供する。
このクラスを$hbar$-perfectと呼び、完全グラフと$hbar-perfectグラフのクラスを拡張します。
絡み合い検出のための効率的なスキーム,シャドウトモグラフィーの複雑さへの接続,厳密な不確実性関係,地中エネルギーの低い計算のための構成を見いだす。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:05:28 GMT)
3DAlign-DAER: Dynamic Attention Policy and Efficient Retrieval Strategy for Fine-grained 3D-Text Alignment at Scale [13.6] 3DAlign-DAERはテキストと3D幾何を動的アテンションポリシーと効率的な検索戦略によって整列するように設計されたフレームワークである。
テキスト3Dアライメントの研究を容易にし、3DAlign-DAERを訓練するために、2Mのテキスト3Dペアを備えた大規模データセットAlign3D-2Mを構築した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:23:29 GMT)
Diffploit: Facilitating Cross-Version Exploit Migration for Open Source Library Vulnerabilities [13.6] Diffploitは2つのキーモジュールを中心に構成された反復的で差分駆動のエクスプロイトマイグレーション手法である。
79のライブラリにわたる102のJava CVEと689のバージョンマイグレーションタスクを含む大規模データセット上でDiffploitを評価する。
84.2%のエクスプロイトの移行に成功し、変更対応のテスト修正ツールであるTARGETを52.0%、IDEAのルールベースのツールを61.6%上回った。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:06:01 GMT)
ProtoAnomalyNCD: Prototype Learning for Multi-class Novel Anomaly Discovery in Industrial Scenarios [13.5] ProtoAnomalyNCDは、複数のタイプの未知の異常クラスを発見するためのプロトタイプベースのフレームワークである。
提案手法は,MVTec AD,MTD,Real-IADデータセットの最先端手法よりも優れている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:45:34 GMT)
Node-Level Uncertainty Estimation in LLM-Generated SQL [13.4] 本稿では,構造コンテナやエイリアスの変化を過小評価することなく,ノードレベルの正しさを割り当てるセマンティックなラベリングアルゴリズムを提案する。
私たちは、識別子の妥当性、エイリアス解決、型互換性、スコープのあいまいさ、タイポ信号といった、スキーマ認識と語彙の豊富な機能で、各ノードを表現します。
これらの確率は不確実性であると解釈し、クエリの誤りを正確に特定するきめ細かい診断を可能にする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:31:45 GMT)
AdamX: An Adam improvement algorithm based on a novel exponential decay mechanism for the second-order moment estimate [13.4] AdamXアルゴリズムは局所的および大域的ミニマに高次元最適化を収束させるために提案されている。
その中心となる革新は、新しいタイプの2階モーメント推定指数減衰率の提案にある。
その結果, 2次モーメント推定指数減衰速度は, 現在の2次モーメント推定指数減衰速度よりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:07:55 GMT)
BeDiscovER: The Benchmark of Discourse Understanding in the Era of Reasoning Language Models [13.3] 本稿では,現代LLMの談話レベルの知識を評価するための,最新の包括的スイートであるBeDiscovERを紹介する。
BeDiscovERは、公開可能な5つの談話タスクを、談話辞書、(複数)テキストレベル、ドキュメントレベルにコンパイルし、合計52のデータセットを格納する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:50:12 GMT)
SmartPoC: Generating Executable and Validated PoCs for Smart Contract Bug Reports [13.0] SmartPoCは、テキスト監査レポートを検証済みのテストケースに変換する自動フレームワークである。
SmartPoCは545件の監査結果のうち236件の実際のバグを1件当たり0.03ドルで確認している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:37:20 GMT)
Quantum Machine Learning via Contrastive Training [12.8] ラベル付きデータへの依存を減らす量子表現の自己教師付き事前学習を導入する。
我々は,このパラダイムを,プログラム可能なトラップイオン量子コンピュータ上で実装し,画像を量子状態として符号化する。
ラベル付きトレーニングデータに制限があるレギュレータでは、パフォーマンス改善が特に重要である。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:36:23 GMT)
Topological enhancement of a PT-symmetric Su-Schrieffer-Heeger quantum battery [12.6] PT対称プロトコルにより充電されるSu-Schrieffer-Heeger(SSH)格子に基づく非エルミート量子電池について検討する。
格子トポロジーと非ハーモニティの間の相互作用は、電荷力学を支配するバルク点とエッジ例外点(EP)の両方を引き起こす。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:38:50 GMT)
Training-Free Multi-View Extension of IC-Light for Textual Position-Aware Scene Relighting [12.5] ガウススプラッティング(3DGS)による3Dシーンのテキスト誘導リライティングのためのパイプラインであるGS-Lightを紹介する。
GS-Lightは、マルチビュー入力を処理するシングルインプット拡散モデルのトレーニングフリー拡張を実装している。
室内および屋外の両方でGS-Lightを評価し,最先端のベースラインと比較した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:37:41 GMT)
BCWildfire: A Long-term Multi-factor Dataset and Deep Learning Benchmark for Boreal Wildfire Risk Prediction [12.5] ブリティッシュコロンビア州とその周辺地域で4億4000万ヘクタールに及ぶ,25年間の日次分解能の山火事データセットを提示する。
我々は,CNNベース,線形ベース,トランスフォーマーベース,マンバベースアーキテクチャなど,さまざまな時系列予測モデルを評価する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 22:13:00 GMT)
AIF: Asynchronous Inference Framework for Cost-Effective Pre-Ranking [12.4] 産業レコメンデーションシステムでは、ディープニューラルネットワーク(DNN)に基づくプレグレードモデルは通常、シーケンシャルな実行フレームワークを採用する。
本稿では,対話に依存しないコンポーネントをリアルタイムの予測から切り離すコスト効率の高い計算アーキテクチャであるAsynchronous Inference Framework(AIF)を提案する。
フレームワークとモデルの両方を共同設計することで,計算コストと遅延コストを大幅に増加させることなく,優れたパフォーマンスを実現することができる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:39:32 GMT)
AI Fairness Beyond Complete Demographics: Current Achievements and Future Directions [12.3] この調査は、人口統計が不完全である場合のAIの公正性を調べ、従来のアプローチと現実世界の課題のギャップに対処する。
本研究では, 公正概念の新たな分類法を導入し, それらの関係と区別を明らかにした。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:59:25 GMT)
Introducing AI to an Online Petition Platform Changed Outputs but not Outcomes [12.3] プラットフォーム内AIアクセスは請願の語彙的特徴を大きく変え、請願の均質性を高めたが、請願の結果は改善しなかった。
AI記述ツールはオンラインコンテンツを根本的に作り直すことができるが、望ましい結果を改善するための実用的ユーティリティは、予想されるよりも有益ではないかもしれない。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 22:09:01 GMT)
Towards Requirements Engineering for GenAI-Enabled Software: Bridging Responsibility Gaps through Human Oversight Requirements [12.2] 生成的かつ適応的な性質は、人間の監督と責任がどのように特定され、委任され、追跡されるかを複雑にします。
本研究は,GenAI対応ソフトウェアシステムのコンテキストにおいて,これらの研究ギャップを分析することを目的とする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:14:01 GMT)
A Plug-and-Play Spatially-Constrained Representation Enhancement Framework for Local-Life Recommendation [12.1] 本稿では,長期的地域生活推薦のためのPlug-and-Play空間制約付き表現拡張フレームワークを提案する。
まず,基本属性レベルのセマンティック情報を注入することで,基本ID表現を初期化するメタIDワームアップネットワークを提案する。
次に、コントラスト学習に基づく空間制約付きID表現拡張ネットワーク(SIDENet)を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:58:04 GMT)
From Model Training to Model Raising [12.0] 現在のAIトレーニングメソッドは、コア機能を確立した後のみ、モデルと人間の価値を調整します。
モデル・トレーニング」から「モデル・ライジング」へのパラダイムシフトを提案する。
このパラダイムでは,トレーニングコーパスの再設計を中心に,いくつかの重要なコンポーネントを特定します。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:02:44 GMT)
TCM-5CEval: Extended Deep Evaluation Benchmark for LLM's Comprehensive Clinical Research Competence in Traditional Chinese Medicine [11.9] 大規模言語モデル(LLM)は、一般的なドメインにおいて例外的な能力を示してきたが、伝統的な中国医学(TCM)のような高度に専門的で文化的に豊かな分野に適用するには厳密な評価が必要である。
TCM-5CEvalは、(1)コア知識(TCM-seek)、(2)古典リテラシー(TCM-LitQA)、(3)臨床意思決定(TCM-MRCD)、(4)中国マテリアメディカ(TCM-CMM)、(5)臨床非薬物療法(TCM-ClinNPT)の5つの重要な側面にわたるLCMを評価するように設計されている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:15:41 GMT)
TaoSearchEmb: A Multi-Objective Reinforcement Learning Framework for Dense Retrieval in Taobao Search [11.9] Retrieval-GRPOは強化学習に基づく高密度検索フレームワークである。
中国最大のeコマースプラットフォームに配備されている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:16:52 GMT)
Bootstrapping LLMs via Preference-Based Policy Optimization [11.8] 大きな言語モデル(LLM)を優先ベースのポリシー最適化を通じてブートストラップすることで、モデルの振る舞いと人間の好みを整合させる、有望な方向を提供する。
本稿では,学習過程を主方針と報奨モデルの間のmin-maxゲームとして定式化する,新たな嗜好ベースの政策最適化フレームワークを提案する。
我々のアプローチは、既存の最先端の選好最適化技術より一貫して優れている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 01:41:14 GMT)
Enhancing All-to-X Backdoor Attacks with Optimized Target Class Mapping [11.7] バックドア攻撃は、機械学習システムに深刻な脅威をもたらす。
既存の作業のほとんどは、複数のターゲットクラスを持つより複雑なAll-to-X(A2X)攻撃を見越して、シングルターゲットのAll-to-One(A2O)攻撃に焦点を当てている。
堅牢性を維持しつつ,A2X攻撃の成功率を高める新たな攻撃戦略を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:22:44 GMT)
LLM-as-a-Grader: Practical Insights from Large Language Model for Short-Answer and Report Evaluation [11.7] 大規模言語モデル(LLM)は、グラデーションのような教育的なタスクのためにますます研究されている。
本研究は,LLMを用いて短期回答クイズとプロジェクトレポートを大学生の計算言語学コースで評価することの実現可能性について検討した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 22:45:20 GMT)
Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks [11.4] ニューラルネットワークの逆例はユークリッド幾何学で広く研究されている。
テクスチペルボリックネットワークの最近の進歩は、非ユークリッド幾何学における攻撃戦略の再評価を求めている。
本稿では,双曲空間の幾何学的特性を明示的に活用する新たな逆攻撃を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:16:07 GMT)
Tight and Practical Privacy Auditing for Differentially Private In-Context Learning [11.4] 大規模言語モデル(LLM)は、しばしばプライベートまたはプロプライエタリなデータを含むプロンプトデモからタスクに適応することで、コンテキスト内学習(ICL)を実行する。
本稿では,DP-ICLシステムに対する厳密で効率的なプライバシ監査フレームワークを提案する。
標準テキスト分類および生成ベンチマークの実験により,我々の経験的リーク推定値が分類タスクの理論的DP予算と密接に一致し,保守的な埋め込み感度境界による生成タスクが一貫して低下していることが示されている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:39:54 GMT)
Beyond SELECT: A Comprehensive Taxonomy-Guided Benchmark for Real-World Text-to-SQL Translation [10.8] 既存のデータセットは、カバー範囲が限られており、現実世界のアプリケーションの多様性を捉えていないことが多い。
コアインテント,ステートメントタイプ,構文構造,キーアクションに基づくテキスト・ツー・ワン分類のための新しい分類法を提案する。
このアプローチは、分類とLLM(Large Language Models)を組み合わせることで、データセットが現実世界のテキスト・ツー・ワンアプリケーションの幅と複雑さを反映することを保証する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:52:19 GMT)
Applying Large Language Models to Characterize Public Narratives [10.8] 本稿では,大規模言語モデル(LLM)を活用して,公開物語の質的アノテーションを自動化する新しい計算フレームワークを提案する。
我々の研究によると、LLMは8つの物語と14のコードで平均0.80のF1スコアを達成することができる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:41:55 GMT)
Explore How to Inject Beneficial Noise in MLLMs [10.8] マルチモーダル言語モデル(MLLM)は、多モーダルインテリジェンスにおいてますます重要な役割を担っている。
本稿では,従来の手法より優れ,かつ完全な微調整を超越した,有益なランダムノイズを注入することで,新たな微調整戦略を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:11:41 GMT)
Soft Conflict-Resolution Decision Transformer for Offline Multi-Task Reinforcement Learning [10.7] SoCo-DTはパラメータ重要度に基づくソフト・コンフリクト分解法である。
我々は、インタークアタイルレンジに基づく動的空間調整戦略を導入する。
実験結果から,SoCo-DTはMT50では7.6%,準最適データセットでは10.5%,最先端手法では7.6%を上回った。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:40:41 GMT)
Compute-in-Memory Implementation of State Space Models for Event Sequence Processing [10.7] 状態空間モデル(SSM)は、長いシーケンス処理のための強力なフレームワークとして登場した。
本稿では,リアルタイムなイベント駆動処理を実現するために,エネルギー効率の高い計算インメモリハードウェアにSSMを実装する手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:06:52 GMT)
Who Gets the Reward, Who Gets the Blame? Evaluation-Aligned Training Signals for Multi-LLM Agents [10.6] マルチエージェントシステムにおける大規模言語モデル(LLM)は複雑なタスクを約束している。
本稿では,協調ゲーム理論の帰属とプロセス報酬モデリングを一体化する理論的枠組みを提案する。
本手法は, 局所的, 署名, クレジット保存信号を生成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:45:26 GMT)
TSE-Net: Semi-supervised Monocular Height Estimation from Single Remote Sensing Images [10.4] TSE-Netは半教師付き単分子高さ推定のための自己学習パイプラインである。
パイプラインは教師、学生、試験ネットワークを統合している。
提案したパイプラインを,解像度の異なる3つのデータセットで評価し,画像のモダリティを評価する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:22:38 GMT)
Batch Acquisition Function Evaluations and Decouple Optimizer Updates for Faster Bayesian Optimization [10.4] 取得関数を最大化することにより,高い性能パラメータを効率的に見つける方法を示す。
この問題に対処するために、理論上同一のQNN取得関数の収束を分離することを提案する。
この問題に対処するために、理論上同一のQNN取得関数の収束を分離することを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:32:32 GMT)
AHaSIS: Shared Task on Sentiment Analysis for Arabic Dialects [10.3] 病院領域におけるアラビア語方言の感性分析 : アラビア語方言の感性検出に着目して
データセットは、ポジティブ、中立、ネガティブのカテゴリにまたがる538の感情バランスのレビューで構成されている。
トップパフォーマンスのシステムはF1スコアの0.81を達成し、アラビア語の方言における感情分析の可能性と継続的な課題を実証した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:06:55 GMT)
Tab-PET: Graph-Based Positional Encodings for Tabular Transformers [10.3] 本稿では,位置エンコーディングを埋め込みに推定し,解析するためのグラフベースのフレームワークを提案する。
グラフトポロジからPEを導出するアプローチにインスパイアされた我々は、グラフ推定のパラダイムとして、アソシエーションベースと因果関係ベースという2つを探求する。
グラフ由来のPEは,50の分類データセットと3Tの回帰データセットにまたがる性能を著しく向上させることを実証的に実証した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:08:34 GMT)
An approach of deep reinforcement learning for maximizing the net present value of stochastic projects [10.2] 本稿では,個別シナリオ下での活動期間とキャッシュフローを有するプロジェクトについて検討する。
その目的は、流入を加速し流出を遅延させることにより、期待される純現在値(NPV)を最大化することである。
離散時間マルコフ決定過程(MDP)として問題を定式化し、Double Deep Q-Network(DDQN)アプローチを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 01:32:08 GMT)
RAGPulse: An Open-Source RAG Workload Trace to Optimize RAG Serving Systems [10.2] 本稿では,オープンソースのRAGワークロードトレースデータセットであるRAGPulseを紹介する。
このデータセットは2024年4月以降に4万人以上の学生と学部に提供される大学全体のQ&Aシステムから収集された。
分析の結果,実世界のRAGワークロードは,時間的および高度に歪んだホットドキュメントアクセスパターンを示すことがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:06:47 GMT)
Opt3DGS: Optimizing 3D Gaussian Splatting with Adaptive Exploration and Curvature-Aware Exploitation [10.2] 3D Splatting (3DGS) は、新しいビュー合成のための主要なフレームワークとして登場したが、その中核となる最適化課題は未解決のままである。
我々は,3DGS最適化における2つの重要な課題を,最適部分最適化における包摂と,収束品質の不十分さの2つに同定した。
2段階最適化プロセスを通じて3DGSを強化する頑健なフレームワークであるOps3DGSを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:37:33 GMT)
PragWorld: A Benchmark Evaluating LLMs' Local World Model under Minimal Linguistic Alterations and Conversational Dynamics [9.9] 我々は,言語モデル (LM) の内的世界モデルを符号化し,更新する能力を評価する。
本研究では,会話の言語的変化による実体の追跡など,LMが重要な詳細を記憶するのに苦労していることを示す。
本稿では,有用あるいは有害なトランスフォーマー層を識別する,二重パースペクティブ解釈可能性フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:17:17 GMT)
Visual Room 2.0: Seeing is Not Understanding for MLLMs [9.9] MLLMの知覚認識アライメントを評価するための階層的ベンチマークであるtextitVisual Room 2.0 を紹介する。
人間の知覚と認知のプロセスは、低、中、高の3段階にわたってモデル化され、17の代表的なタスクをカバーしています。
データセットには350のマルチモーダルサンプルが含まれており、それぞれ6つのプログレッシブな質問(合計2,100件)が認識から認知に分散している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:34:52 GMT)
Towards Metric-Aware Multi-Person Mesh Recovery by Jointly Optimizing Human Crowd in Camera Space [9.8] In-the-the-wild Human Mesh pseudo-ground-Truth (pGT) 生成パイプラインは、個人中心である。
本研究では,群集内の全個人のカメラ空間翻訳を改良する新しい最適化手法を提案する。
DTOを4D-Humansデータセットに適用し、DTO-Humansという新しい大規模pGTデータセットを構築した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:00:13 GMT)
Human-Level and Beyond: Benchmarking Large Language Models Against Clinical Pharmacists in Prescription Review [9.6] RxBenchは、一般的な処方薬レビューカテゴリをカバーし、14の頻繁な処方薬エラーを集約する包括的なベンチマークである。
1,150のシングルチョイス、230のマルチチョイス、879のショートアンサーアイテムで構成され、いずれも経験豊富な臨床薬剤師によってレビューされている。
Gemini-2.5-pro-preview-05-06、Grok-4-0709、DeepSeek-R1-0528は一貫して第1階層を形成し、精度と堅牢性の両方で他のモデルを上回った。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:36:53 GMT)
Automated Side-Channel Analysis of Cryptographic Protocol Implementations [9.4] WhatsAppの最初の形式モデルを実装から抽出する。
コンパイル後セキュリティに対する既知のクローンアタックを特定します。
本稿では,暗号プロトコルの実装をサイドチャネル攻撃に対するレジリエンスとして解析する手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:36:51 GMT)
Hybrid Quantum-Classical Dispatching for High-Renewable Power Systems:A Noise-Resilient Variational Approach with Real-World Validation [9.4] 本研究では, 再生可能エネルギー導入型電力システムを対象としたハイブリッド型量子古典分散フレームワークを提案する。
提案手法は,変動量子アルゴリズムと古典最適化を統合し,現実的なハードウェア制約下での耐雑音性能を実現する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:45:34 GMT)
LocalBench: Benchmarking LLMs on County-Level Local Knowledge and Reasoning [9.3] 大規模言語モデル (LLM) は, マクロな地理的タスクにおいて広く評価されてきたが, 超局所的な知識を扱う能力はいまだによく理解されていない。
アメリカ合衆国全体での郡レベルの地域知識に基づいてLSMを評価するために設計された最初のベンチマークであるLocalBenchを紹介する。
LocalBenchを用いて、クローズドブックとWeb拡張設定の両方で、13の最先端LCMを評価した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:46:07 GMT)
A Fractional Calculus Framework for Open Quantum Dynamics: From Liouville to Lindblad to Memory Kernels [9.3] オープン量子系は、純粋にユニタリ進化から可逆的な散逸緩和までのダイナミクスを示す。
ここでは、開系力学のより広い視野に分数的量子マスター方程式を埋め込む統一階層を確立する。
結果として得られる枠組みは、分数計算を本質的なメモリを持つ量子力学のための厳密で統一的な言語として位置づけている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:35:42 GMT)
MM-Telco: Benchmarks and Multimodal Large Language Models for Telecom Applications [9.3] 大規模言語モデル(LLM)は、複雑な推論と意思決定タスクを自動化する強力なツールとして登場した。
通信では、ネットワーク最適化を変革し、トラブルシューティングを自動化し、顧客サポートを強化し、規制コンプライアンスを確実にする可能性を秘めている。
本稿では,テレコムドメインに適したベンチマークとモデルの総合的なスイートであるMM-Telcoを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:34:41 GMT)
Can Large Language Models Function as Qualified Pediatricians? A Systematic Evaluation in Real-World Clinical Contexts [9.3] 医学における大規模言語モデル(LLM)の急激な普及に伴い、実際の臨床現場で有能な小児科医として機能するかどうかが重要な疑問である。
PEDIASBenchは,知識システムフレームワークを中心とした,現実的な臨床環境に適したシステム評価フレームワークである。
GPT-4o, Qwen3-235B-A22B, DeepSeek-V3を含む過去2年間にリリースされた12種類の代表モデルについて検討した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:54:00 GMT)
Restart Belief: A General Quantum LDPC Decoder [9.3] 量子低密度パリティチェック(QLDPC)デコーダは通常、信念伝播(BP)処理に基づいて構築される。
本稿では,分岐とバウンドの最適化原理に着想を得たBPに基づく反復的アルゴリズムである再帰的信念(RB)デコーダを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:55:11 GMT)
What Color Is It? A Text-Interference Multimodal Hallucination Benchmark [9.2] 本研究では,「色は何か」データセットにおける単一モダリティ視覚幻覚の根本原因について検討する。
このデータセットに基づいて,幻覚を増強するための潜在的な解決策を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:15:41 GMT)
The Battle of Metasurfaces: Understanding Security in Smart Radio Environments [9.2] 準曲面-準曲面相互作用とその無線セキュリティへの応用について検討する。
その結果,メタサーフェスの「戦闘」の結果は,タイミング,配置,アルゴリズム戦略,ハードウェアスケールの相互作用に依存することが明らかとなった。
スマート無線環境における高耐久・高能率物理層システムの設計に新たな機会が開けた。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:48:32 GMT)
Hybrid continuous-discrete-variable quantum computing: a guide to utility [9.1] 新しい方向性は、連続変数モードの導入と、量子コンピューティングに対するハイブリッド連続離散アプローチの検討である。
本稿では,このモダリティの利点について論じ,その利点を生かしたアプリケーションをいくつか紹介する。
これには物理学、化学、計算機科学の応用が含まれる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:02:16 GMT)
Synergizing Multigrid Algorithms with Vision Transformer: A Novel Approach to Enhance the Seismic Foundation Model [8.9] シーケンシャルトークン化による既存の視覚変換器(ViT)は、固有パターンを無視し、高周波数と低周波の両方の地震情報を効果的に把握できない。
本研究では,Hilbertエンコーディングを用いた新しい2グリッド基礎モデルトレーニング戦略(ADATG)を導入する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:37:28 GMT)
Rdgai: Classifying transcriptional changes using Large Language Models with a test case from an Arabic Gospel tradition [8.8] Rdgaiは多言語大言語モデル(LLM)を用いた分類作業を自動化するソフトウェアパッケージである。
本稿では,多言語大言語モデル(LLM)を用いた分類作業を自動化するソフトウェアパッケージRdgaiを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:03:12 GMT)
ForgeDAN: An Evolutionary Framework for Jailbreaking Aligned Large Language Models [8.8] ジェイルブレイク攻撃は 有害な出力を 引き出すためにアライメント・ガードをバイパスする
セマンティック・コヒーレントで高能率な対人プロンプトを生成するための新しいフレームワークであるForgeDANを提案する。
本評価は,従来のSOTAソリューションよりも優れた自然さとステルスを維持しつつ,高い脱獄率を達成することを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:19:21 GMT)
Multi-Agent Multimodal Large Language Model Framework for Automated Interpretation of Fuel Efficiency Analytics in Public Transportation [8.7] 本研究では,データナレーションとエネルギーインサイト生成を自動化するマルチエージェントフレームワークを提案する。
データナレーション剤、LSM−as−a−ジャッジ剤、オプションのヒト・イン・ザ・ループ評価剤を含む3つの特殊エージェントを調整する。
このシステムは、デンマーク北部ユトランドの公共バス輸送に関する実際のケーススタディを通じて検証されている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:14:17 GMT)
Uni-Hema: Unified Model for Digital Hematopathology [8.7] デジタル血液病理学のためのマルチタスク統合モデルUni-Hemaを提案する。
Uni-Hemaは、検出、分類、セグメンテーション、形態予測、および複数の疾患に対する推論を統合している。
本フレームワークはマルチタスクおよびマルチモーダルデジタル血液病理学の新しい標準を確立する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:29:20 GMT)
FUSE: A Flow-based Mapping Between Shapes [8.7] 本稿では,フローマッチングモデルに基づく3次元形状間のマップのための新しいニューラル表現を提案する。
この構成は、ポイントワイズなタスク調整された埋め込みで形状を符号化することにより、形状間の写像の可逆かつモダリティに依存しない表現を提供する。
我々のフレームワークは、紫外線マッピングや人体の生点雲スキャンの登録など、他のタスクにおいて有望な結果を示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:42:45 GMT)
Scalable and Efficient Large-Scale Log Analysis with LLMs: An IT Software Support Case Study [8.7] IT環境は通常、システムの状態を監視し、問題を検出するためのロギングメカニズムを持っています。
生成されたログの膨大な量は、手動による検査を非現実的にします。
本稿では,ログデータ処理や問題診断に大規模言語モデルを活用するログ解析ツールを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:50:17 GMT)
Trust in Vision-Language Models: Insights from a Participatory User Workshop [8.6] 本稿では,VLM(Vision-Language Models)ユーザを対象としたユーザ中心ワークショップの予備的結果を示す。
このパイロットワークショップからの洞察は、ユーザ-VLMインタラクションのケースに合うように、参加者のエンゲージメントのための信頼度と戦略の文脈化を目的とした将来の研究を通知する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:04:59 GMT)
GenTract: Generative Global Tractography [8.6] GenTractは、グローバルトラクトグラフィーのための最初の生成モデルである。
研究グレードのデータに対して高い精度でトラクトグラムを生成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:43:57 GMT)
TZ-LLM: Protecting On-Device Large Language Models with Arm TrustZone [8.5] モバイルデバイスにデプロイされる大規模言語モデル(LLM)は、ユーザのプライバシやネットワーク遅延の低減といったメリットを提供するが、重大なセキュリティリスクをもたらす。
我々は、Arm Trusted Execution Environment (TEE)、TrustZoneを用いて、デバイス上でのLDMを保護するシステム設計を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:59:20 GMT)
ST-ProC: A Graph-Prototypical Framework for Robust Semi-Supervised Travel Mode Identification [8.4] 本稿では,これらの制約に対処する新しいグラフプロトタイプ多目的SSLフレームワークST-ProCを提案する。
我々のフレームワークは、基礎的なSSLサポートでグラフ-プロトタイプコアをシナジする。
ST-ProCは全てのベースラインを著しく上回り、実世界のスパースラベル設定で有効性を示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:52:11 GMT)
MergeSlide: Continual Model Merging and Task-to-Class Prompt-Aligned Inference for Lifelong Learning on Whole Slide Images [8.3] Whole Slide Images (WSIs) の生涯学習は、がん関連のタスクで連続的に統一モデルを訓練または微調整することを目的としている。
本稿では,生涯学習をモデル統合問題として扱うフレームワークであるMergeSlideを紹介する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:51:18 GMT)
SkyReels-Text: Fine-grained Font-Controllable Text Editing for Poster Design [8.3] ポスターテキストを正確に編集するためのフォント制御可能な新しいフレームワークであるSkyReels-Textを紹介する。
本手法では,複数のテキスト領域の同時編集が可能で,それぞれが異なるスタイルで描画される。
SkyReels-Textはテキストの忠実さと視覚的リアリズムの両方において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:02:52 GMT)
Text2Traffic: A Text-to-Image Generation and Editing Method for Traffic Scenes [8.3] 画像生成と編集の両方に統一されたテキスト駆動フレームワークを提案する。
交通シーンの幾何学的多様性を高めるために、車両側と道路側の両方のマルチビューデータを組み込んだ。
本手法は,トラフィックシーン内におけるテキストベースの画像生成と編集における先行的な性能を実現する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:39:13 GMT)
ParaDySe: A Parallel-Strategy Switching Framework for Dynamic Sequence Lengths in Transformer [8.2] ParaDySeは動的シーケンスのための新しい適応型並列戦略切替フレームワークである。
ParaDySeは、即時入力シーケンスに応じて、オンザフライで最適な戦略適用を可能にする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:08:24 GMT)
Skeletons Speak Louder than Text: A Motion-Aware Pretraining Paradigm for Video-Based Person Re-Identification [8.1] マルチモーダル・プレトレーニングは視覚的理解に革命をもたらしたが、人に基づく人物再識別(ReID)への影響はいまだ未発見である。
既存のアプローチはビデオとテキストのペアに依存することが多いが、(1)真のマルチモーダル事前学習の欠如、(2)テキストが微妙な時間運動を捉えにくいという2つの基本的な制限に悩まされている。
ReIDのための最初のスケルトン駆動事前学習フレームワークを導入することで、テキストベースのパラダイムから大胆に離れる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:59:41 GMT)
Cost-Driven Synthesis of Sound Abstract Interpreters [8.1] 我々は,現代のLLMが,音や非自明な抽象的インタプリタを合成することで,この負担を軽減することができるかどうかを検討する。
我々は,LLMベースの生成を統語的・意味的検証と定量的なコスト誘導フィードバック機構で統合する統合フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:16:36 GMT)
Automated Construction of Medical Indicator Knowledge Graphs Using Retrieval Augmented Large Language Models [8.1] 本稿では,検索拡張生成(RAG)と大規模言語モデル(LLM)を組み合わせて医療指標知識グラフを構築する自動フレームワークを提案する。
得られた知識グラフは、インテリジェントな診断と質問応答システムに統合することができる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:00:42 GMT)
Temporal Realism Evaluation of Generated Videos Using Compressed-Domain Motion Vectors [8.1] 圧縮ビデオストリームから直接抽出した動きベクトル(MV)を用いて時間的行動を評価するスケーラブルなモデルAフレームワークを提案する。
Kullback-Leibler, Jensen-Shannon, Wassersteinの2つの相違点を実ビデオと生成ビデオのMV統計量で計算することで現実性を定量化する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:47:06 GMT)
MMD-Thinker: Adaptive Multi-Dimensional Thinking for Multimodal Misinformation Detection [8.1] マルチモーダルな誤報はさまざまなソーシャルメディアに溢れ、AIGC(AIGC)の時代においても進化を続けている。
近年の研究では、汎用多目的大言語モデル(MLLM)を活用して、検出において顕著な結果が得られている。
適応型多次元思考によるマルチモーダル誤情報検出のための2段階フレームワークであるMDD-Thinkerを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:04:30 GMT)
Mapping the Vanishing and Transformation of Urban Villages in China [8.1] 中国の都市部に埋め込まれた都市集落は、ここ数十年で大規模な解体と再開発が進んでいる。
解体された土地が効果的に再利用されたかどうかの体系的な評価は残っていない。
本研究は,中国における紫外線変換の変化をモニタリングする深層学習に基づくフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:42:41 GMT)
Agent READMEs: An Empirical Study of Context Files for Agentic Coding [8.0] 我々は1,925のリポジトリから2,303のエージェントコンテキストファイルを調べ、それらの構造、保守、およびコンテンツを特徴付ける。
これらのファイルは静的なドキュメントではなく、コンフィグレーションコードのように進化し、頻繁で小さな追加によって維持される複雑で読みにくいアーティファクトであることが分かりました。
これらの結果は、開発者がコンテキストファイルを使用してエージェントを機能させる一方で、エージェント記述コードの安全性やパフォーマンスを保証するためのガードレールはほとんど提供せず、ツールやプラクティスの改善の必要性を強調していることを示している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:18:55 GMT)
Statistically Accurate and Robust Generative Prediction of Rock Discontinuities with A Tabular Foundation Model [8.0] 本稿では,岩盤不連続性の統計的に正確な生成予測のための簡易かつ頑健な手法を提案する。
提案手法は, 限られた不連続範囲内で, 基礎となる複雑な分布パターンを効果的に捉えることができる。
この研究は、岩盤の質量構造を定量的に評価し、より安全で信頼性の高いデータ駆動地形設計をサポートする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:09:53 GMT)
HiFusion: Hierarchical Intra-Spot Alignment and Regional Context Fusion for Spatial Gene Expression Prediction from Histopathology [8.0] HiFusionは、2つの補完的なコンポーネントを統合する新しいディープラーニングフレームワークである。
HiFusionは,2次元のスライドワイドクロスバリデーションと,より困難な3次元サンプル固有シナリオの両面において,最先端のパフォーマンスを実現する。
これらの結果は、定期的な病理組織学からのST推論の堅牢で正確でスケーラブルな解としてのHiFusionの可能性を裏付けるものである。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:47:39 GMT)
A note on Schmidt-number witnesses based on symmetric measurements [7.8] 対称測度に基づくk-正線型写像のクラスを示す。
我々は、シュミット数目撃者が高次元系におけるシュミット数の量子状態をよりよく特定していることを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:21:51 GMT)
T-SAR: A Full-Stack Co-design for CPU-Only Ternary LLM Inference via In-Place SIMD ALU Reorganization [7.7] 本稿では,CPU上でのスケーラブルな3次LLM推論を実現するための最初のフレームワークであるT-SARを提案する。
T-SARはメモリボトルネックを排除し、データレベルの並列性を最大化し、GEMMレイテンシとGEMVスループットの5.6-24.5xと1.1-86.2xの改善を提供する。
T-SARはNVIDIA Jetson AGX Orinの2.5-4.9倍のエネルギー効率を実現し、エッジプラットフォーム上で効率的なLCM推論のための実践的なアプローチを確立した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:32:03 GMT)
Large Language Models Meet Extreme Multi-label Classification: Scaling and Multi-modal Framework [7.6] ファンデーションモデルは、多くの領域にわたって人工知能に革命をもたらしたが、その変革の可能性は、エクストリーム・マルチラベル分類(XMC)にほとんど使われていない。
本稿では,より大規模なデコーダのみのモデルを効果的に活用する方法と,計算効率を保ちながら視覚情報を活用する方法について述べる。
既存のテキストのみのデータセットを拡張して、ビジュアルメタデータを活用し、将来のベンチマークに利用できるようにする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:52:53 GMT)
Mitigating Spurious Correlations in Patch-wise Tumor Classification on High-Resolution Multimodal Images [7.5] パッチワイドバイナリ分類は, パッチ構成とラベルの相互関係を突発的に引き起こす可能性が示唆された。
我々はこの効果を緩和するためのデバイアスング戦略を提案する。
この強化により、致命的なマイノリティケースのモデルパフォーマンスが向上する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:01:30 GMT)
On the Information Processing of One-Dimensional Wasserstein Distances with Finite Samples [7.4] ワッサーシュタイン距離 (Wasserstein distance) は、データ空間における標本輸送距離の和である。
1次元のワッサーシュタイン距離は、速度と支持の両方に有意な密度差があることが示される。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:16:20 GMT)
Inertia-Informed Orientation Priors for Event-Based Optical Flow Estimation [7.4] イベントカメラはシーン内の動きを直接エンコードする。
イベントベース光学フローを推定する学習ベースおよびモデルベース手法が多数存在する。
本稿では,空間的に視覚的かつスパースな動作手段を結合した,生物学的に高密度なハイブリッドCMを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:39:18 GMT)
View-aware Cross-modal Distillation for Multi-view Action Recognition [7.3] 完全教師付きマルチモーダル教師からモダリティとアノテーションに制限された学生へ知識を抽出するために,ビューアウェアなクロスモーダル知識蒸留(ViCoKD)を提案する。
ViCoKDは、クロスモーダルな注意を持つクロスモーダルなアダプタを採用しており、学生は不完全なモーダルで操作しながらマルチモーダルな相関を利用することができる。
また,ビューアウェア・コンシステンシー・モジュールを提案する。ビューアウェア・コンシステンシー・モジュールはビューアライメントのミスアライメントに対処する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:00:22 GMT)
A Smart-Glasses for Emergency Medical Services via Multimodal Multitask Learning [7.3] 本稿では,EMSNetを利用したスマートグラスシステムであるEMSGlassと,EMSServeを,EMSシナリオに適した低遅延マルチモーダルサービスフレームワークとして提示する。
EMSNetはテキスト、バイタルサイン、シーンイメージを統合し、EMSインシデントに対する統合されたリアルタイム理解を構築する。
EMSServe は PyTorch のマルチモーダル推論による 1.9x -- 11.7x の高速化を実現している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:27:52 GMT)
Revealing the dynamic responses of Pb under shock loading based on DFT-accuracy machine learning potential [7.2] 衝撃波の荷重下では、Pbの動的力学挙動は塑性変形と衝撃誘起相転移という2つの重要な現象を含む。
新たに開発したPb-Sn合金に対する機械学習の可能性を利用して, 衝撃荷重による組織変化を再考した。
その結果, Pbの[001]方向に沿った衝撃荷重は, 高速で可逆的で, 大規模な相転移と積層断層の進展を示すことがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:38:19 GMT)
MEGA-GUI: Multi-stage Enhanced Grounding Agents for GUI Elements [7.2] MEGA-GUIは、グラウンディングを粗い関心領域(ROI)選択ときめ細かい要素グラウンディングに分離する多段階フレームワークである。
MEGA-GUIは、空間的希釈を緩和する双方向ROIズームアルゴリズムと、意味的曖昧さを低減する文脈対応書き換えエージェントを備えている。
視覚的に密度の高いScreenSpot-Proベンチマークでは、MEGA-GUIの精度は73.18%に達し、セマンティックに複雑なOSWorld-Gベンチマークでは68.63%に達した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:38:05 GMT)
GigaEvo: An Open Source Optimization Framework Powered By LLMs And Evolution Algorithms [7.2] GigaEvoはオープンソースのフレームワークで、研究者はLLM-進化のハイブリッドアプローチを研究、実験することができる。
今後の研究を支援するために,システムアーキテクチャ,実装決定,実験方法論の詳細な説明を行う。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:44:47 GMT)
SHAP Distance: An Explainability-Aware Metric for Evaluating the Semantic Fidelity of Synthetic Tabular Data [7.2] 本稿では,グローバルな SHAP 帰属ベクトル間の余弦距離として定義される,説明可能性を考慮した新しい尺度である SHAP (SHapley Additive exPlanations) Distance を紹介する。
我々は,臨床健康記録に生理的特徴のあるデータセット,不均一スケールの企業請求取引,カテゴリー・数字の混合属性を持つテレコムチャーンログを分析した。
以上の結果から,SHAP Distanceは,Kulback-Leiblerの発散やTrain-on-Synthetic-Test-on-Realの精度が検出できないような,特徴的重要性のシフトや,テール効果の不足を捉えていることがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:47:47 GMT)
End-to-End Multi-Person Pose Estimation with Pose-Aware Video Transformer [7.2] ビデオにおける多人数2Dポーズ推定のためのエンドツーエンドフレームワークを提案する。
鍵となる課題は、複雑な時間軌道と重なり合う時間軌道の下で、個人をフレーム全体で関連付けることである。
本稿では,フレーム内関係と時間デコーダのポーズをモデル化するための空間エンコーダを備えた新しいPose-Aware VideoErEr Network(PAVE-Net)を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:19:35 GMT)
Viper-F1: Fast and Fine-Grained Multimodal Understanding with Cross-Modal State-Space Modulation [7.2] 本稿では,効率的な液体状態空間ダイナミクスに置き換えるハイブリッド状態空間ビジョンランゲージモデルであるViper-F1を紹介する。
その結果,Viper-F1は精度が高く,精度が大幅に向上することがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:08:31 GMT)
Exploring the Effectiveness of Google Play Store's Privacy Transparency Channels [7.2] Google Play Storeでは,Android開発者がアプリのプライバシプラクティスをより責任を持って,潜在的なユーザに伝えることが求められている。
これらのチャンネルが、ユーザーがアプリの選択とインストールプロセスにおいて情報的な決定を下すのにどれほど効果的かは不明だ。
我々は,モバイルアプリのシミュレートされたプライバシー透明性チャネルと対話するために,190人の参加者を対象に調査を行った。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:40:19 GMT)
Differentiated Directional Intervention A Framework for Evading LLM Safety Alignment [7.1] 大規模言語モデルには、悪意のある要求を拒否する能力が備わっている。
以前の研究は、この拒絶機構を活性化空間の1つの線形方向としてモデル化していた。
我々は,臨界層における安全アライメントを正確に中和する新しいホワイトボックスフレームワークDBDIを導入する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:42:17 GMT)
Evaluating the Ability of Large Language Models to Identify Adherence to CONSORT Reporting Guidelines in Randomized Controlled Trials: A Methodological Evaluation Study [7.1] 本研究は,現代LPMの精度と信頼性を評価することを目的とした。
各種医療専門分野にまたがる150個のRCTの黄金標準データセットを構築した。
トップパフォーマンスモデルであるGemini-2.5-FlashとDeepSeek-R1は、それぞれ0.280と0.282のコーエンのカッパ係数の0.634とほぼ同じマクロF1スコアを達成した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:05:15 GMT)
Tuning for Two Adversaries: Enhancing the Robustness Against Transfer and Query-Based Attacks using Hyperparameter Tuning [6.9] 本稿では,トランスファーベースおよびクエリベースの攻撃に対して,最適化ハイパーパラメータがロバスト性にどのように影響するかを,初めて詳細に分析する。
私たちの研究は、集中型トレーニング、アンサンブル学習、分散トレーニングなど、さまざまな実践的なデプロイメント設定にまたがっています。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:03:49 GMT)
Spatially-Aware Mixture of Experts with Log-Logistic Survival Modeling for Whole-Slide Images [6.8] 4つの相補的な革新を通じて制限に対処する包括的計算病理学フレームワークを導入する。
大規模TCGAコホートでは, LUADでは0.644, KIRCでは0.751, BRCAでは0.752の時間依存一致指数が得られた。
このフレームワークはさらにキャリブレーションと解釈性を改善し、パーソナライズされたがん予後のためのWSIsの使用を推進している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:13:24 GMT)
Contrastive Entropy Bounds for Density and Conditional Density Decomposition [6.7] ヒルベルト空間と分解を用いて、多重出力ネットワークがガウス混合を定義する複数の中心を生成する場合に対処する。
本稿では,デコーダを複数出力するエンコーダ/ミキサー/デコーダアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:49:08 GMT)
From Black Box to Insight: Explainable AI for Extreme Event Preparedness [6.6] 気候変動が山火事などの極端な出来事の頻度と深刻度を加速するにつれ、正確で説明可能な予測や行動可能な予測の必要性が高まっている。
人工知能(AI)モデルはそのような事象を予測することを約束しているが、現実の意思決定への採用はブラックボックスの性質のために制限されている。
本稿では、予測精度と極端な事象予測のための実用的な洞察とのギャップを埋める上での、説明可能なAI(XAI)の役割について検討する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:57:15 GMT)
RoS-Guard: Robust and Scalable Online Change Detection with Delay-Optimal Guarantees [6.5] オンライン変更検出(OCD)は、ストリーミングデータの変化点を迅速に識別することを目的としている。
OCD法は通常、推定誤差と環境変動のために非現実的なシステム知識を推定する。
我々は,不確実性のある線形システムに適した頑健で最適なOCDアルゴリズムであるRoS-Guardを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 00:30:36 GMT)
Online Learning of HTN Methods for integrated LLM-HTN Planning [6.4] メソッドはタスクをサブタスクに分割するタイミングと方法を示す。
ChatHTNはChatGPTに問い合わせ、タスクをプリミティブなタスクに分解する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:46:04 GMT)
Zero-Shot Grammar Competency Estimation Using Large Language Model Generated Pseudo Labels [6.3] 手動ラベルを頼らずにラベル付きデータと大言語モデル(LLM)を活用するゼロショット文法能力推定フレームワークを提案する。
学習中に、文法能力に基づくプロンプトを用いてラベルなしデータにLLM生成予測を適用する。
擬似ラベル生成におけるLCMの選択がモデル性能に重大な影響を及ぼし,トレーニング中のクリーン・ツー・ノイズの比率が安定性と精度に強く影響を与えることを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:00:26 GMT)
Taming Barren Plateaus in Arbitrary Parameterized Quantum Circuits Without Sacrificing Expressibility [6.2] 任意のPQCにおけるバレン高原を除去するための汎用的でハードウェア効率のよい手法を提案する。
具体的には、実装が容易な量子チャネルの層を元のPQCに挿入することで、これを実現する。
重要なことは、MPQCにバレンプラトーがないことは現実的なノイズに対して堅牢であり、我々のアプローチは現在のノイズの多い中間スケール量子(NISQ)ハードウェアに直接適用できる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:21:43 GMT)
Long-range entanglement and quantum correlations in a multi-frequency comb system [6.2] 非線形に結合した周波数コムが、非常に広いスペクトル範囲にまたがる2モード間および2モード間のスキューズおよび絡み合いを発生させることを示す。
我々の研究は、波長可変なブロードバンドゴースト分光法、スクイーズ・エンハンスドポンププローブ測定、スペクトル多重化情報間のブロードバンドの絡み合わせを可能にした。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:10:07 GMT)
KForge: Program Synthesis for Diverse AI Hardware Accelerators [6.0] KForgeは2つの協調LDMエージェント上に構築されたプラットフォームに依存しないフレームワークである。
生成エージェントは、コンパイルと正当性フィードバックによりプログラムを反復的に生成・洗練し、パフォーマンス分析エージェントは、プロファイリングデータを解釈して最適化を誘導する。
このエージェントベースのアーキテクチャは、新しいプラットフォームをターゲットにしたシングルショットの例のみを必要とする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:46:43 GMT)
DiffFP: Learning Behaviors from Scratch via Diffusion-based Fictitious Play [5.9] ゼロサムゲームにおける未確認相手に対する最良の応答を推定する架空のプレイフレームワークであるDiffFPを提案する。
レースや多粒子ゼロサムゲームを含む複雑なマルチエージェント環境において,本手法の有効性を検証した。
提案手法は, RLベースのベースラインに対して, 最大で3$times$高速収束, 30$times$高い成功率を達成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:48:29 GMT)
GRIN Transfer: A production-ready tool for libraries to retrieve digital copies from Google Books [5.8] 本報告ではGRIN Transferの初期リリースを紹介する。
GRIN Transferにより、パートナーライブラリは、GRINからGoogle Booksコレクションを効率的に取り出すことができる。
この記事では、Institutional Books 1.0パイプラインのアップデート版も紹介します。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:20:14 GMT)
Learning Implicit Neural Degradation Representation for Unpaired Image Dehazing [5.8] 暗黙的神経劣化表現のための教師なし脱湿法を提案する。
提案手法は,様々な公開および実世界のデータセット上での競合的脱ヘイズ性能を実現する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:07:48 GMT)
Transformer-Based Scalable Multi-Agent Reinforcement Learning for Networked Systems with Long-Range Interactions [5.8] マルチエージェント強化学習は大規模ネットワーク制御を約束するが、既存の手法には2つの大きな制限がある。
両課題に対処する統合トランスフォーマーベースのMARLフレームワークSTACCAを紹介する。
本研究は,STACCAの性能向上,ネットワークの一般化,スケーラビリティを実証し,流行の封じ込めや噂を流すネットワーク制御タスクについて評価する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:58:13 GMT)
ARCTraj: A Dataset and Benchmark of Human Reasoning Trajectories for Abstract Problem Solving [5.8] 本稿では、複雑な視覚的タスクを通して人間の推論をモデル化するためのデータセットと方法論のフレームワークであるARCTrajを提案する。
ARCTrajは、人間が入力を出力に反復的に変換する方法をキャプチャする、時間的に順序付けられたオブジェクトレベルのアクションを記録することでギャップに対処する。
さらに、データ収集、アクション抽象化、マルコフ決定プロセス(MDP)の定式化、下流学習を含む統一推論パイプラインを定義する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:11:14 GMT)
Complex-Weighted Convolutional Networks: Provable Expressiveness via Complex Diffusion [5.8] グラフニューラルネットワーク(GNN)は、様々なアプリケーションで顕著な成功を収めていますが、ヘテロ親和性のあるグラフ上での過度なスムーシングと低パフォーマンスによって制限され続けています。
グラフに複素重み付き構造を持たせる新しいフレームワークを導入し、各エッジに複素数を与え、ランダムなウォークを複素領域に拡大する拡散過程を駆動する。
本稿では,データから直接適切な複素重み付き構造を学習する複合重み付き畳み込みネットワーク(CWCN)を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:45:27 GMT)
Unlocking the Forgery Detection Potential of Vanilla MLLMs: A Novel Training-Free Pipeline [5.7] 画像偽造解析に適した訓練不要MLLMベースのパイプラインであるForeseeを提案する。
Foreseeはタイププライア駆動の戦略を採用し、コピー-ムーブ操作を処理するためにFlexible Feature Detectorモジュールを使用している。
提案手法は,より優れた局所化精度を実現し,より包括的なテキスト説明を提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:49:57 GMT)
Power Homotopy for Zeroth-Order Non-Convex Optimizations [5.7] GS-Powerは非次元最適化問題に対する新しいゼロ階法である。
競合するアルゴリズムの上位3位に一貫してランクインしている。
ImageNetの画像に対するブラックボックス攻撃で、少なくとも1位を獲得した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:54:30 GMT)
ZX-DB: A Graph Database for Quantum Circuit Simplification and Rewriting via the ZX-Calculus [5.7] 本稿では,グラフデータベース内で量子回路の単純化と書き換えを行うデータ駆動型システムZX-DBを紹介する。
ZX-DBはZX計算の書き直しルールを標準のopenCypherクエリとしてエンコードし、サンプルグラフデータベースエンジンであるMemgraphで実行する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:33:18 GMT)
A Global Spacetime Optimization Approach to the Real-Space Time-Dependent Schrödinger Equation [5.7] 本稿では,実空間TDSE,フェルミオン反対称時空間ネットワークを解くための汎用ニューラルネットワークフレームワークを提案する。
このアプローチは、TDSEをグローバル最適化問題として定式化し、ステップバイステップの伝搬を回避し、高度にカスタマイズ可能な並列トレーニングをサポートする。
我々のフレームワークは、時間依存量子システムの初期シミュレーションに新たな可能性を開く、従来の基底依存法や平均場法に代わる、非常に表現力の高い代替手段を提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:12:42 GMT)
Quantifying and Improving Adaptivity in Conformal Prediction through Input Transformations [5.6] コンフォーマル予測は、単一点予測の代わりにラベルの集合を構成する。
具体的困難への適応性は重要な特性である。
本稿では,推定困難度でサンプルをグループ化し,グループ条件の共形予測を適用した適応予測アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:21:34 GMT)
PAST: A Primary-Auxiliary Spatio-Temporal Network for Traffic Time Series Imputation [5.6] 本稿では,PAST(Pary-Auxiliary Spatio-Temporal Network)を提案する。
グラフ統合モジュール(GIM)とクロスゲートモジュール(CGM)から構成される。
27の欠落したデータ条件下での3つのデータセットの実験は、PASTが7つの最先端ベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:28:29 GMT)
Orientation-Free Neural Network-Based Bias Estimation for Low-Cost Stationary Accelerometers [5.5] 低コストのマイクロエレクトロメカニカル加速度計は、ナビゲーション、ロボティクス、そしてモーションセンシングと位置推定のためのコンシューマーデバイスで広く使われている。
定常条件下での加速度計バイアスを推定するモデルフリー学習ベースキャリブレーション法を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:15:24 GMT)
Uncertainty-aware Physics-informed Neural Networks for Robust CARS-to-Raman Signal Reconstruction [5.5] コヒーレント・アンチストークス・ラマン散乱(CARS)は、医学、物質科学、化学分析において広く用いられている強力で迅速な手法である。
ラベル付きデータセットを用いて測定されたCARSデータから真のラマンスペクトルを再構成するために深層学習法が用いられている。
本研究では,CARS-to-Raman信号再構成の文脈における様々な不確実性定量化(UQ)手法の評価と比較を行う。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:46:15 GMT)
Explainable RL Policies by Distilling to Locally-Specialized Linear Policies with Voronoi State Partitioning [5.4] そこで我々は,状態空間を,単純化された人間の理解可能なモデルが動作可能な領域に分割する,新しいモデルに依存しない手法を提案する。
本稿では,Voronoiパーティショニングを用いて,線形モデルが元のコントロラーと同じような性能が得られる領域を探索する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:58:38 GMT)
Robust Defense Strategies for Multimodal Contrastive Learning: Efficient Fine-tuning Against Backdoor Attacks [5.3] CLIPのようなマルチモーダルディープラーニングモデルは、敵の攻撃に対して安全ではない。
本研究では,このような攻撃に対するマルチモーダル・コントラスト学習モデルの堅牢性を高めるための革新的な戦略を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:16:50 GMT)
GEM: Generative Entropy-Guided Preference Modeling for Few-shot Alignment of LLMs [5.2] 本稿では,大規模言語モデル(LLM)のためのジェネレーティブエントロピー誘導選好モデリング手法GEMを提案する。
選好データに基づいて差別的な報酬モデルを訓練する代わりに、LLMを直接訓練してクローズドループ最適化アーキテクチャを内部化する。
一般的なベンチマークとドメイン固有のタスクの実験は、GEMが数ショットの選好データで大幅な改善を達成していることを示している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:04:47 GMT)
SymGS : Leveraging Local Symmetries for 3D Gaussian Splatting Compression [5.2] 3Dガウススプラッティングは、新しいビュー合成における変換技術として登場した。
我々のフレームワークは、最先端の圧縮手法のプラグ・アンド・プレイの強化として機能する。
SymGSは平均$bf108times$3DGSシーンの圧縮を可能にし、レンダリング品質を保っている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:26:09 GMT)
Aligning Machiavellian Agents: Behavior Steering via Test-Time Policy Shaping [5.2] モデル誘導型ポリシー整形に基づくテスト時間アライメント手法を提案する。
本手法は,多様な強化学習環境にまたがって,個々の行動特性を正確に制御する。
我々の結果は、テストタイムポリシーの整形が非倫理的行動を緩和するための効果的でスケーラブルなソリューションを提供することを示した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:49:46 GMT)
PoCGM: Poisson-Conditioned Generative Model for Sparse-View CT Reconstruction [5.1] スパースビューCT再構成の課題に対処するPoCGM(Poisson-Conditioned Generative Model)を提案する。
PoCGMは、トレーニングおよびサンプリングフェーズのガイダンスとしてスパースビューデータを組み込むことで、PFGM++を条件付き生成フレームワークに再構成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 22:53:37 GMT)
Fast and Robust Simulation-Based Inference With Optimization Monte Carlo [5.0] 本稿では,実行時間を大幅に削減した正確な後部推論を実現する,微分可能シミュレータの新しい手法を提案する。
我々の手法は、常に一致し、しばしば最先端の手法の精度を上回り、ランタイムを実質的なマージンで削減する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:07:36 GMT)
BrainNormalizer: Anatomy-Informed Pseudo-Healthy Brain Reconstruction from Tumor MRI via Edge-Guided ControlNet [5.0] BrainNormalizerは解剖学的にインフォームドされた拡散フレームワークで、腫瘍スキャンから直接擬似健康MRIを再構築する。
BrainNormalizerは、強い定量的性能を達成し、腫瘍に罹患した領域で、解剖学的にもっともらしい再構成を定性的に生成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 00:48:30 GMT)
You Only Look Omni Gradient Backpropagation for Moving Infrared Small Target Detection [4.8] 小型ターゲット検出のためのバックプロパゲーション駆動型特徴ピラミッドアーキテクチャBP-FPNを提案する。
この設計は理論的に基礎があり、計算のオーバーヘッドを無視し、既存のフレームワークにシームレスに統合することができる。
複数の公開データセットに対する大規模な実験は、BP-FPNが一貫して新しい最先端のパフォーマンスを確立していることを示している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:13:41 GMT)
Proceedings Seventh International Workshop on Formal Methods for Autonomous Systems [4.6] FMAS 2025は、第20回国際統合形式法会議(iFM'25)と共同開催された。
合計で、FMAS 2025はカナダ、中国、フランス、ドイツ、アイルランド、イタリア、日本、オランダ、ポルトガル、スウェーデン、アメリカ、イギリスといった機関の研究者から16件の提出を受けた。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:07:57 GMT)
Algorithms Trained on Normal Chest X-rays Can Predict Health Insurance Types [4.6] 従来の胸部X線検査から,患者の健康保険タイプ,社会経済的地位の強力な指標を予測することが可能であることを示す。
年齢、人種、性別が制御された場合でも信号は持続し、モデルが単一の人種グループでのみ訓練された場合でも検出可能である。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:02:28 GMT)
MAT-MPNN: A Mobility-Aware Transformer-MPNN Model for Dynamic Spatiotemporal Prediction of HIV Diagnoses in California, Florida, and New England [4.5] 郡レベルのHIV診断率を予測するための移動型トランスフォーマーパスニューラルネットワーク(MAT-MPNN)フレームワーク。
モデルでは、Transformerエンコーダによって抽出された時間的特徴と、モビリティグラフジェネレータを通じてキャプチャされた空間的関係を組み合わせる。
MAT-MPNNは平均角予測誤差(EMSP)をフロリダでは27.9%、カリフォルニアでは39.1%、ニューイングランドでは3.9%削減し、予測モデル選択基準(PMCC)をそれぞれ7.7%、3.5%、3.9%改善した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:10:37 GMT)
Practical Global and Local Bounds in Gaussian Process Regression via Chaining [4.5] 本稿では,予期しないデータに対する期待値の上限値と下限値を推定するための連鎖に基づくフレームワークを提案する。
また,特定入力における局所不確実性定量化手法を開発した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:26:40 GMT)
Artificial Intelligence-driven Intelligent Wearable Systems: A full-stack Integration from Material Design to Personalized Interaction [4.5] Human-Symbiotic Health Intelligence (HSHI)は、マルチモーダルセンサーネットワークとエッジクラウド協調コンピューティングを統合する調和したフレームワークである。
HSHIは、予防、適応性、および技術と健康管理の関係を強調するモデルに向かっている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:33:45 GMT)
HDW-SR: High-Frequency Guided Diffusion Model based on Wavelet Decomposition for Image Super-Resolution [4.4] ウェーブレット分解(HDW-SR)に基づく高周波誘導拡散ネットワークを提案する。
我々は残差マップのみに拡散を行い、ネットワークがより効率的に高周波情報復元に集中できるようにする。
合成データセットと実世界のデータセットの両方の実験は、HDW-SRが競合する超解像性能を達成することを示した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:25:26 GMT)
Topological quantum compilation for non-semisimple Ising anyons via monte carlo simulations [4.4] 本稿では、位相量子計算のための普遍的な量子ゲートセットの体系的な数値構成を提案する。
標準1量子ゲートの高忠実度近似を実現する。
この研究は、非半単純イジングエノンを用いた普遍量子計算への新たな経路を確立する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:01:19 GMT)
Warm-starting active-set solvers using graph neural networks [4.3] 本稿では,グラフニューラルネットワーク(GNN)を用いた二元能動集合解法DAQPの能動集合の予測手法を提案する。
問題のサイズは様々であり、GNNはコールドスタートに比べてソルバイテレーションの数を一貫して減らしている。
様々な問題サイズを訓練したGNNは、柔軟性とスケーラビリティを実証し、目に見えない次元に効果的に一般化する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:22:45 GMT)
Self-Adaptive Graph Mixture of Models [4.3] Self-Adaptive Graph Mixture of Models (SAGMM)は、最も適切なGNNモデルを自動的に選択して組み合わせることを学ぶモジュール式で実用的なフレームワークである。
我々は、ノード分類、グラフ分類、回帰、リンク予測タスクを含む16のベンチマークデータセット上でSAGMMを評価する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:11:06 GMT)
Weight-sparse transformers have interpretable circuits [4.2] 重みのほとんどをゼロに制約することで、より理解可能な回路を持つようにモデルを訓練する。
いくつかの手作り作業の根底にあるきめ細かい回路を復元する。
我々の研究は、前例のないレベルの人間の理解力を達成する回路を生み出している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:02:06 GMT)
Physics informed Transformer-VAE for biophysical parameter estimation: PROSAIL model inversion in Sentinel-2 imagery [4.2] 本稿では, キーキャノピーパラメータをSentinel-2データから同時推定するために, PROSAIL放射伝達モデルを逆変換する物理インフォームドトランスフォーマー-VAEアーキテクチャを提案する。
我々のモデルはシミュレーションデータにのみ訓練されるが、実際の画像を利用する最先端の手法と同等の性能を達成できる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:20:09 GMT)
What's in a Software Engineering Job Posting? [4.2] この記事では、ソフトウェア工学の仕事の投稿で強調された非技術的側面について考察する。
Thematic Analysis of 100 job postingsでは、雇用主が目的意識に合わせた候補者を探していることが示されています。
これらの期待を強調して、研究者、教育者、実践者、採用者に関連した洞察を提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:14:15 GMT)
Neo: Real-Time On-Device 3D Gaussian Splatting with Reuse-and-Update Sorting Acceleration [4.1] 3D Gaussian Splatting (3DGS)レンダリングをリソース制約のあるデバイス上でリアルタイムにレンダリングすることは、没入型拡張現実(AR/VR)体験を実現する上で不可欠である。
既存のソリューションは、特に高解像度レンダリングにおいて、高いフレームレートを達成するのに苦労している。
本稿では,ガウス順序の時間的冗長性を利用した再利用・更新ソートアルゴリズムであるNeoを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:37:13 GMT)
Quantum-classical gravity distinction in reservoir-engineered massive quantum system [4.0] 古典的な重力は、別の散逸チャネルを導入し、その結果、異なる絡み合い特性を生み出します。
提案手法は、量子重力の検証に関する実験的な要件を緩和し、その短期的な実現に向けた新たな道を開く。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:20:00 GMT)
PlugTrack: Multi-Perceptive Motion Analysis for Adaptive Fusion in Multi-Object Tracking [4.0] マルチパーセプティブな動作理解を通じて、カルマンフィルタとデータ駆動型動作予測器を適応的に融合するフレームワークであるPlugTrackを提案する。
PlugTrackは、既存のモーション予測器を変更することなく、MOT17/MOT20とDanceTrackの最先端のパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:03:11 GMT)
It's a Feature, Not a Bug: Secure and Auditable State Rollback for Confidential Cloud Applications [3.9] Reboundは、ロールバック保護を保護しつつ、ポリシーで承認されたアプリケーションバイナリ、設定、データのロールバックを可能にする汎用セキュリティフレームワークである。
キー・トゥ・リバウンド(Key to Rebound)は、状態遷移を仲介し、承認ポリシーを強制し、状態更新とロールバックのアトミック性を保証するリファレンスモニターであり、アプリケーションや監査者に透明性を提供する、見事なログを発行する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:53:47 GMT)
Delineate Anything Flow: Fast, Country-Level Field Boundary Detection from Any Source [3.8] Delineate Anything Flow (DelAnyFlow) は、大規模フィールド境界マッピングのための分解能に依存しないアプローチである。
このタイプの最大のデータセットであるFBIS 22Mには、672,909のマルチ解像度イメージパッチ(0.25-10m)と22.9万の検証済みフィールドインスタンスが含まれている。
DelAnyFlowは1台のワークステーションで6時間以内に、ウクライナのための完全なフィールド境界層(603,000km2)を作成した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:30:43 GMT)
Non-Linear Scoring Model for Translation Quality Evaluation [3.7] 分析翻訳品質評価(TQE)は、伝統的に1000-2000ワードの基準サンプルに校正された線形エラー対ペナルティ尺度を用いている。
本稿では, コンテンツ利用者が様々な長さのサンプルの翻訳品質をどう認識するかを反映した, 校正・非線形スコアリングモデルを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:09:22 GMT)
The Future of Food: How Artificial Intelligence is Transforming Food Manufacturing [3.6] 食品分野におけるAIの採用は、異質なデータセット、限られたモデルとシステムの相互運用性、データサイエンティストと食品分野の専門家の間の永続的なスキルギャップにより、いまだに不均一である。
これらの課題に対処し、イノベーションを推進すべく、AIFS(AI Institute for Next Generation Food Systems)は、第1回食品開発シンポジウム(AI for Food Product Development Symposium)を開催した。
この白書は、AIが最も短期的影響を持つことができる5つの領域を中心に組織されたシンポジウムから洞察を合成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:17:55 GMT)
Real-time distortion prediction in metallic additive manufacturing via a physics-informed neural operator approach [3.6] 本稿では,将来の15秒間におけるzおよびy方向予測のための物理インフォームド・スマートニューラルホライゾン演算子(PINO)を提案する。
PINOモデルの性能は、欠陥の制御におけるリアルタイムの時間歪み場予測の可能性を強調している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:37:04 GMT)
Arcee: Differentiable Recurrent State Chain for Generative Vision Modeling with Mamba SSMs [3.6] 状態空間モデル(SSM)は、長文シーケンスモデリングにますます採用されている。
最近の"Mamba-for-vision"変種は、非順序信号に対する厳密な因果関係を緩和するために、主に複数のスキャン順序を探索している。
Arceeはブロック間のリカレントステートチェーンであり、各ブロックの端末状態空間表現を再利用する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:00:42 GMT)
Measurement-based Dynamical Decoupling for Fidelity Preservation on Large-scale Quantum Processors [3.6] 動的デカップリング(DD)は、デコヒーレンスを抑制し、量子アルゴリズムの性能を維持するための重要な手法である。
本稿では,ノイズサブシステムの部分的な測定から制御単位ゲートを決定するDDプロトコルを提案する。
局所的なエネルギー緩和と劣化雑音下では、MDDは任意のDDスキームで達成可能な最大エンタングルメント忠実度を達成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:05:49 GMT)
Hybrid Convolution Neural Network Integrated with Pseudo-Newton Boosting for Lumbar Spine Degeneration Detection [3.5] 本稿では,DICOM画像を用いた腰椎変性の分類を行うための新しい拡張モデルアーキテクチャを提案する。
提案手法はPseudo-Newton Boosting層を組み込んだ従来の転写学習法と区別される。
このアーキテクチャは、0.9の精度、0.861のリコール、0.88のスコア、0.18の損失、88.1%の精度をベースラインモデルであるEfficientNetと比較して達成している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:54:52 GMT)
Data-driven Acceleration of MPC with Guarantees [3.5] 我々は、オンライン最適化をオフラインMPCソリューションから構築された非パラメトリックポリシーに置き換えることで、MPCを高速化するデータ駆動フレームワークを提案する。
我々の政策は最適コスト・ツー・ゴーに構築された上限に対して厳格であり、非パラメトリックなルックアップルールとして実装することができる。
我々の実験では、このポリシーは標準のMPCの100倍から1000倍の速度で、最適性にはわずかしか影響せず、リアルタイム制御タスクの可能性を示している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:51:23 GMT)
Why is "Chicago" Predictive of Deceptive Reviews? Using LLMs to Discover Language Phenomena from Lexical Cues [3.5] 大規模言語モデルでは,機械学習した語彙列を人間の理解可能な言語現象に変換することができる。
これらの言語現象は、オンラインレビューの信頼性を批判的に評価するのに役立つ可能性がある。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:15:13 GMT)
Quantum Mpemba Effect Induced by Non-Markovian Exceptional Point [3.4] 量子ムペンバ効果(Quantum Mpemba effect)は、加速緩和の異常現象を記述している。
非マルコフ的例外点による量子ムペンバ効果を実現するメカニズムを提案する。
我々の研究は、量子システムにおけるエネルギーと情報の伝達を加速する方法を開拓する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:22:01 GMT)
Fully Differentiable dMRI Streamline Propagation in PyTorch [3.4] トラクトグラフィーは、dMRIを用いて脳内の白質経路を可視化する技術である。
ほとんどの拡散トラクトグラフィ法は、手続き的流線形プロパゲータや大域的エネルギー最小化法に依存している。
本稿では,主ストリームラインアルゴリズムを用いて数値忠実度を保った完全微分可能解を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:31:47 GMT)
uCLIP: Parameter-Efficient Multilingual Extension of Vision-Language Models with Unpaired Data [3.4] 我々は多言語視覚言語アライメントのための軽量でデータ効率の良いフレームワークを提案する。
本手法では,画像テキストペアやテキストペアは必要とせず,事前訓練された画像エンコーダと多言語テキストエンコーダの両方を凍結する。
この最小限のトレーニング設定は、監督が限られている言語でも堅牢な多言語アライメントを可能にする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:34:49 GMT)
Privacy Challenges and Solutions in Retrieval-Augmented Generation-Enhanced LLMs for Healthcare Chatbots: A Review of Applications, Risks, and Future Directions [3.4] 検索増強世代 (RAG) は, 大規模言語モデルを臨床・生物医療システムに統合するための転換的アプローチとして急速に発展してきた。
このレビューは、医療におけるRAGアプリケーションの現状を詳細に分析する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:23:50 GMT)
The correlated matching decoder for the 4.8.8 color code [3.4] 本稿では,4.8.8カラーコードに対する相関デコーダを提案する。
制限格子間の相関を利用して従来の制限付きデコーダを改善する。
これは、統合デコーダの性能を非常に低い物理エラー率で一致させる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:57:09 GMT)
Physics-Informed Neural Networks for Nonlinear Output Regulation [3.3] 本研究は非線形システムの完全情報出力制御問題に対処する。
この設定では、ゼロ規制エラー多様体(w)とフィードフォワード入力c(w)を構築することにより、完全追跡または拒絶を実現する。
この枠組みはヘリコプターの垂直ダイナミックスと調和振動するプラットフォームを同期させる規制タスクで検証される。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:55:42 GMT)
Causal Reinforcement Learning based Agent-Patient Interaction with Clinical Domain Knowledge [3.2] 強化学習(RL)は、データが不足している認知症ケアなど、適応的な医療介入において重大な課題に直面している。
本稿では、因果発見と推論をポリシー最適化に明示的に統合する、因果構造対応強化学習(CRL)と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 22:38:03 GMT)
Examining the Usage of Generative AI Models in Student Learning Activities for Software Programming [3.2] 本研究では,GenAI支援が従来のオンラインリソースとどのように比較して,知識の獲得を支援するかを検討する。
プログラミング経験の異なる24人の大学生を対象に,制御されたユーザ実験を行った。
以上の結果から,GenAIによる完全解の生成は,特に初心者のタスク性能を著しく向上させるが,必ずしも知識の獲得には至らないことが明らかとなった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:42:24 GMT)
Local Collaborative Filtering: A Collaborative Filtering Method that Utilizes Local Similarities among Users [3.2] 本稿では,LCF(Local Collaborative Filtering)と呼ばれる新しい協調フィルタリング手法を提案する。
LCFは、ユーザ間の局所的な類似性を利用し、大数の法則(LLN)を用いてデータを統合する。
実験はSteamゲームデータセット上で行われ、LCFの結果は現実世界のニーズと一致している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:10:37 GMT)
Compact Multimodal Language Models as Robust OCR Alternatives for Noisy Textual Clinical Reports [3.2] 本研究は,コンパクトなマルチモーダル言語モデルを,ノイズのある臨床文書の書き起こしのためのプライバシ保護代替手段として評価する。
我々は、転写精度、雑音感度、数値精度、計算効率の点で8つのシステムを比較した。
高い計算コストにもかかわらず、その堅牢性と言語適応性は、それらをオンプレミスの医療デジタル化の候補として位置づけている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:58:03 GMT)
Enriching Historical Records: An OCR and AI-Driven Approach for Database Integration [3.2] この研究は1983年から1985年にかけて書かれた『Leidse hoogleraren en lectoren 1575-1815』をデジタル化し分析した。
OCR、解釈、データベースリンクを統合して、過去の文書画像から既存の高品質のデータベースレコードに調和させる自動パイプラインをどうやって設計できるのか?
我々は、OCR技術、データ抽出を構造化する生成AI復号法、データベースリンク法を適用して、OCRから抽出した文字誤り率(CER)が1.08%、ワード誤り率(WER)が5.06パーセントに達した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:13:42 GMT)
SAE-MCVT: A Real-Time and Scalable Multi-Camera Vehicle Tracking Framework Powered by Edge Computing [3.0] 我々は,最初のスケーラブルリアルタイムMCVTフレームワークであるSAE-MCVTを提案する。
SAE-MCVTは2K 15 FPSビデオストリーム上でリアルタイムに動作し,IFF1スコアが61.2であることを示す。
これは、都市規模のデプロイメントに適した、初めてのスケーラブルなリアルタイムMCVTフレームワークである。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:55:14 GMT)
Mapping fNIRS Signals to Agent Performance: Toward Reinforcement Learning from Neural Feedback [2.9] Reinforcement Learning from Human Feedback (RLHF) は、エージェントのトレーニングプロセスに人間のフィードバックを統合することで、エージェントの行動と人間の嗜好を整合させる方法論である。
我々は、暗黙の神経信号からエージェントトレーニングを誘導するために、受動的脳-コンピュータインタフェース(BCI)を利用する可能性のあるフレームワークを紹介する。
筆者らは, ピック・アンド・プレイス・ロボット, ルナー・ランダー, フラッピーバードという3つの領域にわたる25人の被験者から収集した, 機能的近赤外分光法(fNIRS)のデータセットを作成した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 00:21:46 GMT)
Uncovering Causal Drivers of Energy Efficiency for Industrial Process in Foundry via Time-Series Causal Inference [2.9] 本稿では, 誘導炉溶融におけるエネルギー効率に直接影響を与える運転要因を特定するために, 時系列因果推定フレームワークを適用した。
デンマークの鋳造所の生産データを用いて、この研究は時系列クラスタリングを統合し、融解サイクルを別の運用モードに分割する。
クラスター全体にわたって、エネルギー消費、炉温度、材料重量の堅牢な因果関係は、効率のコアドライバを定義し、電圧は、遅延応答を伴う冷却水温に一貫して影響を及ぼす。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:00:00 GMT)
Discovering Operational Patterns Using Image-Based Convolutional Clustering and Composite Evaluation: A Case Study in Foundry Melting Processes [2.9] 本稿では,一変量時系列データにおける運用モードの教師なし発見のための新しいフレームワークを提案する。
北欧の鋳造所からの3900以上の溶融炉の操業に適用される。
このフレームワークは、シーケンスの不規則性、重複モード、メートル法の不整合など、教師なしの時系列分析における重要な課題に対処する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:50:44 GMT)
Generalized Denoising Diffusion Codebook Models (gDDCM): Tokenizing images using a pre-trained diffusion model [2.8] 近年,Denoising Diffusion Codebook Models (DDCM) が提案されている。
本稿では,一般化デノイング拡散圧縮モデル(gDDCM)を提案する。
実験により, DDCMのモデルへの一般化に成功し, 性能向上を実現した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:58:49 GMT)
A Generalized Spectral Framework to Expain Neural Scaling and Compression Dynamics [2.8] 実証的なスケーリング法則は、テスト損失やその他のパフォーマンス指標がどのようにモデルのサイズ、データセットのサイズ、計算に依存するかを記述する。
本稿では,一般的な機能的アンザッツの下での学習力学と圧縮現象を統一するスペクトルフレームワークを開発する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:55:03 GMT)
RefineVAD: Semantic-Guided Feature Recalibration for Weakly Supervised Video Anomaly Detection [2.8] Weakly-Supervised Video Anomaly Detectionは、ビデオレベルのラベルのみを使用して異常なイベントを特定することを目的としている。
既存の手法は、全ての異常事象を単一のカテゴリとして扱うことで、しばしば異常空間を単純化する。
この二重プロセス推論を模倣する新しいフレームワークであるRefineVADを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:15:34 GMT)
Skeleton of isometric Tensor Network States for Abelian String-Net Models [2.8] 我々は、アーベルトポロジカル秩序の位相を探索できるパラメータ化された等尺テンソルネットワーク状態(スケルトンと呼ばれる)を構築した。
任意の重みを持つ一般化されたパウリ弦の期待値は、古典的手法を用いて効率的に計算できることを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:00:02 GMT)
Jailbreaking Large Vision Language Models in Intelligent Transportation Systems [2.7] 本稿では,インテリジェントトランスポーテーションシステムに組み込まれたLVLMの脆弱性を系統的に解析する。
画像タイポグラフィ操作とマルチターンプロンプトによりLVLMの脆弱性を悪用する新しいジェイルブレイク攻撃を導入する。
モデルが不適切な応答を発生させないための多層型応答フィルタリング防衛手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:29:48 GMT)
Counterfactual Explainable AI (XAI) Method for Deep Learning-Based Multivariate Time Series Classification [2.7] 多変量時系列分類のための新しい多目的対実説明法(CE)を提案する。
ConFETTI は、重要な MTS サブシーケンスを特定し、反ファクトターゲットを特定し、予測の信頼性、近接性、スパーシリティのバランスをとるために、時系列を最適に修正する。
常に最先端のCEメソッドを最適化の目的、および文献の他の6つの指標で上回っている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:00:43 GMT)
From Black-Box to White-Box: Control-Theoretic Neural Network Interpretability [2.6] 我々は、局所線形化、制御可能性、可観測性グラミアン、ハンケル特異値を用いて、訓練されたニューラルネットワークの内部計算を分析する。
本稿では,1 2 2 1 SwiGLUネットワークと2 3 3 2 GELUネットワークを含む,単純なフィードフォワードネットワークのフレームワークについて説明する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 00:47:33 GMT)
Weakly Supervised Ephemeral Gully Detection In Remote Sensing Images Using Vision Language Models [2.6] 本研究は,エフェメラルガリー検出のための第1の弱教師付きパイプラインについて述べる。
本手法はリモートセンシングに依存し,視覚言語モデル(VLM)を用いて手動ラベリングの作業を大幅に削減する。
また,リモートセンシング画像から短腸の半教師付き検出を行うための第1種データセットも利用可能である。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:29:44 GMT)
Rethinking the filter bubble? Developing a research agenda for the protective filter bubble [2.5] フィルタ気泡の有害な影響はよく研究されている。
例えば、フィルターバブルは情報サイロを作成し、誤情報を増幅し、憎しみと過激主義を促進する。
しかし、フィルターバブルの反対側、保護効果を考慮する研究は比較的少ない。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:03:08 GMT)
Pico-Cloud: Cloud Infrastructure for Tiny Edge Devices [2.5] Pico-CloudはRaspberry Pi Zeroのような超最小のハードウェアプラットフォーム上に構築された、マイクロエッジクラウドアーキテクチャである。
我々は、そのアーキテクチャモデルを示し、農村接続、教育クラスタ、エッジAI推論などの代表的なユースケースを概説し、計算、ネットワーク、ストレージ、電力管理における設計上の課題を分析する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:13:17 GMT)
Assessing Large Language Models in Generating RTL Design Specifications [2.4] エンジニアは現在、既存のRTLコードを手動で解釈し、仕様書を書く必要がある。
提案手法がRTL-to-specificationの品質にどのように影響するかを考察し、生成した仕様を忠実に評価するための指標を導入する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:06:24 GMT)
Depth Optimization of Ansatz Circuits for Variational Quantum Algorithms [2.3] 量子回路の深さの増大は、量子アルゴリズムの実行に大きな制限を与える。
追加のキュービット、中間回路計測、古典的に制御された操作を導入することで、それらの深さを低減できることを示す。
特に, 提案した非単体量子回路は, 層流および乱流状態の流路構成を効率的に表現できることを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:14:14 GMT)
Towards Quantum Software for Quantum Simulation [2.3] 量子シミュレーションソフトウェアスタックにおける臨界ギャップを同定する。
モジュラーモデル駆動工学(MDE)アプローチを提唱する。
スケーラブルでクロスプラットフォームなシミュレーションをサポートする量子シミュレーションフレームワークの構想を概説する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:53:37 GMT)
NeuroLex: A Lightweight Domain Language Model for EEG Report Understanding and Generation [2.2] NeuroLexは、EEGレポートテキストに基づいて純粋にトレーニングされた軽量なドメイン適応型言語モデルである。
NeuroLexは脳波レポートの言語的および診断的特徴に合わせている。
バイオメディカルテキストモデリングとブレイン・コンピュータ・インタフェースを橋渡しする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 00:44:35 GMT)
MRIQT: Physics-Aware Diffusion Model for Image Quality Transfer in Neonatal Ultra-Low-Field MRI [2.2] 可搬型超低磁場MRI (uLF-MRI) は新生児医療に利用できる神経画像を提供するが、低信号対雑音比と診断精度の低下に悩まされている。
ULFからHF MRIへの画像品質伝達のための3次元条件拡散フレームワークであるMRIQTを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:51:11 GMT)
Beyond Citations: A Cross-Domain Metric for Dataset Impact and Shareability [2.2] X-インデックス(X-index)は、2段階のプロセスを通じてデータコントリビューションの価値を定量化する、新しい著者レベルのメトリクスである。
専門家評価に対する我々のアプローチを検証し、強い相関性を達成する。
X-indexは持続可能なデータ共有の実践を奨励し、機関、資金提供者、プラットフォームに、研究データセットの持続的な影響を認識するための具体的な方法を提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:45:19 GMT)
MACKO: Sparse Matrix-Vector Multiplication for Low Sparsity [2.1] MACKO-SpMVはGPU最適化フォーマットであり、ストレージオーバーヘッドを減らすためにカーネルが共同設計されている。
疎度50%のMACKOは、高密度表現に対する1.5倍のメモリ削減と1.2-1.5倍のスピードアップを持つ最初のアプローチである。
Llama2-7BをWandaに50%の間隔で適用することで、fp16精度で1.5倍のメモリ削減と1.5倍高速な推論を実現する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:10:37 GMT)
Cognitive Maps in Language Models: A Mechanistic Analysis of Spatial Planning [2.1] 我々はグリッド環境における3つの空間学習パラダイムに基づいてGPT-2モデルを訓練する。
行動、表現、機械的分析を用いて、2つの基本的な異なる学習アルゴリズムを明らかにする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:46:19 GMT)
Quantifying consistency and accuracy of Latent Dirichlet Allocation [2.1] 確率論的トピックモデルは、その性質により再実行時に異なる結果を生成することができ、潜在トピックの不整合を引き起こす。
この不安定性は、複製性、信頼性、解釈に影響を与え、トピックモデルが意味のあるトピックをキャプチャするかどうか、あるいは単にノイズをキャプチャするかどうかに関する懸念を提起する。
LDAが文書中のトピック数を正確に決定できることが示される。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 00:44:27 GMT)
Language-Guided Invariance Probing of Vision-Language Models [2.1] 本稿では,Language-Guided Invariance Probing (LGIP)を導入し,画像テキストマッチングにおけるパラフレーズへの不変性と意味的フリップに対する感度を測定する。
EVA02-CLIPおよび大きなOpenCLIP変異体は、低パラフレーズ誘発の変動と、元のキャプションのスコアを一定に高め、好適な不変感度フロンティア上にあることを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:35:49 GMT)
Human-Centred Requirements Engineering for Critical Systems: Insights from Disaster Early Warning Applications [2.0] 本論では,人間中心の側面を考えることが信頼性の重要な次元であると主張している。
社会的責任を重要なシステム開発に組み込むために設計された、人間中心のREプロセスを提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 01:02:12 GMT)
Boosting Reinforcement Learning in 3D Visuospatial Tasks Through Human-Informed Curriculum Design [2.0] 本研究は、知的行動の実証におけるRLの可能性と、より複雑で構造化されていない問題領域への対処の進展について考察する。
本稿では,現代のRLフレームワークが,一見単純な3次元同一差分空間課題に対処する能力について検討する。
PPO、行動クローニング、模倣学習など最先端の手法の初期応用は、最適な戦略を直接学習する上での課題を明らかにしたが、カリキュラム学習の成功する実装は、有望な道のりを提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:28:07 GMT)
GAEA: Experiences and Lessons Learned from a Country-Scale Environmental Digital Twin [1.9] 本稿では,キプロス島における3年間にわたる大規模環境デジタル双生児の展開から得られた経験と教訓について述べる。
このデジタル双生児はGAEAと呼ばれ、27の環境地理空間サービスがあり、都市プランナー、政策立案者、農家、不動産所有者、不動産および林業の専門家に適している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:37:38 GMT)
QwenCLIP: Boosting Medical Vision-Language Pretraining via LLM Embeddings and Prompt tuning [1.9] 対照的な言語画像訓練(CLIP)は、医療領域における視覚言語タスクの強力な一般化を実証している。
CLIPのテキストエンコーダは77個のトークンしか受け入れないため、長く情報に富んだ放射線学レポートを表現できない。
QwenCLIPはCLIPのテキストエンコーダを大きな言語モデル(LLM)ベースの埋め込みモジュールに置き換える視覚言語フレームワークである。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:51:59 GMT)
KANGURA: Kolmogorov-Arnold Network-Based Geometry-Aware Learning with Unified Representation Attention for 3D Modeling of Complex Structures [1.8] 我々はKANGURA: Kolmogorov-Arnold Network-Based Geometry-Aware Learning with Unified Representation Attentionを提案する。
Kolmogorov-Arnold Network(KAN)に基づく表現学習は、従来の多層パーセプトロン(MLP)を使わずに幾何学的関係を再構築する関数分解問題として予測を定式化する。
実験の結果、KANGURAはModelNet40ベンチマークデータセットで15以上の最先端(SOTA)モデルより優れ、92.7%の精度を実現し、現実世界のMFCアノード構造問題において97%の精度で優れていた。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:25:09 GMT)
Sequences of Bivariate Bicycle Codes from Covering Graphs [1.8] 元のTannerグラフのカバーグラフを増大させ,新たなBB符号の無限列を生成することができることを示す。
グラフ被覆写像を連鎖写像に拡張することにより、(co)ホモロジー上の誘導射影および持ち上げ写像が存在することを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:26:15 GMT)
Accuracy is Not Enough: Poisoning Interpretability in Federated Learning via Color Skew [1.7] 敵対的クライアントが適用した小さなカラー摂動は、モデルの正当性マップを意味論的に意味のある領域から切り離すことができることを示す。
我々の攻撃は、Grad-CAMの説明におけるピークアクティベーションの重複を最大35%削減し、すべての評価データセットで96%以上の分類精度を維持する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:07:54 GMT)
DANCE: Density-agnostic and Class-aware Network for Point Cloud Completion [1.7] ポイント雲の完成は、不完全な3Dスキャンから欠落した幾何学的構造を復元することを目的としている。
DANCEは、観測された幾何学を保ちながら、欠落した領域のみを完成させる新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 01:28:46 GMT)
The Grain Family of Stream Ciphers: an Abstraction, Strengthening of Components and New Concrete Instantiations [1.7] 本稿では,ストリーム暗号のGrainファミリーを抽象的に定義する。
また、コンポーネントの新しい、そして強化された定義も提供する。
ストリーム暗号の具体的な提案が7つ提案されている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:08:32 GMT)
A Novel Hierarchical Integration Method for Efficient Model Merging in Medical LLMs [1.7] 大規模言語モデル(LLM)は、分散医療において重大な課題に直面します。
本稿では,2つのアーキテクチャに適合する医療用LLMに適用した6つのパラメータ空間マージ手法の体系的評価について述べる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:47:27 GMT)
Non-stationary and Varying-discounting Markov Decision Processes for Reinforcement Learning [1.6] 非定常的・分散的MDPフレームワークを導入し、非定常性を自然に許容し、時間や遷移に応じて割引率を変化させる。
我々はNVMDPの理論的基礎を確立し、仮定、状態値、行動値の定式化、再帰を含む。
我々は動的プログラミングと一般化されたQ-ラーニングアルゴリズムをNVMDPに適応し、公式な収束証明を行う。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:00:04 GMT)
An International Agreement to Prevent the Premature Creation of Artificial Superintelligence [1.6] 本報告では, 人工超知能の早期発達を防止するための国際協定を提案する。
この合意は、現在の安全なAIアプリケーションへのアクセスを維持しながら、危険なAI能力の進歩を停止する。
当事者間の信頼が欠如しているため、検証は合意の重要な部分である。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:16:23 GMT)
Energy Consumption of Dataframe Libraries for End-to-End Deep Learning Pipelines:A Comparative Analysis [1.6] 本稿では,Pythonデータ操作ライブラリであるPandas, Polars, Daskの3つのパフォーマンスの比較分析を行った。
この研究は、データローディング、前処理、バッチフィードといった重要なフェーズにおいて、これらのライブラリがGPUワークロードとどのように相互作用するかを研究することで、既存の文献のギャップを埋める。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:13:05 GMT)
Likelihood-guided Regularization in Attention Based Models [1.6] 視覚変換器(ViTs)のための確率誘導型変分型Ising型正規化フレームワークを提案する。
そこで,Ising正則化器は,不確実性を考慮した注意機構を通じて,精度の高い確率推定と構造的特徴選択を導出することを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:38:09 GMT)
How Good is BLI as an Alignment Measure: A Study in Word Embedding Paradigm [1.5] 2つの埋め込み空間のアライメントの程度を評価する尺度として,BLIの強度と限界について検討する。
我々は,従来の埋め込みアライメント技術,新しい多言語モデル,複合アライメント技術がいかにBLIタスクを実行するかを評価する。
そこで本研究では,入力された言語の性質を考慮に入れた2つの組込み空間を評価するための,新しいステムベースBLI手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:41:41 GMT)
Scientific Data Compression and Super-Resolution Sampling [1.4] 本稿では, 指数関数族学習の最近の進歩を基盤として, 科学的データ圧縮と超解像のための新しい枠組みを提案する。
本手法は, 物理量の不確かさを保存・定量化し, 圧縮比と復元忠実度との柔軟なトレードオフを支援する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:31:57 GMT)
Toward Conversational Hungarian Speech Recognition: Introducing the BEA-Large and BEA-Dialogue Datasets [1.4] ハンガリー語音声コーパス BEA の未処理部分から構築した BEA-Large と BEA-Dialogue という2つの新しいデータセットを紹介した。
BEA-LargeはBEA-Baseを拡張し、433人の話者による255時間の自発的なスピーチを、詳細なセグメントレベルのメタデータで豊かにする。
BEA-ダイアログ(BEA-Dialogue)は、自然対話を話者に依存しないサブセットに分割したハンガリー語音声コーパスである。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:02:08 GMT)
LinkXplore: A Framework for Affordable High-Quality Blockchain Data [1.4] LinkXploreは、オンチェーンデータの収集と管理のための最初のオープンフレームワークである。
これにより、RPCクエリやストリームから直接生データを解析することで、コストのかかるブロックチェーンデータプロバイダをバイパスすることができる。
これにより、限られた予算を持つ研究者と開発者の両方にとって、現実的な代替手段となる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:56:07 GMT)
A Workflow for Full Traceability of AI Decisions [1.3] AIシステムの最先端は、意思決定プロセスの適切なドキュメントに関してほとんど努力しません。
本稿では、自動化された意思決定のトレーニングや推論に進む各コンポーネントのドキュメンテーションを強制することによって、この問題に対して急進的で実践的なアプローチをとる。
これは、AI決定の改ざん、検証、徹底的なトレースの生成をサポートする最初の実行ワークフローを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:24:15 GMT)
What Works for 'Lost-in-the-Middle' in LLMs? A Study on GM-Extract and Mitigations [1.3] GM-Extract は制御変数の検索において LLM 性能を評価するために慎重に設計された新しいベンチマークデータセットである。
2つのマルチドキュメントタスク(キー値抽出と質問応答)における7-8Bパラメータモデルの体系的評価を行う。
明瞭なU字曲線は一貫して観測されなかったが,本研究では,モデル間での明らかな性能パターンを明らかにした。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:50:50 GMT)
Randomized Controlled Trials for Phishing Triage Agent [1.3] 本稿では,ドメイン固有のAIエージェントがアナリストの生産性と精度に与える影響を評価するために,最初のランダム化制御試験(RCT)を提案する。
エージェント強化アナリストは、アナリスト毎分あたりの真正値の最大6.5倍、予測精度がコントロールグループに比べて77%向上した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:23:08 GMT)
Towards Multimodal Representation Learning in Paediatric Kidney Disease [1.2] 本研究では,縦断的な実験室配列と人口統計情報を統合する時間的モデリング手法について検討した。
これらのデータに基づいてトレーニングされた反復神経モデルを用いて、30日以内に子供が異常な血清クレアチニン値を記録するかどうかを予測した。
パイロット研究として評価されたこの研究は、単純な時間的表現が日常的な小児医学データで有用なパターンを捉えることができるという最初のデモンストレーションを提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:50:21 GMT)
Quantum Advantage in Learning Mixed Unitary Channels [1.2] 魚介類情報を用いた混成ユニタリチャネル学習の課題について検討する。
我々の結果は、サンプルの複雑さが$fracrdvarepsilon2$で、$r$はチャネルのランクであることを示している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:37:33 GMT)
Bi-View Embedding Fusion: A Hybrid Learning Approach for Knowledge Graph's Nodes Classification Addressing Problems with Limited Data [1.0] Bi-Viewは、ナレッジグラフのノード機能の情報的内容を増加させる、新しいハイブリッドアプローチである。
このアプローチは、特に初期機能に乏しいシナリオにおいて、ダウンストリームタスクのパフォーマンスを改善します。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:45:14 GMT)
InfoDecom: Decomposing Information for Defending against Privacy Leakage in Split Inference [1.0] 分割推論(SI)により、ユーザは生データを直接送信することなく、ディープラーニング(DL)サービスにアクセスできるようになる。
データ再構築アタック(DRA)は、クライアントからサーバに送信されたスマッシュされたデータから元の入力を復元する。
本稿では,まず冗長な情報を分解して除去し,理論的に保証されたプライバシを提供するために校正されたノイズを注入する防衛フレームワークInfoDecomを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:36:40 GMT)
Recognition of Abnormal Events in Surveillance Videos using Weakly Supervised Dual-Encoder Models [1.0] 我々のフレームワークは、トップkプーリングによる畳み込みとトランスフォーマー表現を組み合わせて、UCF-Crimeデータセットの曲線(AUC)の90.7%の領域を達成している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:47:28 GMT)
Can Newtonian Gravity Produce Quantum Entanglement? [1.0] 本論では,物質-重力相互作用の具体的なシナリオについて考察する。
我々は、ニュートン重力を介して相互作用する質量四重極のパリティを持つメソスコピック量子体が、量子体によってもたらされる重力潮流場のパリティが量子化される場合にのみ絡み合うことを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:21:26 GMT)
Randomized Controlled Trials for Conditional Access Optimization Agent [1.0] Microsoft Entraにおける条件アクセス(CA)ポリシー管理のためのAIエージェントの評価を行った最初のランダム化制御試験(RCT)の結果を報告する。
エージェントアクセスは、精度が48%向上し、タスク完了時間が43%低下し、精度が一定であった。
これらの結果から, 汎用AIエージェントは, アイデンティティ管理における速度と精度の両方を著しく向上させることができることがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:33:03 GMT)
Ontology-Driven Model-to-Model Transformation of Workflow Specifications [0.9] Smart FormsやSmart Flowといったプロプライエタリな言語は、プロセスの知識をクローズドなフォーマットにロックするため、相互運用性と再利用を妨げる。
私たちは、ビジネスプロセスモデルと表記にドメイン固有の定義をサポートするオントロジー駆動のモデル・ツー・モデルパイプラインを導入します。
私たちは、Serior Técnico(IST)のSmart Forms & Smart Flowのためのパイプラインをインスタンス化し、標準準拠のBPMNダイアグラムを生成するコンバータを実装しました。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:16:19 GMT)
Emulation of the Six-State Quantum Key Distribution Protocol with Pulsed Lasers [0.9] 本稿では,6状態量子鍵分布プロトコルを探索する枠組みを提案する。
このアプローチはマルチバス符号化の基本原理を強調し、実験的な測定が理論的な期待とどのように直接結びつくかを実証する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:26:15 GMT)
Tractable Probabilistic Models for Investment Planning [0.9] 発電や送電の拡充などの電力事業への投資計画には、深刻な不確実性の下で10年にわたる予測が必要である。
本稿では, トラクタブル確率モデル(TPM), 特にサプライズネットワーク(SPN)を用いた代替手法を提案する。
TPMは、シナリオ可能性、限界、条件付き確率などの重要な量の正確でスケーラブルな推論を可能にする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:23:34 GMT)
A Quantum Tensor Network-Based Viewpoint for Modeling and Analysis of Time Series Data [0.8] 本稿では,量子物理学に基づく新しいホワイトボックス法を提案する。
時系列データベクトルのカーネル平均埋め込み(KME)をカーネルヒルベルト空間(RKHS)にマッピングすることにより、テンソルネットワークにインスパイアされた1Dスピンチェーンハミルトニアンを構築する。
次に、関連するシュルディンガー方程式を解き、摂動理論を適用して不確実性を定量化し、量子テンソルネットワークモデルを用いて実行されるタスクの解釈可能性を改善する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:49:17 GMT)
ScoresActivation: A New Activation Function for Model Agnostic Global Explainability by Design [0.8] デザインによるグローバルな説明可能性に対する新たな差別化可能なアプローチを導入する。
特徴重要度推定を直接モデルトレーニングに統合する。
提案手法は, SHAP値と地道的特徴重要度に整合した, グローバルに忠実で安定した特徴ランクを導出する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:10:34 GMT)
A FEDformer-Based Hybrid Framework for Anomaly Detection and Risk Forecasting in Financial Time Series [0.8] 本研究では,金融時系列における異常検出とリスク予測のためのFEDformer-based Hybrid Frameworkを提案する。
周波数拡張分解変換器(FEDformer)と残差ベースの異常検出器とリスク予測ヘッドを統合している。
S&P 500, NASDAQ Composite, Brent Crude Oil データセット (2000-2024) を用いて行った実験は, ベンチマーク法よりも提案モデルの方が優れていることを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:09:04 GMT)
Reconstruction of Manifold Distances from Noisy Observations [0.7] 雑音の対距離観測から多様体の内在幾何学を再構築する問題を考察する。
十分密集した$M$のサブサンプルにおいて、点間のすべての距離を復元する新しい枠組みを開発する。
サンプリング確率の定量的な下限は、最初のアルゴリズムでクラスタ構造を変更し、すべてのリカバリ保証を拡張するのに十分であることを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:24:31 GMT)
Lost in the Pipeline: How Well Do Large Language Models Handle Data Preparation? [0.7] 本稿では,データ作成タスクの選択と自動化において,大規模言語モデルがユーザを効果的に支援できるかどうかを検討する。
私たちはこれらのモデルを質の悪いデータセットで促し、データプロファイリングやクリーニングといったタスクを実行する能力を測定しました。
大規模言語モデルの能力を評価するため,ユーザスタディを通じて検証されたカスタムデザインの品質モデルを開発した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:06:22 GMT)
Asymptotic confidence bands for centered purely random forests [0.7] そこで,本研究では,エレンフェストを中心とする優良無作為林(Ehrenfest centered purely無作為林)という,新種の優良無作為林を提案する。
我々の主要な信頼バンド定理は、どちらのランダムな森にも当てはまる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:09:01 GMT)
Topological Phases in Non-Hermitian Nonlinear-Eigenvalue Systems [0.7] 我々は、非エルミート非線形固有値系のクラスにおける位相位相の完全なBBCと位相的特性を確立する。
注目すべきは、非ハーミティティーと非線形性の間の相互作用が、エキゾチックな複素バンド位相を生み出すことである。
この結果は非線形トポロジカル位相の族を豊かにし、メタマテリアルシステムにおける新しいトポロジカル物理の探索の基礎を築いた。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:25:17 GMT)
Towards Continuous Assurance with Formal Verification and Assurance Cases [0.5] 我々は、トレース可能なモデル駆動ワークフロー内に設計時、実行時、進化時保証を統合する統合された継続的保証フレームワークを提案する。
我々は,核検査ロボットのシナリオに対するアプローチを実証し,三元AI原則との整合性について議論する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:42:38 GMT)
Moving Pictures of Thought: Extracting Visual Knowledge in Charles S. Peirce's Manuscripts with Vision-Language Models [0.5] ダイアグラムは、多くの分野において不可欠だが未調査のツールである。
彼らの象徴的な形態は、視覚研究、メディカル分析、テキストベースのデジタルキャプションに障害をもたらす。
ビジュアル言語モデル(VLM)は、そのようなハイブリッドページをコンテキスト内で識別し、解釈するのに役立ちます。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:52:23 GMT)
Tissue Aware Nuclei Detection and Classification Model for Histopathology Images [0.5] 組織認識核検出(TAND, tissue-Aware Nuclei Detection)は, 関節核の検出と分類を実現する新しいフレームワークである。
TANDは、ConvNeXtベースのエンコーダデコーダと凍結したVirchow-2組織セグメンテーションブランチを結合し、セマンティック組織確率は分類ストリームを選択的に調節する。
TANDは最先端のパフォーマンスを達成し、組織に依存しないベースラインとマスクを監督する手法の両方を超越する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:21:05 GMT)
A Brain Wave Encodes a Thousand Tokens: Modeling Inter-Cortical Neural Interactions for Effective EEG-based Emotion Recognition [0.4] 本稿では,潜時空間における脳の皮質間神経力学をモデル化するTransformerベースのニューラルネットワークアーキテクチャであるRBTransformerを提案する。
本研究は,SEED,DEAP,DREAMERデータセットを用いて,特に主観的設定下で広範囲にわたる実験を行った。
その結果,提案したRBTransformerは,従来の最先端手法を3つのデータセットすべてで上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 22:27:12 GMT)
Multi-task GINN-LP for Multi-target Symbolic Regression [0.4] 我々は,マルチターゲットシンボリック回帰のための解釈可能なニューラルネットワークであるマルチタスク回帰GINN-LP(MTRGINN-LP)を提案する。
我々は,エネルギー効率予測や持続可能な農業など,実用的マルチターゲットアプリケーションにおけるマルチタスクGINN-LPの有効性を検証した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:07:41 GMT)
Passive Dementia Screening via Facial Temporal Micro-Dynamics Analysis of In-the-Wild Talking-Head Video [0.4] 短時間のトーキングヘッドビデオによる受動的認知症スクリーニングを対象とする。
早期神経認知変化の言語自由検出のための顔時間マイクロダイナミクス解析を開発した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:14:30 GMT)
Global Cross-Time Attention Fusion for Enhanced Solar Flare Prediction from Multivariate Time Series [0.3] 本稿では,時間的モデリングを強化するため,新たなグローバルクロスモーメント・アテンション・フュージョンアーキテクチャを提案する。
GCTAFは、学習可能な横断的グローバルトークンのセットを注入し、適切な時間パターンを要約する。
我々はGCTAFが強いフレアを効果的に検出し、予測性能を向上させることを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:26:56 GMT)
A Detailed Comparative Analysis of Blockchain Consensus Mechanisms [0.3] この研究は、PoWが堅牢でタイムテストされたセキュリティを提供するが、高エネルギー消費、スループットの遅さ、採掘プールによる集中化に悩まされていることを強調している。
PoSはスケーラビリティと効率性を向上し、環境への影響を大幅に低減し、トランザクション料金をより安定させる。
この結果は、それぞれのメカニズムに固有のトレードオフを明らかにし、ハイブリッド設計がPoWのセキュリティとPoSの効率性と持続可能性を組み合わせることを示唆している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:40:08 GMT)
Exploring Multi-Table Retrieval Through Iterative Search [0.3] データレイクに対するオープンドメインの質問応答には、複数のテーブルから情報を検索して構成する必要がある。
MIP(Mixed-Integer Programming)のような厳密な最適化手法はコヒーレンスを保証する。
本稿では,マルチテーブル検索を反復探索プロセスとして捉え,拡張性,解釈可能性,柔軟性の面での利点を論じる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:31:33 GMT)
Qudit-native simulation of the Potts model [0.3] クーディットシステムのためのスズキ・トロッター分解に基づくポッツモデルのシミュレーション手法を提案する。
その結果,多体モデルのQuditに基づくディジタル量子シミュレーションへの道が確立された。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:38:48 GMT)
Method of Manufactured Learning for Solver-free Training of Neural Operators [0.2] Method of Manufactured Learning (MML)は、ニューラル演算子を訓練するためのソルバに依存しないフレームワークである。
MLは古典的な製造法にインスパイアされ、数値データ生成を関数合成に置き換える。
MMLは高いスペクトル精度、低い残差誤差、そして目に見えない条件への強い一般化を実現する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:24:19 GMT)
Causal computations in Semi Markovian Structural Causal Models using divide and conquer [0.2] Bjru et al. は構造因果モデルにおける反事実確率の有界化のための新しい分割・対数アルゴリズムを提案した。
本稿では,テキスト・マルコフ型SCMへの方法論拡張について検討する。
そのようなモデルはマルコフモデルでは不可能な境界関係を表現することができる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:08:53 GMT)
New Data Security Requirements and the Proceduralization of Mass Surveillance Law after the European Data Retention Case [0.2] データ保持指令(Data Retention Directive)は、欧州の通信事業者とインターネットアクセスプロバイダーに対し、最大2年間すべての顧客のメタデータを保持するよう義務付けた。
欧州連合司法裁判所は、プライバシーとデータ保護に関する人権に違反していると宣言した。
裁判所はメタデータに依存する大量監視を全面的に非難しなかったが、政策立案者が十分な手続き上の保護を履行すれば、大量監視の可能性を開放した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:23:05 GMT)
Freedom of expression and 'right to be forgotten' cases in the Netherlands after Google Spain [0.2] Googleのスペイン判決以来、オランダの裁判所は、削除要求に関する2つのケースを決定した。
Googleのスペイン判決が表現の自由に与える影響を評価するのは難しい。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:23:15 GMT)
Access to Personal Data and the Right to Good Governance during Asylum Procedures after the CJEU's YS. and M. and S. judgment [0.2] 欧州連合司法裁判所は、オランダの裁判官が亡命申請に関する決定について文書にアクセスできるよう亡命希望者の権利を明確にするよう要求する3つの手続きを裁定した。
この判決は、将来の亡命者の場合の議事録への効果的なアクセス権に関する十分な根拠を提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:23:10 GMT)
Beyond Mimicry: Preference Coherence in LLMs [0.2] 大規模言語モデルが真の嗜好構造を示すかどうかを,AI固有のトレードオフに対する応答をテストすることによって検討する。
23の組合せ(47.9%)は、シナリオ強度と選択パターンの統計的に有意な関係を示した。
5つの組み合わせ(10.4%)だけが適応的またはしきい値に基づく行動を通じて有意義な嗜好コヒーレンスを示す。
不安定な遷移(45.8%)と刺激特異的感性は、現在のAIシステムが統一された嗜好構造を欠いていることを示唆している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:41:48 GMT)
Evaluating Large Language Models for Diacritic Restoration in Romanian Texts: A Comparative Study [0.2] 本研究は,ルーマニア語テキストにおけるダイアクリティカルティクスの復元におけるいくつかの大規模言語モデル (LLM) の性能を評価する。
その結果、GPT-4oのようなモデルでは、中性エコーベースラインを一貫して超える高いダイアクリティカルな復元精度が得られた。
これらの知見は, モデルアーキテクチャ, トレーニングデータ, 即時設計が診断的復元性能に与える影響を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:43:54 GMT)
Learning to Solve Resource-Constrained Project Scheduling Problems with Duration Uncertainty using Graph Neural Networks [0.2] 資源制約計画計画問題(Resource-Constrained Project Scheduling Problem, RCPSP)は古典的なスケジューリング問題である。
本稿では, RCPSP 変種を不確実なタスク持続時間(既知の確率を用いてモデル化)で解決し, プロジェクト全体の持続時間を最小化することを目的とする。
我々は,グラフニューラルネットワークと深層強化学習(DRL)を併用して,タスクスケジューリングのための効果的なポリシを開発する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:27:35 GMT)
Reconstruction-Driven Multimodal Representation Learning for Automated Media Understanding [0.1] 本稿では,テキスト,音声,視覚データ間の統一表現を学習するマルチモーダルオートエンコーダを提案する。
線形ベースラインに比べてクラスタリングとアライメントの指標が大幅に改善された。
その結果、現代放送の自動化、検索可能性、コンテンツ管理効率を高めるために、再構成駆動型マルチモーダル学習の可能性を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:13:51 GMT)
Trading athermality for nonstabiliserness [0.1] 非安定性は量子上の優位性のための資源であり、量子状態が古典的にシミュレート可能な対称性をどの程度破るかを捉えている。
非安定化剤は、単に熱浴にカップリングするだけで安定剤状態から生成できるのか?
我々は、最小の仮定の下で非安定性の熱力学的限界を探求し、そのようなプロセスが初期安定化状態からそれを生成するために必要な必要十分条件を導出する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:01:00 GMT)
Towards Affect-Adaptive Human-Robot Interaction: A Protocol for Multimodal Dataset Collection on Social Anxiety [0.1] 社会的不安は、対人関係や社会的機能に影響を及ぼす一般的な状態である。
人工知能と社会ロボティクスの最近の進歩は、人間とロボットの相互作用の文脈における社会的不安を調べる新たな機会を提供する。
社会的不安に関連する感情状態や行動の正確な検出には、マルチモーダルデータセットが必要である。
本稿では,人間とロボットのインタラクションコンテキストにおける社会的不安を反映したマルチモーダルデータセット収集プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:03:33 GMT)
Semi-Supervised Multi-Task Learning for Interpretable Quality As- sessment of Fundus Images [0.1] 網膜画像品質評価(RIQA)は、眼疾患のコンピュータ支援診断を支援する。
ほとんどのツールは、画像の全体的な品質のみを分類するが、再キャプチャーをガイドするための取得欠陥は示さない。
本稿では,マルチタスクフレームワーク内で,手動による品質ラベルと品質詳細の擬似ラベルを併用した半教師付きハイブリッド学習手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:17:42 GMT)
Quantum Metamorphosis: Programmable Emergence and the Breakdown of Bulk-Edge Dichotomy in Multiscale Systems [0.1] 量子変態(QuMorph)をホストできる階層的なネスト格子のためのスケールプログラミング可能なフレームワークを提案する。
QuMorphは、無次元の調整可能なパラメータ$$で制御されるシステム依存機能間の継続的な進化である。
この多スケール混合は、ハイブリッドエッジバルク状態、スケール依存トポロジー、トポロジー埋め込みフラットバンド、孤立エッジバンドを含む新しい現象をもたらす。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:00:05 GMT)
Many-Body Time Evolution from a Correlation-Efficient Quantum Algorithm [0.1] CETEは時間に依存しない相関問題として、時間進化の各ステップを再放送する。
シーケンシャルな短時間プロパゲータによる従来の進化とは異なり、CETEは1回だけ相関する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:40:44 GMT)
BIOMERO 2.0: end-to-end FAIR infrastructure for bioimaging data import, analysis, and provenance [0.1] 本稿では,ビオメロをバイオイメージングプラットフォームに転換するBIOMEROフレームワークのメジャー進化であるBIOMERO 2.0を紹介する。
BIOMERO 2.0は、データインポート、前処理、分析、ワークフロー監視をOMERO.webプラグインとコンテナ化コンポーネントを通じて統合する。
すべてのインポートと分析はパラメータ、バージョン、結果で記録され、統合ダッシュボードを通じてリアルタイムでアクセスできるようにする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:17:22 GMT)
Halving the Cost of Controlled Time-Evolution [0.1] 量子シミュレーションアルゴリズムは、時間進化のユニタリを制御する能力を必要とするかもしれない。
トロッター時間進化を制御する標準的なアプローチは、単一キュービットの任意の回転の数を2倍にする。
この構造は、制御されたトロッター進化の任意の回転数を、制御されていないトロッター進化の回転数に還元する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:15:03 GMT)
Detection of many-body entanglement partitions in a quantum computer [0.1] 本稿では,多部量子系の絡み合いを検知する手法を提案する。
真に多粒子エンタングルメント、$m$-セパビリティ、およびエンタングルメント深さなどの構造は、非常に特殊なケースとして検出される。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:00:02 GMT)
Fast Quantum Many Body State Synthesis [0.0] そこで本研究では,ハミルトニアンの多体絡み合った基底状態を作成する可能性について検討する。
ソルバ・ハミルトンのパラメータは、コスト関数としてエネルギー最小化を用いて古典的に最適化される。
本手法を用いて作成したn=10 qubit多体状態について検討する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:21:12 GMT)
Spin-Adapted Fermionic Unitaries: From Lie Algebras to Compact Quantum Circuits [0.0] 我々は、必要となる量子資源をさらに削減するために、最小の普遍対称性適応作用素プールを導入する。
対称性の保存は、多体系の古典的および量子的シミュレーションにおいて重要な役割を果たしている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:21:22 GMT)
YOLO Meets Mixture-of-Experts: Adaptive Expert Routing for Robust Object Detection [0.0] 本稿では,複数のYOLOv9-Tエキスパート間の適応的ルーティングを取り入れた,オブジェクト検出のためのMixture-of-Expertsフレームワークを提案する。
平均精度(mAP)と平均リコール(AR)は、単一のYOLOv9-Tモデルよりも高い。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:11:11 GMT)
Whistledown: Combining User-Level Privacy with Conversational Coherence in LLMs [0.0] Whistledownは、大きな言語モデル(LLM)に送信される前にプロンプトを変更する、最善のプライバシ層である。
Whistledownは、匿名化とローカルな差分プライバシー($-LDP)と変換キャッシュを組み合わせて、会話ユーティリティを犠牲にすることなく、最高のプライバシー保護を提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:56:33 GMT)
When AI Does Science: Evaluating the Autonomous AI Scientist KOSMOS in Radiation Biology [0.0] エージェントAIの「科学者」は、言語モデルを使って文学を検索し、分析し、仮説を生成する。
我々は,自律型AI科学者であるKOSMOSを,単純なランダム遺伝子ヌルベンチマークを用いて放射線生物学の3つの問題について評価した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:00:03 GMT)
Weather Maps as Tokens: Transformers for Renewable Energy Forecasting [0.0] 現在のアプローチでは、気象パターンの豊富な空間的文脈と時間的進化を統合できない。
この研究は、気象地図をトランスフォーマーシーケンスのトークンとして扱い、再生可能エネルギーを予測する新しいアプローチを導入する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:38:50 GMT)
Ultra Low Overhead Syndrome Extraction for the Steane code [0.0] 動的プロトコルを用いたSteane符号のフォールトトレラントシンドローム抽出のための新しい性能ベンチマークを構築した。
本手法は, フォールト等価ZX-リライトを用いた2つの高度に最適化された回路上に構築される。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:52:02 GMT)
Tunable quantum photonic routing using a coupled giant-atom-like array [0.0] 2つの1次元導波路に結合した巨大原子状アレイを用いた量子ルーティング機構について検討する。
強い原子-導波路結合と弱い原子間相互作用の時代には、このシステムは効率的な単一光子ルータとして機能する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:51:09 GMT)
Translation Entropy: A Statistical Framework for Evaluating Translation Systems [0.0] 文語の翻訳は紀元前3世紀から知られているが、その必要性は情報時代においてますます一般的になっている。
一つの言語のエントロピーが未だに不明であるため、パフォーマンスを評価するための定量的な客観的手法は存在しない。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:42:15 GMT)
Transformer Injectivity & Geometric Robustness - Analytic Margins and Bi-Lipschitz Uniformity of Sequence-Level Hidden States [0.0] 離散的プロンプトから終点隠れ状態への写像は、有限プロンプト集合に対して一般射影的であることを示す。
本研究では, 層間, シーケンス長, モデルスケール, 8ビットおよび4ビットのアクティベーション量子化について検討した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:39:15 GMT)
Thermodynamics of the Fermi-Hubbard Model through Stochastic Calculus and Girsanov Transformation [0.0] 本稿では,Fermi-Hubbardモデルにおける熱力学的相関関数に対して,計算とジラノフ変換によるハバードモデルのダイナミクスを応用した。
バイパルタイト格子上の半充填時のスピンスピン相関を考察し, 任意の温度でこれらの相関のサインが反強磁性型でなければならないという解析的証明を得る。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:45:04 GMT)
The persistence of painting styles [0.0] トポロジカルデータ解析の手法である持続的ホモロジー(PH)が,芸術的スタイルに対する客観的かつ解釈可能な洞察をいかに提供するかを示す。
統計的確証を持って、PHがアーティストと異なる芸術的流路と同一の流路を区別できることを示し、アーティストのイメージとアーティストのスタイルのAI生成画像とを区別する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:25:04 GMT)
The Shape of Data: Topology Meets Analytics. A Practical Introduction to Topological Analytics and the Stability Index (TSI) in Business [0.0] トポロジカルデータ分析(TDA)は、接続されたコンポーネント、ループ、ヴォイドなどの堅牢なパターンをスケールにわたって発見するための幾何学的レンズを提供する。
本稿では、永続的ホモロジーへの直感的で図形駆動型導入と、応用アナリストのための実用的で再現可能なTDAパイプラインを提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:41:11 GMT)
The Last Vote: A Multi-Stakeholder Framework for Language Model Governance [0.0] 我々は、AIが民主社会にもたらすあらゆるリスクに対処する枠組みを提案する。
当社のアプローチは、マルチステークホルダー参加、市民社会参加、および既存の国際ガバナンスフレームワークを統合している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:44:13 GMT)
The Intrinsic Angular - Momentum of Particles and the Resolution of the Spin-Statistics Theorem [0.0] スピン統計問題の解法は、"Weyl Integrable Quantum Mechanics"(WIQM)理論に基づいている。
この理論は標準量子力学のワイルゲージ不変な定式化を与える。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:29:42 GMT)
The Impact of Bootstrap Sampling Rate on Random Forest Performance in Regression Tasks [0.0] ランダムフォレスト(RF)は通常、トレーニングセットと同じサイズのブートストラップサンプルで各ツリーをトレーニングする。
本研究では, 0.2から5.0までのBRの変化が, 39の異種回帰データセットと16のRF構成におけるRF性能に与える影響について検討した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 22:16:35 GMT)
The Good, The Bad, and The Hybrid: A Reward Structure Showdown in Reasoning Models Training [0.0] 我々は、細調整された大規模言語モデルのためのハード、連続、ハイブリッドの報酬構造について研究する。
離散信号と連続信号の間で遷移する適応型ハイブリッド報酬スケジューラを導入する。
以上の結果から,ハイブリッド報酬構造は,純粋にハードあるいは連続的なアプローチよりも収束速度とトレーニング安定性を向上させることが示唆された。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:15:26 GMT)
The Final-Stage Bottleneck: A Systematic Dissection of the R-Learner for Network Causal Inference [0.0] 本稿ではR-Learnerフレームワークグラフを体系的に解析する。
最終段階のCATE推定器の帰納バイアスがパフォーマンスの第一の要因であるという厳密な証拠を初めて提示する。
我々は微妙でトポロジに依存した「ニュアンスボトルネック」を識別し、機械的説明を提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:16:04 GMT)
Switching rates in Kerr resonator with two-photon dissipation and driving [0.0] 有限デチューニングと2光子散逸を伴う2光子駆動のKerr発振器のスイッチング速度を解析的に検討した。
クラマーの理論と$P$-表現を用いて、ビットフリップ誤差率の解析式を導出する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:40:56 GMT)
Structured Imitation Learning of Interactive Policies through Inverse Games [0.0] 生成的単一エージェントポリシー学習とフレキシブルで表現力のあるゲーム理論構造を組み合わせることで,インタラクティブなポリシのための構造化された模倣学習フレームワークを提案する。
合成5エージェント型ソーシャルナビゲーションタスクの予備的な結果から,本手法は非対話的政策を著しく改善し,50のデモのみを用いて,地上の真理対話的政策と相容れない性能を示した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 00:42:45 GMT)
Spectroscopic signatures of emergent elementary excitations in a kinetically constrained long-range interacting two-dimensional spin system [0.0] 基本励起の非局在化重畳状態への遷移速度は、集合的な多体増強を示す。
この機構は、2次元リドベルク格子気体において理論的に研究される特徴的初等励起の形成を支持する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:52:23 GMT)
Show and Tell: Prompt Strategies for Style Control in Multi-Turn LLM Code Generation [0.0] 言語モデルは、過剰な冗長性に傾向のある機能的に正しいコードを生成する。
命令ベース,例ベース,および組み合わせプロンプトが初期制御と拡張訓練の異なるパターンを生成することを示す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:01:44 GMT)
Self-Organization of Attractor Landscapes in High-Capacity Kernel Logistic Regression Hopfield Networks [0.0] カーネルベースの学習は、Hopfieldネットワークのストレージ容量を劇的に増加させる。
我々は,アトラクタの局所的安定性を定量化するために,ネットワークのエネルギー景観の幾何学的解析を行う。
私たちの中心的な発見は最適化の尾根の出現です」
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:58:34 GMT)
Seek and You Shall Fold [0.0] 実験観測変数のほとんどの予測子は微分不可能であり、勾配に基づく条件付きサンプリングとは相容れない。
これは特に核磁気共鳴において制限されており、化学シフトのような豊富なデータは生成的モデリングに直接統合することは困難である。
本研究では, タンパク質生成モデルの非分化誘導のためのフレームワークを導入し, 遺伝的アルゴリズムを用いて, 連続拡散型ジェネレータとブラックボックスの目的を結合する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:07:49 GMT)
Screw-dislocation-engineered quantum dot: geometry-tunable nonlinear optics, orbital qubit addressability, and torsion metrology [0.0] 均一なねじり媒体,垂直磁場,アハロノフ-ボームフラックスの存在下で閉じ込められた単一電子について検討した。
i)エネルギーブルーシフトが$sim 6.8$から$sim 15.5$meVとなり、飽和強度が桁違いに変化するトーション制御光遷移により、幾何学的にプログラム可能な光スイッチングが可能となる。
また、トーションがエミッタのテクスチンシチュー制御をどのように行うかを示す。-キャビティQEDにおけるキャビティデチューニングと光物質結合について。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:16:35 GMT)
Scene Graph-Guided Generative AI Framework for Synthesizing and Evaluating Industrial Hazard Scenarios [0.0] 職場の危険を正確に検出するための視覚モデルの訓練には、事故につながる危険条件のリアルなイメージが必要である。
本研究では,OSHA(Occupational Safety and Health Administration)の事故報告に基づく危険シナリオのフォトリアリスティックなイメージを合成する,新しいシーングラフ誘導型生成AIフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 22:58:27 GMT)
Realizing Unitary $k$-designs with a Single Quench [0.0] 最小限の制御で$k$-designsを生成する単一待ち行列プロトコルを提案する。
このプロトコルは、運用上、測定に優しい$t_mathrmTh$を定義し、カオス性の定量的診断を提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:00:04 GMT)
Rare Genomic Subtype Discovery from RNA-seq via Autoencoder Embeddings and Stability-Aware Clustering [0.0] UCI "Gene Expression Cancer RNA-Seq"データセット(801のサンプル、20,531の遺伝子)では、膵臓分析により、ほぼ完全に起源の組織と整列するクラスターが否定的な制御として機能していることが示された。
我々は、上位2000個の高可変遺伝子を選択し、それらを標準化し、フィードフォワードオートエンコーダ(128次元潜在空間)を訓練し、k = 2-10でk-meansを実行する。
大域的な指標は小さいkを好むが、事前に監督された発見規則(ハンガリーのアライメント後の20種に対してジャカード>=0.60)でkをスキャンすると、k = 5で簡単な解が得られる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:53:43 GMT)
Quantum lattice Boltzmann method for several time steps: A local Carleman linearization algorithm [0.0] 使用する符号化は、適切な結果を得る確率を高く保ちながら、局所的な衝突ルールを可能にする。
このアルゴリズムは、時間ステップ毎に$O(log3(N)+Q4)$にスケールし、2D格子の格子サイト数$N$と、一定数のキュービット数$Q$にスケールする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:19:25 GMT)
QUASAR: An Evolutionary Algorithm to Accelerate High-Dimensional Optimization [0.0] 本稿では,漸近再帰型準適応探索(quaSAR)を提案する。
QUASARは、次元の呪いによる複雑で微分不可能な問題の収束を加速する進化的アルゴリズムである。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:02:31 GMT)
Pulsation of quantum walk between two arbitrary graphs with weakly connected bridge [0.0] グロバーのウォークは、2つの任意の単純グラフからなる有限グラフ上を1つのエッジで連結すると考える。
十分な小さい値の$に対して、パルセーションと呼ばれる現象が起こる。
この脈動は、2つのグラフ間の量子ウォーカーの周期的な移動によって特徴づけられる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:01:37 GMT)
Probing parameters estimation with Gaussian non-commutative measurements [0.0] プローブ状態の準備段階が2つの非可換ガウス測度を含むガウス状態のパラメータ推定について検討する。
これらの非可換ガウス測定の影響を量子フィッシャー情報(QFI)を用いて検討する。
この結果は,量子力学におけるコヒーレンスの利用に寄与し,量子光学デバイスにおいて実験的に実現可能である。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:55:57 GMT)
Private Frequency Estimation Via Residue Number Systems [0.0] 本報告では,ローカル・ディファレンシャル・プライベート(LDP)周波数推定のための新しいアルゴリズムであるtextsfModularSubsetSelection (MSS) を提案する。
私たちの$varepsilon$-LDPメカニズムは、サイズが$k$と$n$のユーザに与えられたら、それぞれの入力をResidue Number System (RNS)経由で$ell$ペアワイズ・コプライム・モジュリでエンコードします。
MSS は評価された全ての LDP プロトコルの中で最小の再構成攻撃成功率を達成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:42:09 GMT)
PolicyBot - Reliable Question Answering over Policy Documents [0.0] この研究は、ポリシー文書上のユーザクエリに応答するように設計された、検索拡張世代(RAG)システムであるPolicyBotを提示する。
このシステムは、ドメイン固有のセマンティックチャンキング、多言語で密接な埋め込み、複数段階の検索と再ランク付け、ソース・アウェア・ジェネレーションを組み合わせて、元のドキュメントに基盤を置く応答を提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:26:10 GMT)
On the Optimal Rate of Convergence for Translation-Invariant 1D Quantum Walks [0.0] 一次元格子上での変換不変な離散時間量子力学の収束速度について検討する。
2次元のコイン空間を持つステップコイン量子ウォークの特別な場合、最大距離に対する同じ収束率を回復する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:21:49 GMT)
NuBench: An Open Benchmark for Deep Learning-Based Event Reconstruction in Neutrino Telescopes [0.0] ニュートリノ望遠鏡における深層学習に基づくイベント再構成のためのオープンベンチマークであるNuBenchを紹介する。
NuBenchは、約1億3000万の電荷と中性電流のミューオンニュートリノ相互作用を含む7つの大規模なシミュレーションデータセットで構成されている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:08:01 GMT)
Nonparametric Estimation of Joint Entropy through Partitioned Sample-Spacing Method [0.0] 分割標本間隔(PSS)に基づく多変量関節エントロピーの非パラメトリック推定器を提案する。
PSSは、k-アネレスト近傍推定器を一貫して上回り、最近の正規化フローベース手法と競合する精度を達成する。
これらの特性は、PSSをフローベースアプローチの正規化の実践的な代替品と位置づけ、情報理論機械学習応用に幅広い可能性を秘めている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:05:34 GMT)
Non-invertible defects in generalized Ising models via strange correlator [0.0] クラマース・ワニエ(KW)双対性欠陥は古典統計システムや量子ハミルトンモデルで研究されている。
KW双対性欠陥(KW duality defect)とKW二重性欠陥(KW duality defects/KW defects)の体系的構成を提供する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:00:09 GMT)
MorphBoost: Self-Organizing Universal Gradient Boosting with Adaptive Tree Morphing [0.0] MorphBoostは、トレーニング中の分割動作を動的に変化させる自己組織化されたツリー構造を備えた、新しい勾配促進フレームワークである。
このアルゴリズムは、蓄積された勾配統計と頑健性に依存した学習圧力に基づいて進化する適応分割関数を実装している。
MorphBoostは4/10のデータセットの勝利(40%の勝利率)と6/30のトップ3のフィニッシュ(20%)で総合優勝者の地位を確保した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:54:01 GMT)
Modeling Quantum Noise in Nanolasers using Markov Chains [0.0] レーザ量子ノイズは、単純かつ直感的な速度方程式から始めることで、非常に幅広い種類のレーザーに対して定量的に計算できることを示す。
我々は、レーザーにおける量子ノイズの計算における様々なアプローチを広範囲に比較し、異なるシステムサイズに対する最良のアプローチを特定する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:27:28 GMT)
Mind the Gap: Evaluating LLM Understanding of Human-Taught Road Safety Principles [0.0] 道路安全の概念を多モード大言語モデル (LLM) がいかによく理解しているかを評価する。
学校テキストブックから得られた交通標識と道路安全基準を表現した画像のパイロットデータセットをキュレートする。
予備的な結果は、これらのモデルが安全推論に苦しむことを示し、人間の学習とモデル解釈のギャップを明らかにする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:01:48 GMT)
MedRule-KG: A Knowledge-Graph--Steered Scaffold for Reliable Mathematical and Biomedical Reasoning [0.0] MedRule-KGは, 数学的, 生化学的に有効な出力に向けて, 生成を操る軽量検証器と組み合わせた, コンパクトな知識グラフ足場である。
反応の実現可能性、代謝適合性、毒性のスクリーニングにまたがる90のタスクで、MedRule-KGは強力なチェーン・オブ・ソートのベースラインに対して、違反数を83.2%削減する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:42:52 GMT)
Making Evidence Actionable in Adaptive Learning Closing the Diagnostic Pedagogical Loop [0.0] 本研究では,インストラクターによるフィードバックループを裏付けるエビデンスを提示し,概念レベルの評価エビデンスを精査されたマイクロインターベンションに変換する。
適応学習アルゴリズムは、ギャップ閉鎖のハードな保証としての妥当性、時間と冗長性の予算付き制限としての注意、単一リソースへの過度な適合に対する保護としての多様性の3つのセーフガードを含む。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:15:50 GMT)
Machine learning inspired photon number resolution in superconducting nanowire single-photon detectors [0.0] 超伝導ナノワイヤ単光子検出器(SNSPD)による光子数分解検出が注目されている。
我々は、主成分分析(PCA)と新しい読み出し手法を組み合わせて、SNSPDの光子数解決能力を探索する。
本稿では, 検出器系の光子数分解能を定量化するために, Bhattacharyya に基づく新しい信頼度指標を提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:13:46 GMT)
MMWSTM-ADRAN+: A Novel Hybrid Deep Learning Architecture for Enhanced Climate Time Series Forecasting and Extreme Event Prediction [0.0] Anomaly-Driven Recurrent Attention Network Plus (MMWSTM-ADRAN+) を用いたマルチモード気象状態遷移モデルを提案する。
MMWSTMは双方向Long-Term Memory (BiLSTM)ユニットと学習可能なマルコフ状態遷移行列を組み合わせることで、共光スケール気象条件の変化を捉える。
2番目のストリームであるADRANは、双方向Gated Recurrent Units (BiGRUs)、マルチヘッド自己アテンション、および新しい異常増幅層を統合し、低確率信号に対する感度を高める。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:31:54 GMT)
LinkedIn Profile Characteristics and Professional Success Indicators [0.0] 本研究では,LinkedInのプロフィール特性と職業的成功との関係について検討し,昇進の指標,追随者数,キャリアの進展率に着目した。
62,000以上の匿名化されたLinkedInプロファイルのデータセットを活用することで、機械学習技術を用いて予測モデルを開発し、プロフェッショナルの成功を導く最も影響力のある要因を特定しました。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:54:12 GMT)
Linguistic Predictability and Search Complexity: How Linguistic Redundancy Constraints the Landscape of Classical and Quantum Search [0.0] 歴史的に根拠付けられた25文字の正書法と現代イタリア語のアルファベットを併用した文字ベースのn-gramモデルを構築した。
200文字から1000文字までの暗号長にわたって、実験結果が1/sqrt(pgood)におけるGrover Oracle呼び出しの予測依存性を確認する
これらの結果から,言語的冗長性と検索空間の縮約との関係が示唆された。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:36:05 GMT)
Learning stochasticity: a nonparametric framework for intrinsic noise estimation [0.0] 時系列データから状態依存の固有ノイズを推定するカーネルベースのフレームワークであるTrineを紹介する。
我々はTrineを生物学的および生態学的システムで検証し、隠れた力学を明らかにする能力を示した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:52:05 GMT)
Learning Branching Policies for MILPs with Proximal Policy Optimization [0.0] 混合線形プログラム(MILP)における分岐境界法(B&B)
現在のアプローチはImitation Learning (IL)に依存しており、専門家によるデモンストレーションに過度に適合する傾向にあり、構造的に多様なインスタンスや目に見えないインスタンスに一般化するのに苦労している。
本研究では,RLアルゴリズムであるPPO(Proximal Policy Optimization)を用いて分岐ポリシーの学習を行う新しいフレームワークであるTree-Gate Proximal Policy Optimizationを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:16:14 GMT)
Latency and Ordering Effects in Online Decisions [0.0] オンライン意思決定システムは遅延フィードバックと順序に敏感なダイナミクスの下で動作している。
ヘテロジニアスレイテンシ、非可換性、実装ギャップ効果を1つの下界ステートメントにパッケージ化する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:08:05 GMT)
Interpretable Ransomware Detection Using Hybrid Large Language Models: A Comparative Analysis of BERT, RoBERTa, and DeBERTa Through LIME and SHAP [0.0] 本研究では,ランサムウェア検出のための3つのトランスフォーマーベース大規模言語モデル(LLM)の比較分析を行った。
数値的および分類的ランサムウェア機能はKBinsDiscretizerとトークンベースのエンコーディングを用いてテキストシーケンスに変換された。
約2,500個のラベル付きサンプルを微調整し,精度,F1スコア,ROC-AUCを用いて評価した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:51:36 GMT)
InteractiveGNNExplainer: A Visual Analytics Framework for Multi-Faceted Understanding and Probing of Graph Neural Network Predictions [0.0] グラフニューラルネットワーク(GNN)はグラフベースの学習タスクに優れていますが、複雑で非線形な操作によって、しばしば不透明な"ブラックボックス"として表現されます。
本稿では,GNN説明可能性を高めるビジュアル分析フレームワークであるInteractiveGNNExplainerを紹介する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:08:31 GMT)
Informative Communication of Robot Plans [0.0] 本稿では,ロボットプランを情報伝達するための言語化戦略を提案する。
本研究では,ロボットの事前知識を捉えた利用者の2階の心の理論に対して,言語化が持つ情報ゲインを測定した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:44:25 GMT)
Hardware optimization on Android for inference of AI models [0.0] オブジェクト検出(YOLOファミリー)と画像分類(ResNet)の2つの重要なタスクに着目し,Androidシステム上でのAIモデルの最適実行構成を提案する。
我々の中核的な目的は、最小精度の劣化と最大推論速度の最高のトレードオフを達成するための組合せを実証的に決定することである。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:58:15 GMT)
HPC-Accelerated Simulation and Calibration for Silicon Quantum Dots [0.0] 量子コンピュータ(QC)は、今日の先進スーパーコンピュータよりもはるかに高速に重要な問題を解く可能性がある。
1つの大きな課題は、量子ビット上のユニタリを実現するためにロバストパルスを設計することである。
ターゲットのユニタリに対してパルスを生成する高速なJAX対応シミュレータであるQalibrateを実装した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:04:56 GMT)
Fractional Contribution of Dynamical and Geometric Phases in Quantum Evolution [0.0] 我々は、この分割が任意の瞬間において、単一の幾何学量によってのみ支配されることを示す驚くほど単純で普遍的な法則を証明している。
この結果は、原点において幾何学的対動的である全位相の正確な分数を定義する普遍的かつ厳密な方法を与える。
この発見はすぐに実践的な結果をもたらし、高忠実な幾何学的量子ゲートを設計するための進化の幾何学性をリアルタイムで測定する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:40:30 GMT)
Floquet Recurrences in the Double Kicked Top [0.0] ダブルキックトトップ(DKT)における正確な量子再帰について検討する。
解析的に Floquet 作用素の正確な周期性を $k_r = j/2$ および $k_r = j/4$ に対して示す。
我々の研究は、通常の、カオス的なレギュレーションは、$k_r$と$k_$をチューニングすることで、どんなシステムサイズでも制御できることを示した。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:10:45 GMT)
Find the Leak, Fix the Split: Cluster-Based Method to Prevent Leakage in Video-Derived Datasets [0.0] 本稿では,クラスタベースのフレーム選択手法を提案する。
トレーニング、検証、テストセットに分割する前に視覚的に類似したフレームをグループ化することにより、この方法はより代表的でバランスよく信頼性の高いデータセット分割を生成する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:57:46 GMT)
Fermionic Born Machines: Classical training of quantum generative models based on Fermion Sampling [0.0] 我々は、古典的に訓練可能な量子生成モデルの一例として、フェルミオンボルンマシンを紹介した。
このモデルはパラメータ化魔法の状態と、学習可能なパラメータを持つフェルミオン線形光学(FLO)変換を用いる。
アンザッツの特定の構造は、最適化に好適な特性を示す損失景観を誘導する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 19:03:03 GMT)
Exploring the Use of ChatGPT by Computer Science Students in Software Development: Applications, Ethical Considerations, and Insights for Engineering Education [0.0] ChatGPTはコンピュータ科学でますます使われており、ソフトウェア開発タスク全体にわたって効率的なサポートを提供している。
以前の研究では、学生の戦略の詳細な分析と倫理的意識に関する傾向を強調し、調査に大きく依存していた。
本研究では,コンピュータサイエンスの学生がソフトウェア開発プロジェクトにおいて,ChatGPTを戦略的・倫理的にどう扱うかを検討する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:54:08 GMT)
Evaluating Generative AI for CS1 Code Grading: Direct vs Reverse Methods [0.0] 本稿では、AIモデルが学生コードに直接ルーブリックを適用する textitDirect と、AIが最初にエラーを修正し、その性質と修正数に基づいてグレードを推定する textitReverse (新たに提案されたアプローチ) の2つのAIベースのグレード技術を比較した。
本稿では,ハイブリッドAIグレーティングシステムにおける,それぞれのアプローチの強みと限界,迅速な設計のための実践的考察,今後の方向性について論じる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 01:38:06 GMT)
EndoSight AI: Deep Learning-Driven Real-Time Gastrointestinal Polyp Detection and Segmentation for Enhanced Endoscopic Diagnostics [0.0] この研究は、正確なポリプローカライゼーションを実現するために独立して開発、評価されたディープラーニングアーキテクチャであるEndoSight AIを提示する。
このシステムは、ポリプ検出で88.3%の平均平均精度(mAP)とセグメンテーションで最大69%のDice係数を達成する。
このトレーニングには、臨床的に関係のあるパフォーマンス指標と、モデル堅牢性と効率性を保証するための新しいサーマルアウェア手順が組み込まれている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 04:40:38 GMT)
Empirical Likelihood for Random Forests and Ensembles [0.0] 本研究では,ランダム林と関連するアンサンブル手法の実証的可能性 (EL) フレームワークを開発した。
不完全性によって誘導される部分サンプリングが過度にスパースしない場合、我々は2乗2乗のEL統計を構築した。
スペーサーのサブサンプリング体制の下では、EL統計はピカリティの喪失により過剰に覆われる傾向にある。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:38:43 GMT)
Efficient reconstruction of multidimensional random field models with heterogeneous data using stochastic neural networks [0.0] ニューラルネットワークのトレーニングにおいて,多次元ランダム場モデル再構成のための一般化誤差を限られた数のトレーニングデータで証明する。
この結果から,ノイズが次元にわたって不均一である場合,一般化誤差の収束速度はモデル次元に比例しない可能性が示唆された。
We show that our Wasserstein-distance approach can successfully training neural network to learn multidimensional uncertainty models。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:13:07 GMT)
Efficient algorithm for fidelity estimation of two quantum states [0.0] 本研究では, 混合状態に対する密度行列指数と干渉計方式に基づいて, 忠実度推定のための効率的なアルゴリズムを提案する。
我々のアルゴリズムは、量子状態の密度行列が互いに可換であるとき、未知の(純粋または混合の)2つの既知の量子状態の忠実度を推定する資源効率の高い手法として機能する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:54:47 GMT)
Dynamic Template Selection for Output Token Generation Optimization: MLP-Based and Transformer Approaches [0.0] 動的テンプレート選択は応答品質を損なうことなく大幅なコスト削減を実現する。
この研究は、機械学習の理論的基礎を持つ形式的問題定式化、それに対応する複雑性解析を伴う4つのアルゴリズム、生産システム全体にわたる広範な実証検証など、いくつかの重要な要素に貢献している。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:00:22 GMT)
Do Environment-Modification Behaviors and Gamers' Immersiveness Shape Exceptionalism Beliefs? [0.0] 人間の例外主義は人間の自然認識、思考、価値観、行動を強く形成する。
本研究は,仮想環境修正行動とプレイヤーの没入感が協調的に例外主義を形作る方法について考察する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 05:19:11 GMT)
Distinguishing Repetition Disfluency from Morphological Reduplication in Bangla ASR Transcripts: A Novel Corpus and Benchmarking Analysis [0.0] ノイズの多いASR転写におけるこれらの2つの現象を明瞭に区別するために,手動で注釈を付した2万列バングラコーパスを紹介した。
我々は、この新しいリソースを、最先端の多言語大言語モデル(LLM)とタスク固有のエンコーダモデルの微調整という2つのパラダイムを用いてベンチマークする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 09:06:01 GMT)
Dimension vs. Precision: A Comparative Analysis of Autoencoders and Quantization for Efficient Vector Retrieval on BEIR SciFact [0.0] Int8量子化は最も効果的な「スイートスポット」を提供し、nDCG@10の無視可能な[1-2%]ドロップで4倍の圧縮を達成する。
オートエンコーダは優雅な劣化を示すが、同等の4倍圧縮比でより大きな性能損失を被る。
バイナリ量子化は 破滅的な性能低下のため この作業には適さないことが分かりました
論文参考訳(メタデータ) (Mon, 17 Nov 2025 07:02:11 GMT)
Diffraction induced quantum chaos in a one-dimensional Bose gas [0.0] 低エネルギースペクトルがランダム・マトリクス統計を示すことを示す。
この多体量子カオスの非伝統的な形態は、不純物によって引き起こされる拡散過程に由来すると論じる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:56:00 GMT)
Detecting and Steering LLMs' Empathy in Action [0.0] LLM活性化空間における線形方向としての共感-in-actionについて検討する。
Empathy-in-Actionベンチマークに基づいた対照的なプロンプトを用いて、検出と4つのモデル間のステアリングをテストする。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:45:26 GMT)
Density of reflection resonances in one-dimensional disordered Schrödinger operators [0.0] 実エネルギーを持つ複素共振極の密度$(cal E,)$を評価するための解析的アプローチを開発する。
このリンクを利用することで、弱い障害限界における共鳴密度の詳細な解析が可能になることを示す。
我々の手法は、短い乱れたサンプルの反対の場合、$(cal E,)$の制限式を得る。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:39:48 GMT)
Data-driven adaptive quantum error mitigation for probability distribution [0.0] 確率分布に対する量子誤差緩和(QEM)の精度を改善するための2つのプロトコルを提案する。
1つ目は、異なるQEM戦略を用いて得られた確率分布を比較するN-versionプログラミング法である。
2つ目は、適切な外挿戦略を選択するための一貫性に基づく方法である。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 10:50:28 GMT)
Data Whitening Improves Sparse Autoencoder Learning [0.0] 入力アクティベーションにPCAホワイトニングを適用することで、複数のメトリクスにわたるSAE性能が向上することを示す。
我々はReLUとTop-K SAEを多種多様なモデルアーキテクチャ、幅、空間的に評価する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:20:58 GMT)
Computer Vision based group activity detection and action spotting [0.0] 多人数シーンにおけるグループ活動の検出は、複雑な人間との相互作用と時間的変化により困難である。
本研究では、ディープラーニングモデルとグラフベースの関係推論を組み合わせたグループ活動認識とアクションスポッティングのためのコンピュータビジョンベースのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 12:52:22 GMT)
Computational Measurement of Political Positions: A Review of Text-Based Ideal Point Estimation Algorithms [0.0] 本稿では、教師なしおよび半教師付き計算テキストベース理想点推定(CT-IPE)アルゴリズムの体系的レビューを行う。
CT-IPEアルゴリズムは、議会演説、政党宣言、ソーシャルメディアからイデオロギー的嗜好を推定するために、政治科学、コミュニケーション、計算社会科学、コンピュータ科学で広く使われている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 11:01:09 GMT)
Comparative Analysis of Large Language Model Inference Serving Systems: A Performance Study of vLLM and HuggingFace TGI [0.0] 本稿では,vLLM と HuggingFace Text Generation Inference (TGI) の2つの著名なオープンソースLarge Language Models (LLMs) の総合的評価について述べる。
スループット性能,エンドツーエンドレイテンシ,GPUメモリ利用,LLaMA-2モデルを用いたスケーラビリティ特性など,複数次元にわたるシステムのベンチマークを行った。
実験の結果,新しいPagedAttention機構により,高速負荷下でのTGIよりも最大24倍のスループットを実現し,対話型単一ユーザシナリオのテールレイテンシが低くなることがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 16:25:21 GMT)
Classification of Hope in Textual Data using Transformer-Based Models [0.0] 本稿では,テキスト中の希望表現を分類するためのトランスフォーマーに基づくアプローチを提案する。
我々は2進分類(ホップ対ノーホープ)と多クラス分類(5つの希望関連カテゴリ)の3つのアーキテクチャを開発し比較した。
BERTはより優れた性能(84.49%のバイナリ、72.03%のマルチクラス精度)を示し、新しいアーキテクチャよりも計算資源(443sと704sのトレーニング時間)をはるかに少なくした。
GPT-2 の精度は低い (79.34% のバイナリ、71.29% のマルチクラス) が、DeBERTa は適度な結果 (80.70% のバイナリ、71.56% のマルチクラス) を得たが、計算能力はかなり高い。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 02:07:24 GMT)
Can QE-informed (Re)Translation lead to Error Correction? [0.0] 本稿では,WMT2025自動翻訳品質評価システムタスク3に提案される2つのアプローチについて述べる。
トレーニングフリーアプローチであるQEインフォームド・リトランスレーションについて検討し、同じトレーニングフリーパラダイム内で比較する。
提案された2つのアプローチは、それぞれ0.0201と-0.0108のデルタCOMETスコアを達成し、サブタスクのリーダーボードで勝利を収める最初のアプローチとなった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 20:10:47 GMT)
CacheFlow: Compressive Streaming Memory for Efficient Long-Form Video Understanding [0.0] CacheFlowは、Dynamic Token Droppingと長期メモリを組み合わせた、トレーニング不要のパイプラインである。
オンラインのフレーム単位の処理により、当社のアプローチはライブストリーミングVQAに基本的に適しています。
推測において、コンセンサスに基づく検索機構は、Top-Kで最も関連性の高いブロックのみを検索する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:56:14 GMT)
CVChess: A Deep Learning Framework for Converting Chessboard Images to Forsyth-Edwards Notation [0.0] 本稿では,チェスボード画像をForsyth-Edwards Notation (FEN)に変換するフレームワークであるCVChessを提案する。
本手法では,スマートフォンカメラ画像から断片認識を行うために,残層を有する畳み込みニューラルネットワーク(CNN)を用いる。
結果として得られる分類はFEN文字列としてエンコードされ、最も最適な動きを生成するためにチェスエンジンに入力することができる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 03:00:45 GMT)
CORGI: Efficient Pattern Matching With Quadratic Guarantees [0.0] 我々は,AIベースのシステムにおいて,CORGIと呼ばれるアルゴリズムがタイトな時間制約で問題を解く方法を示す。
CORGIは、単一の満足度マッチを見つけ、コンフリクトセット全体をメモリにコミットすることなく、メモリにストリームする能力を見出す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:49:39 GMT)
Automated Road Distress Detection Using Vision Transformersand Generative Adversarial Networks [0.0] この研究は、道路難問分割に畳み込みニューラルネットワーク(CNN)を適用し、その後、トランスフォーマーベースのモデルMaskFormerについて検討する。
その結果,GAN生成したデータはモデル性能を向上し,MaskFormerはCNNモデルより2つの指標(mAP50とIoU)で優れていた。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:56:08 GMT)
Aspect-Level Obfuscated Sentiment in Thai Financial Disclosures and Its Impact on Abnormal Returns [0.0] 本稿では, タイの金融年報における難読感をデコードするために, Aspect-Based Sentiment Analysis (ABSA) を用いた新しいアプローチを提案する。
我々はこれらのテキストに難読感を注釈付けするための具体的なガイドラインを開発し、100以上の財務報告を注釈付けする。
以上の結果から,市場反応はレポート内の特定の側面によって選択的に影響されることが示唆された。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:17:46 GMT)
Artificial Intelligence Agents in Music Analysis: An Integrative Perspective Based on Two Use Cases [0.0] 本稿では,音楽分析と教育に応用されたAIエージェントの総合的レビューと実験的検証について述べる。
ルールベースモデルから、ディープラーニング、マルチエージェントアーキテクチャ、検索拡張生成フレームワークを含む現代的アプローチへの歴史的進化を合成する。
実験の結果,AIエージェントは音楽パターン認識,構成パラメータ化,教育的フィードバックを効果的に強化することがわかった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 23:46:47 GMT)
Architectural Approaches to Fault-Tolerant Distributed Quantum Computing and Their Entanglement Overheads [0.0] 分散量子コンピューティング(DQC)プラットフォーム上でのフォールトトレラント量子計算は、リソース要件とノイズ閾値を慎重に評価する必要がある。
タイプ1アーキテクチャはGHZ(Greenberger-e-Zeilinger)状態を介して接続された小さな量子ノードで構成され、非局所安定化器の測定を可能にする。
タイプ2アーキテクチャは、大規模なエラー訂正コードブロックを複数のモジュールに分散しており、ほとんどの安定化器はローカルのままである。
Type 3アーキテクチャは、異なるモジュールにコードブロックを割り当て、格子ゲート、格子手術、テレポーテーションのようなフォールトトレラントな操作を実行できる。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:14:38 GMT)
An Operational Kardashev-Style Scale for Autonomous AI - Towards AGI and Superintelligence [0.0] 我々は,Kardashevにインスパイアされたものの,自律型AI(AAI)尺度を提案する。
固定されたロボットプロセス自動化(AAI-0)から完全な人工知能(AAI-4)に至るまでの進捗を計測する。
AAI-インデクスによって集約された10つの能力軸(自律性、一般性、計画、記憶/永続性、ツール経済、自己改革、社会性/コーディネーション、身体的、世界モデル忠実性、経済的アウトプット)を定義する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 14:24:27 GMT)
Above-Unity Coherent Cooperativity of Tin-Vacancy Centers in Diamond Photonic Crystal Cavities [0.0] フォトニック結晶キャビティとの結合により、SnV光マターインタフェースが強化され、さまざまな絡み合い生成プロトコルがアンロックされる。
ここでは、フォトニック結晶空洞に埋め込まれたSnV中心の上の一様コヒーレント協調性を実証する。
これらの結果は、キャビティ結合されたSnV中心を将来の量子ネットワークのための効率的でコヒーレントな光マターインターフェースとして使用するための扉を開く。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 13:49:28 GMT)
AA-Omniscience: Evaluating Cross-Domain Knowledge Reliability in Large Language Models [0.0] AA-Omniscienceは6000の質問に対する事実的リコールと知識のキャリブレーションを測定するために設計されたベンチマークである。
モデルの評価は、事実のリコールを測定する有界メトリック(-100から100)であるOmniscience Indexを測定する。
その結果、フロンティアモデル全体の持続的な事実性とキャリブレーションの弱点が明らかになった。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 06:27:16 GMT)
A Real-Time Driver Drowsiness Detection System Using MediaPipe and Eye Aspect Ratio [0.0] 本研究は, ドロージーの兆候を示すドライバーに警告を行うことにより, 道路の安全を向上することを目的としたドライバ・ドローシー検知システムの開発について述べる。
このシステムは、運転者の顔の特徴を追跡する標準的なウェブカメラに基づいており、眼球運動の検査に重点を置いている。
システムは、長時間の目が閉じた瞬間や、悲しみの現れである点滅率の非常に低い瞬間を検出し、音でドライバーに警告して注意を戻す。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:22:48 GMT)
A Lexical Analysis of online Reviews on Human-AI Interactions [0.0] 本研究では,ユーザレビューを解析することにより,人間とAIシステムの複雑なダイナミクスを理解することに焦点を当てる。
G2.com、Producthunt.com、Trustpilot.comから55,968件のオンラインレビューを分析するための語彙的アプローチを用いて、この予備研究は人間とAIのインタラクションを分析することを目的としている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 15:17:36 GMT)
A High-Efficiency Three-Stroke Quantum Isochoric Heat Engine: From Infinite Potential Wells to Magic Angle Twisted Bilayer Graphene [0.0] 2つの熱貯水池間の熱機関として機能する3ストロークの量子等方性サイクルを導入する。
量子等方性サイクルは、どちらの古典的サイクルよりも高い効率を達成するとともに、最近提案された3ストローク量子等方性サイクルの効率を上回っている。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 18:01:29 GMT)
A Gentle Introduction to Conformal Time Series Forecasting [0.0] このレビューは、非交換可能データに対処するために特別に設計された共形予測手法の最近の進歩をまとめるものである。
まず,弱依存性条件下での分割等角予測に対する有限サンプル保証を導出する理論的基礎を提示する。
次に、キャリブレーションデータを再重み付けしたり、残留分布を動的に更新したり、ターゲットのカバレッジレベルをリアルタイムで調整したりすることで、シリアル依存を軽減する最先端のアプローチを調査し、分類する。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 17:12:51 GMT)
A Comparative Analysis of Recurrent and Attention Architectures for Isolated Sign Language Recognition [0.0] 本研究では,アゼルバイジャンの手話データセット上で,ConvLSTMとVanilla Transformerの2つの代表的なモデルを実装し,評価する。
その結果,注目に基づくVanilla Transformerは,Top-1とTop-5の精度で連続したConvLSTMより一貫して優れていた。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 08:28:35 GMT)
A Closed-Form Framework for Schrödinger Bridges Between Arbitrary Densities [0.0] シュルディンガーブリッジシステムの力学を表現するための統一閉形式フレームワークを提案する。
本研究では,SBの動的特性を直接推定するシミュレーションフリーアルゴリズムを開発した。
この研究は、科学的および機械学習アプリケーションにまたがる効率的でスケーラブルな拡散モデリングのための新しい方向を開く。
論文参考訳(メタデータ) (Mon, 17 Nov 2025 21:08:02 GMT)