X-ray Insights Unleashed: Pioneering the Enhancement of Multi-Label Long-Tail Data [86.5] 胸部X線撮影における長期肺腫瘍の診断は困難であった。
尾部病変の表現力を高める拡散法は近年進歩しているが, 稀な病変例では, それらの発生能が低下している。
そこで本研究では,従来のX線を併用して尾部病変を増大させる新しいデータ合成パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:14:55 GMT)
Reflection Pretraining Enables Token-Level Self-Correction in Biological Sequence Models [82.8] CoT(Chain-of-Thought)は、大規模言語モデルを用いた自然言語処理において、高度なタスク解決機能を備えている。
CoTをタンパク質やRNA言語モデルのような非自然言語ドメインに適用することは、まだ不可能である。
生物シークエンスモデルではじめて事前学習を導入し、中間的推論を行えるようにした。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:25:17 GMT)
GriDiT: Factorized Grid-Based Diffusion for Efficient Long Image Sequence Generation [77.1] サブサンプルフレームからなる格子画像にのみ依存する生成モデルを訓練する。
本研究では,Diffusion Transformer (DiT) の強い自己アテンション機構を用いて,フレーム間の相関関係を捉えることで,画像系列を生成することを学ぶ。
我々の手法は、データセット間で、品質および推論速度(少なくとも2倍の速さ)において、一貫してSoTAを上回ります。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 16:46:04 GMT)
A Turn Toward Better Alignment: Few-Shot Generative Adaptation with Equivariant Feature Rotation [67.2] 少ない撮影画像生成は、ごく少数の訓練画像を用いて、ソース生成モデルをターゲット領域に効果的に適応することを目的としている。
Equivariant Feature Rotation (EFR) は、ソースドメインとターゲットドメインを2つの相補的なレベルで整列させる新しい適応戦略である。
本手法は,対象領域内の生成性能を著しく向上させる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 13:48:22 GMT)
Towards Arbitrary Motion Completing via Hierarchical Continuous Representation [64.7] Inlicit Representations(INR)に基づくNAMEと呼ばれる新しいパラメトリックアクティベーションによる階層的暗黙表現フレームワークを提案する。
本手法では,複数の時間スケールで動作列から特徴を抽出し,複雑な時間パターンを効果的に捕捉する階層的時間符号化機構を提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:07:04 GMT)
Transductive Visual Programming: Evolving Tool Libraries from Experience for Spatial Reasoning [63.1] 提案するTransductive Visual Programming (TVP, Transductive Visual Programming) は、投機ではなく、独自の経験から新しいツールを構築する新しいフレームワークである。
TVPは最先端のパフォーマンスを達成し、GPT-4oを22%上回り、以前の最高のビジュアルプログラミングシステムを11%上回っている。
私たちの研究は、自己進化型ビジュアルプログラミングエージェントを構築するための強力なパラダイムとして、経験駆動型トランスダクティブツールの作成を確立します。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:30:21 GMT)
Steering Vision-Language Pre-trained Models for Incremental Face Presentation Attack Detection [62.9] 顔提示攻撃検出(PAD)は、スプーフィング戦術やドメインと戦うために漸進的な学習を要求する。
過去のデータ保持を禁止し、リハーサルフリーラーニング(RF-IL)を必要とするプライバシー規制
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:36:25 GMT)
ACD: Direct Conditional Control for Video Diffusion Models via Attention Supervision [62.4] 本稿では,注意監督による映像拡散モデルにおける直接条件制御のためのフレームワークである,注意継続拡散(Attention-Conditional Diffusion)を提案する。
ACDは、モデルの注意マップと外部制御信号との整列により、より良い制御性を実現する。
ベンチマークビデオ生成データセットの実験は、ACDがコンディショニング入力と優れたアライメントを提供することを示した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 16:24:18 GMT)
Emergent temporal abstractions in autoregressive models enable hierarchical reinforcement learning [61.4] 次トーケン予測に基づく大規模自己回帰モデルの構築と強化学習(RL)による微調整
自己回帰モデルの内部表現を動作させ,探索することにより,この問題を克服できることを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:32:45 GMT)
SemanticGen: Video Generation in Semantic Space [60.5] 最先端のビデオ生成モデルは、通常、VAE空間内のビデオ潜像の分布を学習し、VAEデコーダを使用してピクセルにマッピングする。
我々はセマンティックGenを紹介した。セマンティックGenはセマンティックな空間でビデオを生成する新しいソリューションだ。
提案手法は,長大なビデオ生成に拡張した場合にも有効であり,計算的にも効率的である。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:39:25 GMT)
HiStream: Efficient High-Resolution Video Generation via Redundancy-Eliminated Streaming [58.6] HiStreamは、3つの軸にわたる冗長性を体系的に低減する効率的な自動回帰フレームワークである。
1080pのベンチマークでは、主要なHiStreamモデル(i+ii)は最先端のビジュアル品質を実現し、Wan2.1ベースラインと比較して76.2倍高速なデノイングを実現した。
より高速なHiStream+は3つの最適化を全て適用し、ベースライン上で107.5倍の高速化を実現しています。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:59:58 GMT)
RoboSafe: Safeguarding Embodied Agents via Executable Safety Logic [56.4] 視覚言語モデル(VLM)を利用するエージェントは、複雑な現実世界のタスクを実行する能力がますます高まっている。
しかし、安全でない行動を引き起こす可能性のある危険な指示に弱いままである。
提案するRoboSafeは,実行可能述語ベースの安全ロジックを通じて,エージェントを具体化するためのランタイムセーフガードである。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:01:26 GMT)
TGC-Net: A Structure-Aware and Semantically-Aligned Framework for Text-Guided Medical Image Segmentation [56.1] 本稿では,パラメータ効率,タスク固有適応に着目したCLIPベースのフレームワークであるTGC-Netを提案する。
TGC-Netは、挑戦的なベンチマークで顕著なDiceゲインを含む、トレーニング可能なパラメータをかなり少なくして、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 12:06:26 GMT)
UniRec-0.1B: Unified Text and Formula Recognition with 0.1B Parameters [55.3] 視覚言語モデル(VLM)は、テキストと公式の統一的な認識を実現している。
パラメータが0.1Bしか持たない統一認識モデルUniRec-0.1Bを提案する。
文字、単語、行、段落、文書など、複数のレベルでテキストや公式の認識を行うことができる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 10:35:21 GMT)
Tree of Preferences for Diversified Recommendation [54.2] データバイアスの観点から、多種多様な推薦について検討する。
本研究では,世界知識を活用したゼロショット推論における大規模言語モデル(LLM)の卓越した性能に着想を得て,新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:13:17 GMT)
Learning from Next-Frame Prediction: Autoregressive Video Modeling Encodes Effective Representations [53.9] NExT-Vidは,新しい自己回帰型視覚生成事前学習フレームワークである。
本研究では,文脈分離型自己回帰予測器を導入し,セマンティック表現をターゲットデコーディングから切り離す。
文脈分離型フローマッチング事前学習により,本手法は強い表現を実現する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:07:08 GMT)
Policy-Conditioned Policies for Multi-Agent Task Solving [53.7] 本研究では,ポリシーを人間の解釈可能なソースコードとして表現することでギャップを埋めるパラダイムシフトを提案する。
本研究では,Large Language Models (LLM) を近似インタプリタとして利用することにより,学習問題を再構築する。
我々はこのプロセスを,ポリシーコードをテキスト勾配で最適化するアルゴリズムである TextitProgrammatic Iterated Best Response (PIBR) として定式化する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:42:10 GMT)
Embodied Intelligence for Flexible Manufacturing: A Survey [53.5] フレキシブルな製造では、産業的な具体化インテリジェンスは3つの課題に直面している。
これには、限られた知覚下での正確なプロセスモデリングとモニタリング、柔軟な適応と高精度制御の動的バランス、専門的な産業操作と汎用スキルの統合が含まれる。
本研究は,製造システムにおける知覚-決定-実行の閉ループ最適化のためのエンボディインテリジェンスの重要な技術経路を明らかにする。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:26:30 GMT)
Statistical and computational challenges in ranking [53.0] 質問に対する回答の正しさに基づいて,専門家の能力に応じて$n$をランク付けする問題を考察する。
ここでは,この問題に対する統計的に最適かつ計算学的に効率的な手順の存在について検討する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:18:06 GMT)
Benchmarking and Enhancing VLM for Compressed Image Understanding [53.0] VLM(Vision-Language Models)は、主に高ビットレート圧縮画像の消化と理解を行う。
低ビットレート圧縮画像の解釈能力はまだ研究されていない。
圧縮画像に対するVLMの能力を評価するための,最初の総合的なベンチマークを導入する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 02:59:01 GMT)
Fast SAM2 with Text-Driven Token Pruning [52.8] Segment Anything Model 2 (SAM2) では、視覚計算モデルがプロンプト駆動のビデオオブジェクトセグメンテーションにおいて大幅に進歩している。
SAM2パイプラインは、イメージエンコーダが生成するすべての視覚トークンを、ターゲットオブジェクトとの関係にかかわらず、下流の時間的推論モジュールを通じて伝達する。
本稿では,時間的伝播に先立ってトークン密度を選択的に低減し,推論効率を向上させるためのテキスト誘導型トークンプルーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:59:05 GMT)
Anatomy-R1: Enhancing Anatomy Reasoning in Multimodal Large Language Models via Anatomical Similarity Curriculum and Group Diversity Augmentation [52.8] MLLM(Multimodal Large Language Models)は自然画像推論において顕著な進歩を遂げている。
医用画像におけるその潜在性は、特に臨床解剖学的外科画像では未発見のままである。
これらの課題は、従来のSupervised Fine-Tuning戦略の有効性を制限する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:32:41 GMT)
Quantile Rendering: Efficiently Embedding High-dimensional Feature on 3D Gaussian Splatting [52.2] コンピュータビジョンの最近の進歩は、3Dガウススプラッティング(3D-GS)を活用して、OVS(Open-vocabulary segmentation)を3Dドメインに拡張することに成功している。
既存の方法はコードブックや特徴圧縮を採用しており、情報損失を引き起こし、セグメンテーションの品質が低下する。
本稿では,高忠実度を維持しながら高次元特徴を効率的に処理する3次元ガウスの新たなレンダリング戦略であるQuantile Rendering(Q-Render)を紹介する。
本フレームワークは,512次元特徴写像上での43.7倍の高速化でリアルタイムレンダリングを実現するとともに,最先端の手法よりも優れる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:16:18 GMT)
LookPlanGraph: Embodied Instruction Following Method with VLM Graph Augmentation [48.0] 大規模言語モデル(LLM)をタスクを具体化するためのプランナーとして利用する手法が広く普及している。
1つの解決策は、必要なすべての情報を含むシーングラフを使用することです。
現代の手法は事前に構築されたシーングラフに依存し、すべてのタスク関連情報が計画開始時に利用可能であると仮定する。
静的なアセットとオブジェクトの先行値からなるシーングラフを利用するLookPlanGraphを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:36:21 GMT)
TexAvatars : Hybrid Texel-3D Representations for Stable Rigging of Photorealistic Gaussian Head Avatars [48.0] テクスアバター(TexAvatars)は、解析リグの明示的な幾何学的基底とテクセル空間の空間的連続性を組み合わせたハイブリッド表現である。
提案手法は,CNNを用いてUV空間の局所的幾何学特性を推定するが,メッシュ認識ヤコビアンによる3次元変形を駆動する。
提案手法は,過度なポーズと表現変化下での最先端性能を実現し,挑戦的な頭部再現設定において強力な一般化を示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 10:50:04 GMT)
Graph Attention-based Adaptive Transfer Learning for Link Prediction [47.5] GAATNet(Graph Attention Adaptive Transfer Network)を提案する。
事前トレーニングと微調整の利点を組み合わせて、さまざまなスケールのデータセットにまたがるグローバルノードの埋め込み情報をキャプチャする。
7つの公開データセットに関する総合的な実験は、GAATNetがLPタスクで最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:11:34 GMT)
UltraShape 1.0: High-Fidelity 3D Shape Generation via Scalable Geometric Refinement [46.2] 我々は,高忠実度3次元幾何生成のためのスケーラブルな3次元拡散フレームワークであるUltraShape 1.0を紹介する。
提案手法では, 粗大な大域構造をまず合成し, 精細で高品質な幾何を生成する。
我々のモデルは、利用可能な3Dデータセットにのみトレーニングされており、限られたトレーニングリソースにもかかわらず、強力な幾何学的品質を達成することができる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:08:38 GMT)
SparScene: Efficient Traffic Scene Representation via Sparse Graph Learning for Large-Scale Trajectory Generation [46.0] SparSceneは、効率的でスケーラブルなトラフィックシーン表現のために設計されたスパースグラフ学習フレームワークである。
エージェントマップとエージェントエージェントの相互作用を集約し、効率とスケーラビリティを大幅に改善したコンパクトなシーン表現を生成する。
5ミリ秒以内のシーンで200以上のエージェントのトラジェクトリを生成し、5000以上のエージェントと17,000レーンにスケールし、わずか54ミリ秒の推論時間でGPUメモリは2.9GBである。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 12:02:35 GMT)
Beyond Pixel Simulation: Pathology Image Generation via Diagnostic Semantic Tokens and Prototype Control [45.7] セマンティクス駆動の病理画像生成フレームワークUniPathを紹介する。
UniPathは、Multi-Stream Control: a Raw-Text stream; a High-Level Semantics stream: a learnable query to a frozen pathology MLLM。
データ面では、2.65Mイメージテキストコーパスと、微調整で高品質な68Kサブセットをキュレートして、データの不足を軽減する。
実験によりUniPathのSOTA性能が実証され、Path-FIDは80.9(第2ベストより51%良い)で、セマンティックコントロールは98.7%の精度で実現された。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:52:08 GMT)
Where Did This Sentence Come From? Tracing Provenance in LLM Reasoning Distillation [44.2] クロスモデル推論蒸留防止トラクションフレームワークについて紹介する。
蒸留モデルにより生成された各行動について,教師,元学生,蒸留モデルに割り当てられた予測確率を同じ文脈で求める。
実験により, 蒸留モデルでは, 実際に教師が選択した行動が生成され, 実験結果と相関し, 測定結果が妥当に説明できることが実証された。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 03:19:05 GMT)
DiffusionVL: Translating Any Autoregressive Models into Diffusion Vision Language Models [44.0] 拡散視覚言語モデル (dVLM) は依然として主流モデルよりもかなり遅れている。
我々は、任意の強力なARモデルから変換可能なdVLMファミリーであるDiffusionVLを提案する。
DiffusionVLは、MMMU-Pro(vision)ベンチで34.4%、MME(Cog)ベンチで37.5%という総合的なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 03:37:34 GMT)
PanoGrounder: Bridging 2D and 3D with Panoramic Scene Representations for VLM-based 3D Visual Grounding [43.7] PanoGrounderは、多モードパノラマ表現と事前訓練された2D VLMを結合して、強力な視覚言語推論を行う、一般化可能な3DVGフレームワークである。
シーンレイアウトと幾何学を考慮したパノラマ視点をコンパクトに配置する3段階パイプラインを考案する。
提案手法は, ScanRefer と Nr3D の最先端結果を実現し, 未知の3次元データセットやテキストの言い換えに優れた一般化を示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 03:18:51 GMT)
pokiSEC: A Multi-Architecture, Containerized Ephemeral Malware Detonation Sandbox [42.0] pokiSECは、Dockerコンテナ内の一時的なマルウェア爆発サンドボックスである。
pokiSECはQEMUとハードウェアアクセラレーション(KVMが利用可能)を統合し、ブラウザベースのワークフローを公開する。
Apple Silicon and Ubuntu (AMD64) 上で pokiSEC を検証する
論文参考訳(メタデータ) (Wed, 24 Dec 2025 00:38:40 GMT)
Tutorial on Superconducting Quantum Circuits: From Basics to Applications [42.0] このチュートリアルは、学生レベルで超伝導量子回路の自己完結型教育的導入を提供する。
超伝導とジョセフソン効果の概要から始まり、マイクロ波回路の量子化を回路量子力学(cQED)の枠組みに体系的に展開する。
その後、トランスモン量子ビットは最先端の応用として導入され、ハミルトニアンとその制御および読み出し回路との相互作用を詳細に導出した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 03:36:14 GMT)
UniPR-3D: Towards Universal Visual Place Recognition with Visual Geometry Grounded Transformer [41.5] マルチビューからの情報を効果的に統合する初のVPRアーキテクチャであるUniPR-3Dを紹介する。
UniPR-3DはVGGTのバックボーン上に構築され、マルチビューの3D表現をエンコードできる。
実験により、UniPR-3Dは、単一のビューベースラインと複数ビューベースラインの両方を上回り、新しい最先端の技術を設定できることが判明した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 09:55:16 GMT)
Schrödinger's Navigator: Imagining an Ensemble of Futures for Zero-Shot Object Navigation [41.2] ゼロショットオブジェクトナビゲーション(ZSON)は、ロボットが以前見えなかった環境で対象物を見つける必要がある。
既存のZSONメソッドは、しばしば現実的で散らかった環境で苦労する。
そこで我々はSchrdingerのナビゲータを提案する。これはSchrdingerの不確実性に関する思考実験に触発されたナビゲーションフレームワークである。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:28:17 GMT)
T2AV-Compass: Towards Unified Evaluation for Text-to-Audio-Video Generation [41.0] Text-to-Audio-Video (T2AV) は、自然言語から時間的コヒーレントなビデオと意味的に同期された音声を合成することを目的としている。
本稿では,T2AVシステムの総合評価のための統合ベンチマークであるT2AV-を提案する。
最強のモデルでさえ、人間レベルのリアリズムとクロスモーダルな一貫性にかなり劣っている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 10:30:35 GMT)
SpidR-Adapt: A Universal Speech Representation Model for Few-Shot Adaptation [40.6] 最小限のラベル付きデータを用いた新しい言語への迅速な適応のためのSpedR-Adaptを提案する。
両レベル最適化フレームワークとして適応処理を定式化するマルチタスク適応型事前学習プロトコルを構築した。
経験的に、SpedR-Adaptは音韻識別性と音声言語モデリングの急速な進歩を実現している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:33:16 GMT)
ReaSeq: Unleashing World Knowledge via Reasoning for Sequential Modeling [38.2] 産業推薦システムはログ駆動のパラダイムの下で2つの基本的な制限に直面している。
大規模言語モデルにおける世界知識を活用する推論強化フレームワークであるReaSeqを紹介する。
TaobaoのランキングシステムにReaSeqをデプロイします。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 16:06:20 GMT)
Foundation Model Priors Enhance Object Focus in Feature Space for Source-Free Object Detection [38.1] ドメインシフトは、検出器が強力なオブジェクト中心の表現を維持する能力を低下させる。
FALCON-SFODはドメインシフト下でのオブジェクト指向適応を強化するために設計されたフレームワークである。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:10:56 GMT)
Hybrid digital-analog protocols for simulating quantum multi-body interactions [37.8] 量子シミュレーターは古典計算を超えた量子多体物理学を探求することを約束する。
彼らの能力は、ハードウェア内の利用可能なネイティブインタラクションによって制限される。
これらの制限を克服するハイブリッドデジタルアナログプロトコルを導入し、実験的に実証する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 19:00:36 GMT)
Semantic Refinement with LLMs for Graph Representations [37.7] グラフ表現学習のためのデータ適応セマンティック・リファインメントフレームワークDASを提案する。
我々は、テキストリッチグラフとテキストフリーグラフの両方に対するアプローチを評価した。
結果は、セマンティクスに富むグラフに競争力を維持しながら、構造支配グラフに対して一貫した改善を示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:10:28 GMT)
TICON: A Slide-Level Tile Contextualizer for Histopathology Representation Learning [37.3] TICONは変換器ベースのタイル表現文脈化器である。
計算病理学における 'any' アプリケーションのためのリッチでコンテキスト化された埋め込みを生成する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:58:16 GMT)
Active inference and artificial reasoning [36.9] この技術的注記は、基礎となる世界モデルの構造に関する最も多くの情報を提供する結果のサンプリングについて考察する。
我々は、世界モデルに関する最大の不確実性を解決する結果を求めることで得られるサンプル効率に焦点を当てる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:59:36 GMT)
AndroidLens: Long-latency Evaluation with Nested Sub-targets for Android GUI Agents [36.7] モバイルGUIエージェントのための挑戦的な評価フレームワークであるAndroidLensを紹介する。
中国語と英語の両方の環境での長時間のタスクは571である。
我々の評価では、最高のモデルでさえ、12.7%のタスク成功率と50.47%のATPにしか達していない。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 17:40:42 GMT)
Streaming Video Instruction Tuning [36.4] 本稿では、汎用対話型アシスタントとして機能するリアルタイムストリーミングビデオLLMであるStreamoを紹介する。
Streamoは、リアルタイムナレーション、アクション理解、イベントキャプション、時間的イベントグラウンド、時間に敏感な質問応答など、幅広いストリーミングビデオタスクを実行する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:59:36 GMT)
dUltra: Ultra-Fast Diffusion Language Models via Reinforcement Learning [36.1] マスク付き拡散言語モデルは並列トークン生成の可能性を秘めている。
オープンソースのMDLMは、モデルフォワードパス毎に5トークン未満をデコードする。
dUltraは効率的な並列デコーディングのためのアンマスク戦略を学ぶ。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 23:31:48 GMT)
LuxIA: A Lightweight Unitary matriX-based Framework Built on an Iterative Algorithm for Photonic Neural Network Training [36.0] アートPNNシミュレーションツールの現状は,大規模PNNのトレーニングにおいて,大きなスケーラビリティ上の課題に直面している。
バックプロパゲーションに適合する効率的な転送行列計算手法であるスライシング法を提案する。
スライシング方式はメモリ使用量と実行時間を大幅に削減し、大規模PNNのスケーラブルなシミュレーションとトレーニングを可能にする。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 17:31:51 GMT)
GenTSE: Enhancing Target Speaker Extraction via a Coarse-to-Fine Generative Language Model [35.1] 我々は,TSEのための2段階デコーダのみのジェネレーションLMアプローチであるGenTSEを提案する。
意味論と音響学の分離は、復号化を安定化させ、より忠実で内容に整合したターゲットスピーチをもたらす。
Libri2Mixの実験は、GenTSEが従来のLMベースのシステムよりも、音声品質、知性、話者の一貫性を上回っていることを示している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:13:02 GMT)
MarineEval: Assessing the Marine Intelligence of Vision-Language Models [35.1] 我々は,2000枚の画像に基づく質問応答ペアを用いた,最初の大規模海洋VLMデータセットとベンチマークであるMarineEvalを構築した。
我々は,MineEval上で17の既存のVLMをベンチマークし,海洋研究の質問に答える上での既存モデルの限界について検討する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:57:50 GMT)
Next-Scale Prediction: A Self-Supervised Approach for Real-World Image Denoising [34.5] Next-Scale Prediction (NSP)は、ノイズのデコレーションをディテール保存から切り離す新しい自己監督パラダイムである。
副産物として、NSPは自然にリトレーニングや修正なしにノイズ画像の超解像をサポートする。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:06:17 GMT)
Self-supervised Multiplex Consensus Mamba for General Image Fusion [34.0] 一般画像融合のための自己教師型多重コンセンサスマンバフレームワークであるSMC-Mambaを提案する。
Modality-Agnostic Feature Enhancement (MAFE)モジュールは適応ゲーティングを通じて詳細を保存する。
MCCM内のクロスモーダルスキャンは、モダリティ間の特徴的相互作用を強化する。
Bi-level Self-supervised Contrastive Learning Loss (BSCL) は、計算オーバーヘッドを増大させることなく高周波情報を保存する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 03:57:21 GMT)
AInsteinBench: Benchmarking Coding Agents on Scientific Repositories [33.5] AInsteinBenchは、大規模言語モデル(LLM)エージェントが科学計算開発エージェントとして動作するかどうかを評価するための大規模なベンチマークである。
AInsteinBenchは、表面レベルのコード生成を超えて、計算科学研究に必要なコア能力に移行するモデルの能力を測定する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:11:11 GMT)
Generalization of Diffusion Models Arises with a Balanced Representation Space [32.7] 我々は,表現学習のレンズを用いて,拡散モデルにおける記憶と一般化の区別を分析する。
暗記は,学習重みに生のトレーニングサンプルを格納し,符号化と復号を行い,局所的な「スピーキー」表現を生成するモデルに対応することを示す。
本稿では,表現ステアリングによる正確な制御を可能にする,暗記検出のための表現ベース手法と,トレーニング不要な編集手法を提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:40:40 GMT)
ClarifyMT-Bench: Benchmarking and Improving Multi-Turn Clarification for Conversational Large Language Models [32.1] ClarifyMT-Benchは、大規模言語モデル(LLM)におけるマルチターン明確化のためのベンチマークである。
多様なあいまいさソースと相互作用パターンをキャプチャする6,120個のマルチターン対話を構築した。
textbfClarifyAgentは,認知,予測,追跡,計画に明確化を分解するエージェントアプローチである。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:39:00 GMT)
Matrix Completion Via Reweighted Logarithmic Norm Minimization [31.8] 核ノルムは、一般に凸として使われ、階数関数の計算的に抽出可能なサロゲートとして用いられる。
本稿では,既存の多くの代替品よりも近い近似を提供する新しい再重み付きサロゲートを提案する。
画像インパインティング実験の結果,提案手法は最先端のLRMC手法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:31:44 GMT)
Language-Guided Grasp Detection with Coarse-to-Fine Learning for Robotic Manipulation [31.4] 本稿では,ロボット操作のための粗粒度学習パラダイムを用いた言語誘導グラフ検出(LGGD)を提案する。
この設計により、きめ細かいビジュアル・セマンティックなアライメントが可能となり、タスク命令に対する予測された把握の実現性が改善される。
OCID-VLGとGrasp-Anything++データセットの実験は、LGGDが既存の言語誘導の把握方法を上回ることを示している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 09:16:42 GMT)
Accurate and Diverse Recommendations via Propensity-Weighted Linear Autoencoders [30.7] 実世界のレコメンデーションシステムでは、ユーザとイテムのインタラクションは、MNAR(Missing Not At Random)である。
Inverse Propensity Scoring (IPS) は広く使われており、一般的にはアイテムの相互作用周波数のパワー則関数に基づいて確率をモデル化する。
我々は、人気アイテムを過度に罰することなく、より広い項目の推薦を可能にするために、適合度スコアを再定義することでこの問題に対処する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 02:44:25 GMT)
Human Motion Estimation with Everyday Wearables [30.1] EveryWearは、日常的なウェアラブルをベースとした、軽量で実用的な人間のモーションキャプチャーアプローチである。
我々はEgo-Elecを紹介した。Ego-Elecは実世界の9時間データセットで、17の屋内および屋外環境にわたる56の日々の活動をカバーしている。
このアプローチでは,エゴセントリックカメラからの視覚的手がかりと,コンシューマデバイスからの慣性信号を統合するマルチモーダルな教師学習フレームワークを採用している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:44:51 GMT)
Parallel Token Prediction for Language Models [29.8] 言語モデルにおける並列シーケンス生成のための普遍的なフレームワークである並列トークン予測(PTP)を提案する。
PTPは、サンプリング手順をモデルに組み込むことで、1つのトランスフォーマー呼び出しにおける複数の依存トークンを共同で予測する。
PTPは任意の自己回帰配列分布を表現できることを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:46:55 GMT)
DreaMontage: Arbitrary Frame-Guided One-Shot Video Generation [29.7] DreaMontageは任意のフレーム誘導生成用に設計された包括的なフレームワークである。
多様なユーザが提供するインプットから、シームレスで表現力豊かで長期にわたるワンショットビデオを合成することができる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 16:00:15 GMT)
DGSAN: Dual-Graph Spatiotemporal Attention Network for Pulmonary Nodule Malignancy Prediction [28.9] 肺がんは、世界中のがん関連死亡の主な原因であり続けている。
従来の研究は、マルチモーダル情報とマルチテンポラル情報を統合し、単一モーダルと単一時間点よりも優れていた。
本稿では、時間変動とマルチモーダルデータを活用して予測精度を向上させるデュアルグラフ時空間注意ネットワークを提案する。
NLST-cmst と CSTL-based data を併用した実験により, DGSAN は肺結節の分類において, 異常な計算効率で, 最先端の手法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 02:47:22 GMT)
Equivariant Multiscale Learned Invertible Reconstruction for Cone Beam CT: From Simulated to Real Data [28.2] LIRE++は、高速かつメモリ効率の良いCBCT再構成のための、エンド・ツー・エンド・エンド・エンドのローテーション・等価な学習用可逆原始双対スキームである。
LIRE++は、高速な準モンテカルロCBCTプロジェクションシミュレータからシミュレーションされたプロジェクションデータに基づいて訓練された。
実際の臨床データでは, LIRE++は再建とそれに対応する計画CTの平均絶対誤差を, 10個のハウンズフィールドユニットで改善した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 13:59:43 GMT)
kooplearn: A Scikit-Learn Compatible Library of Algorithms for Evolution Operator Learning [27.9] Kooplearnは、動的演算子の線形、カーネル、ディープラーニング推定を実装した機械学習ライブラリである。
Kooplearnは離散時間進化作用素(Koopman/Transfer)と連続時間無限小ジェネレータの両方をモデル化することができる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 20:15:41 GMT)
EVE: A Generator-Verifier System for Generative Policies [27.9] 生成的アーキテクチャに基づくビジュモータポリシーは、強い性能を示すが、分散シフトの下では劣化する。
Eveはモジュール型ジェネレータと検証器のインタラクションフレームワークで、テスト時に事前訓練された生成ポリシーのパフォーマンスを高める。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 21:36:34 GMT)
Can Agentic AI Match the Performance of Human Data Scientists? [27.2] 大規模言語モデル(LLM)は、非常に自動化されたデータサイエンスを持つ。
これらのエージェントAIシステムは、人間のデータサイエンティストのパフォーマンスに本当にマッチできるか?
ジェネリック分析ワークフローに依存するエージェントAIは、ドメイン固有の洞察を使用するメソッドに劣っていることを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:31:42 GMT)
Distilling the Essence: Efficient Reasoning Distillation via Sequence Truncation [27.2] 大きな言語モデルからより小さな学生モデルへの推論能力を希釈するには、かなりの量の推論データのトレーニングが必要となることが多い。
異なるセグメント(P, CoT, A)にまたがる監督の割り当てが学生のパフォーマンスにどのように影響するかを検討する。
各トレーニングシーケンスの最初の50%ドルのトークンのみのトレーニングは、平均して$approx94%のフルシーケンスパフォーマンスを保持することができる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:57:35 GMT)
Surgical Scene Segmentation using a Spike-Driven Video Transformer with Real-Time Potential [27.0] 手術シーンセグメンテーションに適した最初のスパイク駆動ビデオトランスフォーマーフレームワークである textitSpikeSurgSeg を提案する。
SpikeSurgSegは、SOTA ANNベースのモデルに匹敵するほとんどのmIoUを実現し、推論遅延を少なくとも8倍に削減する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 17:05:09 GMT)
Atomic clock frequency ratios with fractional uncertainty $\leq 3.2 \times 10^{-18}$ [26.5] 本稿では,光学式原子時計の高精度周波数比を27ドルAl$+$,71ドルYb,87ドルSrで報告する。
総分数不確かさが3.2×10-18$以下である以上、これらの測定は国際単位系における第2次の再定義の重要なマイルストーン基準を満たす。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 21:25:48 GMT)
Shape of Thought: When Distribution Matters More than Correctness in Reasoning Tasks [24.6] より有能なモデルからの連鎖トレースのデータセットをトレーニングすることで、言語モデルの推論能力を向上させることができることを示す。
実験により、このアプローチは人間の注釈付きデータセットのトレーニングよりも推論タスクのパフォーマンスが向上することが示された。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:35:55 GMT)
GateBreaker: Gate-Guided Attacks on Mixture-of-Expert LLMs [24.3] GateBreakerは、トレーニング不要で、軽量で、アーキテクチャに依存しない最初のアタックフレームワークです。
GateBreakerは、現代のMoE LLMの安全アライメントを推論時に妥協する。
本研究により,MoEの安全性はスパースルーティングによって調整された神経細胞の小さなサブセットに集中していることが判明した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:13:24 GMT)
The Imitation Game: Using Large Language Models as Chatbots to Combat Chat-Based Cybercrimes [24.1] チャットベースのサイバー犯罪は広範にわたる脅威として浮上している。
従来の防衛機構は、これらの会話的脅威を特定するのに苦労している。
本稿では,Large Language Modelsをアクティブエージェントとしてデプロイする最初のシステムLUREを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:34:05 GMT)
Efficient and Robust Video Defense Framework against 3D-field Personalized Talking Face [23.7] 最先端の3D-field video-referenced Talking Face Generation (TFG) 手法は,高忠実度パーソナライズされた対面映像をリアルタイムに合成する。
この機能は、個人肖像画の悪意ある誤用に関する重要なプライバシー上の懸念を引き起こす。
本稿では,3次元フィールドTFG法に対する新しい,効率的なビデオ防御フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:26:06 GMT)
Casting a SPELL: Sentence Pairing Exploration for LLM Limitation-breaking [23.5] 大規模言語モデル(LLM)は、AI支援コーディングツールを通じてソフトウェア開発に革命をもたらした。
このアクセシビリティは、これらの強力なツールを利用して有害なソフトウェアを生成する悪意のあるアクターにまで拡張される。
本研究では,悪意のあるコード生成におけるセキュリティアライメントの弱点を評価するための総合的なテストフレームワークであるSPELLを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:25:31 GMT)
Multimodal Skeleton-Based Action Representation Learning via Decomposition and Composition [23.3] 本稿では,自己教師型マルチモーダルスケルトンに基づく行動表現学習フレームワーク,Decomposition and Composingを紹介する。
提案手法は,計算コストとモデル性能のバランスが良好である。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 09:10:04 GMT)
AegisAgent: An Autonomous Defense Agent Against Prompt Injection Attacks in LLM-HARs [23.0] AegisAgentはLLM駆動HARシステムのセキュリティを確保するために設計された自律エージェントシステムである。
結果は、GPUワークステーションで78.6ミリ秒のレイテンシオーバーヘッドしか発生せず、攻撃成功率を平均30%削減することを示している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:29:24 GMT)
Temporal Visual Semantics-Induced Human Motion Understanding with Large Language Models [22.5] サブスペースクラスタリング技術を用いて、教師なしの人間の動きのセグメンテーションを効果的に実現することができる。
本稿では,人間の動作系列から派生した時間的視覚意味論(TVS)を用いて,サブスペースクラスタリング性能を向上させることを提案する。
実験結果から,提案手法は4つのヒトの動作データセットに対する既存の最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 03:11:12 GMT)
STLDM: Spatio-Temporal Latent Diffusion Model for Precipitation Nowcasting [22.3] 降水流しは、異常気象による深刻な被害を防ぐための社会にとって重要な予測課題である。
STLDMと呼ばれるシンプルなモデルアーキテクチャを提案する。これは拡散に基づくモデルであり、Varitemporal Autoencoder と Conditioning Network の両方とともに、終端から終端までの潜伏表現を学習する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:34:44 GMT)
A Tool Bottleneck Framework for Clinically-Informed and Interpretable Medical Image Understanding [22.0] TBF(Tool Bottleneck Framework)と呼ばれる医用画像理解のためのツール・ユース・フレームワークを提案する。
ある画像とタスクに対して、TBFは市販の医療用VLMを活用して、それぞれが臨床的に関連のある特徴を抽出するツールボックスからツールを選択する。
テキストベースの構成の代わりに、これらのツールはTBMによって構成され、最終予測を出力する前にニューラルネットワークを使用してツール出力を計算および融合する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 20:30:01 GMT)
TrafficSimAgent: A Hierarchical Agent Framework for Autonomous Traffic Simulation with MCP Control [21.8] TrafficSimAgentは、汎用的な交通シミュレーションタスクの実験設計と意思決定の最適化の専門家である。
このフレームワークは、専門家エージェント間のクロスレベルなコラボレーションを通じて実行を容易にする。
ユーザーの指示があいまいである場合でも、一貫して合理的な結果を生み出す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:48:04 GMT)
Hearing to Translate: The Effectiveness of Speech Modality Integration into LLMs [20.3] SpeechLLMは、従来の転写ベースのパイプラインをバイパスして、音声言語を直接翻訳することを目的としている。
分析対象は16のベンチマーク,13の言語ペア,9つの困難な条件である。
現在のSpeechLLMは、選択した設定のカスケードにのみ対応しているのに対して、カスケードシステムは全体として最も信頼性が高い。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:39:27 GMT)
MVInverse: Feed-forward Multi-view Inverse Rendering in Seconds [19.9] 多視点逆レンダリングは、幾何、材料、照明を複数の視点で一貫して回復することを目的としている。
既存のシングルビューアプローチは、しばしばクロスビュー関係を無視し、一貫性のない結果をもたらす。
本稿では,RGB画像から空間変化アルベド,金属,粗さ,拡散シェーディング,表面正規度を直接予測するフィードフォワード多視点逆レンダリングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:59:29 GMT)
ORCA: Object Recognition and Comprehension for Archiving Marine Species [19.9] ORCAは478種の14,647枚の画像からなる海洋研究のためのマルチモーダルベンチマークである。
このデータセットは、様々な海洋種にまたがる形態学指向の属性をキャプチャする、きめ細かい視覚的およびテキスト的アノテーションを提供する。
結果は、種多様性、形態学的重複、専門領域要求など、重要な課題を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 12:36:57 GMT)
MMSRARec: Summarization and Retrieval Augumented Sequential Recommendation Based on Multimodal Large Language Model [18.9] 本稿では,マルチモーダル要約と検索拡張シーケンスレコメンデーションを提案する。
まずMLLMを用いて、項目を簡潔なキーワードに要約し、要約長、情報損失、再構成難易度を含む報酬を用いてモデルを微調整する。
検索拡張生成にインスパイアされ、協調信号を対応するキーワードに変換し、補足コンテキストとして統合する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 03:44:25 GMT)
Fast Navigation Through Occluded Spaces via Language-Conditioned Map Prediction [18.7] このようなコパイロット命令をローカルプランナに組み込むアプローチとしてPaceForecasterを紹介した。
PaceForecasterは、ロボットのローカルセンサーのフットプリントと、提供されるコパイロット命令を入力として取り込む。
言語条件付き予測と目標を用いることで,多角形環境下でのローカルマップのみのベースラインよりもナビゲーション性能が36%向上することを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 19:34:08 GMT)
C2LLM Technical Report: A New Frontier in Code Retrieval via Adaptive Cross-Attention Pooling [18.5] 0.5Bおよび7Bサイズのコード埋め込みモデルのファミリーであるC2LLMを提案する。
Qwen-2.5-Coderのバックボーン上に構築されているC2LLMでは、トークン埋め込みからシーケンス埋め込みを生成するために、Pooling by Multihead Attention (PMA)モジュールを採用している。
C2LLMモデルはMTEB-Codeで同様のサイズのモデルで新記録を樹立し、C2LLM-7Bは全体リーダーボードで1位となった。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:59:01 GMT)
Foundation Model-based Evaluation of Neuropsychiatric Disorders: A Lifespan-Inclusive, Multi-Modal, and Multi-Lingual Study [18.4] アルツハイマー病(AD)、うつ病、自閉症スペクトラム障害(ASD)などの神経精神疾患は、言語学的および音響的異常によって特徴づけられる。
FEND (Foundation model-based Evaluation of Neuropsychiatric Disorders) は、生涯にわたってAD、うつ病、ASDを検出するための音声とテキストのモダリティを統合した総合的な多モードフレームワークである。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:07:07 GMT)
FluencyVE: Marrying Temporal-Aware Mamba with Bypass Attention for Video Editing [18.2] 大規模テキスト・画像拡散モデルは画像生成と編集において前例のない成功を収めた。
近年のビデオ編集作業は、ビデオタスクに時間的注意機構を加えることで、事前訓練されたテキスト・ツー・イメージモデルに適応している。
本稿では,シンプルだが効果的なワンショットビデオ編集手法であるFluencyVEを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:21:59 GMT)
Optical Flow-Guided 6DoF Object Pose Tracking with an Event Camera [18.1] イベントカメラを用いた光学式フロー誘導型6DoFオブジェクトポーズトラッキング手法を提案する。
提案手法は,精度とロバスト性の両方の観点から,イベントベース最先端手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:40:57 GMT)
Case Prompting to Mitigate Large Language Model Bias for ICU Mortality Prediction [17.9] 大規模言語モデル(LLM)は、構造化された医療データから結果を予測することを約束している。
LLMは性、年齢、人種に関する人口統計バイアスを示し、臨床実践における信頼に値する使用を制限することができる。
本研究では,公正さとパフォーマンスを同時に向上するトレーニングフリー,臨床適応型プロンプトフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:34:41 GMT)
Reasoning-Driven Amodal Completion: Collaborative Agents and Perceptual Evaluation [17.4] 本稿では,視覚合成から意味的計画を明確に分離する協調的マルチエージェント推論フレームワークを提案する。
提案手法は,画素生成前の構造的,明示的なプランを生成し,視覚的,意味的に整合した単一パス合成を可能にする。
従来の評価基準の限界に対処し,新しい人間対応評価指標MAC-Scoreを導入する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:39:45 GMT)
AI-Accelerated Qubit Readout at the Single-Photon Level for Scalable Atomic Quantum Processors [16.8] 我々は,中性原子配列における蛍光可読化のためのAI加速ベイズ推定法について報告する。
提案手法はベイズ推定を利用して,短時間露光下での単一光子レベルでの信頼性の高い状態検出を実現する。
このフレームワークは、大規模原子配列のスケーラブルでリアルタイムな読み出しをサポートし、計算とセンシングにおけるAI強化量子技術への道を開く。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 03:51:56 GMT)
Optimizing Decoding Paths in Masked Diffusion Models by Quantifying Uncertainty [16.5] Masked Diffusion Models (MDMs) は柔軟で非自己回帰的な生成を提供するが、この自由は挑戦をもたらす。
我々はこの問題を初めて公式化し、生成経路に沿った累積予測の不確実性に出力品質の変動をもたらす。
本研究は,MDMにおける不確実性を負債から,高品質なソリューションを発見する上での鍵となる優位性へと効果的に転換する,生成の理解と制御の原則的ツールとして,Denoising Entropyを確立した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:59:51 GMT)
MolAct: An Agentic RL Framework for Molecular Editing and Property Optimization [16.4] 分子設計問題に対するエージェント強化学習フレームワークである MolAct を紹介する。
分子編集タスクの MolEditAgent と分子最適化タスクの MolOptAgent の2つのモデルファミリーを訓練するためのフレームワークをインスタンス化する。
その結果, 分子設計を多段階, ツール強化プロセスとして扱うことが, 信頼性と解釈性の向上の鍵であることが示唆された。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 02:19:21 GMT)
Planetary Terrain Datasets and Benchmarks for Rover Path Planning [16.3] 宇宙ミッションベースの惑星データセット、標準化されたベンチマーク、評価プロトコルが不足している。
本稿では,火星と月の高解像度デジタル地形画像から得られたMarsPlanBenchとMoonPlanBenchを提案する。
さらに,古典的かつ学習的な経路計画アルゴリズムを統一的なフレームワークで構築し,提案したデータセット上で評価した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 22:15:12 GMT)
One Tool Is Enough: Reinforcement Learning for Repository-Level LLM Agents [16.3] RepoNavigatorは、呼び出されたシンボルの定義に単一の実行対応ツールジャンプを備えるエージェントである。
RepoNavigatorは、事前訓練されたモデルから直接強化学習を通じてエンドツーエンドで訓練され、クローズドソースの蒸留は行われない。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:27:53 GMT)
Lightweight framework for underground pipeline recognition and spatial localization based on multi-view 2D GPR images [16.2] 本稿では、3次元GPRを用いた地下パイプライン検出の複雑なシナリオにおいて、多視点特徴間の弱い相関、小型目標の認識精度の低さ、およびロバスト性に対処する3次元パイプラインインテリジェント検出フレームワークを提案する。
実験により, 複雑なマルチパイプのシナリオにおいて, 精度96.2%, 平均精度93.3%, 平均精度96.7%が得られた。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 00:50:27 GMT)
Embodied AI-Enhanced IoMT Edge Computing: UAV Trajectory Optimization and Task Offloading with Mobility Prediction [16.2] 無人航空機(UAV)は、無線ボディエリアネットワーク(WBAN)ユーザーにリアルタイムなバイオメディカルエッジコンピューティングサービスを提供するために、Internet of Medical Things(IoMT)で広く利用されている。
本稿では,AIエージェントが捉えたユーザの履歴軌跡に基づく,階層型マルチスケールトランスフォーマーに基づくユーザ軌道予測モデルを提案する。
予測ユーザの移動情報を統合した予測強化学習(DRL)アルゴリズムは,UAV飛行軌跡の最適化とタスクオフロード決定のために設計されている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 03:06:37 GMT)
AnyAD: Unified Any-Modality Anomaly Detection in Incomplete Multi-Sequence MRI [16.2] 本稿では,任意のMRIモダリティ・アベイラビリティの下で,ロバストな異常検出と局所化を行う,Any-Modality 異常検出フレームワークを提案する。
Intrinsic Normal Prototypes (INPs) extractorとINP-guided Decoderを導入し、正常な解剖学的パターンのみを再構成し、異常な偏差を自然に増幅する。
我々のアプローチは、7つのモダリティの組み合わせにまたがって、最先端の産業と医療のADベースラインを一貫して超越し、より優れた一般化を実現している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 16:16:09 GMT)
PUFM++: Point Cloud Upsampling via Enhanced Flow Matching [15.7] PUFM++は、スパース、ノイズ、部分的な観測から点雲を再構築するための拡張されたフローマッチングフレームワークである。
本稿では,まず,スパース入力から高密度ターゲットへ直進する直進経路の流れを学習し,次にノイズ摂動サンプルを用いて改良し,終端境界分布をよりよく近似する2段階フローマッチング手法を提案する。
合成ベンチマークと実世界のスキャンの実験は、PUFM++がポイントクラウドのアップサンプリングにおいて、新しい最先端の技術を設定していることを示している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:30:42 GMT)
Improving the Convergence Rate of Ray Search Optimization for Query-Efficient Hard-Label Attacks [15.6] ハードラベルのブラックボックス攻撃では、トップ1の予測ラベルのみがアクセス可能である。
本稿では,最適な光線方向を探索する攻撃の代表的なクラスを最適化することに焦点を当てる。
Nesterov の Gradient (NAG) に触発され,運動量に基づくアルゴリズム ARS-OPT を提案する。
ARS-OPTは蓄積運動量から推定される将来の光線方向の勾配を積極的に推定する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:35:03 GMT)
Does the Data Processing Inequality Reflect Practice? On the Utility of Low-Level Tasks [15.0] 有限個のトレーニングサンプルに対して,分類精度を向上させる事前分類処理が存在することを示す。
また、クラス分離、トレーニングセットサイズ、およびクラスバランスが、この手順の相対的な利得に及ぼす影響についても検討する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:21:01 GMT)
Learning from Neighbors with PHIBP: Predicting Infectious Disease Dynamics in Data-Sparse Environments [15.0] 本稿では,Poisson Hierarchical Indian Buffet Process(PHIBP)の詳細な計算フレームワークと実験応用について述べる。
PHIBPのアーキテクチャは絶対存在感の概念に基づいており、関連する地域から統計的強度を体系的に借用し、相対レート法の既知の感度をゼロカウントに回避している。
この原理は、一貫性のある予測分布を生成するための堅牢な基盤と、アルファやベータの多様性のような比較尺度を効果的に活用するための基盤を提供することを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:10:17 GMT)
Fuzzwise: Intelligent Initial Corpus Generation for Fuzzing [14.7] 突然変異ベースのグレーボックスファジングでは、初期コーパスのための高品質な入力シードを生成することが不可欠である。
FuzzyWiseは、大きなコーパスを生成し、その後最小化するために、別々のフェーズを統合する。
FuzzyWiseは高いコードカバレッジを実現し、ベースラインと比較してランタイムエラーを発生させる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 22:17:29 GMT)
CoDrone: Autonomous Drone Navigation Assisted by Edge and Cloud Foundation Models [14.4] CoDroneはクラウドとバックエンドのコラボレーティブコンピューティングフレームワークで、ファンデーションモデルを自律的なUAVクルーズシナリオに統合する。
CoDroneは飛行速度やネットワーク条件の異なるベースライン法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 02:49:47 GMT)
An Equivariance Toolbox for Learning Dynamics [13.7] 学習力学の1次制約と2次制約を結合した汎用等分散ツールボックスを開発した。
まず,保護法則と暗黙のバイアス関係を単一アイデンティティの特別な事例として統一する。
2階目では、曲率に関する構造予測を提供する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 23:42:07 GMT)
Mesh-Attention: A New Communication-Efficient Distributed Attention with Improved Data Locality [13.4] 本稿では,新しい分散アテンションアルゴリズムであるMesh-Attentionを提案する。
提案手法では,ブロックの2次元タイル(1次元行や列ではなく)を各GPUに割り当て,高い効率を実現する。
Mesh-Attentionは最大3.4倍のスピードアップを実現し、通信容量を最大85.4%削減できることを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:48:58 GMT)
All-optical control and multiplexed readout of multiple superconducting qubits [13.3] 超伝導量子回路はミリケルビン温度で動作し、室温制御と読み出し電子回路を接続するために各キュービットごとに独立したマイクロ波ケーブルを必要とする。
ここでは、超伝導量子回路のための完全な光I/Oアーキテクチャを示す。
この閉ループ光I/Oは、クビットコヒーレンス時間に測定可能な劣化を起こさず、光学駆動された単一クビットゲート忠実度は、標準マイクロ波動作と比較して0.19%しか減少しない。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:27:21 GMT)
A Large-Depth-Range Layer-Based Hologram Dataset for Machine Learning-Based 3D Computer-Generated Holography [13.2] 機械学習ベースのホログラフィー(ML-CGH)は近年急速に進歩しているが、高品質で大規模なホログラムデータセットの可用性が制限されている。
256*256から2048*2048までの解像度で6000対のRGB-D画像と複雑なホログラムからなる公開データセットである KOREATECH-CGH を提案する。
位相保存中に各深さ層におけるホログラム波動場の振幅成分を置き換える後処理技術である振幅投影を導入する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:07:39 GMT)
RevFFN: Memory-Efficient Full-Parameter Fine-Tuning of Mixture-of-Experts LLMs with Reversible Blocks [13.0] RevFFNは、専門家(MoE)のLLMの混合のためのメモリ効率の良い微調整パラダイムである。
RevFFNは、バックプロパゲーション中に出力からの層入力アクティベーションの再構築を可能にする、慎重に設計されたリバーシブルトランスフォーマーブロックを採用している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 03:56:58 GMT)
Shared Representation Learning for High-Dimensional Multi-Task Forecasting under Resource Contention in Cloud-Native Backends [12.8] 本研究では,クラウドネイティブバックエンドシステムの予測要求を満たすため,高次元マルチタスク時系列の統一予測フレームワークを提案する。
本手法は,多様なモニタリング指標を統一的に表現するための共有符号化構造を構築する。
ノード間の潜在的な依存関係をモデル化するために、クロスタスク構造伝搬モジュールが導入された。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:02:03 GMT)
MiST: Understanding the Role of Mid-Stage Scientific Training in Developing Chemical Reasoning Models [12.8] 大規模言語モデルは、ルールベースの報酬でオンラインの微調整を通じて推論機能を開発することができる。
強化学習は、ベースモデルが既に答えを正すために無視できない確率を割り当てている場合にのみ成功する。
この研究は、化学推論能力の出現とこれらの前提条件が化学にとって何を意味するかを研究する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:15:18 GMT)
CoTDeceptor:Adversarial Code Obfuscation Against CoT-Enhanced LLM Code Agents [12.1] CoTDeceptorは、CoT強化LDM検出器をターゲットにした最初の逆コード難読化フレームワークである。
我々の発見は、現実世界のソフトウェアサプライチェーンの潜在的なリスクを浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:55:42 GMT)
Deadline-Aware Online Scheduling for LLM Fine-Tuning with Spot Market Predictions [11.8] コスト効率のよいスケジューリングを可能にするための予測のパワーと、推定誤差に対する感度を示す。
本稿では,コミット型水平方向制御手法に基づくオンラインアロケーションアルゴリズムを提案する。
両アルゴリズムのパラメータを変動させて構築したプールから最良のポリシーを学習するオンラインポリシー選択アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:47:27 GMT)
Model Merging via Multi-Teacher Knowledge Distillation [11.5] モデルマージ設定に特化して、新しい平坦性を考慮したPAC-Bayes一般化を導入する。
我々は,少ないラベルのないデータに基づいて,マルチ教師の知識蒸留としてマージするモデルを構築した。
我々は,学生教師のKulback-Leibler分散の最小化が,合併モデルの過大なリスクの上限を直接締め付けることを正式に証明した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 17:10:44 GMT)
Memory-Efficient Acceleration of Block Low-Rank Foundation Models on Resource Constrained GPUs [11.5] トランスフォーマーベースの基盤モデルの最近の進歩は、多くのタスクのデフォルト選択となった。
その急速に成長するサイズは、単一のGPUに完全なモデルを適合させることがますます難しくなり、計算コストが禁じられる。
ブロック低ランク(BLR)圧縮技術は、重み行列のコンパクト表現を学習することでこの問題に対処する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 00:41:13 GMT)
AgentTutor: Empowering Personalized Learning with Multi-Turn Interactive Teaching in Intelligent Education Systems [11.2] AgentTutorは、パーソナライズされた学習を促進する多ターンインタラクティブな知的教育システムである。
LLMを利用した生成型マルチエージェントシステムと学習者固有の学習プロファイル環境を備えている。
カリキュラムの分解、学習者評価、動的戦略、リフレクションの指導、知識と経験記憶の5つの重要なモジュールが含まれている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 12:26:28 GMT)
Certifiable Alignment of GNSS and Local Frames via Lagrangian Duality [11.2] グローバルナビゲーション衛星システム(GNSS)に対する局地システムの絶対方向を推定することは、しばしば局地的なミニマと衛星の可用性への高い依存に悩まされる。
このアライメントタスクの方法は、入手できない多くの衛星に依存し、あるいはアライメントの最適性を保証できない局所最適化手法を使用する。
提案手法は認証可能であり,既存の局所凸が故障した場合のギャップを数値的に埋めることができる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:24:33 GMT)
A Survey of Freshness-Aware Wireless Networking with Reinforcement Learning [10.8] 情報時代(AoI)は、現代の無線システムにおけるデータの鮮度の中心的指標となっている。
このギャップによって動機づけられたこの調査は、特にAoIのレンズと一般化された鮮度最適化を通してRLを調べる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 20:24:16 GMT)
Learning to Refocus with Video Diffusion Models [10.7] 本稿では,映像拡散モデルを用いた現実的な撮影後再焦点のための新しい手法を提案する。
単一の非焦点画像から,ビデオシーケンスとして表現された知覚的精度の高い焦点スタックを生成する。
提案手法は,難解なシナリオにまたがる知覚的品質と堅牢性の両方において,既存のアプローチを一貫して上回ります。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 16:32:32 GMT)
Robust and Efficient MuJoCo-based Model Predictive Control via Web of Affine Spaces Derivatives [10.6] 有限差分法(FD)のドロップイン置換として,MuJoCo MPC内のアフィン空間(WASP)誘導体を導入する。
WASPは、精度の高い微分近似のシーケンスを効率的に計算するための、最近開発されたアプローチである。
我々は,複数のロボットを対象とする多種多様なMJPCタスクを対象としたWASPの評価を行った。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:13:41 GMT)
Cerberus: Multi-Agent Reasoning and Coverage-Guided Exploration for Static Detection of Runtime Errors [10.4] 我々はCerberusを提案する。Cerberusは予測、実行不要なカバレッジ誘導テストフレームワークである。
Cerberus は LLM を使用して実行時のエラーを発生させるインプットを生成し、コード実行なしでコードカバレッジ予測とエラー検出を行う。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 21:41:35 GMT)
LLMTM: Benchmarking and Optimizing LLMs for Temporal Motif Analysis in Dynamic Graphs [10.4] 時間的モチーフ関連タスクにおいて,Large Language Models (LLMs) の性能を体系的に研究する。
我々は,これらのタスクを高精度に解くために,高精度なプロンプトを利用するツール拡張LDMエージェントを開発した。
このトレードオフに対処するため,簡単な構造対応ディスパッチを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:10:29 GMT)
LLM-Driven Preference Data Synthesis for Proactive Prediction of the Next User Utterance in Human-Machine Dialogue [10.1] ProUttは、積極的に次の発話を予測するためのLLM駆動の嗜好データ合成法である。
対話履歴をインテントツリーに変換し、インテント推論軌跡を明示的にモデル化する。
次に、異なる将来のターンでインテントツリーパスを摂動または修正することで、選好および非参照推論プロセスを構築する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 12:23:52 GMT)
Neutralization of IMU-Based GPS Spoofing Detection using external IMU sensor and feedback methodology [10.1] IMUセンサによる検出を中和するスプーフィング攻撃システムを提案する。
そこで本研究では,内部の動的状態情報を盗み,GPSスプーフィングを行う攻撃モデルを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:40:40 GMT)
Your Reasoning Benchmark May Not Test Reasoning: Revealing Perception Bottleneck in Abstract Reasoning Benchmarks [10.1] 認識と推論を明確に分離する2段階の実験パイプラインを導入する。
本研究は,観測性能ギャップの根底にある要因は知覚能力であることを示す。
本研究は,認識を推論から遠ざける評価プロトコルの必要性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:58:04 GMT)
Understanding Scaling Laws in Deep Neural Networks via Feature Learning Dynamics [9.9] スケーリング法則は、成功とはどのようなもので、いつ、なぜスケーリングが成功するか、失敗なのかを記述している。
中心的な障害は、大きな深さで特徴学習の厳密な理解が欠如していることである。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 09:39:04 GMT)
Agentic Software Issue Resolution with Large Language Models: A Survey [9.6] ソフトウェア問題解決は,ユーザが提供する自然言語記述に基づいて,ソフトウェアリポジトリの現実的な問題に対処することを目的としている。
推論と生成能力の大規模言語モデル(LLM)は、自動ソフトウェア問題解決において大きな進歩をもたらした。
近年,LSMベースのエージェントシステムがソフトウェア問題解決の主流となっている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:05:10 GMT)
Robustness Certificates for Neural Networks against Adversarial Attacks [9.4] 本稿では,勾配に基づく学習を離散時間力学系としてモデル化する形式的頑健性認定フレームワークを提案する。
当社のフレームワークはテスト時の攻撃に対する認証にも拡張されており、トレーニングとテスト時の攻撃設定の両方で正式な保証を提供する最初の統一されたフレームワークです。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 00:49:47 GMT)
Precise quantum control of unidirectional field-free molecular orientation [9.0] 我々は、対称トップ分子の2つの特定の回転状態を選択的に操作することで、一方向のフィールドフリー配向を実現する理論的枠組みを開発する。
所望の2状態配向を達成するために,単一制御パルスを用いた量子制御戦略を提案する。
その結果, 分子配向の長期化における初期状態選択と量子コヒーレンスの重要性が明らかになった。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:16:28 GMT)
AirGS: Real-Time 4D Gaussian Streaming for Free-Viewpoint Video Experiences [9.0] 自由視点ビデオ(FVV)は、ユーザが任意の視点からシーンを見ることによって没入的な視聴体験を可能にする。
AirGSはストリーミング最適化された4DGSフレームワークで、トレーニングとデリバリを再構築して、高品質で低レイテンシな体験を可能にする。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:57:30 GMT)
Hallucination Detection for LLM-based Text-to-SQL Generation via Two-Stage Metamorphic Testing [8.9] 大型言語モデル(LLM)は幻覚、すなわち非現実的または非論理的内容を生成する。
本稿では,メタモルフィックテスト(MT)に基づく新しい幻覚検出手法を提案する。
F1スコアは69.36%から82.76%の範囲である。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:04:26 GMT)
ReVEAL: GNN-Guided Reverse Engineering for Formal Verification of Optimized Multipliers [8.8] ReVEALはグラフ学習に基づく乗算器アーキテクチャのリバースエンジニアリング手法である。
従来のルールベースのアプローチと比較して,スケーラビリティと精度の向上を示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 13:01:55 GMT)
Hamiltonian-Informed Point Group Symmetry-Respecting Ansatz for Variational Quantum Eigensolver [8.8] 変分量子固有解法(VQE)アルゴリズムによって分子エネルギーレベルを解くことは、最も有望な応用の1つである。
そこで本研究では,ハミルトニアンの固有情報から設計した新しい対称性を反映したアンザッツであるHiUCCSDを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 10:03:23 GMT)
Simulating Circuit Layout for Distributed Quantum Computing [8.6] 提案フレームワークは、フォトニックに接続された分散量子プロセッサ間で量子回路をコンパイルする最初のツールである。
その設計は、回路分割、トランスパイル、組立のための分割・コンカのパラダイムに従っており、シミュレート可能で実装可能な回路レイアウトを生成する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 19:52:45 GMT)
Bridging Microscopic Constructions and Continuum Topological Field Theory of Three-Dimensional Non-Abelian Topological Order [8.4] 我々は3次元量子二重モデルの研究により、非アベリア位相秩序における励起、核融合、収縮について研究する。
格子縮小規則は融合に従い、ツイストされた$BF$場理論によって予測される一貫性関係を収縮することを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 12:30:42 GMT)
Hardware-aware and Resource-efficient Circuit Packing and Scheduling on Trapped-Ion Quantum Computers [8.3] 本稿では,トラップイオンデバイスのためのハードウェア対応回路パッキングフレームワークであるCircPackを紹介する。
超伝導ベースのQMPアプローチと比較すると、CircPackは70.72%の忠実度、62.67%の高利用率、32.80%の改善を達成している。
このフレームワークはまた、独立したQCCDモジュールのクラスタ間でスケーラブルでバランスの取れたスケジューリングを可能にする。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 16:38:08 GMT)
A Reinforcement Learning Approach to Synthetic Data Generation [8.3] RLSynは患者記録に対するポリシーとしてデータジェネレータをモデル化する新しいフレームワークである。
我々は、プライバシー、実用性、忠実度を評価する上で、最先端のジェネレーティブ・敵ネットワーク(GAN)と拡散に基づく手法を比較検討した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 19:26:37 GMT)
SegMo: Segment-aligned Text to 3D Human Motion Generation [8.3] SegMoは、新しいテキスト条件のヒューマンモーション生成フレームワークである。
複雑なテキスト記述を時間的に順序づけられたフレーズに分解し、それぞれが単純な原子行動を表す。
動作シーケンスを対応する動作セグメントに分割し、テキストと動作セグメントを対照的な学習と整合させる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:26:11 GMT)
Understanding Virality: A Rubric based Vision-Language Model Framework for Short-Form Edutainment Evaluation [8.2] VideoScore-2は、特定のオーディオヴィジュアル属性が実際の観客のエンゲージメントに与える影響を捉えていない。
本稿では、視覚言語モデル(VLM)を用いて教師なしの視覚的特徴を抽出するデータ駆動評価フレームワークを提案する。
我々のアプローチは、堅牢で説明可能なビデオ理解へと進む。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 19:43:59 GMT)
LLM4Perf: Large Language Models Are Effective Samplers for Multi-Objective Performance Modeling [7.4] 本稿では,Large Language Models (LLMs) によるサンプリング機能と特徴について検討する。
フィードバックベースのフレームワークであるLLM4Perfを設計,実装し,LLM誘導サンプリングプロセスの体系的評価に利用した。
この有効性は、LLMの2つの機能である、構成空間プルーニングとフィードバック駆動型戦略改善に起因している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:33:31 GMT)
VisRes Bench: On Evaluating the Visual Reasoning Capabilities of VLMs [7.4] 自然主義的環境下での視覚的推論を文脈言語による制御なしで研究するためのベンチマークであるVisRes Benchを紹介した。
3段階の複雑さのモデル行動を分析し、知覚的および関係的な視覚的推論能力の明らかな限界を明らかにする。
我々は、VisResがマルチモーダル研究における抽象的な視覚的推論を促進するための統一的なフレームワークをどのように提供するかについて論じる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:18:38 GMT)
Safe Path Planning and Observation Quality Enhancement Strategy for Unmanned Aerial Vehicles in Water Quality Monitoring Tasks [7.3] スペクトルリモートセンシング技術は水質モニタリングに広く利用されている。
動的環境において、影やスペクトル反射のような様々な照明条件は、厳しいスペクトル歪みを引き起こす。
本稿では,動的光と影乱れ回避のための能動経路計画法を提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:26:20 GMT)
Decomposing LLM Self-Correction: The Accuracy-Correction Paradox and Error Depth Hypothesis [6.9] 自己補正を3つのサブ機能に分解する。
本研究は,モデル能力と自己改善に関する線形仮定に挑戦する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 21:51:24 GMT)
Learning to Solve PDEs on Neural Shape Representations [6.9] 形状上の偏微分方程式を解くことは、多くの形状解析や工学的なタスクを支えている。
しかし、一般的なPDEソルバは多角形/三角形メッシュで動作し、現代の3Dアセットは神経表現としてますます生きていく。
本稿では,ニューラルな(局所的な)形状特性に基づいて局所的な更新演算子を学習する,メッシュフリーな新しい定式化を提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:14:02 GMT)
Feasible strategies in three-way conflict analysis with three-valued ratings [6.4] 本稿では,一貫性と非一貫性という2つの観点から,実現可能な戦略について検討する。
実現可能な戦略,$L$オーダー可能な戦略,およびそれに対応する最適戦略を識別するアルゴリズムを開発する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 20:52:15 GMT)
Interpretable Plant Leaf Disease Detection Using Attention-Enhanced CNN [6.4] 植物病は世界の食料安全保障に重大な脅威をもたらす。
本研究は,植物葉病検出のための解釈型注意誘導畳み込みニューラルネットワーク(CNN)CBAM-VGG16を紹介する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:38:23 GMT)
Stretchable and High-Precision Optical Tactile Sensor for Trajectory Tracking of Parallel Mechanisms [6.3] 提案した連続スペクトルフィルタ原理に基づく伸縮性触覚センサを開発した。
提案センサは伸縮・曲げ時でも高直線空間応答 (0.996) と高連続空間 (7m) と高力 (5mN) の分解能を実現する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 02:13:16 GMT)
Scalable Deep Subspace Clustering Network [6.3] 我々はランドマークベースの近似により$mathcalO(n)$複雑性を実現するディープサブスペースクラスタリングフレームワークであるSDSNetを提案する。
本研究では,SDSNetのクラスタリング品質を最先端手法と同等に向上し,計算効率が大幅に向上したことを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 21:46:38 GMT)
PhononBench:A Large-Scale Phonon-Based Benchmark for Dynamical Stability in Crystal Generation [6.1] 我々は,AI生成結晶の動的安定性に関する最初の大規模ベンチマークであるPhononBenchを紹介する。
フォノンベンチは、108,843個の結晶構造に対する効率的な大規模フォノン計算と動的安定性解析を可能にする。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:07:36 GMT)
Universal Reasoning Model [6.1] Universal Transformer (UT) はARC-AGI や Sudoku といった複雑な推論タスクに広く使われている。
ARC-AGIの改良は主にTransformerの繰り返し誘導バイアスと強い非線形成分から生じる。
この発見を動機として,短い畳み込みと切り離されたバックプロパゲーションでUTを向上させるUniversal Reasoning Model (URM)を提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:34:30 GMT)
Quantum entanglement between partons in a strongly coupled quantum field theory [6.0] 強結合型3+1次元スカラー湯川理論におけるパートニック成分間の量子絡みについて検討する。
エンタングルメントエントロピーは、横運動量依存分布のシャノンエントロピーと密接に関係している。
本研究は、量子場理論における非摂動力学の基本的なプローブとしての絡み合いの役割を明らかにするものである。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:08:27 GMT)
Time-Efficient Evaluation and Enhancement of Adversarial Robustness in Deep Neural Networks [5.9] この論文は、ディープニューラルネットワーク(DNN)における対向ロバスト性の評価と強化のための時間効率のよい方法を提供することを目的としている。
両チームの既存のアプローチは計算集約的であり、大規模モデルの適用性を制限している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 02:33:08 GMT)
Critical Points of Degenerate Metrics on Algebraic Varieties: A Tale of Overparametrization [5.9] 縮退する二次目的量によって定義される最適化問題の代数多様体上の臨界点について検討する。
本研究の主な成果は、退化最適化問題を射影による非退化問題に関連付けるものである。
射影多様体の臨界点数を数えるツールを提供し、深層学習による特定の事例について議論する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:52:23 GMT)
A Unified Framework for EEG Seizure Detection Using Universum-Integrated Generalized Eigenvalues Proximal Support Vector Machine [5.7] 本稿では,脳波信号分類のための新しいUniversum-enhanced分類器を提案する。
提案したモデルは、非定常性、低信号-雑音比、ラベル付きデータといった脳波解析における重要な課題に対処する。
モデルは2つのバイナリ分類タスクにまたがってボン大学脳波データセットで評価される。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 13:39:11 GMT)
ALIVE: An Avatar-Lecture Interactive Video Engine with Content-Aware Retrieval for Real-Time Interaction [5.7] ALIVEはAvatar-Lecture Interactive Video Engineで、受動的にリアルタイムで学習できる。
ALIVEは軽量な埋め込みモデル、FAISSベースの検索、プログレッシブプリロードによるセグメント化されたアバター合成を採用している。
本システムは,完全な医用画像処理コースにおいて,その検索精度,レイテンシ特性,ユーザエクスペリエンスを評価し,ALIVEが正確なコンテンツ認識とリアルタイムサポートを提供することを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 00:33:59 GMT)
Three-way conflict analysis based on alliance and conflict functions [5.6] トリセクトエージェント、イシュー、およびエージェントペアは、3方向のコンフリクト分析において必須のトピックである。
評価関数は、問題に対するエージェントの肯定的、否定的、中立的な評価を定義する。
補助機能は、エージェント間の同盟、紛争、中立関係を定義する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 20:51:48 GMT)
How important is Recall for Measuring Retrieval Quality? [5.2] 知識ベースが大きく進化した現実的な検索設定では、クエリに関連するドキュメントの総数は一般的に不明であり、リコールは計算できない。
我々は,検索品質指標とLCMに基づく応答品質判断の相関を計測することにより,この制限に対処するためのいくつかの確立された戦略を評価する。
本稿では,関連文書の総数を知ることなく,検索品質の簡易化を図る方法を提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 00:16:31 GMT)
Teaching People LLM's Errors and Getting it Right [5.2] 人々は、すべきでないときに大きな言語モデル(LLM)を使用します。
以前の作業では、LLMが失敗する可能性のあるリージョンにインスタンスの埋め込みをクラスタ化することで、この問題に対処しようとしていた。
見つかった障害パターンは、過剰な信頼性を軽減するためにユーザに教えられます。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 20:53:07 GMT)
A Real-World Evaluation of LLM Medication Safety Reviews in NHS Primary Care [5.2] 本研究は,NHSプライマリケアデータを用いたLSMベースの医薬品安全性評価システムの最初の評価である。
患者を戦略的に採取し,幅広い臨床複雑性と薬剤の安全性リスクを捉えた。
当システムでは,臨床症状の認識に強い性能を示した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:58:49 GMT)
Early warning signals for loss of control [5.0] フィードバックシステムの安定性はレジリエンスの指標によって監視可能であることを示す。
このシステム安全モニタはシステムモデルに依存しておらず、臨界減速という一般的な現象に基づいている。
ドローンによる有効性を示す一方で、基礎となる原則の一般的な性質は、これらの指標がより広い種類の制御システムに適用可能であることを示唆している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 00:59:46 GMT)
DexAvatar: 3D Sign Language Reconstruction with Hand and Body Pose Priors [5.0] DexAvatarは,手話ビデオから生体力学的に精密な手話や身体の動きを再現する新しいフレームワークである。
DexAvatarはSGNifyモーションキャプチャデータセットで強力なパフォーマンスを実現し、体と手のポーズの推定で35.11%向上した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:44:58 GMT)
DeepCQ: General-Purpose Deep-Surrogate Framework for Lossy Compression Quality Prediction [4.6] 圧縮品質の損失予測のための汎用的なディープサロゲートフレームワーク(DeepCQ)を提案する。
我々の結果はフレームワークの異常な予測精度を強調しており、ほとんどの設定で予測エラーは10%以下である。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 21:46:17 GMT)
Generalised Linear Models in Deep Bayesian RL with Learnable Basis Functions [4.6] 我々は、学習可能な基底関数(GLiBRL)を持つディープベイズRLにおける新しいディープBRL法、一般化線形モデルを導入する。
挑戦的なMetaWorld ML10/45ベンチマークでは、GLiBRLは最先端のディープBRL手法であるVariBADの成功率を最大2.7倍改善した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:00:51 GMT)
A Mechanistic Analysis of Transformers for Dynamical Systems [4.6] 動的データに適用した場合の単一層変換器の表現能力と限界について検討する。
線形系に対しては、ソフトマックスアテンションによって課される凸性制約が、表現できる力学のクラスを根本的に制限していることが示される。
部分可観測性を持つ非線形系では、注意は適応的な遅延埋め込み機構として機能する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:21:07 GMT)
Heralded Linear Optical Generation of Dicke States [4.5] 我々は、任意のディック状態を生成するための隠蔽光学スキームを、$|D_nkrangle$と$3n+k$光子で提示する。
この結果は、量子技術のためのDicke状態の実用化に向けて、資源効率の良い経路を提供する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 01:56:23 GMT)
State-Conditional Adversarial Learning: An Off-Policy Visual Domain Transfer Method for End-to-End Imitation Learning [4.5] ターゲットドメインデータが厳密なオフポリティ、エキスパートフリー、不足といった現実的で困難な環境で、エンド・ツー・エンドの模倣学習のための視覚的ドメイン転送について検討する。
条件付きKL項の判別器に基づく推定器を用いて,システム状態に条件付の潜伏分布を整列する,非政治的逆数学習フレームワークであるステート・コンディショナル・アディショナル・アディショナル・ラーニングを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:35:55 GMT)
ElfCore: A 28nm Neural Processor Enabling Dynamic Structured Sparse Training and Online Self-Supervised Learning with Activity-Dependent Weight Update [4.4] イベント駆動型センサ信号処理に適した28nmデジタルスパイクニューラルネットワークプロセッサElfCoreを提案する。
ElfCoreは,(1)ラベル付き入力を使わずに多層時間学習が可能なローカルオンライン自己教師型学習エンジン,(2)高精度スパース学習をサポートする動的構造化スパース学習エンジン,(3)入力アクティビティとネットワークダイナミクスのみに基づいて重みを選択的に更新する活動依存スパースウェイト更新機構である。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 12:45:36 GMT)
Beyond Memorization: A Multi-Modal Ordinal Regression Benchmark to Expose Popularity Bias in Vision-Language Models [4.3] このタスクの最大のオープンベンチマークを紹介する: YearGuessrデータセットは157カ国のマルチモーダル属性を持つ55,546のイメージで構成されている。
我々は,建設年度予測タスクを規則的回帰とみなし,このバイアスを定量化するために人気を考慮した区間精度指標を導入する。
その結果、YearCLIPモデルを含む30モデル以上のベンチマークの結果、VLMは一般的な記憶アイテムに優れるが、未認識の被験者と大きな差はないことが確認された。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:59:54 GMT)
FedPOD: the deployable units of training for federated learning [4.3] FedPODは2024年のFeTSチャレンジで第1位にランクインした。
FedPIDAvgにインスパイアされたFedPODは、訓練効率を高めるためのラウンドワイドなタスクを定義する。
この課題では、DiceのスコアでFedPIDAvgに匹敵するパフォーマンスを示し、WT、ET、TCの平均は0.78、0.71、0.72、平均は0.74である。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 02:38:59 GMT)
Neural Probe-Based Hallucination Detection for Large Language Models [4.2] 大規模言語モデルは、テキスト生成と知識問合せタスクにおいて優れている。
幻覚コンテンツを生成する傾向があり、リスクの高いドメインへの適用を厳しく制限している。
トークンレベルの幻覚検出のためのニューラルネットワークベースのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:10:19 GMT)
Assessing the Software Security Comprehension of Large Language Models [4.2] 本研究は,5大言語モデル(LLM)のセキュリティ理解を体系的に評価する。
記憶、理解、適用、分析、評価、創造の6つの認知次元を評価します。
モデルが信頼性のある性能を継続的に維持する上で,最高の認知レベルを識別するソフトウェアセキュリティ知識境界を導入する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:29:54 GMT)
Tracing Energy Flow: Learning Tactile-based Grasping Force Control to Prevent Slippage in Dynamic Object Interaction [4.1] 動的物体相互作用におけるすべりの低減のための把持力の調節は、ロボット操作の基本的な課題である。
本稿では,物体を仮想エネルギーコンテナとしてモデル化する物理情報を用いたエネルギー抽象化を提案する。
シミュレーションとハードウェアの両方の実験により,スクラッチから力の制御を数分で学習できることが実証された。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:19:25 GMT)
Multi-Attribute guided Thermal Face Image Translation based on Latent Diffusion Model [4.0] 本稿では,熱入力から高品質な顔画像を生成するために,新しい潜時拡散モデルを提案する。
マルチ属性分類器は、可視画像から重要な顔属性を抽出し、赤外線可視画像復元時の特徴損失を軽減する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:55:54 GMT)
Towards Better Search with Domain-Aware Text Embeddings for C2C Marketplaces [3.8] 我々は,日本最大のC2CマーケットプレースであるMercuriにおける検索の質を向上させるために,ドメイン対応の日本語テキスト埋め込みアプローチを構築した。
生産制約を満たすために,Matryoshka Representation Learningを適用して,コンパクトでトランケーションの少ない埋め込みを実現する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:35:17 GMT)
Variationally correct operator learning: Reduced basis neural operator with a posteriori error estimation [3.8] PDE-残留損失の最小化は、ニューラル演算子の物理的一貫性を促進するための一般的な戦略である。
本研究は,FOSLS(Fon-order system least-squares)の目的を定式化することによって,変分正しい演算子学習フレームワークを開発する。
本稿では,有限要素の離散化バイアス,ベーストランケーション誤差の低減,ニューラルネットワーク近似誤差,統計的推定誤差の和で総誤差を束縛する厳密な収束解析を提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:37:59 GMT)
Amortized Inference for Model Rocket Aerodynamics: Learning to Estimate Physical Parameters from Simulation [3.6] モデルロケットの飛行性能の正確な予測には、直接測定が難しい空力パラメータを推定する必要がある。
従来のアプローチでは計算流体力学や経験的相関に頼っていたが、データ駆動方式では膨大な実際の飛行データが必要であり、収集には高価で時間がかかる。
本稿では,物理シミュレータから生成された合成飛行データに基づいてニューラルネットワークをトレーニングし,学習したモデルを微調整なしで実飛行に適用するシミュレーションベースアモータイズ推論手法を提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 01:32:04 GMT)
From GNNs to Symbolic Surrogates via Kolmogorov-Arnold Networks for Delay Prediction [3.6] 我々は、注目に基づくメッセージパッシングを備えた異種GNNを実装し、強力なニューラルベースラインを確立する。
第二に、Kolmogorov-Arnold Networksが標準レイヤを置き換え、トレーニング可能なパラメータを減らすFlowKANetを提案する。
第三に、ブロックワイド回帰を用いてモデルをシンボリック・サロゲートモデルに蒸留し、訓練可能な計算を排除した閉形式方程式を生成する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 02:05:46 GMT)
LLM-Driven Feature-Level Adversarial Attacks on Android Malware Detectors [3.5] LAMLADはAndroidマルウェア検出のための新しい攻撃フレームワークである。
これは、大きな言語モデルの生成能力と推論能力を利用する。
LAMLADは攻撃成功率(ASR)を97%まで達成し、敵のサンプル当たり平均3回しか試行できない。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 19:56:06 GMT)
Speak the Art: A Direct Speech to Image Generation Framework [3.4] 我々は、音声エンコーディングネットワークと、音声埋め込みを前提としたVQ-拡散ネットワークからなる、textbfSpeak the Art (STA) というフレームワークを導入する。
音声の埋め込みを改善するために、トレーニング中にトレーニング済みの大規模な画像テキストモデルによって音声符号化ネットワークを監督する。
概念実証として、私たちは2つの言語(英語とアラビア語)でフレームワークを訓練しました。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 10:49:00 GMT)
Holographic Tensor Networks as Tessellations of Geometry [3.4] ホログラフィックテンソルネットワークは、アンチ・デ・シッター/コンフォーマルフィールド理論(AdS/CFT)対応の玩具モデルとして機能する。
我々は2つのホログラフィックテンソルネットワークモデル、すなわち分解されたPEEテンソルネットワークとランダムなPEEテンソルネットワークを開発する。
どちらのモデルでも、ネットワーク内の面に沿った最小限の切断数が、この表面の面積を正確に計算することを示し、正確な龍高柳公式を再現する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 13:46:49 GMT)
Measuring all the noises of LLM Evals [3.2] 本研究では, 与えられた質問に対する異なる回答から発生する予測ノイズ, サンプリングされた質問から得られるデータノイズ, および全分散の法則に従って合成された総雑音の3種類のノイズを定義し, 測定する。
本稿では,LLMのすべてのペアにペア解析を適用し,数百万の質問レベル予測に基づいて,すべてのノイズ成分を計測する全ペアペアペア手法を提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:54:37 GMT)
CoSeNet: A Novel Approach for Optimal Segmentation of Correlation Matrices [3.2] 提案したモデルはCoSeNetと呼ばれ、4層アルゴリズムアーキテクチャに基づいている。
このモデルは、そのような行列における相関セグメントを、類似した問題に対する以前のアプローチよりも効果的に識別することができる。
モデルの出力は、最適セグメンテーションとセグメンテーションポイントを表す二項ノイズフリー行列である。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:55:43 GMT)
A multi-algorithm approach for operational human resources workload balancing in a last mile urban delivery system [3.2] 労働力への効率的な作業負荷割り当ては、ラストマイルパッケージデリバリシステムにおいて非常に重要です。
地理的に近接した作業員にパッケージ配達を割り当てる従来の手法は非効率である。
この問題に対処するためのマルチアルゴリズムアプローチを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:45:44 GMT)
Larger Is Not Always Better: Leveraging Structured Code Diffs for Comment Inconsistency Detection [3.0] 開発者がコードを変更するが、対応するコメントを更新することを無視する場合に、コメントの不整合が発生する。
大規模言語モデル(LLM)を利用したCCI(Code-comment Inconsistency)検出への最近のアプローチ
CodeT5+のバックボーン上に構築したJust-In-Time CCI検出手法を提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:58:28 GMT)
Interpretable Perturbation Modeling Through Biomedical Knowledge Graphs [2.9] マルチモーダル・埋め込みは バイオメディカル・ナレッジ・グラフに統合されます
薬物細胞対のランドマーク遺伝子のデルタ表現プロファイルを学習するために,グラフアテンションネットワークを訓練する。
我々の枠組みは、メカニスティックな薬物モデリングへの道筋を提供する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:42:25 GMT)
A Community-Enhanced Graph Representation Model for Link Prediction [2.9] Community-Enhanced Link Prediction (CELP) フレームワークは、局所グラフトポロジとグローバルグラフトポロジを共同でモデル化するコミュニティ構造を組み込んでいる。
CELPは、リンク予測精度の向上において、コミュニティ構造の重要な役割を検証し、優れた性能を達成する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 13:31:34 GMT)
Making AI Work: An Autoethnography of a Workaround in Higher Education [2.8] この研究は、ユーザ主導の回避策は、社会技術統合の不可欠な行為として理解されるべきである、と論じている。
複雑な組織政治において、GenAIを統合するために必要な目に見えない労働力は、実際にどのように機能するかという周辺的要素よりも、重要であることを示唆している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:48:18 GMT)
Deep learning-enhanced dual-mode multiplexed optical sensor for point-of-care diagnostics of cardiovascular diseases [2.8] 光センサーによる心筋トロポニンI(cTnI)、クレアチンキナーゼMB(CK-MB)、N末端プロB型ナトリウム利尿ペプチド(NT-proBNP)の同時定量
xVFAは、cTnIに対するサブpg/mL感度とCK-MBおよびNT-proBNPに対するサブng/mL感度を達成する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 19:11:14 GMT)
Artificial or Just Artful? Do LLMs Bend the Rules in Programming? [2.8] 本研究では,異なるプロンプト条件下でテストケースに曝露した場合に,大規模言語モデルがコード生成戦略にどのように適応するかを検討する。
結果から,テストの可視性は性能を劇的に改善し,精度はいくつかのモデルではほぼ2倍になるが,明示的な制約や部分的な露出は,この効果を部分的に緩和するだけであることがわかった。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:51:15 GMT)
Evolutionary optimization of spatially-distributed multi-sensors placement for indoor surveillance environments with security levels [2.7] 室内監視のための空間分布型マルチセンサ配置の修正版に取り組む。
当社のアプローチは、異なるセキュリティレベルを考慮できる軍事施設など、賢明な屋内空間のセキュリティ監視に重点を置いている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:33:45 GMT)
MultiMind at SemEval-2025 Task 7: Crosslingual Fact-Checked Claim Retrieval via Multi-Source Alignment [2.5] 本稿では,SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrievalについて述べる。
本稿では,TriAlignerについて紹介する。TriAlignerは,2つのエンコーダアーキテクチャを対照的な学習で活用し,異なるモダリティにまたがるネイティブとイングリッシュの両方の翻訳を取り入れた新しいアプローチである。
本手法は,複数の言語にまたがるアライメントの相対的重要性を学習することにより,複数の言語にまたがるクレームを効果的に検索する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:14:40 GMT)
Solving Functional PDEs with Gaussian Processes and Applications to Functional Renormalization Group Equations [2.4] 非摂動関数的再正規化群方程式を解くための演算子学習フレームワークを提案する。
我々の手法は柔軟であり、幅広い関数微分方程式に適用できる。
特に,本手法は非定常場を扱えるため,より複雑なフィールド構成の研究が期待できる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:27:20 GMT)
Semi-Supervised Learning for Large Language Models Safety and Content Moderation [2.3] 大規模言語モデル(LLM)の安全性は、その出現以来、研究の焦点となっている。
ラベル付きデータとラベルなしデータの両方を活用する半教師付き学習手法を提案する。
大規模言語モデルに与えられるプロンプトと,その要求に対する応答の両方に対して,これらのテクニックがもたらす改善について分析する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:12:09 GMT)
Decoding Predictive Inference in Visual Language Processing via Spatiotemporal Neural Coherence [2.2] 聴覚障害者の視覚言語刺激に対する神経応答を復号する機械学習フレームワークを提案する。
言語理解における左半球と低周波のコヒーレンスを重要視した。
この研究は、経験駆動の脳における知覚の生成モデルを探索するための新しいアプローチを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:19:20 GMT)
Coupled-wire construction of non-Abelian higher-order topological phases [2.0] この研究は、高次の位相位相の理解を非アベリア体制へと拡張する。
これは、フォトニックや音響メタマテリアルのような合成量子システムにおける実現可能な実験的実現を示唆している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 13:59:13 GMT)
Adaptive Financial Sentiment Analysis for NIFTY 50 via Instruction-Tuned LLMs , RAG and Reinforcement Learning Approaches [1.9] 金融感情分析における既存の研究は、株価や市場のフィードバックが感情分析に与える影響を考慮していない。
本研究では,大規模言語モデル(LLM)と現実世界の市場フィードバックを統合し,感情分類を改善する適応フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 03:42:59 GMT)
NeRV360: Neural Representation for 360-Degree Videos with a Viewport Decoder [1.8] ビデオに対する暗黙の神経表現(NeRV)は、ビデオ圧縮に強い可能性を示している。
本研究では,パノラマフレーム全体を再構築する代わりに,ユーザ選択ビューポートのみをデコードするエンドツーエンドフレームワークであるNeRV360を提案する。
NeRV360はHNeRVに比べてメモリ消費が7倍減少し、デコード速度が2.5倍向上する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 01:21:25 GMT)
Analyzing Skill Element in Online Fantasy Cricket [1.6] 我々は,オンラインファンタジークリケットプラットフォームにおける成功決定におけるスキルの役割を評価するための統計的枠組みを開発する。
戦略パフォーマンスは、Megaと4x or Nothingという2つのコンテスト構造の下で、ポイント、ランク、ペイオフに基づいて評価される。
適応行動を捉えるために,エージェント集団がソフトマックス再重み付け機構を通じて進化する動的トーナメントモデルを導入する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:55:23 GMT)
ALETHEIA: Combating Social Media Influence Campaigns with Graph Neural Networks [1.5] 本稿では,悪質なアカウント(またはトロルアカウント)の検出を形式化するシステムであるALETHEIAを提案する。
我々は、さまざまな国のRedditとXのインフルエンサーキャンペーンを分析した。
ALETHEIAは、最先端のグラフニューラルネットワーク(GNN)を使用して、大規模ネットワークにスケール可能な悪意のあるユーザを検出する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 19:17:59 GMT)
Evaluating Novelty in AI-Generated Research Plans Using Multi-Workflow LLM Pipelines [1.4] 本稿では, 反復的推論, 進化的探索, 分解を用いたエージェントシステムが, より斬新で実現可能な研究計画を創出できるかどうかを考察する。
我々は、リフレクションベースの反復リフレクション、サカナAI v2進化アルゴリズム、Googleコサイディストマルチエージェントフレームワーク、GPT Deep Research、Gemini3 Proマルチモーダルロングコンテキストパイプラインの5つの理由付けアーキテクチャをベンチマークした。
その結果, 創造性を犠牲にすることなく, 高い達成性を維持しつつ, 研究領域にまたがる様々なパフォーマンスが明らかとなった。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 12:41:31 GMT)
Coherence in the brain unfolds across separable temporal regimes [1.4] 言語におけるコヒーレンスには、脳が競合する2つの時間的要求を満たす必要がある。
我々は、コヒーレンスを、文脈統合の遅い解離可能なニューラルレシエーションと、イベント駆動の迅速な再構成によって実現していることを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 12:51:11 GMT)
Sensitivity Analysis of the Consistency Assumption [1.4] 感度分析は、仮定からの離脱に対する結論の感度を評価することによって因果推論を通知する。
一貫性の仮定は、治療の隠れたバージョンはなく、自然に生じる結果が介入によって生じる結果と等しいことを述べています。
本稿では,新しい手法をサポートするために,新しい数学的表記法を導入し,その応用例を示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 17:21:12 GMT)
Flocking phase transition and threat responses in bio-inspired autonomous drone swarms [1.4] バイオインスパイアされた3Dフロッキングアルゴリズムを提案する。
キャリブレーションされた飛行力学モデルを用いたシミュレーションと組み合わされた10機のドローンによる実験では、この遷移の近くでの操作が外部の障害に対する応答性を高めることが示されている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:20:19 GMT)
Better Call Graphs: A New Dataset of Function Call Graphs for Malware Classification [1.2] 我々は,最近のAndroidアプリケーションパッケージ(APK)から抽出した,大規模かつユニークなFunction Call Graphs(FCG)の包括的なデータセットであるBetter Call Graphs(BCG)を紹介する。
BCGには、さまざまなファミリーやタイプにまたがる良性および悪意のあるサンプルと、各APK用のグラフレベルの機能が含まれている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 01:21:38 GMT)
Microtopia: Exploring the Impact of Interdisciplinary Projects on Ethnic Minority Female Pupils' Perceptions of Computer Science [1.2] マイクロトピア(Microtopia)は、少数民族の少女の間でコンピュータ科学(CS)への参加を広げるために設計された学際プログラムである。
本研究では,社会経済的・民族文化的要因が学生のCS観にどのように影響し,ミクロトピアへの参加が認知をシフトさせたかを検討する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:56:36 GMT)
Three-way decision with incomplete information based on similarity and satisfiability [1.2] 不完全情報を用いた3方向決定に対する2つのアプローチを一般化する。
計算式を定式化するために、同値関係の一般化として、オブジェクトの類似度の新しい尺度を提案する。
概念的定式化のために、完全情報による満足度を定量的に一般化する手段として、公式の満足度尺度を提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 20:52:41 GMT)
A Systematic Review of Technical Defenses Against Software-Based Cheating in Online Multiplayer Games [1.1] 本稿では,オンラインマルチプレイヤーゲームにおけるソフトウェアベースの不正行為に対する技術的防御について検討する。
既存のアプローチをサーバ側の検出、クライアント側のアンチタンパー、カーネルレベルのアンチチートドライバ、ハードウェアによるTEEに分類する。
全体的な見直しは、不正行為者による進行中の軍備競争と、頑丈で敵対的な反チートデザインの必要性を強調している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 16:00:45 GMT)
Quadrupped-Legged Robot Movement Plan Generation using Large Language Model [1.1] 本稿では,Large Language Models(LLM)を統合し,直感的で自然言語に基づくナビゲーションを実現するための新しい制御フレームワークを提案する。
本稿では,DeepRobotics Jueying Lite 3プラットフォームにおける計算制約を克服するため,高レベルの命令処理を外部サーバにオフロードする分散アーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 17:22:00 GMT)
Logic Sketch Prompting (LSP): A Deterministic and Interpretable Prompting Method [1.0] Logic Sketch Prompting (LSP)は、型付き変数、決定論的条件評価器、ルールベースのバリデータを導入した軽量なプロンプトフレームワークである。
LSPを、ゼロショットプロンプト、チェーン思考プロンプト、簡潔な3つのオープンウェイトモデルに対してベンチマークする。
これらの結果から,LSPは性能を犠牲にすることなく決定性,解釈可能性,一貫性を向上し,臨床,規制,安全決定支援システムでの使用を支援することが示唆された。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 09:20:35 GMT)
SENTINEL: A Multi-Modal Early Detection Framework for Emerging Cyber Threats using Telegram [0.9] サイバー攻撃の早期検出にソーシャルメディア信号を活用するフレームワークであるSENTINELを提案する。
我々は、サイバーセキュリティと365万のメッセージにまたがるオープンソースのインテリジェンス(OSINT)に関連する、Telegram上の16の公開チャネルのデータを使用します。
我々は、ソーシャルメディアの議論がサイバー脅威に関する活発な対話を巻き込み、SENTINELを活用して実世界の脅威に対するシグナルを0.89のF1と整合させることを強調した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:33:34 GMT)
Learning Factors in AI-Augmented Education: A Comparative Study of Middle and High School Students [0.8] 本研究では,AIを活用した学習環境において,4つの重要な学習要因,経験,明快さ,快適さ,モチベーションがコヒーレントを維持しているかを検討する。
この研究は、学生が学習活動の一環としてAIツールと対話する真正の教室環境で行われた。
相関分析とテキストマイニングを組み合わせたマルチメソッド定量的解析により,2つの年齢群間に有意な異なる次元構造が明らかになった。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:43:58 GMT)
Beyond Context: Large Language Models Failure to Grasp Users Intent [0.8] 現在のLarge Language Models (LLMs) の安全性アプローチは、重大な脆弱性を見落としながら、明らかに有害なコンテンツに焦点を当てている。
これにより、悪意のあるユーザーが安全メカニズムを回避するために体系的に活用できる悪用可能な脆弱性が生成される。
われわれは,ChatGPT,Claude,Gemini,DeepSeekなど,最先端のLLMを実証的に評価した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:15:57 GMT)
Agentic Multi-Persona Framework for Evidence-Aware Fake News Detection [0.8] AMPEND-LSは、マルチモーダルフェイクニュース検出のためのエージェント型マルチペルソナエビデンスグラウンドフレームワークである。
LLMを駆動する構造化推論パイプラインを通じて、テキスト、ビジュアル、コンテキストの信号を統合する。
実験の結果、AMPEND-LSは精度、F1スコア、ロバスト性において、一貫して最先端のベースラインを上回った。
この研究は、オンライン情報の完全性を保護するための適応的で説明可能な、エビデンス対応システムの開発を進める。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:06:52 GMT)
The Silent Scholar Problem: A Probabilistic Framework for Breaking Epistemic Asymmetry in LLM Agents [0.6] 本稿では,エージェントに双方向知識交換のための非構造的動機を与える形式的確率的枠組みを提案する。
これらの蓄積された信念状態が、人間フィードバックからの強化学習(RLHF)と監視ファインチューニング(SFT)のための高品質データフィルタの検証可能な報酬信号としてどのように機能するかを示す。
シミュレーションの結果、この不確実性駆動型戦略が異種環境におけるランダムベースラインを著しく上回ることを示した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 02:02:25 GMT)
GeoTransolver: Learning Physics on Irregular Domains Using Multi-scale Geometry Aware Physics Attention Transformer [0.6] 我々は、標準的な注意をGALEに置き換えるCAEのための幾何対応物理注意変換器GeoTransolverを提案する。
GeoTransolverは、幾何学的、大域的、境界的条件パラメータを物理的状態空間に計画し、潜在計算をドメイン構造や運用状態に固定する。
我々はGeoTransolver on DrivAerML, Luminary ShiFT-SUV, Luminary ShiFT-Wingをベンチマークし, Domino, Transolver (SilberNeMo でリリースされた) および文芸レポート AB-UPT と比較し, フィールド変数に対するドラッグ/リフトR2および相対L1誤差の評価を行った。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:28:58 GMT)
Opportunities and Challenges of Natural Language Processing for Low-Resource Senegalese Languages in Social Science Research [0.6] 本稿では,セネガル憲法で公式に認められた6つの国語(Wolof, Pulaar, Sereer, Joola, Mandingue, Soninke)の進歩と課題について概観する。
言語的・社会技術的・インフラ的要素を合成し、それらのデジタル準備性を形作り、データ、ツール、ベンチマークのギャップを識別する。
この論文は、セネガル語のための持続可能なコミュニティ中心のNLPエコシステムに向けたロードマップを概説することで締めくくっている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 20:20:31 GMT)
Morality is Contextual: Learning Interpretable Moral Contexts from Human Data with Probabilistic Clustering and Large Language Models [0.6] COMETH (Contextual Organization of Moral Evaluation from Textual Human inputs) は、確率論的文脈学習者とLLMに基づく意味論的抽象化と人間の道徳的評価を統合したフレームワークである。
我々は、6つのコアアクションにまたがる300のシナリオを経験的に基礎づけたデータセットをキュレートし、N=101の参加者から3つの判断を収集する。
前処理パイプラインは、LLMフィルタとMiniLMをK-meansで埋め込んだアクションを標準化し、堅牢で再現可能なコアアクションクラスタを生成する。
一般化モジュールは、予測を一般化し、説明するために、簡潔で非評価のバイナリコンテキスト特徴を抽出し、透明な可能性で特徴重みを学習する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 22:16:04 GMT)
Observation of the Aharonov-Bohm Effect in Pilot-Wave Hydrodynamics [0.6] 歩行液滴は、シールドされた渦を囲む環状の空洞に閉じ込められている。
渦は、液滴の運動を誘導する空間的に拡張されたパイロット波場を変化させる。
高速追尾および遅延埋め込み再構成により、ウィグナーのような位相空間分布が得られる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 16:11:53 GMT)
INSIGHT: Spatially resolved survival modelling from routine histology crosslinked with molecular profiling reveals prognostic epithelial-immune axes in stage II/III colorectal cancer [0.6] 本稿では,日常的な組織像から直接生存を予測するグラフニューラルネットワークINSIGHTを提案する。
TCGAとSURGENでトレーニングされ、クロスバリデーションされたINSIGHTは、患者レベルで空間的に解決されたリスクスコアを生成する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:36:15 GMT)
BALLAST: Bandit-Assisted Learning for Latency-Aware Stable Timeouts in Raft [0.5] 本稿では,静的なタイムアウトを文脈的包帯に置き換える軽量なオンライン適応機構であるBALLASTを提案する。
本研究では, 長期遅延, 損失, 相関バースト, ノード乱流, パーティショニング/リカバリ乱流を再現可能な離散イベントシミュレーションで評価した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 13:25:36 GMT)
Thermodynamic sampling of materials using neutral-atom quantum computers [0.5] 我々は中性原子量子ハードウェアを用いて材料の熱力学特性を抽出する枠組みを開発し,検証する。
試験例として,窒素ドープグラフェンについて考察する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 12:24:30 GMT)
Classical reservoir approach for efficient molecular ground state preparation [0.5] 基底状態の準備は電子構造に対する量子アルゴリズムの中枢的な応用である。
本稿では,短期ハードウェアに適した低コストな変量アンザッツである古典型貯水池のアプローチを紹介する。
我々のアンザッツは局所化された分子軌道で活動し、以前は探索されなかった変分パラメータ空間の領域を研究する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 09:26:01 GMT)
Invariant Feature Extraction Through Conditional Independence and the Optimal Transport Barycenter Problem: the Gaussian case [0.5] メソッドは$d$不変の$W=f(X)$を抽出するために開発され、変数$Z$によって構築されることなく応答変数$Y$を予測する。
主な要素は、$W$と$Z$の間の統計的依存を、$Y$で条件付きで罰することである。
この手順はより一般的な非ガウス/非線型ケースにほとんど変化しない。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 03:39:18 GMT)
Hierarchical Modeling Approach to Fast and Accurate Table Recognition [0.5] テーブル認識は典型的には3つのサブタスク、すなわちテーブル構造、セル位置、セル内容認識から構成される。
近年のモデルでは,マルチタスク学習,ローカルアテンション,相互学習の組み合わせにより,優れた認識が得られている。
本稿では,非因果的注意を利用してテーブル構造全体をキャプチャする新しいマルチタスクモデルと,より高速なセルコンテンツ推論のための並列推論アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 09:58:30 GMT)
Causal-driven attribution (CDA): Estimating channel influence without user-level data [0.5] 本稿では,集約された印象レベルデータのみを用いて,チャネルの影響を推測する因果型属性フレームワークを提案する。
このフレームワークは,真の因果グラフが与えられたときの平均相対RMSEが9.50%,予測グラフが24.23%となることを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:51:12 GMT)
VLegal-Bench: Cognitively Grounded Benchmark for Vietnamese Legal Reasoning of Large Language Models [0.4] ベトナムの法定ベンチマーク(ベトナム語:VLegal-Bench)は、ベトナムの法務上の大きな言語モデル(LLM)を評価するために設計された最初のベンチマークである。
ベンチマークは厳密なアノテーションパイプラインを通じて生成された10,450のサンプルで構成されている。
VLegal-Benchは、標準化された透明で認知的な評価フレームワークを提供することにより、ベトナムの法的文脈におけるLLMのパフォーマンスを評価するための確かな基盤を確立している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 02:46:01 GMT)
SMART SLM: Structured Memory and Reasoning Transformer, A Small Language Model for Accurate Document Assistance [0.3] SMART(Structured Memory and Reasoning Transformer)はその処理を階層的アプローチを用いて構成する。
全SMARTモデルは45.51Mパラメータを使用し、GPT-2 (124M) より64%、BERT (133M) より69%少ない。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 16:59:04 GMT)
ReACT-Drug: Reaction-Template Guided Reinforcement Learning for de novo Drug Design [0.3] 本稿では、強化学習に基づく完全に統合されたターゲットに依存しない分子設計フレームワークであるbfReACT-Drugを紹介する。
このアーキテクチャは、構造生物学、深層表現学習、化学規則を統合し、合理的な薬物設計を自動化し加速する可能性を強調している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 05:29:35 GMT)
FinAgent: An Agentic AI Framework Integrating Personal Finance and Nutrition Planning [0.2] 本稿では,個人財務管理とダイエット最適化を組み合わせた価格認識型エージェントAIシステムを提案する。
このシステムは栄養的に十分な食事プランを比較的合理的な価格で作成し、市場の変化に合わせて自動的に調整する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:33:17 GMT)
Introducing Axlerod: An LLM-based Chatbot for Assisting Independent Insurance Agents [0.2] 保険業界は人工知能(AI)技術の導入を通じてパラダイムシフトを行っている。
本稿では,独立保険業者の業務効率向上を目的としたAIを活用した対話インタフェースであるAxlerodの設計,実装,実証評価について述べる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:31:59 GMT)
Cardiac mortality prediction in patients undergoing PCI based on real and synthetic data [0.1] 本研究の目的は,PCIを施行した患者のリアルおよび合成データに基づいて,心死のリスクを評価するための予測モデルを開発することである。
PCI後の3年間の死亡を予測するために、いくつかの機械学習モデルが適用された。
以上の結果から,非バランスな臨床予測において,現実的および極端な症例に対する直接的な拡張は,脆さを露呈し,定量化し,減少させる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 10:12:08 GMT)
Thermodynamic Characterizations of Singular Bayesian Models: Specific Heat, Susceptibility, and Entropy Flow in Posterior Geometry [0.1] 特異な揺らぎは、精密で自然な解釈を固有熱として認めることを示す。
また, エントロピーフロー, 先行感受性, クロスサセプティビリティなど, 関連する熱力学量の収集についても紹介する。
この結果は特異学習理論と統計力学の具体的な橋渡しとなる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 20:19:28 GMT)
Black hole as a multipartite entangler: multi-entropy in AdS${}_3$/CFT${}_2$ [0.1] 通常の純粋なBTZブラックホールとホログラフィック的に双対な多重粒子の絡み合いについて検討した。
その結果, 真空AdS$_3$に対して, 真の三部構造をもつ多エントロピーは, 急激なスケールを示すことがわかった。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:03:55 GMT)
A Multi-fidelity Double-Delta Wing Dataset and Empirical Scaling Laws for GNN-based Aerodynamic Field Surrogate [0.1] 本研究では,グラフニューラルネットワークを用いた代理モデルにおけるトレーニングデータサイズと予測精度の関係について検討した。
我々は、二重デルタ翼のためのオープンソースの多要素空力データセットをリリースする。
テストエラーは、データサイズに応じて−0.6122のパワーロー指数で減少し、効率的なデータ利用を示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:53:11 GMT)
Industrial Ouroboros: Deep Lateral Movement via Living Off the Plant [0.1] 本報告では, 被害環境のネイティブ機能にのみ依存する初めてのPLC中心側方移動技術について述べる。
この技術は、デュアルホームのPLCを通じて、IPネットワークからレガシシリアルネットワークへの脱出を容易にする。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:45:49 GMT)
Blurb-Refined Inference from Crowdsourced Book Reviews using Hierarchical Genre Mining with Dual-Path Graph Convolutions [0.1] HiGeMineは階層的なジャンルのマイニングフレームワークで、ユーザレビューと権威ある書籍の曖昧さをしっかりと統合している。
第1フェーズでは、HiGeMineはゼロショットセマンティックアライメント戦略を使用してレビューをフィルタリングし、対応するぼかしとセマンティックに一貫性のあるもののみを保持する。
第2フェーズでは、デュアルパス、2レベルグラフベースの分類アーキテクチャを導入する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 09:49:56 GMT)
A Graph-Augmented knowledge Distillation based Dual-Stream Vision Transformer with Region-Aware Attention for Gastrointestinal Disease Classification with Explainable AI [0.1] 本研究は,教師-学生の知識蒸留に基づくハイブリッド二流深層学習フレームワークを提案する。
教師のセマンティックな知識と形態的知識を継承するコンパクトなTiny-ViT構造として学生ネットワークが実装された。
主要なGI疾患クラスを含む2つの注意深くキュレートされたWireless Capsule Endoscopyデータセットを使用して、バランスの取れた表現を保証した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:51:54 GMT)
Optical spin tomography in a telecom C-band quantum dot [0.0] テレコム波長で放射される量子ドットは、有望なスピン光子プラットフォームを示す。
我々は, 液滴エピタキシーQDの電子および孔g因子とコヒーレンス特性をベンチマークした。
次に,固定孔基底状態のフルステートトモグラフィーを行い,スピン前兆における微妙な異方性を明らかにする。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 01:11:34 GMT)
Algebraic Fusion in a (2+1)-dimensional Lattice Model with Generalized Symmetries [0.0] 非可逆な一般化対称性を持つ高次元格子系における位相欠陥の融合規則を導出する枠組みを開発する。
物理的ヒルベルト空間上の部分等距離として作用することを明確に検証し、非可逆対称性に適用可能なウィグナーの定理の最近の一般化を満たす。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 22:01:15 GMT)
zkFL-Health: Blockchain-Enabled Zero-Knowledge Federated Learning for Medical AI Privacy [0.0] zkFL-Healthは、フェデレートラーニング(FL)とゼロ知識証明(ZKP)と信頼実行環境(TEE)を組み合わせたアーキテクチャである。
クライアントはローカルにトレーニングし、アップデートをコミットする。アグリゲータはTEE内でグローバルアップデートを計算し、クライアントのアップデートをホストに公開することなく、コミットした入力と正しいアグリゲーションルールを正確に使用したという簡潔なZK証明を生成する。
医療に適したシステムと脅威モデル、zkFL-Healthプロトコル、セキュリティ/プライバシ保証、正確性、プライバシリスク、レイテンシ、コストにまたがるパフォーマンス評価計画について概説する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:29:28 GMT)
Wireless Center of Pressure Feedback System for Humanoid Robot Balance Control using ESP32-C3 [0.0] 本研究では,不均一表面の安定性を維持するための無線組込みバランスシステムを提案する。
提案した制御システムは,単脚昇降作業におけるバランス維持において100%の成功率を達成した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:00:23 GMT)
When F1 Fails: Granularity-Aware Evaluation for Dialogue Topic Segmentation [0.0] 本稿では,ウィンドウ耐性F1(W-F1)とともに境界密度とセグメントアライメント診断(純度とカバレッジ)を報告する評価フレームワークを提案する。
境界選択から境界スコアを分離することにより, 1つの操作点ではなく, 密度レジーム間のセグメンテーション品質を評価する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:05:57 GMT)
What Makes a GitHub Issue Ready for Copilot? [0.0] 私たちは、GitHubの問題の品質を測定するために、32の詳細な基準を構築して、AIエージェントに適合させています。
私たちは、GitHubの問題が合体したプルリクエストをもたらす可能性を予測するために、解釈可能な機械学習モデルを構築します。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 21:16:02 GMT)
Universality of equilibration dynamics after quantum quenches [0.0] 我々は、適切なスケーリングの制限において、絡み合いスペクトルの下部が普遍性を示すことを示す」。
我々は, 逆場イジング鎖やXX鎖などの自由フェルミオン鎖, 規則54鎖, ベーテアンサッツ可解スピンモデルで解析結果をベンチマークした。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:19:57 GMT)
Uncertainty in security: managing cyber senescence [0.0] 私の主な懸念は、サイバーセキュリティのエコシステムはゆっくりとだが確実に老朽化し、老朽化が運用上のリスクになりつつあることです。
私の心配は、廃棄物がサイバー空間に蓄積されているということです。この廃棄物は、リスクの低減が不確実な、重複するコントロールが多数含まれています。
制御フレームワークを切断しない限り、このムダの蓄積はサイバースペースの老朽化を引き起こし、最終的にはシステム崩壊につながる可能性がある。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:56:12 GMT)
Transcriptome-Conditioned Personalized De Novo Drug Generation for AML Using Metaheuristic Assembly and Target-Driven Filtering [0.0] 急性骨髄性白血病(AML)は、その極端な分子多様性と高い再発率のために、臨床上の課題である。
本稿では,患者固有の転写学とde novo薬物発見のギャップを埋める,新しいエンドツーエンドの計算フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 17:39:37 GMT)
Towards a General Framework for Predicting and Explaining the Hardness of Graph-based Combinatorial Optimization Problems using Machine Learning and Association Rule Mining [0.0] GCO-HPIFは、グラフ上で表現できる最適化問題の計算困難性を予測し、説明するための機械学習ベースのフレームワークである。
これは、COLLAB、IMDB、TWITTERグラフデータセットからコンパイルされた3287の最大傾き問題のデータセットに適用された。
このフレームワークは、重み付きF1スコアが0.9921、マイノリティークラスF1スコアが0.878、ROC-AUCスコアが0.9083、インスタンスの硬さを予測するのに優れた性能を示した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 03:43:54 GMT)
Toward Human-Centered AI-Assisted Terminology Work [0.0] 本稿では,人工知能に対する人間中心のアプローチが,用語学の作業に欠かせないものとなっていることを論じる。
このフレームワークは、拡張用語学者、倫理的AI、人間中心のデザインの3つの分野で構成されている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:41:46 GMT)
The Physics Constraint Paradox: When Removing Explicit Constraints Improves Physics-Informed Data for Machine Learning [0.0] 5つの幾何学パラメータを100点のスペクトル応答にマッピングする物理インフォームドグレーティングカプラスペクトル生成器を提案する。
エネルギー保護法,ファブリ・ペロ振動,帯域変動,雑音を選択的に除去することにより,物理制約パラドックスを明らかにする。
これらの知見は、物理インフォームドデータセット設計のための実用的なガイダンスを提供し、制約関連性を評価するための診断ツールとして機械学習の性能を強調している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:34:52 GMT)
The Environmental Impact of AI Servers and Sustainable Solutions [0.0] 本研究では,AIサーバ運用の環境フットプリントを評価する。
予想では、2024年のデータセンターの電力需要は、2030年までに約415 TWhから945 TWhに増加する可能性がある。
米国だけでも、2030年までにAIサーバーは年間200~300億ガロンの水を消費し、24~4400万トン分の二酸化炭素を排出すると予想されている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 01:09:06 GMT)
The Affine Divergence: Aligning Activation Updates Beyond Normalisation [0.0] 勾配降下時の数学的理想と効果的なアクティベーション更新の間には、体系的なミスマッチが存在する。
正規化はパラメータ化スケーリングによるアクティベーション関数のような写像の方が優れており、最適化時の表現の優先順位付けを支援することが主張されている。
これは、経験的に検証されたいくつかの新しい関数を導き、モデル生成に対するアフィン+非線形アプローチに関する疑問を提起する理論原理的なアプローチを構成する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 00:31:22 GMT)
Squeezed quantum multiplets: properties and phase space representation [0.0] 我々は「圧縮された量子多重項」の性質を定義し、研究する。
通常の (p=2$) 倍数と高次 (p>2$) の状態を最も関係のある場合と比較する。
いくつかの圧縮多重項はすべての位相空間方向の摂動に非常に敏感であり、気象学的な応用に興味深い。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:09:12 GMT)
Security Risks Introduced by Weak Authentication in Smart Home IoT Systems [0.0] 認証状態は、通常の運用中および通常のネットワーク条件下で確立、再利用、検証される。
その結果、認証状態はコントロールアクション全体で一貫して再利用され、明示的な有効期限なしで長期間持続し、再接続などのネットワークイベント後も有効であることがわかった。
リプレイ実験では、以前に観測された認証アーティファクトを再利用して、同じローカルネットワーク上の他のホストからの制御コマンドを高い成功率で発行できることが示されている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:07:22 GMT)
Scaling Laws for Economic Productivity: Experimental Evidence in LLM-Assisted Consulting, Data Analyst, and Management Tasks [0.0] AIモデルの進歩は毎年、タスクタイムを8%削減しています。
非エージェント分析では生産性が有意に向上した。
これらの結果は、継続したモデルスケーリングが今後10年間で米国の生産性を約20%向上させることを示唆している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:24:29 GMT)
Random dilation superchannel [0.0] 本稿では,ランダム・ディレーション・スーパーチャネルを実装した量子回路を提案する。
未知の量子チャネルの効率的な保存・検索方法を示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 16:09:38 GMT)
Quantum-classical algorithm for Ewald summation based computation of long-range electrostatics [0.0] 点電荷系のクーロン静電エネルギー計算のための量子アルゴリズムを提案する。
このアルゴリズムは量子コンピュータ上で全原子分子動力学シミュレーションを実行する際に実装できる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 02:06:04 GMT)
Quantum computation of mass gap in an asymptotically free theory [0.0] 相対論的場の理論では、質量スペクトルは真空のエネルギーと励起状態の差によって与えられる。
本稿では,量子コンピュータを用いて直接質量ギャップを抽出する手法を提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 17:04:21 GMT)
Quantum Origin of Classical Background Fields from Coherent States: A First-Principles Formulation in QED [0.0] 量子電磁力学における古典的背景場の量子起源を明らかにする第一原理の定式化について述べる。
本研究では,コヒーレント状態間の散乱振幅が,背景場の観点から効果的に説明できることを示す。
さらに,所定バックグラウンドフィールドを持つ従来の生成関数が,制限ケースとしてどのように現れるかを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:49:53 GMT)
Quantum Homotopy Algorithm for Solving Nonlinear PDEs and Flow Problems [0.0] 非線形PDEを制御フロー問題に統合する量子アルゴリズムは、発見が難しいが、量子コンピューティングの実用性を高めるために重要である。
ここでは、時間依存、散逸、非線形PDEを解くために、ほぼ最適、堅牢、エンドツーエンドの量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:56:34 GMT)
Quantum Approximate Optimization Algorithm with Fixed Number of Parameters [0.0] 我々は新しい量子最適化パラダイム、FPC-QAOA(Fixed-Count Approximate Quantum Optimization Algorithm)を導入する。
スケーラブルな変分フレームワークであり、量子ビットの数、ハミルトン複雑性、回路深さに関わらず、一定の数のトレーニング可能なパラメータを保持する。
我々は、ランダムなMaxCutインスタンスとTail Assignment ProblemのFPC-QAOAをベンチマークし、標準的なQAOAに匹敵する性能を達成する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:02:31 GMT)
Psychometric Validation of the Sophotechnic Mediation Scale and a New Understanding of the Development of GenAI Mastery: Lessons from 3,932 Adult Brazilian Workers [0.0] 本研究は、GenAIとの長時間の相互作用に関連する思考と行動の様式である、ソフォテクニック・メディエーションを考察する。
2023年から2025年の間に、ブラジルのペルナンブコで3,932人の成人労働者が、独立した横断的なサンプルから収集された。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 02:04:42 GMT)
Preventing AI Deepfake Abuse: An Islamic Ethics Framework [0.0] 本研究は、ディープフェイク技術の誤用を軽減するための予防的アプローチとして、包括的なイスラム倫理的枠組みを定式化することを目的とする。
この分析は、Maqasid al-Shariahの原則を統合することが、デジタル技術の責任を負う使用を管理するための強力な規範的基盤を提供することを示している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:44:00 GMT)
Post-Processing Mask-Based Table Segmentation for Structural Coordinate Extraction [0.0] 本稿では,テーブルマスクからテーブルエッジを検出するためのマルチスケール信号処理手法を提案する。
ロウとカラムの遷移は1次元信号としてモデル化され、ガウスの畳み込みを用いて処理される。
この方法は、ゼロパディングとスケーリング戦略による解像度の変動に対して堅牢である。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 17:10:37 GMT)
Photoexcitation of moiré-trapped interlayer excitons via chiral phonons [0.0] 2H-stacked MoSeにおける個別モアレトラッピング層間励起子のフォノンによる新しい励起機構を報告した。
我々は, TMDモアレ系における量子エミッタの励起制御ツールとして, キラルフォノンの有用性を強調した。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 11:56:12 GMT)
Optimizing Quantum State Transformation Under Locality Constraint [0.0] 我々は、初期状態を高い忠実度で目標状態に変換する最適化された局所量子チャネルを構築する。
本手法は弱い絡み合い状態に対する絡み合い蒸留を著しく促進することを示した。
これらの結果は、幅広い量子情報処理タスクのための強力で汎用的なツールとして、我々の手法を確立している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:11:47 GMT)
Multi-Agent Formation Navigation Using Diffusion-Based Trajectory Generation [0.0] 本稿では, 散在環境におけるリーダ・フォロワ生成制御のための拡散型プランナを提案する。
提案手法はスムーズな動きと低追尾誤差を生じ、ほとんどの障害は狭い障害物のない空間で発生している。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:36:28 GMT)
ML Inference Scheduling with Predictable Latency [0.0] 既存の干渉予測手法の潜在的な限界を評価する。
粗粒度法は予測精度に顕著なずれを生じさせ,静的モデルがワークロード変更時に著しく劣化することを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:31:46 GMT)
Leveraging Lightweight Entity Extraction for Scalable Event-Based Image Retrieval [0.0] 実世界の画像テキスト検索は、あいまいなクエリや文脈に依存したクエリ、言語的可変性、スケーラブルなソリューションの必要性のために困難である。
本稿では、イベント中心のエンティティ抽出を利用して、実世界のキャプションから時間的・文脈的な信号を取り込む軽量な2段階検索パイプラインを提案する。
提案手法は平均0.559の精度を達成し,従来のベースラインよりも大幅に優れていた。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 15:02:33 GMT)
Learning to Reconfigure: Using Device Status to Select the Right Constrained Coding Scheme [0.0] 本稿では,新しい2次元磁気記録(TDMR)技術のための制約付き符号化方式に着目する。
デバイスの状態に基づいて,このタスクを実行するためのオフラインおよびオンライン学習手法を提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 19:26:55 GMT)
LLM_annotate: A Python package for annotating and analyzing fiction characters [0.0] LLM_annotateは、フィクションキャラクターの性格を分析するためのPythonパッケージである。
フルテキストで文字の振る舞いをアノテートするための計算を標準化する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 12:45:02 GMT)
LLM Personas as a Substitute for Field Experiments in Method Benchmarking [0.0] 我々は,人間をペルソナに置き換えることで,適応手法が最適化するベンチマークインターフェースを保っていることを示す。
また、フィールド実験としてペルソナベンチマークを意思決定に関連付けることは、基本的にはサンプルサイズの問題であることを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 09:56:00 GMT)
Interaction-Resilient Scalable Fluxonium Architecture with All-Microwave Gates [0.0] 高速な$sim63$ns制御Z(CZ)ゲートを持つフラキソニウム系正方形グリッドの設計を提案し,そのコヒーレントな誤差を10~4$以下とする。
全マイクロ波ゲートを持つ大規模システムにおける中心的な困難は、近隣に広がる寄生的相互作用を抑えることである。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:15:41 GMT)
Holonomic multi-controlled gates for single-photon states [0.0] フォトニック導波路ネットワークにおける非アベリアホロノミーに基づく制御および多制御量子ゲートの実現手法を提案する。
単一の中心サイト(M-pod)に結合したM周囲の導波路を持つ恒星ネットワークは、非アベリアのThoulessポンプで使用される三脚構造を自然に一般化する。
より大規模なM-pod構造へのアプローチが、乗算制御操作の実現にどのように役立つかを示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 10:54:23 GMT)
Hamilton-Jacobi as model reduction, extension to Newtonian particle mechanics, and a wave mechanical curiosity [0.0] この観点は、ハミルトン・ヤコビ方程式を保守的な系から非保守的な力を含む一般ニュートン粒子系へと関連付けることを可能にする。
幾何光学近似は散逸的なシュルディンガー方程式をもたらし、関連する古典的な力体系が保守的な力を含むとき、期待される制限形式を持つ。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 17:02:26 GMT)
Guardrailed Elasticity Pricing: A Churn-Aware Forecasting Playbook for Subscription Strategy [0.0] 本稿では,サブスクリプション価格を動的に保護された意思決定システムとして運用するマーケティング分析フレームワークを提案する。
季節ごとの時系列モデルをツリーベースの学習者とブレンドし、モンテカルロシナリオテストを実行してリスクエンベロープをマップし、制約付き最適化を解決する。
このフレームワークは,フラットな価格からダイナミックな価格への移行時期,CLVやMRRターゲットとの価格調整方法,倫理的ガードレールの組み込み方法など,戦略プレイブックとして機能する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:25:31 GMT)
Governing Cloud Data Pipelines with Agentic AI [0.0] Agentic Cloud Data Engineeringは、バウンドAIエージェントをクラウドデータパイプラインのガバナンスとコントロールプレーンに統合する、ポリシー対応のコントロールアーキテクチャである。
Agentic Cloud Data Engineeringプラットフォームは、平均パイプラインリカバリ時間を最大45%削減し、運用コストを約25%削減し、静的オーケストレーションと比較して手動の介入イベントを70%以上削減する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 19:30:32 GMT)
Geometry and quantum brachistochrone analysis of multiple entangled spin-1/2 particles under all-range Ising interaction [0.0] 我々は、全範囲イジング相互作用を持つ$n$ spin-$1/2$粒子からなる物理系に対する統一的幾何学的および動的枠組みを提案する。
解析により, この系は球面位相を持つ滑らかでコンパクトな2次元多様体上で進化することが明らかとなった。
本研究では, 状態空間の形状形成, 幾何位相の変調, 進化速度とブラキストロン時間制御における絡み合いの役割について検討する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 19:37:07 GMT)
From Values to Frameworks: A Qualitative Study of Ethical Reasoning in Agentic AI Practitioners [0.0] エージェント人工知能システムは、人間の監督を最小限に抑えて複雑な目標を追求できる自律技術である。
これらのシステムは生産性の大きな向上を約束する一方で、新たな倫理的課題も提起する。
本稿では,エージェントAI展開における構造化ジレンマを中心とした質的なインタビューを通じて,AI実践者の倫理的理由について考察する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 00:58:41 GMT)
Evaluating an Adaptive Multispectral Turret System for Autonomous Tracking Across Variable Illumination Conditions [0.0] 従来の赤緑色(RGB)検出パイプラインは、低照度環境で苦労している。
RGBと長波長赤外線(LWIR)ビデオストリームを複数の融合比で融合する適応フレームワークを提案する。
私たちは、3つの光レベルにまたがる22,000以上の注釈付きイメージで、33のYou Only Look Once (YOLO)モデルをトレーニングしました。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 17:11:37 GMT)
Enhancing diffusion models with Gaussianization preprocessing [0.0] 拡散モデル(英: Diffusion model)は、画像生成などのタスクにおいて顕著な成功を収めた生成モデルのクラスである。
これらのモデルのボトルネックの1つは、軌道分岐開始前の遅延によるサンプリングが遅いことである。
我々の主な目的は、トレーニングデータを前処理して再建品質を向上させることにより、分岐関連問題を緩和することである。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 07:34:20 GMT)
Dyna-Style Reinforcement Learning Modeling and Control of Non-linear Dynamics [0.0] SINDy(Sparse Identification of Dynamics)とTD3(Twin Delayed Deep Deterministic Policy Gradient)を統合したDyna-Style Reinforcement Learning Controlフレームワークを提案する。
SINDyはシステムのデータ駆動モデルを特定し、明示的な物理モデルを必要とせずにキーダイナミクスをキャプチャする。
本フレームワークの有効性を実証するため,両回転子システムに適用し,安定化と軌道追尾性能の評価を行った。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 09:56:28 GMT)
Device-Independent Anonymous Communication in Quantum Networks [0.0] 匿名性(Anonymity)は、ネットワーク上のメッセージ送信中に送信者と受信者の同一性を隠蔽する基本的な暗号プリミティブである。
我々は、デバイスに依存しないセキュリティ証明を備えた、匿名通信のための最初の完全量子プロトコルを現実的な量子ネットワークで導入する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 08:28:37 GMT)
Controlling photothermal forces and backaction in nano-optomechanical resonators through strain engineering [0.0] ナノスケール構造設計により光熱力のサインと大きさを設計できることを示す。
ナノスケールの幾何学的変化に対応する単一の設計パラメータは、光熱バックアクションの大きさを制御する。
これらの知見は、ナノオプトメカニカルシステムにおける光熱と放射圧の複合化を可能にする。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:21:23 GMT)
Code2Doc: A Quality-First Curated Dataset for Code Documentation [0.0] 機能レベルのコードドキュメンテーション生成のための品質第一のキュレートデータセットであるCode2Docを紹介します。
Code2Docは、オープンソースリポジトリから抽出された13,358の高品質な関数ドキュメントペアで構成されている。
52,069人の候補者から始めて、全ての品質制約を満たすのは25.6%である。
全体として、86.9%のサンプルには明示的な型アノテーションが含まれており、潜在的なAI生成としてフラグ付けされているのはわずか2.9%である。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:47:27 GMT)
Clever Hans in Chemistry: Chemist Style Signals Confound Activity Prediction on Public Benchmarks [0.0] 我々は分子指紋から著者を予測するために1,815クラスの分類器を訓練し、足場ベースの分割で60%のトップ5の精度を達成した。
次に、分子記述子に直接アクセスすることなく、構造から導出されるタンパク質識別子と著者確率ベクトルのみを受信するアクティビティモデルを訓練する。
これは「クリーバー・ハンス」の失敗モードを達成している:モデルは、化学の研究室に依存しない理解を必要とせずに、主に化学者の目標とお気に入りの目標を推測することで、生物活性を予測することができる。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 04:04:20 GMT)
Characterizing quantum synchronization in the van der Pol oscillator via tomogram and photon correlation [0.0] ホモダイントモグラフィーに根ざした非古典領域定量器を用いて、vdPo状態の非古典的性質を評価する。
系の定常密度行列と対応する断層図に対する解析式を導出する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 16:40:16 GMT)
Bose polarons as relativistic Unruh-DeWitt detectors: Entanglement harvesting from Bose-Einstein condensates [0.0] ボース・アインシュタイン凝縮体における有界不純物を直接、相対論的量子場と相互作用するウンルー・デウィット検出器にマッピングできることを示す。
有限時間Feshbachチューニングにより,39textK$不純物と87textRb$凝縮物とを結合した実装に対して,明示的な実験パラメータを提供する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 19:00:00 GMT)
Autonomous Uncertainty Quantification for Computational Point-of-care Sensors [0.0] ポイント・オブ・ケア(POC)センサーは、緊急時、遠隔時、リソース制限のある領域において、迅速で低コストでアクセス可能な診断を可能にする。
これらのシステムは、ニューラルネットワークベースのアルゴリズムを使用して、迅速な診断テストやセンサーによって生成された信号から診断を正確に推測することができる。
しかし、ニューラルネットワークに基づく診断モデルは幻覚を受けており、誤った予測を生じさせ、誤診のリスクと不正確な臨床診断を生じさせる可能性がある。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 18:59:47 GMT)
Automatic Replication of LLM Mistakes in Medical Conversations [0.0] MedMistakeは、LCMが患者と医師の会話で犯した誤りを抽出し、それらを単発QAペアのベンチマークに変換する自動パイプラインである。
私たちは、3,390枚のシングルショットQAペアからなるデータセットであるMedMistake-Allをリリースした。
GPTモデルであるClaudeとGrokは、MedMistake-Benchで最高のパフォーマンスを得た。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:17:21 GMT)
Asymptotic Momentum of Dirac Particles in One Space Dimension [0.0] 自由ディラック方程式に従って進行するスピンハーフ波動関数によって運動が導かれる1つの空間次元における大粒子の軌跡を解析する。
運動量$k$の軌道とエネルギー$E$または$-E$の軌道が平面波に対応していることを証明する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 21:08:25 GMT)
Architectural Trade-offs in Small Language Models Under Compute Constraints [0.0] 本稿では,厳密な計算制約下での小型言語モデルの体系的研究を行う。
我々は,Tny Shakespeare の文字レベルモデリングと Penn Treebank (PTB) とWikiText-2 の単語レベルモデリングについて検討した。
この結果から,注目モデルがFLOP毎の効率を小型でも上回る一方で,深度や文脈の増大が性能を低下させる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 01:36:50 GMT)
Analytic and Variational Stability of Deep Learning Systems [0.0] 安定性シグネチャの均一な有界性は、学習の流れに沿って散逸するリャプノフ型エネルギーの存在と等価であることを示す。
スムーズな状況下では、このフレームワークは、スペクトルノルム、アクティベーション規則性、ステップサイズ、学習速度を学習力学の収縮率にリンクする明確な安定性指数を得る。
この理論は、ReLUネットワーク、近近と近近の更新、下位のフローを含む非滑らかな学習システムにまで拡張されている。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:43:59 GMT)
A Note on Publicly Verifiable Quantum Money with Low Quantum Computational Resources [0.0] 本稿では,量子計算能力の欠如を前提とした量子マネープロトコルを提案する。
量子共役符号とハードウェアベースの仮定から構築できるワンタイムメモリに依存しています。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 17:48:03 GMT)
A Blockchain-Monitored Agentic AI Architecture for Trusted Perception-Reasoning-Action Pipelines [0.0] 自律的な意思決定におけるエージェントAIシステムの応用は、医療、スマートシティ、デジタル法医学、サプライチェーン管理の領域で増加している。
本稿では,ラングチェインをベースとしたマルチエージェントシステムと,一定の監視,ポリシー施行,エージェントアクションの不変監査性を保証するために,ブロックチェーンを許可した単一アーキテクチャモデルを提案する。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 06:20:28 GMT)
3D cavity-based graphene superconducting quantum circuits in two-qubit architectures [0.0] グラフェン系超伝導量子回路のシリーズを構築し,それを3次元キャビティに統合する。
本研究は, 2次元材料ベース超伝導回路と3次元周波数との柔軟な結合性を示す。
論文参考訳(メタデータ) (Wed, 24 Dec 2025 14:56:10 GMT)