SegSplat: Feed-forward Gaussian Splatting and Open-Set Semantic Segmentation [114.6] SegSplatは、高速でフィードフォワードな3D再構成とリッチでオープンなセマンティック理解のギャップを埋めるために設計された、新しいフレームワークである。
この研究は、意味的に認識された3D環境の実践的でオンザフライな生成に向けた重要なステップである。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 10:26:38 GMT)
NAF: Zero-Shot Feature Upsampling via Neighborhood Attention Filtering [80.6] 隣り合う注意フィルタリング(NAF)は、クロススケールな隣り合う注意と回転位置埋め込み(RoPE)を通して、適応的な空間・コンテンツ重みを学習する
NAFはゼロショットを運用しており、再訓練せずにヴィジョン・ファンデーション・モデル(VFM)の機能をアップサンプルしている。
高効率を維持し、2Kのフィーチャーマップにスケーリングし、18 FPSで中間解像度マップを再構築する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 13:43:52 GMT)
When Alignment Fails: Multimodal Adversarial Attacks on Vision-Language-Action Models [75.2] 我々は,White-box設定とBlack-box設定の両方の下で,組込みVLAモデルのマルチモーダル対向ロバスト性に関する総合的研究であるVLA-Foolを紹介する。
自動生成および意味的に誘導されるプロンプトフレームワークを最初に開発する。
LIBEROベンチマークの実験では、小さなマルチモーダル摂動でさえ大きな行動偏差を引き起こすことが示されている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:21:40 GMT)
A Tri-Modal Dataset and a Baseline System for Tracking Unmanned Aerial Vehicles [74.8] MM-UAVはMulti-Modal UAV Trackingの最初の大規模ベンチマークである。
データセットは30以上の挑戦的なシナリオにまたがっており、1,321の同期マルチモーダルシーケンスと280万以上の注釈付きフレームがある。
データセットを伴って、我々は新しいマルチモーダルマルチUAV追跡フレームワークを提供する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 08:42:17 GMT)
A joint optimization approach to identifying sparse dynamics using least squares kernel collocation [70.1] 本研究では,通常の微分方程式(ODE)の学習システムを,状態の不足,部分的,ノイズの多い観測から学習するためのオール・アット・オンス・モデリング・フレームワークを開発する。
提案手法は,関数ライブラリ上でのODEのスパースリカバリ戦略とカーネルヒルベルト空間(RKHS)理論による状態推定とODEの離散化の手法を組み合わせたものである。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:04:15 GMT)
Sequence-Adaptive Video Prediction in Continuous Streams using Diffusion Noise Optimization [63.4] 本稿では,事前学習した拡散モデルをビデオストリームに継続的に適応させる手法を提案する。
拡散雑音最適化(SAVi-DNO)を用いた逐次適応映像予測手法について
実験により,Ego4DとOpenDV-YouTubeの長いビデオ上でのFVD,SSIM,PSNR測定値に基づく性能向上が実証された。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 02:58:10 GMT)
Multimodal Continual Learning with MLLMs from Multi-scenario Perspectives [61.6] 視覚理解における連続学習は,多モーダル大言語モデル(MLLM)における破滅的忘れに対処することを目的としている
我々は、4つの異なるシナリオと視点を含むマルチモーダル視覚理解データセット(MSVQA)を構築した。
MLLMを用いたmUltimodal coNtInual Learningを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:47:49 GMT)
OmniStruct: Universal Text-to-Structure Generation across Diverse Schemas [57.5] OmniStructは、テキストから構造までのタスクにおいて、大規模言語モデルの能力を評価するためのベンチマークである。
我々は,効率的なテキスト・ツー・ストラクチャ・モデルの開発を容易にするために,合成タスク生成による高品質なトレーニングデータを収集する。
本実験は, 合成データのより小さなモデルから, 普遍構造生成モデルへの微調整の可能性を示すものである。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 08:18:12 GMT)
TRIDENT: A Trimodal Cascade Generative Framework for Drug and RNA-Conditioned Cellular Morphology Synthesis [56.9] TRIDENTは、摂動と対応する遺伝子発現プロファイルの両方を条件にすることで、現実的な細胞形態を合成するカスケード生成フレームワークである。
TRIDENTは最先端のアプローチよりも優れており、目に見えない化合物への強い一般化で最大7倍の改善を実現している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 04:43:27 GMT)
ConsistCompose: Unified Multimodal Layout Control for Image Composition [56.9] レイアウト座標を直接言語プロンプトに埋め込む統合フレームワークであるConsistComposeを提案する。
本研究では,ConsistComposeがレイアウト制御ベースラインよりも空間精度を大幅に向上することを示す。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 08:14:53 GMT)
TRANSPORTER: Transferring Visual Semantics from VLM Manifolds [56.7] 本稿では,ビデオ生成のためのモデルに依存しないアプローチであるTransportERとともに,ロジット・トゥ・ビデオ(L2V)タスクを提案する。
TransporterはVLMの高セマンティック埋め込み空間への最適輸送結合を学習する。
代わりに、ロジットスコアは条件付きビデオ生成のための埋め込み方向を定義する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:12:48 GMT)
Findings of the BlackboxNLP 2025 Shared Task: Localizing Circuits and Causal Variables in Language Models [56.7] 機械的解釈可能性(MI)は、言語モデル(LM)が特定の振る舞いをどのように実装するかを明らかにする。
最近リリースされたMechanistic Interpretability Benchmark (MIB)は、回路と因果変数のローカライゼーションを評価するためのフレームワークを提供する。
BlackboxNLP 2025 Shared TaskはMIBを拡張し、MIテクニックのコミュニティ全体で再現可能な比較を行う。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 11:33:59 GMT)
Uni-MoE-2.0-Omni: Scaling Language-Centric Omnimodal Large Model with Advanced MoE, Training and Data [55.7] Uni-MoE-2.0-Omniをスクラッチから3つのコアコントリビューションで構築しています。
雑用的な理解や、画像、テキスト、音声を生成することができる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:18:13 GMT)
Can a Second-View Image Be a Language? Geometric and Semantic Cross-Modal Reasoning for X-ray Prohibited Item Detection [55.4] 我々は、X線検査のための最初の総合的なベンチマークであるDualXrayBenchを紹介する。
本稿では,12カテゴリにまたがって,45,613対のデュアルビュー画像対からなるキャプションコーパスを紹介する。
本稿では,多モーダルモデルとして幾何学的(クロスビュー)-意味論的(クロスモーダル)共振器を提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 10:25:24 GMT)
EventBench: Towards Comprehensive Benchmarking of Event-based MLLMs [53.4] EventBenchは8つのタスクメトリクスと大規模なイベントストリームデータセットを提供するベンチマークである。
我々は、GPT-5やGemini-2.5 Proのような最先端のクローズドソースモデル、Qwen2.5-VLやInternVL3といったオープンソースモデル、EventGPTのようなイベントベースのMLLMを評価した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 13:39:01 GMT)
Multi-Agent Collaborative Filtering: Orchestrating Users and Items for Agentic Recommendations [53.2] エージェントレコメンデーションのためのMulti-Agent Collaborative Filtering (MACF) フレームワークを提案する。
類似したユーザや関連項目を,ユニークなプロファイルを持つ大規模言語モデル(LLM)エージェントとしてインスタンス化する。
各エージェントは検索ツールを呼び出し、候補項目を推薦し、他のエージェントと対話することができる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 11:57:10 GMT)
InstructAudio: Unified speech and music generation with natural language instruction [52.8] InstructAudioは、音響属性の命令ベースの制御を可能にする統一的なフレームワークである。
英語と中国語で表現力のある音声、音楽、対話生成をサポートする。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:15:21 GMT)
TASO: Jailbreak LLMs via Alternative Template and Suffix Optimization [52.0] テンプレートと接尾辞を交互に最適化する新しいジェイルブレイク手法であるTASOを紹介する。
我々は,24個のLLMのベンチマークデータセットにおけるTASOの有効性を評価する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:49:27 GMT)
Efficient Covariance Estimation for Sparsified Functional Data [51.7] 共分散関数のランダムノット(ランダムノット-空間)とB-スプライン(Bspline-Spatial)推定器は計算的に効率的である。
共分散の漸近的なポイントワイドは、ある規則性条件下でのスパース化された個々の軌跡に対して得られる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 00:50:33 GMT)
An Introduction to the Quantum Approximate Optimization Algorithm [51.6] チュートリアルは変分量子回路とQUBO問題の概要から始まる。
次に、ハミルトンの定式化、ゲート分解、サンプル応用など、QAOAの詳細を探索する。
このチュートリアルはこれらの概念を高階ハミルトニアンに拡張し、関連する対称性と回路構成について議論する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:54:20 GMT)
Adaptive Mesh-Quantization for Neural PDE Solvers [51.3] グラフニューラルネットワークは複雑なジオメトリや境界条件に必要な不規則なメッシュを処理できるが、それでもすべてのノードで一様計算処理を適用できる。
適応メッシュ量子化(Adaptive Mesh Quantization): メッシュノード,エッジ,クラスタ特徴間の空間適応量子化であり,量子化モデルで使用されるビット幅を動的に調整する。
我々は,MP-PDEとGraphViTという2つの最先端モデルと統合して,複数のタスクのパフォーマンスを評価することで,フレームワークの有効性を実証する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 14:47:24 GMT)
Gaze Beyond the Frame: Forecasting Egocentric 3D Visual Span [50.6] EgoSpanLiftは、2次元画像平面から3次元シーンへ、エゴセントリックなビジュアルスパン予測を変換する手法である。
また、生のエゴセントリックなデータからベンチマークをキュレートし、3Dビジュアルスパン予測のための364.6Kサンプルを用いたテストベッドを作成します。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 14:37:11 GMT)
UniFlow: Towards Zero-Shot LiDAR Scene Flow for Autonomous Vehicles via Cross-Domain Generalization [46.6] 我々は多種多様なLiDARセンサに転送する一般的な動きの先行を学習する。
我々は、複数の大規模LiDARシーンフローデータセットを統一し、訓練するフィードフォワードモデルのファミリーであるUniFlowを提案する。
UniFlowは、TruckScenesのような目に見えないデータセットで最先端の精度を実現し、TruckScenes固有のモデルよりも30.1%向上している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 02:51:42 GMT)
MASS: Motion-Aware Spatial-Temporal Grounding for Physics Reasoning and Comprehension in Vision-Language Models [45.5] 視覚言語モデル(VLM)は、標準的なビデオタスクではうまく機能するが、運動力学や空間的相互作用を含む物理駆動推論に苦慮する。
本稿では,物理世界のコンテキストキューをVLMの知覚,理解,推論に合わせた解釈可能な表現に変換することによって,このギャップに対処するアプローチを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:43:44 GMT)
PhysGS: Bayesian-Inferred Gaussian Splatting for Physical Property Estimation [43.0] 本稿では,3次元ガウス格子のベイズ推定拡張であるPhysGSについて述べる。
オブジェクトスケール、屋内、屋外の現実世界のデータセット全体で、PhysGSは質量推定の精度を最大22.8%向上させる。
以上の結果から,PhysGSは空間的に連続した1つのフレームワークにおいて,3次元再構成,不確実性モデリング,物理的推論を統一することを示した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:29:20 GMT)
ORIGAMISPACE: Benchmarking Multimodal LLMs in Multi-Step Spatial Reasoning with Mathematical Constraints [42.7] 本稿では,多段階空間推論能力の評価を目的とした新しいデータセットとベンチマークであるORIGAMISPACEを紹介する。
パターン予測,多段階空間推論,空間関係予測,終端CPコード生成という4つの評価課題を提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 13:42:22 GMT)
C3Po: Cross-View Cross-Modality Correspondence by Pointmap Prediction [42.5] 我々は,インターネット写真コレクションから3次元のシーンを構造化して構築した新しいデータセットC3を紹介する。
C3には90Kのフロアプランと写真、597のシーンに153Mピクセルレベルの対応と85Kカメラのポーズがある。
新しいデータをトレーニングすることで、RMSEで最高の性能を34%向上させることができる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:12:42 GMT)
Transforming Conditional Density Estimation Into a Single Nonparametric Regression Task [42.1] 本研究では, 条件密度推定の問題を, 補助サンプルの導入により, 単一の非パラメトリック回帰タスクに変換する。
我々はこのアプローチを実装する方法であるcondensitéを開発する。
大規模な人口調査データセットと衛星画像データセットを用いて,本手法の評価を行った。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:50:34 GMT)
4D-VGGT: A General Foundation Model with SpatioTemporal Awareness for Dynamic Scene Geometry Estimation [41.8] 動的シーン幾何学のための普遍性分割時間表現を用いた一般化モデルを提案する。
本研究では,空間的表現のためのクロスビューグローバル・フュージョンと時間的表現のためのクロスタイムローカル・フュージョンを提案する。
複数の幾何学的データセットを統合してモデルをトレーニングし,提案手法の有効性を検証するための広範な実験を行う。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 12:05:28 GMT)
CHIPS: Efficient CLIP Adaptation via Curvature-aware Hybrid Influence-based Data Selection [41.6] CLIPを垂直領域に適用することは、通常、新しい微調整戦略や、大規模なドメイン固有のデータセット上での継続事前トレーニング(CPT)によってアプローチされる。
我々は、このタスクをデータ中心の観点から再考する: CPTの大規模データセットの代わりに、効果的なデータ選択は可能か?
そこで,CHIPS(Curvature-aware Hybrid Influence in Projection Subspace)を導入し,各画像テキスト対に3つの相補的要素を3つの目標に整合させるユーティリティスコアを割り当てる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:25:42 GMT)
A Viable Paradigm of Software Automation: Iterative End-to-End Automated Software Development [41.3] 本稿では、反復的なエンドツーエンド自動ソフトウェア開発パラダイムであるAutoSWのビジョンを示す。
分析計画-実装-デリバリループで動作し、人間のパートナーとしてのAIシステムが第一級アクターになる。
結果はAutoSWが実行可能なソフトウェアをうまく提供できることを示唆している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 08:08:15 GMT)
ChineseVideoBench: Benchmarking Multi-modal Large Models for Chinese Video Question Answering [41.3] ChineseVideoBenchは、中国語ビデオ質問回答におけるMLLM(Multimodal Large Language Models)の評価のためのベンチマークである。
8つの主要なクラスと12のサブクラスから構成されており、深いビデオ理解と、中国の言語と文化の認識の両方を必要とするタスクを含んでいる。
Gemini 2.5 Proは77.9%、InternVL-38Bは最も競争力のあるオープンソースモデルである。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 10:56:22 GMT)
Democratic Recommendation with User and Item Representatives Produced by Graph Condensation [41.3] グラフ凝縮の最近の進歩は、重要な情報を保持しながら、グラフのサイズを減らし、有望な方向を提供する。
提案する textbfDemoRec は,グラフの凝縮を利用してユーザおよび項目の代表を推薦タスクとして生成するフレームワークである。
4つの公開データセットで実施された実験は、DemoRecの有効性を示し、SOTA法と比較して推奨性能、計算効率、堅牢性を大幅に改善したことを示している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 04:09:28 GMT)
Large Language Model Enhanced Graph Invariant Contrastive Learning for Out-of-Distribution Recommendation [41.2] InvGCLLMは、データ駆動モデルと知識駆動LLMの強みを統合する革新的な因果学習フレームワークである。
InvGCLLMは配布外リコメンデーションの大幅な改善を実現し、一貫して最先端のベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 04:24:58 GMT)
Time Matters: Enhancing Sequential Recommendations with Time-Guided Graph Neural ODEs [39.5] シーケンスレコメンデーション(SR)は、eコマースプラットフォームやストリーミングサービスなどに広くデプロイされています。
既存の方法は、インタラクション間の不規則なユーザ関心と、時間とともに非常に不均一なアイテム分布という、2つの重要な要因を見落としていることが多い。
我々はTGODEを提案し、長期の歴史的相互作用の強化とキャプチャを行う。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 08:46:27 GMT)
Wireless Power Transfer and Intent-Driven Network Optimization in AAVs-assisted IoT for 6G Sustainable Connectivity [38.8] AAVは、6Gリンク以上のリソースを割り当て、ユーザインテリジェンスとネットワーク全体のパフォーマンスを共同で強化する。
本稿では,予測と決定モジュールを含む自律ネットワーク最適化のためのIntent-Driven Frameworkを提案する。
予測には超次元ベクトル符号化による超次元空間にデータを埋め込む超次元変換器(HDT)を導入する。
MAPPOは、2つの独立したパラメータ化されたネットワークを通してアクションをサンプリングし、ユーザインテントネットワークを軌跡ネットワークにカスケードして動作を維持する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:27:24 GMT)
A Needle in a Haystack: Intent-driven Reusable Artifacts Recommendation with LLMs [38.0] オープンソースソフトウェア開発では、冗長な実装作業を避けるため、既存のアーティファクトの再利用が広く採用されている。
多くの再利用可能なアーティファクトに直面している場合、開発者は、期待されるニーズを満たすアーティファクトを見つけるのに苦労することが多い。
この負担を軽減するため、アーティファクトレコメンデーションを自動化するために、検索ベースおよび学習ベース技術が提案されている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 08:39:43 GMT)
End-to-End Automated Logging via Multi-Agent Framework [35.3] 既存の自動ロギングツールは、多くの場合、ログ間の基本的な判断を無視する。
我々は、完全なエンドツーエンドロギングパイプラインに対処する新しいハイブリッドフレームワークであるAutologgerを提案する。
エンドツーエンド設定では、Autologgerは生成したロギングステートメントの全体的な品質を最強のベースラインに対して16.13%改善する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:45:30 GMT)
SyncVoice: Towards Video Dubbing with Vision-Augmented Pretrained TTS Model [34.9] ビデオダビングは、視覚内容と時間的に正確に一致した高忠実度音声を生成することを目的としている。
既存の手法は、音声の自然さと音声と視覚の同期の限界に悩まされている。
我々は、事前訓練されたテキスト音声(TTS)モデルに基づいて構築された、ヴィジュアライズされたビデオダビングフレームワークSyncVoiceを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:51:05 GMT)
Optimal Pose Guidance for Stereo Calibration in 3D Deformation Measurement [33.5] 本研究の目的は,次の最適なポーズを自動的に生成する対話型キャリブレーションフレームワークを開発することである。
この手法を統合したユーザフレンドリなグラフィカルインターフェースは、熟練していないユーザでさえ、適度なキャリブレーション画像をキャプチャするようにガイドする。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:10:07 GMT)
Alternating Perception-Reasoning for Hallucination-Resistant Video Understanding [33.0] 我々は、ループベースのパラダイムと反幻覚報酬を統合した新しいフレームワークを導入する。
一度にビデオを記述する代わりに、各ループは正確なタイムスタンプを持つビデオセグメントを記述するためにモデルを必要とする。
幻覚のリスクに対して、Factual-Aware Evaluatorは、各知覚結果を信頼できる反幻覚報酬として評価する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 14:14:14 GMT)
Health system learning achieves generalist neuroimaging models [32.6] 我々は524万のMRIおよびCTボリュームに基づいてトレーニングされた視覚基盤モデルであるNeuroVFMを紹介する。
NeuroVFMは、脳解剖学と病理学の包括的表現を学び、複数の臨床的タスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 22:34:50 GMT)
Robust Physical Adversarial Patches Using Dynamically Optimized Clusters [32.5] Ap proachはSimple Linear Iterative Clustering (SLIC)アルゴリズムを用いて、最適化中に相手パッチ内のピクセルを動的にクラスタする。
提案手法は,デジタル領域における性能向上を実現し,物理的に実現すれば,これらの性能向上は維持される。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 23:43:31 GMT)
Can Large Language Models Solve Path Constraints in Symbolic Execution? [32.5] 我々は,経路制約問題の解決に大規模言語モデル(LLM)を採用する可能性を検討することに注力する。
テストケース生成とパス分類という2つのタスクのための新しい評価パイプラインとベンチマークを構築します。
実験の結果,LLMは生成タスクと分類タスクの両方において経路制約を解くことができることがわかった。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 04:54:48 GMT)
SwiftVGGT: A Scalable Visual Geometry Grounded Transformer for Large-Scale Scenes [30.5] 大規模シーンにおける3次元再構成は3次元知覚の基本的な課題である。
既存の手法では、速度を優先し、低品質な結果を生成するか、推論時間の遅いコストで高品質な再構築を実現する。
高品質な高密度3次元再構成を保ちながら、推論時間を大幅に短縮するトレーニング不要なSwiftVGGTを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:03:49 GMT)
SineProject: Machine Unlearning for Stable Vision Language Alignment [30.4] MLLM(Multimodal Large Language Models)は、完全なリトレーニングを必要とせずに、特定の知識を忘れる必要がある。
既存の未学習の手法は、しばしば視覚言語のアライメントを妨害し、モデルが有害なクエリと良心的なクエリの両方を拒否する。
SineProjectは、凍結プロジェクターを正弦波変調したトレーニング可能なパラメータで拡張するシンプルな方法である。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 13:29:28 GMT)
TimePre: Bridging Accuracy, Efficiency, and Stability in Probabilistic Time-Series Forecasting [30.1] TimePreは、MCLパラダイムの分散柔軟性とモデルの効率を統一する新しいフレームワークである。
TimePreは、主要な確率的メトリクスで新しい最先端の精度を達成する。
これにより、確率予測における精度、効率、安定性の長年のギャップを埋める。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 17:10:07 GMT)
Point-to-Point: Sparse Motion Guidance for Controllable Video Editing [29.9] 本稿では,映像拡散モデルに先行するリッチな動きを生かして,最も重要な動きパターンをキャプチャする,新しい動き表現,アンカートークンを提案する。
実験では、アンカートークンはより制御可能でセマンティックに整合したビデオ編集をもたらし、編集や動きの忠実さの点で優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:59:59 GMT)
Perceptual-Evidence Anchored Reinforced Learning for Multimodal Reasoning [29.8] PEARLは二重ブランチの知覚推論の相乗効果であり、視覚的証拠に明示的に固定することで多モーダル推論を強化する。
PEARLはマルチモーダル推論ベンチマークにおいて、ベースラインよりも+9.7%改善し、MathVerseではGRPOよりも+6.6%向上した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 13:15:58 GMT)
AdaTok: Adaptive Token Compression with Object-Aware Representations for Efficient Multimodal LLMs [29.7] 適応トークン圧縮のためのオブジェクトレベルのトークンマージ戦略を提案する。
当社のアプローチでは,バニラモデルのパフォーマンスの96%を達成しながら,トークンの10%しか使用していません。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:39:02 GMT)
Evolution without an Oracle: Driving Effective Evolution with LLM Judges [29.5] プロブレム仕様」を通じて主観的評価の固有のノイズをテーパーするフレームワークであるMADEを紹介する。
MADEは、ソフトウェア要件の満足度を50%以上向上させます。
この研究は、"計算可能なメトリクス"の最適化から"説明可能な品質"への移行という、基本的なパラダイムシフトを検証する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 08:20:01 GMT)
Autoencoder for Position-Assisted Beam Prediction in mmWave ISAC Systems [29.4] 本稿では、位置アシストビーム予測問題に対処する軽量オートレコーダ(LAE)モデルを提案する。
提案するLEEは, 3層不完全なネットワークとして設計され, 次元削減機能を利用する。
シミュレーションの結果,提案モデルでは,83%の複雑さの低減を図り,ベースラインに類似したビーム予測精度が得られた。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 19:27:29 GMT)
MimiCAT: Mimic with Correspondence-Aware Cascade-Transformer for Category-Free 3D Pose Transfer [29.1] 3Dポーズ転送は、ターゲットの形状とソースのポーズ特性の両方を保持しながら、ソースメッシュのポーズスタイルをターゲットキャラクタに転送することを目的としている。
既存の手法は、ほとんど類似した構造を持つ文字に限られており、カテゴリーなしの設定に一般化できない。
カテゴリフリーな3Dポーズ転送用に設計されたカスケード変換器モデルであるMimiCATを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:28:57 GMT)
From Tables to Signals: Revealing Spectral Adaptivity in TabPFN [28.1] 本研究では,TabPFNのコンテキスト内学習行動の周波数に基づく最初の分析を行う。
本研究では,TabPFNが標準のReLU-MLPよりも広い有効周波数容量を有することを示す。
位置符号化はTabPFNの周波数応答を変調し、古典的な結果を暗黙の神経表現に反映する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 04:07:16 GMT)
SatSAM2: Motion-Constrained Video Object Tracking in Satellite Imagery using Promptable SAM2 and Kalman Priors [27.7] SatSAM2はSAM2上に作られたゼロショットの衛星ビデオトラッカーで、基礎モデルをリモートセンシング領域に適応させるように設計されている。
SatSAM2は2つのコアモジュールを導入している: KFCMM (Kalman Filter-based Constrained Motion Module) と、動きのダイナミクスと信頼性に基づいたトラッキング状態を制御するMotion-Constrained State Machine (MCSM) である。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:26:57 GMT)
AnyExperts: On-Demand Expert Allocation for Multimodal Language Models with Mixture of Expert [26.8] 我々はAnyExpertsという新しいオンデマンド・予算対応動的ルーティングフレームワークを提案する。
トークンごとに、その意味的重要性に基づいて、可変な専門家スロット数を割り当てる。
視覚的理解、音声理解、NLP理解の様々なタスクにまたがって評価される。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 06:53:43 GMT)
ComLQ: Benchmarking Complex Logical Queries in Information Retrieval [26.6] 情報検索システムは,様々なアプリケーションにまたがる情報過負荷をナビゲートする上で重要な役割を担っている。
これらのベンチマークは、現実世界のシナリオにおける複雑なクエリ上でのIRモデルの性能を十分に評価するためには使用できない。
大規模言語モデル(LLM)を利用してtextbfComplex textbfLogical textbfQueries 用の新しいIRデータセット textbfComLQ を構築する手法を提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 06:31:37 GMT)
Kitty: Accurate and Efficient 2-bit KV Cache Quantization with Dynamic Channel-wise Precision Boost [24.9] Kittyは、混合精度KVキャッシュのためのアルゴリズムとシステムの共同設計である。
KVメモリを8倍近い精度で削減し、最大8倍のバッチと2.1倍-4.1倍のスループットを実現した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 22:54:48 GMT)
$A^2Flow:$ Automating Agentic Workflow Generation via Self-Adaptive Abstraction Operators [23.7] A2Flow$は、自己適応的な抽象化演算子に基づくエージェントワークフロー生成のためのフレームワークである。
A2Flow$は3段階の演算子抽出プロセスを採用している。
一般的なベンチマークと具体化ベンチマークの実験では、$A2$は2.4%、平均性能は19.3%向上している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:32:53 GMT)
FHE-Agent: Automating CKKS Configuration for Practical Encrypted Inference via an LLM-Guided Agentic Framework [23.7] 本稿では、専門家推論プロセスを自動化するエージェントフレームワークであるFHE-Agentを紹介する。
探索をグローバルパラメータ選択と階層的ボトルネック修復に分解する。
検索戦略よりも精度が良く、レイテンシも低い。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 23:26:21 GMT)
EVA-Net: Interpretable Anomaly Detection for Brain Health via Learning Continuous Aging Prototypes from One-Class EEG Cohorts [22.4] EVA-Netは、脳年齢を解釈可能な異常検出問題として再放送する新しいフレームワークである。
1297人の健康な被験者で訓練され、最先端の精度を達成している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 11:56:28 GMT)
Exploring Weak-to-Strong Generalization for CLIP-based Classification [22.4] 現在の手法は人間の監督に頼っているが、モデルの複雑さが増大するにつれて実用的ではない。
最近提案された新しい解決策は、より弱いモデルを使用してより強いモデルを監視することである。
これまでの研究は、言語のみのモデルにおける弱強一般化の有効性を示してきた。
CLIPモデルの分類能力を高めることを目的としたクラスプロトタイプ学習法(CPL)を提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 10:47:25 GMT)
From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence [21.5] 大規模言語モデル(LLM)は、自然言語記述を直接関数コードに変換することによって、自動ソフトウェア開発を変革した。
コードLLMに関する総合的な合成と実践的ガイド(一連の解析および探索実験)を提供する。
一般LLM(GPT-4, Claude, LLaMA)とコード特殊化LLM(StarCoder, Code LLaMA, DeepSeek-Coder, QwenCoder)のコード機能の解析を行う。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 17:09:34 GMT)
GROOT: Graph Edge Re-growth and Partitioning for the Verification of Large Designs in Logic Synthesis [21.2] 本稿では,チップ設計領域の知識とGPUカーネルの再設計を含むアルゴリズムとシステムの共同設計フレームワークであるGROOTを紹介する。
We create node features using the circuit node types and the polarity of the connection between the input edges to node in And-Inverter Graphs (AIGs)
GROOTは、非常に大きなCSA、すなわちバッチサイズ16,024ビットの1,024ビットに対して、メモリフットプリント(59.38乗算器、99.96%)を大幅に削減する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:32:56 GMT)
UFO: Unfair-to-Fair Evolving Mitigates Unfairness in LLM-based Recommender Systems via Self-Play Fine-tuning [21.1] 我々は、不公平は、SFTだけでなく、事前訓練によっても生じ、そこでは、SFTの間に固有のバイアスがさらに増幅されることを見出した。
本研究では,不公平さ軽減を両プレーヤーゲームとして定式化した自己再生機構を用いた Unfair-to-Fair evOlving (UFO) フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 08:34:30 GMT)
How to Train Your Latent Control Barrier Function: Smooth Safety Filtering Under Hard-to-Model Constraints [21.0] 本研究では,可到達性値関数を制御障壁関数(CBF)に適応させることにより,最適化に基づくスムーズなフィルタリングを実現する。
本稿では,ラベル付けを伴わずにスムーズなマージン関数に繋がる勾配のペナルティによって,両方の課題に対処するLatentCBFを提案する。
視覚に基づく操作ポリシーによるシミュレーションベンチマークとハードウェアの実験は、LatentCBFがスムーズな安全フィルタリングを可能にすることを示した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 20:15:28 GMT)
Video-as-Answer: Predict and Generate Next Video Event with Joint-GRPO [21.0] Video-Next-Event Prediction (VNEP)は、テキスト内の次のイベントを予測するために動的なビデオ応答を必要とする。
VNEPのためのビデオ拡散モデル(VDM)とビジョンランゲージモデル(VLM)を一致させるために、強化学習を利用するモデルVANSを導入する。
VANSのコアとなるのは、VLMとVDMを編成してユニットとして機能するジョイント・GRPOである。
手続き的および予測的ベンチマークの実験は、VANSがビデオイベント予測と可視化の両方で最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:27:38 GMT)
When Generative Replay Meets Evolving Deepfakes: Domain-Aware Relative Weighting for Incremental Face Forgery Detection [20.3] 生成的リプレイは過去のデータを合成することで潜在的な解決策を提供するが、偽造検出の可能性はまだ不明である。
生成的リプレイを効果的に活用するための新しいドメイン認識相対重み付け(DARW)戦略を提案する。
DARWは、ドメインリスキーサンプルの監督と潜在的な混乱のバランスをとるために、相対分離損失を適用しながら、ドメインセーフなサンプルを直接監視する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 13:09:02 GMT)
MammothModa2: A Unified AR-Diffusion Framework for Multimodal Understanding and Generation [20.1] 統一マルチモーダルモデルは、単一のフレームワーク内で理解と生成を統合することを目的としている。
本稿では,自己回帰拡散(AR-Diffusion)フレームワークであるMammothModa2(Mammoth2)を紹介する。
Mammoth2は、公開ベンチマークで強力なテキスト・ツー・イメージと命令ベースの編集性能を提供する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:25:39 GMT)
ADF-LoRA: Alternating Low-Rank Aggregation for Decentralized Federated Fine-Tuning [20.0] ADF-LoRAは1ラウンド当たり1つの低ランク行列の更新を同期し、両方の行列を混合することにより、分散的伝搬下でより一貫したパラメータ状態を維持する。
実験により、AFF-LoRAはより高速でスムーズな収束を実現し、タスク間で最高の平均精度を達成し、分散FLにおける既存のLoRA変異を一貫したマージンで上回っていることが示された。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:09:32 GMT)
Zero-Reference Joint Low-Light Enhancement and Deblurring via Visual Autoregressive Modeling with VLM-Derived Modulation [18.7] 現実の暗黒画像は、視界とコントラストの低いだけでなく、複雑なノイズやぼやけも示しており、重要な修復上の課題を呈している。
視覚言語モデル(VLM)を用いた視覚自己回帰モデル(VAR)に基づく生成フレームワークを提案する。
我々のフレームワークは完全に教師なしであり、ベンチマークデータセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 19:08:45 GMT)
DocPTBench: Benchmarking End-to-End Photographed Document Parsing and Translation [18.5] DocPTBenchは、写真文書解析および翻訳用に特別に設計されたベンチマークである。
実験の結果,デジタル化文書から写真化文書への移行により,性能が著しく低下することが確認された。
この大きなパフォーマンスギャップは、現実世界の状況でキャプチャされた文書によって引き起こされるユニークな課題を浮き彫りにする。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 13:02:11 GMT)
Natural Emergent Misalignment from Reward Hacking in Production RL [17.5] 大規模言語モデルが実運用RL環境のハックに報いることを学習すると、これは突然の誤認識をもたらす可能性があることを示す。
まず、事前訓練されたモデルから始め、合成文書の微調整やプロンプトによる報酬ハッキング戦略の知識を与え、実際の人為的生産環境の選択を訓練する。
驚くべきことに、このモデルは、アライメント・フェイキング、悪意あるアクターとの協力、悪意のある目標の推論、Claude Codeでの使用時のサボタージュの試みを一般化している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 10:50:02 GMT)
stable-pretraining-v1: Foundation Model Research Made Simple [17.1] 我々は、PyTorch、Lightning、Hugging Face、TorchMetrics上に構築された、安定した事前トレーニング、モジュラーおよびパフォーマンス最適化ライブラリを提供する。
従来のツールキットが最先端の結果に焦点を絞ったのとは異なり、安定した事前訓練は柔軟性とスピードのために設計されている。
最小限のオーバーヘッドで新たな研究結果を生成する能力を示すことで,図書館の検証を行う。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 04:39:48 GMT)
ViMix-14M: A Curated Multi-Source Video-Text Dataset with Long-Form, High-Quality Captions and Crawl-Free Access [16.9] ViMix-14Mは、約1400万対のマルチソースビデオテキストデータセットである。
ViMix-14Mは、様々なオープンビデオソースをマージして構築され、その後にデ複製と品質フィルタリングが統合されている。
マルチモーダル検索,テキスト・ツー・ビデオ生成,ビデオ質問応答タスクによるデータセットの評価を行った。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 10:19:56 GMT)
Clinician-in-the-Loop Smart Home System to Detect Urinary Tract Infection Flare-Ups via Uncertainty-Aware Decision Support [16.6] 尿路感染症(UTI)フレアアップは、慢性疾患を持つ高齢者に重大な健康リスクをもたらす。
UTI検出のための単純なバイナリ分類に依存する従来の機械学習アプローチは、看護師や実践者に限られたユーティリティを提供する。
本稿では,環境センサデータを利用して意味のある行動マーカーを抽出するCILスマートホームシステムを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 08:16:17 GMT)
Position: The Complexity of Perfect AI Alignment -- Formalizing the RLHF Trilemma [16.5] RLHF(Reinforcement from Human Feedback)は、大規模な言語モデルの整合に広く使われている。
私たちはこのトリレンマを形式化する: アライメント・トリレンマ(Alignment Trilemma: No Epsilon-representativeness of various human values)。
我々のフレームワークは、嗜好の崩壊、梅毒症、系統的バイアス増幅などの病態を統一的に説明する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 20:23:23 GMT)
Hierarchical Deep Research with Local-Web RAG: Toward Automated System-Level Materials Discovery [16.5] 複雑な材料やデバイス発見問題のための長期的階層的深層研究(DR)エージェント。
我々のフレームワークは、ローカルにデプロイ可能なDRインスタンスをインスタンス化し、ローカル検索拡張生成と大規模言語モデル推論を統合します。
大規模言語モデル (LLM-as-judge) を用いた27のナノマテリアル/デバイストピックに対して, Web 対応5つの最先端モデルを審査員として体系的に評価した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:57:42 GMT)
Beyond Words and Pixels: A Benchmark for Implicit World Knowledge Reasoning in Generative Models [16.0] 我々は、暗黙の世界の知識とT2Iモデルの物理的因果推論の把握を評価する最初の総合的なベンチマークであるPicWorldを紹介する。
このベンチマークは、3つのコアカテゴリにわたる1,100のプロンプトで構成されている。
我々は、PicWorldで17の主流モデルT2Iを徹底的に分析し、暗黙の世界知識と物理的因果推論の能力に普遍的に限界があることを示した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:44:54 GMT)
Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data [15.9] 大きな言語モデル(LLM)は例外的な性能を示すが、かなりのプライバシーリスクを引き起こす。
選択的知識学習のための階層的二重ストラテジーフレームワークを提案する。
当社のフレームワークは、パラメータの0.1%しか変更することなく、堅牢なプライバシ保証を維持しています。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:28:19 GMT)
PeriodNet: Boosting the Potential of Attention Mechanism for Time Series Forecasting [15.8] 本稿では、隣接した周期を解析するための周期注意機構とスパース周期注意機構を組み込んだ周期ネットを提案する。
PeriodNetは、従来のエンコーダ・デコーダ・トランスフォーマーアーキテクチャに基づく他のモデルと比較して、長さ720の時系列を予測する場合、相対的に22%の改善を実現している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 14:47:38 GMT)
Graph Out-of-Distribution Detection via Test-Time Calibration with Dual Dynamic Dictionaries [15.4] グラフアウト・オブ・ディストリビューション(OOD)検出の鍵となる課題は、トレーニング中に接地トルースOODサンプルが存在しないことである。
動的に動的に更新された辞書を用いてOODスコアを校正する,BaCaと呼ばれる新しいテスト時間グラフOOD検出法を提案する。
BaCaは、OOD検出における既存の最先端メソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:09:35 GMT)
Uni-DAD: Unified Distillation and Adaptation of Diffusion Models for Few-step Few-shot Image Generation [15.3] 拡散モデル(DM)は高品質な画像を生成するが、新しい領域への適応にはコストがかかる。
蒸留とDMの適応を統一する単一段パイプラインであるUni-DADを紹介する。
Uni-DADは4段階未満のサンプリングステップでも、最先端(SoTA)適応手法よりも高い品質を提供する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 04:22:42 GMT)
Shadows in the Code: Exploring the Risks and Defenses of LLM-based Multi-Agent Software Development Systems [15.3] リスクのある2つのシナリオを識別する: 悪質なエージェントを持つ悪意のあるユーザ(MU-BA)と悪質なエージェントを持つ良質なユーザ(BU-MA)。
Indicit Malicious Behavior Injection Attack (IMBIA)を導入し、マルチエージェントシステムをどのように操作して悪質な機能を隠蔽したソフトウェアを生成するかを示す。
本研究は,マルチエージェントソフトウェア開発システムにおける堅牢なセキュリティ対策の急激なニーズを浮き彫りにするものである。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 14:26:35 GMT)
RoadSceneVQA: Benchmarking Visual Question Answering in Roadside Perception Systems for Intelligent Transportation System [15.2] RoadSceneVQAは、ロードサイドシナリオに特化した、大規模な視覚的質問応答データセットである。
データセットは、様々な天候、照明、交通条件の下で収集された34,736種類のQAペアで構成されている。
RoadSceneVQAは、明示的な認識と暗黙的な常識推論の両方を実行するモデルに挑戦する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 04:40:50 GMT)
A Fair OR-ML Framework for Resource Substitution in Large-Scale Networks [14.6] 本稿では,オペレーティングリサーチ(OR)と機械学習(ML)を組み合わせて,大規模ネットワークにおける資源の公平な置換を可能にする汎用フレームワークを提案する。
このフレームワークは、世界最大のパッケージデリバリー企業のネットワークに適用されている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:38:41 GMT)
LLMs as Firmware Experts: A Runtime-Grown Tree-of-Agents Framework [14.4] FIRMHIVEは、大規模言語モデルが自律的なファームウェアセキュリティアナリストとして機能することを可能にするエージェントハイブである。
FIRMHIVEはより深く(約16倍の推論ステップ)、より広い(約2.3倍のファイル検査)クロスファイル探索を行い、ファームウェアごとに約5.6倍の警告を行う。
最先端(SOTA)セキュリティツールと比較して、FIRMHIVEは1.5倍の脆弱性(1,802件)を特定し、71%の精度を実現している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 13:19:40 GMT)
Majority of the Bests: Improving Best-of-N via Bootstrapping [14.2] Majority-of-the-Bests (MoB) はブートストレッピングによってBoNの出力分布を推定し、そのモードを選択する新しい選択メカニズムである。
MoBは、BoNと自己整合性の単純な代替として機能し、より広範に、よりニュアンスな選択機構の研究を動機付けている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 22:05:08 GMT)
AutoFocus-IL: VLM-based Saliency Maps for Data-Efficient Visual Imitation Learning without Extra Human Annotations [13.7] AutoFocus-ILは、視覚模倣学習におけるデータ効率と一般化を改善するための、シンプルで効果的な方法である。
気晴らしや素早い相関よりも、タスク関連機能への参加をポリシーに導いている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 21:21:10 GMT)
SciPostLayoutTree: A Dataset for Structural Analysis of Scientific Posters [13.1] ポスターの読み順と親子関係の分析は、構造を意識した要約の構築に不可欠である。
学術的なコミュニケーションが盛んに行われているにもかかわらず、ポスターは構造解析研究に過小評価されている。
SciPostTreeは、約8000のポスターを収集し、読み順と親子関係を構築した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:50:59 GMT)
Uncertainty Quantification in HSI Reconstruction using Physics-Aware Diffusion Priors and Optics-Encoded Measurements [12.9] ベイズ推論問題として高スペクトル像(HSI)再構成を定式化する。
我々は,非条件で訓練された画素レベルの拡散と後方拡散サンプリングを利用するHSDiffというフレームワークを提案する。
我々は,HSDiffが不確実性を考慮したHSI再建のための完全かつ高性能な手法であることを実証した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 14:43:51 GMT)
SmolKalam: Ensemble Quality-Filtered Translation at Scale for High Quality Arabic Post-Training Data [12.8] マルチモデルアンサンブル変換パイプラインを用いたSmoltalk2の翻訳であるSmolKalamを紹介する。
本研究では,従来のデコーダのみのモデルに対するアブレーションによる効率的な翻訳手法について検討する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 11:53:30 GMT)
LockForge: Automating Paper-to-Code for Logic Locking with Multi-Agent Reasoning LLMs [12.6] 論文中のLL記述を実行可能なテストコードに変換するフレームワークであるLockForgeを紹介します。
LockForgeは、先入観、実装、反復的な改善、多段階検証を実現する、慎重に構築されたパイプラインを提供する。
LockForgeのような高度な推論モデルと高度なマルチステージフレームワークが必要であることを示す。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:51:32 GMT)
CycleChemist: A Dual-Pronged Machine Learning Framework for Organic Photovoltaic Discovery [12.5] 我々は、予測モデリングと生成分子設計を組み合わせた、OPV発見のための二重機械学習フレームワークを提案する。
我々は,2000個の実験的に特徴付けられたドナーアクセプターペアを含む,その種の最大のキュレートデータセットである有機太陽光発電ドナーアクセプターデータセット(OPV2D)を提示する。
このフレームワークには、HOMOとLUMOのエネルギーレベルを予測するための軌道エネルギー推定器(MOE2)と、PCEを推定する太陽光発電性能予測器(P3)が含まれる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:31:11 GMT)
General Agentic Memory Via Deep Research [12.5] 我々は,textbf General Agentic memory (GAM) と呼ばれる新しいフレームワークを提案する。
GAMは実行時にクライアントに最適化されたコンテキストを生成し、オフライン段階ではシンプルだが有用なメモリのみを保持する。
GAMは、既存のメモリシステムに対して様々なメモリ基底タスク完了シナリオを大幅に改善する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 12:29:33 GMT)
OmniTFT: Omni Target Forecasting for Vital Signs and Laboratory Result Trajectories in Multi Center ICU Data [12.2] OmniTFTは、高頻度のバイタルサインを共同で学習し、予測する深層学習フレームワークである。
スライディングウィンドウ等化サンプリング、周波数認識型埋め込み収縮、階層変数選択、影響対応型アテンションキャリブレーションの4つの新しい手法を実装している。
MIMIC-III、MIMIC-IV、およびeICUデータセットにおいて、バイタルサインと実験結果の両方で大幅な性能向上を実現している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:17:22 GMT)
Clinician-Directed Large Language Model Software Generation for Therapeutic Interventions in Physical Rehabilitation [11.9] デジタルヘルスの介入は、スマートフォンなどのセンサーを備えたデバイスを介して在宅運動プログラムを届けるために、身体的および職業的治療にますます利用されている。
ケアの時点では、臨床医はモジュールを選択して、繰り返しのような狭いパラメータを調整できるだけである。
我々は,大規模言語モデル(LLM)を用いて臨床医の運動処方薬を介入ソフトウェアに翻訳するデジタル介入パラダイムを評価した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:51:41 GMT)
DiM-TS: Bridge the Gap between Selective State Space Models and Time Series for Generative Modeling [11.8] 時系列データは、さまざまな分野において重要な役割を果たすが、プライバシーに関する問題に直面している。
そこで,本研究では,モデルが認知過程において重要なパターンを識別する能力を高めるために,Lag Fusion MambaとPermutation Scanning Mambaを提案する。
またDiffusion Mamba for Time Series (DiM-TS)を導入し、時間周期性およびチャネル間相関をよりよく保存する高品質な時系列生成モデルを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 06:48:03 GMT)
Zero-Shot Video Deraining with Video Diffusion Models [11.6] 本稿では,合成データやモデル微調整を必要としない複雑な動的シーンに対して,最初のゼロショットビデオデラミニング手法を提案する。
我々のアプローチは、実世界の降雨データセットに関する広範な実験を通じて検証される。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 17:06:22 GMT)
Expressive Temporal Specifications for Reward Monitoring [11.5] 我々は,実行時可観測状態軌跡に対して高密度な報酬ストリームを生成する報奨モニタを合成する。
我々のフレームワークはアルゴリズムに依存しず、状態ラベル関数のみに依存します。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 12:12:35 GMT)
LLM Reasoning for Cold-Start Item Recommendation [11.2] 大規模言語モデル(LLM)はレコメンデーションシステムを改善する重要な可能性を示している。
我々はNetflixドメイン内で、コールドスタートアイテムレコメンデーション用に設計された新しい推論戦略を提案する。
提案手法は,LLMの高度な推論機能を利用してユーザの好みを効果的に推測する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:22:53 GMT)
Brain-MGF: Multimodal Graph Fusion Network for EEG-fMRI Brain Connectivity Analysis Under Psilocybin [11.0] 脳波-fMRI接続解析のためのマルチモーダルグラフ融合ネットワークBrain-MGFを提案する。
各モダリティに対して、部分相関エッジとピアソンに代表されるノード特徴を持つグラフを構築し、対象レベルの埋め込みを学習する。
適応的なソフトマックスゲートは、コンテキスト依存のコントリビューションをキャプチャするために、サンプル固有の重みとモダリティを融合する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:31:28 GMT)
MindEval: Benchmarking Language Models on Multi-turn Mental Health Support [10.5] MindEvalは、現実的でマルチターンのメンタルヘルスセラピー会話において、言語モデルを自動的に評価するためのフレームワークである。
シミュレーションされた患者が生成したテキストに対する現実性を定量的に検証し、自動判断と人的判断との間に強い相関関係を示す。
われわれは12の最先端のLCMを評価し、AI固有のコミュニケーションパターンに特に弱点がある平均6点中4点以下で、すべてのモデルが苦戦していることを示す。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:19:29 GMT)
HiFi-MambaV2: Hierarchical Shared-Routed MoE for High-Fidelity MRI Reconstruction [9.8] HiFi-MambaV2 は、周波数分解とコンテンツ適応型計算を結合した階層型共有制御型Mixture-of-Expertsアーキテクチャである。
また,HiFi-MambaV2はPSNR,SSIM,NMSEにおいて,CNN-,Transformer-,およびそれ以前のMambaベースラインより一貫して優れていた。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:58:15 GMT)
DEXO: A Secure and Fair Exchange Mechanism for Decentralized IoT Data Markets [9.7] データコンシューマと分散IoT/モバイルデータプロバイダ間のセキュアで公平なデータ交換を容易にする分散データ交換機構であるDEXOを提案する。
DEXOは初めて、参加者の共謀に対する強力なレジリエンスで、エンドツーエンドのデータ機密性、ソースの検証可能性、交換プロセスの公平性を保証します。
この評価は、一般的なデータ交換メカニズムと比較して、適度なデプロイメントコストとブロックチェーンの運用効率が大幅に向上したことを示している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:29:24 GMT)
Reduced-Basis Deep Operator Learning for Parametric PDEs with Independently Varying Boundary and Source Data [9.4] RB-DeepONetは,DeepONetの分岐トランク構造と低基底数値構造を融合したハイブリッド演算子学習フレームワークである。
トランクはグレディ選択によってオフラインで生成された厳密に構築されたRB空間に固定され、物理的解釈可能性、安定性、認証されたエラー制御が許される。
独立に負荷や境界条件が変化する問題に対して、低次元座標にデータを圧縮する境界およびソースモーダル符号化を開発する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:22:11 GMT)
Zero-Trust Strategies for O-RAN Cellular Networks: Principles, Challenges and Research Directions [9.3] Zero-Trust Architecture (ZTA)は、暗黙の信頼前提を捨てる有望なセキュリティパラダイムとして登場した。
ZTAは、敵の動きを含むために、コントロールプレーンとユーザプレーンの両方にわたって包括的できめ細かなセキュリティ機構を委任する。
本稿では,アーキテクチャの実現手段として,Open-RAN(O-RAN)を中心に,5G以降の文脈におけるZTAの採用について検討する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:25:19 GMT)
Pre-training Graph Neural Networks on 2D and 3D Molecular Structures by using Multi-View Conditional Information Bottleneck [8.4] 本稿では,2次元および3次元分子構造上のグラフニューラルネットワークの事前学習のためのマルチビューコンディショナル・インフォメーション・ボトルネック・フレームワークを提案する。
我々の考えは、MVIBの原則の下で、各ビューから無関係な機能を最小化しながら、共有情報を見つけることである。
ビュー間のセマンティックな一貫性と構造的整合性を高めるために,2つのビュー間のアンカーとして機能的グループやego-networksといった重要なサブストラクチャを利用する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 11:18:35 GMT)
Universal learning of nonlocal entropy via local correlations in non-equilibrium quantum states [8.4] 量子状態の非局所的性質を特徴づけることは、大規模量子計算とシミュレーションの実用化における中心的な課題である。
多層パーセプトロン(MLP)を用いて、QMIと局所相関の普遍写像を1次元の乱れたXXZモデルにおいて、クエンチによって生成される非平衡状態に対して最大2次まで確立する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:34:25 GMT)
LRDUN: A Low-Rank Deep Unfolding Network for Efficient Spectral Compressive Imaging [8.2] 低ランクディープ・アンフォールディング・ネットワーク(LRDUN)は、計算コストを大幅に削減し、最先端(SOTA)再構築品質を達成する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:08:34 GMT)
Intervention Efficiency and Perturbation Validation Framework: Capacity-Aware and Robust Clinical Model Selection under the Rashomon Effect [8.2] 同等のパフォーマンスを持つ複数のモデルの共存は、信頼できるデプロイメントと評価に根本的な課題をもたらします。
我々は,頑健なモデルアセスメントと選択のための2つの補完的ツールを提案する: 介入効率(IE)と摂動検証フレームワーク(PVF)。
IEはキャパシティを意識したメトリクスであり、限られた介入しか実現できない場合、モデルが実行可能な真の正をいかに効率的に識別するかを定量化する。
PVFは、データ摂動下でのモデルの安定性を評価するための構造化されたアプローチを導入し、ノイズやシフトした検証セット間で性能が最も不変なモデルを特定する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 17:59:46 GMT)
RNN as Linear Transformer: A Closer Investigation into Representational Potentials of Visual Mamba Models [8.0] Mambaは最近、視覚タスクの効果的なバックボーンとして注目を集めている。
マンバの表現性を調べるために3つの主要な貢献をする。
我々のモデルは、ImageNet上で78.5%の線形探索精度を達成し、その強い性能を裏付ける。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:57:27 GMT)
Enhancing UAV Search under Occlusion using Next Best View Planning [7.6] 密林では、無人航空機の有効性は、地上の鮮明な景色を捉える能力に依存する。
本研究は、カメラの位置と視点を最適化する最適化された探索戦略を提案する。
最適なカメラ視点を選択することで探索性能を向上させるために,2つの新しい最適化,幾何と可視性を提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:00:33 GMT)
Quantum machine learning for efficient reduced order modelling of turbulent flows [7.5] 乱流の正確な予測は、その高次元性と固有非線形性のために流体力学における中心的な課題である。
量子アルゴリズムと機械学習の最近の発展は、乱流モデリングに固有の計算障壁を克服する新たな機会を提供する。
ここでは、リアルタイムの乱流予測を高速化する新しいハイブリッド量子古典的フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 17:42:46 GMT)
Leveraging Discrete Choice Experiments for User-Centric Requirements Prioritization in mHealth Applications [7.0] モバイルヘルス(mHealth)アプリケーションは慢性疾患管理に広く利用されているが、ユーザビリティとアクセシビリティの課題は続いている。
本研究は,mHealth適応設計におけるユーザの嗜好やトレードオフに影響を与える重要な要因を明らかにする。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 21:50:09 GMT)
Breaking the Bottleneck with DiffuApriel: High-Throughput Diffusion LMs with Mamba Backbone [6.8] 両方向マンバのバックボーン上に構築されたマスク付き拡散言語モデルであるDiffuAprielを紹介する。
この結果から, 双方向状態空間アーキテクチャは, マスク拡散LMの強力なデノイザとして機能することが示唆された。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:32:34 GMT)
Seer: Online Context Learning for Fast Synchronous LLM Reinforcement Learning [6.7] 強化学習(RL)は、現代の大規模言語モデル(LLM)の進展に欠かせないものとなっているが、既存の同期RLシステムは、重大なパフォーマンスボトルネックに直面している。
従来見過ごされていた出力長と生成パターンの類似性を利用して,同じプロンプトを共有することで,これらの課題に対処する新しいオンラインコンテキスト学習システムであるSeerを提案する。
Seer氏は、動的ロードバランシングのための分割ロールアウト、コンテキスト対応スケジューリング、適応的なグループ化された投機的デコーディングの3つの主要なテクニックを紹介している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 13:41:11 GMT)
A Recommender System Based on Binary Matrix Representations for Cognitive Disorders [6.7] 本研究の目的は,二項行列表現を用いた認知障害診断のためのレコメンデータシステムの開発である。
推奨システムのプロトタイプがPythonで実装された。
これはプロトタイプであるが、推奨システムは臨床支援ツールとしての可能性を示している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 23:04:21 GMT)
ChroniUXMag: A Persona-Driven Framework for Inclusive mHealth Requirements Engineering [6.6] 本研究は,mHealth設計における傾斜度要求を抽出・解析するフレームワークであるChroniUXMagを紹介する。
このフレームワークはInclusiveMagとGenderMagの原則に基づいており、研究者や実践者が慢性疾患を持つ個人がmHealthシステムをどのように認識し、信頼し、相互作用するかに影響を与える要因を体系的に把握し、評価することを目的としている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 22:20:13 GMT)
DE-KAN: A Kolmogorov Arnold Network with Dual Encoder for accurate 2D Teeth Segmentation [6.5] 本稿では,特徴表現とセグメンテーション精度を向上させる新しいDual Kolmogorov Arnold Networkを提案する。
このフレームワークは、拡張入力にResNet-18エンコーダ、オリジナル入力にカスタマイズされたCNNエンコーダを使用しており、グローバルおよびローカルな空間特徴を補完的に抽出することができる。
2つのベンチマーク歯科用X線データセットの実験により、DE-KANは最先端のセグメンテーションモデルより優れていることが示された。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:56:20 GMT)
Can LLMs Help Allocate Public Health Resources? A Case Study on Childhood Lead Testing [6.5] プライオリティ・スコアは、未検査児の割合、血中鉛濃度の上昇、公衆衛生に関するパターンを統合している。
我々は,シカゴ,ニューヨーク,ワシントンD.C.の136地区における資源配分決定の最適化を支援するために,これらの割り当てタスクを活用している。
エージェント推論と深層研究能力を備えた大規模言語モデルが公衆衛生資源を効果的に配分できるかどうかを評価する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 00:54:25 GMT)
No Free Lunch in Language Model Bias Mitigation? Targeted Bias Reduction Can Exacerbate Unmitigated LLM Biases [6.2] 大規模言語モデル(LLM)は、トレーニングデータから社会的バイアスを継承し、有害または不公平なアウトプットにつながる可能性がある。
7つのモデルファミリーから10種類のモデルに適用された4つのバイアス緩和手法について検討し,人種的,宗教的,職業的,性的なバイアスについて検討した。
我々の結果は、標的緩和は意図した次元におけるバイアスを減少させることがあるが、意図しない結果や否定的な結果をもたらすことが多いことを一貫して示している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 22:21:18 GMT)
Profile Generators: A Link between the Narrative and the Binary Matrix Representation [6.1] 本研究は,DSM-5の物語形式と二項行列表現を関連付ける代替表現を開発する。
症状プロファイルジェネレータ(または単にジェネレータ)は、バイナリマトリックスの可読性、適応性、包括的な代替手段を提供する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 22:44:17 GMT)
Semantics as a Shield: Label Disguise Defense (LDD) against Prompt Injection in LLM Sentiment Classification [6.0] 本稿では,ラベルを意味的に変換したエイリアスラベルに置き換えることで,真のラベルを隠蔽する軽量な戦略であるラベル・ディグライズ・ディフェンス(LDD)を紹介する。
GPT-5, GPT-4o, LLaMA3.2, Gemma3, Mistral など,9種類の最先端モデルを対象としたLCDの評価を行った。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 20:16:51 GMT)
Carbon-Aware Intrusion Detection: A Comparative Study of Supervised and Unsupervised DRL for Sustainable IoT Edge Gateways [5.9] 本稿では,DeepEdgeIDSとAutoDRL-IDSの2つの新しいIDSを提案する。
どちらのDRLベースのIDSも、エッジゲートウェイに関する理論的解析と実験的評価により検証される。
その結果,AutoDRL-IDSはラベル付きデータによる検出精度94%,DeepEdgeIDSはラベル無しで98%の精度と適応性が得られた。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 00:59:27 GMT)
Bayesian Optimization and Convolutional Neural Networks for Zernike-Based Wavefront Correction in High Harmonic Generation [5.8] 高高調波発生(HHG)は、波長可変、高エネルギー、コヒーレント、超短パルスのテーブルトップ生成を可能にする非線形過程である。
HHG用高出力レーザーシステムの光収差はビーム品質を低下させ効率を低下させる。
空間光変調器を用いた収差補正のための機械学習手法を提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 20:03:42 GMT)
Analyzing and Optimizing the Distribution of Blood Lead Level Testing for Children in New York City: A Data-Driven Approach [5.6] 本研究は,2005年から2021年までのニューヨーク市の42地区で6歳未満の小児の血中鉛濃度(BLL)を測定した。
市全体でのBLL率の低下にもかかわらず、地区レベルでの格差は持続し、公式報告書には触れられていない。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:27:13 GMT)
Think Fast: Real-Time IoT Intrusion Reasoning Using IDS and LLMs at the Edge Gateway [5.5] 本稿では、軽量機械学習(ML)ベースのIDSモデルと事前学習された大規模言語モデル(LLM)を統合したエッジ中心の侵入検知システム(IDS)について述べる。
このシステムは、決定木(DT)、K-Nearest Neighbors(KNN)、ランダムフォレスト(RF)、畳み込みニューラルネットワーク(CNN)、Long Short-Term Memory(LSTM)、低消費電力エッジゲートウェイ上のハイブリッドCNN-LSTMモデルの6つのMLベースIDSモデルを評価する。
異常検出のために、システムは低帯域APIコールを介してコンパクトでセキュアなテレメトリスナップショットをLSMに送信する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 00:33:51 GMT)
The Generalized Proximity Forest [5.5] 一般化されたPF(Proximity Forest)モデルを導入し、RFの近さをあらゆる文脈に広げる。
また、回帰タスクのためのPFモデルの変種も導入する。
一般化されたPFモデルの独特な利点をRFモデルと$k$-nearest近辺モデルと比較して実験的に実証した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:50:53 GMT)
Building Domain-Specific Small Language Models via Guided Data Generation [5.4] 大規模言語モデル(LLM)は、幅広い知識集約的なタスクをサポートすることに顕著な成功を収めている。
専門分野においては、分野の専門家をドメイン固有の課題で支援するためにLLMを活用することへの関心が高まっている。
多くのオープンソースモデルは、効果的なドメイン適応とデプロイのために重要な計算資源を必要とする。
小型シードコーパスからガイド付き合成データ生成とボトムアップドメインデータを組み合わせた,低コストでスケーラブルなトレーニングパイプラインを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:19:31 GMT)
Evaluating Large Language Models on the 2026 Korean CSAT Mathematics Exam: Measuring Mathematical Ability in a Zero-Data-Leakage Setting [5.3] 本研究は,2026年の韓国・カレッジ・スコラスティック能力テスト(CSAT)を用いた大規模言語モデル(LLM)の数学的推論能力について,体系的に評価した。
試験の公開から2時間以内に46問(普通22問、選択24問)をデジタル化し,モデルトレーニングデータに含める可能性を排除した。
GPT-5コーデックスはテキスト入力と韓国のプロンプトで唯一の完全スコア(100点)を獲得し、Grok 4、GPT-5、Deepseek R1は95点を超えた。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 23:09:33 GMT)
Ensuring Calibration Robustness in Split Conformal Prediction Under Adversarial Attacks [5.3] コンフォーマル予測(CP)は、分布のない有限サンプルのカバレッジを保証するが、交換可能性に依存している。
本研究では, 対向的摂動下での分割共形予測のロバスト性について検討し, 適用範囲の妥当性と結果の予測セットサイズに着目した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:16:31 GMT)
DynamiX: Dynamic Resource eXploration for Personalized Ad-Recommendations [5.2] オンラインアドレコメンデーションシステムのためのスケーラブルでパーソナライズされたシーケンス探索フレームワークであるDynamixを紹介した。
Dynamixは、居住時間と広告変換イベントの相関を利用して、セッションと表面レベルのユーザエンゲージメントを分類する。
我々は,Dynamixがオンラインユーザシーケンスに基づく推薦モデルにおいて,大幅なコスト効率と性能向上を実現していることを示す。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 08:10:33 GMT)
Hyperspectral Variational Autoencoders for Joint Data Compression and Component Extraction [5.2] 我々は、NASAのTEMPO衛星ハイパースペクトル観測(1028チャンネル、290-490nm)のx514圧縮を実現する変分オートエンコーダ(VAE)アプローチを提案する。
この劇的なデータボリューム削減は、スペクトルの忠実さを維持しながら、効率的なアーカイブと衛星観測の共有を可能にする。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:26:09 GMT)
Lightweight Autoencoder-Isolation Forest Anomaly Detection for Green IoT Edge Gateways [5.1] 従来の異常検出方式は、計算効率と環境への影響を見越しながら精度を優先することが多い。
本稿では,表現学習と異常スコアリングを統合した,持続可能なハイブリッド型異常検出フレームワークであるtextitEcoDefenderについて述べる。
現実的なIoTトラフィックの実験では、これらの理論的洞察を確認し、AEのみのベースラインと比較して平均CPU使用率22%、27msの推論レイテンシ、30%のエネルギー消費で、最大94%の検出精度を達成した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 00:48:34 GMT)
Heterogeneous Multi-Agent Proximal Policy Optimization for Power Distribution System Restoration [5.0] 本稿では, 相互接続したマイクログリッド間の協調修復を実現するために, 不均一・エージェント強化学習フレームワークを適用した。
その結果、HARLフレームワークにマイクログリッドレベルの不均一性を組み込むことで、複雑なPSD修復のためのスケーラブルで安定で制約対応のソリューションが得られることが示された。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 20:39:15 GMT)
Toward an AI-Native Internet: Rethinking the Web Architecture for Semantic Retrieval [5.0] AI-Native Internetの概念は、サーバが完全なドキュメントではなく、意味的に関連する情報をチャンクとして公開するWebアーキテクチャである。
現在のHTMLベースの検索の非効率性を定量化し、今日のドキュメント中心のWebをAI指向の基板に進化させる上でのアーキテクチャ上の方向性とオープンな課題を概説する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:01:22 GMT)
Learning Visually Interpretable Oscillator Networks for Soft Continuum Robots from Video [4.9] 本稿では,自動エンコーダに基づく潜在動的学習のためのプラグイン・アンド・プレイモジュールであるAttention Broadcast Decoder (ABCD)を紹介する。
ABCDは静的背景をフィルタリングしながら、各潜伏次元の寄与をローカライズした画素精度の注意マップを生成する。
ABCDに基づくモデルにより,複数ステップの予測精度が大幅に向上することが実証された。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:27:39 GMT)
Bayesian-based Online Label Shift Estimation with Dynamic Dirichlet Priors [4.8] FMAPLS(Full Maximum A Posterior Label Shift)と呼ばれるラベルシフト推定のためのベイズ的フレームワークを提案する。
その結果、FMAPLSとオンラインFMAPLSはそれぞれ40%と12%のKLのばらつきを達成できた。
これらの結果は,大規模および動的学習シナリオに対する提案手法の堅牢性,拡張性,適合性を確認した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 21:10:49 GMT)
Multidimensional Rubric-oriented Reward Model Learning via Geometric Projection Reference Constraints [4.8] GPRC(Geometric Projection Reference Constraints)を用いたMR-RML(Multidimensional-oriented Reward Model Learning)を導入する。
提案手法は,(1)訓練パイプライン全体にドメイン固有のガイドラインを組み込んだ医療標準システム,(2)評価基準を分解する独立した多次元報酬モデル,(3)臨床認知論理を数学的正則化に変換する予測基準制約,の3つの重要なイノベーションを紹介する。
本手法はQwen-32Bモデルの性能を大幅に向上させ,完全部分集合では45%,ハード部分集合では85%向上させた。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 04:03:44 GMT)
Towards Robust and Fair Next Visit Diagnosis Prediction under Noisy Clinical Notes with Large Language Models [4.6] 本稿では,多種多様なテキスト破損シナリオ下での最先端の大規模言語モデル(LLM)の体系的研究について述べる。
臨床に根ざしたラベル推論手法と,臨床医の推論をエミュレートする階層的チェーン・オブ・シント(CoT)戦略を導入する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 10:40:36 GMT)
Probabilistic Bounds on the Number of Elements to Generate Finite Nilpotent Groups and Their Applications [4.3] varphi_k(G) ge 1 - $ if $k ge operatornamerank(G) + lceil log(2/) rceil$ (グループランクに基づく境界) あるいは $k ge operatornamelen(G) + lceil log (1/) rceil$ (グループチェーンの長さに基づく境界) が証明される。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 12:30:46 GMT)
Matching correlated VAR time series [4.1] 本稿では,一致するVAR時系列データベースの問題について検討する。
本稿では,2つの時系列$(x_t)_tin[T],(x#_t)_tin[T]$を共同生成する確率的フレームワークを提案する。
目的は$(x_t)_tin[T],(x#_t)_tin[T]$の観測から$*$を回収することである。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 17:47:55 GMT)
Tail Distribution of Regret in Optimistic Reinforcement Learning [4.0] 累積的後悔$R_K$ over $K$ エピソードのテール分布を,期待値や単一高確率量子化ではなく,特徴付ける。
提案したアルゴリズムは、期待される後悔と、その後悔がガウス以下の尾を示す範囲のバランスをとるチューニングパラメータ$$に依存する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 02:23:09 GMT)
Optimal Meal Schedule for a Local Nonprofit Using LLM-Aided Data Extraction [3.9] 本稿では,地域社会における食料不安全に対処する非営利団体であるPower Packs Projectと共同で開発されたデータ駆動パイプラインについて紹介する。
このシステムは、PDFからのデータ抽出、成分標準化のための大規模言語モデル、および15週間のレシピスケジュールを生成するバイナリ整数プログラミングを統合している。
全157のレシピは栄養データベースにマッピングされ、歴史的請求書データとカテゴリー別インフレーション調整を用いて推定および予測コストが割り当てられた。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:05:21 GMT)
RigAnyFace: Scaling Neural Facial Mesh Auto-Rigging with Unlabeled Data [3.9] RigAnyFace(RAF)は、さまざまなトポロジの顔メッシュのためのスケーラブルなニューラルネットワーク自動リグフレームワークである。
RAFは中立的な顔メッシュを業界標準のFACSのポーズに変形させ、表現力のあるブレンドシェープリグを形成する。
RAFは、アーティストが制作した資産だけでなく、現場のサンプルにも様々なトポロジを網羅し、精度と一般化性において過去の成果よりも優れています。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 19:55:08 GMT)
ReCoGS: Real-time ReColoring for Gaussian Splatting scenes [3.8] 本研究では,事前学習したガウススプラッティングシーン内の領域の正確な選択と再色を可能にする,ユーザフレンドリーなパイプラインを提案する。
また,実際にパイプラインを実験できるインタラクティブツールも提示する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 13:25:14 GMT)
Non-Linear Scoring Model for Translation Quality Evaluation [3.7] 分析翻訳品質評価(TQE)は、伝統的に1000-2000ワードの基準サンプルに校正された線形エラー対ペナルティ尺度を用いている。
本稿では, コンテンツ利用者が様々な長さのサンプルの翻訳品質をどう認識するかを反映した, 校正・非線形スコアリングモデルを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 22:43:55 GMT)
A Benchmark for Zero-Shot Belief Inference in Large Language Models [3.7] 本研究では,大規模言語モデルによる幅広いトピックに対する個人的姿勢の予測能力を評価するベンチマークを提案する。
個人に関する背景情報の提供により予測精度は向上するが,その性能は信仰領域によって大きく異なる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 21:13:20 GMT)
Z-Space: A Multi-Agent Tool Orchestration Framework for Enterprise-Grade LLM Automation [3.5] 本稿では,データ生成指向型マルチエージェント協調ツール実行フレームワークZ-Spaceを提案する。
このフレームワークはElemeプラットフォームの技術部門にデプロイされており、大規模なテストデータ生成シナリオを提供している。
生産データは、ツール推論における平均トークン消費を96.26%削減していることを示している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:59:14 GMT)
EgoVITA: Learning to Plan and Verify for Egocentric Video Reasoning [3.5] 構造化計画と検証を通じてMLLMの推論を可能にする強化学習フレームワークであるtextbfEgoVITA$を紹介した。
EgoVITAは、エゴセントリックな推論タスクにおいて、ベースラインのQwen2.5-VL-7Bを、EgoBlindで$mathbf+7.7$、EgoOrientで$mathbf+4.4$で上回っている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 01:25:17 GMT)
From Healthy Scans to Annotated Tumors: A Tumor Fabrication Framework for 3D Brain MRI Synthesis [3.3] 腫瘍形成(TF)は、3次元脳腫瘍合成のための新しい2段階のフレームワークである。
TFは完全に自動化されており、実際のアノテートされたデータの限られた量とともに、健康なイメージスキャンのみを活用する。
データ豊か化に用いた合成画像ラベルペアは,低データレギュレーションにおける下流腫瘍セグメンテーションタスクの性能を著しく向上させることができることを実証した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 23:28:49 GMT)
Re(Visiting) Time Series Foundation Models in Finance [3.3] 金融時系列予測は、トレーディング、ポートフォリオ最適化、リスク管理の中心である。
時系列基礎モデル(TSFM)の最近の進歩は、大規模で多様なデータセットから一般化可能な時間表現を学習するための新しいパラダイムを提供する。
本稿では,グローバル金融市場におけるTSFMの総合的研究について紹介する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:44:19 GMT)
Functional Localization Enforced Deep Anomaly Detection Using Fundus Images [3.1] 糖尿病網膜症と加齢黄斑変性は確実に検出されたが,緑内障は最も頻度の低い疾患であった。
GANomaly-based anomaly detector を開発し,AUC0.76を達成し,本質的な再構成に基づく説明可能性と無意味なデータへの堅牢な一般化を実現した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 21:56:40 GMT)
FOS: A Large-Scale Temporal Graph Benchmark for Scientific Interdisciplinary Link Prediction [3.0] 学際的な科学的ブレークスルーはほとんど予期せず現れ、新しい研究分野の形成を予測することは大きな課題である。
FOS(Future of Science)は、65,027のサブフィールドの年次共起グラフを再構成する、総合的なタイムアウェアグラフベースのベンチマークである。
これらのグラフでは、エッジは1つの出版物における2つのフィールドの共起を表し、対応する出版年とタイムスタンプされる。
我々は,時間的リンク予測タスクとして新たなフィールドペアリンクの予測を定式化し,学際的方向の先駆的な方向を示す「初回」接続を強調した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 22:08:52 GMT)
Utilizing Circulant Structure to Optimize the Implementations of Linear Layers [2.6] 対称暗号に使用される線形層を最適化するための新しい手法を提案する。
その結果、ブロック暗号の様々な線形層に対して、従来よりも性能が向上した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 00:05:06 GMT)
SafeCiM: Investigating Resilience of Hybrid Floating-Point Compute-in-Memory Deep Learning Accelerators [2.6] 本稿では,FP-CiMのハードウェア欠陥に対する脆弱性について検討し,ミッションクリティカルな設定において信頼性に大きな懸念を呈する。
本稿では, 耐故障性設計であるSafeCiMを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 01:06:01 GMT)
Reasoning With a Star: A Heliophysics Dataset and Benchmark for Agentic Scientific Reasoning [2.6] 今回,新たに提案されたレアソン・ウィズ・ア・スター(Reasoning With a Star)について紹介する。
我々のデータは、スターサマースクール問題セットによる大気研究リビングのためのNational Aeronautics and Space Administration & University Corporationから作成されています。
プログラムグレーダは、単位認識数値寛容、記号同値、スキーマ検証を用いて予測をチェックする。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:13:25 GMT)
Efficient Inference Using Large Language Models with Limited Human Data: Fine-Tuning then Rectification [2.5] 微調整と修正を併用したフレームワークを開発し,2段階にわたる限定ラベル付きサンプルを最適に割り当てる。
この知見に基づいて、実験的なスケーリング法則を利用して、微細調整と修正の段階でサンプルを最適に分割するデータ駆動手法を開発した。
実験的な分析により, 微調整と修正のみを用いた場合と比較して, 推定性能と推測性能が改善された。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:23:21 GMT)
"AGI" team at SHROOM-CAP: Data-Centric Approach to Multilingual Hallucination Detection using XLM-RoBERTa [2.4] 本稿では,SHROOM-CAP 2025の9言語にわたる科学的幻覚検出タスクについて述べる。
既存の5つのデータセットを統合して、124,821のサンプル(50%の正解、50%の幻覚)からなる総合的なトレーニングコーパスを作成します。
我々の結果は、体系的なデータキュレーションがアーキテクチャの革新を単独で著しく上回ることを示した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:48:27 GMT)
NeuroVascU-Net: A Unified Multi-Scale and Cross-Domain Adaptive Feature Fusion U-Net for Precise 3D Segmentation of Brain Vessels in Contrast-Enhanced T1 MRI [2.3] 我々は、T1CE MRIスキャンから直接脳血管構造を抽出するために設計された最初のディープラーニングアーキテクチャであるNeuroVascU-Netを提案する。
NeuroVascU-NetはDiceスコア0.8609、精度0.8841を達成し、主要な血管構造と微細血管構造の両方を正確に分類した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 12:23:20 GMT)
LLM Assisted Coding with Metamorphic Specification Mutation Agent [2.3] メタモルフィック関係は、意味論的に等価な突然変異を生成する基本的なメカニズムとして機能する。
CodeMetaAgent (CMA)は、タスク仕様を体系的に洗練し、セマンティックに制約されたテストケースを生成する。
我々のフレームワークはHumanEval-Pro、MBPP-Pro、SWE-Bench_Liteデータセットで評価されている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 02:30:34 GMT)
MagicWand: A Universal Agent for Generation and Evaluation Aligned with User Preference [2.3] textbfUniPrefer-100Kは,ユーザが好むスタイルを記述した画像,ビデオ,関連テキストのデータセットである。
次に、ユーザの好みに基づいてプロンプトを強化するユニバーサルな生成および評価エージェントであるtextbfMagicWandを提案する。
UniPreferBenchの実験では、MagicWandが一貫してユーザの好みに適合したコンテンツと評価を生成することを示した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 08:59:47 GMT)
Breaking Forgetting: Training-Free Few-Shot Class-Incremental Learning via Conditional Diffusion [2.2] 本研究では,従来の勾配更新処理を拡散に基づく生成遷移に置き換える条件拡散駆動型FSCILフレームワークを提案する。
また,大規模言語モデルによって自動生成される自然言語記述に視覚的特徴を統合するマルチモーダル学習戦略を導入する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:13:06 GMT)
SAMBA: Toward a Long-Context EEG Foundation Model via Spatial Embedding and Differential Mamba [2.1] 脳波(EEG)モデリングは、一般化可能な脳波表現モデルの開発に不可欠である。
我々は,マンバをベースとしたU字型エンコーダデコーダアーキテクチャを用いた自己教師型学習フレームワークであるtextitSAMBAを提案する。
SAMBAは、メモリ消費と推論時間を維持しながら、最先端の手法を一貫して上回ることを示す。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:31:18 GMT)
Weakly-supervised Latent Models for Task-specific Visual-Language Control [2.1] 本稿では,目標状態の監督のみを用いて,共有潜在空間における状態特異的な行動誘発シフトを学習するタスク固有潜在ダイナミクスモデルを提案する。
実験では、71%の成功を達成し、未知の画像や指示に一般化する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:18:28 GMT)
Attosecond-resolved quantum fluctuations of light and matter [1.9] 量子光学の概念をアト秒物理学に変換する。
我々は、XUV高調波とその関連するアト秒パルスの量子状態を、アト秒精度で再構成する。
電子とXUVのアト秒パルスの量子相関を測定する能力は、アト秒の量子電磁力学の基礎を確立する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:17:01 GMT)
Differential privacy with dependent data [1.9] We show that Winsorized mean estimator can be used under dependent for bounded data。
我々は,対数ソボレフ不等式による関節非有界観測への依存性を定式化する。
我々の研究は、依存データに対する差分プライバシー(DP)の体系的研究に向けた第一歩となる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:56:40 GMT)
A Unified BERT-CNN-BiLSTM Framework for Simultaneous Headline Classification and Sentiment Analysis of Bangla News [1.9] 本研究は,感情分析と合わせて,Banglaニュースの見出し分類に最先端のアプローチを提案する。
我々は9014ニュース見出しのBAN-ABSAというデータセットを探索した。
提案したBERT-CNN-BiLSTMは,分類タスクにおけるベースラインモデル全体の性能を著しく向上させる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 21:22:56 GMT)
From Reviewers' Lens: Understanding Bug Bounty Report Invalid Reasons with LLMs [1.9] 私たちは、9,942件のバグ報奨金を公表したデータセットを集めました。
我々は、最先端の大規模言語モデルが無効なレポートを識別できるかどうかを評価する。
我々は情報開示の脆弱性の理由の分類を作成し、それを検索強化された生成フレームワークに組み込む。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 20:27:54 GMT)
MultiDiffNet: A Multi-Objective Diffusion Framework for Generalizable Brain Decoding [1.7] textitMultiDiffNetは、複数の目的に最適化されたコンパクトな潜在空間を学習することで、生成的拡張を完全に回避する拡散ベースのフレームワークである。
我々は、この空間から直接デコードし、主観的およびセッション不整合性評価を用いて、様々なニューラルデコードタスクにまたがる最先端の一般化を実現する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:22:27 GMT)
KGpipe: Generation and Evaluation of Pipelines for Data Integration into Knowledge Graphs [1.5] 多様な情報源から高品質な知識グラフ(KG)を構築するには、情報抽出、データ変換、オントロジーマッピング、エンティティマッチング、データ融合の手法を組み合わせる必要がある。
既存のツールやLLM(Large Language Model)機能を組み合わせてパイプラインを定義し実行するための新しいフレームワークであるKGpipeを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:21:14 GMT)
Cross-Disciplinary Knowledge Retrieval and Synthesis: A Compound AI Architecture for Scientific Discovery [1.5] BioSageは、LLMをRAGと統合した新しい複合AIアーキテクチャで、AI、データサイエンス、バイオメディカル、バイオセキュリティドメインにわたる発見を可能にするために、特殊なエージェントとツールを編成した。
本システムでは,クエリ計画と応答合成を備えた検索エージェントを含む,複数の特殊エージェントを特徴とし,引用支援型応答を持つドメイン間の知識検索を実現する。
我々の研究は、チャート、表、構造化された科学データに対するマルチモーダル検索と推論に重点を置いており、また、クロスディシプリナ発見のための総合的なマルチモーダルベンチマークも開発している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:33:11 GMT)
An Analysis of Constraint-Based Multi-Agent Pathfinding Algorithms [1.5] 本研究では,将来のマルチエージェントパスフィンディング(MAPF)およびマルチロボットモーションプランニング(MRMP)アルゴリズムの設計について報告する。
我々は制約を保守的あるいは攻撃的と分類し、彼らの検索行動に関する洞察を提供する。
検索は決定フローチャートで合成され、適切な制約を選択するのに役立つ。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 20:11:47 GMT)
Evaluating perturbation robustnessof generative systems that use COBOL code inputs [1.3] 大きな言語モデル(LLM)をコンポーネントとして組み込んだシステムは、小さな入力のバリエーションに敏感であることが知られている。
本稿では,入力としてコードを用いるシステムのロバスト性を評価するためのフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:16:08 GMT)
Neural network approximation of regularized density functionals [1.3] 密度汎関数理論は、量子力学の最も効率的で広く使われている計算方法の1つである。
まず、モロー・ヨシダ正規化を適用して正確な汎函数を連続化する手順を提案する。
結果として生じるニューラルネットワークは、正確な機能に対する肯定性と凸性を保っている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:08:24 GMT)
Gradient Masters at BLP-2025 Task 1: Advancing Low-Resource NLP for Bengali using Ensemble-Based Adversarial Training for Hate Speech Detection [1.3] YouTubeコメントにサブタスク1A(ハッシュ型分類)と1B(ターゲットグループ分類)に対処するためのアンサンブルに基づく微調整戦略を提案する。
本稿では,ベースラインモデルより優れ,サブタスク1Aにおいて第6位を確保したバングラ言語モデルに対するハイブリッドアプローチを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:29:09 GMT)
CrossJEPA: Cross-Modal Joint-Embedding Predictive Architecture for Efficient 3D Representation Learning from 2D Images [1.2] 3次元表現学習における大規模3次元データセットの不足に対処するために、クロスモーダルなクロスモーダル学習が出現している。
画像基礎モデルの知識を生かしたシンプルなクロスモーダル共同埋め込み予測アーキテクチャであるCrossJEPAを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 12:40:04 GMT)
Beyond Binary Classification: A Semi-supervised Approach to Generalized AI-generated Image Detection [1.2] 現在の法医学における重大な脆弱性は、検出器がクロスジェネレータの一般化を達成できないことである。
本稿では,「フェイク」クラス内の潜在アーキテクチャパターンを発見することによって,バイナリ分類を強化する半教師付きアプローチを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:02:27 GMT)
QuantumChem-200K: A Large-Scale Open Organic Molecular Dataset for Quantum-Chemistry Property Screening and Language Model Benchmarking [1.2] 我々は、20万以上の有機分子からなる大規模データセットであるQuantumChem-200Kを紹介した。
これらの値は、密度関数理論(DFT)、半経験的励起状態法、原子論的量子解法、ニューラルネットワーク予測器を統合するハイブリッドワークフローを用いて計算される。
我々はQuantumChem-200Kを用いて、オープンソースのQwen2.5-32B大言語モデルを微調整し、SMILESからプロパティ予測を転送できる化学AIアシスタントを作成する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 02:33:06 GMT)
Privacy Concerns and ChatGPT: Exploring Online Discourse through the Lens of Information Practice on Reddit [1.2] 本研究は、Redditユーザーがプライバシーに関する懸念をまとめて交渉し、答える方法について考察する。
ポストは、r/Chatgpt、r/privacy、r/OpenAIという3つの主要なサブレディットから収集された。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:37:49 GMT)
Proactive Defense: Compound AI for Detecting Persuasion Attacks and Measuring Inoculation Effectiveness [1.2] 本稿では, 説得攻撃の有効性を検知し, 測定するために設計された, 複合AIアーキテクチャであるBRIESを紹介する。
本稿では, ターゲットの説得戦略を用いた敵対的コンテンツを生成するTwister, パラメータによる攻撃タイプを識別する検出器, コンテンツ接種による弾力性のあるコンテンツを生成するDefender, 因果推論を用いて接種効果を評価するアセスメントシステムを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:49:05 GMT)
Stage-Specific Benchmarking of Deep Learning Models for Glioblastoma Follow-Up MRI [1.1] 追従型MRIのための深層学習モデルの第1段階別横断的ベンチマークを行う。
アーキテクチャ性能がタイムポイントに依存するかどうかをテストするために,異なるポストRTスキャンを独立に解析する。
これらの結果は、時系列モデリング、マルチシーケンスMRI、より大規模なマルチセンターコホートを組み込んだステージアウェア・ベンチマークを確立し、今後の研究を動機付けている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 19:38:03 GMT)
Building Resilient Information Ecosystems: Large LLM-Generated Dataset of Persuasion Attacks [1.1] 生成AIモデルは、スピードとスケールで組織からの公式メッセージで競合する物語を形成する説得的コンテンツを生成することができる。
本稿では, GPT-4, Gemma 2, Llama 3.1 が生成する134,136件の攻撃を含む LLM 生成型大規模パーサー・アタック・データセットを提案する。
これらの攻撃はSemEval 2023 Task 3の23の説得的テクニックに及んでいる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:18:57 GMT)
Future Is Unevenly Distributed: Forecasting Ability of LLMs Depends on What We're Asking [1.1] 本研究では,モデルカットオフ日を超えて発生した事象に関する実世界の質問に対して,モデルファミリの異なるモデルファミリで,予測性能がどう変化するかを検討する。
我々は,文脈,質問タイプ,外部知識が精度やキャリブレーションにどのように影響するか,事実的ニュースコンテキストの追加が信念の形成や失敗モードをどう修正するかを分析する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 10:41:19 GMT)
PEFT-DML: Parameter-Efficient Fine-Tuning Deep Metric Learning for Robust Multi-Modal 3D Object Detection in Autonomous Driving [1.0] PEFT-DMLは、自律運転における堅牢な3次元物体検出のためのパラメータ効率の高いディープラーニングフレームワークである。
Low-Rank Adaptation (LoRA)とアダプタ層を統合することで、PEFT-DMLはトレーニング効率が大幅に向上する。
ベンチマーク nuScenes の実験では精度が優れている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:07:14 GMT)
GNSS Jammer Direction Finding in Dynamic Scenarios Using an Inertial-based Multi-Antenna System [0.9] ジャミング装置はグローバルナビゲーション衛星システム(GNSS)からの信号を妨害する
本稿では,2回のパッチアンテナシステムを用いて,ジャミング源の角度,高さ,距離を推定する。
プラットフォーム運動を用いたコヒーレントな空間画像撮影を可能にする合成開口システムを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 20:12:36 GMT)
Deep Learning Decision Support System for Open-Pit Mining Optimisation: GPU-Accelerated Planning Under Geological Uncertainty [0.7] 本研究では,長期露天採掘計画のための完全不確実性を考慮した最適化フレームワークを提案する。
地質的な不確実性は、5万の空間グレードのサンプルに基づいて訓練された変分オートエンコーダを用いてモデル化される。
その結果、IBM CPLEXよりも120万倍改善され、地質的な不確実性の下では予測されるNPVが大幅に向上した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:27:04 GMT)
Generative Myopia: Why Diffusion Models Fail at Structure [0.7] グラフ拡散モデル(GDM)は統計確率を最適化し、textbf frequency filters(英語版)として暗黙的に機能する。
我々は、この失敗がtextbfGradient Starvation によって引き起こされることを理論的、実証的に証明する。
textbfSpectrally-Weighted Diffusionを導入する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 19:27:13 GMT)
Dealing with the Hard Facts of Low-Resource African NLP [0.7] 本稿では,低資源西アフリカのバンバラにおける612時間の自然発話のフィールドコレクションについて報告する。
我々は,データ収集プロトコル,アノテーション,モデル設計の実践的提案と,人的評価の実施の重要性を示す証拠を提供する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:08:36 GMT)
Human Experts' Evaluation of Generative AI for Contextualizing STEAM Education in the Global South [0.6] Generative AI(GenAI)は、カリキュラム標準を学習者の文化的知識、コミュニティの実践、日々の経験にリンクすることで、文脈化されたSTEAM指導を支援する。
専門家らは、GenAI支援の授業を、標準的な授業計画よりも文化的に根ざし、教育的に反応するものとして評価した。
GenAIはガーナの文化的多元主義を表現するのに苦労し、しばしば言語、歴史、アイデンティティへの表面的な参照を提供した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 01:14:17 GMT)
From Archives to Decisions: Multi-Agent Pharmaceutical Co-Scientist for Traceable Drug Discovery and Reverse Translation [0.6] 医薬品研究・開発を支援する多エージェント共同研究者であるDiscoVerseを紹介する。
このシステムはロシュの大規模な歴史的コーパスに意味検索、クロスドキュメントリンク、監査可能な合成を実装している。
我々のアプローチを実世界の規模で検証するために、ロシュ研究レポジトリから180分子のサブセットを選択しました。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:17:26 GMT)
A Systematic Study of Compression Ordering for Large Language Models [0.6] 本研究では,Qwen2.5 3Bモデルに適用した場合の知識蒸留,構造化プルーニング,低ビット量子化の方法について系統的に検討する。
実験により、量子化は最大のスタンドアロン圧縮を提供する一方で、プルーニングは適度な品質劣化をもたらすことが示された。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 12:46:56 GMT)
General vs Domain-Specific CNNs: Understanding Pretraining Effects on Brain MRI Tumor Classification [0.6] 深部畳み込みニューラルネットワーク(CNN)は、医用画像処理タスクにおいて強力な性能を示している。
小さなデータセットしか利用できない場合、事前訓練されたモデルのどのタイプが優れているかは不明だ。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:31:41 GMT)
Bridging the Divide: Gender, Diversity, and Inclusion Gaps in Data Science and Artificial Intelligence Across Academia and Industry in the majority and minority worlds [0.5] この章では、AIとDSにおける女性やマイノリティの参加について検討し、産業とアカデミックの両方における彼らの代表性に焦点を当てている。
AIとDSにおける男性の優位性は、機械学習システムの性別バイアスを強化し、不平等のフィードバックループを生成する。
この不均衡は社会的・経済的正義の問題であり、価値主導の多様性を要求する倫理的課題である。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:09:31 GMT)
DHAuDS: A Dynamic and Heterogeneous Audio Benchmark for Test-Time Adaptation [0.4] 音声・音声分析におけるTTA (Test-Time Adaptation) 研究は、しばしば定型ないし不一致な雑音条件下でモデルを評価する。
本稿では,より現実的で多様な音響シフトの下でTTAアプローチを評価するためのベンチマークであるDHAuDSを提案する。
DHAuDSは、UrbanSound8K-C、SpeechCommandsV2-C、VocalSound-C、ReefSet-Cの4つの標準ベンチマークで構成されている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 12:19:23 GMT)
Forecasting AI Time Horizon Under Compute Slowdowns [0.4] 我々はOpenAIの計算予測に基づいて時間地平線成長を計画し、いくつかのケースでかなりの遅延を予測した。
例えば、1ヶ月の時間的地平線が80%$信頼性を持つのは、単純な傾向の補間が示唆するよりも7ドル遅れている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 10:46:10 GMT)
Developing an AI Course for Synthetic Chemistry Students [0.3] AI4CHEM(AI4CHEM)は、合成化学トラックの学生のための、事前のプログラミングの背景を持たない入門的なデータ駆動の化学試験コースである。
アセスメントは、コード誘導の宿題、ミニレビュー、そして学生がAI支援文学を構築する共同プロジェクトを組み合わせる。
すべてのコースの教材が公開されており、AIを合成化学トレーニングに統合するための、規律に固有の初心者アクセス可能なフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 01:39:11 GMT)
From Simulations to Surveys: Domain Adaptation for Galaxy Observations [0.3] 本稿では、TNG50銀河を模擬し、実SDSS銀河をモルフォロジーラベルで評価する予備的な領域適応パイプラインを提案する。
これらの損失とOTベースの"top_$k$ soft matching"損失を組み合わせることで、ドメインアライメントをさらに向上できることを示す。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 19:08:40 GMT)
Cavity magnomechanical framework for a high-efficiency quantum battery [0.2] 2つの同一の2レベル原子がキャビティ-磁気力学系によって充電される量子電池アーキテクチャについて検討する。
我々は、重要なパフォーマンス指標を強化するために、強い共鳴光-物質相互作用が不可欠であることを示す。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 13:23:54 GMT)
A Multimodal Conversational Agent for Tabular Data Analysis [0.2] 大規模言語モデル(LLM)は、音声対話を含むユーザとの対話において、ハイパフォーマンスを維持しながら、データ分析、可視化、解釈を扱うことで、情報処理を再構築することができる。
直感的データ探索のためのマルチモーダルLLM駆動型対話エージェントTalk2Dataを提案する。
このシステムでは、ユーザーは音声やテキストでデータセットをクエリし、プロット、テーブル、統計、音声による説明などの回答を受け取ることができる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 11:21:04 GMT)
Qudit-native simulation of the Potts model [0.2] クーディットシステムのためのスズキ・トロッター分解に基づくポッツモデルのシミュレーション手法を提案する。
その結果,多体モデルのQuditに基づくディジタル量子シミュレーションへの道が確立された。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 17:07:47 GMT)
Lean 5.0: A Predictive, Human-AI, and Ethically Grounded Paradigm for Construction Management [0.1] 本稿では、予測分析、AIコラボレーション、継続的学習を結びつけるリーン-デジタル統合の人間中心の進化であるLean 5.0を紹介します。
体系的な文献レビューと12週間の経験的検証研究は、測定可能なパフォーマンス向上を示している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 23:11:55 GMT)
ioPUF+: A PUF Based on I/O Pull-Up/Down Resistors for Secret Key Generation in IoT Nodes [0.1] ioPUF+はIC(Integrated Circuits)とそれを含むIoTノードのためのユニークな指紋を生成する。
PUFはICのI/Oピン上のプルアップ抵抗値とプルダウン抵抗値を測定してデバイス固有の応答を生成する。
ioPUF+には、生のPUF応答を暗号的に使用可能な秘密鍵に変換する完全なデータパスが含まれている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 11:55:22 GMT)
Fusing Biomechanical and Spatio-Temporal Features for Fall Prediction: Characterizing and Mitigating the Simulation-to-Reality Gap [0.1] 転倒は、高齢者の怪我や独立の喪失の主な原因である。
視覚に基づく落下予測システムは、衝突のほんの数秒前に落下を予測する非侵襲的な解決策を提供する。
本研究では,ポーズ情報と生体力学情報を組み合わせた二重ストリームモデルであるBioST-Temporal Graph Conal Network(BioST-GCN)を提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 19:30:21 GMT)
DL-CapsNet: A Deep and Light Capsule Network [0.1] いくつかのカプセル層からなるCapsNetの深いバリエーションを提案する。
DL-CapsNetは非常に正確だが、少数のパラメータを使用し、より高速なトレーニングと推論を提供する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:45:11 GMT)
Robust Differential Evolution via Nonlinear Population Size Reduction and Adaptive Restart: The ARRDE Algorithm [0.0] ARRDE は LSHADE アルゴリズム上に構築され,jSO の鍵機構を組み込んだ非線形人口削減戦略を導入している。
ARRDEは、考慮されたすべてのベンチマークスイートの中で、トップレベルのパフォーマンスを一貫して示す。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 12:50:25 GMT)
Universality in Collective Intelligence on the Rubik's Cube [0.0] 我々はルービックキューブをパズルの解き方、スキル学習、専門知識、文化伝達、グループ理論の共通点に存在する認知モデルシステムとして利用する。
ルービックキューブの集合的学習における普遍性の証拠は、目視と目視の両方の条件で見つかる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 20:30:38 GMT)
Vision Token Masking Alone Cannot Prevent PHI Leakage in Medical Document OCR: A Systematic Evaluation [0.0] 視覚言語モデル(VLM)は、医療環境における光学的文字認識(OCR)のためにますます多くデプロイされている。
本研究は、DeepSeek-OCRを用いた医療文書OCRのプライバシー保護機構として、推論時視覚トークンマスキングを初めて体系的に評価したものである。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:45:22 GMT)
Unified Deep Learning Platform for Dust and Fault Diagnosis in Solar Panels Using Thermal and Visual Imaging [0.0] 太陽エネルギーは、将来の大きなポテンシャルを持つ再生可能エネルギーの最も豊富でテーピングされた源の1つである。
我々は,太陽パネル上の塵や断層の検出モデルを実装した。
これら2つのアプリケーションは、単一プラットフォームとして集中化されており、ルーチン保守やその他のチェックに使用できる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:09:37 GMT)
Tunable Bands in 1D Fractional Quantum Media [0.0] 我々は、レヴィ指数$q$がエネルギーバンドの形成と反転をいかに支配するかを研究する。
レヴィ指数は、帯域反転を駆動し、バンドギャップを変調し、キャリアダイナミクスを再構成できる調整可能な自由度として機能する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:36:51 GMT)
Tu crois que c'est vrai ? Diversite des regimes d'enonciation face aux fake news et mecanismes d'autoregulation conversationnelle [0.0] TwitterとFacebookで2つの研究を行い、デジタルトレースの定量的分析とオンライン観察とインタビューを組み合わせた。
最初の調査では、フランスのTwitter圏でファクトチェッカーが偽のラベルを付けたアイテムを少なくとも1つシェアしたユーザーを地図化した。
2つ目は、Facebookユーザーが警告した項目のコーパスを使用して、認識的ステータスが不確実なステートメントに対する反応を研究した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:28:16 GMT)
Toward Trustworthy Difficulty Assessments: Large Language Models as Judges in Programming and Synthetic Tasks [0.0] 大規模言語モデル(LLM)は、自然言語とコード生成において印象的な能力を示している。
LLMは、モデル出力と学習活動の自動判断として、ますます多くデプロイされている。
自然言語の難易度評価器として純粋に使用される GPT-4o と,明示的な数値的特徴とテキスト的特徴を訓練した解釈可能な Light-GBM アンサンブルを比較した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 19:39:44 GMT)
The Locally Deployable Virtual Doctor: LLM Based Human Interface for Automated Anamnesis and Database Conversion [0.0] MedChatは、AI支援臨床解剖のための、ローカルにデプロイ可能な仮想医師フレームワークである。
既存のクラウドベースシステムとは異なり、この研究は、完全にオフラインで、ローカルにデプロイ可能なLCM拡散フレームワークが臨床解剖に有効であることを示す。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 22:12:35 GMT)
The Catastrophic Paradox of Human Cognitive Frameworks in Large Language Model Evaluation: A Comprehensive Empirical Analysis of the CHC-LLM Incompatibility [0.0] 平均的な人間のIQスコアを達成するモデルは、結晶化された知識タスクにおいてゼロに近づいた二分精度を同時に示す。
この切断は、結晶化されたインテリジェンス領域において最も強く現れる。
人工知能の非人間性を認識するネイティブマシン認識アセスメントを開発するための枠組みを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:49:57 GMT)
Teleportation-based quantum state tomography [0.0] 量子テレポーテーションプロトコルを用いて任意の2ビットと3ビットの密度行列を再構成できることを示す。
テレポーテーションベースの量子状態トモグラフィープロトコルを実装するために必要な唯一の量子リソースはベル測定を行う能力である。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 21:32:38 GMT)
Table Comprehension in Building Codes using Vision Language Models and Domain-Specific Fine-Tuning [0.0] 建設コードには、安全、規制の遵守、建設と工学における情報的意思決定を保証する重要な情報が含まれている。
このタスクには,情報検索の精度と言語モデルの生成能力を組み合わせるため,RAG(Retrieval-Augmented Generation)システムが必要である。
本稿では,複数の事前学習された視覚言語モデル(VLM)を用いて,建築コードの表データから情報を抽出する2つの手法について検討・比較する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 06:34:51 GMT)
Stro-VIGRU: Defining the Vision Recurrent-Based Baseline Model for Brain Stroke Classification [0.0] 脳卒中早期発見のための事前訓練型視覚変換器を用いた伝達学習フレームワークを提案する。
ViTモデルのいくつかのエンコーダブロックは凍結され、残りは脳卒中特有の特徴を学習するために微調整される。
このモデルはストロークデータセットから脳卒中を分類する際に94.06%の精度を達成した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:09:56 GMT)
Strategic Decision Framework for Enterprise LLM Adoption [0.0] 大規模言語モデル(LLM)は、コンテンツ生成、コーディング支援、プロセス自動化に強力な機能を提供する。
本稿では,LSM導入のための系統的な6段階決定フレームワークについて述べる。
ビジネスリーダが技術的能力とビジネス目標を整合させるための実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 19:05:52 GMT)
Steering Latent Traits, Not Learned Facts: An Empirical Study of Activation Control Limits [0.0] 大規模言語モデル(LLM)は、多様なアプリケーションにまたがる安全かつ効果的なデプロイメントのために、正確な振る舞い制御を必要とする。
本研究では, ステアリングの有効性が, 異なる行動種によってどのように異なるのか, 対象行動の性質がステアリングの成功を予測することができるのか, という課題に焦点をあてる。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 04:28:41 GMT)
Robust Inference Methods for Latent Group Panel Models under Possible Group Non-Separation [0.0] 本稿では,線形パネルデータモデルにおける一般線形仮説に対する頑健な推論手法を提案する。
データから推定される群構造から条件分布係数推定を導出する選択的条件推論手法を用いる。
我々はモンテカルロシミュレーションによるアプローチの有効性を実証し,その手法を2つのデータセットに適用する: (i)所得と民主主義の関係, (ii)法人レベルの研究開発投資の循環性。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 17:41:30 GMT)
RegDeepLab: A Two-Stage Decoupled Framework for Interpretable Embryo Fragmentation Grading [0.0] 本研究では,マルチタスク学習(MTL)フレームワークであるRegDeepLabを提案し,ステート・オブ・ザ・アーツ(SOTA)セマンティックセグメンテーション(DeepLabV3+)とマルチスケール回帰ヘッドを統合する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 13:50:49 GMT)
Real-Time Personalized Content Adaptation through Matrix Factorization and Context-Aware Federated Learning [0.0] 本研究では,ソーシャルメディアプラットフォームにおけるユーザインタラクションとコンテンツ関連性を高めるための多面的アプローチを提案する。
パーソナライズされたLLMフェデレーション学習モデルとコンテキストベースのソーシャルメディアモデルを導入する。
主要なモジュールは、ユーザー生成コンテンツの分類、ユーザーペルソナスコアの計算、友人ネットワークからの関連投稿の特定に重点を置いている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:18:11 GMT)
Radiation-Preserving Selective Imaging for Pediatric Hip Dysplasia: A Cross-Modal Ultrasound-Xray Policy with Limited Labels [0.0] 当科では, 必要なときにのみX線撮影を要求できる, 進行性股関節異形成症(DDH)に対する超音波第1次放射線治療方針について検討した。
超音波予測における一側共形推論則を校正し, 交換性下でのサンプルカバレッジを有限に保証する。
我々は,リミテッドラベルを,臨床ハンドオフに適した解釈可能な測定値と選択的画像曲線に変換する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 13:59:32 GMT)
RFX: High-Performance Random Forests with GPU Acceleration and QLORA Compression [0.0] RFX (Random Forests X) は、X が圧縮または量子化の略であり、Python で Breiman と Cutler の Random Forest 分類方法論のプロダクション対応の実装を提供する。
RFX v1.0は完全な分類を提供する:out-of-bagエラー推定、総合的および局所的重要度測定、QLORA圧縮による近接行列、ケースワイズ分析、インタラクティブ可視化(rfviz)。
回帰、教師なし学習、CLIQUEの重要性、RF-GAP近接はv2.0で計画されている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 12:00:33 GMT)
Prompt Optimization as a State-Space Search Problem [0.0] 言語モデルは、インプットプロンプト文字列に小さな変更を加えることで、パフォーマンスの崩壊の影響を受けやすい。
本稿では,従来の状態空間探索問題として即時最適化を扱う代替手法を提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 21:24:13 GMT)
Progressive Localisation in Localist LLMs [0.0] 本稿では,解釈可能な大規模言語モデルを作成する上で,プログレッシブローカライゼーションが最適アーキテクチャであることを示す。
私たちの重要な発見は、レイトレイヤのローカライゼーションがAIの安全性アプリケーションに不可欠であることです。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:49:13 GMT)
Physics-Guided Deep Learning for Heat Pump Stress Detection: A Comprehensive Analysis on When2Heat Dataset [0.0] 本稿では, 熱ポンプ応力分類のための新しい物理誘導型ディープニューラルネットワーク(PG-DNN)を提案する。
この手法は、物理誘導された特徴選択とクラス定義をディープニューラルネットワークアーキテクチャと統合する。
このモデルは78.1%のテスト精度と78.5%の検証精度を達成し、ベースラインアプローチよりも大幅に改善された。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:50:47 GMT)
Path-Constrained Retrieval: A Structural Approach to Reliable LLM Agent Reasoning Through Graph-Scoped Semantic Search [0.0] 本稿では,構造グラフ制約と意味探索を組み合わせた検索手法であるPath-Constrained Retrieval(PCR)を提案する。
PCRは、基準法では24-32%に比べて完全な構造整合性を実現し、高い関連性スコアを維持している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 06:50:01 GMT)
Parallel qMRI Reconstruction from 4x Accelerated Acquisitions [0.0] コイル感度マップを共同で推定し、4倍の加速で、アンダーサンプリングされたk空間測定のみから画像を再構成するエンド・ツー・エンドのディープラーニングフレームワークを提案する。
心エコーが8例の被験者10名のマルチコイル脳MRIデータに対して,2倍のSENSE再構成を基礎的真実として検討した。
提案手法は,PSNR/SSIM値が低いにもかかわらず,従来のSENSE出力に比べて視覚的にスムーズな再構成を実現する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 00:45:05 GMT)
OpenGloss: A Synthetic Encyclopedic Dictionary and Semantic Knowledge Graph [0.0] OpenGlossは、英語の合成百科事典辞書と意味知識グラフである。
語彙的定義、百科事典的文脈、語源的歴史、統一リソースにおける意味的関係を統合する。
全資源は1週間以内に1,000ドル以下で生産された。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 21:33:53 GMT)
OpenCML: End-to-End Framework of Open-world Machine Learning to Learn Unknown Classes Incrementally [0.0] 提案モデルは,オープンかつ継続的な学習環境において,新しい学習クラスを提供する。
平均精度は4回で82.54%、最小精度は65.87%である。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 10:27:19 GMT)
On Addressing Isolation in Blockchain-Based Self-Sovereign Identity [0.0] 自己主権アイデンティティ(Self-Sovereign Identity、SSI)は、保有者がデジタルアイデンティティの完全な所有と管理を許可するものである。
SSIは、プライバシ保護機構を含むクレームの検証を可能にする。
残念ながら、ブロックチェーンはほとんどがサイロ化されており、SSIの相互運用性と普遍性に影響を与える。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 09:57:25 GMT)
Nonlinear stochastic and quantum motion from Coulomb forces [0.0] 制御可能な非線形性は 量子粒子間の自然力と基本力によって 常に到達したかもしれない
補助線形力によりクーロン力の調和部を除去した後、残りの相反非線形部は直接観測可能な非相反非線形効果をもたらすことを示す。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 08:42:29 GMT)
Non-Hermitian topology in a single driven-dissipative Kerr-Cat qubit [0.0] 最近の研究は、非エルミート物理学を完全量子領域に拡張している。
我々は、Kerr非線形共振器を用いて実現した、駆動散逸性Kerr-cat量子ビットの例外構造について検討する。
我々の研究は、連続変数量子システムで非エルミート現象を実現する可能性を開く。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:00:31 GMT)
NSTR: Neural Spectral Transport Representation for Space-Varying Frequency Fields [0.0] Inlicit Neural Representations (INR)は、画像、オーディオ、三次元シーンなどの信号を表現するための強力なパラダイムとして登場した。
我々は,空間的に変化する局所周波数場を可視化する最初のINRフレームワークであるtextbfNeural Spectral Transport Representation (NSTR)を提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 10:24:12 GMT)
Machine Learning by Adiabatic Evolutionary Quantum System [0.0] 我々は、これらのAEQSを量子的にトレーニングすることで、特定の機械学習タスクを達成する効率的な方法を研究する。
我々は、量子カウント、量子振幅推定、量子近似のためのよく知られた量子アルゴリズムを概ね活用する基本的なアイデアを開発する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:27:09 GMT)
LungX: A Hybrid EfficientNet-Vision Transformer Architecture with Multi-Scale Attention for Accurate Pneumonia Detection [0.0] 肺炎は、タイムリーな診断が重要な世界的な死亡原因である。
我々は,EfficientNetのマルチスケール機能,CBAMアテンション機構,Vision Transformerのグローバルコンテキストモデリングを組み合わせた,新しいハイブリッドアーキテクチャであるLungXを紹介する。
LungXは最先端のパフォーマンス(86.5%の精度、0.943のAUC)を達成し、効率の良いNet-B0ベースラインよりも6.7%のAUCを改善した。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 12:44:13 GMT)
KAN vs LSTM Performance in Time Series Forecasting [0.0] 本稿では,KAN(Kolmogorov-Arnold Networks)とLSTM(Long Short-Term Memory Network)を比較し,非決定論的株価データを予測する。
LSTMは、全ての試験された予測地平線に対してかなりの優位性を示す。
LSTMの実践的な財務予測への採用を支援するとともに、特化KANアーキテクチャの継続的な研究が今後の改善をもたらす可能性があることを示唆している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 21:09:58 GMT)
In Search of Goodness: Large Scale Benchmarking of Goodness Functions for the Forward-Forward Algorithm [0.0] フォワードフォワード(FF)アルゴリズムは、バックプロパゲーションの生物学的に妥当な代替手段を提供する。
現在の実装は主に単純な2乗和の計量を利用する。
4つの標準画像データセットで21の良さ関数をベンチマークした。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:24:35 GMT)
Hybrid Agentic AI and Multi-Agent Systems in Smart Manufacturing [0.0] 本稿では,複合エージェントAIとマルチエージェントフレームワークを,規範的メンテナンスユースケースに適用する。
提案するフレームワークは、認識層、前処理層、分析層、最適化層からなる階層アーキテクチャを採用している。
特殊エージェントは、スキーマ発見、インテリジェントな特徴分析、モデル選択、規範最適化を自律的に処理する。
最初の概念実証は、2つの工業生産データセットで検証される。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 03:06:23 GMT)
HQPEF-Py: Metrics, Python Patterns, and Guidance for Evaluating Hybrid Quantum Programs [0.0] 本研究では,ハイブリッド量子プログラムを独立したデバイスやアルゴリズムではなく,エンドツーエンドとして評価する方法を検討する。
ワークフロー対応の量子可読度(QRL)スコアを定式化し、量子性(UQ)の品質制約の下で正規化スピードアップを定義する。
これらの定義を、メトリクスと監査手順のインスタンス化方法を示す簡潔なPythonリファレンス実装で補完します。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:47:43 GMT)
General Machine Learning Algorithm for Quantum Teleportation [0.0] 本稿では,任意のシステムに量子テレポーテーションを実装するために最適なユニタリ演算子を作成できる汎用アルゴリズムを提案する。
単一および複数キュービット状態,コヒーレント状態,ディック状態,および先行分布と不等次元を持つ系に対して,これらを集合スピンモデルで説明し,その汎用性を実証する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:11:01 GMT)
Foundations of Artificial Intelligence Frameworks: Notion and Limits of AGI [0.0] 人工知能は、スケールに関係なく、現在のニューラルネットワークパラダイムから生まれない、と我々は主張する。
本稿では,既存の施設(計算基板)と建築組織を区別する枠組みを提案する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:18:13 GMT)
For Those Who May Find Themselves on the Red Team [0.0] このポジションペーパーでは、文学者は大きな言語モデル(LLM)の解釈可能性の研究に携わる必要があると論じている。
この闘争が起こる可能性のあるサイトのひとつが、赤いチームだ、と私は思う。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:31:03 GMT)
Extreme Model Compression for Edge Vision-Language Models: Sparse Temporal Token Fusion and Adaptive Neural Compression [0.0] 2つの適応圧縮技術は、アルゴリズムの革新とハードウェア対応の最適化を統合するために提案されている。
イベントベースの視覚タスクでは、STTFは平均トークン数を84%削減する。
ANCは低モーションシーンでFLOPを最大90%カットする。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 15:43:00 GMT)
Discrete Action, Graph Evolution, and the Hierarchy of Symmetries: A Rigorous Construction of Temporal Layers $C1 \to C2 \to C3 \to C4$ [0.0] 我々は、離散周期を$_N=Nhbar/E$とする時間層$C N$の厳密な階層を構築する。
各層は構成空間、シンプレクティック構造、更新規則、創発対称性によって指定される。
これらの構造は離散的な作用原理に従っており、グラフの成長は自然に非一貫性と自発的対称性の破れのメカニズムを提供する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 05:25:00 GMT)
Crash-Consistent Checkpointing for AI Training on macOS/APFS [0.0] 本稿では,AIトレーニングにおけるチェックポイントインストールプロトコルと整合性検証の実験的検討を行う。
unsafe(ベースライン、fsyncなし)、Atomic_nodirsync(fsync()経由のファイルレベルの耐久性)、Atomic_dirsync(file + ディレクトリの耐久性)の3つの書き込みモードを実装しています。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 07:29:06 GMT)
Comparison of Text-Based and Image-Based Retrieval in Multimodal Retrieval Augmented Generation Large Language Model Systems [0.0] 本稿では,マルチモーダルRAGシステムにおける2つの検索手法の比較分析を行う。
直接マルチモーダル埋め込み検索は、LLM-summary-based approachよりも大幅に優れている。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 00:38:47 GMT)
Coherent Multi-Agent Trajectory Forecasting in Team Sports with CausalTraj [0.0] CausalTrajは時間的因果関係に基づくモデルであり、共同で予測可能なマルチエージェント軌道予測を生成する。
NBAスポーツVU、バスケットボールU、フットボールUのデータセットで評価された。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 02:24:20 GMT)
Categorical Equivariant Deep Learning: Category-Equivariant Neural Networks and Universal Approximation Theorems [0.0] 我々は、カテゴリー同変ニューラルネットワーク(CENN)の理論を開発する。
CENNはグループ/グループ-同変ネットワーク、ポーズ/格子-同変ネットワーク、グラフとせん断ニューラルネットワークを統一する。
グループ/グループ、ポーズ/ラテックス、グラフ、セルシーブのフレームワークをインスタンス化する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 12:07:45 GMT)
Bridging Philosophy and Machine Learning: A Structuralist Framework for Classifying Neural Network Representations [0.0] 本稿では,機械学習研究における暗黙的な存在論的コミットメントを分類するための構造論的決定枠組みを開発する。
修正されたPRISMAプロトコルを用いて、表現学習と解釈可能性に関する過去20年間の文献を体系的にレビューする。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 22:19:43 GMT)
BitRL-Light: 1-bit LLM Agents with Deep Reinforcement Learning for Energy-Efficient Smart Home Lighting Optimization [0.0] BitRL-Lightはエッジデバイス上でのリアルタイムスマートホーム照明制御のための新しいフレームワークである。
本手法では,Raspberry Piハードウェア上で1ビット量子化Llama-3.2-1Bモデルをデプロイし,全精度モデルに比べて71.4倍のエネルギー削減を実現している。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 16:18:07 GMT)
Barriers to AI Adoption: Image Concerns at Work [0.0] 私は、労働者がAIへの依存が評価者に見える場合、低いレートでAIレコメンデーションを採用することに気付きました。
労働者がAIに大きく依存することを恐れていることが、労働者自身の判断に対する自信の欠如を示唆していることを示す、インセンティブに適合する新しい方法を紹介します。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 18:50:34 GMT)
A Quantum-Classical Hybrid Branch & Bound Algorithm [0.0] 等式制約のある線形プログラムを解くために,完全量子古典ハイブリッド分岐結合アルゴリズム(QCBB)を提案する。
設定されたパーティショニング問題インスタンスについて数値的な結果を示し、アルゴリズムの異なるステップの特徴について多くの詳細を提供する。
論文参考訳(メタデータ) (Sun, 23 Nov 2025 17:44:03 GMT)