Multimodal Evaluation of Russian-language Architectures [89.1] 本稿では,ロシアの建築におけるオープンなマルチモーダル評価フレームワークであるMera Multiを紹介する。
ベンチマークはインストラクションベースで、デフォルトのテキスト、画像、オーディオ、ビデオモダリティを含んでいる。
Mera Multiは、マルチモーダルベンチマークを構築するための複製可能な方法論を提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:43:53 GMT)
A Comprehensive Study on Visual Token Redundancy for Discrete Diffusion-based Multimodal Large Language Models [85.3] 我々は,異なるdMLLMアーキテクチャとタスクを用いて,視覚的トークン冗長性がどのように進化するかを検討する。
本研究により, 視覚的冗長性は, 長時間のタスクを処理しながら, オフスクラッチdMLLMでのみ現れることが明らかとなった。
層スキッピングはAR-to-diffusion dMLLMの加速に有効であるのに対し、プログレッシブプルーニングやレイトステッププルーニングはストクラッチdMLLMよりも効果的である。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:13:36 GMT)
DiffuGR: Generative Document Retrieval with Diffusion Language Models [80.8] 本稿ではDiffuGRと呼ばれる拡散言語モデルを用いた生成文書検索を提案する。
推論のために、DiffuGRはDocIDトークンを並列に生成し、制御可能な多数のデノナイジングステップを通じてそれを洗練しようと試みている。
従来の左から右への自動回帰デコーディングとは対照的に、DiffuGRはより信頼性の高いDocIDトークンを生成するための新しいメカニズムを提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:32:27 GMT)
CKDA: Cross-modality Knowledge Disentanglement and Alignment for Visible-Infrared Lifelong Person Re-identification [77.1] 生涯にわたる人物再識別は、異なるシナリオから継続的に収集された個々のデータを同一人物と一致させることを目的としている。
日夜の連続した日中マッチングを実現するために、Visible-Infrared Lifelong person Re-IDentification (VI-LReID) は、可視および赤外線モダリティからのデータのシーケンシャルトレーニングに重点を置いている。
既存の方法は、伝統的知識の破滅的な忘れを和らげるために、クロスモーダルな知識蒸留を利用するのが一般的である。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 01:30:29 GMT)
DEPO: Dual-Efficiency Preference Optimization for LLM Agents [75.7] 本稿では、簡潔な応答とアクションステップの低減を両立させる二重効率優先最適化手法DEPOを提案する。
WebShopとBabyAIの実験によると、DECOはトークンの使用量を最大60.9%削減し、ステップを最大26.9%削減し、パフォーマンスは最大29.3%向上した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:38:43 GMT)
Edge-Centric Relational Reasoning for 3D Scene Graph Prediction [74.2] 3Dシーングラフ予測は、複雑な3D環境をオブジェクトとそのペア関係からなる構造化グラフに抽象化することを目的としている。
既存のアプローチでは、接続されたオブジェクトノードからメッセージを集約することで、関係エッジ機能を反復的に更新するオブジェクト中心のグラフニューラルネットワークが一般的である。
本稿では,オブジェクト認識融合を用いたリンク誘導エッジ中心関係推論フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:53:56 GMT)
StreamingTalker: Audio-driven 3D Facial Animation with Autoregressive Diffusion Model [73.3] 音声駆動型3D顔アニメーションは、音声入力によって駆動される現実的で同期された顔の動きを生成することを目的としている。
近年,3次元顔アニメーションに音声条件拡散モデルが採用されている。
本稿では,ストリーミング方式で音声を処理する自己回帰拡散モデルを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:20:19 GMT)
Boosting In-Silicon Directed Evolution with Fine-Tuned Protein Language Model and Tree Search [67.2] 大規模言語モデルの革新的パラダイムを活用することにより,タンパク質配列を最適化する新しいフレームワークであるAlphaDEを提案する。
第一に、AlphaDEファインチューンは、タンパク質配列のマスク言語モデルを用いて、関心のあるタンパク質クラスの進化的妥当性を活性化するタンパク質言語モデルである。
第二に、AlphaDEはモンテカルロ木探索に基づくテスト時間推論を導入し、微調整されたタンパク質言語モデルからの進化誘導でタンパク質を効果的に進化させる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:00:47 GMT)
Generating Natural-Language Surgical Feedback: From Structured Representation to Domain-Grounded Evaluation [66.8] 外科的トレーナーからの高品質なフィードバックは,訓練者のパフォーマンス向上と長期的スキル獲得に不可欠である。
本稿では,実際の訓練者-訓練者間の文書から外科的行動オントロジーを学習する構造対応パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:19:34 GMT)
$π^{*}_{0.6}$: a VLA That Learns From Experience [66.8] 我々は、強化学習(RL)による実世界の展開を通して、視覚言語アクション(VLA)モデルがどのように改善できるかを検討する。
本稿では,Advantage- Conditioned Policies (RECAP) を用いた汎用RL法について述べる。
フルRECAP法でトレーニングした*_0.6$モデルは、実際の家庭で洗濯物を折り畳み、箱を確実に組み立て、プロのエスプレッソマシンを使ってエスプレッソドリンクを作ることができる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:34:49 GMT)
FlashMesh: Faster and Better Autoregressive Mesh Synthesis via Structured Speculation [65.3] FlashMeshは高速かつ高忠実なメッシュ生成フレームワークである。
我々は、FlashMeshが標準の自己回帰モデルよりも最大2倍のスピードアップを達成することを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:03:49 GMT)
Driving in Spikes: An Entropy-Guided Object Detector for Spike Cameras [62.9] スパイクカメラは、マイクロ秒のレイテンシとオブジェクト検出のための超高ダイナミックレンジを提供する。
希少で離散的な出力は標準画像ベースの検出器では処理できない。
デュアルブランチ設計によるエンド・ツー・エンドのスパイクカメラ検出器EASDを提案する。
DSEC Spikeは、最初の駆動指向シミュレートされたスパイク検出ベンチマークである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:16:17 GMT)
SafeRBench: A Comprehensive Benchmark for Safety Assessment in Large Reasoning Models [60.9] LRMの安全性をエンドツーエンドに評価する最初のベンチマークであるSafeRBenchを紹介する。
私たちは、リスクカテゴリとレベルを入力設計に組み込んだ先駆者です。
我々は,長い推論トレースを意味的に一貫性のある単位にセグメント化するためのマイクロシンクのチャンキング機構を導入する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:46:33 GMT)
Critical or Compliant? The Double-Edged Sword of Reasoning in Chain-of-Thought Explanations [60.3] 系統的な推論連鎖の摂動とデリバリートーンの操作による道徳シナリオにおけるCoT(Chain-of-Thought)の説明の役割について検討した。
1) 利用者は, 根拠に欠陥がある場合でも, 信頼感を保ち, 結果合意を信頼する傾向がみられた。
これらの結果は、CoTの説明が同時に明確化と誤解を招き、視覚的信頼よりも精査と批判的思考を奨励する説明を提供するNLPシステムの必要性を強調している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:49:39 GMT)
When to Think and When to Look: Uncertainty-Guided Lookback [60.0] 長い鎖は多くの場合、画像を無視した長い間違った軌跡を生み出します。
より深い分析により、画像に明示的に言及する短い振り返り句が、成功した軌跡に強く富んでいることが明らかとなった。
本研究では,不確実性信号と適応的なルックバックプロンプトと広帯域探索を組み合わせた学習自由復号法である不確実性ガイド付きルックバックを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:01:02 GMT)
GeoVista: Web-Augmented Agentic Visual Reasoning for Geolocalization [53.1] エージェント視覚推論に関する最近の研究は、深いマルチモーダル理解を可能にするが、主に画像操作ツールに焦点を当てている。
そこで本研究では,視覚的グラウンディングだけでなく,仮説の検証や修正のためにWeb検索も必要とするジオローカライゼーションタスクを再考する。
既存のジオローカライゼーションベンチマークは、高解像度画像の必要性と深部エージェント推論の局所化課題を満たすことができないため、GeoBenchをキュレートする。
推論ループ内にツールの実行をシームレスに統合するエージェントモデルであるGeoVistaを提案し,興味のある領域を拡大するイメージズームインツールと関連する領域を検索するWeb検索ツールを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:59:22 GMT)
LLM-MemCluster: Empowering Large Language Models with Dynamic Memory for Text Clustering [52.4] 大規模言語モデル(LLM)は、テキストクラスタリングを行う前例のない能力を提供することで、教師なしの学習を再構築している。
既存のメソッドは、しばしば外部モジュールを持つ複雑なパイプラインに依存し、真にエンドツーエンドのアプローチを犠牲にする。
LLM-MemClusterは,クラスタリングをLLMネイティブタスクとして再認識する新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:22:08 GMT)
GRPO-RM: Fine-Tuning Representation Models via GRPO-Driven Reinforcement Learning [52.2] 我々は、表現モデル(GRPO-RM)のためのグループ相対ポリシー最適化を提案する。
我々の手法は,大規模言語モデル(LLM)におけるトークンシーケンスサンプリングを機能的に置き換えるための事前定義された出力セットを確立する。
特殊報酬関数は表現モデルの性質を満たすように設計されている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:19:39 GMT)
GEO-Bench-2: From Performance to Capability, Rethinking Evaluation in Geospatial AI [52.1] GeoFMは地球観測を変革しているが、評価には標準化されたプロトコルが欠けている。
GEO-Bench-2は、分類、セグメンテーション、回帰、オブジェクト検出、インスタンスセグメンテーションにまたがる包括的なフレームワークでこの問題に対処する。
GEO-Bench-2のコード、データ、およびリーダーボードは、パーミッシブライセンスの下で公開されている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:45:02 GMT)
MoDES: Accelerating Mixture-of-Experts Multimodal Large Language Models via Dynamic Expert Skipping [52.0] 我々は,MoE MLLM推論を効果的かつ正確なものにするために,専門家を適応的にスキップする最初のトレーニングフリーフレームワークであるMoDESを提案する。
MoDESは推論速度を大幅に向上させ、プリフィルタイムを2.16$times$、デコードタイムを1.26$times$に改善する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:48:27 GMT)
GloTok: Global Perspective Tokenizer for Image Reconstruction and Generation [52.0] トークン化された特徴のより均一な意味分布をモデル化するために,Global Perspective Tokenizer(GloTok)を導入する。
量子化による再構成誤差を最小限に抑えるために, 微細な細部を復元するために, 残差学習モジュールを提案する。
標準のImageNet-1kベンチマーク実験により,提案手法が最先端の復元性能と生成品質を実現することを確認した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:46:44 GMT)
Behavior Trees vs Executable Ontologies: a Comparative Analysis of Robot Control Paradigms [51.6] ロボット行動のモデリングには,インペラティブ・ビヘイビア・ツリー(BT)と宣言的実行可能オントロジー(EO)の2つのアプローチを比較した。
一方、EOはデータフロールールによって駆動される時間的イベントベースのセマンティックグラフとしてドメインを表現している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:38:01 GMT)
Selective Mixup for Debiasing Question Selection in Computerized Adaptive Testing [50.8] コンピュータ適応テスト (Computerized Adaptive Testing, CAT) は、オンライン教育プラットフォームにおける学習者の習熟度を評価する技術である。
選択バイアスは、質問選択が推定された熟練度に強く影響されるため生じる。
本稿では,Cross-Attribute Examinee RetrievalとSelective Mixup-based Regularizationの2つの主要なモジュールからなるデバイアス化フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:55:01 GMT)
A Causal Perspective on Measuring, Explaining and Mitigating Smells in \llm-Generated Code [49.1] Propensity Smelly Score (PSC) は、特定の臭いの種類を生成する確率を推定する計量である。
我々は、生成戦略、モデルサイズ、モデルアーキテクチャ、および生成したコードの構造特性をいかに形成するかを識別する。
PSCは、開発者がモデルの振る舞いを解釈し、コード品質を評価するのに役立つ。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:18:28 GMT)
Taming Generative Synthetic Data for X-ray Prohibited Item Detection [48.2] 禁止アイテム検出モデルのトレーニングには、大量のX線セキュリティイメージが必要である。
合成画像のX線セキュリティ画像合成によるデータセットのスケールアップ
テキスト・ツー・イメージ生成に基づくワンステージX線セキュリティ画像合成パイプライン(Xsyn)を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:07:11 GMT)
UniUltra: Interactive Parameter-Efficient SAM2 for Universal Ultrasound Segmentation [47.2] Segment Anything Model 2 (SAM2) は、自然画像に顕著な普遍的なセグメンテーション機能を示す。
この制限は、パラメータ効率を維持しながらSAM2を超音波画像に効率的に適応する方法と、リソース制約された臨床環境において適応モデルを効果的に展開する方法の2つの重要な課題を提起する。
本報告では,UniUltraを超音波の普遍的セグメンテーションのために提案する。特に,パラメータ効率の良い微調整を実現しつつ,多様な超音波画像の微粒化知覚を高める新しいコンテキストエッジハイブリッドアダプタ(CH-Adapter)を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:42:49 GMT)
ChartEditor: A Reinforcement Learning Framework for Robust Chart Editing [46.8] 私たちは、31のチャートカテゴリにまたがる7,964のサンプルからなる総合的なベンチマークであるChartEditVistaを紹介します。
ChartEditVistaのインプットには、オリジナルのチャートコードなしで、オリジナルのチャートイメージと自然言語編集命令のみが含まれている。
また、コード実行可能性と視覚的忠実性を同時に実施するために、新しいレンダリング報酬を含む強化学習フレームワークを使用してトレーニングされたモデルであるChartEditorも提示する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:27:37 GMT)
MutDafny: A Mutation-Based Approach to Assess Dafny Specifications [46.0] 潜在的な弱点を自動的に通知することで、Dafny仕様の信頼性を高めるツールであるMutDafnyを提示する。
一般的なツールから突然変異演算子を解析し、Dafnyに適用可能なものを同定する。
実世界の794個のDafnyプログラムのデータセットにおいて,MutDafnyの有効性と効率を評価する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:58:06 GMT)
Design and Optimization of Adaptive Diversity Schemes in Quantum MIMO Channels [45.8] 本研究では、送信機における普遍的非対称クローニングと受信機における確率的浄化に基づく離散変数QuMIMOシステムの適応的多様性戦略について検討する。
その結果,提案手法はクロストークに支配された設定において有意な忠実性向上をもたらし,チャネル対称性やチャネル条件に自動的に適応することがわかった。
この研究は、将来のQuMIMOシステムの設計ガイドラインを提供し、より高度な伝送および復号戦略のための堅牢なベースラインを確立する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:58:10 GMT)
ItemRAG: Item-Based Retrieval-Augmented Generation for LLM-Based Recommendation [45.6] 大規模言語モデルを適応させるために、検索強化生成(RAG)が組み込まれている。
LLMに基づくレコメンデーションのためのアイテムベースRAG手法であるItemRAGを提案する。
ItemRAGは、Hit-Ratio-1において最大43%のゼロショットLPMベースのレコメンデーションを一貫して改善し、(2)標準およびコールドスタートアイテムレコメンデーション設定においてユーザベースのRAGベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:39:14 GMT)
FinCriticalED: A Visual Benchmark for Financial Fact-Level OCR Evaluation [45.2] FinCriticalEDは、財務文書のOCRおよびビジョン言語モデルを評価するためのビジュアルベンチマークである。
FinCriticalEDは500のイメージとHTMLのペアを提供し、700以上の数値と時間的事実をカバーする、専門家の注釈付き財務事実を提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 00:41:14 GMT)
Scriboora: Rethinking Human Pose Forecasting [44.8] 本稿では,絶対的なポーズ予測のタスクにおいて,ポーズ予測アルゴリズムを広範囲に評価する。
最近の音声モデルは、ポーズ予測のタスクに効率的に適応でき、最先端の性能を向上させることができる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:58:33 GMT)
Text2Loc++: Generalizing 3D Point Cloud Localization from Natural Language [44.7] 我々は,言語とポイントクラウド間の効果的な相互アライメントを目的とした,新しいニューラルネットワークであるText2Loc++を提案する。
ベンチマークを支援するため,多様な都市シーンからカラーおよび非カラーポイント雲をカバーする新しい都市スケールデータセットを導入した。
グローバルな場所認識の段階では、Text2Loc++は、事前訓練された言語モデルと階層変換器と、文レベルの意味論のためのMax pooling(HTM)を組み合わせる。
微細なローカライゼーションの段階では、明示的なテキストインスタンスマッチングを完全に取り除き、軽量で強力なフレームワークを設計する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:19:45 GMT)
Gaussian Blending: Rethinking Alpha Blending in 3D Gaussian Splatting [44.6] 3DGSは、トレーニング中に見えない視線を合成する際、目立った相違が見られる。
本稿では,アルファとトランスミタンスを空間的に異なる分布として扱う新しい手法を提案する。
ガウシアン・ブレンディングは、目に見えないサンプリングレートと見られるサンプリングレートの両方で、既存の新しいビュー合成モデルより一貫して優れている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:21:38 GMT)
CompTrack: Information Bottleneck-Guided Low-Rank Dynamic Token Compression for Point Cloud Tracking [43.9] LiDARポイントクラウドにおける3Dオブジェクトトラッキングは、コンピュータビジョンと自律運転において重要なタスクである。
成功をおさめたにもかかわらず、ポイントクラウドの本質的な分散性は、二重冗長性の問題をもたらす。
我々は、ポイントクラウドにおける両方の冗長性を体系的に排除する、新しいエンドツーエンドフレームワークであるCompTrackを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:12:24 GMT)
PocketLLM: Ultimate Compression of Large Language Models via Meta Networks [43.8] 本稿では,大規模言語モデルを圧縮する新しい手法であるPocketLLMを紹介する。
LLMの重みを離散潜在ベクトルに投影する単純なエンコーダネットワークを提案する。
軽量デコーダネットワークを使用して、コードブックの代表ベクトルを元の重み空間にマッピングする。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:46:26 GMT)
QSentry: Backdoor Detection for Quantum Neural Networks via Measurement Clustering [43.4] 量子ニューラルネットワーク(QNN)は量子機械学習(QML)を実装する上で重要なモデルである
本研究は,QMLにおけるバックドア脅威を軽減するための実践的で効果的な枠組みを確立する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:08:11 GMT)
SRPO: Self-Referential Policy Optimization for Vision-Language-Action Models [42.9] VLA(Vision-Language-Action)モデルはロボット操作に優れるが、専門家によるデモンストレーションに大きく依存している。
グループベースの最適化手法を含む現在のVLA-RL法は、深刻な報酬の分散によって損なわれている。
本稿では,新しいVLA-RLフレームワークである自己参照ポリシー最適化(SRPO)を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:52:23 GMT)
Transparent Early ICU Mortality Prediction with Clinical Transformer and Per-Case Modality Attribution [42.9] ICU滞在後48時間から, 生理的時系列測定と非構造的臨床記録とを融合した, 軽量で透明なマルチモーダルアンサンブルを提案する。
ロジスティック回帰モデルは、バイタル用双方向LSTMとノート用微調整された臨床ModernBERT変換器の2つのモード固有モデルからの予測を組み合わせる。
MIMIC-IIIベンチマークでは、遅延融合アンサンブルは、よく校正された予測を維持しながら、最高の単一モデルに対する差別を改善する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 20:11:49 GMT)
Learning Depth from Past Selves: Self-Evolution Contrast for Robust Depth Estimation [42.7] SEC-Depthは自己監督型頑健な深度推定タスクのための自己進化型コントラスト学習フレームワークである。
本手法は多様なベースラインモデルにシームレスに統合し,ゼロショット評価におけるロバスト性を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:42:40 GMT)
Beyond Tsybakov: Model Margin Noise and $\mathcal{H}$-Consistency Bounds [42.7] 本稿では,モデルマージンノイズ(MMノイズ)を仮定した新しい低雑音条件を提案する。
拡張された$mathcalH$-consistency boundsを、バイナリとマルチクラスの両方の分類に導出する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:13:39 GMT)
MHR: Momentum Human Rig [42.5] 我々は,ATLASの切り離された骨格・形状パラダイムと,モメンタム図書館に触発されたフレキシブルで現代的なリグとポーズ修正システムを組み合わせた,パラメトリックな人体モデル MHR を提案する。
我々のモデルは、表現的で解剖学的に妥当な人間のアニメーションを可能にし、非線形ポーズ補正をサポートし、AR/VRとグラフィックパイプラインの堅牢な統合のために設計されている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:18:02 GMT)
Reasoning via Video: The First Evaluation of Video Models' Reasoning Abilities through Maze-Solving Tasks [42.1] ビデオモデルは、コヒーレントモーションダイナミクスを用いた高忠実度ビデオ生成において顕著な成功を収めた。
離散テキストコーパスと比較して、ビデオグラウンドは明示的な空間的レイアウトと時間的連続性を推論する。
ビデオモデルの推論能力を体系的に評価するために設計されたベンチマークであるVR-Benchを紹介する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:18:29 GMT)
Instruction-Guided Lesion Segmentation for Chest X-rays with Automatically Generated Large-Scale Dataset [42.0] 単純でユーザフレンドリーな命令に基づいて,多様な病変を分類するインストラクションガイド付き病変分割(ILS)を導入する。
本パラダイムでは,CXR病変分割のためのMIMIC-ILSを構築した。
MIMIC-ILSは、192K画像と91K独自のセグメンテーションマスクから派生した1.1Mのインストラクション・アンサー対を含み、7つの主要な病変をカバーしている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:17:19 GMT)
Multimodal Continual Instruction Tuning with Dynamic Gradient Guidance [41.6] マルチモーダル・インストラクション・チューニングにより、大規模言語モデルは、以前獲得した知識に基づいて構築しながら、新しいタスクに順次適応することができる。
しかし、この継続的な学習パラダイムは破滅的な忘れ込みという重大な課題に直面しており、そこでは新しいタスクの学習が過去のタスクのパフォーマンス低下につながる。
本稿では,新しいタスク学習において,古いタスクからの勾配を欠く問題として概念化することで,破滅的な忘れ方に対する新たな洞察を導入する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:29:15 GMT)
A Viable Paradigm of Software Automation: Iterative End-to-End Automated Software Development [41.3] 本稿では、反復的なエンドツーエンド自動ソフトウェア開発パラダイムであるAutoSWのビジョンを示す。
分析計画-実装-デリバリループで動作し、人間のパートナーとしてのAIシステムが第一級アクターになる。
結果はAutoSWが実行可能なソフトウェアをうまく提供できることを示唆している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:57:49 GMT)
Auditing Google's AI Overviews and Featured Snippets: A Case Study on Baby Care and Pregnancy [40.7] Google Search、AI Overviews(AIO)やFeatured Snippets(FS)などの機能を通じてAI生成コンテンツのサーフェスを強化
本稿では, 実際の乳児ケアと妊娠関連クエリの体系的アルゴリズム監査により, これらの情報表示の品質と一貫性を評価する。
その結果, AIO と FS の情報を同一検索結果ページ上に表示した場合, 33% のケースで相互に一致しない情報一貫性の欠如が明らかとなった。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 20:16:12 GMT)
UniHOI: Unified Human-Object Interaction Understanding via Unified Token Space [40.7] 統一トークン空間を介してHOIの検出と生成を共同でモデル化するUniHOIを提案する。
UniHOIはHOI検出と生成の両方において最先端の性能を達成する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:37:03 GMT)
What Does It Take to Be a Good AI Research Agent? Studying the Role of Ideation Diversity [40.3] エージェントのパフォーマンスにおいて,アイデアの多様性が果たす役割について検討する。
異なるモデルとエージェントの足場は、様々なアイデアの多様性をもたらす。
高いパフォーマンスのエージェントは、アイデアの多様性を増す傾向にある。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:32:18 GMT)
Zero-Shot Open-Vocabulary Human Motion Grounding with Test-Time Training [39.8] ZOMGは、アノテーションや微調整を必要とせずに、動作シーケンスを意味のあるサブアクションに分割するフレームワークである。
ZOMGは(1)言語セマンティックパーティションを統合し、大きな言語モデルを利用して命令を順序付けられたサブアクション単位に分解し、(2)ソフトマスキング最適化を行う。
3つのモーション言語データセットの実験では、HumanML3Dベンチマークにおいて、先行手法を+8.7%mAPで上回る、動作グラウンド性能の最先端の有効性と効率が示されている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:11:36 GMT)
Theoretical Closed-loop Stability Bounds for Dynamical System Coupled with Diffusion Policies [39.5] 本研究は、作用を実行する前に部分的にしか除音処理を行わない可能性について研究し、コンピュータ上で進行する逆時間拡散ダイナミクスと平行して植物が動的に進化することを可能にする。
この研究の貢献により、高速な模倣学習のためのフレームワークと、デモのばらつきに基づいてコントローラが安定しているかどうかを判断するメトリクスが提供される。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:13:08 GMT)
Attention-Based Feature Online Conformal Prediction for Time Series [39.4] オンライン共形予測(OCP)は、トレーニング済みの予測器をラップして、カバレッジ保証付き予測セットを生成する。
標準OCPは、単純な非整合(NC)スコアを使用して出力空間で動作し、量子化を推定する際にすべての歴史的観測を均一に扱う。
本稿では2つの重要なイノベーションを通じて両方の制約に対処する注目型機能OCP(AFOCP)を紹介する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:53:36 GMT)
The Loss of Control Playbook: Degrees, Dynamics, and Preparedness [39.4] 本報告では,新たな分類と準備の枠組みを開発することにより,AIシステムにおけるロス・オブ・コントロール(Los of Control, LoC)の実用的な定義が欠如していることに対処する。
そこで本研究では,重度と持続性の指標に基づいて,偏差,境界LoC,Strict LoCを区別したLoC分類法を提案する。
我々は,社会的脆弱性が到達した場合に,準備の維持と LoC 結果の発生防止を計画した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 20:10:39 GMT)
US-X Complete: A Multi-Modal Approach to Anatomical 3D Shape Recovery [38.1] 本稿では,3次元超音波における閉塞型解剖構造を完遂するための新しいマルチモーダル学習法を提案する。
我々は,(1)X線スキャンをシミュレートする2次元側方椎体ビューと(2)部分椎体表現からなるペアトレーニングデータを生成する。
本手法は画像モダリティの両面で形態情報を統合し, 脊椎再建において有意な改善が認められた。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:45:04 GMT)
NAMeGEn: Creative Name Generation via A Novel Agent-based Multiple Personalized Goal Enhancement Framework [38.0] 多様な要件を満たすために,客観的抽出,名称生成,評価を交互に行う新しいマルチエージェント最適化フレームワークであるNAMeGEnを提案する。
また、美学を強化するために17k以上の詩を用いた古典的漢詩コーパスを構築し、CBNamesを新たに導入した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:05:25 GMT)
Joint Semantic-Channel Coding and Modulation for Token Communications [37.8] トークン通信の問題点を考察し,トークンを効率よく確実に送信する方法について考察する。
本稿では,トークンエンコーダとポイントトークンを標準デジタルコンステレーションポイントにマッピングする共同セマンティックチャネルと変調方式を提案する。
提案手法は,ジョイント・セマンティック・チャネル・コーディングと従来の分離符号化の両方に優れる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:56:32 GMT)
Unbiased Semantic Decoding with Vision Foundation Models for Few-shot Segmentation [36.7] 我々は,Segment Anything Model(SAM)と統合したunbiased Semantic Decoding(USD)戦略を提案する。
USD戦略は、一貫した予測を行うために、サポートセットとクエリセットの両方からターゲット情報を同時に抽出する。
ターゲット中心のプロンプト埋め込みを生成するために、学習可能なビジュアルテキストターゲットプロンプト生成器を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:41:43 GMT)
Walrus: A Cross-Domain Foundation Model for Continuum Dynamics [36.6] ファンデーションモデルは、言語とビジョンのために機械学習を変革してきたが、物理シミュレーションに匹敵する影響を達成することは、依然として課題である。
We developed Walrus, a transformer-based foundation model developed for fluid-like dynamics。
ワラスは、天体物理学、地球科学、レオロジー、プラズマ物理学、音響学、古典流体など、19の多様なシナリオで事前訓練されている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:36:03 GMT)
PresentCoach: Dual-Agent Presentation Coaching through Exemplars and Interactive Feedback [36.1] 本稿では,理想提示エージェントとコーチエージェントという2つの補完的な役割を通じて,プレゼンテーション実践を支援するデュアルエージェントシステムを提案する。
理想的なプレゼンテーションエージェントは、スライド処理、視覚言語分析、ナレーションスクリプト生成、パーソナライズされた音声合成、同期されたビデオアセンブリを組み合わせることで、ユーザが提供するスライドをモデルプレゼンテーションビデオに変換する。
コーチエージェントは、これらの例に対してユーザ記録されたプレゼンテーションを評価し、マルチモーダルな音声分析を行い、オブザーバ-Impact-Suggestion (OIS)フォーマットで構造化されたフィードバックを提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:15:21 GMT)
Global Convergence of Four-Layer Matrix Factorization under Random Initialization [34.2] 4層行列因数分解におけるランダムな勾配降下に対する大域収束保証を示す。
我々は従来の理論を拡張し、層重みの固有値の変化を特徴づける。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:50:24 GMT)
In-N-On: Scaling Egocentric Manipulation with in-the-wild and on-task Data [33.7] エゴセントリックなビデオは、操作ポリシーを学ぶための価値がありスケーラブルなデータソースです。
本稿はまず,人間のデータを2つのカテゴリに分類することで,エゴセントリックなデータを収集・利用するためのスケーラブルなレシピを提供する。
我々は、Human0が、人間のデータのみからの指示に従う言語を含む、人間のデータのスケーリングから、いくつかの新しい特性を達成していることを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:59:04 GMT)
Harli: SLO-Aware Co-location of LLM Inference and PEFT-based Finetuning on Model-as-a-Service Platforms [33.6] Harliは、(最先端のサービスシステムまで)平均46.2%の微調整スループットを向上する
Harliは、(最先端のサービスシステムまで)平均46.2%の微調整スループットを向上する
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:34:02 GMT)
ProPL: Universal Semi-Supervised Ultrasound Image Segmentation via Prompt-Guided Pseudo-Labeling [33.5] ラベル付きデータとラベルなしデータの両方を活用することで,複数の臓器やセグメンテーションタスクを処理できるフレームワークであるProPLを提案する。
ProPLのコアとなるのは、共有ビジョンエンコーダとプロンプト誘導デュアルデコーダを組み合わせて、フレキシブルなタスク適応を可能にすることだ。
大規模な実験により、ProPLは様々なメトリクスで最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:01:41 GMT)
Realist and Pluralist Conceptions of Intelligence and Their Implications on AI Research [33.5] 私たちは、現在のAI研究は2つの異なるインテリジェンスの概念のスペクトルで動いていると論じます。
これらの概念はインテリジェンス・リアリズムとインテリジェンス・プラナリズムである。
これらの前提を明確化することは、AI研究における不一致の明確化に寄与する、と我々は主張する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:48:07 GMT)
Towards Unbiased Cross-Modal Representation Learning for Food Image-to-Recipe Retrieval [33.2] 本稿では, レシピや食品画像の学習表現の課題を, クロスモーダル検索問題における課題として論じる。
レシピと調理された料理との関係は因果関係であるので、レシピをテキストソースとして扱うと、バイアスを導いた画像とレシピの類似性判定が生成される。
本稿では, 事実上脱バイアスのための多ラベル成分であるプラグアンドプレイニューラルモジュールを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:39:53 GMT)
BokehFlow: Depth-Free Controllable Bokeh Rendering via Flow Matching [33.1] ボケレンダリングは、写真における浅い視野効果をシミュレートし、視覚美学を強化し、興味のある領域への視聴者の注意を誘導する。
本稿では,フローマッチングに基づくボケレンダリングのためのフレームワークであるボケフローを提案する。
BokehFlowは、オールインフォーカス画像から直接フォトリアリスティックなボケ効果を合成し、深度入力を不要にする。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:18:58 GMT)
Learning Where, What and How to Transfer: A Multi-Role Reinforcement Learning Approach for Evolutionary Multitasking [32.3] 強化学習による体系的で一般化可能な知識伝達政策の設計について検討する。
主な課題は、転送(場所)のタスクの決定、転送される知識(何)、転送(方法)のメカニズムである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:38:09 GMT)
MF-Speech: Achieving Fine-Grained and Compositional Control in Speech Generation via Factor Disentanglement [31.8] 本稿では,MF-SpeechEncoderとMF-SpeechGeneratorの2つのコアコンポーネントからなる,MF-Speechと呼ばれる新しいフレームワークを提案する。
MF-SpeechEncoderは、元の音声信号をコンテンツ、音色、感情の非常に純粋な表現に分解するために、多目的最適化戦略を採用する。
MF-SpeechGeneratorは導体として機能し、動的融合と階層的スタイル適応正規化を通じてこれらの因子の精密で構成可能できめ細かい制御を実現する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:50:05 GMT)
TiCAL:Typicality-Based Consistency-Aware Learning for Multimodal Emotion Recognition [31.4] マルチモーダル感情認識は、視覚、聴覚、テキストなどの不均一なモダリティを統合することで、人間の感情状態を正確に識別することを目的としている。
既存のアプローチは主に、モデルトレーニングを監督するために統一された感情ラベルに依存しており、しばしば重要な課題であるモーダル間感情衝突を見落としている。
我々は,人間の感情知覚の段階的特性に着想を得た,定型性に基づく連続型マルチモーダル感情認識(TiCAL)を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:49:22 GMT)
SNAP: Low-Latency Test-Time Adaptation with Sparse Updates [31.2] テスト時間適応(TTA)は、ラベルのないテストデータを使用してモデルを調整し、動的分散シフトを処理する。
SNAPは,精度を保ちながら適応周波数とデータ使用量を削減できるスパースTTAフレームワークである。
SNAPは、受信したデータストリームの1%のみに基づいて適応しても、競争精度を維持する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:40:24 GMT)
Distribution Matching Distillation Meets Reinforcement Learning [31.0] 本稿では,RL(Reinforcement Learning)技術と蒸留プロセスを組み合わせた新しいフレームワークDMDRを提案する。
数ステップのジェネレータのRLでは、MDD損失自体が従来のジェネレータよりも効果的な正規化であることを示す。
実験により、DMDRは目立った視覚的品質を達成でき、数ステップの手法間のコヒーレンスを促進でき、多ステップの教師を超えるパフォーマンスを発揮できることが示された。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:27:53 GMT)
Radial Fast Entangling Gates Under Micromotion in Trapped-Ion Quantum Computers [30.9] 高周波イオントラップのマイクロモーションは一般に量子論理ゲートにとって有害であると考えられている。
2イオン結晶の放射モードを利用した高速ゲートの設計には,マイクロモーションが有用であることを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:05:31 GMT)
The SA-FARI Dataset: Segment Anything in Footage of Animals for Recognition and Identification [30.7] 野生動物のための最大のオープンソースMATデータセットであるSA-FARIを紹介する。
これは、約10年間(2014-2024年)に4大陸の741箇所から収集された11,609のカメラトラップビデオから成っている。
16,224個のマスクレットのアイデンティティと942,702個のバウンディングボックス、セグメンテーションマスク、および種ラベルを含む46時間の濃密な注釈付き映像で、それぞれのビデオが総括的に注釈付けされる。
SAM 3を含む最先端の視覚言語モデルを用いて,SA-FARIの総合的なベンチマークを行い,種別および汎用性の両方で評価した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:07:08 GMT)
C$^2$-Cite: Contextual-Aware Citation Generation for Attributed Large Language Models [30.7] 我々は,新しいtextbfCon-textual-aware textbfCitation 生成フレームワークを提案する。
引用マーカーと参照コンテンツ間の意味的関係を明示的に統合する。
SOTAベースラインを平均して5.8%の励起品質、17.4%の応答精度で上回っている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:46:25 GMT)
SplitFlux: Learning to Decouple Content and Style from a Single Image [30.3] 本稿では,LoRAによる単一ドリームブロックの微調整によってコンテンツやスタイルを歪曲するSplitFluxを提案する。
SplitFluxは最先端の手法を一貫して上回り、さまざまなシナリオで優れたコンテンツ保存とスタイリング品質を実現している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:22:24 GMT)
Where does an LLM begin computing an instruction? [30.1] レイヤスタックに沿って、次に示す命令がどこから始まるのか、読み取りが行うべきポイントを問う。
Llama ファミリーのモデル全体では、この点よりも先に予測を変更する介入が、その後ほとんど効果を示さないような、オンセット(onset)と呼ばれる反射点が観察される。
これらの結果は、命令がどこから始まるかを特定し、タスクとモデルサイズでこの位置を比較するための、シンプルでレプリカ可能な方法を提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:35:53 GMT)
Evaluating Low-Light Image Enhancement Across Multiple Intensity Levels [30.0] 制御条件下で様々な光強度で撮像された画像を含むマルチイルミネーション低照度データセットを提案する。
我々は、いくつかの最先端手法をベンチマークし、強度レベルの大きな性能変化を明らかにした。
修正により、フルHD画像上のスマートフォンのDSLRでは最大10dBPSNR、最大2dBの改善が達成される。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:52:51 GMT)
Beyond GeneGPT: A Multi-Agent Architecture with Open-Source LLMs for Enhanced Genomic Question Answering [30.0] 我々は、Llama 3.1、Qwen2.5、Qwen2.5 Coderなどのオープンソースモデルを用いて、モノリシックなアーキテクチャでGeneGPTを再現する。
次に、ツールルーティング、クエリ生成、レスポンスバリデーションのためのエージェント特殊化を導入することで、GeneGPTを拡張するモジュール型マルチエージェントフレームワークであるOpenBioLLMを開発する。
OpenBioLLMは、ベンチマークタスクの90%以上でGeneGPTにマッチし、Gene-Turingで0.849、GeneHopで0.830を達成している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:08:20 GMT)
Experimental demonstration of non-local magic in a superconducting quantum processor [29.6] 超伝導量子処理ユニット(QPU)における非局所魔法の実験実験を行った。
システムのノイズモデリングにおいて,自由パラメータを必要とせず,理論と実験の良好な一致を観察する。
この研究で開発された方法やツールは、ブラックホールのおもちゃモデルから効率的な純度推定とホーキング放射の復号化を実験的に実現したものである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:08:03 GMT)
Segmenting Collision Sound Sources in Egocentric Videos [29.1] 本研究の目的は、衝突音の原因となる物体を音声の視覚入力に分割することである。
孤立した音のイベントとは異なり、衝突音は2つの物体間の相互作用から生じ、衝突の音響的シグネチャは両方に依存する。
基礎モデル(CLIPとSAM2)を利用した音声条件セグメンテーションの弱教師付き手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:49:37 GMT)
Teaching According to Students' Aptitude: Personalized Mathematics Tutoring via Persona-, Memory-, and Forgetting-Aware LLMs [28.6] 我々は,ペルソナ,記憶,ダイナミクスを取り入れた学習支援フレームワークであるTAS(Teaching Based by Students' Aptitude)を提案する。
具体的には、TASAは、熟練度プロファイルをキャプチャする構造化された学生ペルソナと、事前学習インタラクションを記録するイベントメモリを維持している。
TASAは、学習者の熟達状態を動的に更新し、文脈的に適切で難解な質問や説明を生成する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:28:16 GMT)
Enhancing Reliability across Short and Long-Form QA via Reinforcement Learning [28.4] 本研究は, 内因性および外因性両方の幻覚を, 短文および長文の質問応答で緩和するターゲットRLフレームワークを導入する。
ファインウェブの長文をファクトグラウンドの報酬方式で活用することで、本質的な幻覚(文脈への不信感)に取り組む。
信頼性を高めるために、我々のフレームワークは、解決不可能な質問に答えることを拒否するモデルに明確に報いる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:26:53 GMT)
Multi-Aspect Cross-modal Quantization for Generative Recommendation [27.9] 生成レコメンデーション(MACRec)のための多視点クロスモーダル量子化を提案する。
まず、ID学習過程において、競合率を効果的に低減するクロスモーダル量子化を導入する。
また、暗黙のアライメントや明示的なアライメントを含むマルチアスペクトのクロスモーダルアライメントも組み込んでいます。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:55:14 GMT)
EntroPIC: Towards Stable Long-Term Training of LLMs via Entropy Stabilization with Proportional-Integral Control [27.9] 大規模言語モデル(LLM)の長期トレーニングでは、モデルが最適でない動作に崩壊しないように、安定した探索を行う必要がある。
既存の強化学習手法は、正と負のサンプルが混在するトレーニングプロセスであるため、適切なエントロピーレベルを維持するのに苦労する。
本稿では, 損失係数を動的に調整することで, 正および負のサンプルの影響を適応的に調整する新しい手法であるProportional-Integral Control (EntroPIC) によるエントロピー安定化を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:06:42 GMT)
First Frame Is the Place to Go for Video Content Customization [27.6] ビデオモデルでは、第1フレームを概念記憶バッファとして暗黙的に扱い、生成時に視覚的エンティティを格納し、後続の再利用を行う。
これは、参照ベースのビデオカスタマイズのためのビデオ生成モデルの強力で見落とされがちな機能を公開する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:56:50 GMT)
Exploring the use of AI authors and reviewers at Agents4Science [27.4] 私たちは、AIエージェントが主要な著者とレビュアーの両方として、人間を共著者と共同レビュアーとして、最初のカンファレンスを組織しました。
ここでは、このカンファレンスから学んだ重要な教訓と、科学における人間とAIのコラボレーションにおけるその意義について論じる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:32:07 GMT)
BD-Net: Has Depth-Wise Convolution Ever Been Applied in Binary Neural Networks? [27.4] 本稿では,表現性を向上する1.58ビットの畳み込みと,最適化を安定させるためにBN前の残差接続を提案する。
提案手法は,MobileNet V1を用いたImageNet上の3300万のOPを実現し,BNN(Binary Neural Networks)の新たな最先端技術を確立する。
CIFAR-10、CIFAR-100、STL-10、Tiny ImageNet、オックスフォード・フラワーズ102など、様々なデータセットで既存の手法を一貫して上回り、精度は最大9.3%向上した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:38:50 GMT)
Kandinsky 5.0: A Family of Foundation Models for Image and Video Generation [26.8] Kandinsky 5.0は、高解像度画像と10秒のビデオ合成のための最先端の基礎モデルのファミリーである。
フレームワークは、Kandinsky 5.0 Image Lite、Kandinsky 5.0 Video Lite、Kandinsky 5.0 Video Proの3つのコアラインアップで構成されている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 00:23:22 GMT)
Towards Practical Zero-Knowledge Proof for PSPACE [26.6] この研究は、PSPACE完全文に対する最初の実用的なゼロ知識(ZK)プロトコルを示す。
我々はQ-Res証明の効率的な符号化を開発し、低オーバヘッド演算チェックによる検証を可能にする。
また、QBFに関する勝利戦略の知識を証明するため、ZKプロトコルを設計する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:22:48 GMT)
ConInstruct: Evaluating Large Language Models on Conflict Detection and Resolution in Instructions [26.4] このデータセットは、ユーザインストラクション内の競合を検出し、解決するLarge Language Modelsの機能を評価するためのベンチマークである。
ほとんどのプロプライエタリなLCMは強力なコンフリクト検出能力を持っているが、オープンソースのモデルではDeepSeek-R1のみが同様の強力な性能を示している。
強いコンフリクト検出能力にもかかわらず、LLMは競合する制約に直面したときに、ユーザにコンフリクトや要求の明確化を明示的に通知することは滅多にない。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:06:40 GMT)
Learning to Expand Images for Efficient Visual Autoregressive Modeling [26.4] 本稿では、人間の視覚系の中心外知覚パターンをエミュレートする新しい生成パラダイムである、拡張自己回帰表現(EAR)を紹介する。
EARは、画像トークンを中心からスパイラル順に展開し、徐々に外側に展開し、空間的連続性を保持し、効率的な並列復号を可能にする。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:55:07 GMT)
Is Your VLM for Autonomous Driving Safety-Ready? A Comprehensive Benchmark for Evaluating External and In-Cabin Risks [24.5] VLM(Vision-Language Models)は自律走行には大きな可能性を秘めているが、安全クリティカルなシナリオには適していない。
この問題は、外部環境リスクとキャビン内運転行動の安全性の両方を同時に評価する包括的なベンチマークが欠如していることから生じる。
我々は,VLMの各種安全リスクに対する認識を統一的に評価するための,最初の総合運転安全ベンチマークであるDSBenchを紹介する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:44:41 GMT)
Towards High-Consistency Embodied World Model with Multi-View Trajectory Videos [24.1] 身体的世界モデルは、視覚的な観察と行動を通じて物理的世界と予測し、相互作用することを目的としている。
MTV-Worldは正確なビジュモータ予測のためのマルチビュートラジェクトリ・ビデオ制御を導入した。
MTV-Worldは、複雑なデュアルアームシナリオにおける正確な制御実行と正確な物理的相互作用モデリングを実現する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:11:12 GMT)
When Harmless Words Harm: A New Threat to LLM Safety via Conceptual Triggers [24.1] モデル応答に反映された集合値構造を対象とするモデル非依存のジェイルブレイク手法MICMを紹介する。
GPT-4o, Deepseek-R1, Qwen3-8B を含む 5 つの先進的大規模言語モデル (LLM) ジェイルブレイクに対する MICM の評価を行った。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:34:57 GMT)
Masked Auto-Regressive Variational Acceleration: Fast Inference Makes Practical Reinforcement Learning [23.9] マスク付き自己回帰拡散モデル(MAR)は拡散モデルの表現的モデリング能力の恩恵を受ける。
MARVAL(Masked Auto-Regressive Variational Acceleration)は、拡散鎖を1つのAR生成ステップに圧縮する蒸留ベースのフレームワークである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:24:07 GMT)
Gaussian Splatting-based Low-Rank Tensor Representation for Multi-Dimensional Image Recovery [23.8] t-SVDは多次元画像表現のための有望なツールである。
多次元画像をコンパクトかつ連続的に表現する低ランクテンソル表現フレームワークを提案する。
多次元画像復元実験は,提案手法が常に最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:51:09 GMT)
Mind the Motions: Benchmarking Theory-of-Mind in Everyday Body Language [22.9] Motion2Mindは、NVCを解釈する機械のToM能力を評価するためのフレームワークである。
222種類の非言語的手がかりと397のマインドステートを含んでいる。
現在のAIシステムは、NVCの解釈にかなり苦労している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 21:26:28 GMT)
S-DAG: A Subject-Based Directed Acyclic Graph for Multi-Agent Heterogeneous Reasoning [22.6] 大規模言語モデル(LLM)は複雑な推論問題において顕著な性能を達成した。
本研究では,指定されたマルチエージェント協調戦略を備えた対象レベルできめ細かい分析を行う新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:09:21 GMT)
UniFit: Towards Universal Virtual Try-on with MLLM-Guided Semantic Alignment [22.5] 画像ベースの仮想試着(VTON)は、特定の服装を身に着けている人の写実的な画像を合成することを目的としている。
UniFitはMultimodal Large Language Model (MLLM)によって駆動される普遍的なVTONフレームワークである
UniFitは、マルチガーメントやモデルからモデルへのトライオンを含む幅広いVTONタスクをサポートしているが、最先端のパフォーマンスも実現している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:38:44 GMT)
EVA-Net: Interpretable Brain Age Prediction via Continuous Aging Prototypes from EEG [22.4] EVA-Netは、脳年齢を解釈可能な異常検出問題として再放送する新しいフレームワークである。
1297人の健康な被験者で訓練され、最先端の精度を達成している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:39:19 GMT)
The Subtle Art of Defection: Understanding Uncooperative Behaviors in LLM based Multi-Agent Systems [22.4] 本稿では,非協調行動がマルチエージェントシステムの不安定化や崩壊のメカニズムをシミュレートし,解析するための新しい枠組みを提案する。
本フレームワークは,(1)非協調的エージェント行動のゲーム理論に基づく分類,(2)エージェントの状態が進化するにつれて非協調的動作を動的に生成・改善する多段階シミュレーションパイプラインを含む。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 20:39:19 GMT)
TSRE: Channel-Aware Typical Set Refinement for Out-of-Distribution Detection [22.2] 活性化に基づく手法は、OOD検出において基本的な役割を担っている。
本稿では,識別可能性と活動性に基づく典型的な集合精錬法を提案する。
また、典型的な集合推定における分布バイアスを軽減するために、歪度に基づく改善も導入する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:33:14 GMT)
Regularized Schrödinger Bridge: Alleviating Distortion and Exposure Bias in Solving Inverse Problems [22.1] 逆問題に適したシュルディンガー橋を適応した正規化シュルディンガー橋(RSB)を提案する。
RSBは、入力状態とターゲットの両方を摂動させ、露光バイアスを効果的に軽減する、新しい規則化されたトレーニング戦略を採用している。
音声強調のための2つの典型的な逆問題に対する大規模な実験は、RSBが最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:16:07 GMT)
Breaking Expert Knowledge Limits: Self-Pruning for Large Language Models [21.2] 大規模言語モデル(LLM)は、広範囲のタスクにおいて顕著なパフォーマンスを達成しており、その巨大なサイズのため、実際のデプロイメントを妨げている。
既存のプルーニング手法は手動設計プルーニングアルゴリズムに大きく依存しているため、テクティファイジの作業コストや専門知識のテクティファイアに繋がる。
筆者らはまず, LLMを活用して, 専門家の知識を使わずに, 自己に最適なプルーニングアルゴリズムを設計することで, 専門家の知識限界を克服する, textbfAutoPrune と呼ばれる新しいプルーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:38:21 GMT)
BBox DocVQA: A Large Scale Bounding Box Grounded Dataset for Enhancing Reasoning in Document Visual Question Answer [21.0] BBox DocVQAは、空間的推論と視覚文書のエビデンスローカライゼーションを強化するために設計された、大規模で有界なボックス基底データセットである。
得られたデータセットは3.6Kの多様なドキュメントと32KのQAペアを含み、単一の領域と複数ページのシナリオを含む。
我々のデータセットとコードは公開され、解釈可能で空間的に基底付けられた視覚言語推論の研究が進められる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:03:54 GMT)
CrossCheck-Bench: Diagnosing Compositional Failures in Multimodal Conflict Resolution [20.8] CrossCheck-Benchは、マルチモーダル入力における矛盾検出を評価するための診断ベンチマークである。
タスクが知覚的マッチングから論理的矛盾検出に移行するにつれて、13の最先端の視覚言語モデルを評価し、一貫した性能低下を観察する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:17:15 GMT)
Learning Human-Like RL Agents Through Trajectory Optimization With Action Quantization [20.7] マクロアクション量子化(Macro Action Quantization,MAQ)は、人間のデモをマクロアクションに蒸留する人間のような強化学習フレームワークである。
D4RL Adroitベンチマークの実験では、MAQは人間の類似性を大幅に改善し、軌道類似性スコアを増大させ、RLエージェントの中で最も高い人間類似性ランキングを達成している。
また,MAQは市販のRLアルゴリズムに容易に組み込むことができ,人間的なRLエージェントを学習する上で有望な方向を導出できることを示した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:59:47 GMT)
Multi-layer Stack Ensembles for Time Series Forecasting [20.6] 組立は機械学習モデルの精度を向上させるための強力な技術である。
実世界の50のデータセットにわたる33のアンサンブルモデルを評価する。
時系列予測のための多層積み重ねフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 11:21:00 GMT)
CASTELLA: Long Audio Dataset with Captions and Temporal Boundaries [20.6] 音声モーメント検索(AMR)のための人手による音声ベンチマークであるCASTELLAを紹介する。
CastELLA は 1,009 と 213 と 640 のオーディオ録音で構成されている。
実験により、合成データに対する事前訓練の後、CASTELLAで微調整されたモデルが、Recall1@0.7の10.4ポイントの合成データにのみ訓練されたモデルより優れていることが示された。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:19:34 GMT)
A Style is Worth One Code: Unlocking Code-to-Style Image Generation with Discrete Style Space [20.5] 本稿では,数値的なスタイルのみを前提とした,新しい一貫した視覚的スタイルのイメージを生成する,コード・ツー・スタイル画像生成の新しいタスクを紹介する。
CoTyleはこのタスクのための最初のオープンソースメソッドである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 01:28:35 GMT)
Point Cloud Quantization through Multimodal Prompting for 3D Understanding [20.4] 本稿では,ポイントクラウド解析のための簡易なマルチモーダルプロンプト駆動量子化フレームワークを提案する。
1) 事前訓練されたモデルからのテキスト埋め込みは、視覚的意味論を本質的にエンコードする。
我々は、量子化空間を維持しながら微分可能な離散化を実現するために、Gumbel-Softmax緩和を用いる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:45:37 GMT)
SceneEdited: A City-Scale Benchmark for 3D HD Map Updating via Image-Guided Change Detection [20.3] SceneEditedは、3Dポイントクラウド更新によるHDマップのメンテナンス研究をサポートするために明示的に設計された最初の都市規模のデータセットである。
SceneEditedには、73kmの運転とおよそ3$textkm2$の都市部を含む800以上の最新のシーンが含まれている。
各シーンには、校正されたRGBイメージ、LiDARスキャン、トレーニングと評価のための詳細な変更マスクが含まれている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:10:55 GMT)
Eq.Bot: Enhance Robotic Manipulation Learning via Group Equivariant Canonicalization [20.1] Eq.Botは、ロボット操作学習のためのSE(2)群同変理論に基づく普遍的な標準化フレームワークである。
我々のフレームワークは、観測結果を標準空間に変換し、既存のポリシーを適用し、結果のアクションを元の空間にマッピングする。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:28:20 GMT)
Refraction Hall Effect [19.9] 時間反転不変材料においてホール様応答を生成する新しい機構を導入する。
傾斜した電位界面は、電子波パケットがバリアを透過するときに屈折のような偏向を生じさせることを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:57:16 GMT)
Optomechanical disk resonator in the quantum ground state of motion [19.9] 量子基底状態で調製された光磁気ディスク共振器の最初の実験例を示す。
メカニカルモードのフォノン占有度をブリュアンサイドバンド分光法により定量化する。
レーザー誘起加熱のメカニズムを実験的に検討した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:48:07 GMT)
Alpha Divergence Losses for Biometric Verification [19.8] $$$-divergence loss関数は、CosFaceやArcFaceのようなマージンベースのSoftmax損失に代わる魅力的な代替手段を提供する。
本稿では,Q-MarginとA3Mの2つの新しいマージンベース$$-divergence損失について検討する。
本手法は,IJB-BとIJB-Cの顔評価ベンチマークにおいて,高い性能向上を実現している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:29:32 GMT)
INQUIRE-Search: A Framework for Interactive Discovery in Large-Scale Biodiversity Databases [19.6] INQUIRE-Searchは、科学者が生態画像データベース内で迅速かつインタラクティブに検索できるオープンソースのシステムである。
InQUIRE-Searchのようなツールがサポートする科学的応用の多様性を示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:42:35 GMT)
Evaluating Multimodal Large Language Models on Vertically Written Japanese Text [18.8] 日本語テキストにおけるMLLM(Multimodal Large Language Models)の読み出し能力について検討した。
我々は,日本語テキストを画像に描画することで,合成日本語OCRデータセットを生成し,それをモデル微調整と評価の両方に利用する。
また,縦書き日本語テキストを含む実世界の文書画像から得られた評価データセットを作成する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:04:22 GMT)
FaultDiffusion: Few-Shot Fault Time Series Generation with Diffusion Model [18.7] 故障診断はシステムの信頼性を確保し、予測保守を可能にするために重要である。
豊富な正規データに最適化された既存の時系列生成モデルは、数ショットのシナリオで障害分布のキャプチャに苦労する。
拡散モデルに基づく新しい数ショットの故障時系列生成フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:53:15 GMT)
Cross Modal Fine-Grained Alignment via Granularity-Aware and Region-Uncertain Modeling [17.8] 微細な画像テキストアライメントは、マルチモーダル学習における重要な課題である。
本稿では,意味認識と地域レベルの不確実性モデリングを融合した統一アプローチを提案する。
提案手法は,各種バックボーンアーキテクチャにおける最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:39:44 GMT)
H-CNN-ViT: A Hierarchical Gated Attention Multi-Branch Model for Bladder Cancer Recurrence Prediction [17.7] 膀胱癌再発予測に特化して設計された多系列多モードMRIデータセットについて紹介する。
次に,H-CNN-ViTを提案する。H-CNN-ViTは,グローバル (ViT) パスとローカル (CNN) パスからの特徴を選択的に重み付けできる階層的Gated Attention Multi-Branchモデルである。
我々のマルチブランチアーキテクチャは、各モダリティを独立に処理し、各撮像チャネルのユニークな特性を最適に捕捉し、統合することを保証する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:47:54 GMT)
Effective Code Membership Inference for Code Completion Models via Adversarial Prompts [17.4] コード補完モデルにおけるメンバーシップ推論攻撃(MIA)は、プライバシーリスクを評価する効果的な方法を提供する。
本稿では,コード補完モデルに特化して設計されたAdvPrompt-MIAを提案する。
我々は、APPSおよびHumanEvalベンチマークに対して、Code Llama 7Bのような広く採用されているモデルに対して包括的な評価を行う。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:30:54 GMT)
Deep Pathomic Learning Defines Prognostic Subtypes and Molecular Drivers in Colorectal Cancer [16.9] TDAM-CRC予測性能は、従来のステージングシステムや複数の最先端モデルよりも大幅に優れていた。
TDAM-CRCリスクスコアは多変量解析において独立した予後因子として確認された。
ミトコンドリアリボソーム蛋白L37 (MRPL37) は, 深部病原性特徴と臨床予後を関連付けるキーハブ遺伝子として同定し, 検証した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:19:43 GMT)
VisPlay: Self-Evolving Vision-Language Models from Images [16.4] 強化学習(RL)は、複雑なタスクにおける視覚言語モデル(VLM)を改善するための原則的なフレームワークを提供する。
我々は、VLMが大量のラベルのない画像データを用いて推論能力を自律的に改善できる自己進化型RLフレームワークであるVisPlayを紹介した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:55:15 GMT)
Full-Atom Peptide Design via Riemannian-Euclidean Bayesian Flow Networks [16.1] PepBFNは完全な原子ペプチド設計のための最初のベイズ流ネットワークであり、完全な連続空間におけるパラメータ分布を直接モデル化する。
具体的には、PepBFNは連続したパラメータ分布を学習することで離散残留型をモデル化し、共同および滑らかなベイズ更新を可能にする。
サイドチェーンパッキング、逆折り畳み、バインダー設計タスクの実験は、計算ペプチド設計におけるPepBFNの強いポテンシャルを示している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:15:09 GMT)
Tokenisation over Bounded Alphabets is Hard [16.0] 近年の研究では、トークン化はNP完全であることが示されている。
制限付き$n$-aryアルファベット上でトークン化を分析することで、このギャップを埋める。
単一アルファベットに適用しても, 直接トークン化はNP完全であることを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:59:56 GMT)
Robust Bayesian Optimisation with Unbounded Corruptions [15.9] 予算は規模ではなく、腐敗の頻度にのみ拘束される新しい敵を紹介します。
RCGP-UCBの安定かつ適応的なバージョンを示し、最大$O(T1/2)$の存在下でサブ線形後悔を達成することを証明した。
外れ値がない場合、RCGP-UCBの後悔境界は標準のGP-UCBアルゴリズムと一致する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:28:56 GMT)
GeoMVD: Geometry-Enhanced Multi-View Generation Model Based on Geometric Information Extraction [15.7] マルチビュー画像生成はコンピュータビジョンにおいて重要な応用価値を持つ。
単一画像の拡張に依存する既存の手法では、クロスビューの一貫性を維持する上で、注目すべき計算課題に直面している。
本稿では,多視点幾何情報を抽出する機構を組み込んだ幾何誘導多視点拡散モデルを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:17:25 GMT)
Rethinking Kernel Program Repair: Benchmarking and Enhancing LLMs with RGym [15.7] RGymはLinuxカーネル向けの軽量でプラットフォームに依存しないAPR評価フレームワークである。
局所化技術を利用した簡易かつ効果的なAPRパイプラインを提案する。
GPT-5シンキングで43.36%のパスレートを実現した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:12:47 GMT)
IPTQ-ViT: Post-Training Quantization of Non-linear Functions for Integer-only Vision Transformers [15.5] 視覚変換器の量子化アウェアトレーニング(QAT)手法は、非線形層量子化における精度損失を回復するために、高価なリトレーニングに依存している。
既存のPTQ(Post-Training Quantization)手法は、非線形関数を部分的に定量化するか、アクティベーション分布を調整して精度を維持するが、完全に整数のみの推論を達成できない。
IPTQ-ViTは、完全に整数のみの視覚変換を行うための新しいPTQフレームワークである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 11:56:16 GMT)
Graph Query Networks for Object Detection with Automotive Radar [15.3] 本稿では,レーダによって知覚されるオブジェクトをグラフとしてモデル化する注目ベースのフレームワークであるGraph Query Networks (GQN)を紹介する。
NuScenesデータセットでは、GQNは、最強の先行レーダ法よりも8.2%の利得を含む、相対的なmAPを最大53%改善している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:36:49 GMT)
Knowledge-Grounded Agentic Large Language Models for Multi-Hazard Understanding from Reconnaissance Reports [14.9] 災害後の偵察報告には、マルチハザード相互作用を理解するための重要な証拠が含まれている。
MoRA-RAGは、偵察レポートをマルチハザード推論のための構造化基盤に変換する知識基盤のLLMフレームワークである。
MoRA-RAGは94.5パーセントの精度を達成し、ゼロショットのLLMを30%上回り、最先端のRAGシステムを10%上回っている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:42:08 GMT)
Rényi Differential Privacy for Heavy-Tailed SDEs via Fractional Poincaré Inequalities [14.8] 近年, 重み付き勾配降下に対するDP保証値が得られた。
DPと重み付きSGDの差分リンクに新しい光を流すが、これらの結果はパラメータ数に強く依存する。
我々のフレームワークは、新しいレニイフロー計算と、確立された分数的ポアンカレ不等式の使用に基づいている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:18:54 GMT)
RescueLens: LLM-Powered Triage and Action on Volunteer Feedback for Food Rescue [14.7] 本研究は,大規模言語モデル(LLM)が,ボランティア体験に基づいて,食品救助のオーガナイザの理解と行動にどのように役立つかを検討する。
RescueLensはボランティアのフィードバックを自動的に分類し、寄付者や受取人がフォローアップするように提案し、フィードバックに基づいてボランティアの指示を更新する。
RescueLensは現在412のFood Rescueにデプロイされており、オーガナイザとの半構造化されたインタビューを通じて、RescueLensがフィードバックプロセスの合理化によって、オーガナイザがより時間を割くことができることがわかった。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:55:16 GMT)
MMCM: Multimodality-aware Metric using Clustering-based Modes for Probabilistic Human Motion Prediction [14.6] 本稿では,HMP(Human Motion Prediction)のための新しい指標を提案する。
1つの過去のシーケンスが複数の将来をもたらす可能性があるため、確率論的HMP法はそのような複数の動きを予測する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:05:05 GMT)
SweeperBot: Making 3D Browsing Accessible through View Analysis and Visual Question Answering [14.5] SweeperBotは、Screen Reader(SR)ユーザーが視覚的質問応答を利用して3Dモデルを調べて比較することを可能にするシステムである。
SR経験を持つ10 Blind and Low-Vision (BLV)ユーザによる専門家レビューでは、SweeperBotの使用の可能性が示された。
SweeperBotによる説明の質は、30人の目撃者による第2回調査によって検証された。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:43:24 GMT)
Learning from Mistakes: Loss-Aware Memory Enhanced Continual Learning for LiDAR Place Recognition [14.5] LiDARの位置認識はSLAM、ロボットナビゲーション、自動運転において重要な役割を果たす。
既存のLiDARの位置認識手法は、学習済みの知識を忘れずに新しい環境に適応するのに苦労することが多い。
我々は,LiDAR位置認識のための新しい連続学習フレームワークKDF+を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:41:30 GMT)
RB-FT: Rationale-Bootstrapped Fine-Tuning for Video Classification [14.2] 視覚言語モデル(VLM)はマルチメディア理解にとってますます不可欠なものになりつつある。
彼らはしばしばドメイン固有のビデオ分類タスク、特に限られたデータで苦労する。
新しいアノテーションを使わずにこのギャップを埋める2段階の自己改善パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 23:12:18 GMT)
TTF: A Trapezoidal Temporal Fusion Framework for LTV Forecasting in Douyin [14.2] 本稿では,これらの課題に対処するために,Trpezoidal Temporal Fusion (TTF) と呼ばれる新しいフレームワークを提案する。
本稿では,データアンアライメントとSILOの課題に対処するために,台座型マルチ時系列モジュールを提案する。
我々はMT-FusionNetと呼ばれるマルチトウワー構造で正確な予測を出力する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:09:33 GMT)
Taxonomy, Evaluation and Exploitation of IPI-Centric LLM Agent Defense Frameworks [14.1] IPI中心の防衛フレームワークを包括的に分析する。
我々は、これらの防衛を包括的に分類し、5次元で分類する。
次に、代表的防衛フレームワークのセキュリティとユーザビリティを徹底的に評価する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:47:30 GMT)
SOLID: a Framework of Synergizing Optimization and LLMs for Intelligent Decision-Making [14.0] SOLIDは、大規模言語モデル(LLM)の文脈能力と数学的最適化を統合するフレームワークである。
この枠組みは凸性仮定の下で理論収束保証を保持しており、LLMの設計に関する洞察を与えている。
実験結果は,様々なシナリオにおける収束を示し,ベースラインのみの手法と比較して年次リターンを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:44:36 GMT)
Atlas Gaussian processes on restricted domains and point clouds [13.9] 現実世界のアプリケーションでは、データは未知の境界を持つ制限された領域に常駐することが多い。
従来のガウス過程(GP)は、そのような設定で基礎となる幾何学を捉えるのに苦労している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:28:05 GMT)
Unified all-atom molecule generation with neural fields [13.8] FuncBindはコンピュータビジョンに基づくフレームワークで、原子系全体にわたってターゲット条件付き全原子分子を生成する。
FuncBindは、小さな分子、大環状ペプチド、および抗体相補性決定領域ループの生成において、シリカ性能の競争力を達成する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 22:18:13 GMT)
WALDO: Where Unseen Model-based 6D Pose Estimation Meets Occlusion [13.8] モデルに基づく6次元ポーズ推定法に対する4つの新しい拡張を提案する。
提案手法は,IABINの精度が5%以上向上し,BOPデータセットのベンチマークでは2%以上向上していることを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 21:01:49 GMT)
To Align or Not to Align: Strategic Multimodal Representation Alignment for Optimal Performance [13.5] トレーニング中のアライメント強度を正確に操作できる制御可能なコントラスト学習モジュールを提案する。
この結果から, 単調モデルの性能に対する明示的アライメントの影響は, データの特性と関係があることが示唆された。
混合情報分布におけるモダリティ固有信号と共有冗長性のバランスをとる最適アライメント強度を同定する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:26:02 GMT)
CODE-II: A large-scale dataset for artificial intelligence in ECG analysis [13.4] CODE-IIはブラジルのミナスジェライステレヘルスネットワーク(TNMG)が収集した2,093,807人の成人患者の2,735,269個の心電図からなる大規模な実世界のデータセットである。
各試験は、標準化された診断基準を用いて注釈付けされ、心臓科医によってレビューされた。
CODE-IIで事前トレーニングされたニューラルネットワークは、外部ベンチマーク(PTB-XLとCPSC)と、より大きなデータセットでトレーニングされた代替手段よりも優れた転送性能を達成した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:14:05 GMT)
Node-Level Uncertainty Estimation in LLM-Generated SQL [13.4] 本稿では,構造コンテナやエイリアスの変化を過小評価することなく,ノードレベルの正しさを割り当てるセマンティックなラベリングアルゴリズムを提案する。
私たちは、識別子の妥当性、エイリアス解決、型互換性、スコープのあいまいさ、タイポ信号といった、スキーマ認識と語彙の豊富な機能で、各ノードを表現します。
これらの確率は不確実性であると解釈し、クエリの誤りを正確に特定するきめ細かい診断を可能にする。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 20:18:33 GMT)
AdamX: An Adam improvement algorithm based on a novel exponential decay mechanism for the second-order moment estimate [13.4] AdamXアルゴリズムは局所的および大域的ミニマに高次元最適化を収束させるために提案されている。
その中心となる革新は、新しいタイプの2階モーメント推定指数減衰率の提案にある。
その結果, 2次モーメント推定指数減衰速度は, 現在の2次モーメント推定指数減衰速度よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:11:41 GMT)
Optimized scheduling of electricity-heat cooperative system considering wind energy consumption and peak shaving and valley filling [13.4] 本研究では,改良されたDual-Delay Deep Deterministic Policy Gradient (PVTD3)アルゴリズムに基づくインテリジェントスケジューリング手法を提案する。
グリッド電力購入変動に対するペナルティ項を導入することにより,システム最適化を実現する。
提案アルゴリズムは, 経済効率とグリッド安定性に優れるだけでなく, エネルギー貯蔵装置管理において, 持続可能なスケジューリング能力も優れている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:10:02 GMT)
Octopus: Agentic Multimodal Reasoning with Six-Capability Orchestration [13.2] そこで我々は,Octopus: Agentic Multimodal Reasoning with Six-Capability Orchestrationを提案する。
マルチモーダル推論に必要な6つのコア機能を定義し,総合評価ベンチマークであるOctopus-Benchを整理する。
OctopusはOctopus-Benchのタスクの大部分で最高のパフォーマンスを達成し、エージェントマルチモーダル推論における能力調整の重要な役割を強調している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 11:22:13 GMT)
Better LLM Reasoning via Dual-Play [13.2] 大規模言語モデルのための新しいデュアルプレイフレームワークPasoDobleを紹介する。
パソドブルは、同じベースモデルから2つのモデルを逆行する。
実験結果から,PasoDobleはLCMの推理性能を向上させることができることがわかった。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 01:20:49 GMT)
Generative design and validation of therapeutic peptides for glioblastoma based on a potential target ATP5A [13.1] 本稿では、ATP5Aを標的とするペプチドを最適化するために、生成モデリングと実験的検証を組み合わせたフレームワークを提案する。
最初の鉛ペプチド条件のフローマッチングモデルとして、POTFlowは治療ペプチド設計のための一般化可能なフレームワークとして強力なポテンシャルを持っている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 11:17:17 GMT)
From Solving to Verifying: A Unified Objective for Robust Reasoning in LLMs [13.0] 本稿では,統合損失関数内での解生成と自己検証を協調的に最適化するアルゴリズムGRPO-Verifを提案する。
実験により,提案手法は推論において同等の性能を維持しつつ,自己検証能力を向上させることが示された。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:27:06 GMT)
Optimus-Q: Utilizing Federated Learning in Adaptive Robots for Intelligent Nuclear Power Plant Operations through Quantum Cryptography [12.8] Optimus-Qロボットは、空気の質を自律的に監視し、汚染を検出するように設計されている。
このロボットは、さまざまな原子力発電所にまたがる他のシステムと協力し、予測能力を向上させる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:01:24 GMT)
AccelOpt: A Self-Improving LLM Agentic System for AI Accelerator Kernel Optimization [12.3] 本稿では,自己改善型大規模言語モデル(LLM)エージェントシステムであるAccelOptを紹介する。
NKIBenchは、AWS Trainiumアクセラレータカーネルの新しいベンチマークスイートで、現実世界のワークロードから抽出される複雑さがさまざまです。
評価の結果,AccelOptの能力は時間とともに向上し,ピークスループットの平均値はTranium 1で49%から61%,NKIBenchカーネルで45%から59%へと向上した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 22:49:37 GMT)
Fourier-KAN-Mamba: A Novel State-Space Equation Approach for Time-Series Anomaly Detection [12.2] マンバをベースとした状態空間モデルは、ロングシーケンスモデリングにおいて顕著な効率性を示している。
本稿では,フーリエ層,コルモゴロフ・アルノルドネットワーク(KAN),マンバ選択状態空間モデルを統合するハイブリッドアーキテクチャを提案する。
提案手法は既存の最先端手法を著しく上回っている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:45:06 GMT)
Thermalizing channel states for rapid qubit heating [12.1] 共振器を通した熱流中へのマイクロ波駆動の伝達実験を行った。
熱流を受ける量子ビットは、任意の目標温度の準熱平衡を数百ナノ秒で得る。
解析的予測はXmon量子ビット回路の実験値とよく一致している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:26:58 GMT)
EPSO: A Caching-Based Efficient Superoptimizer for BPF Bytecode [12.0] キャッシュベースのスーパーオプティマイザであるEPSOを提案し、オフラインのスーパーオプティマイゼーションによって書き換えルールを発見し、それを再利用してランタイムオーバーヘッドを最小限に抑えた高品質な最適化を実現する。
我々は、LinuxカーネルやCilium、Katran、hXDP、Sysdig、Tetragon、Traceeなど、いくつかのeBPFベースのプロジェクトのベンチマークでEPSOを評価した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:21:20 GMT)
Insights from the ICLR Peer Review and Rebuttal Process [12.0] ICLR 2024と2025のピアレビュープロセスを大規模に分析する。
本研究は,レビュースコア,著者-レビューアテンション,レビュー提出時の時間的パターン,共同レビューアの影響について検討する。
この結果から,初回評価と共同視聴者の評価が,報奨期間における得点変化の予測因子として最強であることが示唆された。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:21:52 GMT)
Hierarchical Semantic Tree Anchoring for CLIP-Based Class-Incremental Learning [11.8] クラスインクリメンタルラーニング(Class-Incremental Learning, CIL)は、モデルが過去の知識を保ちながら、新しいクラスを継続的に学習することを可能にする。
しかし、現実世界の視覚的および言語的概念は本質的に階層的である。
本稿では,CILに階層的な情報を固定し,破滅的な忘れを抑えるHASTENを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:14:47 GMT)
AquaSentinel: Next-Generation AI System Integrating Sensor Networks for Urban Underground Water Pipeline Anomaly Detection via Collaborative MoE-LLM Agent Architecture [11.6] AquaSentinelは、都市地下パイプラインネットワークにおけるリアルタイムな異常検出のための物理インフォームドAIシステムである。
1) ネットワーク全体の可観測性を最小限のインフラから実現するために,高分散ノードでの戦略的スパースセンサ展開と物理ベースの状態拡張を併用する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 20:53:50 GMT)
Cortex AISQL: A Production SQL Engine for Unstructured Data [11.5] AIはSnowflakeで本番環境にデプロイされ、分析、検索、コンテンツ理解にまたがるさまざまな顧客のワークロードに電力を供給する。
本稿では、AI対応クエリ最適化が、AI推論コストを第一級最適化目標として扱う方法を示す。
第二に、適応モデルカスケードは、高速プロキシモデルを通じてほとんどの行をルーティングすることで、推論コストを削減する。
第三に、セマンティックなジョインクエリの書き換えは、ジョイン操作の二次的な時間の複雑さを線形に下げる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:22:56 GMT)
Proximal Approximate Inference in State-Space Models [11.3] 非線形・非ガウス状態空間モデルにおける状態推定のためのアルゴリズムのクラスを示す。
提案手法は, ベイズ推定をエントロピー的信頼領域更新の系列として用いたラグランジアン定式化に基づく。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:06:08 GMT)
TB or Not TB: Coverage-Driven Direct Preference Optimization for Verilog Stimulus Generation [11.3] 大規模言語モデル(LLM)を用いた自動刺激生成のためのフレームワークTBかTBかを提案する。
提案したCD-DPO法は,定量的カバレッジフィードバックを直接最適化目標に統合し,検証カバレッジを最大化する刺激生成に向けてモデルを導出する。
CVDP CID12ベンチマークの実験では、TBがオープンソースと商用の両方のベースラインを上回っ、コードカバレッジが77.27%向上した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:23:06 GMT)
RoboTidy : A 3D Gaussian Splatting Household Tidying Benchmark for Embodied Navigation and Action [11.2] RoboTidyは、言語誘導の家庭用ティディリングのための統一されたベンチマークである。
VLA(Vision-Language-Action)とVLN(Vision-Language-Navigation)のトレーニングと評価をサポートする。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:44:17 GMT)
MambaIO: Global-Coordinate Inertial Odometry for Pedestrians via Multi-Scale Frequency-Decoupled Modeling [11.1] 慣性オドメトリー(IO)は、慣性測定ユニット(IMU)からの加速度と角速度の測定のみを用いたリアルタイムな位置決めを可能にする
我々は,IMU測定をラプラシアンピラミッドを用いて高周波・低周波成分に分解するMambaIOを提案する。
複数の公開データセットの実験では、MambaIOはローカライズエラーを著しく低減し、最先端(SOTA)のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:29:27 GMT)
The Learning Dynamics of Subword Segmentation for Morphologically Diverse Languages [11.1] サブワードセグメント言語モデル(SSLM)を拡張して,事前学習と微調整をサポートする。
形態素スペクトルにまたがる学習のダイナミクスを研究するために,3つの類型的多様言語のためのモデルを訓練する。
形態学的に複雑なisi-Xhosaが不安定である4段階のサブワード学習を同定した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:30:00 GMT)
PAVE: An End-to-End Dataset for Production Autonomous Vehicle Evaluation [11.0] このデータセットには、市場で生産される自動運転車モデルから100時間以上の自然科学的なデータが含まれている。
各キーフレームには、過去6秒と将来の5秒にまたがる20Hzの車両軌跡と、周辺車両、歩行者、信号機、交通標識の詳細な2Dアノテーションが提供されている。
AVの安全性を評価するために、自動運転車のフレーム上で平均変位誤差(ADE)1.4mの車両軌道を予測できるエンドツーエンドの運動計画モデルを用いる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:21:50 GMT)
Build AI Assistants using Large Language Models and Agents to Enhance the Engineering Education of Biomechanics [11.0] バイオメカニクス教育における大規模言語モデル (LLM) の性能向上のために, RAG (Retrieval-Augmented Generation) とMAS (Multi-Agent System) を適用した。
以上の結果から, RAGは概念的疑問に答える上で, LLMの性能と安定性を著しく向上させることが示された。
一方、複数のLSMを用いて構築されたMASは、多段階推論を行い、方程式を導出し、コードを実行し、計算を必要とするタスクに対して説明可能なソリューションを生成する能力を示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:16:51 GMT)
MedBench v4: A Robust and Scalable Benchmark for Evaluating Chinese Medical Language Models, Multimodal Models, and Intelligent Agents [11.0] MedBench v4は全国的なクラウドベースのベンチマークインフラストラクチャで、70,000あまりのエキスパートがキュレートされたタスクで構成されています。
500以上の機関の臨床医による多段階的改善と多段階的レビューの項目は、人間の評価に対するLLM-as-a-judgeによって評価される。
LLMの総合得点は54.1/100(クロード・ソネット4.5, 62.5/100)であるが、安全と倫理は依然として低い。
マルチモーダルモデルは全体的な性能が悪く(平均47.5/100; 最高: GPT-5, 54.9/100)、認識力はやや弱い。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:04:55 GMT)
From Low-Rank Features to Encoding Mismatch: Rethinking Feature Distillation in Vision Transformers [10.9] 低ランク構造の利用がいかに効果的で、解釈可能な修復と、コンパクトな視覚変換器のための具体的な設計指導をもたらすかを示す。
そこで本研究では,ViTの特性蒸留が失敗する理由を考察し,低ランク構造の利用が,コンパクトなViTの有効性,解釈可能な改善策,具体的な設計指針を示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:03:21 GMT)
Aligning Generative Music AI with Human Preferences: Methods and Challenges [10.9] 本稿では,音楽生成における選好アライメント手法の体系的適用を提唱する。
これらの手法は、時間的コヒーレンス、調和一貫性、主観的品質評価といった音楽の独特な課題にどのように対処できるかについて議論する。
我々は、インタラクティブな作曲ツールやパーソナライズされた音楽サービスにおいて、好みに合わせた音楽生成を可能にすることを想定する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:12:27 GMT)
MambaTrack3D: A State Space Model Framework for LiDAR-Based Object Tracking under High Temporal Variation [10.6] MambaTrack3Dは、状態空間モデルMamba上に構築された新しいHTV指向のトラッキングフレームワークである。
MambaTrack3Dは、HTV指向トラッカーと通常のシナリオトラッカーの両方を一貫して上回っている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:37:56 GMT)
PeerCoPilot: A Language Model-Powered Assistant for Behavioral Health Organizations [10.5] 行動の健康状態は米国では病気の重荷となっている。
ピアラン行動保健組織(PRO)は、メンタルヘルスサービスと収入、雇用、住宅といったニーズへの支援を組み合わせることで、これらの状況に直面している個人を批判的に支援する。
PeerCoPilotは大規模言語モデル(LLM)を利用したアシスタントで、ピアプロバイダがウェルネスプランを作成し、ステップバイステップの目標を構築し、これらの目標をサポートするための組織リソースを見つけるのに役立つ。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:55:00 GMT)
D4C: Data-free Quantization for Contrastive Language-Image Pre-training Models [10.3] 我々は、ビジョン言語モデル(CLIP)に適した、最初のデータ自由量子化(DFQ)フレームワークであるD4Cを提案する。
D4Cは3つのキーコンポーネントを通して意味的にリッチで構造的に多様な擬似画像を合成する。
実験によりD4Cの有効性が検証され、様々なビット幅とモデルの性能が大幅に向上した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:08:25 GMT)
CroPS: Improving Dense Retrieval with Cross-Perspective Positive Samples in Short-Video Search [10.3] CroPS (Cross-Perspective Positive Samples) は、新しい検索データエンジンである。
ユーザクエリの修正行動から得られる肯定的な信号によるトレーニングを強化する。
CroPSは現在Kuaishou Searchに完全にデプロイされており、毎日数億人のユーザーにサービスを提供している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:57:40 GMT)
MaskMed: Decoupled Mask and Class Prediction for Medical Image Segmentation [10.2] 複数クラス予測をクラス非依存のマスク予測と,共有オブジェクトクエリを用いたクラスラベル予測に分離する,統合された分離セグメント化ヘッドを提案する。
提案手法はMaskMedと名付けられ,AMOS 2022ではnUNetを+2.0%,BTCVでは+6.9%のDiceを上回り,最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:49:02 GMT)
Decentralized Gaussian Process Classification and an Application in Subsea Robotics [10.1] ロボットのチームが、ある場所から別の場所への通信成功確率のマップを、リアルタイムで構築する上での課題に対処する。
この研究の主な貢献は、AUV間で共有される測定値を選択する厳格に派生したデータ共有ポリシーである。
バージニア工科大学690AUVのチームから収集した実音響通信データを用いて,提案手法を実験的に検証した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:26:47 GMT)
Bell Inequality Violation with Vacuum-One-Photon Number Superposition States [10.0] 絡み合いは量子技術の中心的な資源であり、フォトニック絡み合いの実現は物質との相互作用に依存する。
ここでは、単一量子ドットからのRFに基づくエンタングルメント生成の新しい経路を示す。
この重ね合わせをビームスプリッターで非局在化することにより、時間ビンの絡み合いを実現し、クレーター-ホルン-シモニー-ホルトベルの不平等の明確な違反を観察する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:12:55 GMT)
ShelfOcc: Native 3D Supervision beyond LiDAR for Vision-Based Occupancy Estimation [10.0] 我々は、LiDARに頼ることなく制限を克服する、視覚のみのShelfOccを紹介した。
ShelfOccは、ビデオからメートル法的に一貫したセマンティックなボクセルラベルを生成することで、ネイティブな3D空間を監督する。
本手法では,フレーム間の静的な幾何を一貫したフィルタリングと蓄積により,これらの問題を緩和する専用フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:44:13 GMT)
Pharmacophore-based design by learning on voxel grids [9.6] リガンドをベースとした薬物発見は、タンパク質標的に既知のバインダーを用いることで、構造的に多様な分子が結合する可能性がある。
1つの一般的なアプローチは、既知のバインダーの薬胞-形状プロファイルを、ライブラリ分子毎に列挙された3Dコンフォメーションにオーバーレイし、オーバーラップを計算し、高いオーバーラップを持つ多様なライブラリ分子のセットを選択することである。
本稿では,従来の製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社製薬会社社製薬会社社製薬会社社社製の
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:10:04 GMT)
Time series learning in a many-body Rydberg system with emergent collective nonlinearity [9.4] 非平衡相転移に近く、リドバーグ原子は外部摂動に集合的に反応する。
時系列予測のための対話型Rydberg蒸気の応用について検討する。
集団効果が増幅された非平衡相転移に近づき、入力を学習するシステムの能力が向上する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:38:04 GMT)
DCL-SE: Dynamic Curriculum Learning for Spatiotemporal Encoding of Brain Imaging [9.3] 時間近似(DaSE)のための動的カリキュラム学習を導入する
ランクプール符号化を利用して、3次元の脳データを情報に富んだ2次元の動的表現に符号化する。
我々は、動的グループによって指導されたカリキュラム学習戦略を用いてデコーダを訓練する。
DaSEは、精度、予測、解釈可能性において既存の手法を一貫して上回っている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:10:31 GMT)
MedBuild AI: An Agent-Based Hybrid Intelligence Framework for Reshaping Agency in Healthcare Infrastructure Planning through Generative Design for Medical Architecture [9.0] 本稿では,大規模言語モデルと決定論的エキスパートシステムを統合するハイブリッドインテリジェンスフレームワークであるMedBuild AIを紹介する。
ウェブベースのプラットフォームとして、衛星インターネットにアクセス可能な地域であれば、モジュラーで低技術で低コストな医療ビルの設計に関するガイダンスを得ることができる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:33:13 GMT)
DoGCLR: Dominance-Game Contrastive Learning Network for Skeleton-Based Action Recognition [8.9] 既存の骨格に基づく行動認識のための自己教師付きコントラスト学習法は、しばしば全ての骨格領域を均一に処理する。
本稿では,骨格型行動認識(DoGCLR)のためのドミナンスゲームコントラスト学習ネットワークを提案する。
DoGCLRは、正と負のサンプルの構成を動的ドミナンスゲームとしてモデル化し、両方のサンプルタイプが相互作用し、セマンティックな保存と識別力のバランスをとる平衡に達する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:47:01 GMT)
As If We've Met Before: LLMs Exhibit Certainty in Recognizing Seen Files [8.9] COPYCHECKは、不確実性信号を利用して、著作権コンテンツがトレーニングセットで使用されているかどうかを検知する新しいフレームワークである。
我々の手法は、LCM過信を制限から資産に転換し、目に見えない(トレーニングデータ)と見えない(トレーニングデータ)のコンテンツを確実に区別する不確実なパターンをキャプチャする。
実験の結果、COPYCHECKはLLaMA 7bで平均90.1%、LLaMA2 7bで91.6%のバランスの取れた精度を達成した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:24:22 GMT)
Complex-Valued 2D Gaussian Representation for Computer-Generated Holography [8.8] 構造付き複素数値2次元ガウスプリミティブに基づく新しいホログラム表現を提案する。
ホログラムパラメータ探索空間を小さくすることで,次世代のコンピュータ生成ホログラフィシステムにおいて,よりスケーラブルなホログラム推定が可能となる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 01:41:14 GMT)
Benchmarking Multi-Step Legal Reasoning and Analyzing Chain-of-Thought Effects in Large Language Models [8.8] 我々は,M SLRを紹介した。これは,実世界の司法判断に基礎を置いた,中国初の多段階の法的推論データセットである。
M SLR は IRAC フレームワーク (Issue, Rule, Application, Conclusion) を採用し、公式な法的文書からの構造化専門家の推論をモデル化している。
我々は,ステップレベルの詳細な推論アノテーションを効率よく生成する,スケーラブルなHuman-LLM協調アノテーションパイプラインを設計する。
さらなる実験では、モデルによって生成される自己開始型チェーン・オブ・ワットプロンプトが、推論のコヒーレンスと品質を自律的に改善し、人間によって設計されたプロンプトを上回ることが示されている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:24:02 GMT)
Uni-Hema: Unified Model for Digital Hematopathology [8.7] デジタル血液病理学のためのマルチタスク統合モデルUni-Hemaを提案する。
Uni-Hemaは、検出、分類、セグメンテーション、形態予測、および複数の疾患に対する推論を統合している。
本フレームワークはマルチタスクおよびマルチモーダルデジタル血液病理学の新しい標準を確立する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:51:51 GMT)
Look, Zoom, Understand: The Robotic Eyeball for Embodied Perception [8.5] 既存のビジョンモデルと固定RGB-Dカメラシステムは、細かな詳細取得で広域範囲を調整できない。
本研究では,アクティブな視覚知覚のためのロボット眼球であるEyeVLAを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:42:08 GMT)
FairEnergy: Contribution-Based Fairness meets Energy Efficiency in Federated Learning [8.5] 無線エッジシステムにおけるエネルギー効率と公平な参加のバランスをとるためのFairEnergyを提案する。
また,FairEnergyは,ベースライン戦略と比較して最大79%の精度で精度が向上することを示した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:11:44 GMT)
Meta-Black-Box Optimization with Bi-Space Landscape Analysis and Dual-Control Mechanism for SAEA [8.5] この研究は、SAEAを二重レベルに制御する最初のMetaBBOフレームワークと、代理モデル情報をキャプチャするバイスペースERAを紹介する。
DB-SAEAは、様々なベンチマークで最先端のベースラインを上回るだけでなく、高次元設定で見えないタスクに強力なゼロショット転送を示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:43:19 GMT)
HEAD-QA v2: Expanding a Healthcare Benchmark for Reasoning [8.4] HEAD-QA v2は、スペイン語/英語のヘルスケアマルチ選択推論データセットの拡張および更新版である。
スペインの10年間の専門試験から、データセットを12,000以上の質問に拡張します。
結果は,モデルスケールと本質的推論能力が主要因であり,限られた利得を得る複雑な推論戦略が特徴であることが示唆された。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 11:31:32 GMT)
What Color Is It? A Text-Interference Multimodal Hallucination Benchmark [8.4] 本研究では,「色は何か」データセットにおける単一モダリティ視覚幻覚の根本原因について検討する。
このデータセットに基づいて,幻覚を増強するための潜在的な解決策を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:09:33 GMT)
A Tensor Compiler for Processing-In-Memory Architectures [8.4] Processing-In-Memory(PIM)デバイスは、Large Language Models(LLM)を含む機械学習(ML)モデルにおいて、メモリ集約カーネルを加速することができる。
現在のコンパイルアプローチでは、複数のPIMバックエンドにまたがる多様なMLカーネルの体系的な最適化が欠如している。
我々は、データ再構成と計算コード最適化を共同で最適化するPIMシステムのための、最初のデータ中心のMLコンパイラDCCを設計する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:58:16 GMT)
Unveiling Inference Scaling for Difference-Aware User Modeling in LLM Personalization [8.3] 差分対応推論パーソナライゼーションは、推論スケーリングを活用してパーソナライゼーションを強化することで、差分抽出機構を再構築するフレームワークである。
LLMは、関連する特徴次元を自律的に識別し、構造化された定義と記述を生成する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:35:40 GMT)
Task Specific Sharpness Aware O-RAN Resource Management using Multi Agent Reinforcement Learning [8.3] 次世代ネットワークは、動的リソース管理を可能にするためにOpen Radio Access Network (O-RAN)アーキテクチャを利用する。
深層強化学習モデルは、動的環境における堅牢性と一般化性に苦しむことが多い。
本稿では,分散マルチエージェントRL(MARL)フレームワークにおいて,シャープネス・アウェア最小化(SAM)を用いたソフトアクタ批判(SAC)アルゴリズムの新たな資源管理手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 00:55:24 GMT)
A Crowdsourced Study of ChatBot Influence in Value-Driven Decision Making Scenarios [8.2] 世論を形成するソーシャルメディアボットと同様、ChatGPTのようなチャットボットはユーザーに行動を変えるよう説得する。
我々はクラウドソースによる調査を行い、336人の参加者が2つの価値枠のChatBotのうちの1つと相互作用し、米国の防衛費を変更することを決定した。
フレームが自分の価値観と一致しない場合、一部の参加者は元の好みを補強した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 20:25:34 GMT)
Know Your Intent: An Autonomous Multi-Perspective LLM Agent Framework for DeFi User Transaction Intent Mining [8.1] 我々は、ユーザ意図を強く推測するTransaction Intent Miningフレームワークを提案する。
Meta-Level Plannerは、パースペクティブ固有のインテント分析を解決可能なサブタスクに分解する。
認知評価器は幻覚を緩和し、検証可能性を保証する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:15:23 GMT)
HiFusion: Hierarchical Intra-Spot Alignment and Regional Context Fusion for Spatial Gene Expression Prediction from Histopathology [8.0] HiFusionは、2つの補完的なコンポーネントを統合する新しいディープラーニングフレームワークである。
HiFusionは,2次元のスライドワイドクロスバリデーションと,より困難な3次元サンプル固有シナリオの両面において,最先端のパフォーマンスを実現する。
これらの結果は、定期的な病理組織学からのST推論の堅牢で正確でスケーラブルな解としてのHiFusionの可能性を裏付けるものである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:37:46 GMT)
Cross-Balancing for Data-Informed Design and Efficient Analysis of Observational Studies [7.9] クロスバランシング(英語: Cross-balancing)とは、サンプル分割を用いて特徴構造における誤差と重み推定における誤差を分離する手法である。
結果情報の慎重な利用は、解釈可能性を維持しながら、推定と推測の両方を大幅に改善できることを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 21:56:22 GMT)
PLATONT: Learning a Platonic Representation for Unified Network Tomography [7.8] 本稿では、異なるネットワークインジケータを共有潜在ネットワーク状態の投影としてモデル化する統合フレームワークPLATONTを提案する。
合成および実世界のデータセットの実験により、PLATONTはリンク推定、トポロジ推論、交通予測において既存の手法より一貫して優れていることが示された。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:10:32 GMT)
Beluga: Block Synchronization for BFT Consensus Protocols [7.7] 本稿では,インクリメンタルなブロック検索を駆動し,リソース・アウェア交換を強制するシンプルな抽象化であるブロックシンクロナイザの概念を紹介する。
Belugaは、ブロックシンクロナイザのモジュラーで希少なインスタンス化である。
障害下での回復コストと敵の動作を制限しながら、最適な共通ケースレイテンシを実現する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:12:16 GMT)
Optimal control of the future via prospective learning with control [7.6] AIの次のフロンティアは、未来を最適にコントロールすることだ。
この問題に対する現在のアプローチは、典型的には強化学習(RL)または教師付き学習に根ざしている。
ここでは、教師あり学習を拡張して、非定常かつリセットのない環境での学習に対処する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:25:38 GMT)
Generation of spin-squeezed states using dipole-coupled spins [7.5] 量子センシングの感度は、測定においてスピン可観測物がどのように正確に決定できるかに依存する。
量子センサにおけるスピンスクイーズ状態の使用は、適切な測定手順と組み合わせることで、標準量子限界以下の不確実性を低減することができる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 23:45:01 GMT)
Multimodal Wireless Foundation Models [7.4] 我々は、生のIQストリームと画像のような無線モダリティの両方を処理できる最初のマルチモーダル無線基盤モデルを構築した。
画像ベース(人間の活動センシング,RF信号分類,5G NR位置決め)とIQベース(RFデバイス指紋認証,干渉検出・分類)の5つの課題を対象としたモデルの評価を行った。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:26:49 GMT)
The Empowerment of Science of Science by Large Language Models: New Tools and Methods [7.4] 大規模言語モデル(LLM)は、自然言語の理解と生成、画像認識、マルチモーダルタスクにおいて例外的な機能を示した。
本書は, ユーザの視点から, LLMをサポートする中核技術について, 迅速な工学, 知識向上した検索拡張生成, 微調整, 事前学習, ツール学習など, 総合的なレビューを行う。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 11:57:22 GMT)
HSKBenchmark: Modeling and Benchmarking Chinese Second Language Acquisition in Large Language Models through Curriculum Tuning [7.4] 本稿では,大規模言語モデルのステージドモデリングと記述評価のための最初のベンチマークであるHSKBenchmarkを紹介する。
HSKレベル3から6までをカバーし、676万のトークン、16K合成指導サンプル、30のテストトピック、言語的に基礎付けられた評価システムを含む。
我々の微調整LDMは、高度な人間の学習者と同等の性能を示し、人間に似た獲得特性を示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:06:06 GMT)
Mutual Information Bounds in the Shuffle Model [7.3] 本稿では,情報理論の観点から,単一メッセージシャッフルモデルに関する最初の体系的研究について述べる。
シャッフルのみの設定とシャッフルのみの設定の2つのルールを分析した。
シャッフルDP設定では,情報漏洩に関する情報理論上の上限を確立する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:44:59 GMT)
Intelligent Collaborative Optimization for Rubber Tyre Film Production Based on Multi-path Differentiated Clipping Proximal Policy Optimization [7.2] 深層強化学習アルゴリズムについて紹介する:MPD-PPO(Multipathiated Different Clipping Proximal Policy Optimization)
MPD-PPOはチューニング精度と操作効率の両方で大幅に改善されている。
このフレームワークは、高次元性、多目的トレードオフ、動的適応など、重要な課題にうまく取り組みます。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:47:14 GMT)
Cheating Stereo Matching in Full-scale: Physical Adversarial Attack against Binocular Depth Estimation in Autonomous Driving [6.9] 自律運転におけるステレオマッチングモデルに対する最初のテクスチャ対応物理対向攻撃を提案する。
本手法は局所的な2Dパッチベースではなく,グローバルなカモフラージュテクスチャを備えた3D PAEを用いている。
また,これらのカメラの差分効果に対処するため,新しい3次元ステレオマッチングレンダリングモジュールを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:01:31 GMT)
Agentic AI Systems in Electrical Power Systems Engineering: Current State-of-the-Art and Challenges [6.8] エージェントAIシステムは、人工知能において批判的で変革的なアプローチとして登場した。
本稿では,「エージェントAI」の正確な定義と分類について述べる。
本論文では,電気工学を専門とする4つの応用事例について述べる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:49:23 GMT)
Breaking the Bottleneck with DiffuApriel: High-Throughput Diffusion LMs with Mamba Backbone [6.8] 両方向マンバのバックボーン上に構築されたマスク付き拡散言語モデルであるDiffuAprielを紹介する。
この結果から, 双方向状態空間アーキテクチャは, マスク拡散LMの強力なデノイザとして機能することが示唆された。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 23:23:49 GMT)
Vehicle Routing Problems via Quantum Graph Attention Network Deep Reinforcement Learning [6.6] 車両ルーティング問題(VRP)は、物流や流通に広く応用されたインテリジェント輸送システムにおいて、基本的なNPハードタスクである。
本稿では,従来の電車エンコーダの代わりにパラメータ化量子回路(PQC)を用いる量子グラフニューラルネットワーク(Q-GAT)フレームワークを提案する。
実験の結果、Q-GATは従来のGATと比較して、より高速な収束を実現し、ルーティングコストを約5%削減できることがわかった。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:54:38 GMT)
Jointly Conditioned Diffusion Model for Multi-View Pose-Guided Person Image Synthesis [6.4] 複数ビューの先行性を利用した共同条件付き拡散モデル(JCDM)を提案する。
JCDMは可変数の参照ビューをサポートし、標準拡散バックボーンと統合する。
実験は、アートの忠実さとクロスビューの一貫性の状態を実証する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:05:39 GMT)
Uncertainty Makes It Stable: Curiosity-Driven Quantized Mixture-of-Experts [6.2] 本稿では、資源制約のあるデバイス上でのディープニューラルネットワークのための好奇心駆動型量子化混合処理フレームワークを提案する。
われわれの4ビット量子化は、16ビットの精度(0.858対0.859 F1)の99.9%を維持し、4倍の圧縮と41%の省エネを実現している。
我々の情報理論的ルーティングは、適応量子化が精度(0.858 F1, 1.2M params)、エネルギー効率(3.87 F1/mJ)、予測可能なエッジモデルをもたらすことを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:46:45 GMT)
Unveiling Intrinsic Dimension of Texts: from Academic Abstract to Creative Story [6.2] 内在次元(ID)は現代のLLM解析において重要なツールである。
我々は、解釈可能なテキストプロパティにおいて、最初の総合的な研究基盤IDを提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:00:40 GMT)
Towards a Formal Verification of Secure Vehicle Software Updates [6.2] ソフトウェアの脆弱性は、安全性、経済、社会に深刻な影響を与える可能性がある。
UniSUFは、既存の車両インフラとシームレスに統合するセキュアな更新フレームワークを提供するように設計されている。
我々は,UniSUFの必須セキュリティ要件への準拠を正式に検証するProVerifベースのフレームワークを開発する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:35:30 GMT)
Anthropic Economic Index report: Uneven geographic and enterprise AI adoption [6.2] Claudeの利用パターンは、時間とともに、150以上の国、米国各州、そしてAPIを通じてClaudeをデプロイする企業の間で文書化しています。
Claude.aiに関する100万の会話と100万のAPIトランスクリプトのプライバシー保護分析に基づいて、4つの重要な発見を得た。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:41:54 GMT)
Decomposing Theory of Mind: How Emotional Processing Mediates ToM Abilities in LLMs [6.1] ステアリングとベースラインLLMのアクティベーションを比較することで,言語モデルにおけるToMの分解を提案する。
信念帰属タスク(32.5%から46.7%の精度)のパフォーマンスは、感情内容を処理するアクティベーションによって改善されている。
このことは、LSMにおけるToM能力の成功は、分析的推論ではなく、感情的な理解によって媒介されていることを示唆している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 21:56:00 GMT)
Seizure-NGCLNet: Representation Learning of SEEG Spatial Pathological Patterns for Epileptic Seizure Detection via Node-Graph Dual Contrastive Learning [6.0] 薬物耐性てんかん(DRE)発作検出の精度は複雑である。
本稿では,SEEGの相互抑制と信号伝達パターンを学習するためのノードグラフ二重コントラスト学習フレームワークであるSezure-NGCLNetを提案する。
最新の技術性能は, 平均精度95.93%, 感度96.25%, 特異性94.12%である。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 01:33:13 GMT)
What Your Features Reveal: Data-Efficient Black-Box Feature Inversion Attack for Split DNNs [6.0] 中間特徴から高忠実度画像再構成を実現するブラックボックスFIAフレームワークであるFIA-Flowを紹介する。
中間機能内の意味情報を活用するため,我々はLFSAM (Latent Feature Space Alignment Module) を設計した。
また, 1ステップの推論で, 対象多様体にオフマニフォールドな特徴を投影する決定論的逆流マッチング (DIFM) も開発した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:30:38 GMT)
Incremental Maintenance of DatalogMTL Materialisations [6.0] 本稿では,有界区間を持つデータログMTLの逐次推論アルゴリズムであるDRedMTLを提案する。
我々のアルゴリズムは、データログプログラムの実体化を漸進的に更新する古典的DRedアルゴリズムに基づいている。
このアプローチを実装し、いくつかの公開データセットでテストしました。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:30:26 GMT)
SRNN: Spatiotemporal Relational Neural Network for Intuitive Physics Understanding [5.9] 本稿では、ニューラルオブジェクト属性、関係、タイムラインの統一表現を確立するモデルである、時空間ネットワーク(SRNN)を紹介する。
CLEVRベンチマークでは、SRNNは競合性能を達成し、視覚ストリームから重要な言語関係を表現する能力を確認する。
我々の研究は、制約された環境での直感的な物理理解のために、重要なニューラルネットワークをエンジニアリングシステムに翻訳する可能性を確認する概念実証を提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:13:12 GMT)
How To Cook The Fragmented Rug Pull? [5.8] rugプル検出器は単純なワークフローを前提とします – デプロイは流動性プール(LP)トークンを保持して,プールを崩壊させてキャッシュアウトする1ないし数回の大規模な販売(1日以内)を実行します。
実際には、多くの現実世界の出口は、時間次元とアクター次元の両方で攻撃を分割することでこれらの仮定に違反している。
我々は,この攻撃を断裂したラグプル (FRP) として定式化し,緩やかな煮込み牛肉専用にコンパクトなレシピを提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:22:07 GMT)
OEMA: Ontology-Enhanced Multi-Agent Collaboration Framework for Zero-Shot Clinical Named Entity Recognition [5.8] OEMAはマルチエージェントコラボレーションを用いたゼロショット臨床NERフレームワークである。
MTSamplesとVAERSデータセット上での最先端の正確なマッチングパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:02:55 GMT)
Writing With Machines and Peers: Designing for Critical Engagement with Generative AI [5.7] 本研究では,大学院レベルの書記活動において,AIとピアフィードバックを統合した教育設計を提案する。
学生は複数の執筆と修正段階を通じて文献レビュープロジェクトを開発し、カスタムビルドのAIレビュアーと人間ピアからのフィードバックを受けた。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:17:42 GMT)
Parameter Importance-Driven Continual Learning for Foundation Models [5.5] ドメイン固有のポストトレーニングは、しばしば破滅的な忘れ込みを引き起こし、基礎モデルが一般的な推論能力を失う。
PIECEは,ドメイン知識を効率的に学習しながら,汎用性を保った重要度推定に基づく継続性向上手法である。
我々の結果は、破滅的な忘れをすることなく、スケーラブルでドメイン順応的な基礎モデルへの実践的な道のりを浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:07:53 GMT)
BlueBottle: Fast and Robust Blockchains through Subsystem Specialization [5.5] 2層コンセンサスアーキテクチャであるBlueBottleを紹介します。
コア層であるBB-Coreは、中規模のコアバリデータセットと非常に低いファイナリティレイテンシのために、いくつかのフォールトトレランスを交換する。
ガード層であるBB-Guardは、BB-Coreにおける分散的な振る舞い検出と同期回復経路を提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 11:42:43 GMT)
On the Internal Semantics of Time-Series Foundation Models [5.4] 時系列ファウンデーションモデル(TSFM)は、多様な時間領域をまたがって学習するための普遍的なパラダイムとして登場した。
本稿では,これらのモデルが基本時系列概念を表現する内部メカニズムについて考察する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:41:02 GMT)
SymGS : Leveraging Local Symmetries for 3D Gaussian Splatting Compression [5.2] 3Dガウススプラッティングは、その高速なレンダリング速度と忠実さのために、新しいビュー合成において変換技術として登場した。
既存の手法では、類似性の検出と量子化を通じてプリミティブレベルの冗長性を利用する圧縮戦略を導入することでこの問題に対処している。
本研究では,新たな圧縮フレームワークであるSymGSを提案し,現場に学習可能なミラーを導入し,圧縮のための局所的およびグローバル的反射冗長性を排除した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:12:47 GMT)
Based on Data Balancing and Model Improvement for Multi-Label Sentiment Classification Performance Enhancement [5.1] マルチラベル感情分類は、一つのテキスト内で複数の感情を検出することによって、自然言語処理において重要な役割を果たす。
GoEmotionsのような既存のデータセットは、しばしば厳しいクラス不均衡に悩まされ、パフォーマンスを損なう。
我々は、GoEmotionsデータ、Sentiment140からの感情ラベル付きサンプル、手作業による注釈付きテキストを用いて、バランスの取れたマルチラベル感情データセットを構築した。
実験結果は、不均衡なデータで訓練されたモデルと比較して、精度、精度、リコール、F1スコア、AUCを大幅に改善した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:56:35 GMT)
IndicGEC: Powerful Models, or a Measurement Mirage? [5.1] 本稿では,BHASHA-Task 1 の文法的誤り訂正タスクにおける TeamNRC の参加結果について報告する。
異なる大きさの言語モデルのゼロ/ファウショットプロンプトに着目した我々のアプローチは,それぞれ83.78点,84.31点のGLEUスコアで,テルグ語で4位,ヒンディー語で2位を達成した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:24:23 GMT)
Planning in Branch-and-Bound: Model-Based Reinforcement Learning for Exact Combinatorial Optimization [5.1] Mixed-Integer Linear Programming (MILP)は、多くの実世界の最適化(CO)問題の中核にあり、伝統的にブランチ・アンド・バウンド(B&B)によって解決されている。
モデルベース強化学習(MBRL)エージェントであるPlan-and-Branch-and-Bound(PlanB&B)を導入する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:58:56 GMT)
discretize_distributions: Efficient Quantization of Gaussian Mixtures with Guarantees in Wasserstein Distance [5.0] discretize_distributionsはPythonパッケージで、ガウス混合分布の離散近似を構成する。
離散化_分布は計算コストの低い精度で近似することを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 20:23:11 GMT)
Finetuning LLMs for Automatic Form Interaction on Web-Browser in Selenium Testing Framework [5.0] 本稿では,セレンで高品質なテストケースを生成するために,大規模言語モデル(LLM)を訓練するための新しい手法を提案する。
我々は、さまざまな現実世界のフォームやテストシナリオをカバーし、トレーニングと評価のために、合成データセットと人間アノテーションデータセットの両方をキュレートする。
提案手法は, GPT-4o など,すべての評価指標において, 高いベースラインを著しく上回っている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:43:21 GMT)
Comparative Security Performance of Workday Cloud ERP Across Key Dimensions [5.0] 本研究では、重み付きサブメトリック分析と質的文書レビューによる機密性、完全性、可用性、認証、コンプライアンスの5つの重要な側面について検討する。
このプラットフォームは暗号化プロトコル、粒度のアクセス制御、ネットワークセーフガード、そして最小限のアクセスと適応防御を可能にする継続的な認証メカニズムを使用する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:57:37 GMT)
Adapt-As-You-Walk Through the Clouds: Training-Free Online Test-Time Adaptation of 3D Vision-Language Foundation Models [5.0] 3D Vision-Language Foundation Models (VLFMs) は、オープンワールドのポイントクラウド処理タスクにおいて、強力な一般化とゼロショット認識能力を示している。
動的プロトタイプ学習に基づく3次元VLFMのための新しいトレーニング不要オンラインテスト時間適応戦略であるUni-Adapterを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:22:22 GMT)
PCARNN-DCBF: Minimal-Intervention Geofence Enforcement for Ground Vehicles [4.9] 本稿では,PCARNN-DCBFについて紹介する。これは物理符号化された制御-アフィン残差ネットワークとプレビューベースの離散制御バリアを統合した新しいパイプラインである。
一般的な学習モデルとは異なり、PCARNNは車両力学の制御-アフィン構造を明示的に保持し、信頼性の高い最適化に必要な線形性を保証する。
電気および燃焼プラットフォームにわたるCARLAの実験では、この構造保存アプローチが解析的および非構造的神経ベースラインを著しく上回ることを示した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:19:32 GMT)
WarNav: An Autonomous Driving Benchmark for Segmentation of Navigable Zones in War Scenes [4.9] WarNavは、オープンソースのDATTALIONリポジトリのイメージから構築された、新しい現実世界のデータセットである。
このデータセットは、従来の都市交通資源と、危険で損傷を受けた戦域において無人のシステムが遭遇するユニークな運用シナリオの間に重要なギャップに対処する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:32:26 GMT)
Computer Vision Modeling of the Development of Geometric and Numerical Concepts in Humans [4.9] コンピュータビジョンモデルは,大人と同様の幾何学的,数値的概念の潜在表現を学習する。
数の場合,経験を伴う人間の心的数列の表現の出現に,発達的アライメントが現れる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 01:50:35 GMT)
HalluClean: A Unified Framework to Combat Hallucinations in LLMs [4.8] HalluCleanは、大きな言語モデルで幻覚を検出し修正するためのタスクに依存しないフレームワークである。
様々な領域にまたがるゼロショットの一般化を可能にするために、最小限のタスクルーチンプロンプトを使用する。
実験結果から,HaluCleanは事実整合性を大幅に向上し,競争ベースラインを上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:22:50 GMT)
Enhanced Federated Deep Multi-View Clustering under Uncertainty Scenario [4.8] 従来のFederated Multi-View Clusteringは、クライアント間で一様ビューを前提としていますが、実際のデプロイメントでは、不完全な、冗長な、あるいは破損したデータを含む、不均一なビュー完全性を明らかにします。
まず、ローカルなセマンティクス、クライアント内の階層的なコントラスト融合は、セマンティクスの衝突を排除してビューの不確実性を解消する。
実験により、EFDMVCは、複数のベンチマークデータセットにわたる不均一な不確実なビューに対して、優れたロバスト性を実現することが示された。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:16:10 GMT)
HISE-KT: Synergizing Heterogeneous Information Networks and LLMs for Explainable Knowledge Tracing with Meta-Path Optimization [4.8] 知識追跡は、学生の進化する知識状態を掘り下げ、将来の質問応答性能を予測することを目的としている。
異種情報ネットワーク(HIN)に基づく既存手法では,手動によるメタパスの選択やランダムな選択によるノイズの導入が困難である。
我々は,HINをLLMとシームレスに統合する,革新的なフレームワークHIN-LLM Synergistic Enhanced Knowledge Tracing (HISE-KT)を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:24:10 GMT)
Wave-Former: Through-Occlusion 3D Reconstruction via Wireless Shape Completion [4.5] Wave-Formerは、完全に隠された、多様な、日々の物体に対して、高精度な3D形状の再構築を可能にする。
この機能は、ロボット工学、拡張現実、ロジスティクスにまたがる新しいアプリケーションを開くことができる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:37:49 GMT)
Multidimensional scaling of two-mode three-way asymmetric dissimilarities: finding archetypal profiles and clustering [4.4] 多次元スケーリングは、オブジェクト間の相違を可視化し、データ次元を減少させる。
h-プロートのような最近の発展は、非対称的および非反射的関係の解析を可能にする。
この研究はh-plot法を対称的・非対称的・条件的・非条件的両方のフレームワークの下での3方向近接データに拡張する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:10:23 GMT)
CASPER: Cross-modal Alignment of Spatial and single-cell Profiles for Expression Recovery [4.4] 現在のプラットフォームは、実験的な制約と過剰なコストのために、限られた遺伝子だけを測定する。
本研究では,空間的トランスクリプトロミクスにおける未測定遺伝子発現を予測するクロスアテンションベースのフレームワークであるCASPERを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:36:05 GMT)
Learning from the Right Patches: A Two-Stage Wavelet-Driven Masked Autoencoder for Histopathology Representation Learning [4.3] 全スライド画像はデジタル病理の中心であるが、その極端の大きさとアノテーションが不足しているため、自己指導型学習が不可欠である。
本稿では,ウェーブレットインフォームドパッチ選択戦略を通じて,MAEに基づく学習に構造と生物学的関連性をもたらす枠組みを提案する。
WISE-MAEは、弱い監督下で効率を保ちながら、競争力のある表現品質と下流分類性能を実現する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:42:12 GMT)
Orion: A Unified Visual Agent for Multimodal Perception, Advanced Visual Reasoning and Execution [3.9] 視覚に基づく推論とツール拡張実行を統合した視覚エージェントOrionを紹介する。
Orionは、オブジェクト検出、キーポイントのローカライゼーション、パノプティックセグメンテーション、OCR、幾何学解析など、特殊なコンピュータビジョンツール群を編成する。
本システムはMMMU,MMBench,DocVQA,MMLongBench間での競合性能を実現する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 20:07:34 GMT)
RE for AI in Practice: Managing Data Annotation Requirements for AI Autonomous Driving Systems [3.9] 高品質なデータアノテーション要件は、安全で信頼性の高いAI対応システムの開発に不可欠である。
本研究は,アノテーションの要件が定義され,実際にどのように使用されるかを検討する。
主な課題は、曖昧さ、エッジケースの複雑さ、要求の進化、矛盾、リソースの制約である。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 20:27:30 GMT)
Knowledge-Informed Automatic Feature Extraction via Collaborative Large Language Model Agents [3.9] Rogue Oneは知識インフォームド自動特徴抽出のための新しいマルチエージェントフレームワークである。
Rogue Oneは、19の分類と9の回帰データセットからなる総合的なスイートにおいて、最先端の手法を大幅に上回っていることを実証した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:27:14 GMT)
ProRAC: A Neuro-symbolic Method for Reasoning about Actions with LLM-based Progression [3.8] 本稿では,RAC問題に対処するためのニューロシンボリック・フレームワークであるProRACを提案する。
ProRACは問題からアクションや質問を含むRAC要素を抽出する。
いくつかのRACベンチマークでProRACを評価し,本手法が高い性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:20:06 GMT)
Reasoning in Diffusion Large Language Models is Concentrated in Dynamic Confusion Zones [3.7] 本稿では,RL の目標,報酬,計算予算を変更することなく,高平均ステップへの勾配更新を動的に再配置する軽量なステップ選択戦略である Adaptive Trajectory Policy Optimization (ATPO) を提案する。
ATPOは、dLLM RLを進める上で、軌道動力学の活用が鍵であることを示し、ベンチマーク全体にわたって精度とトレーニング安定性の推論においてかなりの向上をもたらす。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:59:34 GMT)
Representation Space Constrained Learning with Modality Decoupling for Multimodal Object Detection [3.6] 本稿では,マルチモーダル検出における核融合劣化の理論的検討を行う。
2つのモジュールからなるRepresentation Space Constrained Learning with Modality Decoupling (RSC-MD)法を提案する。
提案手法は, 核融合劣化を効果的に軽減し, 複数のベンチマークで最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:41:27 GMT)
B+ANN: A Fast Billion-Scale Disk-based Nearest-Neighbor Index [3.5] 本稿では,HNSWアルゴリズムの問題点に対処するため,新しいディスクベースANNインデックスであるB+ANNを提案する。
入力データをセマンティックに類似したアイテムを含むブロックに分割し、B+ツリーの変種を構築し、インメモリとディスクの両方にブロックを格納する。
HNSWよりも品質(リコール値)と実行性能(秒/QPSあたりのクエリ)の両方を改善する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:50:28 GMT)
HinTel-AlignBench: A Framework and Benchmark for Hindi-Telugu with English-Aligned Samples [3.4] インド語の視覚言語モデル(VLM)を評価し,それを英語のパフォーマンスと比較するためのスケーラブルなフレームワークを提案する。
このフレームワークを使ってHinTel-AlignBenchを生成する。HindiとTeluguのさまざまなソースから英語対応のサンプルを描画するベンチマークだ。
ヒンディー語では平均8.3ポイント、テルグ語では5.5ポイントである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:11:00 GMT)
Adaptive thresholding pattern for fingerprint forgery detection [3.4] 指紋の生存度検出システムは、スプーフィングの影響を受けている。
偽の指紋と本物とを区別する技術を開発することが不可欠である。
本稿では,偽しきい値パターンに基づく指紋検出アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:39:38 GMT)
CATCHFed: Efficient Unlabeled Data Utilization for Semi-Supervised Federated Learning in Limited Labels Environments [3.3] フェデレートラーニング(Federated Learning)は、データプライバシを保持しながら分散クライアントリソースを活用する、有望なパラダイムである。
既存のFLアプローチの多くは、クライアントがラベル付きデータを持っていると仮定しているが、現実のシナリオでは、クライアント側のラベルは利用できないことが多い。
クラス難易度を考慮したクライアント対応適応しきい値,疑似ラベル品質向上のためのハイブリッドしきい値を導入し,非擬似ラベルデータを用いて整合正則化を行うtextitCATCHFedを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:17:29 GMT)
Understanding the Nature of Depth-1 Equivariant Quantum Circuit [3.2] 我々は、量子強化学習(QRL)のための効率的なトレーニング最適化であるSIGS(Size-Invariant Grid Search)を提案する。
我々は,RLシミュレーションと解析式を比較すると,総シミュレーション時間を96.4%削減する。
テストセット上のRL学習モデルの0.005の範囲内で平均最適性ギャップを達成する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:23:59 GMT)
Cyclone: Designing Efficient and Highly Parallel QCCD Architectural Codesigns for Fault Tolerant Quantum Memory [3.1] QCCDは、効率的なオール・ツー・オール接続を維持するためにシャットリング操作を必要とする。
我々は、柔軟なリングトポロジーを支持するために、従来の2Dグリッドから離れる円形のソフトウェアハードウェアコードサインであるCycloneを提案する。
HGP符号では、Cycloneは論理誤差率を最大2$times$で改善し、BB符号では、この改善は最大3$times$で達成される。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 22:26:21 GMT)
The Impact of Quantization on Large Reasoning Model Reinforcement Learning [3.0] 大規模強化学習(RL)は、微調整を監督せずに強力な推論能力を得ることができる。
ポストトレーニング量子化(PTQ)と量子化対応トレーニング(QAT)はよく研究されているが、大きな推論モデル(LRM)における量子化がRLに与える影響は未解決のままである。
その結果,量子化を意識したRLトレーニングが学習プロセスに悪影響を及ぼしたのに対し,PTQとQLoRAは高い性能を示した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:50:58 GMT)
Context Cascade Compression: Exploring the Upper Limits of Text Compression [3.0] テキスト圧縮の上限を探索するためにContext Cascade Compression C3を導入する。
圧縮率20倍では,DeepSeek-OCRの約60%と比較して98%の復号精度が得られた。
これは、文脈圧縮の領域において、C3圧縮は光学的文字圧縮よりも優れた性能と実現可能性を示すことを示している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:02:56 GMT)
Fidelity-Preserving Quantum Encoding for Quantum Neural Networks [3.0] 既存の符号化方式は、ノイズ中間スケール量子NISQデバイスの限られた量子ビットに高次元画像を適用する際に、空間情報や意味情報を破棄する。
本稿では、ほぼロスレスなデータ圧縮と量子符号化を行うフィデリティ保存量子保存フレームワークを提案する。
実験の結果、FPQEはMNISTのような単純なデータセットの従来の手法と相容れない性能を示し、より複雑なデータセットの明確な改善を実現している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 11:44:39 GMT)
MF-GCN: A Multi-Frequency Graph Convolutional Network for Tri-Modal Depression Detection Using Eye-Tracking, Facial, and Acoustic Features [3.0] 眼球追跡データは、うつ病群で頻繁に観察される負刺激に対する注意バイアスを定量化する。
音声およびビデオデータは、うつ病の特徴である感情的平坦化と精神運動的遅滞を捉えている。
低周波信号と高周波信号の両方を利用するマルチ周波数グラフ畳み込みネットワーク(MF-GCN)を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:18:53 GMT)
AI-Assisted Writing Is Growing Fastest Among Non-English-Speaking and Less Established Scientists [3.0] 2021年から2024年にかけて、PubMed Centralから200万以上のフルテキストのバイオメディカルパブリッシングを分析した。
AI支援書記のChatGPT後において、言語障壁が最も顕著な状況において、採用が最速に伸びているのを観察する。
AIの利用の増加は生産性の緩やかな増加と結びつき、英語圏と非英語圏の科学者の間での出版ギャップを狭めた。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 21:00:18 GMT)
Image Denoising Using Transformed L1 (TL1) Regularization via ADMM [2.9] TL1正規化復調モデルを開発し、乗算器の交互方向法(ADMM)を用いて解いた。
実験結果から,提案手法は優れた遮音性能を実現し,エッジを保ちながらノイズを効果的に抑制し,画像コントラストを向上することを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:06:03 GMT)
IMACT-CXR - An Interactive Multi-Agent Conversational Tutoring System for Chest X-Ray Interpretation [2.9] IMACT-CXRは、胸部X線を解釈する訓練者を支援する対話型多エージェント会話型チューターである。
アノテーション、視線分析、知識検索、イメージグラウンド推論を1つのAutoGenベースのワークフローに統合する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:32:29 GMT)
Towards Classifying Benign And Malicious Packages Using Machine Learning [2.9] 悪意のあるオープンソースパッケージ検出には、静的、動的解析、あるいはその両方が必要になる。
現在の動的解析ツールには、悪意のあるパッケージと良質なパッケージを区別する自動メソッドがない。
本稿では、動的解析(例えば、実行されたコマンド)から特徴を抽出し、機械学習技術を活用して、パッケージを自動的に良性または悪意として分類するアプローチを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 01:59:11 GMT)
BaGGLS: A Bayesian Shrinkage Framework for Interpretable Modeling of Interactions in High-Dimensional Biological Data [2.8] BaGGLSは、機能相互作用を含む高次元の生物学的推論のための、柔軟で解釈可能な2次回帰モデルである。
BaGGLSは生物学的に関係のある相互作用パターンを明らかにするための有望な手法であり、計算生物学における様々な高次元タスクに適用可能であることを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:48:30 GMT)
Towards Understanding Layer Contributions in Tabular In-Context Learning Models [2.8] 我々はTabPFNとTabICLを「画家としての層」の観点から分析する。
レイヤのサブセットだけが共通の表現言語を共有しており、構造的冗長性と解釈可能性の向上が示唆されている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:39:30 GMT)
Fast Post-Hoc Confidence Fusion for 3-Class Open-Set Aerial Object Detection [2.8] オープンセット検出のための軽量でモデルに依存しない後処理フレームワークを提案する。
マルチ層パーセプトロンを用いて複数の信頼度推定と検出単位の特徴を集約する融合方式を用いる。
本手法は2クラス分類において平均2.7%のAUROCでしきい値ベースラインを超え,オープンセットのmAPを維持するか改善する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 11:03:47 GMT)
TopoReformer: Mitigating Adversarial Attacks Using Topological Purification in OCR Models [2.8] テキストの逆摂動画像は、OCRシステムが人間の目に見えない変化から誤った書き起こしや誤った書き起こしを発生させる可能性がある。
既存の防御、例えば、敵の訓練、入力前処理、あるいは認識後の補正は、しばしばモデル固有であり、計算的に高価であり、摂動しない入力のパフォーマンスに影響する。
TopoReformerは、テキストイメージの構造的整合性を保ちながら、敵対的摂動を緩和するモデルに依存しない改革パイプラインである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:01:51 GMT)
TimeFlow: Towards Stochastic-Aware and Efficient Time Series Generation via Flow Matching Modeling [2.7] 時系列データは、下流の時系列マイニングタスクを幅広くサポートするため、重要な研究トピックとして浮上している。
エンコーダのみのアーキテクチャを統合する新しいフローマッチングフレームワークであるTimeFlowを提案する。
私たちのモデルは、生成品質、多様性、効率において、一貫して強力なベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:01:25 GMT)
Lost in Vagueness: Towards Context-Sensitive Standards for Robustness Assessment under the EU AI Act [2.7] ロバストネスは、EU人工知能法(AI法)に基づくリスクの高いAIシステムにとって重要な要件である
本稿では,AIシステムが堅牢であることの意味を考察し,文脈に敏感な標準化の必要性を示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:06:36 GMT)
Enhancing Chemistry on Quantum Computers with Fermionic Linear Optical Simulation [2.7] 我々は,化学応用に適した量子回路シミュレータを提示し,オープンソース化した。
我々のシミュレーターは、受動フェルミオン線形光学素子と制御相ゲートを含む回路から得られたサンプルのボルンルール確率を計算することができる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:48:20 GMT)
Balancing Natural Language Processing Accuracy and Normalisation in Extracting Medical Insights [2.7] 本研究は,電子カルテからの情報抽出のためのNLP低スループットルールベース手法とLarge Language Models(LLMs)の比較分析を行った。
本研究は, テキスト正規化の欠如と翻訳による情報損失の影響について検討しながら, 患者集団, 臨床所見, 処方薬を抽出し, 双方のアプローチを評価した。
その結果、ルールに基づく手法は、特に年齢や性別の抽出において、情報検索タスクにおいて高い精度を提供することが示された。
LLMは、薬名認識に優れた適応性とスケーラビリティを提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:51:45 GMT)
Dynamic Expert Quantization for Scalable Mixture-of-Experts Inference [2.6] 我々は、専門家の精度を第一級、動的に管理されるリソースとして扱うランタイムシステムDynaExqを提案する。
我々は,DynaExqが5090とA6000のGPU上で大きなLLMをデプロイし,静的な低精度ベースラインに対して最大4.03ポイントの精度向上を実現していることを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 01:27:54 GMT)
Cost-Aware Prediction (CAP): An LLM-Enhanced Machine Learning Pipeline and Decision Support System for Heart Failure Mortality Prediction [2.6] 本稿では,大規模言語モデル(LLM)エージェントによる費用対効果分析を組み合わせたコスト対効果予測(CAP)フレームワークを提案する。
心臓不全患者の1年間の死亡を予測できるMLモデルを構築した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 11:34:47 GMT)
Hyperspectral Image Classification using Spectral-Spatial Mixer Network [2.5] 本稿では,高スペクトル画像(HSI)分類のための軽量かつ効果的なディープラーニングモデルであるSS-MixNetを紹介する。
このアーキテクチャは、局所スペクトル空間特徴抽出のための3次元畳み込み層と、2つの並列スタイルミキサーブロックを統合する。
QUH-TangdaowanとQUH-Qingyunのデータセット上で、ラベル付きデータのわずか1%を用いてモデルを評価する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:48:52 GMT)
Terra Nova: A Comprehensive Challenge Environment for Intelligent Agents [2.5] 文明Vに触発された強化学習(RL)研究のための,新しい総合的課題環境であるTerra Novaを紹介した。
CCEは、複数の標準RL課題が同時に発生する単一の環境である。
これらの集計マルチタスクベンチマークは、エージェントが無関係なポリシーをカタログ化して切り替えられるかどうかを主に評価する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:10:10 GMT)
Continual Reinforcement Learning for Cyber-Physical Systems: Lessons Learned and Open Challenges [2.5] 継続的な学習(CL)は、エージェントが以前に学習した能力に適応し、一般化できるようにすることを目的としている。
これは特に自律運転のようなサイバー物理システムに関係している。
近年のCLの進歩にもかかわらず、強化学習(RL)にうまく適用することは依然として未解決の問題である。
本稿では,自律走行環境における実験に基づく連続RLのオープン課題について述べる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:40:13 GMT)
Efficiency Will Not Lead to Sustainable Reasoning AI [2.5] この論文は、効率だけでは持続可能な推論AIに繋がらないと論じている。
このようなシステムの最適化とガバナンスに明確な限界を埋め込むための研究と政策の方向性について論じる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:23:14 GMT)
German General Personas: A Survey-Derived Persona Prompt Collection for Population-Aligned LLM Studies [2.4] ドイツ総合社会調査(ALLBUS)から構築された総合的かつ代表的なパーソナ・プロンプト・コレクションであるジャーマン・ジェネラル・ペルソナ・コレクション(GGP)を紹介する。
GGPとそのペルソナプロンプトは、全ての種類の大規模言語モデル(LLM)とタスクのプロンプトに簡単に接続できるように設計されており、下層のドイツ人人口に対応する応答を生成するために、モデルを操縦する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:01:02 GMT)
Opinion Dynamics Models for Sentiment Evolution in Weibo Blogs [2.4] われわれは影響力のあるテック系ブログのWeiboを6ヶ月にわたって追跡し、テキストによるフィードバックからフォロワーの感情を定量化した。
感情トラジェクトリは、反復的平均化の原則に従っている。
推測された影響構造は、ホモフィリーから生じる可能性のあるブログ間の相互依存を明らかにしている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:13:39 GMT)
SkyEgg: Joint Implementation Selection and Scheduling for Hardware Synthesis using E-graphs [2.4] 実装の選択とスケジューリングを協調的に最適化する新しいハードウェア合成フレームワークSkyEggを提案する。
SkyEggはVitisで平均3.01倍のスピードアップを実現し、複雑な式では5.22倍に改善されている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:39:45 GMT)
Controlling False Positives in Image Segmentation via Conformal Prediction [2.3] 本稿では,疑似肯定予測の分布自由な画像レベル制御による信頼マスク構築のための簡易なフレームワークを提案する。
本フレームワークは,オーバーセグメンテーションが臨床効果をもたらすような環境で,実用的なリスク対応セグメンテーションを可能にする。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:02:50 GMT)
Hyperspectral Super-Resolution with Inter-Image Variability via Degradation-based Low-Rank and Residual Fusion Method [2.3] マルチスペクトル画像(MSI)によるハイパースペクトル画像の融合は、HSIの空間分解能を高める効果的な方法である。
取得条件が異なるため、スペクトルのばらつきや、HSIとMSIの間の空間的局所的な変化が存在する可能性がある。
既存の方法は通常、直接変換を適用した画像間の可変性を扱う。
本稿では, この課題に対処するために, 劣化に基づく低ランク・残留核融合(DLRRF)モデルを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:45:31 GMT)
GeoShield: Byzantine Fault Detection and Recovery for Geo-Distributed Real-Time Cyber-Physical Systems [2.3] GeoShieldは、地理的に分散したCPSをビザンツ断層から守るためのリソース効率のよいソリューションである。
障害を検出し、境界時間内にシステムを回復し、リソースの少ない安全性を保証する。
信頼できないネットワークの下で効果的に動作する最初の有界時間回復ソリューションである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 01:57:38 GMT)
An Event-triggered System for Social Persuasion and Danger Alert in Elder Home Monitoring [2.3] イベントトリガーシステムは、監視犬、危険通知、写真リンクなどのイベントを検出するために開発された。
高齢者の技術的な経験がないため、直感的な操作はソーシャルメディアを通じて高齢者と親戚のコミュニケーションを生み出すように設計された。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:39:56 GMT)
From Machine Learning Documentation to Requirements: Bridging Processes with Requirements Languages [2.2] 本研究ではまず,一般公開されている20のModelCardsとDataSheetsにおけるRE関連情報の量と性質について検討する。
次に、3つの確立されたRE表現(EARS, Ruppのテンプレート, Volere)が、この知識をいかに効果的に要求に構造化できるかを評価する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:59:28 GMT)
Navigating the Ethical and Societal Impacts of Generative AI in Higher Computing Education [2.2] Generative AI(GenAI)は、エクイティ、学術的完全性、バイアス、データ証明に関連する社会的および倫理的課題を提示する。
本稿では,高等教育におけるGenAIの倫理的・社会的影響を考慮した共同研究の目標,方法論,成果について概説する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:38:28 GMT)
TSFM in-context learning for time-series classification of bearing-health status [2.2] 本稿では,時系列基礎モデル(TSFM)における文脈内学習を用いた分類手法を提案する。
本研究では、TSFMトレーニングデータコーパスに含まれていないデータをどのように分類するかを、モデルを微調整することなく示す。
本手法をサーボプレスモータ内の軸受の健康状態を評価するための振動データに適用する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:01:12 GMT)
Can we use LLMs to bootstrap reinforcement learning? -- A case study in digital health behavior change [2.2] 本研究では,大規模言語モデル (LLM) を用いてユーザインタラクションを生成し,強化学習モデルの訓練に有用な情報を提供することを示す。
4つの大規模行動変化研究から得られた実際のユーザデータを比較として,LLM生成サンプルは実データがない場合に有用であることを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:28:32 GMT)
Path Planning through Multi-Agent Reinforcement Learning in Dynamic Environments [2.1] 動的環境における経路計画のための拡張性のある地域対応強化学習フレームワークを提案する。
本手法は, 環境変化は動的ではあるが, しばしば境界領域内で局所化されるという観察に基づいている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:48:44 GMT)
Oversampling techniques for predicting COVID-19 patient length of stay [2.1] 新型コロナウイルス(COVID-19)は、2019年に世界的なパンデミックを引き起こした呼吸器疾患である。
多くの危険因子を持つ患者の中には、長期の入院や病気による死亡が知られている者もいる。
本稿では、患者の電子健康記録を分析し、新型コロナウイルス感染の重症度を予測する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:38:10 GMT)
From Code Smells to Best Practices: Tackling Resource Leaks in PyTorch, TensorFlow, and Keras [2.1] PyTorch関連の臭いが30個、リソースリークに関連するスニペット/ケラスの匂いが16個特定される。
それぞれの匂いに対して、少なくとも1つのベストプラクティスを導出し、50の推奨コーディングパターンを導出しました。
これは、主要なMLフレームワーク間でリソースリークを誘発するコードの臭いを調べるための、初めての包括的な研究である。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:32:17 GMT)
Smart Manufacturing: MLOps-Enabled Event-Driven Architecture for Enhanced Control in Steel Production [2.1] 鉄鋼プラントのサステナビリティ, 効率, コスト効果を改善するために, スマートマニュファクチャリングのためのディジタルツインベースのアプローチについて検討する。
当社のシステムは,プロセスからリアルタイムセンサデータを,収束したネットワークインフラストラクチャ上でディジタルツインに取り込み,マイクロサービスエッジ計算プラットフォームを基盤としている。
当社のアプローチの鍵となるのは、機械学習操作(MLOps)駆動システムで使用されているDeep Reinforcement学習ベースのエージェントで、システム状態とデジタルツインを自律的に関連付け、プラントの電力設定を最適化することを目的とした修正動作を特定する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:29:43 GMT)
Report on the Scoping Workshop on AI in Science Education Research 2025 [2.1] 報告では、科学教育研究における人工知能(AI)の役割に関する2日間の国際スコピングワークショップの結果を要約している。
AIは科学の実践、教室の学習、そして研究の方法に素早く反応するので、この分野は新たな機会と重要な課題に直面している。
報告書は、トレーニング、インフラ、標準のための実行可能なレコメンデーションと、資金提供者、政策立案者、専門機関、学術部門のガイダンスで締めくくっている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:25:06 GMT)
Mini Amusement Parks (MAPs): A Testbed for Modelling Business Decisions [2.0] ミニ・アミューズメント・パーク(MAP)は、エージェントの環境をモデル化する能力を評価するために設計された遊園地シミュレータである。
我々は、ヒトのベースラインと最先端のLDMエージェントの総合評価を行い、ヒトは、容易モードでは6.5倍、中モードでは9.8倍、これらのシステムより優れていることを発見した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:38:05 GMT)
Cross-Modal Consistency-Guided Active Learning for Affective BCI Systems [2.0] ラベルノイズに対するロバスト性を高める不確実性を考慮したアクティブラーニングフレームワークを提案する。
脳波に基づく不確実性推定のみに頼るのではなく、クロスモーダルアライメントを評価する。
このフィードバック駆動プロセスは、ネットワークを信頼性のある情報的サンプルへと誘導し、ノイズラベルの影響を低減する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:33:48 GMT)
Deep Learning for Accurate Vision-based Catch Composition in Tropical Tuna Purse Seiners [2.0] 電子監視システムで捉えた画像を用いて,マグロとイエローフィンマグロを識別する難易度を定量化する。
そこで本研究では,信頼度の高い接地トラスデータセットを用いて,捕食者の種組成を推定する多段階パイプラインを提案する。
検証の平均精度は0.66$pm$ 0.03、リコールは0.88$pm$ 0.03である。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:26:04 GMT)
SkinGPT-R1: Adapter-Only Dual Distillation for Efficient Dermatology Reasoning [1.9] 皮膚科に焦点を当てた視覚言語モデルであるSkinGPT-R1を提案する。
我々はDermCoTを開発した。DermCoTは1万件のDermEvalフィルターによるトレーニングケースと3000件の皮膚科医による認定ケースを組み合わせた、標準化された皮膚科の思考物語のコーパスだ。
ダームベンチでは、14の一般、推論、医療ビジョン言語モデルにまたがって、SkinGPT-R1は6つの臨床で定義された次元に対して5のうち平均4.031のスコアを達成している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:55:23 GMT)
STREAM-VAE: Dual-Path Routing for Slow and Fast Dynamics in Vehicle Telemetry Anomaly Detection [1.8] STREAM-VAEは、自動車テレメトリ時系列データにおける異常検出のための変分自動エンコーダである。
モデルでは,低速ドリフトと高速スパイク信号のダイナミックスを分離するためにデュアルパスエンコーダと,過渡偏差を表すデコーダを用いる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:58:40 GMT)
Insert In Style: A Zero-Shot Generative Framework for Harmonious Cross-Domain Object Composition [1.6] Insert In Styleは、実用的かつ高忠実な最初のゼロショット生成フレームワークである。
当社のコアコントリビューションは、アイデンティティ、スタイル、コンポジションの表現をアンタングルする新しいマルチステージトレーニングプロトコル(i)、生成時にこのアンタングルを外科的に強制する特殊なマスク付きアテンションアーキテクチャ(ii)の2つの重要な革新を伴う統合されたフレームワークです。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:33:00 GMT)
Infrastructuring Pop-Up Cities with "Social Layer": Designing Serendipitous Co-Livings for Temporary Intentional Communities [1.6] 本稿では,新興都市を対象とした非会議システム「ソーシャル・レイヤ」の設計について検討する。
我々はシャンハイウー(中国・ジャイリン)、ムチャンマイ(タイ・チアンマイ、2023年)、エッジエスメラルダ(ヘラルドスブルク、アメリカ、2024年)、アレフ(ブエノスアイレス、アルゼンチン、2024年)、トリベのガザリング(リスボン、ポルトガル、2024年)で現実世界の展開を研究した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:28:12 GMT)
Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models [1.5] 本稿では,大言語モデル(LLM)の汎用的単一ターンジェイルブレイク手法として,敵対詩が機能することを示す。
25のプロプライエタリでオープンウェイトなモデルで、キュレートされた詩的なプロンプトによって高いアタック・サクセス・レート(ASR)が得られ、一部のプロバイダは90%を超えた。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:14:08 GMT)
Mixed state tomography reduces to pure state tomography [1.5] 量子トモグラフィーにおける長年の信念は、混合状態の推定は純粋な状態の推定よりもはるかに難しいということである。
我々は,この信念に反して,従来の混合状態トモグラフィーが純粋状態アルゴリズムから簡単かつ自然に従うことを示す新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:01:11 GMT)
Constraint-preserving quantum algorithm for the multi-frequency antenna placement problem [1.5] マルチ周波数アンテナ配置問題に対する制約保存量子断熱アルゴリズム(QAA)を提案する。
まず、この量子アルゴリズムの性能をQAAの基本バージョンと比較し、実現可能性と成功確率の点で優れた性能を示す。
この研究は、制約認識アルゴリズムが産業環境における量子メソッドの実用的で効率的な応用に不可欠である、という以前の主張を支持している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:59:20 GMT)
Simulated Human Learning in a Dynamic, Partially-Observed, Time-Series Environment [1.4] 教室環境をシミュレートする時系列環境を,学生と教師の介入で構築する。
我々は、人口情報から引き抜いて学生の個々の状態の学習を組み合わせて強化学習を行う。
我々の方針は、ファイナルのみの構造よりもクイズと中間構造の性能を高めることができる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 01:57:52 GMT)
Modelling and Model-Checking a ROS2 Multi-Robot System using Timed Rebeca [1.3] Timed Rebecaはアクターベースのモデリング言語で、リアクティブ、並列、タイムセマンティクスをサポートする。
本稿では,マルチボットシステムの設計と検証にモデルを使用する方法,モデルチェックを効率的に行うために継続的システムを個別にモデル化する方法を示す。
RebecaとROS2のコードは、複数の自律ロボットシステムをモデル化するための基盤となる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:28:30 GMT)
M, Toolchain and Language for Reusable Model Compilation [1.3] Mは、システムモデリングとマルチターゲットコンパイルをサポートするために設計されたツールチェーンおよびモデリング言語である。
システムエンティティ、メッセージベースのインタラクション、時間または状態トリガーによる反応をモデル化するための構造を提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:21:46 GMT)
Eye Care You: Voice Guidance Application Using Social Robot for Visually Impaired People [1.3] 写真記録機能により、視覚障害者は危険に遭った瞬間に画像をキャプチャできる。
ムードリフト機能は、質問をしたり、音楽を演奏したり、記事を読むことで視覚障害者を伴って機能する。
視覚障害者の身体的不便な状態に対する来訪者への客機能評価
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:34:54 GMT)
Boundary-Aware Adversarial Filtering for Reliable Diagnosis under Extreme Class Imbalance [1.3] AF-SMOTEは、まず少数点を合成し、逆微分器と境界効用モデルによりフィルタする数学的動機付け強化フレームワークである。
決定境界の滑らかさとクラス条件密度を軽度に仮定すると、フィルタリングステップはF_betaのサロゲートを単調に改善する。
MIMIC-IVプロキシラベル予測と標準不正検出ベンチマークでは、AF-SMOTEは強いオーバーサンプリングベースラインよりも高いリコールと平均精度を実現している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:15:58 GMT)
Global Resolution: Optimal Multi-Draft Speculative Sampling via Convex Minimization [1.3] 1つのドラフトモデルから$n$トークンが選択されたとき、最適な投機的サンプリングのためのアルゴリズムを考案する。
提案手法は,生成トークン当たり90%の受信と100ミリ秒未満のオーバーヘッドで,ターゲットモデル分布から無視できないずれを生じさせるマルチドラフトアルゴリズムである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 21:59:43 GMT)
Privacy-Preserving IoT in Connected Aircraft Cabin [1.2] 現代の航空機キャビンのような共有されたマルチベンダ環境におけるIoTデバイスの普及は、データコラボレーションの約束と、乗客のプライバシーに対するリスクの衝突を引き起こす。
本稿では,CSMIMのようなアーキテクチャ上にプライバシ・エンハンシング・テクノロジー(PET)の層を統合することにより,このギャップを埋めるフレームワークを提案し,評価する。
リソース制約のあるハードウェアで高忠実なテストベッドを使用して、データのプライバシ、ユーティリティ、コンピューティングパフォーマンスのトレードオフを定量化する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:41:25 GMT)
Rectifying Mean-Shift in Cascaded Precipitation Nowcasting [1.2] RectiCastは、平均フィールドの修正を局所性の生成から明示的に分離するフレームワークである。
SEVIRとMeteoNetの実験では、RectiCastは既存の最先端メソッドよりも大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:06:30 GMT)
CODE: A global approach to ODE dynamics learning [1.1] データ駆動設定では、ODEの右辺(RHS)を学習する。
この作業では、多項Chaos ODE拡張であるChaosODE(CODE)を紹介します。
Lotka-Volterra システムにおける CODE の性能評価を行った。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:04:24 GMT)
Reflexive Evidence-Based Multimodal Learning for Clean Energy Transitions: Causal Insights on Cooking Fuel Access, Urbanization, and Carbon Emissions [1.1] 本研究では,大規模言語モデルとドメイン特化エージェントを組み合わせて仮説生成とシナリオ探索を支援する,AIベースのフレームワークであるClimateAgentsを紹介する。
このフレームワークは、機械学習に基づく因果推論アプローチを適用して、炭素排出量の主要な決定要因を特定する。
この分析は、農村部におけるクリーンな調理燃料へのアクセス、都市部におけるクリーンな調理燃料へのアクセス、都市部における人口の割合の3つの主要な要因を強調している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 11:02:41 GMT)
WildfireGenome: Interpretable Machine Learning Reveals Local Drivers of Wildfire Risk and Their Cross-County Variation [1.1] 現在の山火事リスク評価は、決定スケールでの解釈性を犠牲にしながら、地域精度を最適化する粗いハザードマップと不透明な機械学習モデルに依存している。
ワイルドファイアジェノムは,1)H3レベル8解像度で,連邦の7つの山火事指標をサインアラインPCAベースの複合リスクラベルに融合する,2)地元の山火事リスクのランダムフォレスト分類を行う,3)郡固有の非線形ドライバー関係を明らかにするためのSHAPとICE/PDP分析を行う,という3つの要素を通じて,これらのギャップに対処する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:35:08 GMT)
A Quantifier-Reversal Approximation Paradigm for Recurrent Neural Networks [1.1] 本稿では,量子化器の順序を逆転する近似パラダイムを基本的に導入する。
各ターゲット関数$f$に対して、固定トポロジと固定重みを持つ単一リカレントニューラルネットワーク(RNN)を構築する。
我々のRNN構造は、基盤となる深いフィードフォワードReLUネットワーク近似理論をエミュレートする。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:43:48 GMT)
When Words Change the Model: Sensitivity of LLMs for Constraint Programming Modelling [1.1] 大きな言語モデルは、古典的なベンチマークのモデルを自動的に生成する素晴らしい結果を示している。
多くの標準CP問題は、これらのモデルのトレーニングデータに含まれる可能性が高い。
LLMは構文的に妥当で意味論的に妥当なモデルを生成することができるが、その性能は文脈的・言語学的に著しく低下する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:26:11 GMT)
Efficient quantum state preparation of multivariate functions using tensor networks [1.0] 次元性に関して効率的なテンソルネットワークアルゴリズムを導入し,ゲート誤差を考慮に入れた。
数値シミュレーションにより、102量子ビットの状態で符号化された17次元ガウス関数や、実験により、54量子ビットの量子プロセッサ上で実現された9次元ガウス関数など、パラダイム的多変量関数を正確に作成できることが示される。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:18:27 GMT)
Topological Quantum Transducers in a Hybrid Rydberg Atom System [1.0] 本稿では,Rydberg原子空洞における単一光子レベルでのマイクロ波-光変換のためのトポロジカルトランスポートプラットフォームを提案する。
この設定はハイブリッド二重モードのJaynes-Cummings (JC) 構成を利用しており、マイクロ波共振器はライドバーグ原子アンサンブルによって媒介される光学キャビティを結合する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:56:33 GMT)
EfficientSAM3: Progressive Hierarchical Distillation for Video Concept Segmentation from SAM1, 2, and 3 [1.0] プログレッシブ階層蒸留(PHD)に基づく効率的なモデル群であるEfficientSAM3を提案する。
PHDは、SA-1B上でのプロンプト・イン・ザ・ループ・トレーニングを通じて、画像の特徴を整列する; (2) テンポラルメモリ蒸留は、SA-V上で訓練されたコンパクトなPerceiverベースのモジュールで高密度メモリを置き換える。
人気の高いVOSデータセットをベンチマークし、さまざまなリライトされた作業と比較し、強力なパフォーマンスと効率のトレードオフを実現しています。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:42:22 GMT)
FRIENDS GUI: A graphical user interface for data collection and visualization of vaping behavior from a passive vaping monitor [1.0] 本稿では,FRIENDSについて紹介する。FRIENDSはオープンソースのデバイスで,その装着によってendSのパフやタッチイベントを記録できる。
FRIENDS GUIはPythonベースのオープンソースツールで、FRIENDSデバイスから24時間のパフィングデータを抽出し、デコードし、視覚化する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 01:18:06 GMT)
Multi-Stage Residual-Aware Unsupervised Deep Learning Framework for Consistent Ultrasound Strain Elastography [1.0] Ultrasound Strain Elastography (USE)は、組織力学的特性を評価するための強力な非侵襲イメージング技術である。
我々は,頑健かつ一貫したひずみ推定のための残差認識・多段階非教師付き逐次ディープラーニングフレームワークであるMUSSE-Netを提案する。
MUSSE-Netは24.54の目標SNR、132.76のバックグラウンドSNR、59.81のCNR、9.73のエラストグラフSNRで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:22:25 GMT)
The Evolving Ethics of Medical Data Stewardship [0.9] プライバシー中心のポリシーは、イノベーションと患者の保護の両方を妨げる。
現在の医療データポリシーは、イノベーションや包摂性よりもプライバシーを優先するデータに対する時代遅れの理解によって形成された20世紀の法律に根ざしている。
倫理的原則は、障害ではなく、機会に合うように適応し、医療実践や医療提供の制約に対処するための対話を促進するべきである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:37:15 GMT)
Fail fast: techniques to probe rare events in quantum error correction [0.9] 我々は,回路雑音下での一般量子低密度パリティチェック符号の希少規則を特徴付ける3つの手法を開発した。
本稿では,最近提案されたRelayデコーダを用いて,高い低エラーレート性能を示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:57:29 GMT)
Near-optimal delta-convex estimation of Lipschitz functions [0.9] 本稿では,雑音観測から未知のリプシッツ関数を推定するためのトラクタブルアルゴリズムを提案する。
フレームワークは、形状制限された回帰に適応するのも簡単です。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:02:30 GMT)
D2D Power Allocation via Quantum Graph Neural Network [0.9] 量子回路グラフ(PQC)を用いたメッセージパッシングを実現する完全量子グラフニューラルネットワーク(QGNN)を提案する。
我々の量子グラフ畳み込み層(QCLG)は、特徴を量子状態にエンコードし、NISQ互換のユニタリを持つグラフを処理し、測定を通して埋め込みを検索する。
このエンドツーエンドのPQCベースのGNNは、量子加速無線最適化への一歩となる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:05:29 GMT)
Front-door Reducibility: Reducing ADMGs to the Standard Front-door Setting via a Graphical Criterion [0.9] フロントドア調整は、古典的なフロントドア基準の下で単純なクローズドフォーム識別式を提供する。
非巡回有向混合グラフ(ADMG)のグラフィカル条件であるフロントドア再現性(FDR)を導入する。
FDR基準の満足度とFDR調整の適用性の間のグラフレベル等価性を証明した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:26:55 GMT)
Semiconductor Industry Trend Prediction with Event Intervention Based on LSTM Model in Sentiment-Enhanced Time Series Data [0.9] この研究の革新は、ディープラーニング手法と感情分析が従来のビジネスモデル分析と予測に組み込まれていることである。
予測結果は,TSMCのウェハ技術の著しい発展と,世界市場における潜在的な脅威を明らかにした。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:36:02 GMT)
GPU-Initiated Networking for NCCL [0.8] 従来のGPU通信は、CPUがすべての通信操作をオーケストレーションするホスト開始モデルに従っている。
本稿では,GINアーキテクチャ,設計,セマンティクスについて述べる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:36:03 GMT)
WaveFuse-AL: Cyclical and Performance-Adaptive Multi-Strategy Active Learning for Medical Images [0.8] サイクル適応型多段階能動学習(WaveFuse-AL)を提案する。
WaveFuse-ALは、学習プロセスを通じて、BALD、BADGE、Entropy、CoreSetといった確立した買収戦略を融合させる。
実験の結果、WaveFuse-ALはシングルストラテジーと交互ストラテジーベースラインの両方を一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:23:23 GMT)
RS-CA-HSICT: A Residual and Spatial Channel Augmented CNN Transformer Framework for Monkeypox Detection [0.8] 本研究では,ResidualとSpatial LearningをベースとしたCNN-Transformerアーキテクチャのハイブリッドな深層学習手法を提案する。
提案するRS-CA-HSICTフレームワークは,HSICTブロック,残留CNNモジュール,空間CNNブロック,CAから構成される。
Kaggleベンチマークと多種多様なMPoxデータセットの実験結果から、分類精度は98.30%、F1スコアは98.13%と報告され、既存のCNNやViTよりも優れていた。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:32:34 GMT)
Sufficient Explanations in Databases and their Connections to Necessary Explanations and Repairs [0.8] 十分説明できるという代替概念を考える。
本稿では、一貫性のないデータベースを扱うために使用されるデータベース修復と、因果関係に基づく必要な説明とを関連づける。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:07:16 GMT)
CID: Measuring Feature Importance Through Counterfactual Distributions [0.8] 本稿では,CID(Counterfactual Importance Distribution)と呼ばれる,ポストホックな特徴重要度評価手法を提案する。
我々は2つの正および負の反事実集合を生成し、ケルネル密度推定を用いてそれらの分布をモデル化し、分布の相似性尺度に基づいて階数特徴を定式化する。
提案手法の有効性を,確立した特徴量説明器との比較により示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 11:57:59 GMT)
Efficient RF Passive Components Modeling with Bayesian Online Learning and Uncertainty Aware Sampling [0.8] 本稿では,RF受動成分のパラメトリックモデリングを効率的に行うための不確実性を考慮したオンライン学習フレームワークを提案する。
このフレームワークは、従来のMLベースのフローと比較して2.86%のEMシミュレーション時間しか使用せず、正確なモデリングを実現し、35倍のスピードアップを実現している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:04:09 GMT)
Exponential Suppression of Transport in Electric Quantum Walks [0.7] 周期電場における翻訳不変量子ウォークの最大群速度の正確なスケーリングを確立する。
本結果から,最大群速度はパラメータ範囲全体の時間とともに指数関数的に減衰することがわかった。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:00:18 GMT)
FLARE: Adaptive Multi-Dimensional Reputation for Robust Client Reliability in Federated Learning [0.7] フェデレートラーニング(FL)は、データのプライバシを維持しながら協調的なモデルトレーニングを可能にする。
ビザンツの攻撃、データ中毒、あるいは適応的な敵行動を通じてモデルの完全性を侵害する悪意のあるクライアントには、依然として脆弱である。
FLAREは,クライアントの信頼性評価を二分決定から連続的多次元信頼評価に変換するアダプティブな評価ベースフレームワークである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 11:55:52 GMT)
Small Language Models for Phishing Website Detection: Cost, Performance, and Privacy Trade-Offs [0.6] フィッシングサイトは大きなサイバーセキュリティの脅威となり、疑わしいユーザーを搾取し、財政的・組織的被害を引き起こす。
従来のフィッシング検出の機械学習アプローチでは、広範な機能エンジニアリング、継続的なリトレーニング、コストのかかるインフラストラクチャメンテナンスが必要になることが多い。
本稿では,HTML コードのみを用いて,フィッシングサイトを検出するための小型言語モデル (SLM) の実現可能性について検討する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:45:07 GMT)
When Can You Trust Bitcoin? Value-Dependent Block Confirmation to Determine Transaction Finalit [0.6] 我々は、取引量とユーザリスク耐性の関数として、Bitcoinにおける金融取引確認の確定性について検討する。
我々は,ブロック深さとフォークによる確認取り消しの確率の関係を確立する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:19:54 GMT)
Quant-Trim in Practice: Improved Cross-Platform Low-Bit Deployment on Edge NPUs [0.6] 特別なエッジアクセラレータは低ビット量子化に依存しているが、ベンダーコンパイラはスケーリング、クリップング、カーネルサポートが異なる。
同じ浮動小数点(FP)チェックポイントは、バックエンド間で一貫性のない精度が得られるため、実践者はフラグやモデルをベンダーフレンドリーなオペレーターサブセットに調整せざるを得ない。
我々は,バックエンドと精度の選択に対してハードウェア中立チェックポイントを生成するトレーニングフェーズであるQuant-Trimを紹介する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:09:02 GMT)
MAIF: Enforcing AI Trust and Provenance with an Artifact-Centric Agentic Paradigm [0.6] 現在のAIシステムは、監査証跡、証明追跡、EU AI Actのような新たな規則で要求される説明可能性に欠ける不透明なデータ構造で運用されている。
動作は一時的なタスクではなく、永続的で検証可能なデータアーティファクトによって駆動される、アーティファクト中心のAIエージェントパラダイムを提案する。
プロダクション対応実装では、超高速ストリーミング(2,720.7MB/s)、最適化されたビデオ処理(1,342MB/s)、エンタープライズレベルのセキュリティが示されている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 04:10:32 GMT)
SIGMMA: Hierarchical Graph-Based Multi-Scale Multi-modal Contrastive Alignment of Histopathology Image and Spatial Transcriptome [0.6] HE画像の階層的表現と空間トランスクリプトームプロファイルを学習するためのマルチモーダルコントラストアライメントフレームワークであるSigmmaを提案する。
細胞間相互作用をグラフとして表現することにより,組織内微小環境内での微細な細胞間相互作用を効果的に捉えることができる。
我々は、Sigmmが、クロスモーダル対応をよりよく捉えた表現を学習し、遺伝子発現予測タスクの9.78%、データセット間のクロスモーダル検索タスクの26.93%の改善をもたらすことを実証した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:22:23 GMT)
Interpretable temporal fusion network of multi- and multi-class arrhythmia classification [0.6] i)局所的・グローバル的抽出と(ii)局所的・グローバル的情報融合からなる枠組みを提案する。
フレームワークの性能は10クラス,4クラスの不整脈検出で評価された。
提案手法は,ローカル情報とグローバル情報の両方を有意な情報損失なく効果的に捕捉する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:09:42 GMT)
Critical Evaluation of Quantum Machine Learning for Adversarial Robustness [0.6] 量子機械学習(QML)における対向ロバスト性の体系化について述べる。
我々は、ブラックボックス、グレーボックス、ホワイトボックスの3つの脅威モデルに代表攻撃を実装した。
本研究は,実用展開のためのセキュアでレジリエントなQMLアーキテクチャの開発を導くものである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 00:13:17 GMT)
Building Robust and Scalable Multilingual ASR for Indian Languages [0.5] 本稿では,インド工科大学マドラス校のSPRING LabがASRU MADASR 2.0チャレンジのために開発したシステムについて述べる。
これらのシステムは、33の方言にまたがる8つの言語間の発話の言語と方言の予測を改善するために、ASRシステムを適用することに焦点を当てている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:17:16 GMT)
FunnyNodules: A Customizable Medical Dataset Tailored for Evaluating Explainable AI [0.5] 我々はFunnyNodulesを紹介した。FunnyNodulesは、医療AIモデルにおける属性に基づく推論の分析のための、完全にパラメータ化された合成データセットである。
データセットは、ラウンドネス、マージンシャープネス、スポーテーションなどの制御可能な視覚特性を有する肺結節状形状を生成する。
本研究では,FunnyNodulesをモデルに依存しない評価に利用して,モデルが属性-ターゲット関係を正しく学習するかどうかを評価する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:37:49 GMT)
Automatic Uncertainty-Aware Synthetic Data Bootstrapping for Historical Map Segmentation [0.5] 深層学習に基づくほとんどの手法は、歴史的地図では利用できない大量の注釈付きトレーニングデータに依存している。
我々は、土地被覆解釈などのタスクに適した、事実上無制限の合成歴史地図をブートストラップする。
提案手法の有効性と適用性を評価するため,ドメイン適応セマンティックセマンティックセグメンテーションに生成されたトレーニングデータセットを用いた。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 21:02:40 GMT)
DINOv3 as a Frozen Encoder for CRPS-Oriented Probabilistic Rainfall Nowcasting [0.5] 予め訓練された衛星ビジョンエンコーダにビデオプロジェクタを取り付け、エンコーダトークンを離散経験CDFにマッピングする。
代替として、3D-UNETベースラインは、合計ランク確率スコアと画素ごとのガンマ・ハードル目標で訓練されている。
Weather4Cast 2025 ベンチマークでは、提案手法は CRPS 3.5102 で有望な性能を達成した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:48:19 GMT)
BrainRotViT: Transformer-ResNet Hybrid for Explainable Modeling of Brain Aging from 3D sMRI [0.4] 本稿では、視覚変換器(ViT)のグローバルコンテキストモデリングと残留CNNの局所的洗練を組み合わせたハイブリッドアーキテクチャである、訓練された視覚変換器(BrainRotViT)のBrain ResNetを提案する。
提案手法は,130以上の取得サイトを含む11個のMRIデータセットに対する3.34年間の検証を達成している。
脳年齢差の分析によると、老化パターンはアルツハイマー病、認知障害、自閉症スペクトラム障害と関連している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:20:23 GMT)
Quantum-Guided Test Case Minimization for LLM-Based Code Generation [0.4] テスト駆動開発(TDD)に基づいたフレームワークを導入し、コード仕様をエンジニアリング最適化タスクに変換する。
このフレームワークはまずLLMにテストスイートを生成するように促し、次にテストケース最小化(TCM)問題を準拘束不能バイナリ最適化(QUBO)モデルとして定式化する。
この研究は、生成AIとソフトウェアエンジニアリングにおける最適化の強力な相乗効果を示し、正確なモデル定式化の重要性を強調している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:00:44 GMT)
Thinking, Faithful and Stable: Mitigating Hallucinations in LLMs [0.4] 大規模言語モデル(LLM)のための自己修正フレームワークを開発する。
最終回答の正しさのみに頼るのではなく、細かな不確実性信号を利用する。
我々は不当な高信頼とエントロピースパイクをペナル化する複合報酬関数を設計する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 23:09:26 GMT)
Reinforcement Learning in Queue-Reactive Models: Application to Optimal Execution [0.4] メタオーダーの最適実行における強化学習の利用について検討する。
目的は、実装不足と市場への影響を最小限に抑えながら、段階的に大規模な注文を実行することである。
我々はキュー・リフレクティブ・モデルを用いて現実的でトラクタブルなリミットオーダーブックシミュレーションを生成する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:26:23 GMT)
CellGenNet: A Knowledge-Distilled Framework for Robust Cell Segmentation in Cancer Tissues [0.3] 我々は,限定的な監督の下で,堅牢なクロスタスクセルセグメンテーションのための知識蒸留フレームワークであるCellGenNetを提案する。
CellGenNetは学生-教師アーキテクチャを採用しており、キャパシティ教師はスパースアノテーションで訓練され、ラベルのない地域でソフトな擬似ラベルを生成する。
様々ながん組織に対する実験により、CellGenNetは、教師付きおよび半教師付きベースラインよりもセグメンテーションの精度と一般化を改善することが示されている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 02:54:55 GMT)
Why Physics Still Matters: Improving Machine Learning Prediction of Material Properties with Phonon-Informed Datasets [0.3] 2種類のデータセットに対して学習したグラフニューラルネットワーク(GNN)モデルの有効性を評価する。
ケーススタディでは,光電子材料の原型ファミリーの電子的および機械的特性を予測するという課題に対処する。
フォノンインフォームドモデルは、データポイントが少ないにもかかわらず、ランダムに訓練されたモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:16:10 GMT)
A Multimodal Transformer Approach for UAV Detection and Aerial Object Recognition Using Radar, Audio, and Video Data [0.3] 無人航空機(UAV)の検出と航空機の物体認識は、現代の監視とセキュリティにとって重要である。
本研究は、新しいマルチモーダルトランスフォーマーモデルの設計と厳密な評価により、これらの課題に対処する。
レーダー、ビジュアルバンドビデオ(RGB)、赤外線(IR)ビデオ、オーディオといった多様なデータストリームを統合している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:22:29 GMT)
IonCast: A Deep Learning Framework for Forecasting Ionospheric Dynamics [0.3] 電離層は地球近傍の空間において重要な要素であり、データセットの正確性、高周波通信、航空活動を形成する。
私たちはIonCastを紹介します。これは、電離圏力学に適したグラフインスパイアされたモデルを含むディープラーニングモデルのスイートです。
IonCastは、機械学習が電離圏変動と宇宙気象の弾力性に関する異種物理的理解を拡大する方法を実証する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 00:58:17 GMT)
QTIS: A QAOA-Based Quantum Time Interval Scheduler [0.2] 提案手法は、アンシラ支援量子回路を統合し、重なり合うタスクを動的に検出し、ペナルティ化する。
その結果、コンフリクトを最小限に抑えつつ、固定時間窓を用いたスケジューリング作業におけるQTISの有効性を確認した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:29:14 GMT)
Towards Evolutionary Optimization Using the Ising Model [0.2] 理論物理学のモデルを用いて、Isingモデルに基づく進化的最適化アルゴリズムを作成する。
提案アルゴリズムは局所最適化の安定な領域を生成し,これらの領域間の改良の可能性を高める。
これにより、グローバルなミニマの正確な識別が可能になり、同等のメソッドを超え、アンサンブルに有望な応用が期待できる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:08:28 GMT)
Coarse-to-Fine Non-Rigid Registration for Side-Scan Sonar Mosaicking [0.2] サイドスキャンソナーモザイクは大規模な海底マッピングにおいて重要な役割を果たしている。
既存の剛性またはアフィン登録法は複雑な変形をモデル化できない。
本稿では,大規模なサイドスキャンソナー画像に適した,粗大な階層的階層的非剛性登録フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:44:31 GMT)
Beyond Uncertainty Sets: Leveraging Optimal Transport to Extend Conformal Predictive Distribution to Multivariate Settings [0.1] コンフォーマル予測(CP)は、有限サンプルカバレッジを保証するモデル出力に対する不確実性集合を構成する。
最適な割り当ては、スコア空間の固定された多面体分割において一括的に一定であることを示す。
これにより、予測セット全体を魅力的に特徴付けることができ、予測セットのより深い制限に対処するための機械を提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:59:01 GMT)
Can MLLMs Detect Phishing? A Comprehensive Security Benchmark Suite Focusing on Dynamic Threats and Multimodal Evaluation in Academic Environments [0.1] 学術機関や研究者は、動的、多言語、文脈に依存した脅威に直面し、高い価値の目標である。
既存のセキュリティベンチマークは、特定の学術的背景情報を含まないデータセットに大きく依存している。
本稿では,学術的な環境下での動的フィッシング攻撃に対するMLLM防御能力を体系的に評価するための統一的方法論フレームワークとベンチマークスイートであるAdapT-Benchを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:30:25 GMT)
Engineering multi-mode bosonic squeezed states using Monte-Carlo optimization [0.1] ボソニック系のハミルトニアン制御系列を効率的に設計するために,モンテカルロに基づく最適化手法を開発した。
具体的には、光格子中のボース・アインシュタイン凝縮体を重力計やグラジオメトリーの応用に関係している。
一般に、ヒルベルト空間内には、中間QFIスケーリングを持つヒルベルト空間の有限の$mathcalO(1)$測度が存在することを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:01:02 GMT)
What Really Counts? Examining Step and Token Level Attribution in Multilingual CoT Reasoning [0.0] 本研究では,多言語LLMにおけるChain-of-Thought(CoT)推論の帰属パターンについて検討した。
ステップレベルの属性に対するContextCiteとトークンレベルの属性に対するInseqの2つの補完属性手法をQwen2.5 1.5B-Instructモデルに適用する。
実験結果から,(1)帰属スコアは最終推論ステップ,特に不正確な世代において過度に強調され,(2)構造化CoTは高解像度ラテン文字言語の精度を著しく向上させ,(3)否定文や散逸文による制御摂動はモデル精度と帰属コヒーレンスを低下させる,といった重要な結果が得られた。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 21:23:58 GMT)
k-Uniform complete hypergraph states stabilizers in terms of local operators [0.0] 局所作用素の線形結合としてk-ユニフォーム完全ハイパーグラフ状態の安定化を表現する新しい方法を提案する。
我々の定式化は、k-一様完全ハイパーグラフに対する安定化器の明示的な記述を提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 22:30:31 GMT)
Work-minimizing protocols in driven-dissipative quantum systems: An impulse-ansatz approach [0.0] 本研究では,高調波オシレータ浴に結合した代表的2レベルシステムに対する最小限の作業プロトコルについて検討する。
インパルスのような特徴は、量子的、非マルコフ的状態において、短時間でほぼ最適である。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:49:17 GMT)
Weather Maps as Tokens: Transformers for Renewable Energy Forecasting [0.0] 現在のアプローチでは、気象パターンの豊富な空間的文脈と時間的進化を統合できない。
この研究は、気象地図をトランスフォーマーシーケンスのトークンとして扱い、再生可能エネルギーを予測する新しいアプローチを導入する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:07:22 GMT)
Two-Faced Social Agents: Context Collapse in Role-Conditioned Large Language Models [0.0] GPT-5は完全な数学の文脈崩壊を示し、最適応答に対する特異な同一性を採用した。
クロード・ソネット4.5はSATアイテムに限定的ではあるが測定可能な役割特異的なバリエーションを保持していた。
全てのモデルは、異なる役割条件の感情的嗜好を示し、認知的制約が緩和されたときに社会影響の変動が再燃することを示した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:04:49 GMT)
Tracking financial crime through code and law: a review of regtech applications in anti-money laundering and terrorism financing [0.0] 規制技術(RegTech)は、アンチマネーロンダリングを強化し、テロリズム(AML CFT)の資金提供に対抗するため、先進的な情報技術を統合することで、金融コンプライアンスを変革している。
近年の文献では、こうした技術は単なる効率ツール以上のものであり、規制のパラダイムシフトと金融監視の進化を表していることが示唆されている。
本稿では,金融犯罪防止におけるRegTechの最近の応用について,主要なコンプライアンス領域に着目して概説する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:51:08 GMT)
TrackStudio: An Integrated Toolkit for Markerless Tracking [0.0] アクセス可能で統合されたソリューションにはギャップがあり、多様な設定にまたがる非専門家の十分なトラッキングを提供する。
TrackStudioは、既存のオープンソースツールを単一のGUIベースのパイプラインに統合することによって、このギャップに対処するために開発された。
自動2Dおよび3Dトラッキング、キャリブレーション、前処理、特徴抽出、可視化を、プログラミングスキルを必要とせずに提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:53:19 GMT)
The impact of multimode sources on DLCZ type quantum repeaters [0.0] 高速での長距離絡み合い生成は、まだ完全に実現されていない主要な量子技術目標である。
1つの実装は、原子アンサンブルメモリと線形光学を組み合わせることで、DLCZスキームの変種を使用することである。
我々は,SPDC源からのマルチモード放射がDLCZスキームに基づく量子リピータに与える影響を考察する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:31:13 GMT)
The Ensemble Kalman Inversion Race [0.0] エンサンブルカルマン法は、当初海洋学における非線形データ同化問題を解くために開発された。
我々は、モデル化された気候統計と観測された気候統計のミスフィットを最小限に抑え、気候モデルパラメータの学習に重点を置いている。
重要な疑問は、どのアンサンブル・カルマン法を気候モデルキャリブレーションに使用するべきかである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 20:18:40 GMT)
The CAPIRE Curriculum Graph: Structural Feature Engineering for Curriculum-Constrained Student Modelling in Higher Education [0.0] 本稿では,CAPIREフレームワーク内に埋め込まれた構造的特徴工学層であるCAPIRE Curriculum Graphを紹介し,学生の誘惑予測を行う。
学生・学期レベルの9つの構造的特徴を抽出し、学生が時間とともに必要なネットワークをナビゲートする方法を捉える。
これらの特徴には、バックボーン完了率、ボトルネック承認率、不完全な前提条件によるクレジットのブロック、卒業までのグラフ距離が含まれる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:33:00 GMT)
Tensor-network approach to quantum optical state evolution beyond the Fock basis [0.0] 非線形光学系の力学を効率的に捉えるテンソル・ネットワーク手法を提案する。
行列積状態(MPS)形式を用いることで、量子状態と演算子は共に高度に圧縮された形で符号化される。
この枠組みは、マルチモード量子光と非線形光学現象をモデル化するためのスケーラブルな経路を開く。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:58:18 GMT)
Stochastic unravelings for trace-nonpreserving open quantum system dynamics [0.0] 任意のトレース非保存マスター方程式に断片的決定論的解を拡張できる汎用フレームワークを提案する。
このアプローチには、特別な場合として、ハイゼンベルク図形における任意の力学の解法が含まれる。
これは異なる解のスキームと非マルコフ系における逆ジャンプと互換性がある。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:10:27 GMT)
Standardising the NLP Workflow: A Framework for Reproducible Linguistic Analysis [0.0] 脳画像データ構造(BIDS)にインスパイアされた言語処理データ構造(LPDS)を提案する。
次に,言語処理の合理化を目的としたモジュール型神経科学およびPythonパッケージであるペリカンnlpを紹介する。
処理ワークフロー全体は単一の共有可能な構成ファイル内で指定可能で、ペリカンnlpはLPDS形式のデータ上で実行される。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:06:08 GMT)
Securing AI Agents Against Prompt Injection Attacks [0.0] 本稿では,RAG対応AIエージェントのインジェクションリスク評価のためのベンチマークを提案する。
本フレームワークは,攻撃速度を73.2%から8.7%に削減し,94.3%のベースラインタスク性能を維持した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:00:54 GMT)
Scalable Privilege Analysis for Multi-Cloud Big Data Platforms: A Hypergraph Approach [0.0] 本稿では,NISTの次世代アクセス制御(NGAC)とハイパーグラフセマンティクスを統合した新しいPAMフレームワークを提案する。
本稿では,アタックサーフェス,アタックウインドウ,アタックIDを含む3次元Privilege Analysisフレームワークを導入し,特権的脆弱性を体系的に識別する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:53:15 GMT)
SURFing to the Fundamental Limit of Jet Tagging [0.0] 生成モデルを検証する新しいアプローチであるSURF(SUrrogate ReFerence)法を提案する。
我々は、EPiC-FM生成モデルがJetClassジェットの有効なサロゲート参照であり、現代のジェットタグが真の統計的限界に近づいていることを示すためにSURFを適用していると論じる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:00:00 GMT)
Reversing Quantum Noise: Quantum Reverse Diffusion for Pauli Channels [0.0] 連続監視されたパウリ流路の正確な逆拡散ダイナミクスについて検討した。
我々の結果は、生成モデリングにおいて顕著な非線形古典的逆拡散と線形量子力学のギャップを埋めるものである。
これは拡散駆動型量子ゲートの理論的枠組み、前方逆サイクルによる量子トモグラフィー、および逆拡散に基づく量子エラー補正の潜在的なパラダイムを確立する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 22:57:38 GMT)
Resource-Based Time and Cost Prediction in Project Networks: From Statistical Modeling to Graph Neural Networks [0.0] 本研究では,プロジェクト活動のネットワーク表現をグラフニューラルネットワーク(GNN)と統合した新しい資源ベース予測フレームワークを提案する。
提案したGNNフレームワークは,従来の回帰法や木に基づく手法と比較して平均的な絶対誤差を23~31%削減する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 00:56:12 GMT)
Relativistic Covariance and Nonlinear Quantum Mechanics: Tomonaga-Schwinger Analysis [0.0] 我々は、局所ハミルトン密度に対する状態依存的な付加が相対論的共独立性にいつ違反するかを決定するために、量子場理論の友長=シュウィンガー(TS)の定式化を用いる。
我々は、量子力学の状態分散変化から生じるフレシェ微分項を含む、葉の独立に必要とされる新しい作用素積分性条件を導出する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 23:56:32 GMT)
Real-time Scattering in φ^4 Theory using Matrix Product States [0.0] 相互作用する4$量子場理論の1+1$次元における臨界挙動とリアルタイム散乱ダイナミクスについて検討する。
0.8$の有限絡み合いのスケーリング解析は、臨界質量二乗を[-0.3190,-0.3185]$で$_c2に束縛し、対称性、ほぼ臨界、弱破壊、深く壊れた規則の定量的マップを提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 18:55:00 GMT)
Quantum-Assisted Graph Domination Games [0.0] サイクルグラフ上での1ステップのグラフ支配ゲームにおける量子優位性について,解析的に,ノイズのある中間スケール量子(NISQ)プロセッサを用いて検討する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:00:08 GMT)
QADR: A Scalable, Quantum-Resistant Protocol for Anonymous Data Reporting [0.0] 将来の大規模IoTネットワークのセキュリティは、Decrypt Laterの攻撃パラダイムであるHarvest Nowによって著しく脅かされている。
本稿では,この課題に対して,理論的ベンチマークと高性能アーキテクチャを提供するハイブリッドフレームワークであるQuantum Anonymous Data Reportingプロトコルを紹介する。
我々は,このプロトコルが性能ベンチマークとして重要な優位性を証明し,将来の量子セキュアな匿名システムのための高性能な目標を確立する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:37:19 GMT)
Physics-Based Benchmarking Metrics for Multimodal Synthetic Images [0.0] BLEU、CIDEr、VQAスコア、SigLIP-2、CLIPScoreといった最先端技術は、しばしば意味や構造的精度を捉えることができない。
本稿では,大規模言語モデルと推論を組み合わせた物理制約付きマルチモーダルデータ評価(PCMDE)手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:52:20 GMT)
Phase evolution of superposition target states in adiabatic population transfer [0.0] 最終状態が2つの非退化状態の重ね合わせである場合, 刺激されたラマン断熱通路 (STIRAP) を考える。
最終重ね合わせの相対位相は, 断熱伝達パルスの相対振幅, 幅, タイミングに依存する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:53:19 GMT)
Particle Monte Carlo methods for Lattice Field Theory [0.0] 我々は,GPU加速粒子法,Sequential Monte Carlo (SMC) とNested sample が,最先端のニューラルサンプリングと一致する,あるいは性能の優れた古典的ベースラインを提供することを示した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:31:46 GMT)
Parity anomalies in 2+1-dimensional Aharonov-Bohm type configurations [0.0] 2+1次元のディラックフェルミオンはアハラノフ・ボーム型位相位相相として現れるパリティ異常を示す。
誘導トポロジカル電流を明示的に計算し、その特徴的な発散のない形式がこのパリティアノマラストポロジカル位相の直接的シグネチャを提供することを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:51:13 GMT)
Overview of Routing Approaches in Quantum Key Distribution Networks [0.0] 量子鍵分配(QKD)ネットワークは、量子力学的原理を用いて、無条件で安全な鍵交換を可能にする。
暗号鍵をマルチホップ量子ネットワークにルーティングすることは、量子通信に特有の課題をもたらす。
本調査は,2013年から2024年にかけて提案された地上・衛星・ハイブリッドQKDインフラにおける26のルーティング戦略を分析し,分類する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:24:15 GMT)
NuBench: An Open Benchmark for Deep Learning-Based Event Reconstruction in Neutrino Telescopes [0.0] ニュートリノ望遠鏡における深層学習に基づくイベント再構成のためのオープンベンチマークであるNuBenchを紹介する。
NuBenchは、約1億3000万の電荷と中性電流のミューオンニュートリノ相互作用を含む7つの大規模なシミュレーションデータセットで構成されている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:23:15 GMT)
Novel sparse matrix algorithm expands the feasible size of a self-organizing map of the knowledge indexed by a database of peer-reviewed medical literature [0.0] 我々は,Medlineデータセット全体に対して自己組織化マップを適用可能なスパース行列乗法の新しいアルゴリズムを開発した。
このアルゴリズムはまた、データセットの変更を経時的に考慮するために自己組織化マップを精錬する可能性を高める。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:26:04 GMT)
Note on Logical Gates by Gauge Field Formalism of Quantum Error Correction [0.0] 論理ゲートは電場および磁気ゲージ場の指数的量子ビットとして表現できることを示す。
この結果から, 量子誤差補正, トポロジー, 量子場理論の相互作用に関する新たな知見が得られた。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:23:50 GMT)
Nonclassicality of a Macroscopic Qubit-Ensemble via Parity Measurement Induced Disturbance [0.0] 電磁共振器は、クビットアンサンブルのパリティを探査するために用いられる。
アンサンブルの全角運動量と比較して、$hbar rightarrow 0$であるとしても、MRの一定の量の違反が見つかる。
我々は,コプラナー導波路共振器に結合した様々な量子ビットを用いた実装の概要を述べる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 21:15:54 GMT)
Noise-Robust Abstractive Compression in Retrieval-Augmented Language Models [0.0] 抽象圧縮は、より小さなランガウジュモデルを用いてクエリ関連コンテキストを凝縮する。
検索された文書は、しばしば、クエリに答えることに関係のない情報や、事実の不正なコンテンツのために誤解を招く情報を含んでいる。
ACoRNは、多くの精度でドキュメントを削減したデータセットを抽出し、現実世界のシナリオで非常に有用である。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 00:51:27 GMT)
Neural network-driven domain decomposition for efficient solutions to the Helmholtz equation [0.0] 波動伝播の正確なシミュレーションは、音響学、電磁磁気学、地震解析などの分野において重要である。
従来の数値法は、有限差分法や有限要素法のように、ヘルムホルツ方程式のような偏微分方程式(PDE)を解くために広く用いられている。
本研究では、FBPINN(Finite Basis Physics-Informed Neural Networks)とその多レベル拡張を有望な代替手段として検討する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:58:32 GMT)
Navigating Quantum Missteps in Agent-Based Modeling: A Schelling Model Case Study [0.0] 本稿では, ABM 状態観測を直接 QUBO の定式化に変換する標準的な手法は量子的優位性をもたらすことができないことを示す。
従来のABM実装では、各イテレーションでシステムの状態を観察し、計算上の優位性に必要な量子重ね合わせを体系的に破壊する。
この構造的再概念化は、従来のABMシミュレーションやQUBOの定式化で隠されたネットワーク対称性を利用するアルゴリズムをもたらす。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:24:43 GMT)
Multi-Agent LLM Orchestration Achieves Deterministic, High-Quality Decision Support for Incident Response [0.0] 大規模言語モデル(LLM)は、本番システムにおけるインシデント応答を加速することを約束する。
しかし、単一エージェントアプローチは曖昧で使用不能なレコメンデーションを生成する。
コンテナ化されたフレームワークであるMyAntFarm.aiを紹介し、マルチエージェントオーケストレーションがインシデント応答の品質を変えることを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:06:11 GMT)
Model-to-Model Knowledge Transmission (M2KT): A Data-Free Framework for Cross-Model Understanding Transfer [0.0] ニューラルネットワーク間のデータ自由な概念伝達のための新しいパラダイムであるM2KT(Model-to-Model Knowledge Transmission)を紹介する。
古典蒸留とは異なり、M2KTは主に例空間ではなく概念空間で機能する。
M2KTは、標準的な知識蒸留と比較して、データ使用量を98%以上削減しながら、教師のパフォーマンスの約85~90%を達成できる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:43:25 GMT)
Mesh-based Super-resolution of Detonation Flows with Multiscale Graph Transformers [0.0] 反応流のメッシュベース超解像のためのマルチスケールグラフトランスフォーマ手法を開発した。
SR-GTは、従来のSRスキームと比較して、フローフィールドの特徴に反応する高解像度の精度と優れた性能を提供する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:56:02 GMT)
Mathematical Analysis of Hallucination Dynamics in Large Language Models: Uncertainty Quantification, Advanced Decoding, and Principled Mitigation [0.0] 大型言語モデル(LLM)は強力な言語エンジンであるが、幻覚の影響を受けやすい。
我々はこれらの幻覚を理解し、測定し、緩和するための数学的基盤の枠組みを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 00:58:36 GMT)
Making Evidence Actionable in Adaptive Learning Closing the Diagnostic Pedagogical Loop [0.0] 本研究では,インストラクターによるフィードバックループを裏付けるエビデンスを提示し,概念レベルの評価エビデンスを精査されたマイクロインターベンションに変換する。
適応学習アルゴリズムは、ギャップ閉鎖のハードな保証としての妥当性、時間と冗長性の予算付き制限としての注意、単一リソースへの過度な適合に対する保護としての多様性の3つのセーフガードを含む。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:05:10 GMT)
MAPROC at AHaSIS Shared Task: Few-Shot and Sentence Transformer for Sentiment Analysis of Arabic Hotel Reviews [0.0] 本稿では,AHaSIS共有課題に対する我々のアプローチについて述べる。
このデータセットはモロッコ方言とサウジアラビア方言で書かれたホテルレビューで構成されており、レビュー担当者の感情を肯定的、否定的、中立的なものに分類することを目的としている。
公式評価では,26名中12名中73%のF1を達成した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 09:56:16 GMT)
Latent space analysis and generalization to out-of-distribution data [0.0] 潜在空間OOD検出とモデルの分類精度の関連について検討する。
我々は,OOD検出がモデル性能のプロキシ尺度として使用できないことを実証的に実証した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 01:23:34 GMT)
LaguerreNet: Advancing a Unified Solution for Heterophily and Over-smoothing with Adaptive Continuous Polynomials [0.0] LaguerreNetは連続的なLaguerres Neuralsに基づく新しいGNNフィルタである。
オーバースムーシングには極めて堅牢で、パフォーマンスはK=10で、ChebyNetが崩壊する範囲を超えている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:47:23 GMT)
KrawtchoukNet: A Unified GNN Solution for Heterophily and Over-smoothing with Adaptive Bounded Polynomials [0.0] ChebyNetのようなフィルタに基づくスペクトルグラフネットワーク(GNN)には、2つの限界がある。
離散的なKrawtchouksに基づくGNNフィルタであるKrawtchoukNetを提案する。
この適応性により、KrawtchoukNetは、挑戦的なベンチマークでSOTA性能を達成することができることを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:47:15 GMT)
Intelligent Inverse Design of Multi-Layer Metasurface Cavities for Dual Resonance Enhancement of Nanodiamond Single Photon Emitters [0.0] ナノダイヤモンド中の窒素空孔中心に基づく単一表面光子エミッタ(SPE)は、量子ナノフォトニクス応用の有望な基盤である。
我々は,ハイブリッドディープニューラルネットワークアーキテクチャに基づく人工知能駆動の逆設計フレームワークであるNanoPhotoNet-Inverseを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:48:40 GMT)
Inhomogeneous SSH models and the doubling of orthogonal polynomials [0.0] シーケンスの二重化法を用いてSu-Schrieffer-Heeger(SSH)モデルの解析を行う。
このアプローチは、モデルの分析スペクトルと正確な固有状態をもたらす。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:23:37 GMT)
Identifying the Supply Chain of AI for Trustworthiness and Risk Management in Critical Applications [0.0] Gapは、現代のAIシステムの出力に寄与するデータソース、事前訓練されたモデル、エージェント、サービス、その他のシステムの複雑なWebに関連するサプライチェーンリスクの体系的評価に存在する。
我々は、AIのサプライチェーンとAIシステムの振る舞いとアウトプットに関連するリスクに着目し、AIリスク評価と管理の現状を調査する。
本稿では,AIサプライチェーンを分類するための分類法を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:52:02 GMT)
How "Quantum" is your Quantum Computer? Macrorealism-based Benchmarking via Mid-Circuit Parity Measurements [0.0] マクロリアリズム(MR)の振動はIBM QC上で最大$N = 38$ qubitsまで検出され、MRの最もよく知られた結果よりもN$が1桁増加する。
提案したNDC測定値を用いて2つのQCをベンチマークし、量子度を1世代から次の世代に3倍改善したことを示す。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 21:15:54 GMT)
Gleason's Theorem for a Qubit as Part of a Composite System [0.0] 我々は、Gleasonの定理を、合成量子系を記述する標準公理を呼び出すことによって、キュービットの2次元ヒルベルト空間に拡張する。
測定結果に割り当てられる確率は、システム自体に考慮されているか、より大きなシステムのサブシステムとして考慮されているかに依存してはならない。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:53:58 GMT)
Gini Score under Ties and Case Weights [0.0] Giniスコアは、リスクランキングを評価することができるランクベースのスコアである。
本稿では,リスクランキングの関連性において,ジニスコアをどのように活用できるかを論じる。
我々はケースウェイトを持つ一般的なアクチュアリな状況にGiniスコアを適応させる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:01:12 GMT)
Generation of 10-dB squeezed light from a broadband waveguide optical parametric amplifier with improved phase locking method [0.0] 周期偏極ニオブ酸リチウム(PPLN)光導波路光パラメトリック増幅器(OPA)からの10.1pm-0.2dB励起光の発生を報告した。
我々は、位相ロック信号を得るために、シャープされた光の一部をタップする必要のない新しい位相検出技術を導入する。
これらの改良により、位相変動角は14 mrad から9 mrad に減少し、総光損失は12% から8% に減少する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 03:43:44 GMT)
GLOBE: Accurate and Generalizable PDE Surrogates using Domain-Inspired Architectures and Equivariances [0.0] GLOBEは、学習可能なグリーン関数のようなカーネルの重ね合わせとして、境界面からターゲットへ評価されるソリューションである。
AirFRANSでは、GLOBEは相当な精度向上を実現している。
結果は、厳密な物理学とドメインにインスパイアされた帰納的バイアスが、精度、一般化可能性、実用性に大きな利益をもたらすことを示した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 20:23:51 GMT)
Exponential Lasso: robust sparse penalization under heavy-tailed noise and outliers with exponential-type loss [0.0] 本稿では,ラッソフレームワーク内に指数型損失関数を統合する,新しいロバストな手法を提案する。
指数ラッソは、古典ラッソを理想的な条件で整合させて、強い統計的収束率を達成することを示す。
数値実験により, 提案手法は競争力が高く, 汚染された環境下では古典ラッソよりも優れ, ガウス雑音下においても強い性能を維持していることが示された。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:50:46 GMT)
Exploring Syntropic Frameworks in AI Alignment: A Philosophical Investigation [0.0] AIアライメントは、プロセスベース、マルチエージェント、開発メカニズムを通じて、シントロピックで理由対応のエージェントを設計するものとして再認識されるべきである、と私は主張する。
コンテンツベースの値仕様が構造的に不安定なように見える理由を示す、仕様トラップの議論を明確にする。
マルチエージェントアライメントのダイナミクスを理解するための情報理論の枠組みとして, シントロピーを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 23:31:29 GMT)
Explicit Connections Between Krylov and Nielsen Complexity [0.0] 我々は、クリロフ基底をニールセン幾何学の基本ゲート集合の一部とすることで、クリロフとニールセンの複雑性の直接対応を確立する。
正規化に関して、エルミート作用素のクリロフ複雑性はユニタリ多様体上の直線軌跡の長さ2乗に等しい。
対応する長さは、直線が極小測地線であるときに飽和するニールセン複雑性の上限を与える。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:00:07 GMT)
Event-based Data Format Standard (EVT+) [0.0] イベントベースのセンシング(EBS)ハードウェアは、多くの商業、工業、防衛アプリケーションにおいて足場を見つけながら急速に普及している。
独自のデータスキーマを生成可能な,新たなセンサハードウェアを提供するベンダも期待されている。
この文書の目的は、収集されたEBSストリーミングデータの標準を特定し提供することである。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:49:06 GMT)
Entropy-Based Measurement of Value Drift and Alignment Work in Large Language Models [0.0] 大きな言語モデルの安全性の主な障害は、分散シフトによる価値の漂流、ジェイルブレイク攻撃、デプロイメントにおけるアライメントの遅さである。
我々はこのフレームワークを大規模言語モデルで運用する。
我々は5方向の行動分類を定義し、モデル転写物から倫理的エントロピーS(t)を推定するために分類器を訓練し、ベースおよび命令調整された変種に対するエントロピーダイナミクスを測定する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:27:16 GMT)
Efficient Score Pre-computation for Diffusion Models via Cross-Matrix Krylov Projection [0.0] 本稿では,スコアベース拡散モデルを高速化する新しい枠組みを提案する。
まず、標準の安定拡散モデルをフォッカー・プランクの定式化に変換し、各画像に対する大きな線形系を解く。
中心となる革新は、行列間の数学的類似性を利用するクロス行列クリロフ射影法である。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 07:21:49 GMT)
EEG Emotion Recognition Through Deep Learning [0.0] テスト精度は91%に達し、SVM、DNN、ロジスティック回帰といった従来のモデルを上回った。
このモデルでは、62の5電極のみを利用することで、EEG装置の要求を低減できる。
この進歩は、メディアコンテンツ消費によって引き起こされる気分変化の今後の探索の土台となる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 22:14:05 GMT)
Do Large Language Models (LLMs) Understand Chronology? [0.0] 大規模言語モデル(LLM)は、金融や経済学においてますます使われており、ルックアヘッドバイアスに対する迅速な試みは、モデルが時系列を理解することを暗黙的に仮定している。
我々は、モデルが事前学習から既に知っている事実よりも複雑さが増大する一連の時系列順序タスクで、この基本的な問題を検証する。
GPT-4.1, Claude-3.7 Sonnet, with and without Extended Thinking (ET) and GPT-5 across multiple reasoning-effort settings。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 17:19:20 GMT)
Data-driven Prediction of Species-Specific Plant Responses to Spectral-Shifting Films from Leaf Phenotypic and Photosynthetic Traits [0.0] 温室へのスペクトルシフトフィルムの適用は、作物種間で異なる成長反応を示した。
光品質の変化による作物の収量向上は、各種の特定の生物物理学的特性の集団的影響に関連している。
本研究は, 作物の生理的応答と, SF下での生育成績を考慮し, 複数の植物形質特性と日光積分を包括的に関連付けることを目的とする。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 06:51:27 GMT)
Corporate Earnings Calls and Analyst Beliefs [0.0] 決算報告から抽出した物語が、実現した利益とアナリストの予測の両方を著しく改善していることを示します。
本稿では,大規模言語モデルが対ファック・トゥル文字を生成する新しいテキストモーフィング手法を提案する。
アナリストは感情に過度に反応し(最適化)、リスクと不確実性の物語に過度に反応する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:06:46 GMT)
Convergence and Sketching-Based Efficient Computation of Neural Tangent Kernel Weights in Physics-Based Loss [0.0] 適応的 NTK 重みによる勾配勾配の上昇は,適切な意味で収束することを示す。
次に,予測器-相関器アプローチと行列スケッチに着想を得たランダム化アルゴリズムを開発することにより,計算効率の問題に対処する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:29:42 GMT)
Characterizing entanglement at finite temperature: how does a "classical" paramagnet become a quantum spin liquid? [0.0] 量子スピン液体(Quantum spin liquid, QSL)は、崩壊する対称性ではなく、内部の絡み合いのパターンによって区別される物質相である。
本稿では, エンタングルメントの深さと空間構造の両方を特徴付ける手法を提案する。
その結果, 高温常磁性体内のスピンが最初に絡み合う温度と, その基底状態の構造的多部交絡特性を最初に発達する温度の両方を評価できることがわかった。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:50:11 GMT)
Can Artificial Intelligence Accelerate Technological Progress? Researchers' Perspectives on AI in Manufacturing and Materials Science [0.0] 本稿は、AIおよび機械学習(ML)技術に経験した研究者を対象に、米国拠点の学術的製造・材料科学への32回のインタビューの結果を報告する。
インタビュアーは主に、材料や製造プロセスのモデリングにAIを使用し、材料や製造プロセスなどのデザインスペースのより安価で迅速な探索を可能にした。
インタビュアーは、AI/MLツールは、高密度データがすでに利用可能であるデザインスペースの外では信頼できない、古い研究手法と相まって熟練した司法的応用を必要とする、AI/MLツールは破壊的な理論的進歩の機会を有害に回避できる、と報告している。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 22:26:33 GMT)
Calibration of single-photon cameras using radioluminescent light sources [0.0] 放射光を用いた単一光子カメラの量子効率の校正について検討する。
上記放射光エミッタを用いた絶対校正法を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:13:26 GMT)
Beyond Trotterization: Variational Product Formulas for Quantum Simulation [0.0] そこで本研究では,誤りに対するより深い制御を提供するトロッタースズキ分解の変分法を提案する。
提案手法は,時間発展操作を特に対象とし,初期状態に適用可能なパラメータセットを1つにまとめる。
これは直接量子コンピューティングアプリケーションに変換され、より少ないゲートを持つ量子回路の設計を可能にする。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 05:03:15 GMT)
Axiomatising the dagger category of complex Hilbert spaces [0.0] 複素ヒルベルト空間と有界線型写像のダガー圏を公理化する。
私たちの公理は容易に解釈できる目的で選ばれます。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:07:16 GMT)
Automorphism in Gauge Theories: Higher Symmetries and Transversal Non-Clifford Logical Gates [0.0] ゲージ群の自己同型によって誘導されるゲージ理論における対称性について研究する。
特に、自己同型対称性を用いて、トポロジカル量子符号における新しい非クリフォード論理ゲートを構築する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 19:00:00 GMT)
An Optimized Machine Learning Classifier for Detecting Fake Reviews Using Extracted Features [0.0] 本稿では,AIによるこれらのレビューを顕著な精度で分析する,高度な機械学習ベースのシステムを提案する。
提案手法は,高度なテキスト前処理,マルチモーダル特徴抽出,ハリスホークス最適化,および積み重ねアンサンブル分類器を統合する。
我々の最終積み重ねモデルは95.40%の精度、92.81%の精度、95.01%のリコール、93.90%のF1スコアを達成した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 10:05:23 GMT)
Advancing Equity in STEM: A Critical Analysis of NSF's Division for Equity and Excellence in STEM through Theoretical Lenses [0.0] この研究は、現在の政策がシステム障壁の解体に不適切であることを示している。
本稿は、STEM教育環境を根本的に再構築することを超えて、変革的改革を提唱することで締めくくっている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 08:08:22 GMT)
AVATAAR: Agentic Video Answering via Temporal Adaptive Alignment and Reasoning [0.0] AVATAARは、グローバルおよびローカルなビデオコンテキストと、Pre Retrieval Thinking AgentとRethink Moduleを組み合わせたモジュラーフレームワークである。
CinePileベンチマークでは、AVATAARがベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 16:09:38 GMT)
AI-Enabled Orchestration of Event-Driven Business Processes in Workday ERP for Healthcare Enterprises [0.0] 本研究では、Workday ERP内のAI対応イベント駆動オーケストレーションフレームワークを提案する。
このフレームワークは、分散ヘルスケアエンティティ間の金融とサプライチェーンをインテリジェントに同期させる。
結果は、WorkdayのイベントベースのアーキテクチャにAI機能を組み込むことで、運用のレジリエンス、ガバナンス、スケーラビリティが向上することを確認した。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 20:18:10 GMT)
A time for monsters: Organizational knowing after LLMs [0.0] 大規模言語モデル(LLM)は、表現と実践に基づく視点の不安定な基盤によって組織的知識を再構築している。
我々は LLM をハラウェイアンモンスター,すなわちハイブリッドカテゴリ,すなわち,確立したカテゴリを不安定化する境界交差エンティティとして概念化し,調査の新たな可能性を開く。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:07:47 GMT)
A Physics Informed Machine Learning Framework for Optimal Sensor Placement and Parameter Estimation [0.0] 本研究では,センサ配置とパラメータ推定を同時に行う,包括的なPINNベースのフレームワークを提案する。
その結果,本手法は直感的あるいはランダムに選択されたセンサ位置から推定したパラメータ値と比較して,常に高精度であることがわかった。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:37:17 GMT)
A Novel CustNetGC Boosted Model with Spectral Features for Parkinson's Disease Prediction [0.0] 本稿では,パーキンソン病の診断効率を高めるために,CustNetGCと呼ばれる新しい分類と可視化モデルを提案する。
提案したCustNetGCの精度は99.06%,精度は95.83%であり,RAC曲線(AUC)以下の面積はPDクラス0.90,HCクラス0.89であった。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 14:41:34 GMT)
A Hybrid CNN-ViT-GNN Framework with GAN-Based Augmentation for Intelligent Weed Detection in Precision Agriculture [0.0] 本稿では,雑草検出のためのハイブリッドディープラーニングフレームワークのレシピを提案する。
クラスロバスト性をバランスさせ,モデルの一般化を図るため,GANに基づく拡張手法が導入された。
実験結果は、99.33%の精度、精度、リコール、マルチベンチマークデータセット上のF1スコアで優れた結果が得られる。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 15:32:08 GMT)
A Dataset and Baseline for Deep Learning-Based Visual Quality Inspection in Remanufacturing [0.0] 本稿では,2つの車載トランスミッションから,典型的なギアボックスコンポーネントを良質かつ欠陥のある状態で表現した新しい画像データセットを提案する。
データセットを用いて異なるモデルの評価を行い、モデルロバスト性を高めるために対照的な正規化損失を提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 13:56:33 GMT)
A County-Level Similarity Network of Electric Vehicle Adoption: Integrating Predictive Modeling and Graph Theory [0.0] 本研究では、予測モデリングを補完するグラフ理論フレームワークを導入し、郡レベルの特性がEV導入にどのように関係しているかをよりよく把握する。
発見は、中央値収入の減少、教育の達成、充電ステーションの可利用性など、一貫したグローバルなトレンドを明らかにしている。
田園部であるが経済的に不利なグループもあるが、都市化されているグループもあるが、高い貧困率を経験しているグループもある。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 00:45:20 GMT)
A Compliance-Preserving Retrieval System for Aircraft MRO Task Search [0.0] 航空機メンテナンス技術者(AMT)は、作業時間の最大30%をマニュアル検索に費やしている。
航空MRO環境にLLMのリグレードとセマンティック検索を適用したコンプライアンス保存検索システムを提案する。
論文参考訳(メタデータ) (Wed, 19 Nov 2025 12:25:40 GMT)