MOSEv2: A More Challenging Dataset for Video Object Segmentation in Complex Scenes [137.2] ビデオオブジェクトセグメンテーション(VOS)は、ビデオ全体を通して特定のターゲットオブジェクトをセグメンテーションすることを目的としている。
VOSをより現実的な環境に進めるために、コモプレックスビデオオブジェクトセグメンテーション(MOSEv1)が導入された。
このMOSEv2は,実環境下でのVOS手法をさらに発展させるために設計された,はるかに難しいデータセットである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:59:27 GMT)
A Survey on Video Temporal Grounding with Multimodal Large Language Model [107.2] 時間的グラウンドリング(VTG)の最近の進歩は、きめ細かいビデオ理解を著しく向上させた。
より優れたマルチモーダル理解と推論能力により、MLLM(VTG-MLLM)に基づくVTGアプローチは、従来の微調整手法を徐々に超えつつある。
一般的なビデオ言語理解に関する広範な調査にもかかわらず、VTG-MLLMに関する包括的なレビューは乏しいままである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:52:11 GMT)
Establishing Best Practices for Building Rigorous Agentic Benchmarks [94.7] 多くのエージェントベンチマークがタスク設定や報酬設計に問題があることを示す。
このような問題は、エージェントのパフォーマンスを最大100%相対的に過小評価することにつながる可能性がある。
我々はベンチマーク構築経験から要約したガイドラインの集合であるAgentic Benchmark Checklist (ABC)を紹介した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:58:08 GMT)
A Latent-Variable Model for Intrinsic Probing [93.6] 固有プローブ構築のための新しい潜在変数定式化を提案する。
我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:11:35 GMT)
SafeWork-R1: Coevolving Safety and Intelligence under the AI-45$^{\circ}$ Law [91.3] 我々は,機能と安全性の共進化を示す最先端のマルチモーダル推論モデルであるSafeWork-R1を紹介する。
大規模でプログレッシブで安全指向の強化学習をポストトレーニングに取り入れたSafeLadderフレームワークを開発した。
さらに,SafeWork-R1-InternVL3-78B,SafeWork-R1-DeepSeek-70B,SafeWork-R1-Qwen2.5VL-7Bを開発した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:02:42 GMT)
Learning to See and Act: Task-Aware View Planning for Robotic Manipulation [85.7] Task-Aware View Planning (TAVP)は、アクティブなビュープランニングとタスク固有の表現学習を統合するために設計されたフレームワークである。
提案したTAVPモデルは、最先端の固定ビューアプローチよりも優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:21:20 GMT)
Perception-Aware Policy Optimization for Multimodal Reasoning [79.6] 現在のマルチモーダル推論における誤りの主な原因は、視覚入力の知覚にある。
提案するPAPOは,モデルが推論を学習しながら知覚を学習することを奨励する,新しいポリシー勾配アルゴリズムである。
知覚誤りの30.5%が有意に減少し,PAPOによる知覚能力の向上が示唆された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:33:56 GMT)
Hi3DEval: Advancing 3D Generation Evaluation with Hierarchical Validity [78.7] Hi3DEvalは3D生成コンテンツに適した階層的評価フレームワークである。
素材リアリズムを明示的に評価することで審美的外観を超えてテクスチャ評価を拡張する。
ハイブリッド3次元表現に基づく3次元自動スコアリングシステムを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:50:13 GMT)
BEE-RAG: Balanced Entropy Engineering for Retrieval-Augmented Generation [77.1] 本稿では,RAGシステムの適応性を改善するために,バランスの取れたエントロピーエンジニアリングRAG(BEE-RAG)フレームワークを提案する。
BEE-RAGは、注意感度をコンテキスト長から分離し、安定したエントロピーレベルを確保する。
これに基づいて,マルチインパタンス推定のためのゼロショット推論戦略とパラメータ効率適応微調整機構を導入する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:37:25 GMT)
Echo Chamber: RL Post-training Amplifies Behaviors Learned in Pretraining [74.8] 強化学習(RL)に基づく微調整は、訓練後の言語モデルにおいて重要なステップとなっている。
数理推論のためのRLファインタニングを、スクラッチから完全にトレーニングモデルを用いて体系的にエンドツーエンドに研究する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:50:47 GMT)
Adapting Vision-Language Models Without Labels: A Comprehensive Survey [74.2] VLM(Vision-Language Models)は、幅広いタスクにまたがる顕著な一般化機能を示す。
近年,ラベル付きデータに依存しない教師なし適応手法に注目が集まっている。
本稿では,未ラベルの視覚データの可用性と性質に基づく分類法を提案し,既存のアプローチを4つの重要なパラダイムに分類する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:27:37 GMT)
JPS: Jailbreak Multimodal Large Language Models with Collaborative Visual Perturbation and Textual Steering [74.0] マルチモーダルな大規模言語モデル(MLLM)に対するジェイルブレイク攻撃は重要な研究課題である。
JPS, UnderlineJailbreak MLLMs with collaborative visual underlinePerturbation and textual underlineSteering。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:14:01 GMT)
ESVQA: Perceptual Quality Assessment of Egocentric Spatial Videos [71.6] 自己中心型空間ビデオのクオリティ・オブ・エクスペリエンス(QoE)を評価することは、高品質な視聴体験を確保するために不可欠である。
我々は,600個のエゴセントリックな空間ビデオからなる,最初のエゴセントリックな空間ビデオ品質評価データベース(ESVQAD)を紹介した。
また,両眼の空間,運動,意味的特徴を統合し,全体的な知覚品質を予測する多次元両眼機能融合モデルであるESVQAnetを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:14:11 GMT)
ProsodyLM: Uncovering the Emerging Prosody Processing Capabilities in Speech Language Models [70.6] 本稿では,韻律学習に適した単純なトークン化方式であるProsodyLMを提案する。
ProsodyLMは事前学習だけで驚くほど多様なプロソディ処理能力を学習できることがわかった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:23:12 GMT)
Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.8] リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。
既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。
本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:14:16 GMT)
WebWatcher: Breaking New Frontiers of Vision-Language Deep Research Agent [67.4] Deep ResearchのようなWebエージェントは認知能力を示しており、高度に難解な情報検索問題を解決することができる。
このようなエージェントは知覚、論理、知識においてより強力な推論能力を必要とするため、マルチモーダルディープリサーチは非常に困難である。
本稿では,視覚言語推論機能を備えた多モードディープリサーチエージェントであるWebWatcherを紹介する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:03:50 GMT)
Human Cognitive Benchmarks Reveal Foundational Visual Gaps in MLLMs [65.9] VisFactorは、よく確立された認知心理学評価から20の視覚中心のサブテストをデジタル化するベンチマークである。
GPT、Gemini、Claude、LLaMA、Qwen、SEEDファミリーから20のフロンティアマルチモーダル言語モデル(MLLM)を評価する。
最高のパフォーマンスモデルは100点中25.19点のスコアしか得られず、精神的な回転、空間的関係推論、図形の識別といったタスクに一貫して失敗する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:39:27 GMT)
Genie Envisioner: A Unified World Foundation Platform for Robotic Manipulation [65.3] 我々は,ロボット操作のための統一世界基盤プラットフォームであるGenie Envisioner(GE)を紹介する。
GEは、ポリシー学習、評価、シミュレーションを単一のビデオ生成フレームワークに統合する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:59:44 GMT)
RoboTron-Drive: All-in-One Large Multimodal Model for Autonomous Driving [63.9] 大規模マルチモーダルモデル(LMM)は、自律運転(AD)における例外的理解と解釈能力を示した
本稿では,多種多様なデータ入力を処理するための汎用大規模マルチモーダルモデルであるRoboTron-Driveを提案する。
我々は6つの公開ベンチマークで評価を行い、3つの未確認データセットでゼロショット転送を行い、RoboTron-Driveはすべてのタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:38:32 GMT)
StitchFusion: Weaving Any Visual Modalities to Enhance Multimodal Semantic Segmentation [63.3] 我々は,大規模な事前学習モデルを直接エンコーダや機能フューザとして統合するフレームワークであるStitchFusionを提案する。
我々は,エンコーディング中に多方向アダプタモジュール(MultiAdapter)を導入し,モーダル間情報転送を実現する。
本モデルは,最小限の追加パラメータを持つ4つのマルチモーダルセグメンテーションデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:50:19 GMT)
NoWag: A Unified Framework for Shape Preserving Compression of Large Language Models [63.3] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な性能を示す。
LLMは膨大な計算量とメモリ需要に悩まされており、リソース制約のある環境への展開を制限している。
圧縮アルゴリズムを用いたワンショット形状保存のための統一フレームワークであるNoWagを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:04:27 GMT)
The Docking Game: Loop Self-Play for Fast, Dynamic, and Accurate Prediction of Flexible Protein--Ligand Binding [63.0] 本稿では,タンパク質-リガンド相互作用をドッキングゲームと呼ばれる2人プレイヤゲームとしてモデル化する新しいゲーム理論フレームワークを提案する。
LoopPlayは従来の最先端の方法と比較して,正確なバインディングモードの予測において約10%の改善を実現している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:38:28 GMT)
OpenCodeInstruct: A Large-scale Instruction Tuning Dataset for Code LLMs [62.7] 我々は,500万の多様なサンプルからなる最大オープンアクセス命令チューニングデータセットであるOpenCodeInstructを紹介した。
各サンプルには、プログラミング質問、ソリューション、テストケース、実行フィードバック、LLM生成の品質評価が含まれている。
LLaMAやQwenなど,さまざまなベースモデルを,データセットを使用して複数のスケール(1B+,3B+,7B+)にわたって微調整します。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:16:09 GMT)
OpenCodeReasoning: Advancing Data Distillation for Competitive Coding [61.2] 教師付き微調整(SFT)データセットを構築し、様々なサイズのモデルで最先端のコーディング能力を実現する。
私たちのモデルは、LiveCodeBenchで61.8%、CodeContestsで24.6%を達成するためにSFTのみを使用しており、強化学習でトレーニングされた代替品を上回っています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:04:55 GMT)
Decision-Making with Deliberation: Meta-reviewing as a Document-grounded Dialogue [61.1] メタリビューアを効果的に支援できるダイアログエージェントを実現する上での課題について検討する。
まず,対話エージェントの訓練におけるデータ不足の問題に対処する。
このデータを用いて、メタレビューに適した対話エージェントを訓練する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:27:43 GMT)
Unified modality separation: A vision-language framework for unsupervised domain adaptation [60.8] 教師なしドメイン適応(Unsupervised domain adapt, UDA)は、ラベル付きソースドメインでトレーニングされたモデルが新しいラベル付きドメインを扱うことを可能にする。
本稿では,モダリティ固有成分とモダリティ不変成分の両方に対応可能な統一モダリティ分離フレームワークを提案する。
提案手法は,9倍の計算効率で最大9%の性能向上を実現している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:51:10 GMT)
BloomWise: Enhancing Problem-Solving capabilities of Large Language Models using Bloom's-Taxonomy-Inspired Prompts [59.8] BloomWiseは認知にインスパイアされた大規模言語モデル(LLM)のプロンプト技術である
解法をより説明しやすいものにしながら、数学的問題解決におけるLLMの性能を高めるように設計されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:40:48 GMT)
DART: Dual Adaptive Refinement Transfer for Open-Vocabulary Multi-Label Recognition [59.2] Open-Vocabulary Multi-Label Recognition (OV-MLR)は、画像内の複数の見えないオブジェクトカテゴリを識別することを目的としている。
ビジョンランゲージ事前学習モデルは強力なオープン語彙基盤を提供するが、弱い監督下では微粒な局所化に苦慮する。
本稿では,これらの制約を克服するためのDART(Dual Adaptive Refinement Transfer)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:22:33 GMT)
Thompson Exploration with Best Challenger Rule in Best Arm Identification [59.0] 本稿では,バンドイットフレームワークにおける固定信頼度最良腕識別問題について検討する。
我々は、トンプソンサンプリングと、ベストチャレンジャールールとして知られる計算効率の良いアプローチを組み合わせた新しいポリシーを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:10:49 GMT)
TIME: Temporal-Sensitive Multi-Dimensional Instruction Tuning and Robust Benchmarking for Video-LLMs [56.9] ビデオ大言語モデルは、ビデオ質問応答のようなタスクにおいて顕著なパフォーマンスを達成した。
我々のデータセットは5つの重要な次元にわたる時間的理解の向上に焦点を当てている。
本稿では,時間に敏感なタスクを既存の命令データセットにシームレスに統合するマルチタスクプロンプト微調整手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:15:07 GMT)
R-Zero: Self-Evolving Reasoning LLM from Zero Data [56.7] 自己進化型大規模言語モデル(LLM)は、自身の経験から自律的に生成、精製、学習することで、超知性へのスケーラブルなパスを提供する。
このようなモデルを訓練するための既存の方法は、いまだに膨大な人為的なタスクやラベルに大きく依存している。
R-Zeroは、完全に自律的なフレームワークで、スクラッチから独自のトレーニングデータを生成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:38:16 GMT)
Benchmarking Retrieval-Augmented Generation in Multi-Modal Contexts [56.7] 本稿では,マルチモーダル大規模言語モデルの有効性を評価するためのベンチマークであるMulti-Modal Retrieval-Augmented Generation (M$2$RAG)を紹介する。
このベンチマークは、イメージキャプション、マルチモーダル質問応答、マルチモーダル事実検証、イメージリランクの4つのタスクで構成されている。
MLLMのコンテキスト利用能力を高めるため,マルチモーダル検索型インストラクションチューニング(MM-RAIT)も導入する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:16:21 GMT)
Multimodal Causal-Driven Representation Learning for Generalizable Medical Image Segmentation [56.5] 医用画像セグメンテーションにおける領域一般化に取り組むために, MCDRL(Multimodal Causal-Driven Representation Learning)を提案する。
MCDRLは競合する手法より一貫して優れ、セグメンテーション精度が優れ、堅牢な一般化性を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:41:41 GMT)
Position: Mind the Gap-the Growing Disconnect Between Established Vulnerability Disclosure and AI Security [56.2] 我々は、AIセキュリティレポートに既存のプロセスを適用することは、AIシステムの特徴的な特徴に対する根本的な欠点のために失敗する運命にあると主張している。
これらの欠点に対処する私たちの提案に基づき、AIセキュリティレポートへのアプローチと、新たなAIパラダイムであるAIエージェントが、AIセキュリティインシデント報告の進展をさらに強化する方法について論じる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:22:17 GMT)
CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [54.9] 異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:02:17 GMT)
Balancing Accuracy and Novelty with Sub-Item Popularity [54.6] 本稿では,RecJPQフレームワーク内でのサブIDレベルのパーソナライズされた人気の新たな統合を提案する。
提案手法は,レコメンデーション精度を損なうことなく,パーソナライズドノベルティを著しく向上させることにより,アイテムレベルのPSSを一貫して上回ります。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:33:32 GMT)
Dialogues Aspect-based Sentiment Quadruple Extraction via Structural Entropy Minimization Partitioning [54.3] DiaASQは、与えられた複数ラウンドの多人数対話から、ターゲット・アスペクト・オピニオン・センチメントの4倍体を抽出することを目的としている。
まず、発話レベルで個々の感情要素を抽出し、次にサブ対話レベルで四重項をマッチングする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:22:17 GMT)
Distilling Reasoning Ability from Large Language Models with Adaptive Thinking [54.0] 思考の微調整(cot-finetuning)の連鎖は、小さな言語モデル(SLM)を特定のタスクに対するパフォーマンス向上の推論能力で実現することを目的としている。
既存のコトファインタニング法の多くは事前に考えられたメカニズムを採用しており、SLMは答えを出す前に理性を生成することができる。
このメカニズムにより、SLMは複雑な質問を分析して考えることができるが、答えの正しさは論理的に小さな誤りに非常に敏感になる。
理性よりも先に回答を生成するための頑健な後思考機構を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:25:23 GMT)
Forgetting: A New Mechanism Towards Better Large Language Model Fine-tuning [53.4] Supervised Fine-tuning (SFT) は、事前訓練された大規模言語モデル (LLM) において重要な役割を果たす。
各コーパス内のトークンを、モデルパフォーマンスを改善するのに有用かどうかに基づいて、正と負の2つの部分に分類することを提案する。
我々は、よく確立されたベンチマークで実験を行い、この忘れるメカニズムが全体のモデル性能を向上するだけでなく、より多様なモデル応答を促進することを発見した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:30:41 GMT)
Shuffle-R1: Efficient RL framework for Multimodal Large Language Models via Data-centric Dynamic Shuffle [53.2] 強化学習(Reinforcement Learning, RL)は、マルチモーダル大言語モデル(MLLM)の推論能力を高めるための効果的なポストトレーニングパラダイムとして登場した。
しかしながら、現在のRLパイプラインは、アドバンテージ・コラプシング(Advantage Collapsing)とロールアウト・サイレンシング(Rollout Silencing)という2つの未解決の問題によって、トレーニングの非効率に悩まされることが多い。
軌道サンプリングとバッチ合成を動的に再構成することにより、RLの微調整効率を向上する、シンプルだが原則化されたフレームワークであるShuffle-R1を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:53:47 GMT)
OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks [52.9] OmniEARは,言語モデルが身体的相互作用やツールの使用,マルチエージェントの協調にどう影響するかを評価するためのフレームワークである。
我々は、家庭と工業領域にまたがる1500のシナリオにおける連続的な物理的特性と複雑な空間的関係をモデル化する。
我々の体系的な評価は、モデルが制約から推論しなければならない場合、厳しい性能劣化を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:54:15 GMT)
Does Multimodality Improve Recommender Systems as Expected? A Critical Analysis and Future Directions [52.2] マルチモーダルレコメンデーションシステムは、多種多様なデータ型を統合することで、パフォーマンスを向上させる可能性が高まっている。
しかし、この統合の実際の利点ははっきりしないままであり、いつ、どのように本当にレコメンデーションを強化するのかという疑問が持ち上がっている。
4次元にわたるマルチモーダルレコメンデーションを体系的に評価するための構造化評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:21:00 GMT)
Stealthy Patch-Wise Backdoor Attack in 3D Point Cloud via Curvature Awareness [52.1] バックドア攻撃はディープニューラルネットワーク(DNN)に深刻な脅威をもたらす
既存の3Dポイントのクラウドバックドア攻撃は、サンプルワイドなグローバルな修正に依存している。
我々は,3Dポイントクラウド用のパッチワイドバックドアアタックフレームワークであるStealthy Patch-Wise Backdoor Attack (SPBA)を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:27:39 GMT)
GTR: Improving Large 3D Reconstruction Models through Geometry and Texture Refinement [52.0] マルチビュー画像から3次元メッシュを再構成する手法を提案する。
提案手法は, 変圧器を用いたトリプレーンジェネレータとニューラルレージアンスフィールド(NeRF)モデルを用いた大規模再構成モデルから着想を得たものである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:09:35 GMT)
SPaRFT: Self-Paced Reinforcement Fine-Tuning for Large Language Models [51.7] 大規模言語モデル(LLM)は、強化学習(RL)による微調整時に強い推論能力を示す。
トレーニング対象のモデルの性能に基づいて,効率的な学習を可能にする自己評価学習フレームワークである textbfSPaRFT を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:50:48 GMT)
LLMEval-3: A Large-Scale Longitudinal Study on Robust and Fair Evaluation of Large Language Models [51.6] 静的ベンチマークにおけるLLM(Large Language Models)の既存の評価は、データの汚染やリーダーボードのオーバーフィッティングに弱い。
LLMの動的評価のためのフレームワークであるLLMEval-3を紹介する。
LLEval-3は、220kの卒業生レベルの質問からなるプロプライエタリなバンク上に構築されており、評価実行毎に未確認のテストセットを動的にサンプリングする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:46:30 GMT)
AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification [51.5] AHDMILは非対称な階層的蒸留マルチインスタンス学習フレームワークである。
2段階のトレーニングプロセスを通じて、無関係なパッチを排除します。
分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:47:16 GMT)
DSOcc: Leveraging Depth Awareness and Semantic Aid to Boost Camera-Based 3D Semantic Occupancy Prediction [51.4] カメラによる3Dセマンティックアクセシビリティ予測(DSOcc)を促進するために,奥行き認識とセマンティック支援を活用することを提案する。
我々は,非学習法によりソフトな占有率の信頼度を算出し,画像特徴に乗じてボクセルに奥行きを知らせる,占有状態と占有階級推定を共同で行う。
特徴学習を向上する代わりに、よく訓練されたイメージセマンティックセグメンテーションと、その占有確率で複数のフレームを融合させて、占有率のクラス推論を支援する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:25:26 GMT)
INS-MMBench: A Comprehensive Benchmark for Evaluating LVLMs' Performance in Insurance [51.4] LVLM(Large Vision-Language Models)とMLLM(Multimodal Large Language Models)は、専門分野における将来性を示す。
本研究は,自動車,不動産,健康,農業の4種類の保険のマルチモーダルタスクを体系的に評価し,分類する。
我々は、GPT-4oのようなクローズドソースモデルやLLaVAのようなオープンソースモデルを含む11のLVLMをベンチマークする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:56:50 GMT)
On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification [50.3] LLM(Large Language Model)のためのSFT(Supervised Fine-Tuning)の改良法を提案する。
標準SFT勾配は、モデルの一般化能力を著しく制限する問題のある報酬構造を暗黙的に符号化する。
本稿では,このトークンの確率で目的関数を動的に再スケーリングすることにより,各トークンの勾配を安定化する動的微調整(DFT)を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:59:04 GMT)
Efficient Knowledge Injection in LLMs via Self-Distillation [50.2] 本稿では, 急速蒸留を利用して, 自由形式文書から新たな事実知識を内包する手法を提案する。
急速蒸留は標準的な微調整よりも優れており,RAGを超越することさえ可能であることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:12:17 GMT)
No Query, No Access [50.2] 被害者のテキストのみを使用して動作する textbfVictim Data-based Adrial Attack (VDBA) を導入する。
被害者モデルへのアクセスを防止するため、公開されている事前トレーニングモデルとクラスタリングメソッドを備えたシャドウデータセットを作成します。
EmotionとSST5データセットの実験によると、VDBAは最先端の手法より優れており、ASRの改善は52.08%である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:03:20 GMT)
3DGabSplat: 3D Gabor Splatting for Frequency-adaptive Radiance Field Rendering [50.0] 3D Gaussian Splatting(3DGS)は、高忠実なノベルビュー合成を維持しながらリアルタイムレンダリングを実現している。
複数方向の3次元周波数応答を持つ新規な3次元ガボルベースプリミティブを組み込んだ3次元ガボルスプレート(3DGabSplat)を提案する。
我々は3D以上の1.35dBRゲインを実現し、同時にプリミティブメモリ消費量を削減した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:49:44 GMT)
LLM-TabLogic: Preserving Inter-Column Logical Relationships in Synthetic Tabular Data via Prompt-Guided Latent Diffusion [49.9] 合成データセットはドメイン固有の論理的一貫性を維持する必要がある。
既存の生成モデルは、しばしばこれらのカラム間の関係を見落としている。
本研究では,ドメイン知識を必要とせずに列間関係を効果的に維持する手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:11:00 GMT)
VFlowOpt: A Token Pruning Framework for LMMs with Visual Information Flow-Guided Optimization [49.6] LMM(Large Multimodal Models)は、多数の視覚トークンを微粒な視覚情報に活用することにより、視覚言語タスクに優れる。
推論中の視覚トークンを減らすことを目的とした以前の研究は、一般的に、視覚のみのトークンや視覚言語トークンの注意スコアから得られた重要マップを利用して、1つまたは複数のプルーニング段階にわたってトークンをプルーンする。
重要地図導出プロセスとリサイクル機構を備えたプログレッシブプルーニングモジュールを導入したトークンプルーニングフレームワークであるVFlowOptを提案する。
実験により、VFlowOptは、同等のパフォーマンスを維持しながら、90%のビジュアルトークンをプルークでき、KVキャッシュメモリが89%削減され、3.8になった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:47:21 GMT)
Ultra-Large-Scale Compilation and Manipulation of Quantum Circuits with Pandora [49.5] Pandoraは、効率よく、オープンソースで、マルチスレッドで、高速な計算が可能なツールである。
Pandoraは、量子回路等価性チェック、大規模回路の完全なコンパイル、スケーラブルでストリーミングな量子リソース推定フレームワークに使用できる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:48:17 GMT)
Performance and Storage Analysis of CRYSTALS Kyber as a Post Quantum Replacement for RSA and ECC [49.2] CRYSTALS-Kyberは、2022年にNISTによって標準化されたポスト量子暗号ソリューションである。
本研究は,様々な実装方式における性能試験を通じて,Kyberの実用可能性を評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:50:05 GMT)
Fidelity-Aware Multipath Routing for Multipartite State Distribution in Quantum Networks [49.2] 本稿では,分散率と忠実度を向上した量子ネットワーク上での絡み合ったマルチパーティイト状態の分散問題を考察する。
本稿では,マルチパスルーティングプロトコルを提案するとともに,分散Greenberger-Horne-Zeilinger(GHZ)状態の速度と忠実度の観点から,その性能を単一パスルーティングと比較する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:03:57 GMT)
EgoPrompt: Prompt Learning for Egocentric Action Recognition [49.1] EgoPromptは、エゴセントリックな行動認識タスクを実行するための、素早い学習ベースのフレームワークである。
EgoPromptは、内部データセット、クロスデータセット、ベース・ツー・ノーベルの一般化ベンチマークで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:36:17 GMT)
CM-Diff: A Single Generative Network for Bidirectional Cross-Modality Translation Diffusion Model Between Infrared and Visible Images [48.6] 本稿では、赤外モードと可視モードの両方でデータ分布を同時にモデル化するための双方向相互モーダル変換拡散モデル(CM-Diff)を提案する。
CM-Diffが最先端手法よりも優れていることを示す実験結果を得た。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:11:59 GMT)
Learning to Reason for Factuality [48.1] 本稿では,現実的精度,応答詳細度,応答関連度を同時に考慮した新たな報酬関数を提案する。
本モデルでは,幻覚率の平均値が23.1ポイント,回答詳細度が23%増加し,全体の応答効率が低下しない。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:57:09 GMT)
Physical Adversarial Camouflage through Gradient Calibration and Regularization [48.1] 敵のカモフラージュは 物体のテクスチャを 偽検知器に変えて 重大なセキュリティリスクを 負う
既存の技術は様々な物理的環境に苦しむ。
勾配最適化に基づく新しい逆カモフラージュフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:07:49 GMT)
Rethinking Creativity Evaluation: A Critical Analysis of Existing Creativity Evaluations [47.5] クリエイティビティ指標,パープレキシティ,構文テンプレート,LCM-as-a-Judgeなどのクリエイティビティ指標について検討した。
分析の結果、これらの指標は限定的な一貫性を示し、創造性の異なる次元を捉えていることがわかった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:11:48 GMT)
Making Prompts First-Class Citizens for Adaptive LLM Pipelines [46.6] 当社のビジョンと,迅速な管理ギャップを埋める言語とランタイムであるSPEARの初期設計について説明する。
SPEARは、パイプライン内でプロンプトを構築し、適応する方法を管理するプロンプト代数を定義する。
プロンプト論理を構造化データとして扱うことで、SPEARは演算子融合、プレフィックスキャッシュ、ビュー再利用などの最適化を可能にする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:49:56 GMT)
Optimal Stochastic Non-smooth Non-convex Optimization through Online-to-Non-convex Conversion [46.5] 本稿では,新しい解析手法を用いて,未知の非平滑な目的を最適化するアルゴリズムを提案する。
決定論的二階スムーズな目的のために、先進的な楽観的なオンライン学習技術を適用することで、新しい$O(delta0.5)All$が最適または最もよく知られた結果の回復を可能にする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:15:56 GMT)
Diffusion Beats Autoregressive in Data-Constrained Settings [46.1] 自己回帰(AR)モデルは長い間、大きな言語モデルのランドスケープを支配してきた。
近年,ARモデルよりもアドバンテージが低いものの,拡散型言語モデルが将来性のある選択肢として浮上している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:59:38 GMT)
Recent Advances in Speech Language Models: A Survey [46.0] 音声言語モデル(SpeechLMs)は、テキストから変換することなく音声を生成するエンドツーエンドモデルである。
本稿では,近年のSpeechLM構築手法について概観する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:29:43 GMT)
DepthSync: Diffusion Guidance-Based Depth Synchronization for Scale- and Geometry-Consistent Video Depth Estimation [45.9] 本稿では,DepthSyncを提案する。DepthSyncは拡散誘導を用いて,長ビデオのスケールと幾何に一貫性のある深度予測を実現するフレームワークである。
具体的には、ウィンドウ間の深さスケールを同期させるスケールガイダンスと、ウィンドウ内の幾何学的アライメントを強制するための幾何学的ガイダンスを導入する。
様々なデータセットを用いた実験により、特に長ビデオにおいて、スケールと幾何の整合性を改善した深度推定法の有効性が検証された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:10:50 GMT)
FineDialFact: A benchmark for Fine-grained Dialogue Fact Verification [45.2] 大型言語モデル (LLM) は幻覚を生み出すことが知られている。
対話システムにおける幻覚検出への現在のアプローチは、主に生成された応答の事実整合性を検証することに焦点を当てている。
詳細な対話事実検証のためのベンチマークであるFinDialFactを導入する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:51:03 GMT)
Follow-Your-Instruction: A Comprehensive MLLM Agent for World Data Synthesis [44.7] Follow-Your-Instructionは、高品質な2D、3D、4Dデータを自動合成するフレームワークである。
3Dレイアウトを構築し、セマンティックリファインメントのためにビジョン・ランゲージ・モデル(VLM)を利用する。
本研究では,2D,3D,4D生成タスクに関する総合的な実験を通じて,生成データの品質を評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:12:54 GMT)
Towards Hallucination-Free Music: A Reinforcement Learning Preference Optimization Framework for Reliable Song Generation [44.1] 幻覚制御のための好み最適化を利用した新しい強化学習フレームワークを提案する。
我々は,音素誤り率計算によって構築された頑健な幻覚選好データセットを開発した。
フレームワーク内に3つの異なる選好最適化戦略を実装し,評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:49:18 GMT)
MathSmith: Towards Extremely Hard Mathematical Reasoning by Forging Synthetic Problems with a Reinforced Policy [43.9] MathSmithは、LSM推論を強化するために数学的な問題に挑戦する新しいフレームワークである。
既存の問題を修正するのではなく、MathSmithはPlanetMathからランダムに概念-説明ペアをサンプリングすることで、スクラッチから新しいものを構築する。
難易度を高めるために,9つの事前定義された戦略を合理的な制約として設計する。
実験によると、MathSmithは短いCoT設定と長いCoT設定の両方で既存のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:32:14 GMT)
AU-IQA: A Benchmark Dataset for Perceptual Quality Assessment of AI-Enhanced User-Generated Content [43.8] AIベースの画像強調技術は様々な視覚的応用に広く採用されており、ユーザ生成コンテンツ(UGC)の知覚品質が著しく向上している。
専門品質評価モデルの欠如は、ユーザエクスペリエンスを制限し、拡張手法の進歩を妨げる、この分野において重要な制限要因となっている。
代表的な3種類のAI-UGC画像から4,800個のAI-UGC画像を生成するベンチマークデータセットであるAU-IQAを構築した。
本データセットでは,従来のIQA法や大規模マルチモーダルモデルなど,既存の品質評価モデルについて評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:55:11 GMT)
SE-Agent: Self-Evolution Trajectory Optimization in Multi-Step Reasoning with LLM-Based Agents [43.7] 大規模言語モデル(LLM)ベースのエージェントは、最近、複雑な推論とツールの使用において、環境とのマルチステップのインタラクションを通じて印象的な機能を示した。
これらの軌道にはリッチなフィードバックが含まれており、エージェントを正しい方向に誘導して問題を正しく解くことができる。
モンテカルロ木探索 (MCTS) のような一般的な手法は、探索と搾取を効果的にバランスさせることができるが、それらは様々な軌道間の相互依存を無視している。
エージェントが推論プロセスを反復的に最適化できる自己進化フレームワークSE-Agentを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:46:44 GMT)
AbbIE: Autoregressive Block-Based Iterative Encoder for Efficient Sequence Modeling [43.7] 自己回帰的ブロックベース反復一般化は、標準変換器よりも難易度が高い。
AbbIEは遅延スペースでイテレーションを実行するが、遅延推論モデルとは異なり、特別なデータセットやトレーニングプロトコルを必要としない。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:18:14 GMT)
Tool Graph Retriever: Exploring Dependency Graph-based Tool Retrieval for Large Language Models [43.5] ツール間の依存関係を利用して、検索のためのより良いツール表現を学習するツールグラフ検索(TGR)を提案する。
まず、TDI300Kと呼ばれるデータセットを構築し、ツール依存を識別するための識別器を訓練する。
そして、すべての候補ツールをツール依存グラフとして表現し、グラフ畳み込みを使って依存関係を表現に統合します。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:36:26 GMT)
TRKT: Weakly Supervised Dynamic Scene Graph Generation with Temporal-enhanced Relation-aware Knowledge Transferring [43.3] 動的シーングラフ生成(DSGG)は、オブジェクトを検出し、それらの関係を予測することによって、各ビデオフレームのシーングラフを作成することを目的としている。
既存のWS-DSGG法は、既製の外部オブジェクト検出器に依存して、後続のDSGG訓練のための擬似ラベルを生成する。
本稿では,関係認識の動的シナリオにおいて,知識を活用して検出を強化する,時間拡張型関係認識型知識伝達(TRKT)手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:17:45 GMT)
DualMat: PBR Material Estimation via Coherent Dual-Path Diffusion [42.5] 複雑な照明条件下での単一画像からPBR材料を推定するための新しいデュアルパス拡散フレームワークであるDualMatを提案する。
提案手法は,RGB潜伏空間を介して事前学習した視覚的知識を活用するアルベド逆経路と,精密な金属および粗さ推定のために設計されたコンパクト潜伏空間で動作する物質特異的経路という,2つの異なる潜伏空間で動作する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:25:45 GMT)
TurboTrain: Towards Efficient and Balanced Multi-Task Learning for Multi-Agent Perception and Prediction [42.5] TurboTrainは、マルチエージェント認識と予測のための、新しくて効率的なトレーニングフレームワークである。
トレーニングプロセスの合理化によって、我々のフレームワークは、複雑なマルチステージトレーニングパイプラインを手動でチューニングし、チューニングする必要がなくなる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:13:49 GMT)
No Universal Prompt: Unifying Reasoning through Adaptive Prompting for Temporal Table Reasoning [42.4] 時間表推論は大規模言語モデル(LLM)にとって重要な課題である
SEARは、人間の推論にインスパイアされた適応的なプロンプトフレームワークであり、コンテキストに動的に適応し、構造化された推論を統合する。
その結果,SEARは,ベースラインのプロンプト技術と比較して,全てのテーブルタイプで優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:32:35 GMT)
Bipartite entanglement in a nuclear spin register mediated by a quasi-free electron spin [42.3] 量子ネットワークは、計算とエラー訂正のために、堅牢で局所的な量子レジスタに絡み合った光子に依存する。
完全に接続された3量子ビット1,3mathrmC$核スピンレジスタのダイヤモンドにおける制御と絡み合いを実証する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:45:14 GMT)
Whose Truth? Pluralistic Geo-Alignment for (Agentic) AI [42.1] 適切、真実、法的と見なされるものは、文化的規範、政治的現実、法律によって地域によって大きく異なる可能性がある。
本稿では,重要な地理研究の課題を概観し,今後の研究課題を提案するとともに,アライメント感度を評価する方法の概要を述べる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:21:33 GMT)
Pruning Large Language Models by Identifying and Preserving Functional Networks [41.6] 構造化プルーニング(Structured pruning)は、大きな言語モデル(LLM)を圧縮してGPUメモリの消費を減らし、推論速度を高速化する技術である。
ほとんどの構造化プルーニング法は、LLMの機能に不可欠な人工ニューロン間の相互作用と協調を見落としている。
人工ニューラルネットワークと人間の脳における機能的ニューラルネットワークの固有の類似性から着想を得て,機能的ネットワークを同定・保存し,LLMを創出することを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:27:01 GMT)
HOLODECK 2.0: Vision-Language-Guided 3D World Generation with Editing [41.3] HOLODECK 2.0は、3Dワールドジェネレーションのための視覚言語誘導フレームワークであり、人間のフィードバックに基づいたインタラクティブなシーン編集をサポートする。
HOLODECK 2.0は多様でスタイリスティックにリッチな3Dシーンを生成することができる。
プロシージャゲームモデリングにおけるHOLODECK 2.0の実践的応用として,視覚的にリッチで没入感のある環境を生成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:23:07 GMT)
Optimal Corpus Aware Training for Neural Machine Translation [41.1] コーパスアウェアトレーニング(Corpus Aware Training, CAT)は、トレーニング中に、各トレーニング例にコーパス情報を注入することにより、貴重なコーパスメタデータを活用する。
モデルパラメータのほとんどを凍結し,小セットのコーパス関連パラメータのみをチューニングすることにより,CAT事前訓練モデルを微調整するOCAT(Optimal Corpus Aware Training)を提案する。
OCATは軽量で、オーバーフィッティングに耐性があり、モデルの精度向上に有効であることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:12:26 GMT)
Quantum Algorithms for Finite-horizon Markov Decision Processes [40.8] 我々は、時間依存および有限水平マルコフ決定過程(MDP)を解くために、古典的アルゴリズムよりも効率的な量子アルゴリズムを設計する。
正確なダイナミックス設定において、我々の$textbfQVI-1$アルゴリズムがアクション空間$(A)$の2次スピードアップを達成することを証明している。
生成モデル設定において、我々のアルゴリズムである$textbfQVI-3$と$textbfQVI-4$が、最先端(SOTA)古典アルゴリズムよりも複雑なサンプルを実現することを証明している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:00:23 GMT)
MotionStreamer: Streaming Motion Generation via Diffusion-based Autoregressive Model in Causal Latent Space [40.6] テキスト条件付きストリーミングモーション生成では、可変長の歴史的動きと入ってくるテキストに基づいて、次のステップの人間のポーズを予測する必要がある。
既存の方法は、例えば拡散モデルが予め定義された動き長によって制約されるような、ストリーミングモーション生成を達成するのに苦労している。
本研究では,連続因果遅延空間を確率論的自己回帰モデルに組み込む新しいフレームワークであるMotionStreamerを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:21:41 GMT)
VS-LLM: Visual-Semantic Depression Assessment based on LLM for Drawing Projection Test [40.4] ドローイング・プロジェクション・テスト(DPT)は、心理学者がスケッチを通して参加者の精神状態を評価することを可能にする、アートセラピーにおいて不可欠なツールである。
本稿では,大規模自動DPTの実施において,心理学者を支援する効果的な同定法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:59:50 GMT)
EndoMatcher: Generalizable Endoscopic Image Matcher via Multi-Domain Pre-training for Robot-Assisted Surgery [40.2] 内視鏡画像における一般化可能な高密度特徴マッチングはロボット支援作業に不可欠である。
本研究では,大規模なマルチドメインデータ事前学習による内視鏡画像マッチングシステムであるEndoMatcherを提案する。
内視鏡的マッチングのための最初のマルチドメインデータセットであるEndo-Mix6を構築した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:43:09 GMT)
Robust Image Stitching with Optimal Plane [39.8] textitRopStitchは、堅牢性と自然性の両方を備えた教師なしの深層画像縫合フレームワークである。
textitRopStitchは、特にシーンの堅牢性とコンテンツ自然性において、既存のメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:53:26 GMT)
CUPID: Evaluating Personalized and Contextualized Alignment of LLMs from Interactions [39.6] CUPIDは、756人の人為的なインタラクションセッション履歴のベンチマークである。
オープンでプロプライエタリな10のLarge Language Model(LLM)を評価する。
我々の研究は、より文脈的にパーソナライズされたインタラクションのためにLLM機能を進化させる必要性を強調します。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:03:27 GMT)
Semantic Integrity Constraints: Declarative Guardrails for AI-Augmented Data Processing Systems [39.2] セマンティッククエリにおけるLLM出力に対する正当性条件を指定・強制するためのセマンティック整合性制約(SIC)を導入する。
SICは、従来のデータベース整合性制約をセマンティックセッティングに一般化し、グラウンド、サウンドネス、排他といった一般的なタイプの制約をサポートする。
本稿では,SICをクエリ計画と実行環境に統合するシステム設計について述べる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:48:22 GMT)
Robust Tracking with Particle Filtering for Fluorescent Cardiac Imaging [38.1] 術中心筋イメージングは冠動脈バイパス手術後の品質管理を可能にする。
目標ランドマークに追従する粒子を頑健に追跡する循環整合性チェックに基づく粒子フィルタリングトラッカーを提案する。
提案手法は,25.4fpsで117の目標を同時に追跡し,介入中のリアルタイム推定を可能にする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:57:13 GMT)
SGDFuse: SAM-Guided Diffusion for High-Fidelity Infrared and Visible Image Fusion [38.1] 本稿では,Segment Anything Model(SAM)によって導かれる条件拡散モデルを提案する。
このフレームワークは2段階のプロセスで動作し、まずマルチモーダルな特徴の予備的な融合を行い、その後、拡散モデルの粗大な分極生成を駆動する条件としてセマンティックマスクを利用する。
SGDFuseは主観的評価と客観的評価の両方において最先端の性能を発揮することを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:58:52 GMT)
Which Questions Improve Learning the Most? Utility Estimation of Questions with LM-based Simulations [37.9] 本稿では,言語モデルを用いて学習者のシミュレートと質問の有用性の定量化を行うフレームワークであるQUESTを紹介する。
QUESTは、質問をし、教科書の章を勉強している間に回答を受け取った学習者をシミュレートし、それを使ってチャプタ試験を終了させる。
実験の結果、QUESTでトレーニングされたモデルによって生成された質問は、強いベースラインと比較して、シミュレーションテストのスコアを20%以上改善することがわかった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:34:10 GMT)
SPEX: A Vision-Language Model for Land Cover Extraction on Spectral Remote Sensing Images [37.7] スペクトルリモートセンシング画像における土地被覆抽出のための視覚言語モデルであるSPEXを提案する。
SPEXは、典型的な土地被覆カテゴリーを抽出する既存の最先端手法を一貫して上回っている。
SPEXは、その予測のためのテキスト説明を生成することができ、解釈可能性とユーザフレンドリ性を高めることができる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:37:45 GMT)
Optimal Linear Baseline Models for Scientific Machine Learning [37.7] 我々は線形エンコーダ・デコーダアーキテクチャを解析するための統一的理論フレームワークを開発した。
我々は、フォワードモデリングと逆リカバリタスクのための閉形式、階数制約付き線形最適写像を導出する。
この研究は、科学的機械学習問題に対する学習ニューラルネットワークモデルの理解とベンチマークのための堅牢なベースラインを提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:17:07 GMT)
Online Graph Topology Learning via Time-Vertex Adaptive Filters: From Theory to Cardiac Fibrillation [37.7] 本稿では,動的グラフトポロジ推定のための空間適応アルゴリズムであるAdaCGPを紹介する。
AdaCGPは一貫して最先端の手法より優れている。
確立した手法よりも効果的に伝搬パターンの動的変化を追跡する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:28:22 GMT)
Everything You Need to Know About CS Education: Open Results from a Survey of More Than 18,000 Participants [37.6] 我々は173カ国の18,032人の学習者を対象に調査を行った。
本稿では,この調査結果をオープンデータセットとして紹介する。
このデータセットは、コンピュータ教育のさらなる研究と促進を支援することを目的としている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:29:29 GMT)
On the Value of Cross-Modal Misalignment in Multimodal Representation Learning [37.3] マルチモーダル表現学習は、モダリティ間でキューを整列させることにより、強力な表現を学習することを目的としている。
最近の研究により、現実世界のデータセットは、しばしばモダクティブなミスアライメントを示すことが明らかになっている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:13:29 GMT)
Measurement as Bricolage: Examining How Data Scientists Construct Target Variables for Predictive Modeling Tasks [37.2] 我々は、モデリングタスクのターゲット変数をどのように構築するかを理解するために、教育と医療のデータサイエンティストにインタビューする。
以上の結果から,データ科学者は,高レベルな測定目標と低レベルな実践的制約の交渉を含むブリコラージュプロセスを通じて,対象変数を構築することが示唆された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:16:10 GMT)
Local Distance Query with Differential Privacy [37.2] グラフ解析における重要な要素である距離は、典型的にはキュレーターDPを用いて処理される。
多くの実世界のシナリオでは、そのようなキュレーターは存在しない可能性があり、ローカル微分プライバシー(LDP)の下で微分プライベートな距離クエリを実装する上で重要な課題となっている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:48:35 GMT)
DOTS: Learning to Reason Dynamically in LLMs via Optimal Reasoning Trajectories Search [37.2] DOTS は LLM が最適推論軌道探索によって動的に推論できるアプローチである。
提案手法は静的推論手法とバニラ命令チューニング手法より一貫して優れている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:34:52 GMT)
RAP: Real-time Audio-driven Portrait Animation with Video Diffusion Transformer [36.8] RAP(Real-time Audio-driven Portrait animation)は,リアルタイム制約下で高品質な音声画像を生成するための統合フレームワークである。
RAPは正確な音声駆動制御を実現し、長期の時間的ドリフトを緩和し、高い視力を維持する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:47:16 GMT)
Steering One-Step Diffusion Model with Fidelity-Rich Decoder for Fast Image Compression [36.1] SODECは単一ステップ拡散に基づく画像圧縮モデルである。
遺伝子前駆体への過度な依存から生じる忠実性を改善する。
既存の手法よりも優れており、より優れたレート・歪み・知覚性能を実現している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:24:03 GMT)
AdaFusion: Prompt-Guided Inference with Adaptive Fusion of Pathology Foundation Models [35.5] 本稿では,新しいプロンプト誘導推論フレームワークであるAdaFusionを提案する。
本手法は,多様なモデルからタイルレベルの特徴を圧縮・整列する。
AdaFusionは、分類タスクと回帰タスクの両方にわたって、個々のPFMを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:09:31 GMT)
PromptDresser: Improving the Quality and Controllability of Virtual Try-On via Generative Textual Prompt and Prompt-aware Mask [35.1] 本稿では,提供される衣服画像に基づいて衣服を改造する,テキスト編集可能な仮想試着タスクに取り組む。
テキスト編集可能な仮想試行において、(i)ペア化された人着データのためのリッチテキスト記述を設計してモデルを訓練すること、(ii)既存の人の衣服のテクスト情報が新しい衣服の発生を妨害する紛争に対処すること、(iii)テキスト記述に沿った塗装マスクを適応的に調整すること、の3つの重要な側面が存在する。
提案手法は,テキスト内学習によるLMMを用いて,人や衣服の画像の詳細な記述を個別に生成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:30:23 GMT)
BUFFER-X: Towards Zero-Shot Point Cloud Registration in Diverse Scenes [34.7] 一般化を制限する重要な要因は、環境固有のボクセルサイズと探索半径に依存すること、学習ベースのキーポイント検出器のドメイン外ロバスト性に乏しいこと、および生の座標の使用である。
我々は、ボクセルサイズ/探索半径を適応的に決定し、最遠点サンプリングを用いて学習検出器をバイパスし、(c)一貫した座標境界に対するパッチワイドスケール正規化を利用する、BUFFER-Xと呼ばれるゼロショット登録パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:42:36 GMT)
Propagating Sparse Depth via Depth Foundation Model for Out-of-Distribution Depth Completion [33.9] 本研究では,大規模トレーニングを伴わずに,深度基礎モデルを利用して顕著な堅牢性を実現する新しい深度補修フレームワークを提案する。
具体的には、深度基盤モデルを用いて、RGB画像から構造的・意味的文脈を含む環境条件を抽出し、疎度情報の欠落領域への伝播を誘導する。
我々のフレームワークはOODシナリオにおいて非常によく機能し、既存の最先端の深度補完手法よりも優れています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:38:24 GMT)
A Comprehensive Framework for Uncertainty Quantification of Voxel-wise Supervised Models in IVIM MRI [33.7] 混合密度ネットワーク(MDN)のディープアンサンブルに基づく確率論的ディープラーニングフレームワークを提案する。
MDNは拡散係数Dと分数fのパラメータに対してより校正され、よりシャープな予測分布が得られたが、擬拡散係数D*ではわずかに過信が観察された。
本稿では,信頼できない推定値の同定と解釈を可能にする,不確実な定量化を伴うIVIMの包括的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:43:51 GMT)
Learning Only with Images: Visual Reinforcement Learning with Reasoning, Rendering, and Visual Feedback [33.1] 本稿では,MLLMが生画像のみから複雑な視覚的推論を学習できるようにするフレームワークを提案する。
我々は、この相対的容易さが強化学習による最適化に理想的な報酬信号を提供することを示した。
RRVF訓練モデルは既存のMLLMを上回り、微調整ベースラインを監督するだけでなく、より優れた一般化を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:53:15 GMT)
S$^2$Q-VDiT: Accurate Quantized Video Diffusion Transformer with Salient Data and Sparse Token Distillation [32.9] ビデオ拡散モデル(V-DM)の学習後量子化フレームワークであるS$2$Q-VDiTを提案する。
W4A6量子化の下では、S$2$Q-VDiTは3.9倍のモデル圧縮と1.3倍の推論加速を実現している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:44:38 GMT)
User-Intent-Driven Semantic Communication via Adaptive Deep Understanding [32.8] 多様な抽象的意図を解釈するユーザ意図型セマンティックコミュニケーションシステムを提案する。
本システムは,5dBのSNRでRayleighチャネルの下で,ディープJSCCの深い理解と性能を向上する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 22:26:27 GMT)
Data Processing for the OpenGPT-X Model Family [32.8] データ選択と要件定義から始まり、最終的なフィルタリングデータの準備まで、すべてのデータ処理手順を説明します。
我々は、データセットの詳細な分析を提供し、透明性を高め、ヨーロッパのデータ規制と整合する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:18:12 GMT)
Magic Fixup: Streamlining Photo Editing by Watching Dynamic Videos [32.7] 本稿では,所定のレイアウトに従うフォトリアリスティックな出力を合成する生成モデルを提案する。
本手法は,元の画像から細部まで細部を転送し,その部分の同一性を保持する。
簡単なセグメンテーションと粗い2D操作により、ユーザの入力に忠実なフォトリアリスティックな編集を合成できることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:23:46 GMT)
An Overview of CV-MDI-QKD [32.7] 量子鍵分布(QKD)は、量子コンピュータの脅威に対する堅牢な防御として現れる。
本稿では,CV-MDI-QKDプロトコルにおけるこれらの方法論の統合について述べる。
それは、その進化、主要な特徴、そして理論と実験の両方における最新の進歩を詳細に探求する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:52:23 GMT)
Cross-View Localization via Redundant Sliced Observations and A-Contrario Validation [32.7] クロスビューローカライゼーション(CVL)は、地上レベルの画像と空中参照とをマッチングして、カメラの位置を決定する。
ほとんどのCVL法は、単一の観察のみを出力し、カメラはポーズし、測量原理によって必要とされる冗長な観察を欠いている。
Slice-LocはCVLのアコントラリオ信頼性検証を特徴とする2段階の手法である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:15:49 GMT)
SteerPose: Simultaneous Extrinsic Camera Calibration and Matching from Articulation [32.3] 本稿では,他の視点で2次元ポーズを回転させるニューラルネットワークであるSteerPoseを提案する。
異なるマッチングを統合することで、SteerPoseは外部カメラキャリブレーションと対応検索を同時に行う。
本手法は, 新規動物の3次元ポーズをマルチカメラで再現できることを実証する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:38:31 GMT)
Can Vision Language Models Understand Mimed Actions? [32.3] 我々は、視覚言語モデルにとって、緩和行動のしっかりとした理解が重要な前提であると論じている。
そこで本研究では,86件の緩和行動からなるビデオベースの質問応答ベンチマークを提案する。
オープンウェイトモデルとAPIベースのビジョン言語モデルの両方が、MIME上で人間よりも大幅にパフォーマンスが低下していることが分かりました。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:59:32 GMT)
SpectroStream: A Versatile Neural Codec for General Audio [32.2] SpectroStreamはフルバンドマルチチャネルニューラルオーディオモデルである。
24kHzのモノフォニックオーディオ以上の機能を持つ。
48kHzのステレオ音楽を4-16kbpsのビットレートで高品質に再現できる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:44:00 GMT)
Bridging Brain Connectomes and Clinical Reports for Early Alzheimer's Disease Diagnosis [31.5] 本稿では,脳のコネクトームと臨床報告とを,被験者とコネクトームの双方で共有するクロスモーダル潜伏空間に整合させる新しい枠組みを提案する。
本手法をADNIデータセットを用いて軽度認知障害(MCI)に適用する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:20:21 GMT)
Invisible Women in Digital Diplomacy: A Multidimensional Framework for Online Gender Bias Against Women Ambassadors Worldwide [31.2] 本稿では,ソーシャルメディア上での女性の外交官の扱いに関する世界的分析について紹介する。
それは、性的な言語、外交官に向けられたツイートにおける否定性、女性外交官の可視性という3つの重要な要素に焦点を当てている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:29:19 GMT)
Navigating Through Paper Flood: Advancing LLM-based Paper Evaluation through Domain-Aware Retrieval and Latent Reasoning [30.9] 大規模言語モデル(LLM)を用いた論文自動評価のための新しいフレームワークPaperEvalを提案する。
PaperEvalには,1)新規性とコントリビューションの文脈的評価を支援するために,関連業務を検索するドメイン対応紙検索モジュール,2)複雑なモチベーションと方法論の深い理解を可能にする潜時推論機構,の2つの重要な要素がある。
2つのデータセットの実験により、PaperEvalは、学術的影響と紙の品質評価の両方において、既存の手法を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:08:13 GMT)
Towards Assessing Medical Ethics from Knowledge to Practice [30.7] 我々は3,648の質問を伴う総合的なベンチマークであるPrinciplismQAを紹介する。
これには、権威ある教科書から収集された複数の選択の質問や、権威ある医療倫理学のケーススタディ文学から得られたオープンエンドの質問が含まれる。
実験の結果,モデルの倫理的知識と実践的応用との間に大きなギャップがあることが判明した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:10:14 GMT)
Efficient Reasoning for Large Reasoning Language Models via Certainty-Guided Reflection Suppression [30.7] Certainty-Guided Reflection Suppression (CGRS) は、Large Reasoning Language Models (LRLM) における過度な思考を緩和する新しい方法である。
CGRSは、モデルが現在の応答に高い信頼を示すときに、モデルが生成するリフレクショントリガを動的に抑制することで機能する。
我々のアプローチはモデルに依存しず、再トレーニングやアーキテクチャの変更は必要とせず、既存の自己回帰生成パイプラインとシームレスに統合できる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:38:22 GMT)
A Neurosymbolic Framework for Interpretable Cognitive Attack Detection in Augmented Reality [30.6] CADARは、拡張現実における認知的攻撃検出のための新しいニューロシンボリックアプローチである。
ニューラルVLMを用いてマルチモーダル視覚言語入力を融合し、シンボリックな知覚グラフ表現を得る。
拡張されたAR認知攻撃データセットの実験では、強いベースラインよりも最大10.7%精度が向上した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:59:49 GMT)
Klear-CodeTest: Scalable Test Case Generation for Code Reinforcement Learning [30.5] Klear-CodeTestは、厳密な検証機能を備えた総合的なテストケース合成フレームワークで、テストケースの品質と信頼性を保証する。
提案したG-Vフレームワークは,正規ケースとコーナーケースの両方を含む総合的なテストケースを生成し,テストカバレッジと解の正当性評価のための識別力を向上させる。
さらに,オンライン検証プラットフォームに最適化された多層セキュリティサンドボックスシステムを設計し,安全で信頼性の高いコード実行を保証する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:36:01 GMT)
Bidding-Aware Retrieval for Multi-Stage Consistency in Online Advertising [30.1] Bidding-Aware Retrieval (BAR) はモデルベースの検索フレームワークであり、検索スコア関数に広告入札値を組み込むことで、多段階の不整合に対処する。
BARの中核となる革新はビディン・アウェア・モデリング(Bidding-Aware Modeling)であり、経済的に一貫性のある表現を確保するために単調な学習とマルチタスクの蒸留を通じて入札信号を取り入れている。
大規模なオフライン実験とAlibabaのディスプレイ広告プラットフォームへのフルスケール展開により、BARの有効性が検証された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:43:34 GMT)
RoboMemory: A Brain-inspired Multi-memory Agentic Framework for Lifelong Learning in Physical Embodied Systems [29.9] 本稿では,脳にインスパイアされたマルチメモリ・フレームワークであるRoboMemoryについて紹介する。
継続的学習、マルチモジュールメモリレイテンシ、タスク相関キャプチャ、クローズドループ計画における無限ループ緩和といった現実の環境における課題に対処する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:47:22 GMT)
Sign Spotting Disambiguation using Large Language Models [29.8] 本稿では,Large Language Models(LLMs)を統合して,符号スポッティング品質を大幅に向上させる,学習自由フレームワークを提案する。
提案手法は,グローバル・テンポラル・ハンド形状の特徴を抽出し,その特徴を大規模手話辞書と照合する。
この辞書ベースのマッチングは本質的に、モデルの再訓練を必要とせず、より優れた語彙の柔軟性を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:34:51 GMT)
RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers [29.7] RIFLExは、最先端のビデオ拡散変換器における高品質な2x外挿を実現するフリーランチである。
画質を向上し、長いビデオなしで最小限の微調整で3倍の補間を可能にする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:48:51 GMT)
DisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decoding [29.6] 本稿では、DisCoRD: Rectified Flow Decodingによる連続運動への離散トークンの導入について紹介する。
私たちの中核となる考え方は、条件生成タスクとしてトークンデコーディングをフレーム化することです。
DisCoRDは、HumanML3Dで0.032、KIT-MLで0.169、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:03:29 GMT)
Multi-level Value Alignment in Agentic AI Systems: Survey and Perspectives [29.5] エージェントAIシステムの価値アライメントは、エージェントの目標、嗜好、行動が人間の価値観や社会的規範と一致することを保証することを目的としている。
本研究では,エージェントAIシステムの代表的アーキタイプとして,LLMに基づくマルチエージェントシステムにおける価値アライメントを包括的にレビューする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:42:17 GMT)
Eliciting Latent Predictions from Transformers with the Tuned Lens [29.2] 我々は反復推論の観点からトランスフォーマーを解析する。
凍結事前訓練モデルを用いて各ブロックに対するアフィンプローブを訓練する。
我々は、悪意のある入力を検出するために潜伏予測の軌跡を利用できることを発見した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:19:06 GMT)
GAP: Gaussianize Any Point Clouds with Text Guidance [29.0] 我々は,原点雲を高忠実度3Dガウスにガウシアン化する新しい手法であるGAPを提案する。
幾何学的精度を確保するため,3次元形状の表面上にガウスを効果的に拘束する表面アンチョリング機構を導入する。
我々は,合成点雲から実世界のスキャン,さらには大規模シーンに至るまで,様々な複雑さレベルにおいて,ポイント・ツー・ガウス生成タスクにおけるGAPを評価した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:59:27 GMT)
Cooper: Co-Optimizing Policy and Reward Models in Reinforcement Learning for Large Language Models [28.5] モデルベースの報酬とルールベースの報酬の2つの主要な報酬パラダイムがある。
ルールベースの報酬には堅牢性がないのに対して、モデルベースの報酬はハッキングに対する報酬に対して脆弱である。
政策モデルと報酬モデルの両方を共同で最適化するRLフレームワークであるCooperを提案する。
我々の実験によると、Cooperは報酬ハッキングを緩和するだけでなく、例えばQwen2.5-1.5B-Instructの平均精度で0.54%向上するエンド・ツー・エンドのRL性能も改善している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:53:56 GMT)
CodeBoost: Boosting Code LLMs by Squeezing Knowledge from Code Snippets with RL [28.4] コード大言語モデル(LLM)は、効率的で自動化されたコーディングパイプラインを構築するのに欠かせないツールになっている。
既存のモデルは、「ヒューマンインストラクション-ファイナル応答」ペアを用いて汎用LLMから強化学習(RL)を用いて後訓練されるのが一般的である。
我々は,コードスニペットからLLMを純粋に拡張するフレームワークであるCodeBoostを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:31:24 GMT)
Whither symbols in the era of advanced neural networks? [28.4] 現代のニューラルネットワークと、それら上に構築された人工知能システムは、同様の能力を持っている、と我々は主張する。
これは、人間の心が使用する認知過程と表現が象徴的であるという議論を弱めている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:42:55 GMT)
Diagnosing and Mitigating Modality Interference in Multimodal Large Language Models [28.2] MLLM(Multimodal Large Language Models)はタスク間で印象的な機能を示す。
特にVQA(Visual Question Answering)のようなタスクにおいて、タスク関連と無関係な信号の区別が難しい場合が多い。
この脆弱性は、画像分類や純粋なテキスト質問応答など、モダリティ固有のタスクでより明確になる。
本稿では,摂動と対向的摂動を併用した摂動に基づくデータ拡張を含む,MLLMを微調整する新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:46:07 GMT)
A Multi-Stage Large Language Model Framework for Extracting Suicide-Related Social Determinants of Health [28.1] 自殺事件に寄与する社会的健康決定因子(SDoH)は早期介入や予防に不可欠である。
構造化されていないテキストからSDoH因子を抽出する多段階大規模言語モデルフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:36:38 GMT)
PL-DCP: A Pairwise Learning framework with Domain and Class Prototypes for EEG emotion recognition under unseen target conditions [27.8] 未確認対象条件下での脳波感情認識のためのドメインとカテゴリーのプロトタイプを用いたペアワイズ学習フレームワークを提案する。
PL-DCPモデルは、ソースデータとターゲットデータの両方を必要とするディープトランスファー学習法よりも若干性能が向上する。
この研究は感情認識のための効果的で堅牢な潜在的ソリューションを提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:19:48 GMT)
NeuraLeaf: Neural Parametric Leaf Models with Shape and Deformation Disentanglement [27.7] 我々はニューラリーフと呼ばれる3次元葉のニューラルパラメトリックモデルを開発した。
ノイラリーフは葉の幾何学を2次元の基底形状と3次元の変形に分解する。
我々は,NeuraLeafが変形を伴う広範囲の葉の形を生成できることを示し,その結果,正確な3次元観察モデルが得られた。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:24:35 GMT)
QA-Dragon: Query-Aware Dynamic RAG System for Knowledge-Intensive Visual Question Answering [27.6] 本稿では,知識集約型VQAのためのクエリ対応動的RAGシステムQA-Dragonを提案する。
テキストと画像検索エージェントをハイブリッド化することにより,マルチモーダル,マルチターン,マルチホップ推論をサポートする。
KDDカップ2025におけるメタCRAG-MMチャレンジの枠組みを評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:32:49 GMT)
Ultracoherent superconducting cavity-based multiqudit platform with error-resilient control [27.5] 超伝導無線周波数(SRF)キャビティは量子コンピューティングのための有望なプラットフォームを提供する。
本稿では,2セルの楕円形SRF空洞を用いた多モード量子システムについて報告する。
我々は2つのモードで20.6msと15.6msの単光子寿命を達成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:38:34 GMT)
PolyGuard: A Multilingual Safety Moderation Tool for 17 Languages [27.3] PolyGUARDは、LLM(Large Language Models)世代を保護するための、最先端の多言語安全モデルである。
これまでに17言語にまたがる190万のサンプルを含む、最大規模の多言語安全訓練コーパスで訓練されている。
PolyGUARDPROMPTSは、安全ガードレールの評価のための29Kサンプルを用いた高品質な多言語ベンチマークである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:05:19 GMT)
F2PASeg: Feature Fusion for Pituitary Anatomy Segmentation in Endoscopic Surgery [27.3] 解剖学的構造区分は、外科医に外科的リスクを引き起こす早期の警告を与えることができる。
F2PASegは、高解像度画像特徴と深いセマンティック埋め込みの両方を活用することにより、解剖学的構造セグメンテーションを洗練するために提案されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:04:07 GMT)
TreeDiff: AST-Guided Code Generation with Diffusion LLMs [27.1] 本稿では,抽象構文木(AST)の構造的先行を記述プロセスに組み込んだ構文対応拡散フレームワークを提案する。
その結果,構文認識の破損は構文的正当性,再構成精度,不明なコードパターンへの一般化を著しく改善することが示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:46:00 GMT)
InfiAlign: A Scalable and Sample-Efficient Framework for Aligning LLMs to Enhance Reasoning Capabilities [27.1] InfiAlignは、大規模言語モデル(LLM)のためのスケーラブルでサンプル効率の良いポストトレーニングフレームワークである
InfiAlignの中核は、オープンソースの推論から高品質なアライメントデータを自動的にキュレートする堅牢なデータ選択パイプラインである。
本結果は,基本データ選択とフルステージポストトレーニングの併用の有効性を強調した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:34:06 GMT)
Bayesian Gaussian Process ODEs via Double Normalizing Flows [27.0] 本稿では,ODEベクトル場を再パラメータ化するために正規化フローを導入し,データ駆動の事前分布を導出する。
また, GP ODE の後部推定に正規化フローを適用し, 強平均場仮定の問題を解く。
シミュレーション力学系と実世界の人間の動作データに対するアプローチの有効性を検証した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:40:56 GMT)
Towards Generalizable Safety in Crowd Navigation via Conformal Uncertainty Handling [26.6] そこで本研究では,ロボットが分散シフトに頑健な安全なナビゲーションポリシーを学習できることを提案する。
本手法は適応型共形推論により生成された予測不確実性推定を用いてエージェント観測を増強する。
我々は,本手法を実際のロボットに展開し,疎密な群集と密集した群集との相互作用において,ロボットが安全かつ堅牢な決定を行うことを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:59:43 GMT)
scAGC: Learning Adaptive Cell Graphs with Contrastive Guidance for Single-Cell Clustering [26.5] コントラスト誘導で適応的なセルグラフを学習する単一セルクラスタリング法である scAGC を提案する。
scAGCは、他の最先端メソッドを一貫して上回り、それぞれ9と7のデータセットで最高のNMIとARIスコアを得る。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:55:52 GMT)
MedHalu: Hallucinations in Responses to Healthcare Queries by Large Language Models [26.5] 大規模言語モデル(LLM)は、Web検索のような伝統的な情報探索メカニズムを補完し始めている。
LLMは幻覚を起こす傾向があり、不正確な情報や偽造情報を生成する。
本研究は, LLMによる患者からのリアルタイム医療クエリに対する幻覚反応の先駆的な研究である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:13:10 GMT)
TSPO: Temporal Sampling Policy Optimization for Long-form Video Language Understanding [26.5] MLLM(Multi- Language Large Language Models)は、視覚に基づくタスクにおいて大きな進歩を見せている。
本稿では、MLLMの長文ビデオ言語理解を強化学習により促進する時間ポリシーサンプリング最適化(TSPO)を提案する。
我々のTSPOは、複数の長大ビデオ理解ベンチマークで最先端のパフォーマンスを達成し、異なる最先端ビデオMLLM間での転送能力を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:24:17 GMT)
Incentivizing Reasoning for Advanced Instruction-Following of Large Language Models [26.4] CoT(Chain-of- Thought)は、大規模言語モデル(LLM)の能力を普遍的に改善することが期待される。
テスト時間計算のスケーリングに対する推論をインセンティブ化することで,複雑な命令を扱う上でのLLMを向上する体系的手法であるRAIFを提案する。
より優れたCoT施行のためのサンプルワイドコントラストによる複雑な指示の下での推論の浅く、重要でない性質に対処する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:09:33 GMT)
TokenFlow: Unified Image Tokenizer for Multimodal Understanding and Generation [26.3] TokenFlowは、マルチモーダル理解と生成のギャップを埋める、新しい統合イメージトークンである。
離散的な視覚入力がLLaVA-1.513Bを超える性能を初めて実証した。
我々はまた、256*256解像度のGenEvalスコア0.55の自己回帰画像生成における最先端性能を確立した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:08:33 GMT)
An Entity Linking Agent for Question Answering [26.2] 本稿では,人間の認知タスクをシミュレートする大規模言語モデルに基づく質問応答システム(QA)のためのエンティティリンクエージェントを提案する。
エージェントは、エンティティの言及を積極的に識別し、候補エンティティを検索し、決定する。
その結果, エージェントの堅牢性と有効性が確認された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:36:04 GMT)
McBE: A Multi-task Chinese Bias Evaluation Benchmark for Large Language Models [26.2] 我々は4,077のバイアス評価インスタンスを含むマルチタスク中国語バイアス評価ベンチマーク(McBE)を提案する。
このデータセットは、広範なカテゴリカバレッジ、コンテンツの多様性、包括性の測定を提供する。
結果の詳細な分析を行い、大規模言語モデル(LLM)のバイアスに関する新たな洞察を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:09:06 GMT)
Explaining Similarity in Vision-Language Encoders with Weighted Banzhaf Interactions [25.9] 言語画像事前学習(LIP)は、ゼロショット分類、ローカライゼーション、マルチモーダル検索、意味理解が可能な視覚言語モデルの開発を可能にする。
モデル類似度出力における入力画像とテキストのペアの重要性を可視化する様々な説明法が提案されている。
我々は、視覚言語エンコーダの類似性を分解するための統一的なアプローチとして、LIPモデルの忠実な相互作用説明(FIxLIP)を導入する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:18:56 GMT)
VeOmni: Scaling Any Modality Model Training with Model-Centric Distributed Recipe Zoo [25.9] Ve Omni - 大規模言語モデル(LLM)のトレーニングフレームワーク。
Ve Omni氏は、計算からコミュニケーションを分離するモデル中心の分散レシピを紹介した。
Ve Omniは2,800トークン/秒/GPUスループットでトレーニングでき、128GPU上の3D並列処理によって160Kのコンテキスト長にスケールすることができる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:31:09 GMT)
Disentangling Bias by Modeling Intra- and Inter-modal Causal Attention for Multimodal Sentiment Analysis [25.8] マルチモーダル感情分析(MSA)は、テキスト、音声、視覚データなどの複数のモーダルからの情報を統合することで、人間の感情を理解することを目的としている。
既存の手法は、しばしばモダリティ内およびモダリティ間の急激な相関に悩まされ、モデルが真の因果関係ではなく統計的ショートカットに依存するようになる。
本稿では,マルチリレーショナルマルチモーダル因果干渉(MMCI)モデルを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:24:04 GMT)
Part Segmentation and Motion Estimation for Articulated Objects with Dynamic 3D Gaussians [25.7] パートセグメンテーションとモーション推定は、明瞭な物体の動き解析の基本的な問題である。
単音節物体の観測点雲列からこれらの問題を共同で解く方法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:03:15 GMT)
Mean-Variance Efficient Collaborative Filtering for Stock Recommendation [25.7] ストックレコメンデーションのための平均分散効率的な協調フィルタリング(MVECF)モデルを提案する。
我々のモデルは、リスク(リターンのばらつき)とリターン(リターン)のトレードオフにおいて、株価の不確実性を体系的に扱うことにより、パレート最適性を改善するように設計されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:12:19 GMT)
pFedDSH: Enabling Knowledge Transfer in Personalized Federated Learning through Data-free Sub-Hypernetwork [25.5] Federated Learning (FL)は、生データを共有せずに、分散クライアント間で協調的なモデルトレーニングを可能にする。
既存のパーソナライズド・フェデレート・ラーニング(pFL)メソッドは静的なクライアント参加を前提としています。
本稿では,ベクトルを埋め込んで各クライアントのパーソナライズされたモデルを生成する,集中型ハイパーネットワークに基づく新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:43:02 GMT)
Revealing Latent Information: A Physics-inspired Self-supervised Pre-training Framework for Noisy and Sparse Events [25.3] イベントカメラは、高時間分解能と広ダイナミックレンジでデータを記録する。
イベントデータは本質的にスパースでノイズが多く、主に明るさの変化を反映している。
本稿では,イベントデータ中の潜伏情報を完全に明らかにする自己教師付き事前学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:38:36 GMT)
StructVRM: Aligning Multimodal Reasoning with Structured and Verifiable Reward Models [25.3] StructVRMは、マルチモーダル推論をStructudおよびVerifiable Reward Modelsと整合させる手法である。
その中核は、きめ細かいサブクエストレベルのフィードバックを提供するために訓練されたモデルベースの検証器である。
トレーニングされたモデルSeed-StructVRMは、12の公開マルチモーダルベンチマークのうち6つの最先端のパフォーマンスと、新たにキュレートされた高微分型STEM-Benchを実現しています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:31:21 GMT)
MoBE: Mixture-of-Basis-Experts for Compressing MoE-based LLMs [25.2] MoBEは前作に比べて顕著に精度が低下する。
MoBEはQwen3-235B-A22B-2507、DeepSeek-V3-0324 (671B)、Kimi-K2-Instruct (1T)のパラメータ数を24%-30%削減できる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:48:24 GMT)
AudioGen-Omni: A Unified Multimodal Diffusion Transformer for Video-Synchronized Audio, Speech, and Song Generation [24.8] AudioGen-Omniは、入力ビデオとコヒーレントに同期した高忠実度オーディオ、音声、歌を生成する。
ジョイントトレーニングパラダイムは、大規模ビデオテキストオーディオコーパスを統合している。
密度フレームレベルの表現は、AdaLNベースのジョイントアテンション機構を用いて融合する。
推測時間は8秒間1.91秒であり、効率と一般性の両方で大幅に改善されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:31:04 GMT)
Divide-and-Conquer for Enhancing Unlabeled Learning, Stability, and Plasticity in Semi-supervised Continual Learning [24.4] 半教師付き連続学習(SSCL)は、ラベル付きデータとラベルなしデータの両方を逐次学習設定で活用しようとする。
この研究は、SSCLの3つの側面を相乗的に強化するように設計された分割・分散フレームワークであるUSPを提示する。
USPは以前のSSCL法よりも優れており、最終精度は5.94%まで向上し、その有効性を検証している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:19:23 GMT)
GuARD: Effective Anomaly Detection through a Text-Rich and Graph-Informed Language Model [24.2] テキストリッチグラフ上の異常検出は、不正に割り当てられた学術論文を著者に検出したり、ソーシャルネットワーク内のボットを検出するなど、現実の世界で広く普及している。
本稿では,テキストリッチおよびグラフインフォームド言語モデルであるGuARDについて紹介する。このモデルでは,グラフベースの手法から重要な構造的特徴と,テキストリッチグラフ上での効果的な異常検出のために,小さな言語モデルを用いて抽出したきめ細かなセマンティック属性を結合する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:06:29 GMT)
CF3: Compact and Fast 3D Feature Fields [24.2] 3D Gaussian Splatting (3DGS)は2Dファンデーションモデルから豊富な情報を取り入れ始めた。
本稿では,コンパクトかつ高速な3次元ガウス特徴場,すなわちCF3を構築するためのトップダウンパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:45:08 GMT)
MELLA: Bridging Linguistic Capability and Cultural Groundedness for Low-Resource Language MLLMs [24.1] MLLM(Multimodal Large Language Models)は、高リソース言語において顕著な性能を示す。
しかし、その効果は低リソース言語の文脈において著しく低下する。
本稿では,各目標に合ったデータの収集をガイドするデュアルソース戦略を提案し,文化のためのネイティブなウェブアルトテキストと言語学のためのMLLM生成キャプションをソーシングする。
実験結果から,MELLAを微調整した後,MLLMバックボーン上の8言語に対して,汎用的な性能向上が得られた。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:36:24 GMT)
FedMP: Tackling Medical Feature Heterogeneity in Federated Learning from a Manifold Perspective [23.6] Federated Learning(FL)は、複数のクライアントがローカルなプライベートデータを共有せずに、共同で共有モデルをトレーニングする分散機械学習パラダイムである。
非IIDシナリオ下でFLを強化するための新しい手法であるFedMPを提案する。
実世界のマルチセンター分布を含む複数の医用画像データセットにおけるFedMPの有効性を検証する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:13:46 GMT)
DistillDrive: End-to-End Multi-Mode Autonomous Driving Distillation by Isomorphic Hetero-Source Planning Model [23.6] エンド・ツー・エンドの知識蒸留に基づく自律運転モデルであるDistillDriveを紹介した。
教師モデルとして構造化シーン表現に基づく計画モデルを用いる。
我々は, 衝突速度を50%低減し, nuScenes と NAVSIM のデータセット上でモデルを検証した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:54:35 GMT)
QuMAB: Query-based Multi-Annotator Behavior Modeling with Reliability under Sparse Labels [23.6] マルチアノテーション学習は伝統的に、様々なアノテーションを集約して単一の真実を近似し、不一致をノイズとして扱う。
本稿では,サンプル・ワイド・アグリゲーションからアノテータ・ワイド・ビヘイビア・モデリングへのパラダイムシフトを紹介する。
アノテータの不一致をノイズではなく貴重な情報として扱うことにより、アノテータ固有の行動パターンをモデル化することで、未ラベルデータを再構築してアノテーションコストを低減し、集約信頼性を高め、アノテータの決定動作を説明することができる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:17:29 GMT)
Single-Pass Document Scanning for Question Answering [23.5] 本稿では,テキスト全体を線形時間で処理する単一パス文書スキャン手法を提案する。
41のQAベンチマークで、我々のシングルパススキャナはチャンクベースの埋め込み方法よりも一貫して優れています。
全体として、シングルパス文書スキャンは、大量のテキストに対して質問に答える簡単なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:57:15 GMT)
B4DL: A Benchmark for 4D LiDAR LLM in Spatio-Temporal Understanding [23.4] 我々は,4次元LiDAR理解上でMLLMを訓練し,評価するためのベンチマークであるB4DLを紹介する。
本稿では,スケーラブルなデータ生成パイプラインとMLLMモデルを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:11:56 GMT)
DeepPHY: Benchmarking Agentic VLMs on Physical Reasoning [23.4] 視覚言語モデル(VLM)は、強い知覚能力と印象的な視覚的推論を示す。
複雑な動的環境において、細部と正確な行動計画に注意を払うのに苦労する。
DeepPHYは、現実世界のシナリオでこれらの機能を評価するために設計された、新しいベンチマークフレームワークである。
我々の評価では、最先端のVLMでさえ、物理的知識を正確な予測制御に変換するのに苦労している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:58:19 GMT)
Aligning LLMs on a Budget: Inference-Time Alignment with Heuristic Reward Models [23.4] HIA(Heuristic-Guided Inference-time Alignment)は,軽量プロンプトを用いたチューニング不要でブラックボックス互換のアプローチである。
HIAは1つまたは2つの応答クエリの少ない低推論予算下で有効であることが判明した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:54:27 GMT)
Real-Time Iteration Scheme for Diffusion Policy [23.1] 本稿では,RTI(Real-Time Iteration)スキームにインスパイアされた新しい手法を導入し,推論を高速化する。
本稿では,ロボット操作における把握などの離散的な動作を効果的に扱うためのスケーリング手法を提案する。
提案方式は蒸留や政策の再設計を必要とせず,実行時の計算コストを大幅に削減する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:49:00 GMT)
IFDECORATOR: Wrapping Instruction Following Reinforcement Learning with Verifiable Rewards [22.8] Instruct following Decorator(IFDecorator)は、RLVRトレーニングを堅牢でサンプル効率のよいパイプラインにラップするフレームワークである。
我々のQwen2.5-32B-Instruct-IFDecoratorはIFEvalで87.43%の精度を達成し、GPT-4oのようなより大きなプロプライエタリモデルよりも優れている。
私たちのトリップワイヤは、報酬のハッキング率を大幅に低下させています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:30:20 GMT)
Understanding Large Language Model Behaviors through Interactive Counterfactual Generation and Analysis [22.8] 本稿では,大規模言語モデル (LLM) の対実解析による探索を可能にする対話型可視化システムを提案する。
本システムは,意味論的に意味のある反事実を生成する新しいアルゴリズムを特徴とする。
LLM実践者とのユーザスタディと専門家とのインタビューは、システムのユーザビリティと有効性を示している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:48:25 GMT)
Information-Theoretic Graph Fusion with Vision-Language-Action Model for Policy Reasoning and Dual Robotic Control [22.7] Graph-Fused Vision-Language-Action (GF-VLA)は、デュアルアームロボットシステムがタスクレベルの推論と実行を可能にするフレームワークである。
GF-VLAはまずシャノン情報に基づく手がかりを抽出し、最も高いタスク関連性を持つ手や物体を識別する。
クロスハンド選択ポリシーは、明示的な幾何学的推論なしで最適な割り当てを推測する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:48:09 GMT)
Resource-Limited Joint Multimodal Sentiment Reasoning and Classification via Chain-of-Thought Enhancement and Distillation [22.7] 最近のアプローチは、主にパラメータ重(マルチモーダル)大規模言語モデル(LLM)の知識と推論能力を活用する。
本稿では,資源制限環境における配置制約に対処するマルチモーダル・チェーン・オブ・スチューデント・推論蒸留モデル MulCoT-RD を提案する。
4つのデータセットの実験により、3Bパラメータのみを持つMulCoT-RDは、堅牢な一般化と拡張された解釈可能性を示しながら、JMSRC上での強い性能を実現することが示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:23:14 GMT)
Nonasymptotic Analysis of Stochastic Gradient Descent with the Richardson-Romberg Extrapolation [22.7] 本研究では, 勾配勾配勾配(SGD)を一定のステップサイズで解くことで, 密接な凸と滑らかな問題を解く問題に対処する。
得られた推定子の平均二乗誤差を、反復数$n$に対して拡張する。
我々の分析は、時相マルコフ連鎖と見なされるSGDの特性に依存している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:17:05 GMT)
Negative Binomial Variational Autoencoders for Overdispersed Latent Modeling [22.6] 最近の研究は、ポアソン分布を用いてスパイク数をモデル化することによって生物学的にインスピレーションを得ている。
負二項分布を用いてスパイク数をカウントするVAEフレームワークの原理拡張であるNegBio-VAEを導入する。
このシフトは分散を明示的に制御し、より広範で正確な神経表現の族を解き放つ。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:15:09 GMT)
Tail-Risk-Safe Monte Carlo Tree Search under PAC-Level Guarantees [22.6] モンテカルロ・ツリー・サーチで期待されるリターンのみに関する意思決定は、意思決定に関連するリスクの高い、有害な結果の潜在的な範囲を考慮できない。
これらのアプローチは、極端な結果やリスクの高い結果に関して厳格なテールセーフティ保証を提供することができない。
本稿では,この問題を2つの新しい解法によって解決する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:31:22 GMT)
Decoupling Understanding from Reasoning via Problem Space Mapping for Small-scale Model Reasoning [22.6] 本稿では、自然言語問題を標準問題空間にマッピングすることで、推論から理解を分離する新しいフレームワークを提案する。
本フレームワークでは, 自己蒸留による推論軌道を反復的に整列する3段階のアルゴリズムであるDURITを導入する。
実験により、DURITはドメイン内およびドメイン外の数学的および論理的推論タスクにおけるSLMの性能を大幅に改善することが示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:13:30 GMT)
PSEO: Optimizing Post-hoc Stacking Ensemble Through Hyperparameter Tuning [21.7] 本稿では,ポスト・ホック・スタックング・アンサンブル最適化のためのフレームワークであるPSEOを提案する。
sysは、最近のAutoMLシステムにおけるポストホックな設計を含む16の手法の中で、最も平均的なテストランク(2.96)を達成している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:25:44 GMT)
Driver Assistant: Persuading Drivers to Adjust Secondary Tasks Using Large Language Models [21.6] 本研究では,道路条件に対する適切な注意維持を支援するために,Large Language Model (LLM) を用いた。
本ツールでは,レベル3システムで発生する道路条件をトリガーとして利用し,視覚経路と聴覚経路の両方を通じてドライバーの行動を積極的に操縦する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:26:28 GMT)
KBest: Efficient Vector Search on Kunpeng CPU [21.4] KBestは最新のHuawei Kunpeng 920 CPU用に設計されたベクトル検索ライブラリである。
KBestはハードウェア認識とアルゴリズムの最適化を多用している。
実験の結果,KBestはx86 CPUで動作するSOTAベクトル探索ライブラリより優れていることがわかった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:48:34 GMT)
LLMs are Single-threaded Reasoners: Demystifying the Working Mechanism of Soft Thinking [21.2] 本稿では,大規模言語モデル(LLM)のソフトな抽象トークン生成能力について検討する。
一般的な信念とは対照的に,LSMはその後の復号過程において,ソフトインプットの最も影響力のある要素に依存していることが明らかとなった。
この問題に対処するために,ディリクレ再サンプリングやGumbel-Softmax トリックなどの手法を用いて,エミュランドネスを導入するためのサンプリング戦略を検討する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:38:21 GMT)
Discovering Interpretable Programmatic Policies via Multimodal LLM-assisted Evolutionary Search [21.0] 解釈可能性と高い性能は、特に安全クリティカルなタスクにおいて、制御ポリシーを設計する上で必須の目標である。
本研究は,MLES (Multimodal Large Language Model-Assisted Search) と呼ばれる,プログラム型ポリシー発見のための新しいアプローチを導入する。
MLESはマルチモーダルな大言語モデルをポリシージェネレータとして利用し、自動ポリシー最適化のための進化的メカニズムと組み合わせている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:24:03 GMT)
Uni-cot: Towards Unified Chain-of-Thought Reasoning Across Text and Vision [21.0] 大規模言語モデル(LLM)を強化するために,チェーン・オブ・ソート(CoT)推論が広く採用されている。
We propose Uni-CoT, a Unified Chain-of-Thought framework that allow coherent and grounded multimodal reasoning。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:45:17 GMT)
Learning What Matters: Probabilistic Task Selection via Mutual Information for Model Finetuning [20.9] 混合最適化のための原則的でスケーラブルなフレームワークであるTASKPGMを紹介する。
TASKPGMはマルコフランダム場(MRF)上のエネルギー関数を最小化して連続タスク比を選択する
本手法は, 単純な制約下で閉形式解を導出し, タスク間の代表性と多様性を確実にバランスさせる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:25:15 GMT)
Smoothing Slot Attention Iterations and Recurrences [20.6] スロット注意(SA)とその変種は、主流のオブジェクト指向学習(OCL)の中心にある
ビデオの場合、このようなアグリゲーションはフレーム間でテキスト的に共有され、第1フレームではクエリがコールドスタートされ、第1フレームでは前のフレームのスロットから遷移する。
画像やビデオの最初のフレームでSAイテレーションをスムーズにするために、入力機能の豊富な情報でコールドスタートクエリをテキスト化します。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:09:33 GMT)
An End-to-End Multi-objective Ensemble Ranking Framework for Video Recommendation [20.6] 本稿では,多目的アンサンブルランキングモジュールのための新しいエンド・ツー・エンド多目的アンサンブルランキングフレームワーク(EMER)を提案する。
EMERは手作業で設計された公式をエンドツーエンドのモデリングパラダイムに置き換えることで強化する。
当社のフレームワークは,毎日数億人のアクティブユーザがいるショートビデオレコメンデーションプラットフォームであるKuaishouの主要なシナリオにデプロイされています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:21:46 GMT)
Compressed Decentralized Momentum Stochastic Gradient Methods for Nonconvex Optimization [20.6] 我々は2つの異なるシナリオ下で非圧縮不均一性最適化を解くために2つの圧縮分散アルゴリズムを設計する。
どちらのアルゴリズムも、高速収束を実現するモーメント技術と、通信コストを削減するメッセージスピード技術を採用している。
ディープニューラルネットワーク(DNN)とトランスフォーマーの最先端手法では、超越的な経験的性能が観察される。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:33:00 GMT)
Probabilistic Stability Guarantees for Feature Attributions [20.6] 本稿では,非自明かつ解釈可能な帰属法保証を与えるモデル非依存,サンプル効率の安定度保証アルゴリズム(SCA)を提案する。
軽度な平滑化は精度と安定性のトレードオフをより良好に達成し、事前の認証手法による攻撃的な妥協を回避することを示します。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:32:55 GMT)
Sculpting Margin Penalty: Intra-Task Adapter Merging and Classifier Calibration for Few-Shot Class-Incremental Learning [20.6] フォワード互換学習はFSCIL(Few-Shot Class-Incremental Learning)にとって有望なソリューションである
SMP(Sculpting Margin Penalty)は,パラメータ効率のよい微調整パラダイムにおいて,異なる段階における利幅のペナルティを戦略的に統合する新しいFSCIL法である。
そこで本研究では,SMPがFSCILの最先端性能を実現しつつ,ベースクラスと新しいクラスとのバランスを良く保っていることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:26:24 GMT)
EarthSynth: Generating Informative Earth Observation with Diffusion Models [20.4] 本研究では,多カテゴリ・クロスサテライトによる地球観測が可能な拡散ベース生成基盤モデルを提案する。
Earth Synthは、リモートセンシングのためのマルチタスク生成を初めて探求し、限定的な一般化の課題に取り組む。
オープンワールドシナリオにおけるシーン分類,オブジェクト検出,セマンティックセグメンテーションにおける地球合成の評価を行った。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:33:17 GMT)
Align, Don't Divide: Revisiting the LoRA Architecture in Multi-Task Learning [20.3] 頭間類似度の高い単純化されたマルチヘッドアーキテクチャは、複雑なマルチアダプタおよびマルチヘッドシステムより優れていることを示す。
本稿では,共有アダプタ空間内でのタスク表現の整合性を明示的に損なうAlign-LoRAを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:02:55 GMT)
Stochastic Bandits for Crowdsourcing and Multi-Platform Autobidding [20.2] クラウドソーシング(クラウドソーシング)では,一定額の資金がK$の労働者に分配され,固定予算がK$の同時オークションで競売に使用される。
アームは、$K$-dimensional probability simplexに属し、各タスク/オークションに割り当てられた予算の分数を表す。
各ラウンドの報酬は$K$の報酬の合計で、それぞれの報酬は、そのタスク/オークションに割り当てられた予算のごく一部で異なる確率でアンロックされる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:47:27 GMT)
FLUX-Makeup: High-Fidelity, Identity-Consistent, and Robust Makeup Transfer via Diffusion Transformer [20.2] FLUX-Makeupは、高忠実で、アイデンティティに一貫性があり、堅牢なメイクアップ・トランスファー・フレームワークである。
提案手法では,ソース参照画像ペアを直接利用して転送性能を向上する。
FLUX-Makeupは最先端のパフォーマンスを実現し、さまざまなシナリオで強い堅牢性を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:42:40 GMT)
SpectrumWorld: Artificial Intelligence Foundation for Spectroscopy [20.0] 本稿では,分光学における深層学習研究の体系化と高速化を目的とした,先駆的な統一プラットフォームであるSpectrumLabを紹介する。
SpectrumLabには,重要なデータ処理と評価ツールを備えた包括的なPythonライブラリとリーダボード,限定されたシードデータから高品質なベンチマークを生成する革新的なSpectrumAnnotatorモジュールという,3つのコアコンポーネントが統合されている。
私たちはSpectrumLabが、ディープラーニング駆動分光の今後の進歩の重要な基盤になることを期待しています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:20:47 GMT)
Scientifically-Interpretable Reasoning Network (ScIReN): Discovering Hidden Relationships in the Carbon Cycle and Beyond [20.0] 科学者は、既存の知識に基づいて土壌炭素循環の数学的プロセスに基づくモデルを開発した。
本稿では,解釈可能なニューラルネットワークとプロセスベースの推論を組み合わせた完全透明なフレームワークであるScIReNを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:04:18 GMT)
BOASF: A Unified Framework for Speeding up Automatic Machine Learning via Adaptive Successive Filtering [19.9] 本稿では,マルチアーム・バンディット・フレームワークを用いたベイズ最適化と適応逐次フィルタリングアルゴリズム(BOASF)を提案する。
BOASFは複数の評価ラウンドで構成されており、各アームに対して有望な構成を選択する。
ソフトマックスモデルは、次のラウンドに進む有望な各腕に利用可能なリソースを適応的に割り当てるために使用される。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:12:27 GMT)
When Deepfake Detection Meets Graph Neural Network:a Unified and Lightweight Learning Framework [19.8] SSTGNNはビデオを構造化グラフとして表現し、空間的不整合、時間的アーティファクト、スペクトル歪みに対する共同推論を可能にする。
多様なベンチマークデータセットの実験では、SSTGNNはドメイン内設定とドメイン間設定の両方で優れたパフォーマンスを達成している。
注目すべきは、SSTGNNがこれらの結果を、最先端モデルよりも最大42.4$times$少ないパラメータで達成していることだ。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:55:13 GMT)
PhysPatch: A Physically Realizable and Transferable Adversarial Patch Attack for Multimodal Large Language Models-based Autonomous Driving Systems [19.7] マルチモーダル大規模言語モデル(MLLM)は、視覚言語推論能力の強いために、自律運転(AD)システムに不可欠なものになりつつある。
MLLMは敵の攻撃、特に敵のパッチ攻撃に対して脆弱であり、現実世界のシナリオで深刻な脅威を引き起こす可能性がある。
既存のパッチベースの攻撃方法は、主にオブジェクト検出モデルのために設計されており、MLLMベースのシステムに転送すると性能が良くない。
MLLMベースのADシステムに適した転送可能な逆パッチフレームワークであるPhysPatchを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:54:54 GMT)
TrajEvo: Trajectory Prediction Heuristics Design via LLM-driven Evolution [19.6] トレイ予測は人間の行動、特に社会ロボティクスや自動運転車のナビゲーションといった安全上重要な領域をモデル化する上で重要なタスクである。
本稿では,Large Language Models (LLMs) を利用して軌道予測一般を自動設計するフレームワークであるTrajEvoを紹介する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:55:10 GMT)
Multi-Faceted Large Embedding Tables for Pinterest Ads Ranking [19.6] 複数の事前学習アルゴリズムを組み込んだ,複数面事前学習方式を提案する。
このフレームワークはPinterest Adsシステムにデプロイされ、1.34%のオンラインCPC削減と2.60%のCTR向上を達成した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:31:20 GMT)
A Comprehensive Review of Diffusion Models in Smart Agriculture: Progress, Applications, and Challenges [19.5] 拡散モデルは、農業の画像処理、データ拡張、リモートセンシング分析に可能性を示している。
従来の生成逆ネットワーク(GAN)と比較して、拡散モデルはトレーニングの安定性が向上し、画像生成品質が向上する。
本稿では,農業における拡散モデルの適用の最近の進歩を概観し,作物病や害虫検出,リモートセンシング画像強調,作物の生育予測,農業資源管理における役割に注目した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:05:39 GMT)
NanoCodec: Towards High-Quality Ultra Fast Speech LLM Inference [19.2] 大規模言語モデル(LLM)は、音声コーデックを利用して音声をトークンに識別することで、かなり高度なオーディオ処理を行う。
既存のオーディオコーデックは高いフレームレートで動作し、特に自己回帰モデルにおいてトレーニングと推論が遅くなる。
我々は,12.5フレーム/秒(FPS)で高品質な圧縮を実現する,最先端オーディオであるNanoCodecを紹介する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:20:32 GMT)
IRL-VLA: Training an Vision-Language-Action Policy via Reward World Model [19.1] IRL-VLA は textbfInverse textbfReinforcement textbfLearning reward world model による新しいループ強化学習である。
本稿では, 自己構築型VLAアプローチを用いて, textbfInverse textbfReinforcement textbfLearning reward world model を用いた新しいループ強化学習であるIRL-VLAを紹介する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:30:05 GMT)
QFOR: A Fidelity-aware Orchestrator for Quantum Computing Environments using Deep Reinforcement Learning [19.0] 量子クラウドコンピューティングは、量子プロセッサへのリモートアクセスを可能にするが、量子ハードウェアの不均一性とノイズは、リソースのオーケストレーションを複雑にする。
本稿では、Deep Reinforcement Learningを用いたクラウド環境における不均一な量子ノード間のタスクの量子フィデリティアウェアオーケストレーションであるQFORを提案する。
我々のフレームワークは、量子タスク実行の完全性と時間全体のバランスをとり、異なる運用優先順位への適応を可能にします。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:00:50 GMT)
Keep It Real: Challenges in Attacking Compression-Based Adversarial Purification [19.0] 再構築された画像における高いリアリズムは、攻撃の難しさを著しく増大させる。
現実的かつ高忠実な再構築を実現できる圧縮モデルが,我々の攻撃に対して極めて耐性があることを実証した。
この研究は、将来の敵対的攻撃の大きな障害を強調し、現実主義を克服するより効果的な技術を開発することが、総合的なセキュリティ評価にとって重要な課題であることを示唆している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:24:26 GMT)
Efficient Attention Mechanisms for Large Language Models: A Survey [18.9] トランスフォーマーベースのアーキテクチャは、大規模言語モデルの一般的な計算バックボーンとなっている。
最近の研究は、効率的な注意機構の2つの主要なカテゴリを紹介している。
対照的に、スパースアテンションテクニックは、固定パターン、ブロックワイドルーティング、クラスタリング戦略に基づいて、選択されたトークンのサブセットに注意を限定する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:08:17 GMT)
Text2VDM: Text to Vector Displacement Maps for Expressive and Interactive 3D Sculpting [18.8] 3Dアセットの作成には、表面の細部と幾何学的構造を追加するために、多彩な彫刻のブラシが必要となることが多い。
本稿では,テキスト・ツー・VDMブラシ生成のための新しいフレームワークであるText2VDMを提案する。
生成されたブラシは、メインストリームのモデリングソフトウェアにシームレスに統合できます。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:06:41 GMT)
Viewpoint Consistency in 3D Generation via Attention and CLIP Guidance [18.8] 現在の手法はしばしば幾何学的矛盾に悩まされ、一般にヤヌス問題と呼ばれる。
本稿では,拡散モデルにおけるジャナス問題の根本原因である視点生成バイアスを明らかにする。
本稿では,Attention and CLIP Guidance (ACG) 機構と呼ばれるチューニング不要な手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:20:21 GMT)
ReasoningTrack: Chain-of-Thought Reasoning for Long-term Vision-Language Tracking [18.5] 本稿では,事前学習型視覚言語モデルQwen2.5-VLに基づく推論に基づく視覚言語追跡フレームワークReasoningTrackを提案する。
更新された言語記述を埋め込み、それらを視覚機能とともにトラッキングバックボーンネットワークに統合する。
さらに,200の動画シーケンスを含むTNLLTと呼ばれる大規模長期視覚言語追跡ベンチマークデータセットを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:02:07 GMT)
IRCopilot: Automated Incident Response with Large Language Models [18.3] 大規模言語モデル(LLM)は早期の脅威検出に大きな可能性を示している。
侵入後の自動インシデント応答に関しては、その能力は依然として制限されている。
LLMを用いた自動インシデント応答のための新しいフレームワークIRCopilotを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:47:41 GMT)
Unlocking the Potential of MLLMs in Referring Expression Segmentation via a Light-weight Mask Decoder [18.2] 本稿では,MLLMビジョンエンコーダに符号化された視覚的特徴を,余分な視覚的エンコーダを導入することなく活用する新しいフレームワークを提案する。
さらに,MLLMの大規模言語モデル(LLM)によって出力される意味関連特徴と,詳細関連視覚特徴とを完全に統合した,詳細拡張型・意味整合型特徴融合モジュール(DSFF)を提案する。
我々の手法は一般にSAMベースの競合とSAMフリーの競合に勝り、性能とコストのバランスが良くなる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:07:54 GMT)
Test-Time Reinforcement Learning for GUI Grounding via Region Consistency [18.0] 本稿では,複数のサンプル予測から空間投票格子を構築し,コンセンサス領域を同定するテスト時間スケーリング手法を提案する。
また、GUI-RCPOを導入し、これらの一貫性パターンをテスト時間強化学習の報酬に変換する。
提案手法は,GUI接地のためのテスト時間スケーリングとテスト時間強化学習の未解決の可能性を明らかにし,より堅牢でデータ効率のよいGUIエージェントへの有望な道筋を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:54:27 GMT)
Interior Object Geometry via Fitted Frames [17.9] 本稿では,対象集団内での強い位置対応を実現するために,解剖学的対象を対象とする表現について述べる。
進化的s-rep(s-rep)と呼ばれるこの新しい表現により,分類性能が顕著に向上したことを示す。
それぞれの表現から派生した幾何学的特徴について考察する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:15:17 GMT)
TANGO: Graph Neural Dynamics via Learned Energy and Tangential Flows [17.5] グラフ表現学習のための動的システムにインスパイアされたフレームワークであるTANGOを紹介する。
我々のアプローチの中核は、ノード埋め込み上の学習可能なリアプノフ関数である。
エネルギー価値を維持しながら特徴を進化させる,メッセージパッシングによって学習された新しい接尾辞成分を組み込んだ。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:44:01 GMT)
Basis Selection: Low-Rank Decomposition of Pretrained Large Language Models for Target Applications [17.1] 大規模言語モデル(LLM)は様々なアプリケーションの性能を著しく向上させるが、計算集約的でエネルギー需要が高い。
これにより、パーソナルコンピュータやモバイル/ウェアラブルデバイスといった限られたリソースを持つデバイスにデプロイすることが困難になる。
我々は、これらのモデルを効果的に圧縮するために、特定のアプリケーションの要求に合わせて低ランク分解アプローチを導入する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:02:42 GMT)
SciReplicate-Bench: Benchmarking LLMs in Agent-driven Algorithmic Reproduction from Research Papers [16.8] 本研究では,最近のNLP論文におけるアルゴリズム記述からコードを生成する際の言語モデル (LLM) を評価する。
厳密な評価を容易にするため、2024年に発行された36のNLP論文から100のタスクのベンチマークであるSciReplicate-Benchを紹介する。
SciReplicate-Bench上に構築されたSci-Reproducerは,論文からアルゴリズムの概念を解釈するPaper Agentと,リポジトリから依存関係を検索してソリューションを実装するCode Agentで構成された,デュアルエージェントフレームワークである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:31:54 GMT)
NatureGAIA: Pushing the Frontiers of GUI Agents with a Challenging Benchmark and High-Quality Trajectory Dataset [16.7] 本稿ではCausal Pathwaysの原理に基づく新しいベンチマークであるNaturalGAIAを紹介する。
このパラダイムは複雑なタスクを検証可能な一連の原子ステップに構造化し、厳密で完全に自動化され、再現可能な評価基準を保証する。
次に、このデータセットを用いて、Q2.5-VL-7Bモデル上でReinforcement FineTuning(RFT)を行う。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:42:28 GMT)
A Design for an Early Quantum Network [16.7] 本稿では,既存の3つの量子リピータ技術と互換性のある早期量子ネットワークの設計を提案する。
この設計は、量子アプリケーションの多様なニーズに対応するネットワークの能力を最大化することを目的としている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:39:49 GMT)
Attribute Guidance With Inherent Pseudo-label For Occluded Person Re-identification [16.6] Attribute-Guide ReID(AG-ReID)は、追加のデータやアノテーションなしで詳細なセマンティック属性を抽出する新しいフレームワークである。
まず、微妙な視覚的特徴を捉えた属性の擬似ラベルを生成し、次に二重誘導機構を導入する。
大規模な実験により、AG-ReIDは複数の広く使用されているRe-IDデータセットで最先端の結果が得られることが示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:13:24 GMT)
Learned Single-Pass Multitasking Perceptual Graphics for Immersive Displays [16.5] 新興没入型ディスプレイ技術は、望ましくないレンダリングやデノイングといった知覚グラフィック手法で資源を効率的に活用する。
複数の知覚グラフィック手法を実行することは、限られたパワーと計算資源を持つデバイスに挑戦する。
計算軽量な学習型マルチタスク知覚グラフィックスモデルを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:59:19 GMT)
Looking into the Unknown: Exploring Action Discovery for Segmentation of Known and Unknown Actions [16.4] 私たちは、データセットであいまいなアクションを定義し、注釈を付けるという課題に対処する、新しいセットアップであるAction Discoveryを紹介します。
この設定では、既知のアクションと呼ばれるアクションのサブセットだけがトレーニングデータに注釈付けされ、他の未知のアクションはラベル付けされていない。
このシナリオは神経科学のような分野において特に関係があり、よく定義された行動は、しばしば見過ごされる微妙な、または頻繁な行動と共存する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:00:00 GMT)
Tell Me Who Your Students Are: GPT Can Generate Valid Multiple-Choice Questions When Students' (Mis)Understanding Is Hinted [16.4] 本研究の主な目的は、事前学習された大規模言語モデルを用いて、多目的質問(MCQ)を生成する革新的なプロンプト技術であるAnaQuestを開発し、評価することである。
選択項目は、複雑な概念に関する文レベルの主張である。
定式化段階では,学生は自由テキストで対象概念に対するオープンな質問に回答する。要約的評価では,これらの回答を分析し,正しいアサーションと間違ったアサーションを生成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:35:40 GMT)
Marine Chlorophyll Prediction and Driver Analysis based on LSTM-RF Hybrid Models [16.4] 海洋クロロフィル濃度は生態系の健康と炭素循環の強さの重要な指標である。
本稿では,LSTMとRFの利点を組み合わせたLSTM-RFハイブリッドモデルを提案する。
実験の結果,LSTM-RFモデルではR2は0.5386,MSEは0.005806,MAEは0.057147であった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:55:42 GMT)
MAISI-v2: Accelerated 3D High-Resolution Medical Image Synthesis with Rectified Flow and Region-specific Contrastive Loss [16.4] MAISI-v2は,修正フローを統合し,高速かつ高品質な生成を可能にする最初の3次元医用画像合成フレームワークである。
実験の結果,MAISI-v2 は潜時拡散モデルに対して 3 倍の加速で SOTA の画質を達成できることがわかった。
また,データ拡張に合成画像が使用できることを示すために,下流セグメンテーション実験を行った。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:39:45 GMT)
ASCoT: An Adaptive Self-Correction Chain-of-Thought Method for Late-Stage Fragility in LLMs [16.3] CoT(Chain-of-Thought)の促進により,LLM(Large Language Models)の推論機能が大幅に向上した。
CoT鎖の後半で導入されたエラーは、当初と同一のエラーよりも、最終回答が著しく破損する可能性が高い。
本稿では、この脆弱性に対処するために、適応自己補正連鎖法(ASCoT)を導入する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:26:40 GMT)
FullTransNet: Full Transformer with Local-Global Attention for Video Summarization [16.1] 本稿では,ビデオ要約のためのFullTransNetというトランスフォーマー型アーキテクチャを提案する。
ビデオ要約の代替アーキテクチャとしてエンコーダ・デコーダ構造を持つフルトランスフォーマーを使用する。
本モデルでは, Fスコアが54.4%, 63.9%であり, 比較的低い計算量とメモリ要件を維持している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:00:01 GMT)
Attention Basin: Why Contextual Position Matters in Large Language Models [16.1] モデルでは,シーケンスの開始と終了の項目に対して,中間の項目を無視しながら,より高い注意を体系的に割り当てることが示される。
AttnRank(AttnRank)は、モデル固有の位置的注目度を推定するフレームワークである。
AttnRankは、最小の計算オーバーヘッドを持つモデルに依存しない、トレーニングなし、プラグアンドプレイ方式である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:08:08 GMT)
Evaluation of a Sign Language Avatar on Comprehensibility, User Experience \& Acceptability [16.0] 本研究では,システムの理解性,ユーザエクスペリエンス(UX),受容性に影響を及ぼす要因を明らかにする。
SL要素の欠如や実装上の問題により、UXや理解性に大きな改善は見られなかった。
ホロレンス調整のジェスチャーが直感的で、自分に親しみやすいかという懸念が持ち上がった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:06:42 GMT)
Evaluating Universal Machine Learning Force Fields Against Experimental Measurements [15.9] ユニバーサル機械学習力場(UMLFF)は、周期表を横断する素早い原子論シミュレーションを可能にすることによって、材料科学に革命をもたらすことを約束する。
ここでは, 1500の慎重に硬化した鉱物構造の実験的測定に対して, 実験結合性FFsを総合的に評価するためのフレームワークであるUniFFBenchについて述べる。
計算ベンチマークにおける印象的な性能を達成するモデルは、実験的な複雑さに直面すると、しばしば失敗する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:21:39 GMT)
WeTok: Powerful Discrete Tokenization for High-Fidelity Visual Reconstruction [15.7] WeTokトークンは,従来の主要なトークンを超越した,強力で簡潔なトークンである。
潜在特徴をグループに分割し、各グループに対してルックアップフリーな量子化を行う。
生成デコーディング(GD)は、離散トークン上で条件付けられた視覚データの分布を確率的にモデル化することができる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:41:26 GMT)
UNCAGE: Contrastive Attention Guidance for Masked Generative Transformers in Text-to-Image Generation [15.6] Masked Generative Transformersは、因果的注意と自己回帰的復号化の固有の限界を克服するために、Autoregressive Modelsに代わるものとして注目を集めている。
本研究では,注意マップを活用することで構成の忠実度を向上させる新しいトレーニングフリー手法であるunmasking with Contrastive Attention Guidance (UNCAGE)を提案する。
UNCAGEは、複数のベンチマークとメトリクスにわたる定量評価と定性評価の両方のパフォーマンスを、無視可能な推論オーバーヘッドで一貫して改善する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:51:17 GMT)
HydroChronos: Forecasting Decades of Surface Water Change [15.6] 我々は,大規模でマルチ標準のDigital Water DynamicsデータセットであるHydroronを紹介した。
このデータセットには30年以上にわたるランドサット5号とセンチネル2号の画像、気候、アライメント、ヨーロッパ、北アメリカ、南アメリカにまたがる多様な湖や川のための標高モデルが含まれている。
我々はまた、表面の水の変化に影響を与える主要な気候変数を特定するために説明可能なAI分析を行い、将来のモデリング活動に洞察を与え、ガイドする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:46:02 GMT)
WhisperNER: Unified Open Named Entity and Speech Recognition [15.5] 本稿では,共同音声の書き起こしと実体認識を可能にする新しいモデルであるWhisperNERを紹介する。
WhisperNERはオープンタイプのNERをサポートし、推論時に多様で進化するエンティティの認識を可能にする。
実験の結果,WhisperNERはドメイン外オープン型NERと教師付き微調整の両方において,自然なベースラインよりも優れていた。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:51:59 GMT)
SPICE: An Automated SWE-Bench Labeling Pipeline for Issue Clarity, Test Coverage, and Effort Estimation [15.4] SWEベンチスタイルのデータセットをラベル付けするためのスケーラブルで自動化されたパイプラインであるSPICEを紹介する。
SPICEは、コンテキスト対応のコードナビゲーション、合理化によるプロンプト、マルチパスコンセンサスを組み合わせて、専門家のアノテーションに近似したラベルを生成する。
SPICEツールとSPICE Benchは、SWE-Gymの291のオープンソースプロジェクトから収集された6,802のSPICEラベル付きインスタンスのデータセットです。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:52:27 GMT)
G-UBS: Towards Robust Understanding of Implicit Feedback via Group-Aware User Behavior Simulation [15.4] 巨大な暗黙のフィードバックからユーザの好みを推測することは、大きな可能性を秘めている。
本稿では,G-UBS(Group-Aware User Behavior Simulation)パラダイムを提案する。
G-UBSは2つのキーエージェントを介して動作する。まず、ユーザグループマネージャ(UGM)がユーザを効果的にクラスタリングしてグループプロファイルを生成する。
第二に、UFM(User Feedback Modeler)は革新的なグループ認識強化学習アプローチを採用している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:26:08 GMT)
Fast and Robust Visuomotor Riemannian Flow Matching Policy [15.3] 拡散に基づくビジュモータポリシーは、複雑なロボットタスクの学習に長けている。
RFMPは、フローマッチングの容易なトレーニングと高速な推論機能を継承するモデルである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:04:23 GMT)
How and Why: Taming Flow Matching for Unsupervised Anomaly Detection and Localization [15.3] 時間反転フローマッチングの概念をベクトル場回帰として定式化する。
線形確率経路を持つFMは本質的に非可逆であることを示す。
本研究は,非教師付き異常検出タスクに対するFMの最初の成功例を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:02:07 GMT)
MAGIK: Mapping to Analogous Goals via Imagination-enabled Knowledge Transfer [14.9] 強化学習エージェントは通常、新しいタスクが以前に学習したタスクと構造的類似性を共有する場合であっても、広範囲な再訓練を必要とする。
我々は、RLエージェントがターゲット環境と対話することなく、類似したタスクに知識を伝達できる新しいフレームワークMAGIKを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:55:19 GMT)
Simulating Human-Like Learning Dynamics with LLM-Empowered Agents [14.9] 本稿では,LearnerAgentについて紹介する。LearnerAgentはLarge Language Models(LLM)に基づく,現実的な教育環境をシミュレートする新しいマルチエージェントフレームワークである。
我々は,Deep, Surface, Lazy-asなどの心理的基盤を持つ学習者やペルソナのない一般学習者を構築し,LLMのデフォルト動作を検査する。
週毎の知識獲得,月毎の戦略的選択,定期的なテスト,ペアインタラクションを通じて,全年にわたる個人学習者の動的学習進捗を追跡することができる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:57:46 GMT)
Enhancing Code LLMs with Reinforcement Learning in Code Generation: A Survey [14.9] コード生成と最適化のための重要なテクニックとして強化学習(RL)が登場した。
本稿では,コード最適化と生成におけるRLの適用について,系統的な調査を行った。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:34:03 GMT)
Symmetry Understanding of 3D Shapes via Chirality Disentanglement [14.9] キラリティ情報は、画像、ビデオ、ポイントクラウド、メッシュなど、コンピュータビジョンのさまざまなデータモードに対して、ユビキタスである。
本研究では, キラリティを意識した形状の頂点をデコレートする, 教師なしのキラリティ特徴抽出パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:37:26 GMT)
Optimal Brain Connection: Towards Efficient Structural Pruning [14.8] 本稿では,構造パラメータの正当性を評価するための1次計量であるJacobian Criterionを紹介する。
第2に、オートエンコーダを用いて元の接続のコントリビューションを保持する等価プルーニング機構を提案する。
実験の結果、ヤコビアン基準はモデル性能の保存においていくつかの一般的な指標より優れていた。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:51:05 GMT)
Can Large Language Models Generate Effective Datasets for Emotion Recognition in Conversations? [14.8] 会話における感情認識(英: Emotion Recognition in conversation、ERC)は、対話における感情の変化を特定することに焦点を当てる。
既存のデータセットは、バイアスの強いソースとソフトラベル固有の主観性のために、多くの課題に直面している。
資源効率が高く汎用的なLCMを用いて,多様な特性を持つERCデータセットを合成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:13:55 GMT)
MV-Debate: Multi-view Agent Debate with Dynamic Reflection Gating for Multimodal Harmful Content Detection in Social Media [14.7] MV-Debateは、マルチモード有害コンテンツ検出のための動的リフレクションゲーティングを備えたマルチビューエージェント討論フレームワークである。
MV-Debateは4つの相補的な議論エージェント、表面分析者、深い推論者、モダリティコントラスト、社会的文脈主義者を集め、多様な解釈的視点からコンテンツを分析する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:38:25 GMT)
Brain Network Analysis Based on Fine-tuned Self-supervised Model for Brain Disease Diagnosis [14.5] 脳疾患診断のための微調整脳ネットワークモデルを提案する。
元の脳ネットワークモデルに基づいて、複数の次元にまたがる脳領域の表現を拡張する。
本実験は,脳疾患の診断において,提案モデルが優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:41:46 GMT)
RankArena: A Unified Platform for Evaluating Retrieval, Reranking and RAG with Human and LLM Feedback [14.5] RankArenaは、検索パイプライン、リランカー、RAGシステムのパフォーマンスを比較分析するための統一されたプラットフォームである。
複数の評価モードをサポートする: 直接的再分類、人またはLLM投票と盲対比較、手動文書アノテーションの監督、エンドツーエンドのRAG回答品質評価。
ペアワイズな好みとフルリストのアノテーションと、ムーブメントメトリクス、アノテーションタイム、品質評価などの補助メタデータを通じて、詳細な関連性フィードバックをキャプチャする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:46:53 GMT)
Let's Measure Information Step-by-Step: LLM-Based Evaluation Beyond Vibes [14.4] 我々は,ゲーム抵抗と出力品質の関連性を生かして,AIシステムを評価するメカニズムを開発した。
自然条件下では,f-mutual information measures が独特のゲーム抵抗機構であることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:11:43 GMT)
CAMA: Enhancing Mathematical Reasoning in Large Language Models with Causal Knowledge [14.4] 大規模言語モデル(LLM)は、幅広いタスクにわたって強力なパフォーマンスを示してきたが、複雑な数学的推論に苦戦している。
我々は,LLMに明示的で再利用可能な数学的構造を持たせる2段階の因果関係フレームワークであるtextbfCAusal textbfMAthematician (textbfCAMA) を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:57:23 GMT)
Large Language Models Still Exhibit Bias in Long Text [14.3] 大規模言語モデルにおけるバイアスを評価するフレームワークであるLong Text Fairness Test (LTF-TEST)を紹介する。
LTF-TESTはモデル応答とそれらの背後にある推論の両方を評価することで、単純な応答では検出が難しい微妙なバイアスを明らかにする。
FT-REGARD(FT-REGARD)を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:35:39 GMT)
Generative Artificial Intelligence in Medical Imaging: Foundations, Progress, and Clinical Translation [14.3] 生成人工知能(AI)は、急速に医療画像に変化をもたらしている。
生成AIは、取得と再構成からモダリティ間の合成まで、画像連続のキーステージに寄与する。
このレビューは,AI,医学,バイオメディカルエンジニアリングの交差点における今後の研究の指導と学際協力の育成を目的としている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:58:40 GMT)
FedCoT: Communication-Efficient Federated Reasoning Enhancement for Large Language Models [14.2] FedCoTは、フェデレートされた設定における推論を強化するために特別に設計された新しいフレームワークである。
推論精度と堅牢性を向上し、医療応用に欠かせない価値ある解釈性を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:50:15 GMT)
Quantifying Fairness in LLMs Beyond Tokens: A Semantic and Statistical Perspective [13.7] 大規模言語モデル(LLM)は、しばしば固有のバイアスを伴う応答を生成し、現実のアプリケーションにおける信頼性を損なう。
既存の評価手法は、LLM出力の長文応答におけるバイアスと本質的変動をしばしば見落としている。
人口集団間での長文応答の微妙な意味的差異を検知し,LLMにおけるグループレベルの公平性を評価するための新しい統計フレームワークであるFiScoを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:53:47 GMT)
Latent Expression Generation for Referring Image Segmentation and Grounding [13.6] 既存のほとんどのメソッドは単一のテキスト入力に依存しており、視覚領域で利用可能なリッチな情報のごく一部しか取得できない。
このリッチ・ビジュアル・ディテールと粗雑なテキスト・キューのミスマッチは、類似したオブジェクトの誤識別につながる可能性がある。
単一のテキスト入力から生成された複数の潜在表現を利用する新しい視覚的グラウンドディングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:57:27 GMT)
GRAIL:Learning to Interact with Large Knowledge Graphs for Retrieval Augmented Reasoning [13.5] GRAILは、検索強化推論のための大規模グラフと相互作用するように設計されたフレームワークである。
GRAILは知識グラフ問合せデータセットの平均精度を21.01%改善し、F1改善を22.43%改善する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:34:41 GMT)
Can Transformers Learn Full Bayesian Inference in Context? [13.5] 本稿では,コンテクストでよく使用される統計モデルに対して,変圧器が完全なベイズ推定を行うことができることを示す。
本稿では,従来のネットワークと連続正規化フローのアイデアを基盤とした汎用フレームワークを提案する。
実世界のデータセットに対する実験により、我々のICLアプローチは、最先端MCMCや変分推論手法と品質が類似した後部サンプルを生成することを示した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:11:57 GMT)
Chart-R1: Chain-of-Thought Supervision and Reinforcement for Advanced Chart Reasoner [13.5] 本稿では,グラフ領域の視覚言語モデルであるChart-R1を紹介する。
Chart-R1をサポートするために、我々はまず、高品質なステップバイステップチャート推論データを生成する新しいプログラムデータ技術を提案する。
次に、ステップバイステップのチェーン監視を行うChart-COTと、数値的に感度の高い強化微調整を行うChart-RFTの2段階のトレーニング戦略を開発する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:40:21 GMT)
MolSnap: Snap-Fast Molecular Generation with Latent Variational Mean Flow [13.4] 分子グラフトークンとテキスト命令を共同で符号化するCausality-Aware Transformer(CAT)を導入する。
また,既存のフローベース手法を一般化する変分平均流(VMF)フレームワークを開発した。
我々のモデルは最先端のベースラインを上回り、より高い新規性(74.5%まで)、多様性(70.3%まで)、全データセットの100%の妥当性を達成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:04:12 GMT)
Geometric quantum encoding of a turbulent field [13.4] 乱流場の3段階超球面符号化法を提案する。
27 qubits を用いて、レイノルズ数 $mathitRe = 13900$ で瞬時に乱流場を生成する。
これは古典的手法よりも指数的なメモリ削減をもたらし、マルチスケールシステムの大規模量子シミュレーションの準備をする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:54:11 GMT)
Do Machines Think Emotionally? Cognitive Appraisal Analysis of Large Language Models [13.3] 我々は,大規模言語モデルで暗黙的に使用される内的認知構造を評価するために,感情に対する認知推論に関する大規模ベンチマークを導入する。
結果と分析結果から,LLMの多種多様な推論パターンが明らかとなった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 22:19:15 GMT)
The TUB Sign Language Corpus Collection [13.2] 全集には4,381本のビデオファイルが1,300時間以上含まれ、1,3Mのサブタイトルに14Mのトークンが含まれている。
ドイツ語の手話コーパスのサイズは、以前利用可能なコーパスの10倍である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:16:55 GMT)
Modular Transformer Architecture for Precision Agriculture Imaging [13.2] 本稿では、精密農業におけるドローン映像からの効率よく正確な雑草分画の必要性に対処する。
画像劣化に対処する高品質なモジュール型ディープラーニングフレームワークが提案されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:30:53 GMT)
Guardians and Offenders: A Survey on Harmful Content Generation and Safety Mitigation [13.1] 大規模言語モデル(LLM)は、デジタルプラットフォーム全体でコンテンツ作成に革命をもたらした。
LLMは、コンテンツ生成、質問と回答(Q&A)、プログラミング、コード推論といった有益なアプリケーションを可能にする。
また、意図的または故意に有害、攻撃的、偏見のあるコンテンツを発生させることで深刻なリスクを生じさせる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:42:16 GMT)
Blended PC Peer Review Model: Process and Reflection [12.9] The International Conference on Mining Software Repositories (MSR 2025)は、Blended Program Committee (PC)による技術トラックのピアレビューモデルを実験した。
本稿では,レビュー後著者調査から得られた経験的知見を含め,モデルに対する理論的根拠,実装,考察について述べる。
以上の結果から,Blended PCがレビュア不足を緩和し,インクリシティを向上し,高品質な査読プロセスを維持できる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:28:17 GMT)
Code-as-Symbolic-Planner: Foundation Model-Based Robot Planning via Symbolic Code Generation [12.9] 大きな言語モデル(LLM)は、サブゴールとアクションプランでテキストベースの推論チェーンを生成することができる。
LLMは最適化と制約検証のためのシンボリックプランナーとしてコードを生成することもできる。
Code-as-Symbolic-Plannerは、離散的および連続的な環境、2D/3Dシミュレーション、現実世界の設定において、強い効果と一般化性を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:46:14 GMT)
X-VFL: A New Vertical Federated Learning Framework with Cross Completion and Decision Subspace Alignment [12.9] Vertical Federated Learning (VFL)は、複数のクライアント/パーティから分離した機能サブセットを統合することで、協調学習を可能にする。
X-VFLは、非整列データサンプルに欠落した特徴を扱えるように設計された新しいVFLフレームワークである。
X-VFLは、各クライアントに対する新しいデータサンプルのローカル独立推論をサポートする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:00:47 GMT)
PriorRG: Prior-Guided Contrastive Pre-training and Coarse-to-Fine Decoding for Chest X-ray Report Generation [12.9] PriorRGは胸部X線レポート生成フレームワークで、2段階のトレーニングパイプラインを通じて実際の臨床をエミュレートする。
ステージ1では,臨床文脈の時間的特徴抽出を利用した事前指導型コントラスト事前訓練方式を導入する。
ステージ2では、視覚エンコーダの隠蔽状態との事前知識を高めるために、事前認識された粗時間デコーディングを統合する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:02:20 GMT)
GM-PRM: A Generative Multimodal Process Reward Model for Multimodal Mathematical Reasoning [12.7] GM-PRM(Generative Multimodal Process Reward Model)を紹介する。
単純なスカラースコアの代わりに、GM-PRMは各推論ステップのきめ細かい解釈可能な分析を提供する。
GM-PRMは複数のマルチモーダル数学ベンチマークにおいて最先端の計算結果が得られることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:52:48 GMT)
AgenticData: An Agentic Data Analytics System for Heterogeneous Data [12.7] AgenticDataはエージェントデータ分析システムで、複数のドメインにまたがるデータソースを自律的に分析しながら、自然言語(NL)の質問に反応することができる。
本稿では,関連するデータを発見するためのデータプロファイリングエージェント,フィードバックに基づく反復最適化のためのセマンティッククロスバリデーションエージェント,短期文脈を維持するためのスマートメモリエージェントを利用するマルチエージェント協調戦略を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:33:59 GMT)
HFedATM: Hierarchical Federated Domain Generalization via Optimal Transport and Regularized Mean Aggregation [12.7] Federated Learning(FL)は、複数のクライアントが生データを共有せずに、共同で共有グローバルモデルをトレーニングする分散アプローチである。
本稿では階層型フェデレーションドメイン一般化(HFedDG)を紹介する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:14:52 GMT)
Towards Personalized Conversational Sales Agents: Contextual User Profiling for Strategic Action [12.6] 本稿では,一貫した会話の枠組みの中で,嗜好の誘惑,推薦,説得を統合する新しいタスクである会話販売(CSALES)について紹介する。
また,文脈的ユーザプロファイルを積極的に推測し,会話を通じて戦略的に行動を選択する対話販売エージェントであるCSIを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:23:38 GMT)
Data-Aware Socratic Query Refinement in Database Systems [12.5] 本稿では,対話型クエリ拡張フレームワークであるData-Aware Socratic Guidance (DASG)を提案する。
DASGは、自然言語クエリのあいまいさを解決するために、データベースシステム内の第一級演算子としてラインブレイクの対話的明確化を組み込む。
提案アルゴリズムは, セマンティック関連性, カタログ情報ゲイン, 潜在的なコスト削減を組み合わせ, 最適解法を選択する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:28:16 GMT)
MetaOcc: Spatio-Temporal Fusion of Surround-View 4D Radar and Camera for 3D Occupancy Prediction with Dual Training Strategies [12.5] 本稿では,Omni指向の3次元占有予測のための新しいマルチモーダルフレームワークであるMetaOccを紹介する。
レーダーデータにエンコーダを直接適用することの限界に対処するため,レーダハイト自己保持モジュールを提案する。
高価な点クラウドへの依存を軽減するため,オープンセットセグメンタに基づく擬似ラベル生成パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:39:28 GMT)
The World According to LLMs: How Geographic Origin Influences LLMs' Entity Deduction Capabilities [12.5] 大きな言語モデル(LLM)は明示的なバイアスを軽減するために広範囲に調整されてきたが、事前学習データに根ざした暗黙のバイアスがしばしば現れる。
我々は、モデルが積極的に質問するときにどのように振る舞うかを研究する。
マルチターン推論タスクである20の質問ゲームは、この目的のために理想的なテストベッドとして機能する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:53:30 GMT)
$Λ$-Type Giant Atom Mediated Controllable Single-Photon Transport in a One-Dimensional Chiral Waveguide [12.4] 1次元導波路に冷間結合したLambda$型巨大原子系の単一光子散乱スペクトルについて検討した。
実空間散乱法を用いて、マルコフ系と非マルコフ系の両方で有効である散乱振幅の解析解を得る。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:43:31 GMT)
HAMoBE: Hierarchical and Adaptive Mixture of Biometric Experts for Video-based Person ReID [12.3] バイオメトリックエキスパートの階層的・適応的混合(HAMoBE)フレームワークを提案する。
HamoBEは、キーバイオメトリックの特徴を独立してモデル化することで、人間の知覚機構を模倣する。
私たちのアプローチは、大幅なパフォーマンス向上をもたらします。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:34:14 GMT)
Fairy$\pm i$: the First 2-bit Complex LLM with All Parameters in $\{\pm1, \pm i\}$ [12.2] QAT(Quantization-Aware Training)は、量子化をトレーニングループに統合し、LLMが堅牢な低ビット表現を学習できるようにする。
複素数値 LLM のための最初の2ビット量子化フレームワークである Fairy$pm i$ を提案する。
我々は重みを単位の$pm1, pm i$の4番目の根にマッピングし、完全に対称で情報理論的に最適な2ビット表現を形成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:02:23 GMT)
From Generation to Consumption: Personalized List Value Estimation for Re-ranking [11.8] 本稿では,個人化された消費意識リスト値推定フレームワークであるCAVEを提案する。
CAVEは、サブリスト値に対する期待値としてリスト値を定式化し、各位置におけるユーザ固有の出口確率によって重み付けされる。
サブリスト値とユーザエグジットの挙動を共同でモデル化することにより、CAVEは実際のリスト消費値をより忠実に推定する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:51:15 GMT)
Task Vector Quantization for Memory-Efficient Model Merging [11.8] 細調整されたチェックポイントを定量化する代わりに,タスクベクトルの定量化を提案する。
本手法は,完全精度チェックポイントに必要なメモリの8%しか使用せず,モデルマージ性能を維持または改善する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:57:05 GMT)
ByteGen: A Tokenizer-Free Generative Model for Orderbook Events in Byte Space [11.5] LOBイベントの生のバイトストリームを直接操作する新しい生成モデルByteGenを紹介する。
私たちの仕事は、機能エンジニアリングとトークン化の完全な排除であり、モデルが最も基本的な表現から市場のダイナミクスを学べるようにします。
ByteGenは、金融市場の重要な事実を再現し、現実的な価格分布、大口リターン、バーストイベントのタイミングを生成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:31:56 GMT)
MZEN: Multi-Zoom Enhanced NeRF for 3-D Reconstruction with Unknown Camera Poses [11.4] MZEN(Multi-Zoom Enhanced NeRF)を提案する。
MZENはピンホールカメラモデルを、焦点距離を拡大する明示的で学習可能なズームスカラーで強化する。
MZENはポーズなしのベースラインや高解像度のバリエーションよりも一貫して優れている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:44:34 GMT)
Cross-Image Contrastive Decoding: Precise, Lossless Suppression of Language Priors in Large Vision-Language Models [11.4] 言語先行性への過度依存は、LVLM(Large Vision-Language Models)における幻覚の主要な原因である
最近の研究では、訓練なしの解として対照的な復号化が検討されている。
我々は、非関連画像をコントラスト視覚入力として利用する、シンプルで効果的なトレーニング不要なクロスイメージコントラストデコーディング(CICD)を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:23:29 GMT)
Can Large Language Models Integrate Spatial Data? Empirical Insights into Reasoning Strengths and Computational Weaknesses [11.3] 我々は,大規模で異質で騒々しい都市空間データセットの統合において,ドメインエキスパートに力を与えるために,大規模言語モデル(LLM)の適用について検討する。
LLMは空間的推論能力を示すが、マクロスケール環境と関連する計算幾何学的タスクを結びつけるのに苦労している。
この手法は, 正確な応答を保ちながら, 誤った初期応答の補正に極めて有効であることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:44:20 GMT)
How Do LLMs Persuade? Linear Probes Can Uncover Persuasion Dynamics in Multi-Turn Conversations [11.2] 大規模言語モデル(LLM)は、人間を説得する能力を実証し始めている。
近年の研究では、モデル表現を分析するための軽量なツールである線形プローブを用いて、様々なLLM技術を研究している。
そこで本研究では,自然・マルチターン会話における説得力学の研究にプローブを適用した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:58:41 GMT)
IAD-R1: Reinforcing Consistent Reasoning in Industrial Anomaly Detection [11.2] 普遍的なポストトレーニングフレームワークであるIAD-R1は、異常検出機能を大幅に強化する。
IAD-R1は7つのVision-Languageモデルで大幅に改善されている。
IAD-R1はGPT-4.1やClaude-Sonnet-4といった商用モデルを上回るゼロショット設定である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:34:45 GMT)
Anti-Jamming Sensing with Distributed Reconfigurable Intelligent Metasurface Antennas [11.2] 従来のRFセンシング手法の感度は、フェーディングやノイズなどの送信機から受信機への負の伝搬チャネルの影響を受けやすい。
本稿では,分散再構成可能な知的メタアンテナ(RIMSA)を用いてオブジェクトの存在と位置を検出することを提案する。
本稿では,最適なビームフォーミングパターンの計算を目的とした深部強化学習(DRL)アルゴリズムと,受信した信号を知覚結果に変換するニューラルネットワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:33:38 GMT)
R2Vul: Learning to Reason about Software Vulnerabilities with Reinforcement Learning and Structured Reasoning Distillation [11.2] 大規模言語モデル(LLM)は、ソフトウェア脆弱性の検出において有望なパフォーマンスを示しているが、その推論能力は信頼性が保たれている。
本稿では,AIフィードバック(RLAIF)と構造化推論蒸留を組み合わせたR2Vulを提案する。
我々はR2Vulを5つのプログラミング言語と4つの静的解析ツールで評価した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:56:01 GMT)
FinCoT: Grounding Chain-of-Thought in Expert Financial Reasoning [11.0] FinCoTは、ドメイン固有の金融推論の青写真が組み込まれている構造化連鎖フレームワークである。
我々はFinCoTを、ドメインの専門家による青写真を用いた最初の構造化金融特化促進手法として紹介する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:25:59 GMT)
Wrapless: The trustless lending protocol on top of Bitcoin [10.9] Wraplessは、信頼できるラッピング機構を必要とせず、bitcoinの担保化を可能にする貸出プロトコルである。
このプロトコルはビットコインブロックチェーンの"ローンチャネル"を促進し、チューリング完全スマートコントラクトをサポートするブロックチェーン上で発行されるローンの担保としてビットコインをロックできるようにする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:32:08 GMT)
Group Causal Policy Optimization for Post-Training Large Language Models [10.8] グループ相対政策最適化(GRPO)は、補完性や矛盾といった意味的な相互作用を見越して、候補応答を独立したものとして扱う。
本稿では2つの重要なコンポーネントを通じて因果構造を最適化するグループ因果ポリシー最適化(GCPO)を提案する。
GCPOは、複数の推論ベンチマークでGRPOを含む既存のメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:17:28 GMT)
Deep Learning-based Animal Behavior Analysis: Insights from Mouse Chronic Pain Models [10.7] 本研究では、人間の定義した行動ラベルに頼ることなく、慢性的な痛みに関連する特徴を自動的に発見する枠組みを提案する。
本手法では,マウスの行動特徴を自動的に抽出するユニバーサルアクション空間プロジェクタを用いて,人間のラベル付けの潜在的なバイアスを回避する。
本手法は15種類の痛み分類タスクにおいて48.41%の精度を達成し,B-SOiD(30.52%)およびB-SOiD(21.33%)を有意に上回った。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:16:57 GMT)
MagicHOI: Leveraging 3D Priors for Accurate Hand-object Reconstruction from Short Monocular Video Clips [10.6] 本稿では,短い単分子インタラクションビデオから手と物体を再構成するMagicHOIを提案する。
我々は,MagicHOIが既存の手指再建法よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:37:35 GMT)
Evaluation of Safety Cognition Capability in Vision-Language Models for Autonomous Driving [10.4] 本稿では,自律運転シナリオにおける視覚言語モデル(VLM)の安全性認知能力を評価するためのフレームワークであるSCD-Benchを紹介する。
データアノテーションのスケーラビリティ問題に対処するために,半自動ラベリングシステムであるADA(Autonomous Driving )を導入する。
運転環境におけるVLMと安全認知の連携という課題に対処するため,我々は,このタスクに適した最初の大規模データセットであるSCD-Trainingを構築した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:51:18 GMT)
Integrated Influence: Data Attribution with Baseline [10.3] 本稿では,ベースラインアプローチを取り入れた新しいデータ属性手法であるIntegrated Influenceを提案する。
本手法は,ベースラインデータセットを定義し,データデジェネレーションプロセスに従って,現在のデータセットをベースラインに遷移させ,各サンプルの影響を蓄積する。
実験結果から,Integrated Influenceは,データ属性タスクと不正なサンプル識別タスクの両方において,既存の手法と比較して信頼性の高いデータ属性を生成することがわかった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:16:12 GMT)
A Consolidated Volatility Prediction with Back Propagation Neural Network and Genetic Algorithm [10.2] 本稿では,バックプロパゲーションニューラルネットワークと遺伝的アルゴリズムを併用した統合モデルを構築し,新興市場の将来的ボラティリティを予測する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:13:11 GMT)
Cross-LoRA: A Data-Free LoRA Transfer Framework across Heterogeneous LLMs [10.2] Cross-LoRAは、さまざまなベースモデル間でLoRAモジュールを転送するためのフレームワークである。
実験の結果、クロスロラはベースモデルよりも5.26%の相対的なゲインを達成している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:21:08 GMT)
Fairness in Dysarthric Speech Synthesis: Understanding Intrinsic Bias in Dysarthric Speech Cloning using F5-TTS [10.0] 外科的スピーチは、補助技術を開発する上で重要な課題である。
近年のニューラル音声合成、特にゼロショット音声クローニングは、データ拡張のための合成音声生成を促進する。
TORGOデータセットを用いた変形性関節症音声のクローニングにおける最先端F5-TTSの有効性について検討した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:39:48 GMT)
X-MoGen: Unified Motion Generation across Humans and Animals [10.0] X-MoGenは、人間と動物の両方をカバーするクロス種テキスト駆動モーション生成のための最初の統一されたフレームワークである。
我々は115種の大規模データセットと119kのモーションシーケンスを構築し、共同トレーニングのための共有骨格トポロジーの下で人間と動物の動きを統合する。
UniMo4Dの実験では、X-MoGenは目に見える種と目に見えない種の両方で最先端の手法より優れていることが示されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:51:51 GMT)
Unsupervised deep learning model for fast energy layer pre-selection of delivery-efficient proton arc therapy plan optimization of nasopharyngeal carcinoma [10.0] 本稿では,ターゲットと臓器の交差する陽子点の数を危険にさらす新しいデータ表現法であるスポット数表現法を提案する。
この表現はU-NetスタイルのアーキテクチャであるSPArc_dlの入力として機能する。
鼻咽喉頭癌35例を対象に評価し,SPArc_psと比較した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:09:08 GMT)
Community-Aware Social Community Recommendation [9.8] ソーシャルレコメンデーションは、ユーザ間のソーシャルな結びつきを活用して、ユーザとイテムの相互作用のスパース性の問題を軽減する。
既存のソーシャルレコメンデーションモデルは、主にブログ、画像、製品などのレコメンデーションアイテムを推奨するために考案されている。
本稿では,コミュニティレコメンデーションに特化して設計された新しい効果的なモデルであるCASOについて述べる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:42:45 GMT)
Grouped k-threshold random grid-based visual cryptography scheme [9.8] ランダムグリッドベースのVCS(RGVCS)は、基本的な行列設計を必要とせず、画素拡大を避けるため、広く注目を集めている。
RGVCSのコアメトリックであるコントラストは、回復した画像の視覚的品質を直接決定する。
本稿では、任意の$(k,n')$-thresholdスキームから$(k,n)$-thresholdスキームを構成するRGVCSの新しい共有パラダイムを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:44:09 GMT)
CoCoLex: Confidence-guided Copy-based Decoding for Grounded Legal Text Generation [9.8] 法文生成のための信頼性誘導型コピーベース復号法(CoCoLex)について紹介する。
CoCoLexはモデルの信頼性に基づいて直接コピーを奨励し、ソースへの忠実性を確保する。
5つの法的なベンチマーク実験の結果、CoCoLexは既存の文脈認識復号法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:06:58 GMT)
AnomalyControl: Learning Cross-modal Semantic Features for Controllable Anomaly Synthesis [9.7] そこで本研究では,AnomalyControl という,モーダルな意味的特徴をガイダンス信号として学習するための,新しいアノマリ合成フレームワークを提案する。
AnomalyControlは、既存の方法と比較して、異常合成の最先端の結果を得ることができる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:13:02 GMT)
Speech LLMs in Low-Resource Scenarios: Data Volume Requirements and the Impact of Pretraining on High-Resource Languages [9.6] 大規模言語モデル (LLM) は, 様々なタスクにおいて, 音声入力を高速に処理し, 最先端の性能に到達する可能性を実証している。
本研究では,SLAM-ASRフレームワークを用いた低リソース自動音声認識におけるLLMの利用について検討する。
単言語または多言語プロジェクタを高ソース言語で事前訓練することにより,データ不足の影響を低減できることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:33:42 GMT)
Tractable Sharpness-Aware Learning of Probabilistic Circuits [9.4] 確率回路(英: Probabilistic Circuits、PC)は、広範囲のクエリに対して正確かつトラクタブルな推論を可能にする生成モデルのクラスである。
近年の進歩により、深層で表現力に富んだPCの学習が可能になったが、この能力の増大は、しばしば過度な適合につながる。
ニューラルネットワークにおけるシャープネス認識の最小化に着想を得て,PCのトレーニングのためのヘッセン系正規化器を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:13:24 GMT)
Exploring Superior Function Calls via Reinforcement Learning [9.3] 本稿では,グループ相対的政策最適化を強化するための新しい強化学習フレームワークを提案する。
機能呼び出しにおける3つの重要な課題に対処する: 政策学習における不十分な探索、連鎖生成における構造的推論の欠如、パラメータ抽出の不十分な検証。
本フレームワークは,86.02%の精度でオープンソースモデル間の最先端性能を実現し,複雑な多機能シナリオにおいて標準GRPOを最大6%上回っている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:51:38 GMT)
Teaching LLMs How to Learn with Contextual Fine-Tuning [9.3] 我々は、文脈微調整(contextual fine-tuning)と呼ばれる命令チューニングの新しい一般化について研究する。
我々は、このシンプルで効果的な修正によって、新しいデータセット上で高速に微調整できるLLMの能力が向上することが実証的に実証された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:01:43 GMT)
Temporal Cluster Assignment for Efficient Real-Time Video Segmentation [9.2] ビジョントランスフォーマーは、画像ドメインとビデオドメインの両方にわたるセグメンテーションモデルの性能を大幅に向上させた。
Swinのウィンドウベースのアテンションメカニズムは、ウィンドウ毎に一定数のトークンを必要とするため、従来のプルーニング技術の適用性が制限される。
時間的コヒーレンスを活用してトークンクラスタリングを強化する軽量かつ効果的で微調整のない戦略である時間的クラスタ割り当て(TCA)を導入する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:52:49 GMT)
Label Leakage in Federated Inertial-based Human Activity Recognition [9.1] 本研究では,HAR(Human Activity Recognition)ベンチマークデータセットに対する,最先端の勾配に基づくラベル漏洩攻撃の有効性を評価する。
その結果, ラベルリークの程度に影響を与える重要な要因として, 活動クラス数, サンプリング戦略, クラス不均衡が示唆された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:56:57 GMT)
Language Model Uncertainty Quantification with Attention Chain [9.1] 大規模言語モデル(LLM)の予測の不確実性は、その答えの信頼性を判断するために重要である。
UQACは,推論空間をトラクタブルなサイズに縮小し,限界化を実現するための効率的な手法である。
先進的なオープンソース LLM を用いた複数の推論ベンチマークにおいて,UQAC の有効性を検証した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:58:09 GMT)
Patho-AgenticRAG: Towards Multimodal Agentic Retrieval-Augmented Generation for Pathology VLMs via Reinforcement Learning [9.1] Patho-AgenticRAGは、権威的な病理教科書からページレベルの埋め込みに基づいて構築されたデータベースである。
共同でテキストイメージ検索をサポートし、クエリされたテキストと関連する視覚的手がかりの両方を含む教科書ページの直接検索を可能にする。
Patho-AgenticRAGは、多重選択診断や視覚的質問応答といった複雑な病態タスクにおいて、既存のマルチモーダルモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:15:32 GMT)
CB-cPIR: Code-Based Computational Private Information Retrieval [9.1] CB-cPIR(CB-cPIR)は、コードベースの暗号からセキュリティを誘導する、単一サーバのコードに基づく計算プライベート情報検索(cPIR)方式である。
このスキームは、Holzbaur、Hollanti、Wachter-Zehによって提案された、コードベースのcPIRスキームに強くインスパイアされている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:49:26 GMT)
Role of Plaquette Term in Genuine $2+1$D String Dynamics on Quantum Simulators [9.0] 拘束状態の深い2+1$D文字列の力学において,小冊子という用語が重要な役割を担っていることを示す。
我々の発見は、将来の2+1ドルLGTの量子シミュレーション実験の明確なガイドとなる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:00:00 GMT)
End-to-End Fine-Tuning of 3D Texture Generation using Differentiable Rewards [9.0] 本稿では,人間のフィードバックを3次元テクスチャパイプラインに直接埋め込む,エンドツーエンドの微分可能・強化学習不要なフレームワークを提案する。
幾何学的および外見的モジュールによる好み信号のバックプロパゲーションにより、3次元幾何学的構造を尊重し、所望の基準と整合するテクスチャを生成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:58:14 GMT)
A Metric for MLLM Alignment in Large-scale Recommendation [8.9] Leakage Impact Score (LIS)は、マルチモーダルレコメンデーションのための新しいメトリクスである。
Leakage Impact Score (LIS)は、マルチモーダルレコメンデーションのための新しいメトリクスである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:21:51 GMT)
Human-Centered Human-AI Interaction (HC-HAII): A Human-Centered AI Perspective [8.8] この章は体系的に、人間と芸術の知能相互作用の学際的な分野を促進する。
ヒト中心型HAII(HC-HAII)の枠組みを導入する
この章では、人間中心の方法、プロセス、学際チーム、多段階の設計パラダイムなど、HC-HAII方法論を紹介している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:52:25 GMT)
UGOD: Uncertainty-Guided Differentiable Opacity and Soft Dropout for Enhanced Sparse-View 3DGS [8.8] 3D Gaussian Splatting (3DGS) は新規ビュー合成(NVS)の競争的アプローチとなっている
本稿では,ガウスの適応重み付けがレンダリング品質に与える影響について検討する。
提案手法は,MipNeRF 360データセットにおいて3.27%のPSNR改善を実現する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:42:22 GMT)
AI Agent Smart Contract Exploit Generation [8.7] A1は、いかなる大規模言語モデルもエンドツーエンドのエクスプロイトジェネレータに変換するエージェントシステムである。
A1は、自律的な脆弱性発見のための6つのドメイン固有のツールを提供する。
我々は、A1がエクスプロイト当たり最大8.59億ドル、合計9.33億ドルを抽出していることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:29:39 GMT)
Head Anchor Enhanced Detection and Association for Crowded Pedestrian Tracking [8.7] 提案手法は,物体検出器の回帰と分類の両方から検出特徴を取り入れたものである。
動きモデリングの観点で、現代の検出器仮定に適合するように設計された反復カルマンフィルタリング手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:47:34 GMT)
Efficient certification of high-dimensional entanglement [8.6] HDEは量子情報処理において貴重な資源である。
両分極純状態のHDEを効率よく認証できることを示す。
一般的な2量子状態に対して、最適な絡み合い認証戦略を構築する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:23:46 GMT)
Multi-tracklet Tracking for Generic Targets with Adaptive Detection Clustering [8.6] 本稿では、フレキシブルなトラックレット生成をマルチトラックレットアソシエーションフレームワークに統合する、MTT(Multi-Tracklet Tracking)と呼ばれるトラックレットトラッカーを提案する。
汎用マルチオブジェクト追跡のためのベンチマーク実験は,提案フレームワークの競争力を実証している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:05:27 GMT)
Agent Guide: A Simple Agent Behavioral Watermarking Framework [8.6] Agent Guide(エージェントガイド)は、エージェントのハイレベルな判断(振る舞い)を確率バイアスを通じて導くことによって、透かしを埋め込む行動的透かしフレームワークである。
我々はz統計に基づく統計分析を用いて透かしを検出し、複数のラウンドで確実に抽出する。
我々のフレームワークは、悪意のあるエージェントを識別し、プロプライエタリなエージェントシステムを保護するために、エージェントの透かしに実用的で堅牢なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:50:30 GMT)
Coarse-to-Fine Joint Registration of MR and Ultrasound Images via Imaging Style Transfer [8.6] 術前MR像と術後超音波像を登録するためのパイプラインを構築した。
提案手法は, 3D CycleGAN を用いたアンペアスタイル転送を利用して, 合成 T1 画像を生成することで, 登録性能を向上させる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:27:50 GMT)
Explainable Recommendation with Simulated Human Feedback [8.5] 提案する提案手法は,人為的なフィードバック駆動型最適化フレームワークである。
このフレームワークは、人中心で説明可能な要求を達成するために、高い労働コストを発生させることなく、動的にインタラクティブな最適化機構を使用する。
特に,大規模言語モデル(LLM)を人間のシミュレータとして利用して,学習プロセスの指針となる人間的なフィードバックを予測することを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:57:22 GMT)
Open-world Point Cloud Semantic Segmentation: A Human-in-the-loop Framework [8.5] オープンワールドポイントクラウドセマンティックセグメンテーション(OW-Seg)は、実世界のシナリオにおいて、ベースクラスと新しいクラスのポイントラベルを予測することを目的としている。
HOW-SegはOW-Segのための最初のヒューマン・イン・ザ・ループ・フレームワークである。
HOW-Segは、疎い人間のアノテーションをガイダンスとして活用することにより、ベースクラスと新規クラスのプロトタイプベースのセグメンテーションを可能にする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:20:41 GMT)
Mixed-Initiative Dialog for Human-Robot Collaborative Manipulation [8.4] MICoBotは、両方のエージェントが自然言語を使用して、タスクの最も優れたステップを完遂できる提案を定式化、受け入れ、拒否する、という一般的なシナリオを扱う。
課題指向の対話を多様に扱うために,MICoBotは,(1)メタプランナーが人間のダイアログに高レベルの協調戦略を定式化してコーディングすることを考慮し,(2)プランナーがロボットの能力に基づいて各エージェントに残りのステップを最適に割り当てる,(3)行動が人間に言うような低レベルの行動を決定する,という3段階の意思決定を行う。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:09:12 GMT)
Improving Factuality for Dialogue Response Generation via Graph-Based Knowledge Augmentation [8.4] LLM(Large Language Models)は、定型的だが矛盾するテキストを生成する。
本稿では,TG-DRGによる対話応答生成とGA-DRGによる対話応答生成の2つの新しいフレームワークを提案する。
TG-DRGは、推論誘導型対話再構成、対話感覚知識選択、グラフ強調応答生成を組み合わせることで、対話応答の事実性を改善する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:23:33 GMT)
From Imperfect Signals to Trustworthy Structure: Confidence-Aware Inference from Heterogeneous and Reliability-Varying Utility Data [8.4] 我々は,不均一なデータを体系的に統合することで,信頼に値するグリッドトポロジを再構築するスケーラブルなフレームワークを提案する。
提案するフレームワークは,Oncorのサービス領域内の3つのフィーダーにわたる8000m以上のデータを用いて検証されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:05:19 GMT)
Do Political Opinions Transfer Between Western Languages? An Analysis of Unaligned and Aligned Multilingual LLMs [8.3] 政治的意見の異文化間差異は多言語大言語モデル(MLLM)の異言語間差異につながる可能性がある
欧米の5言語にまたがる様々な大きさのMLLMにおいて、意見が言語間で伝達されるか、それぞれの言語に異なる意見が存在するかを分析する。
欧米の文脈では、政治的意見が言語間で伝達され、MLLMの明示的な社会言語学的、文化的、政治的整合性を達成する上での課題が示される。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:33:45 GMT)
ArbiViewGen: Controllable Arbitrary Viewpoint Camera Data Generation for Autonomous Driving via Stable Diffusion Models [8.3] Arbiviewgenは任意の視点から制御可能なカメラ画像を生成するための新しいフレームワークである。
特徴認識型適応ビューストッチングとクロスビュー・コンシスタンス・セルフスーパーバイザード・ラーニングの2つの主要コンポーネントを紹介した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:24:47 GMT)
Learning from Oblivion: Predicting Knowledge Overflowed Weights via Retrodiction of Forgetting [8.3] 我々は、構造化された忘れ物を利用する新しい戦略であるtextbfKNowledge Overflowed Weights (KNOW) 予測を導入し、その逆転によって知識に富んだ重みを合成する。
我々の研究は、ディープラーニングにおける知識伝達の限界を押し上げるために、ダイナミクスを忘れることを再解釈する新しい視点を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:23:07 GMT)
EchoMimicV3: 1.3B Parameters are All You Need for Unified Multi-Modal and Multi-Task Human Animation [8.2] EchoMimicV3はマルチタスクとマルチモーダルアニメーションを統合する効率的なフレームワークである。
最小のモデルサイズが13億のEchoMimicV3は、定量評価と定性評価の両方で競合性能を達成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:40:52 GMT)
Interactive Data Harmonization with LLM Agents: Opportunities and Challenges [8.2] 本稿では,LLMに基づく推論,対話型ユーザインタフェース,データ調和プリミティブのライブラリを組み合わせたシステムであるHarmoniaを紹介する。
これは、データセットを標準フォーマットにマッピングする再利用可能なパイプラインをインタラクティブに作成するのに役立つ。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:04:44 GMT)
TryOffDiff: Virtual-Try-Off via High-Fidelity Garment Reconstruction using Diffusion Models [8.2] VTOFF(Virtual Try-Off)は,着用者の単一写真から標準化された衣服画像を生成する新しいタスクである。
TryOffDiffは、SigLIPベースのビジュアルコンディショニングで安定拡散を適用して、高忠実度再構築を実現する。
本研究は, 電子商取引製品イメージの向上, 生成モデル評価の進展, 高忠実度再構築に向けた今後の研究を導くことを目的としたものである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:11:41 GMT)
Collaborative Learning-Enhanced Lightweight Models for Predicting Arterial Blood Pressure Waveform in a Large-scale Perioperative Dataset [8.1] 本研究では、軽量なsInvResUNetと、KDCL_sInvResUNetという協調学習スキームを紹介する。
実時間ABP推定は、わずか8.49ミリ秒の推論時間で組込みデバイス上で達成された。
これらの有望な結果にもかかわらず、すべての深層学習モデルは、異なる人口動態と心臓血管状態に有意な変化を示した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:40:17 GMT)
Towards Reliable Audio Deepfake Attribution and Model Recognition: A Multi-Level Autoencoder-Based Framework [8.1] オーディオディープフェイクの拡散は、デジタル通信に対する信頼の高まりを示唆している。
LAVAは,音声のディープフェイク検出とモデル認識のための階層的なフレームワークである。
生成技術を識別するAudio Deepfake Attribution (ADA) と、特定の生成モデルインスタンスを認識するAudio Deepfake Model Recognition (ADMR) である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:49:22 GMT)
LadyBug: A GitHub Bot for UI-Enhanced Bug Localization in Mobile Apps [8.1] LadyBugは、Androidアプリのバグを自動的にローカライズするGitHubボットである。
AndroidアプリのGitHubリポジトリに接続し、対応するイシュートラッカにバグが報告された時にトリガーされる。
開発者はバグの再現トレースをデバイスに記録し、GitHubイシュートラッカ経由でLadyBugにアップロードすることができる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:09:59 GMT)
TASE: Token Awareness and Structured Evaluation for Multilingual Language Models [8.1] TASEは、大規模言語モデルのトークンレベルの情報に対する認識と推論能力を評価するために設計されたベンチマークである。
TASEは、トークン認識と構造理解、中国語、英語、韓国語にまたがる10のタスクを2つの中核カテゴリでカバーしている。
我々は、O3、Claude 4、Gemini 2.5 Pro、DeepSeek-R1を含む30以上の主要な商用およびオープンソースLLMを評価した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:11:17 GMT)
CoCAViT: Compact Vision Transformer with Robust Global Coordination [8.0] 本稿では,堅牢なリアルタイム視覚表現のために設計された新しい視覚バックボーンであるCoCAViTを提案する。
224*224の解像度で、CoCAViT-28MはImageNet-1Kで84.0%のトップ-1の精度を達成した。
また、オブジェクト検出では52.2 mAP、ADE20Kセマンティックセグメンテーションでは51.3 mIOU、低レイテンシでは維持できる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:07:12 GMT)
Symmetric Behavior Regularization via Taylor Expansion of Symmetry [8.0] 対称発散は正規化として解析政策を許さず、損失として数値問題を生じさせることを示した。
対称分岐を持つ最初の実用的BRPOアルゴリズムであるSymmetric $f$ Actor-Critic (S$f$-AC)を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:09:06 GMT)
KuaiLive: A Real-time Interactive Dataset for Live Streaming Recommendation [7.9] KuaiLiveは、中国の主要なライブストリーミングプラットフォームであるKuaishouから収集された、初めてのリアルタイム対話型データセットである。
データセットは、21日間で23,772人のユーザと452,621人のストリーマーのインタラクションログを記録している。
ライブストリーミング領域では、トップKレコメンデーション、クリックスルーレート予測、ウォッチタイム予測、ギフト価格予測など、幅広いタスクをサポートすることができる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:59:36 GMT)
Benchmarking LLMs on the Semantic Overlap Summarization Task [7.9] 本稿では,セマンティック・オーバーラップ・サマライゼーション(SOS)タスクのみを対象に,人気のあるLarge Language Models (LLM) のベンチマーク研究を行う。
このデータセットは、プライバシポリシのドキュメントから得られた135の高品質なSOSデータサンプルを提供する。
次に、TELeRと呼ばれる標準の分類法を用いて、2つのSOSデータセット上で905,216個のLCM生成サマリーを作成し、評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:39:19 GMT)
Posterior-GRPO: Rewarding Reasoning Processes in Code Generation [7.9] 強化学習は大規模言語モデルのコード生成に大きく進歩した。
現在のパラダイムは、中間的推論プロセスの品質を無視して、テストケースから得られる結果に基づく報酬に依存しています。
本稿では,RLにおける推論プロセスの品質を効果的に活用する統合フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:04:10 GMT)
Conservative classifiers do consistently well with improving agents: characterizing statistical and online learning [7.9] 複数の新しい軸にまたがる改良を施したいわゆる学習性の特徴付けを行う。
より困難な環境での学習方法を示し、よく研究された有界雑音モデルの下で、より低い一般化誤差を達成する。
我々は、適切な学習と不適切な学習の両方のために、Attiasらによって提起されたオープンな質問を解決する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:13:46 GMT)
MyCulture: Exploring Malaysia's Diverse Culture under Low-Resource Language Constraints [7.8] MyCultureは、マレーシアの文化に関する大規模言語モデル(LLM)を総合的に評価するために設計されたベンチマークである。
従来のベンチマークとは異なり、MyCultureは未定義のオプションなしで、新しいオープンエンドの複数選択質問フォーマットを採用している。
構造化された出力と自由形式出力のモデル性能を比較して構造バイアスを解析し、多言語的プロンプト変動による言語バイアスを評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:17:43 GMT)
Observe novel tricritical phenomena in self-organized Fermi gas induced by higher order Fermi surface nesting [7.8] 光格子中の1次元フェルミオン超放射能について検討する。
有限温度の場合, 新規な三臨界現象と乗算可能性について検討した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:17:28 GMT)
Understanding and Mitigating Errors of LLM-Generated RTL Code [7.7] 大規模言語モデル (LLM) ベースのレジスタ転送レベル (RTL) コード生成は有望であるが、全体的な成功率は相変わらず不満足である。
包括的なエラー解析と手動分類を行う。
その結果、ほとんどのエラーはRTLプログラミングの知識不足、回路概念の理解不足、複雑なマルチモーダル入力の誤解釈によるものであることが判明した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:02:32 GMT)
From Code to Correctness: Closing the Last Mile of Code Generation with Hierarchical Debugging [7.5] さまざまなレベルの粒度でバグを分離,識別,解決し,階層的なコードデバッガであるMulti-Granularity Debugger (MG Debugger)を紹介した。
MGデバッガは問題のあるコードをサブファンクションの階層木構造に分解し、各レベルは特定のエラーの粒度を表す。
これは、HumanEvalのシード世代の精度を18.9%向上させ、HumanEvalFixの97.6%の修復成功率を達成した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:10:30 GMT)
One-sided composite cavity on an optical nanocapillary fiber [7.5] 複合キャビティを用いた光ナノキャピラリーファイバー(NCF)の片面キャビティを数値解析した。
キャビティを設計し、最大80%のNCF誘導モードの最大チャネル効率を実現する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:48:44 GMT)
Look Before You Fuse: 2D-Guided Cross-Modal Alignment for Robust 3D Detection [7.4] 既存の手法は、LiDARとカメラの特徴の空間的ずれに悩まされている。
このミスアライメントの根本原因は、キャリブレーションの不正確さとローリングシャッター効果から生じるプロジェクションエラーにある。
本稿では,PGDCからの残留雑音を抑えるために不連続認識幾何融合を導入し,背景境界における鋭い深度遷移を明示的に促進する。
提案手法は,mAPとNDSをそれぞれ71.5%,73.6%としたnuScenes検証データセット上でのSOTA性能を実現する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:24:32 GMT)
Perceive-Sample-Compress: Towards Real-Time 3D Gaussian Splatting [7.4] 本稿では,3次元ガウス平滑化のための新しい知覚・サンプル圧縮フレームワークを提案する。
提案手法は,リアルタイムレンダリング速度を維持しながら,メモリ効率と視覚的品質を大幅に向上することを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:34:38 GMT)
OmniPlay: Benchmarking Omni-Modal Models on Omni-Modal Game Playing [7.3] オムニプレイ(OmniPlay)は、全知覚スペクトルにおけるエージェントモデルの融合と推論能力を調査するために設計された診断ベンチマークである。
高忠実度メモリタスクに超人的性能を示すが、堅牢な推論と戦略的計画を必要とする課題において、体系的な失敗に苦しむ。
以上の結果から, AGI への道のりは, 相乗的融合に明示的に対処するためには, スケーリング以上の研究が必要であることが示唆された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:25:24 GMT)
Joint parameter estimation and multidimensional reconciliation for CV-QKD [7.3] 本稿では,ベイジアンフレームワーク内でのチャネルパラメータ推定と情報和解を統一する,新しい共同メッセージパッシング手法を提案する。
我々の知る限り、CV-QKDにおける多次元和解とチャネルパラメータ推定を統一する最初の試みである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:38:33 GMT)
DEL: Context-Aware Dynamic Exit Layer for Efficient Self-Speculative Decoding [7.2] DELは、推論中に出口層と投機長を適応的に選択するプラグイン・アンド・プレイ方式である。
Delは、全体的なスピードアップを$2.16times$$sim$2.62times$ over vanilla auto-regressive decoding で達成している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:04:19 GMT)
LAG: Logic-Augmented Generation from a Cartesian Perspective [7.2] 本稿では,体系的な問題分解と依存性を考慮した推論を通じて知識強化を再構築する新しいパラダイムである論理拡張生成(LAG)を紹介する。
4つのベンチマークデータセットの実験では、LAGは推論の堅牢性を大幅に向上し、幻覚を減少させ、LLM問題の解決を人間の認知と整合させることが示されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:42:00 GMT)
Few-Shot Vision-Language Reasoning for Satellite Imagery via Verifiable Rewards [7.1] 衛星画像に対する検証可能な報酬(RLVR)フレームワークを用いた最初の数発の強化学習を提案する。
我々は、衛星推論タスクのモデル出力の整合化のために、ポリシー段階の最適化を1つのキュレートされた例で導入する。
何千もの注釈付きサンプルで訓練されたモデルに一致または超える128のサンプルにスケールする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:40:08 GMT)
Safety of Embodied Navigation: A Survey [7.1] 身体的なナビゲーションでは、エージェントが慣れない設定で特定のターゲットに向かって移動しながら、その環境を知覚し、対話し、適応する必要がある。
実施されたナビゲーションを重要なアプリケーションに統合することで、かなりの安全性上の懸念が生じる。
この調査は、複数の視点から実施されたナビゲーションの安全性を包括的に分析する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:09:48 GMT)
Two tales for a geometric Jensen--Shannon divergence [7.1] 幾何学的ジェンセン-シャノン分岐(G-JSD)は、機械学習と情報科学で人気を博した。
正の密度に合わせた幾何的ジェンセン-シャノン発散の代替定義を導入する。
この斬新な発散は、より一般的な正の測度にまで拡張されたG-JSDと呼ばれる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:34:39 GMT)
FaceAnonyMixer: Cancelable Faces via Identity Consistent Latent Space Mixing [7.1] FaceAnonyMixerは、プライバシを保存する顔イメージを合成する、キャンセル可能な顔生成フレームワークである。
ベンチマークデータセットの実験では、FaceAnonyMixerは優れた認識精度を提供すると同時に、はるかに強力なプライバシ保護を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:59:59 GMT)
A Structure-Preserving Framework for Solving Parabolic Partial Differential Equations with Neural Networks [7.0] パラボリックPDEを解くために,既存のNNソルバの物理的整合性を高める新しいフレームワークを提案する。
時間依存スペクトル再正規化アプローチにインスパイアされた私たちのSidecarフレームワークは、副操縦士として小さなネットワークを導入する。
我々のフレームワークは非常に柔軟であり、様々なPDEの物理量の保存を幅広いNNソルバに組み込むことができる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:06:27 GMT)
PerSense: Training-Free Personalized Instance Segmentation in Dense Images [7.0] PerSenseは、高密度画像の例として、エンドツーエンドで、トレーニング不要で、モデルに依存しないフレームワークである。
本実験は,高密度環境下でのSOTAよりもPerSenseの方が優れていることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:50:51 GMT)
LLaVA-RE: Binary Image-Text Relevancy Evaluation with Multimodal Large Language Model [6.9] マルチモーダル生成AIは通常、与えられた入力を他のモーダルで生成する。
画像テキスト関連性の評価は、応答品質やランキング候補の応答を測定するのに不可欠である。
MLLMを用いた2値画像-テキスト関連性評価のための最初の試みであるLLaVA-REを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:42:44 GMT)
FDC-Net: Rethinking the association between EEG artifact removal and multi-dimensional affective computing [6.9] 現在のアプローチでは、認知と感情認識を独立したタスクとして扱う。
FDC-Netは、認知と感情認識のタスクを深く結合する新しいフレームワークである。
FDC-Netは、DREAMERで82.3+7.1%、DREAMERで88.1+0.8%の感情認識精度を達成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:19:16 GMT)
ADSEL: Adaptive dual self-expression learning for EEG feature selection via incomplete multi-dimensional emotional tagging [6.9] 脳波に基づく感情認識のための新しい不完全多次元特徴選択アルゴリズムを提案する。
提案手法は,最小二乗回帰を用いた適応二重自己表現学習(ADSEL)を統合する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:18:37 GMT)
Learning Disease State from Noisy Ordinal Disease Progression Labels [6.9] ノイズの多い順序ラベルから学ぶことは、医療画像において重要な課題である。
本研究は,病状状態を分類可能な表現を学習するために,常態性疾患進行ラベルを使用できるかどうかを問うものである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:57:34 GMT)
UnGuide: Learning to Forget with LoRA-Guided Diffusion Models [6.9] 大規模テキスト・画像拡散モデルの最近の進歩は、その誤用に対する懸念を高めている。
これは、効果的な機械学習、すなわち事前訓練されたモデルから特定の知識や概念を取り除く必要性を浮き彫りにする。
本研究では,Un-Free Guidance(CFG)を取り入れたUnGuideを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:12:03 GMT)
Medal Matters: Probing LLMs' Failure Cases Through Olympic Rankings [6.8] 大規模言語モデル(LLM)は自然言語処理タスクにおいて顕著な成功を収めた。
本研究は,歴史的オリンピックメダルのレンズを通して,これらの構造について検討する。
最先端のLLMはメダル数を思い出すのに優れていますが、ランキングの提供に苦労しています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:57:22 GMT)
A Novel Image Similarity Metric for Scene Composition Structure [6.8] 生成AIモデルにとって重要な関心事は、画像の基盤となるシーン構成構造(SCS)の保存である。
従来の画像類似度指標は、しばしばSCSを評価するのに不足する。
SCS 類似度指数測定(SCSSIM)は,SCS の保存を定量化するための新しい,分析的,トレーニング不要な指標である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:29:21 GMT)
Non-omniscient backdoor injection with a single poison sample: Proving the one-poison hypothesis for linear regression and linear classification [6.8] 1つの毒のサンプルと限られた背景知識を持つ敵がバックドアにゼロのバックドアエラーを注入できることを示す。
毒サンプルの良性データ分布で未使用の方向を利用する敵に対しては, 結果のモデルがトレーニングから除外されたモデルと機能的に等価であることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:41:33 GMT)
Rationale-guided Prompting for Knowledge-based Visual Question Answering [6.7] 我々は,先行手法がLarge Language Models (LLM) の容量を十分に活性化していないことを論じる。
本稿では,知識に基づく VQA のための LLM と Rationale Heuristics を併用した PLRH というフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:39:31 GMT)
Multi-Agents Based on Large Language Models for Knowledge-based Visual Question Answering [6.7] 知識に基づく視覚質問応答のための投票フレームワークを提案する。
チーム内のさまざまなレベルのスタッフをシミュレートする3つのエージェントを設計し、利用可能なツールをレベルに応じて割り当てます。
OK-VQA と A-OKVQA の実験により,本手法は,それぞれ2.2 と 1.0 の他のベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:39:17 GMT)
Proximal optimal transport divergences [6.7] 不完全な畳み込みの定式化により,情報分岐と最適輸送距離を補間する新しい相違尺度である,近位最適輸送発散を導入する。
この発散は、生成モデルで頻繁に使用される最適な輸送近位法と近位最適化法の基礎となる。
我々は,その滑らかさ,有界性,計算的トラクタビリティなどの数学的性質を探求し,原始双対の定式化と対角学習とのつながりを確立する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:18:46 GMT)
Adaptive Network Security Policies via Belief Aggregation and Rollout [6.7] 本稿では、スケーラブルで理論的保証を提供し、変更に迅速に適応するセキュリティポリシーの計算方法を提案する。
システムのモデルやシミュレータを仮定し、粒子フィルタリングによる信念推定、集約によるオフラインポリシー計算、ロールアウトによるオンラインポリシー適応の3つのコンポーネントで構成される。
本研究では,アグリゲーションの近似誤差を分析し,ロールアウトが特定の条件下でのポリシー変更に効率的に適応することを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:54:40 GMT)
Polymath: A Self-Optimizing Agent with Dynamic Hierarchical Workflow [6.6] 大規模言語モデル(LLM)は、詳細な命令と構造化操作からなるエージェントティックを実行することで、複雑なタスクの解決に優れる。
多くの研究者がコードベースの表現を通じてこれらの生成と最適化を自動化しようとしてきた。
既存の方法は、トレーニングと最適化のためにラベル付きデータセットに頼っていることが多く、現実のダイナミックな問題を解決するのに非効率で柔軟性がない。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:30:51 GMT)
Robust Market Making: To Quote, or not To Quote [6.6] マーケットメイキングは人気のあるトレーディング戦略であり、市場の両側に掲示される引用の拡散から利益を生み出すことを目的としている。
市場環境の変化によるリスクを克服するために、敵の強化学習による市場製造業者(MM)の訓練が可能であることが示されている。
本稿では,この作業線上に構築し,一面の引用を時折引用しない,あるいは提供しない,MMの戦略空間を充実させる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:49:24 GMT)
ARL-Based Multi-Action Market Making with Hawkes Processes and Variable Volatility [6.6] 我々は、ボラティリティレベル2と200の市場形成戦略を訓練し、評価する。
その結果,低ボラティリティ環境下で訓練した4アクションMMは,高ボラティリティ条件に効果的に適応することがわかった。
このことは、フレキシブルな見積もり機構と現実的な市場シミュレーションを取り入れることで、市場形成戦略の有効性が著しく向上することを示している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:50:30 GMT)
ArXivBench: When You Should Avoid Using ChatGPT for Academic Writing [6.6] 大規模言語モデル(LLM)は推論と質問応答において強力な能力を示す。
事実的に誤ったコンテンツを生み出す傾向は、依然として重要な課題である。
本研究は,arXivの正確なリンクを持つ関連研究論文を生成するための,プロプライエタリかつオープンソース LLM の評価を行う。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:26:02 GMT)
NomicLaw: Emergent Trust and Strategic Argumentation in LLMs During Collaborative Law-Making [6.6] 構造化マルチエージェントシミュレーションであるNomicLawを導入する。
投票パターンを通じて信頼と互恵性を定量的に測定し、エージェントが提案を正当化するために戦略的言語をどのように利用するかを質的に評価する。
我々の結果は,10のオープンソースLCMの潜伏する社会的推論と説得能力を強調し,将来のAIシステムの設計に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:49:44 GMT)
Near Optimal Inference for the Best-Performing Algorithm [6.5] 本稿では,サブセット選択問題に対する新しい枠組みを提案する。
我々は、現在知られている手法を大幅に改善する高信頼と有限サンプルスキームを提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:08:06 GMT)
CountingFruit: Language-Guided 3D Fruit Counting with Semantic Gaussian Splatting [6.5] FruitLangGSは言語誘導型3Dフルーツカウントフレームワークである。
適応密度のガウススプラッティングパイプラインを用いてオーチャードスケールのシーンを再構成する。
実験では、リコール数をカウントする場合、既存のパイプラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:47:32 GMT)
Quantum Sensing with Topological-Paired Bound States [6.3] 単一量子ビットを用いた量子強調センシングのための効率的でロバストなプロトコルを提案する。
提案手法は, 量子ビット近傍に局在する位相対境界状態に依存する。
感度はハイゼンベルク限界まで到達しうることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:34:27 GMT)
Balancing Stylization and Truth via Disentangled Representation Steering [6.3] 表現編集によるスタイル付き大言語モデル (LLM) 応答は、微細な出力制御において有望な方法である。
独特なスタイルを課すことは、しばしば真理を損なう。
既存の表現編集手法は、この副次的影響を見落とし、モデルのコアの真正性表現を頻繁に汚染する。
スタイリトゥルース(StyliTruth, StyliTruth, StyliTruth, StyliTruth, StyliTruth, StyliTruth)を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:14:50 GMT)
STEPWISE-CODEX-Bench: Evaluating Complex Multi-Function Comprehension and Fine-Grained Execution Reasoning [6.3] 複雑な多機能理解と細粒度実行推論のための新しいベンチマークであるSTEPWISE-CODEX-Bench(SX-Bench)を提案する。
SX-Benchは非常に差別的であり、最先端のOpenAI-O3でさえハード推論タスクでは78.7%の精度しか達成していない。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:28:43 GMT)
Optimal Qubit Purification and Unitary Schur Sampling via Random SWAP Tests [6.3] ランダムなSWAPテストのみに基づく単純なプロトコルは、最適であるシュア変換と同じ忠実性を達成することを示す。
このプロトコルは量子状態トモグラフィやメトロジーといったタスクのための強力なサブルーチンである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:57:31 GMT)
Optimizing Preventive and Reactive Defense Resource Allocation with Uncertain Sensor Signals [6.2] 予防資源への最適投資が増加し,反応性のある資源投資が減少し,センサの質が向上することを示す。
また,攻撃者が低攻撃成功確率しか達成できない場合,攻撃者の性能向上は,センサが採用されていないベースラインと比較して最大であることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:34:04 GMT)
CARE: Enhancing Safety of Visual Navigation through Collision Avoidance via Repulsive Estimation [6.2] 本稿では,学習に基づく視覚ナビゲーション手法の堅牢性を向上させるため,CARE(Collision Avoidance via Repulsive Estimation)を提案する。
CAREは、ローカルなロボット軌道を生成するRGBベースのナビゲーションモデルにシームレスに統合することができる。
我々は、様々なロボットプラットフォームにまたがる最先端のビジュアルナビゲーションモデルと統合することで、CAREを評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:19:28 GMT)
ASkDAgger: Active Skill-level Data Aggregation for Interactive Imitation Learning [6.1] 我々は,Active Skill-level Data Aggregation (ASkDAgger)フレームワークを紹介する。
初級プランに対する教師のフィードバックを3つの重要な方法で活用する。
これらのコンポーネントはクエリ頻度と障害発生のバランスをとり、必要なデモアノテーションの数を減らし、一般化を改善し、変更するドメインへの適応を高速化する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:10:46 GMT)
LLM-based Multi-Agent Copilot for Quantum Sensor [6.1] QCopilotは、外部知識アクセス、アクティブラーニング、量子センサーの設計と診断のための不確実性定量化を統合するマルチエージェントフレームワークである。
QCopilotを原子冷却実験に適用し、数時間以内に人間の介入なしに10$rm8$sub-$rmmu$K原子を生成した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:14:08 GMT)
Securing Consensus from Long-Range Attacks through Collaboration [6.1] 本稿では,既存のPoS/BFTブロックチェーンを長距離攻撃から保護するPower-of-Collaborationプロトコルの設計を提案する。
PoCは公平性と説明責任を保証し、基盤となるシステムのスループットをわずかに低下させる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:48:49 GMT)
Efficient Safety Testing of Autonomous Vehicles via Adaptive Search over Crash-Derived Scenarios [6.0] 本研究では,安全クリティカルシナリオにおけるAVの高速化テストアルゴリズムの設計に焦点をあてる。
Baidu Apolloは、高度なブラックボックス自動運転システム(ADS)を統合し、エゴ車の挙動を制御する。
ALVNS-SAを用いた場合, 試験効率は有意に向上した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:55:01 GMT)
EnergyPatchTST: Multi-scale Time Series Transformers with Uncertainty Estimation for Energy Forecasting [5.9] EnergyPatchTSTは、エネルギー予測用に特別に設計されたPatch Time Series Transformerの拡張である。
一般的なエネルギーデータセットに関する一連の実験により、EnergyPatchTSTは他の一般的な方法よりも優れていることが示されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:48:39 GMT)
ETTA: Efficient Test-Time Adaptation for Vision-Language Models through Dynamic Embedding Updates [5.8] Test-Time Adaptationは、新しいドメインでラベル付けされていないテストデータに視覚言語モデルを適用する。
現在のキャッシュベースのTTAモデルは、限られた高信頼のサンプルのみを格納する。
入ってくるすべてのテストサンプルを統合するRecursive Updatingモジュールを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:11:33 GMT)
Hierarchical Deep Deterministic Policy Gradient for Autonomous Maze Navigation of Mobile Robots [5.8] 本稿では,高レベルかつ低レベルなポリシーを含む効率的な階層DDPG(HDDPG)アルゴリズムを提案する。
これは標準DDPGとそのバリエーションの制限を大幅に克服し、成功率を56.59%以上改善し、平均報酬を519.03以上引き上げた。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:06:22 GMT)
Personalized Safety Alignment for Text-to-Image Diffusion Models [5.8] 生成モデルにおける安全行動に対するユーザ固有の制御を可能にするフレームワークを提案する。
ユーザ固有の安全設定をキャプチャする新しいデータセットであるSageを導入する。
実験により、PSAは有害なコンテンツ抑制において既存の方法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:06:21 GMT)
Align-for-Fusion: Harmonizing Triple Preferences via Dual-oriented Diffusion for Cross-domain Sequential Recommendation [5.7] クロスドメインシーケンシャルレコメンデーション(CDSR)メソッドは、しばしばアライメント・then-fusionパラダイムに従う。
本稿では,CDSR のためのアライメント・フォー・フュージョン・フレームワークを提案し,二方向DM であるHorizonRec を用いて三重選好を調和させる。
2つの異なるプラットフォームからの4つのCDSRデータセットの実験は、HorizonRecの有効性と堅牢性を示している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:00:29 GMT)
A Stein Gradient Descent Approach for Doubly Intractable Distributions [5.6] そこで本研究では,2重に抽出可能な分布を推定するために,モンテカルロ・スタイン変分勾配勾配(MC-SVGD)法を提案する。
提案手法は,後続分布に匹敵する推論性能を提供しながら,既存のアルゴリズムよりもかなりの計算ゲインを達成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:36:21 GMT)
EasySize: Elastic Analog Circuit Sizing via LLM-Guided Heuristic Search [5.6] EasySizeはQwen3-8Bモデルに基づく最初の軽量ゲートサイズフレームワークである。
タスク固有の損失関数を動的に構築するために、パフォーマンスメトリクスのさまざまなEase of Attainability(EOA)を利用する。
EasySizeは、ゲートサイズにおける人間の専門知識や計算資源への依存を著しく減らすことができる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:47:07 GMT)
Tesserae: Scalable Placement Policies for Deep Learning Workloads [5.6] ディープラーニング(DL)モデルのトレーニングは、データセンタにおいて主要なワークロードになっています。
これを実現するために、スケジューラは通常、クラスタ上にジョブを置く場所を管理する配置ポリシーを取り入れます。
私たちの重要な洞察は、多くの配置制約をグラフマッチング問題として定式化できるということです。
ジョブマイグレーションオーバーヘッドとジョブパッキングを最小化するための新しい配置ポリシーを設計する。
実験の結果,テッセラは既存のスケジューラに比べて平均JCTを最大1.62倍,Makespanを最大1.15倍改善することがわかった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:38:43 GMT)
Calibrating Deep Neural Network using Euclidean Distance [5.4] 機械学習では、Focal Lossは、サンプルの分類が難しいことを強調することで、誤分類率を減らすために一般的に使用される。
高校正誤差は予測確率と実際の結果との相違を示し、モデルの信頼性に影響を及ぼす。
本研究では,FCL (Focal Loss) と呼ばれる新しい損失関数を導入する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:15:03 GMT)
Modeling Rapid Contextual Learning in the Visual Cortex with Fast-Weight Deep Autoencoder Networks [5.3] 深層ニューラルネットワークの初期層において、親しみやすさのトレーニングがグローバルコンテキストに対する感受性をいかに引き起こすかを検討する。
以上の結果から,親しみやすさのトレーニングは,階層的なネットワークにおいて,従来の階層にグローバルな感度をもたらすことが示唆された。
ハイブリット・アンド・スローウェイト・アーキテクチャは、脳内の迅速なグローバルな文脈学習を研究するための実行可能な計算モデルを提供するかもしれない。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:52:09 GMT)
MoMA: A Mixture-of-Multimodal-Agents Architecture for Enhancing Clinical Prediction Modelling [5.3] 複数の大規模言語モデル (LLM) エージェントを臨床予測に利用するために設計された新しいアーキテクチャであるMixture-of-Multimodal-Agents (MoMA) を導入する。
MoMAは、医学画像や実験結果などの非テクストのモダリティを構造化されたテキスト要約に変換するために、特殊なLLMエージェント(特殊エージェント)を使用している。
MoMAは現在の最先端メソッドよりも優れており、さまざまなタスクにおける精度と柔軟性の向上を強調している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:28:34 GMT)
Automatic Image Colorization with Convolutional Neural Networks and Generative Adversarial Networks [5.3] 本稿では,分類と逆学習による画像の自動色付けについて検討する。
私たちは、事前の作業に基づいてモデルを構築し、特定のシナリオに修正を適用し、比較します。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:41:31 GMT)
AutoIAD: Manager-Driven Multi-Agent Collaboration for Automated Industrial Anomaly Detection [5.3] 本稿では,産業用視覚異常検出のエンドツーエンド自動開発を目的としたマルチエージェント協調フレームワークであるAutoIADを紹介する。
AutoIADはマネージャ駆動の中央エージェントを活用して、特殊なサブエージェントをオーケストレーションし、ドメイン固有の知識ベースを統合する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:36:38 GMT)
MedMKEB: A Comprehensive Knowledge Editing Benchmark for Medical Multimodal Large Language Models [5.3] MedMKEBは,知識編集の信頼性,汎用性,局所性,可搬性,堅牢性を評価するために設計された,最初の総合的なベンチマークである。
MedMKEBは高品質な医用視覚質問応答データセット上に構築されており、慎重に構築された編集タスクに富んでいる。
ベンチマークの精度と信頼性を確保するために、人間の専門家による検証を組み込んだ。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:09:26 GMT)
WeatherEdit: Controllable Weather Editing with 4D Gaussian Field [5.2] 我々は3Dシーンで現実的な気象効果を生成するための新しい天気編集パイプラインであるWeatherEditを紹介する。
我々のアプローチは、気象背景編集と気象粒子構築という2つの重要な要素で構成されている。
複数の運転データセットの実験により、気象編集は制御可能な条件重大度で多様な気象効果を発生させることができることが示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:07:35 GMT)
SSEmb: A Joint Structural and Semantic Embedding Framework for Mathematical Formula Retrieval [5.2] 数式の構造的特徴と意味的特徴の両方を捉えることができる新しい埋め込みフレームワークであるSSEmbを提案する。
ARQMath-3 式検索タスクでは,SSEmb は P'@10 および nDCG'@10 において,既存の埋め込み方式よりも5 ポイント以上優れている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:27:21 GMT)
STARFormer: A Novel Spatio-Temporal Aggregation Reorganization Transformer of FMRI for Brain Disorder Diagnosis [5.2] 本稿では,信号の空間的特徴と時間的特徴を効果的に捉えた時空間集約型ランズフォーマSTAR(Former)を提案する。
提案したSTARFormerは、自閉症スペクトラム障害(ASD)と注意欠陥高活動障害(ADHD)の分類のための2つの公開データセットで厳格に評価されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:17:17 GMT)
GNN-Enhanced Fault Diagnosis Method for Parallel Cyber-physical Attacks in Power Grids [5.2] パラレルサイバー物理攻撃(PCPA)は、物理的伝送路を損傷し、電力グリッドにおける計測データ伝送をブロックする。
本稿では,PCPA 下での線形化 (DC) 電力流モデルにおける故障診断問題について検討する。
本稿では,メタ混合整数プログラミング(MMIP)に基づく故障診断フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:30:19 GMT)
High-Order Error Bounds for Markovian LSA with Richardson-Romberg Extrapolation [5.2] マルコフ雑音下でのPolyak-Ruppert平均値を用いた線形近似アルゴリズムのバイアスおよび高次誤差境界について検討した。
本稿では線形化手法によるバイアスの新たな分解法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:02:11 GMT)
Towards Robust Evaluation of Visual Activity Recognition: Resolving Verb Ambiguity with Sense Clustering [5.2] 視覚活動認識システムの評価は、動詞の意味論と画像解釈において固有の曖昧さのために困難である。
本稿では,より頑健な評価を実現するために,動詞知覚クラスタを構成する視覚言語クラスタリングフレームワークを提案する。
ImSituデータセットの分析では、各画像は平均2.8センスのクラスタにマップされ、各クラスタは画像の異なる視点を表す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:22:15 GMT)
Incident Response Planning Using a Lightweight Large Language Model with Reduced Hallucination [5.1] この課題を軽減するための有望なアプローチは、インシデントハンドリング中にセキュリティオペレータを支援するために、大きな言語モデル(LLM)に埋め込まれたセキュリティ知識を使用することである。
最近の研究はこのアプローチの可能性を示しているが、現在の手法は主にフロンティアLLMの迅速な工学に基づいている。
幻覚の減少を伴うインシデント対応計画にLLMを用いた新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:23:25 GMT)
Leveraging LLMs for Privacy-Aware Predictions in Participatory Budgeting [5.1] 参加予算は市民に公共投資プロジェクトの提案と投票を許可する。
その民主的な可能性にもかかわらず、PBイニシアチブは低い参加率に悩まされ、その可視性と正当性を制限している。
本稿では,PB提案の資金源となる可能性を予測するためのプライバシ保護手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:26:22 GMT)
Conformal Sets in Multiple-Choice Question Answering under Black-Box Settings with Provable Coverage Guarantees [5.1] ブラックボックス設定下での周波数に基づく不確実性定量化手法を提案する。
提案手法では,各入力に対するモデル出力分布の独立サンプリングを行う。
周波数に基づくPEは、正しい予測と誤予測の区別においてロジットに基づくPEよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:22:49 GMT)
Estimating the size of a set using cascading exclusion [5.1] 一般的な非漸近論が展開されている。
一般定理は、すべての場合において非パラメトリック有限$n$誤差境界を与える。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:36:42 GMT)
Echo State Networks for Bitcoin Time Series Prediction [4.9] 本研究では,Echo State Networks (ESNs) が短時間の株式市場の動きを効果的にモデル化し,動的データの非線形パターンを捉えることができることを示す。
また,カオス期におけるLyapunov指数によるカオス解析を行い,既存の機械学習手法よりも有意差があることを実証した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:08:45 GMT)
CLOT: Closed Loop Optimal Transport for Unsupervised Action Segmentation [4.9] 教師なしのアクションセグメンテーションは、最近、最適なトランスポート(OT)ベースの方法であるASOTによってその限界を推し進めた。
マルチレベル循環型特徴学習機構を備えた新しいOTベースのフレームワークであるClosed Loop Optimal Transport (CLOT)を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:47:07 GMT)
On the Design of Expressive and Trainable Pulse-based Quantum Machine Learning Models [4.9] パルスベースの量子機械学習(QML)は、量子人工知能の新しいパラダイムとして登場した。
実用的な用途では、パルスベースのモデルは表現力と訓練性の両方を必要とする。
本稿では、トレーニング性を維持しつつ、パルスベースのQMLモデルを表現するための要件について検討する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:40:09 GMT)
Holistic Explainable AI (H-XAI): Extending Transparency Beyond Developers in AI-Driven Decision Making [4.9] 本稿では,従来のXAI手法と因果評価手法を統合する統合フレームワークであるH-XAI(H-XAI)を紹介し,対話的マルチメソッドプロセスとしての説明を支援する。
H-XAIは、ステークホルダーが一連の質問をしたり、仮説をテストしたり、モデル行動と自動的に構築されたランダムでバイアスのあるベースラインを比較することを可能にする。
インスタンスレベルの説明とグローバルな説明を組み合わせて、各ステークホルダの目標に適応し、個々の決定を理解し、グループレベルの偏見を評価し、摂動の下で堅牢性を評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:06:08 GMT)
An Explainable Machine Learning Framework for Railway Predictive Maintenance using Data Streams from the Metro Operator of Portugal [4.9] この研究は、Intelligent Transportation Systemsのリアルタイムデータ駆動予測メンテナンスソリューションに寄与する。
提案手法は,サンプル前処理,機械学習モデルによる漸進的分類,結果説明からなる処理パイプラインを実装した。
この研究は、自然言語と視覚的説明可能性を使って、オンラインの故障予測を行う最初のものである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:38:49 GMT)
Beyond Subspace Isolation: Many-to-Many Transformer for Light Field Image Super-resolution [4.8] 本稿では,光フィールド画像超解像処理のための新しいM2MTを提案する。
M2MTは、自己認識機構を実行する前に、空間部分空間内の角情報を集約する。
光フィールド画像内の全てのサブアパーチャ画像全体への完全なアクセスを可能にする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:18:26 GMT)
Towards Pareto Optimal Throughput in Small Language Model Serving [4.5] SLM(Small Language Models)は、リソース制約のあるユーザに対して、新たな機会を提供する。
本研究では,SLM推論を性能およびエネルギーレベルで評価するための一連の実験について述べる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:57:44 GMT)
PoseGen: In-Context LoRA Finetuning for Pose-Controllable Long Human Video Generation [4.4] 本稿では,1つの参照画像と駆動ポーズシーケンスから,特定の被写体の任意の長さのビデオを生成する新しいフレームワークPoseGenを紹介する。
我々の中核となるイノベーションは、アイデンティティ保存のためのトークンレベルで被写体を注入する、コンテキスト内LoRAファインタニング戦略です。
我々はPoseGenがアイデンティティの忠実度において最先端の手法を著しく上回り、精度を高くし、一貫性のあるアーチファクトのない動画を無制限に生成するユニークな能力を示している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:19:02 GMT)
Minimal Model Reasoning in Description Logics: Don't Try This at Home! [4.4] 我々は、$mathcalEL$に対して、最小限のモデルにおける概念が既に決定不可能であることを示します。
決定性を取り戻すため、TBoxに非循環条件を課し、最悪のケースの複雑さを倍指数時間以下に抑える。
そこでは,DL-Lite$_textcore$で肯定的な結果が得られた。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:56:15 GMT)
Quantum-Efficient Reinforcement Learning Solutions for Last-Mile On-Demand Delivery [4.4] 時間Windowsを用いた大規模キャパシタイトピックアップ・デリバリ問題の解法を量子コンピューティングで検討する。
エンタングル層と変分層を有する新しい問題固有符号化量子回路を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:50:43 GMT)
An Overview of 7726 User Reports: Uncovering SMS Scams and Scammer Strategies [4.3] ユーザーレポートの89.16%がテキストメッセージで構成されており、続いて不審な通話やURLが報告されている。
ユーザが報告したユニークなテキストメッセージの35.12%はスパムであり、40.27%は詐欺テキストメッセージである。
本稿は、特定された詐欺メールを12種類の詐欺タイプに分類する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:19:01 GMT)
Long-Term Client Selection for Federated Learning with Non-IID Data: A Truthful Auction Approach [4.3] 真偽オークション(LCSFLA)に基づく長期クライアント選択フェデレーション学習を提案する。
このスキームは、新たな評価機構とエネルギーコストを用いて、長期データ品質を考慮した社会福祉を最大化する。
IoVシナリオを含む各種データセットの実験結果から,非IIDデータによる性能劣化の軽減効果が示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:30:52 GMT)
Nexus:Proactive Intra-GPU Disaggregation of Prefill and Decode in LLM Serving [4.3] エンジンレベルのプリフィル・デコード(PD)デアグリゲーションは干渉を避けるが、高いハードウェアと調整オーバーヘッドを引き起こす。
PDは、最大2.2倍のスループット、20倍のTTFT、2.5倍のTBTを達成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:26:15 GMT)
CRAM: Large-scale Video Continual Learning with Bootstrapped Compression [4.3] 連続学習(CL)は、ニューラルネットワークがIIDサンプリングではなく、入力の連続ストリームから学ぶことを約束する。
メモリバッファから過去のサンプルを補強するリハーサルベースのアプローチを用いたビデオCLに焦点を当てた。
そこで本稿では,従来型のネットワークを慎重に圧縮し,新しいネットワークで再圧縮する必要があるビデオ符号をリフレッシュすることで,この忘れを解消する手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:32:20 GMT)
FairDAG: Consensus Fairness over Multi-Proposer Causal Design [4.3] 研究によると、敵は取引注文を利用して、フロントランニング、サンドイッチ攻撃、清算操作などの攻撃を通じて利益を抽出している。
この問題は、ブロックプロポーサがトランザクションオーダを完全にコントロールするブロックチェーンデータベースに影響を与える。
既存のフェアネスプロトコルはリーダベースのコンセンサスプロトコルで運用されている。
本稿では,DAGベースのコンセンサスプロトコル上でフェアネスプロトコルを実行するFairDAG-ABとFairDAG-RLを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:56:36 GMT)
DQT: Dynamic Quantization Training via Dequantization-Free Nested Integer Arithmetic [4.2] 本稿では,このボトルネックを取り除く新しいフレームワークである動的量子化トレーニング(DQT)を紹介する。
DQTの中核はネストされた整数表現であり、低い精度の値は高い精度のものにビット単位で埋め込まれている。
これによりDQTは、バックボーンネットワークの量子化のない静的混合精度の両方を可能にする最初の量子化フレームワークとなる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:31:48 GMT)
JEPA4Rec: Learning Effective Language Representations for Sequential Recommendation via Joint Embedding Predictive Architecture [4.2] JEPA4Recはセマンティックにリッチで転送可能な表現をキャプチャし、レコメンデーションパフォーマンスを改善する。
我々は、レコメンデーションデータセットの項目情報をキャプチャするのに適した、修正された埋め込み層を備えた双方向トランスフォーマーエンコーダを採用している。
6つの実世界のデータセットの実験は、JEPA4Recが一貫して最先端のメソッドを上回っていることを示している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:13:59 GMT)
FS-IQA: Certified Feature Smoothing for Robust Image Quality Assessment [4.1] 本稿では,画像品質評価(IQA)モデルに対する新しい認証防御手法を提案する。
入力空間ではなく特徴空間に雑音を印加したランダムな平滑化に基づいている。
その結果,主観的品質スコアとの相関性は最大30.9%向上した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:47:55 GMT)
Echo: Decoupling Inference and Training for Large-Scale RL Alignment on Heterogeneous Swarms [4.1] 大規模言語モデルのポストトレーニングは、同じGPUクラスタ上でトラジェクトリサンプリングとポリシ最適化を併用する。
ヘテロジニアスな"推論"と"トレーニング"スワムにまたがって、これらの2つのフェーズをきれいに分離するRLシステムであるEchoを紹介します。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:37:04 GMT)
Self-Error Adjustment: Theory and Practice of Balancing Individual Performance and Diversity in Ensemble Learning [4.1] アンサンブル学習は、複数のベース学習者からの予測を集約することで、パフォーマンスを高める。
BaggingやBoostingといった従来の手法は、ランダム性を通じて多様性を促進するが、精度と多様性のトレードオフを正確に制御するものではない。
アンサンブルエラーを2つの異なるコンポーネントに分解するSEA(Self-Error Adjustment)という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:30:26 GMT)
Auto-Eval Judge: Towards a General Agentic Framework for Task Completion Evaluation [4.1] 本稿では,タスク領域に依存しないエージェントタスク完了を評価するための,汎用的でモジュール化されたフレームワークを提案する。
GAIAとBigCodeBenchの2つのベンチマークでMagentic-One Actor Agentを評価することで、我々のフレームワークを検証する。
我々の審査員は、人間の評価と密接に一致したタスクの成功を予測し、それぞれ4.76%と10.52%のアライメント精度を達成した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:39:48 GMT)
GPSMamba: A Global Phase and Spectral Prompt-guided Mamba for Infrared Image Super-Resolution [4.1] Infrared Image Super-Resolution is challenge by the low contrast and sparse textures of infrared data。
GPSMambaは、アーキテクチャガイダンスと非因果的な監視を併用するフレームワークである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:21:29 GMT)
Online Sparsification of Bipartite-Like Clusters in Graphs [4.0] 我々は,非方向グラフと有向グラフの2部グラフのようなクラスタを見つける,効率的かつオンラインなスパーシフィケーションアルゴリズムを提案する。
我々は、合成データセットと実世界のデータセットの両方について実験を行い、我々のアルゴリズムが既存のクラスタリングアルゴリズムの実行時間を著しく高速化することを示した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:28:44 GMT)
End-to-End Efficient Quantum Thermal and Ground State Preparation Made Simple [4.0] システム-バス相互作用に基づく熱・地盤状態生成のための新しい量子アルゴリズムを提案する。
これらのアルゴリズムは、単一の再利用可能なアンシラ量子ビットであるハミルトニアン系の下での前方進化のみを必要とする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:43:07 GMT)
Large Language Models Transform Organic Synthesis From Reaction Prediction to Automation [3.9] 大型言語モデル (LLMs) は化学者が有機合成においてどのように反応を計画し実行するかを再形成し始めている。
LLMは、人間の監督なしに実験を行うロボットに、合成経路を提案し、反応の結果を予測することができる。
本稿では,LLMをグラフニューラルネットワーク,量子計算,リアルタイム分光と組み合わせることで,発見サイクルが小さくなり,よりグリーンでデータ駆動型化学をサポートすることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:17:23 GMT)
Qunity: A Unified Language for Quantum and Classical Computing (Extended Version) [3.9] 量子プログラミング言語Quinityを紹介します。
Qunityは量子コンピューティングを古典コンピューティングの自然な一般化として扱う。
我々はQunityがいくつかの量子アルゴリズムをきれいに表現する方法を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:53:50 GMT)
Towards a General-Purpose Zero-Shot Synthetic Low-Light Image and Video Pipeline [3.8] 本稿では,カメラメタデータを必要とせずに,リアルな標準RGB(sRGB)ノイズを合成的に生成する新しい劣化推定ネットワーク(DEN)を提案する。
合成雑音の再現, 映像強調, 物体検出など, 典型的な低照度タスクに対して, 合成データに基づいて訓練した様々な手法を用いて, 合成パイプラインの評価を行った。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:22:33 GMT)
MOGO: Residual Quantized Hierarchical Causal Transformer for High-Quality and Real-Time 3D Human Motion Generation [3.7] MOGOは、効率的でリアルタイムな3Dモーション生成に適した新しい自動回帰フレームワークである。
MoGOは、運動スケール適応型残留ベクトル量子化モジュールであるMoSA-VQと、残留量子化階層型因果変換器であるRQHC-Transformerの2つの重要なコンポーネントから構成される。
意味的忠実性を高めるために,テキスト制御下での動作復号化を改善するテキスト条件アライメント機構を導入する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:28:34 GMT)
Public support for misinformation interventions depends on perceived fairness, effectiveness, and intrusiveness [3.7] 我々は1010人のアメリカのソーシャルメディアユーザーに対して、政府やソーシャルメディア企業が実施した10件の誤情報介入に対する支持と認識を評価するよう求めた。
以上の結果から,介入の公平さが支援決定の最も重要な要因であることが示唆された。
政策の展開と有効性において、世論が重要な役割を果たすのは、どのような介入が支持されるのか、なぜかを理解することが重要である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:52:04 GMT)
On the Reliability of Sampling Strategies in Offline Recommender Evaluation [3.5] オフライン評価は、オンラインテストが非現実的または危険である場合、推奨システムのベンチマークにおいて中心的な役割を果たす。
露出バイアスは、ユーザが表示されているアイテムのみと対話する、露出バイアスと、全カタログではなくログされたアイテムのサブセットで評価を行う際に導入されるサンプリングバイアスである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:50:05 GMT)
Finding Needles in Images: Can Multimodal LLMs Locate Fine Details? [3.5] Finding Needles in Images (NiM)は、新聞、メニュー、講義画像を含む様々な現実世界の文書にまたがるベンチマークである。
我々は,知的パッチ選択とガウス的注意を通してMLLMの能力を高める,シンプルで効果的なアプローチであるSpot-ITを提案する。
提案手法の有効性を実証しながら,文書理解タスクのきめ細かい処理における現在のMLLMの機能と限界を明らかにした。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:10:15 GMT)
ConiQ: Enabling Concatenated Quantum Error Correction on Neutral Atom Arrays [3.4] AHAd符号、特に超高速符号の最近の進歩は、前例のない宇宙効率を実現している。
これらのコードは、アドレス可能な論理ゲートの効率的な実装を欠いている。
長距離通信は、現在のハードウェアプラットフォームにとって大きな課題となる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:46:20 GMT)
SONAR-LLM: Autoregressive Transformer that Thinks in Sentence Embeddings and Speaks in Tokens [3.4] 我々は、同じ連続SONAR埋め込み空間で"考える"デコーダのみの変換器であるSONAR-LLMを提案する。
このハイブリッドな目的は、拡散サンプリング器を除去し、可能性に基づく訓練信号を復元しながら、LCMのセマンティックな抽象化を維持している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:03:44 GMT)
Difference Views for Visual Graph Query Building [3.3] 知識グラフ(KG)には、さまざまなドメインの知識をエンコードする大量のリンクリソースが含まれている。
既存のビジュアルクエリビルダーは、熟練していないユーザがSPARQLクエリを構築し、これらのグラフに含まれる知識を利用することを可能にする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:14:33 GMT)
Semantic Reasoning Meets Numerical Precision: An LLM-Powered Multi-Agent System for Power Grid Control [3.3] 本稿では,リアルタイムにグリッド違反を検出し,対処する自律型AI駆動型フレームワークであるGrid-Agentを紹介する。
Grid-Agentは、モジュールエージェントアーキテクチャを通じて意味論的推論と数値的精度を統合する。
このフレームワークは、スイッチ設定の最適化、バッテリ配置、負荷削減戦略を通じて、コーディネートされた違反解決を可能にする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:10:28 GMT)
Leveraging AI to Accelerate Clinical Data Cleaning: A Comparative Study of AI-Assisted vs. Traditional Methods [3.3] Octoziは、大規模な言語モデルとドメイン固有性を組み合わせた人工知能支援プラットフォームで、臨床データレビューを変換する。
AIアシストは、データのクリーニングスループットを6.03倍にし、同時にクリーニングエラーを54.67%から8.48%に下げることを示した。
このシステムは偽陽性クエリを15.48倍に減らし、不要なサイト負荷を最小限にした。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:49:32 GMT)
Discovering Properties of Inflectional Morphology in Neural Emergent Communication [3.3] 我々は,2つの調音をシミュレートするための小語彙制約を付与することにより,属性値再構成ゲームである共通の EmCom の設定を再解釈する。
音韻論的制約を模擬することで、結合型形態学が促進され、創発型言語が自然言語の傾向を再現し、文法的属性を融合させることが判明した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:44:50 GMT)
REINA: Regularized Entropy Information-Based Loss for Efficient Simultaneous Speech Translation [3.2] 同時音声翻訳(SimulST)システムは、翻訳されたテキストや音声を同時に出力しながら音声でストリームする。
私たちは、このトレードオフを最適化するための戦略を導入します。
正規化エントロピー情報適応(Regularized Entropy Information Adaptation, REINA)を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:25:58 GMT)
Chemist Eye: A Visual Language Model-Powered System for Safety Monitoring and Robot Decision-Making in Self-Driving Laboratories [3.2] ロボット工学と自動化を自動運転研究所(SDL)に統合することで、さらなる安全性の複雑さがもたらされる。
本稿では,SDLにおける状況認識を高めるために設計された分散安全監視システムであるChemist Eyeを紹介する。
このシステムは、SDLのインシデントを監視するために設計されたRGB、深度、赤外線カメラを備えた複数のステーションを統合している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:31:42 GMT)
Q-DPTS: Quantum Differentially Private Time Series Forecasting via Variational Quantum Circuits [3.1] 我々はQ-DPTSを提案する。Q-DPTSは量子差分時時系列予測のためのハイブリッド量子古典的フレームワークである。
Q-DPTSは、変動量子回路とサンプルごとの勾配クリッピングとガウスノイズ注入を組み合わせることで、厳密な$(epsilon, delta)$-differential privacyを保証する。
結果は,Q-DPTSが同一のプライバシー予算の下で常に低い予測誤差を達成していることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:23:51 GMT)
ST-WebAgentBench: A Benchmark for Evaluating Safety and Trustworthiness in Web Agents [3.1] 既存のベンチマークは、エージェントがタスクを完了したか、それが安全に行われているか、あるいは企業が信頼できる方法で行われているかを無視するのみである。
textbftextscST-WebAgentBenchを紹介します。
222のタスクはそれぞれ、制約を符号化する簡潔なルールであるSTポリシーと組み合わせられ、6次元(例えば、ユーザの同意、堅牢性)に沿ってスコアされる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:02:19 GMT)
Generalized Wigner-Smith theory for perturbations at exceptional and diabolic point degeneracies [3.1] 拡張型 (DP) や例外型 (EP) の点を含むスペクトルの退化は、外的摂動に対する特異な感受性を示す。
本稿では,DPおよびEP型スペクトル退化の複素共振分割を定量化する残差に基づく摂動理論を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:42:51 GMT)
A Rose by Any Other Name Would Smell as Sweet: Categorical Homotopy Theory for Large Language Models [3.0] 大規模言語モデル(LLM)は、そのような場合と同様の次世代の確率を生成するべきである。
文類似性のk-NN推定を用いてスムーズな推定を行うなど、実証的な回避策が検討されている。
文の確率をマルコフ圏の矢印で定義する LLM の分類的ホモトピーフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:48:30 GMT)
Cognitive Duality for Adaptive Web Agents [3.0] 本稿では,システム1とシステム2の認知過程を高速に分解する原理を提案する。
高速直感的な処理とタスクの複雑さに基づいた意図的な推論を適応的に切り替えるモジュール型エージェントアーキテクチャであるCogniWebに,このフレームワークを実装した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:05:22 GMT)
"Mirror" Language AI Models of Depression are Criterion-Contaminated [3.0] ミスモデル」は、予測スコアが予測者自身に依存する場合に「基準汚染」に悩まされる。
うつ病のミラー言語AIモデルは、人工的に膨らませられた効果の大きさと一般化可能性の低下を示した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:13:00 GMT)
Few-Shot Deployment of Pretrained MRI Transformers in Brain Imaging Tasks [3.0] 種々の脳画像タスクにおいて,事前訓練したMRIトランスフォーマーを数発配置するためのフレームワークを提案する。
Masked Autoencoder (MAE) 事前学習戦略を利用することで,タスクやデータセット間でよく一般化された,高度に伝達可能な潜在表現が得られる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:53:28 GMT)
A Probabilistic Framework for Imputing Genetic Distances in Spatiotemporal Pathogen Models [3.0] そこで本研究では,不連続な症例間の遺伝的距離と,定義された伝達鎖内の既知のアライメントを推定するための枠組みを提案する。
このアプローチは、米国の野生鳥類における高病原性鳥インフルエンザA/H5症例に適用される。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:39:37 GMT)
AI vs. Human Moderators: A Comparative Evaluation of Multimodal LLMs in Content Moderation for Brand Safety [2.9] ブランド安全分類におけるMLLM(Multimodal Large Language Models)の能力をベンチマークする。
Gemini, GPT, LlamaなどのMLLMのマルチモーダルブランド安全性における有効性を示す。
本稿では,MLLMの限界と障害事例について,詳細な議論を行う。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:55:46 GMT)
Capsule-ConvKAN: A Hybrid Neural Approach to Medical Image Classification [2.9] 提案したCapsule-ConvKANアーキテクチャは、Capsule Networkの動的ルーティングと空間階層機能と、Convolutional Kolmogorov-Arnold Networksのフレキシブルで解釈可能な関数近似を組み合わせたものである。
その結果、空間パターンのキャプチャ、複雑な特徴の管理、医用画像分類における従来の畳み込みモデルの限界への対処において、新たに導入されたCapsule-ConvKANの可能性が示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:14:13 GMT)
MENDR: Manifold Explainable Neural Data Representations [2.8] 本稿では,MENDR(Manifold Explainable Neural Data Representations)を提案する。
EEGファウンデーションモデルは、事前学習、下流の微調整、学習された表現の解釈可能性における透明性を保証する必要がある。
MENDRは極めて少ないパラメータでほぼ最先端の性能を達成し, 効率的, 解釈可能, 臨床応用可能な脳波解析の可能性を明らかにする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:55:05 GMT)
On the Theory and Practice of GRPO: A Trajectory-Corrected Approach with Fast Convergence [2.8] Group Relative Policy Optimizationは、批判のない強化学習アルゴリズムである。
GRPO更新規則は,現行の方針よりも旧方針の政策勾配を推定する。
軌道レベルの重要度補正 GRPO という新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:46:48 GMT)
An Explainable Natural Language Framework for Identifying and Notifying Target Audiences In Enterprise Communication [2.8] 本稿では,RDFグラフデータベースとLLMを組み合わせて自然言語クエリを処理する新しいフレームワークを提案する。
当社のソリューションは,機器,製造業者,保守技術者,設備といった概念を組み込んだ直感的なクエリの定式化を可能にする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:02:40 GMT)
Machine Learning-Based Nonlinear Nudging for Chaotic Dynamical Systems [2.8] ナッジ(Nudging)は、観察駆動制御項をモデル力学に組み込んだ経験的データ同化手法である。
非線形状態空間モデルにおけるヌーディング項を学習するデータ駆動型ニューラルネットワークヌージングを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:45:43 GMT)
Entanglement measures for causally connected subregions and holography [2.7] 量子場理論とホログラフィーにおいて、因果連結部分領域の絡み合いを$A$および$B$で調べる。
シュウィンガー・ケルディシュ形式と実時間複製法を用いて、$T_AB$を構築し、関連する絡み合いを計算する方法を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:44:26 GMT)
Off-Policy Evaluation for Sequential Persuasion Process with Unobserved Confounding [2.7] 現実のシナリオは、しばしば受信者の信念の形成と意思決定に影響を与える隠された変数を含む。
我々はこれをシーケンシャルな意思決定問題として概念化し、送信側と受信側が複数のラウンドで対話する。
このシナリオを部分観測可能なマルコフ決定プロセス (POMDP) として再構成することにより、受信者の信念と観測不能な共同創設者の両方のダイナミクスに関する不完全な情報をキャプチャする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:50:01 GMT)
Optimizing IoT Threat Detection with Kolmogorov-Arnold Networks (KANs) [2.7] IoT(Internet of Things)の指数的な成長は、セキュリティ上の重大な懸念につながっている。
本研究では,IoTネットワークにおける侵入検出のための機械学習モデルの代替として,KAN(Kolmogorov-Arnold Networks)の可能性を検討する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:29:10 GMT)
From Detection to Correction: Backdoor-Resilient Face Recognition via Vision-Language Trigger Detection and Noise-Based Neutralization [2.7] バックドア攻撃はディープニューラルネットワーク(DNN)を利用した顔認識システムを覆す
そこで我々はTrueBiometric: Trustworthy Biometricsを提案する。
実験の結果,TrueBiometricはクリーンな画像の精度を損なうことなく,100%の精度で有毒な画像を検出し,修正することを示した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:02:34 GMT)
Skin-SOAP: A Weakly Supervised Framework for Generating Structured SOAP Notes [2.6] 皮膚癌は世界中で最も多いがんであり、年間医療費は80億ドルを超えている。
臨床現場では、医師が詳細なSOAP(Subjective, Objective, Assessment, Plan)のノートを使って患者訪問を文書化する。
スキンSOAP(Skin-SOAP)は、病変画像やスパース臨床テキストを含む限られた入力から臨床構造化されたSOAPノートを生成するための弱教師付きマルチモーダルフレームワークである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:12:43 GMT)
Guided Random Forest and its application to data approximation [2.6] 我々は、グローバルなパーティショニングを得るために、局所的なパーティショニングによる斜め決定木を構築するというアイデアを拡張した。
我々は,グローバルパーティショニングによって一般化誤差が低減されることを実証的に実証した。
115のベンチマークデータセットの結果は、GRAFがほとんどのデータセットで同等またはより良い結果を得ることを示している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:46:05 GMT)
A Privacy-Centric Approach: Scalable and Secure Federated Learning Enabled by Hybrid Homomorphic Encryption [2.6] Federated Learning(FL)は、生データを共有せずに協調的なモデルトレーニングを可能にするため、プライバシに敏感なドメインに対して有望なアプローチである。
その可能性にもかかわらず、FLは特に通信オーバーヘッドとデータプライバシの観点から、重大な課題に直面している。
本研究では、対称暗号とHEを組み合わせた暗号プロトコルであるHybrid Homomorphic Encryption(HHE)をFLと効果的に統合し、通信とプライバシーの両方の課題に対処する方法について検討する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:51:48 GMT)
Will You Be Aware? Eye Tracking-Based Modeling of Situational Awareness in Augmented Reality [2.5] Augmented Reality(AR)システムは、安全クリティカルなシナリオにおける状況認識(SA)を損なう仮想コンテンツに、認知的トンネルを誘導するリスクを生じさせる。
本稿では,AR誘導蘇生(CPR)におけるSAについて検討する。
我々は、リアルタイムCPRフィードバック(圧縮深さとレート)をオーバーレイするARアプリを開発し、予期せぬインシデントをシミュレーションしたユーザスタディを実行した。
視線追跡分析の結果,より高濃度のSA濃度はより高いサスカデック振幅と速度に関連し,仮想コンテンツに対する固定率と頻度は低下していた。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:35:50 GMT)
On the Classical Hardness of the Semidirect Discrete Logarithm Problem in Finite Groups [2.5] 量子後暗号プロトコルの基礎として,有限群の半間接離散対数問題 (SDLP) が提案された。
近年の研究では、有限群のSDLPは効率的な量子アルゴリズムを認め、量子抵抗を損なうことが示されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:59:57 GMT)
Tailored First-order and Interior-point methods and a new semidefinite programming hierarchy for entanglement detection [2.5] 量子絡み合いは量子情報科学の核心にあるが、高次元またはノイズの多いシステムにおける信頼性の高い検出は、依然として基本的な計算課題である。
本稿では,EXT と DPS の間に挟まれた新しい SDP 階層 PST を導入する。
我々のアルゴリズムは数値的に安定しており、分離性の境界付近にある状態であっても、絡み合った証人や近接測度を生成することができる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:07:36 GMT)
Neuromorphic Cybersecurity with Semi-supervised Lifelong Learning [2.4] 本稿では,生涯ネットワーク侵入検知システム(NIDS)のためのスパイキングニューラルネットワーク(SNN)アーキテクチャを提案する。
提案システムでは、まず効率的な静的SNNを用いて潜在的な侵入を識別し、次に特定の攻撃タイプを分類するアダプティブ動的SNNを起動する。
UNSW-NB15ベンチマークで連続的な学習環境でテストされ、アーキテクチャは堅牢な適応を示し、破滅的な忘れを減らし、全体的な精度は85.3ドル%に達する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:23:54 GMT)
The Impact of Item-Writing Flaws on Difficulty and Discrimination in Item Response Theory [2.4] 質の高いテスト項目は、特にIRTにおける教育評価に不可欠である
従来の検証方法は、アイテムの難易度と差別を見積もるために、リソース集約的なパイロットテストに依存している。
テキスト機能に基づいたテスト項目評価のためのドメイン汎用アプローチとして,IWF(Item-Writing Flaw)ルーブリックが登場した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:13:15 GMT)
HoneySat: A Network-based Satellite Honeypot Framework [2.4] ハニーサットは、最初の高相互作用衛星ハニーポットフレームワークである。
HoneySatはSmallSatミッションの現実的で魅力的なシミュレーションを提供する。
ハニーサットは野生の人類の敵を騙し、22の現実世界の衛星固有の敵の相互作用を収集した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:16:42 GMT)
Building Effective Safety Guardrails in AI Education Tools [2.3] 本稿では,教室で使用されるAI生成コンテンツの安全性と年齢的適切性について考察する。
アイラは5~16歳の生徒にふさわしい全国的なカリキュラムを計画する教師を支援することを目的としている。
AI生成コンテンツに関連する安全性リスクを軽減するため、私たちは4つの重要な安全ガードレールを実装しました。
本稿では、生成型AI教育ツールにおいて、より効果的な安全ガードレールを構築する方法を強調する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:09:47 GMT)
Prediction of Survival Outcomes under Clinical Presence Shift: A Joint Neural Network Architecture [2.3] 本稿では,観測時間と欠落過程を共同でモデル化するマルチタスク・リカレントニューラルネットワークを提案する。
本研究は,予測モデルが新たな環境に展開される際の臨床存在変化の概念を定式化したものである。
提案手法は, 最先端予測モデルと比較して, 性能と輸送性が向上することを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:12:08 GMT)
Unified Bayesian Frameworks for Multi-criteria Decision-making Problems [2.2] 本稿では,多基準意思決定(MCDM)問題に対処するためのベイズ的枠組みを紹介する。
提案するフレームワークは,グループ決定問題や基準相関などのMCDMの課題に対して,統計的にエレガントな解決策を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:24:50 GMT)
Generative AI for Object-Oriented Programming: Writing the Right Code and Reasoning the Right Logic [2.2] 大規模言語モデル (LLM) は、財務、常識知識グラフ、医学、視覚分析にまたがる様々な応用がある。
私たちの研究は、OOPタスクに関わる主要な利害関係者の視点からビジョンを提示することで、このギャップに対処することを目的としています。
さらに,既存の論理的推論とコード記述を強化し,最終的にプログラミング体験を向上させる方法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:38:17 GMT)
Leveraging commuting groups for an efficient variational Hamiltonian ansatz [2.1] 我々は、ハミルトニアン内の通勤群を用いた新しい回路設計を導入する。
量子化学ハミルトニアンの基底状態エネルギーを正確に決定する手法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:54:50 GMT)
Multimodal Fact Checking with Unified Visual, Textual, and Contextual Representations [2.1] 我々は"MultiCheck"と呼ばれる微細なマルチモーダル事実検証のための統一的なフレームワークを提案する。
我々のアーキテクチャは、テキストと画像のための専用エンコーダと、要素間相互作用を用いた相互関係をキャプチャする融合モジュールを組み合わせる。
我々はFactify 2データセットに対する我々のアプローチを評価し、F1の重み付けスコア0.84を達成し、ベースラインを大幅に上回った。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:36:53 GMT)
A Physiologically-Constrained Neural Network Digital Twin Framework for Replicating Glucose Dynamics in Type 1 Diabetes [2.1] 1型糖尿病(T1D)患者の血糖動態のシミュレーションは、パーソナライズされた治療を開発し、データ駆動型臨床決定を支援するために重要である。
本稿では、T1Dのグルコース動態をシミュレートするために、生理的ニューラルネットワーク(NN)デジタルツインを紹介する。
デジタル双生児の394例中, 血糖値は模擬データと観察データとで同等であった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:46:06 GMT)
JULI: Jailbreak Large Language Models by Self-Introspection [2.1] LLM(Large Language Models)は、悪意のあるコンテンツの生成を防ぐために、安全アライメントをトレーニングする。
トークンログの確率を操作することで,LDMをジェイルブレイクするJULI(Jailbreaking Using LLM Introspection)を提案する。
提案手法は,既存のSOTA(State-of-the-art)アプローチよりも優れた効果を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:17:38 GMT)
Optimization-Free Style Transfer for 3D Gaussian Splats [2.1] 本稿では,3次元ガウススプラットをスタイリングする再構成および最適化自由な手法を提案する。
フィードフォワード・サーフェスベースのスタイリング法を用いて、シーン内の個々のスプラットに補間する。
また、スプレートの高速なスタイリングが可能で、コンシューマグレードのハードウェアでも2分以内の速度を実現している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:35:01 GMT)
A Markov Decision Process Framework for Early Maneuver Decisions in Satellite Collision Avoidance [2.1] 本研究は衝突回避操作(CAM)のための意思決定をモデル化するためのマルコフ決定プロセス(MDP)フレームワークを提案する。
許容される衝突リスクの維持に加えて、早期の操縦決定を行うことにより、CAMの燃費を最小化することを目指す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:57:42 GMT)
Beyond Pixels: Medical Image Quality Assessment with Implicit Neural Representations [2.1] アーティファクトは、診断精度と下流分析に影響を及ぼす医療画像において重要な課題となる。
画像品質評価に暗黙的ニューラル表現(INR)を用いることを提案する。
本手法は合成人工物パターンを用いてACDCデータセットを用いて評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:00:06 GMT)
Deep Neural Networks with General Activations: Super-Convergence in Sobolev Norms [2.1] 本稿では,ソボレフ空間の一般利用および一般活性化関数を持つ深層完全連結ニューラルネットワークに対する包括的近似結果(Wn,infty$)を確立する。
導出速度は有限要素法やスペクトル法のような古典的数値近似法よりも高い。
この研究は、PDEに対するニューラルネットワークベースのアプローチに対する誤差推定理論の重大なギャップを埋め、科学計算に使用するための統一された理論的基盤を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:19:11 GMT)
FCBV-Net: Category-Level Robotic Garment Smoothing via Feature-Conditioned Bimanual Value Prediction [2.1] ロボット服用操作のカテゴリーレベルの一般化は、高次元性、複雑な力学、カテゴリー内変異による重要なハードルである。
衣服のスムース化のためのカテゴリーレベルポリシーの一般化を特に強化する特徴定義二元的価値ネットワーク(FCBV-Net)を提案する。
FCBV-Net条件は、事前訓練された、凍結された密集した幾何学的特徴に対するバイマニュアルアクション値の予測であり、カテゴリー内衣服の変動に対する堅牢性を保証する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:37:45 GMT)
Bench-2-CoP: Can We Trust Benchmarking for EU AI Compliance? [2.0] 現在のAI評価プラクティスは、確立されたベンチマークに大きく依存しています。
これらのツールは、新しい規制のランドスケープの焦点となるシステム的リスクを測定するために設計されたものではない。
この研究は、この「ベンチマーク・規制ギャップ」を定量化する緊急の必要性に対処する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:03:39 GMT)
The Missing Reward: Active Inference in the Era of Experience [2.0] アクティブ推論(AIF)は、自律型AIエージェントを開発する上で重要な基盤を提供する。
AIFは、自由エネルギーを最小化するために、外部の報酬信号を本質的な駆動に置き換えることができる。
この合成は、計算と物理の両方の制約に固執しながら自律的に開発できるAIシステムへの魅力的な道を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:57:12 GMT)
A Framework for Inherently Safer AGI through Language-Mediated Active Inference [2.0] 本稿では,アクティブ推論の原理とLarge Language Models(LLM)を組み合わせることにより,安全な人工知能(AGI)を開発するための新しい枠組みを提案する。
本稿では,透過的信念表現と階層的価値アライメントを通じて,安全保証をシステムの中核設計に統合するアーキテクチャを提案する。
このアーキテクチャはマルチエージェントシステムを実装しており、エージェントはアクティブ推論の原則に従って自己組織化される。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:28:54 GMT)
Improving Masked Style Transfer using Blended Partial Convolution [1.9] 本稿では,部分畳み込みに基づくスタイル伝達ネットワークを提案し,そのスタイル特徴を興味のある領域にのみ適用する。
このことは,SA-1Bデータセットの例を用いて,視覚的,定量的にスタイリングを改善することを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:35:44 GMT)
Segmenting the Complex and Irregular in Two-Phase Flows: A Real-World Empirical Study with SAM2 [1.9] 多相流中のガス気泡の分別は、多くの産業環境において重要な課題であるが未解決の課題である。
従来のアプローチ、そして最近の学習に基づく手法は、ほぼ球形の形状を仮定し、バブルが変形、合体、崩壊する状況においてその効果を制限している。
我々は、転送学習問題として、初めて、微調整されたセグメンテーションモデルSAM v2.1が、100個の注釈付き画像を用いて、高度に不規則なバブル構造を正確にセグメント化できることを実証した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:17:46 GMT)
Human-AI Schema Discovery and Application for Creative Problem Solving [1.8] 私のPh.D.研究は、人間-AIスキーマの発見と応用のためのフレームワークを開発している。
私は抽象スキーマよりもユーザを意識的に支援するシステムを設計します。
この研究は、スキーマ誘導インタラクションが暗黙の知識をよりアクセスしやすくする方法についての洞察を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:55:52 GMT)
Unified Linear Parametric Map Modeling and Perception-aware Trajectory Planning for Mobile Robotics [1.7] 本稿では,高次元空間にデータをマッピングする軽量な線形パラメトリックマップを提案する。
UAVでは,Euclidean Signed Distance Field (ESDF) マップを用いた。
UGVでは、モデルは地形を特徴づけ、クローズドフォーム勾配を提供し、オンラインプランニングによって大きな穴を回避できる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:10:42 GMT)
A full dichotomy for Holant$^c$, inspired by quantum computation [1.7] 我々は、量子情報理論を用いて、簡潔な方法でホラント問題の結果を説明する。
我々は2つの新しい二分法を導出する: 1つは新しい問題の族のためのもので、Holant$+$と呼び、これに基づいてHolant$c$の完全な二分法を構築する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:14:35 GMT)
Supervised Machine Learning Methods with Uncertainty Quantification for Exoplanet Atmospheric Retrievals from Transmission Spectroscopy [1.7] 本稿では,既存の機械学習回帰手法の体系的研究について述べる。
送信スペクトルから外惑星の大気パラメータを抽出するための性能の比較を行った。
WASP-39bのJWST観測のケーススタディにおいて,MLモデルと前処理方式の最良の組み合わせが検証された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:28:21 GMT)
Can Language Models Critique Themselves? Investigating Self-Feedback for Retrieval Augmented Generation at BioASQ 2025 [1.7] RAGと「ディープリサーチ」システムは、大規模言語モデル(LLM)が反復的に出力を洗練する自律的な探索プロセスの実現を目的としている。
これらのシステムを、生物医学研究のようなドメイン固有の専門的な検索に適用することは、課題を提示する。
本研究では,この反復的自己補正によって性能が向上し,推論モデルがより有用なフィードバックを生成できるかどうかを検討した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:13:19 GMT)
Situated Epistemic Infrastructures: A Diagnostic Framework for Post-Coherence Knowledge [1.7] 本稿では,ポストコヒーレンス条件下での知識の権威化を診断するための診断ツールとして,Situated Epistemic Infrastructuresフレームワークを紹介した。
本論文は,AIガバナンス,知識生産,情報システムの倫理的設計に関する議論に,学術コミュニケーションの表現主義モデルに対する堅牢な代替手段を提供することによって貢献する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:08:23 GMT)
Inequality in the Age of Pseudonymity [1.6] ジニ係数のような不平等対策は、政策決定を通知し動機づけするために用いられる。
私たちは、インターネットベースのプラットフォームやブロックチェーンベースのプラットフォームに共通する、匿名設定での対策方法を分析します。
一部のアクターはプライバシーを守るためにそうするかもしれませんが、これは不平等な指標を意図せずに歪めてしまう可能性があることを示しています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:21:33 GMT)
Exploring the Feasibility of Deep Learning Techniques for Accurate Gender Classification from Eye Images [1.6] 眼周囲領域は、まぶた、まぶた、それらの間の領域を含む、目を取り巻く領域を指す。
それは、性別分類のための重要な特徴を抽出するために使用できる貴重な視覚的手がかりを含んでいる。
本稿では,色画像データベースを用いた高度な畳み込みニューラルネットワーク(CNN)モデルを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:52:35 GMT)
A Study of Gender Classification Techniques Based on Iris Images: A Deep Survey and Analysis [1.6] ジェンダーの分類は、監視と監視、企業プロファイリング、人間とコンピュータの相互作用など、様々な応用において魅力的なものである。
個人の身元は性別に関する情報から判断されることがあるが、これは柔らかい生体認証の一種である。
最も有名なものは、顔、指紋、ヤシ紋、DNA、耳、歩行、虹彩などの物理的特徴に基づいている。
本研究は,既存の性別分類手法の知識と分析を研究者に提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:33:40 GMT)
Efficient optimization of expensive black-box simulators via marginal means, with application to neutrino detector design [1.6] 本稿では,BOMM(Marginal Means)アプローチによるブラックボックス最適化を提案する。
BOMMはグローバル$mathbfx*$の新しい推定器を使用し、高次元の限られたランで効率的に推論できる。
BOMMは最適化に一貫性があることが示されるが、既存の手法が直面する「次元の商」を誘惑する最適化率も示している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:33:16 GMT)
NT-ML: Backdoor Defense via Non-target Label Training and Mutual Learning [1.6] ディープニューラルネットワーク(DNN)は、バックドア攻撃に対して脆弱である。
本稿では,Non-target label Training and Mutual Learning (NT-ML) という新しい防衛機構を提案する。
NT-MLは、少数のクリーンサンプルで6つのバックドア攻撃に対して効果的に防御でき、5つの最先端のバックドア防御より優れている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:56:54 GMT)
Resistance Technologies: Moving Beyond Alternative Designs [1.5] この危機に対処するには、現在のオンラインサービスに対する持続可能な代替手段の開発以上のものが必要であると我々は主張する。
我々は「保護」を軍事防衛の観点からではなく、西洋諸国が主張することを望んでおり、主権の一部として識別する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:09:08 GMT)
Iterative Learning of Computable Phenotypes for Treatment Resistant Hypertension using Large Language Models [1.5] 大規模言語モデル (LLM) は、医学的質問応答とプログラミングに顕著な能力を示した。
複雑度の異なる6種類の臨床的表現型に対して,LSMsが正確かつ簡潔なCPを生成できるかどうかを検討した。
この結果から,LLMと反復学習が組み合わさって,解釈可能かつ合理的なプログラムを生成できることが示唆された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:15:17 GMT)
ShikkhaChain: A Blockchain-Powered Academic Credential Verification System for Bangladesh [1.5] ShikkhaChainはブロックチェーンによる証明書管理プラットフォームで、学術的資格情報の安全な発行、検証、無効化を目的としている。
プロトタイプは信頼性の向上,検証時間の短縮,バングラデシュの国際的信頼性の向上を実証した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:35:12 GMT)
Nemori: Self-Organizing Agent Memory Inspired by Cognitive Science [1.5] 人間の認知原理に触発された,新たな自己組織型メモリアーキテクチャであるNemoriを紹介する。
ネモリの中核的な革新は、会話の流れを意味的に一貫性のあるエピソードに自律的に整理するトップダウン手法である。
ネモリは最先端のシステムよりも優れており、その利点は特に長い文脈で顕著である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:39:56 GMT)
ATLANTIS at SemEval-2025 Task 3: Detecting Hallucinated Text Spans in Question Answering [1.5] 大規模言語モデル(LLM)は、かなり進歩した自然言語生成(NLG)を持つが、幻覚を受けやすいままであり、誤ったあるいは誤解を招くコンテンツを生成する。
本稿では,ATLANTISチームによるSemEval-2025タスク3への貢献について,質問応答システムにおける幻覚テキストスパンの検出に焦点をあてる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:15:15 GMT)
Improved DDIM Sampling with Moment Matching Gaussian Mixtures [1.5] 本稿では,Gaussian Mixture Model (GMM) を逆遷移演算子 (カーネル) として,DDIM(Denoising Diffusion Implicit Models) フレームワーク内で提案する。
我々は,GMMのパラメータを制約することにより,DDPMフォワードの1次と2次の中心モーメントを一致させる。
以上の結果から, GMMカーネルを使用すれば, サンプリングステップ数が少ない場合に, 生成したサンプルの品質が大幅に向上することが示唆された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:49:13 GMT)
Proof-of-Useful-Work Blockchain for Trustworthy Biomedical Hyperdimensional Computing [1.4] 私たちはHDCoinを紹介します。これは超次元コンピューティング(HDC)のための最初の実用的ブロックチェーンフレームワークです。
HDCoinでは,従来の省エネルギーマイニングプロセスを,高精度で信頼性が高く検証可能な超次元モデルを開発するための競争的なプロセスに変換する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:51:06 GMT)
Multi-Modal Multi-Behavior Sequential Recommendation with Conditional Diffusion-Based Feature Denoising [1.4] 本稿では,マルチモーダルマルチビヘイビアシーケンシャルレコメンデーションの問題に焦点をあてる。
マルチモーダルマルチビヘイビアシーケンスレコメンデーションモデル(M$3$BSR)を提案する。
実験結果から,M$3$BSRはベンチマークデータセット上で既存の最先端手法を著しく上回ることがわかった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:58:34 GMT)
Embedding Alignment in Code Generation for Audio [1.4] LLMによるコード生成は、ライブコーディングのような創造的なコーディング努力に革命をもたらす可能性がある。
本稿では,コードオーディオ埋め込みアライメントマップを構築することで,出力オーディオの埋め込みを予測するモデルを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:13:42 GMT)
Dimension Reduction via Random Projection for Privacy in Multi-Agent Systems [1.4] マルチエージェントシステムでは、個々のエージェントが環境の様々な側面を観察し、その情報を中央エンティティに送信する。
クラウドソースによる交通監視システムでは、通勤者は現在の速度だけでなく、位置情報などの機密情報を共有して、より正確な経路予測を可能にする。
本稿では,共有データの衛生化にロバストな概念を活かした圧縮に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:52:43 GMT)
CSRAP: Enhanced Canvas Attention Scheduling for Real-Time Mission Critical Perception [1.4] エッジプラットフォーム上でのリアルタイム認識は、厳格なレイテンシ制約の下で高解像度のオブジェクト検出を実行するという、中核的な課題に直面します。
本論文は, (i) 可変サイズキャンバスフレームと (ii) 選択可能なキャンバスフレームレートを用いて, 従来のキャンバスに基づくアテンションスケジューリング文献を拡張した。
我々の結果は、追加の自由度が達成可能な品質/コストのトレードオフを改善することを示している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:03:50 GMT)
Don't Reach for the Stars: Rethinking Topology for Resilient Federated Learning [1.3] フェデレートラーニング(FL)は、データをローカルに保つことでデータのプライバシを保護しながら、分散クライアント間で協調的なモデルトレーニングを可能にする。
従来のFLアプローチは、中央サーバがクライアントからモデル更新を集約する、集中型の星型トポロジーに依存しています。
本稿では,P2P (P2P) FLフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:10:37 GMT)
Hybrid quantum tensor networks for aeroelastic applications [1.3] 量子機械学習(QML)のパワーを活用したハイブリッド量子テンソルネットワークのエアロ弾性問題への適用について検討する。
本研究は,ハイブリッド量子テンソルネットワークによる二項分類の精度向上を実証するものである。
離散変数の回帰における有望な性能を観察する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:00:18 GMT)
Advanced Hybrid Transformer LSTM Technique with Attention and TS Mixer for Drilling Rate of Penetration Prediction [1.2] 掘削作業の最適化には, 浸透速度(ROP)が重要である。
伝統的な経験的、物理学的、基礎的な機械学習モデルは、複雑な時間的および文脈的関係を捉えないことが多い。
本稿では,Long Short-Term Memory(LSTM)ネットワーク,Transformerエンコーダ,Time-Series Mixer(TS-Mixer)ブロックを統合するハイブリッドディープラーニングアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:45:56 GMT)
Enabling On-Device Medical AI Assistants via Input-Driven Saliency Adaptation [1.2] 大規模言語モデル(LLM)は、医療シナリオに重大な影響を与えるが、エッジデバイスなどのリソース制約のあるリアルタイム環境へのデプロイには、違法に大きいままである。
汎用圧縮フレームワークによって最適化された新しい医療アシスタントシステムを導入し,LLMを専門分野への展開に適したものにする。
ドメイン固有データに対するニューロンの塩分濃度を計測することにより、無関係なニューロンを積極的にプーンし、性能を保ちながらモデルサイズを小さくすることができる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:57:45 GMT)
Adaptive Collocation Point Strategies For Physics Informed Neural Networks via the QR Discrete Empirical Interpolation Method [1.2] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)に関する前方および逆問題の解法として注目されている。
均一なランダムサンプリングや等間隔グリッドのような固定サンプリング手法は、高い解勾配を持つ臨界領域の捕捉に失敗し、複雑なPDEに対する有効性を制限できる。
QR-DEIM(QR Discrete Empirical Interpolation Method)を用いて,非線形関数を効率的に近似する低次モデリング手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:32:05 GMT)
Accelerating Conditional Prompt Learning via Masked Image Modeling for Vision-Language Models [1.2] CLIPのようなビジョン言語モデル(VLM)はゼロショット学習に優れていますが、新しいタスクに適応するためにはリソース集約的なトレーニングが必要です。
本稿では,マスク付き画像モデリング(MIM)を既存のVLMパイプラインに統合することにより,条件付きプロンプト学習を強化するプラグイン・アンド・プレイフレームワークであるProMIMを紹介する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:08:31 GMT)
Textual Inversion for Efficient Adaptation of Open-Vocabulary Object Detectors Without Forgetting [1.2] Textual Inversion (TI)は、VLM語彙を拡張して、新しいトークンを学習したり、既存のトークンを改善したりすることで、新しいオブジェクトやきめ細かいオブジェクトを、わずか3つの例から正確に検出することができる。
記憶と勾配の計算はトークンの埋め込み次元に限られており、フルモデルの微調整よりも大幅に少ない計算を必要とする。
本手法が,様々な量的,定性的実験において,忘れることに苦しむベースライン手法に適合するか否かを評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:28:08 GMT)
Video Soundtrack Generation by Aligning Emotions and Temporal Boundaries [1.2] EMSYNCはビデオベースのシンボリック音楽生成モデルであり、音楽とビデオの感情的内容と時間的境界を一致させる。
本研究では,音節をシーンカットで予測・調整できる新しい時間的条件付け機構である境界オフセットを導入する。
主観的聴取テストにおいて、EMSYNCは、音楽理論を意識した参加者だけでなく、一般の聴取者に対しても、すべての主観的尺度で最先端のモデルより優れている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:29:23 GMT)
Navigating the Trade-off: A Synthesis of Defensive Strategies for Zero-Shot Adversarial Robustness in Vision-Language Models [1.2] この領域における主要な課題は、敵の堅牢性を高め、モデルのゼロショット機能を維持することの間の本質的にのトレードオフである。
本稿では、モデルパラメータを修飾するAFT(Adversarial Fine-Tuning)と、それらを保存するトレーニングフリー/テストタイムディフェンスの2つの主要な防御パラダイムを分析する。
我々は、ハイブリッド防衛戦略や敵の事前訓練を含む重要な課題と今後の方向性を特定する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:26:10 GMT)
Quantum State Preparation for Medical Data: Comprehensive Methods, Implementation Challenges, and Clinical Prospects [1.2] 量子コンピューティングは医療応用には変革の可能性を秘めているが、複雑な医療データから効率的に量子状態を作成することは根本的な課題である。
この調査は、医学情報を量子システムにエンコードするための現在のアプローチを包括的に検証する。
テンソルネットワークの分解、変分量子アルゴリズム、量子機械学習技術、医療コンピューティングのための特殊なエラー軽減戦略について論じる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:29:06 GMT)
Identifiability of the minimum-trace directed acyclic graph and hill climbing algorithms without strict local optima under weakly increasing error variances [1.1] ガウス線型構造方程式モデルにおける真基底非巡回グラフ(DAG)が最小トレースDAGと同定可能であることを証明した。
計算面では、ランダム・ト・ランドム(R2R)近傍のヒルクライミングアルゴリズムが厳密な局所最適化を含まないことを証明している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:01:02 GMT)
Surformer v1: Transformer-Based Surface Classification Using Tactile and Vision Features [1.1] Surformer v1は、構造化された触覚特徴とResNet-50を介して抽出されたPCAによる視覚的埋め込みを用いて、表面分類のために設計されたトランスフォーマーベースのアーキテクチャである。
このモデルは、触覚固有のエンコーダとモーダルなアテンション層を統合し、視覚とタッチの間のリッチな相互作用を可能にする。
我々はSurformer v1とMultimodal CNNの両方を訓練し、特徴ベースと画像ベースのマルチモーダル学習が分類精度と計算効率に与える影響について検討した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:59:33 GMT)
Logical accreditation: a framework for efficient certification of fault-tolerant computations [1.1] 論理量子ビット上で実行される量子計算を効率的に認証するフレームワークである論理認証を導入する。
我々のプロトコルは一般的なノイズモデルに対して堅牢であり、一般に量子誤り訂正符号の性能解析で考慮されるものよりもはるかに多い。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:53:05 GMT)
Robustness of data-driven approaches in limited angle tomography [1.1] 本研究では,データ駆動型アプローチが従来のフィルタバックプロジェクション手法と比較して,安定して多くの情報を再構築できるという数学的説明を与える。
さらに、U-Netニューラルネットワークに基づく実験を用いて、理論の検証を行う。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:29:30 GMT)
TSMS-SAM2: Multi-scale Temporal Sampling Augmentation and Memory-Splitting Pruning for Promptable Video Object Segmentation and Tracking in Surgical Scenarios [1.1] 本稿では,高速物体運動とメモリ冗長性の課題に対処して,手術ビデオにおけるVOSTの高速化を実現する新しいフレームワークであるTSMS-SAM2を提案する。
TSMS-SAM2は、動作変動に対する堅牢性を改善するためのマルチ時間スケールビデオサンプリング強化と、過去のフレーム機能を整理・フィルタリングするメモリ分割・プルーニングメカニズムの2つの主要な戦略を導入している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:11:15 GMT)
A quantum computing approach to efficiently simulating correlated materials using impurity models and dynamical mean field theory [1.0] 本研究では,量子コンピュータ上でのDMFT計算のためのフレームワークを提案する。
本稿では,ガウス部分空間を用いたDMFTアルゴリズムの収束性を示すとともに,回路圧縮のハードウェア実現可能性を示す。
我々は、物質科学における量子コンピューティングのこのユースケースの実現に向けた潜在的な道筋について論じる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:00:01 GMT)
Adam assisted Fully informed Particle Swarm Optimization ( Adam-FIPSO ) based Parameter Prediction for the Quantum Approximate Optimization Algorithm (QAOA) [1.0] 量子近似最適化アルゴリズム(Quantum Approximate Optimization Algorithm, QAOA)は、マックス・カット問題などの最適化問題の解法として用いられる顕著な変分アルゴリズムである。
QAOAの重要な課題は、高品質なソリューションにつながる適切なパラメータを効率的に特定することである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:11:01 GMT)
Point cloud segmentation for 3D Clothed Human Layering [1.0] 3Dクロースモデリングとシミュレーションは、ファッション、エンターテイメント、アニメーションなど、いくつかの分野でアバターの作成に不可欠である。
本稿では,各3次元点を異なる層に同時に関連付けることのできる,新しい3次元点雲分割パラダイムを提案する。
私たちは、非常にリアルな3Dスキャンを、関連する衣服層の基礎的な真実でシミュレートする、新しい合成データセットを作成します。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:02:15 GMT)
Streamlining Admission with LOR Insights: AI-Based Leadership Assessment in Online Master's Program [1.0] LORI: LOR Insightsは、オンラインマスターのプログラム申請者が提出したLORのリーダーシップスキルを評価するための、AIベースの新しい検出ツールです。
我々の最新のRoBERTaモデルは、重み付けされたF1スコア91.6%、精度92.4%、リコール91.6%を達成し、テストデータに強い一貫性を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:46:59 GMT)
RL-MoE: An Image-Based Privacy Preserving Approach In Intelligent Transportation System [1.0] 感性のある視覚データをプライバシ保護されたテキスト記述に変換する新しいフレームワークであるRL-MoEを提案する。
私たちの仕事は、プライバシに敏感なドメインで信頼できるAIシステムを構築するための実用的でスケーラブルなソリューションを提供します。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:07:54 GMT)
Textual and Visual Guided Task Adaptation for Source-Free Cross-Domain Few-Shot Segmentation [1.0] Few-Shot(FSS)は、ラベル付きサンプルが少ない新しいオブジェクトのセグメンテーションを効率的にすることを目的としている。
このような性能劣化を軽減するため,クロスドメインFew-Shot(CD-FSS)を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:48:24 GMT)
Teaching Introduction to Programming in the times of AI: A case study of a course re-design [0.9] 近年、AIツールのプログラミング教育への統合がますます広まりつつある。
本稿では、プログラミング、特に入門コースの文脈において、プログラミングの教育と学習に利用できる最先端のAIツールについてレビューする。
コース設計、学習目標、コース提供、形式的・要約的評価の課題と、学生によるそのようなツールの誤用を強調します。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:56:19 GMT)
Energy Optimized Piecewise Polynomial Approximation Utilizing Modern Machine Learning Optimizers [0.9] カムプロファイルにおける弾性ひずみエネルギーを最小限に抑える枠組みを導入し,よりスムーズな運動を実現する。
実験により本手法の有効性が確認され, エネルギー消費に対する近似品質の可能性が確認された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:57:18 GMT)
The SMeL Test: A simple benchmark for media literacy in language models [0.9] 我々は、最小限のベンチマークであるSynthetic Media Literacy Test (SMeL Test)を導入する。
我々は、推論モデルを含む、よく使われる命令チューニング LLM のベンチマークを行い、どのモデルも一貫して成功しないことを示した。
私たちの仕事は、この重要な幻覚にもっと光を当て、それと戦うための新しい方法の開発を導くことを願っています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:54:11 GMT)
LATTE: Learning Aligned Transactions and Textual Embeddings for Bank Clients [0.9] LATTEは、生のイベント埋め込みと凍結した言語モデルからのセマンティック埋め込みを整合させる、対照的な学習フレームワークである。
提案手法は,実世界の財務データセット上でのイベントシーケンス表現の学習において,最先端技術よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:46:38 GMT)
Style-Preserving Policy Optimization for Game Agents [0.9] MMPPO(Mixed Proximal Policy Optimization)は、異なるスタイルを維持しながら、既存の準最適エージェントの能力を向上させるように設計されている。
MPPOは、デモ参加者のプレイスタイルを保ちながら、純粋なオンラインアルゴリズムに匹敵する、あるいはそれより優れている熟練度を達成している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:00:32 GMT)
Tiny-BioMoE: a Lightweight Embedding Model for Biosignal Analysis [0.9] The textitSecond Multimodal Sensing Grand Challenge for Next-Gen Pain Assessment (AI4PAIN)に提出された。
提案手法は,生体信号解析のための軽量な事前学習型埋め込みモデルである textitTiny-BioMoE を導入する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:01:54 GMT)
Multi-Representation Diagrams for Pain Recognition: Integrating Various Electrodermal Activity Signals into a Single Image [0.9] The textitSecond Multimodal Sensing Grand Challenge for Next-Gen Pain Assessment (AI4PAIN)に提出された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:23:02 GMT)
Efficient Pain Recognition via Respiration Signals: A Single Cross-Attention Transformer Multi-Window Fusion Pipeline [0.9] The textitSecond Multimodal Sensing Grand Challenge for Next-Gen Pain Assessment (AI4PAIN)に提出された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:25:19 GMT)
Synthetic Data Generation for Emotional Depth Faces: Optimizing Conditional DCGANs via Genetic Algorithms in the Latent Space and Stabilizing Training with Knowledge Distillation [0.8] 知識蒸留(EMA教師モデル)を最適化したGANを用いた合成深度顔生成フレームワークを提案する。
また、画像統計に基づいてGAN潜伏ベクトルを進化させ、ターゲット感情の多様性と視覚的品質を高めるために遺伝的アルゴリズムを適用した。
分類では, LBP, HOG, Sobel edge, 強度ヒストグラムの特徴を抽出し, XGBoostで94%, 96%の精度で抽出した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:00:13 GMT)
RLHF Fine-Tuning of LLMs for Alignment with Implicit User Feedback in Conversational Recommenders [0.8] マルチターンレコメンデーションコンテキストにおいて,インプリッドユーザフィードバック(IUF)を最大化するために,ヒューマンフィードバック強化学習(RLHF)を用いた微調整ソリューションを提案する。
RLHF-fine-tuned モデルでは, (arrow-zero-cmwrquca-teja-falset ensuite 2Round group-deca States penalty と比較して, 推薦精度, コヒーレンス, ユーザ満足度が向上することを示した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:36:55 GMT)
FlowState: Sampling Rate Invariant Time Series Forecasting [0.8] FlowStateは、新しい時系列基礎モデル(TSFM)アーキテクチャである。
本質的に全ての可能な時間分解能を一般化し、予測する地平線を動的に調整する。
GIFT-ZSとChronos-ZSベンチマークの最先端である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:30:26 GMT)
Cumulative Learning Rate Adaptation: Revisiting Path-Based Schedules for SGD and Adam [0.8] 適応学習速度機構は、損失ランドスケープに応じてステップサイズを動的に調整する。
我々は,2017年に提案された累積経路に基づく適応方式を再検討し,観測経路長の相違に基づく学習率の調整を行った。
このような適応戦略が実際的利益をもたらす時期と理由を明らかにすることを目的としている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:59:47 GMT)
Decision-focused predictions via pessimistic bilevel optimization: complexity and algorithms [0.7] 我々は最近の意思決定中心の予測、すなわち予測モデルの構築への取り組みに貢献する。
NP のメンバシップを含む問題の計算結果を示す。
次に,経験的トラクタビリティを実現するために,様々な計算手法を定式化する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:17:10 GMT)
Human Activity Recognition from Smartphone Sensor Data for Clinical Trials [0.7] 歩行と非歩行を最小限のオーバーヘッドで検出できるResNetに基づく人間行動認識モデルを開発した。
このモデルは、成人健常者(HC)と障害拡張状態尺度(EDSS)スコアが0.0-6.5の多発性硬化症(PwMS)のスマートフォンセンサデータを用いて、訓練および評価を行った。
HARモデルは、GaitLabデータセットとRocheデータセットの歩行と非歩行のアクティビティをそれぞれ98.4%と99.6%の精度で検出した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:11:22 GMT)
PRvL: Quantifying the Capabilities and Risks of Large Language Models for PII Redaction [0.7] 非構造化テキストからのPII(Personally Identible Information)のリアクションは、規制されたドメインにおけるデータのプライバシを確保するために重要である。
大規模言語モデル(LLM)の最近の進歩は、有望な代替手段を提供する。
プライバシ保護型PIIリアクションシステムとしてLLMを包括的に分析する。
我々はPRvLをリリースした。PRvLは細調整されたモデルと汎用PIIリアクションのための評価ツールである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:22:49 GMT)
The vast world of quantum advantage [0.7] 量子技術の核心は量子の優位性を見極めることにある。
予測可能性,典型性,堅牢性,妥当性,有用性という5つのキーストーン特性について検討する。
量子的優位性は、古典的な資源だけでは本質的に予測できないことを証明している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:26:26 GMT)
HiSTM: Hierarchical Spatiotemporal Mamba for Cellular Traffic Forecasting [0.7] 両空間エンコーダとマンバに基づく時間モジュールとアテンション機構を組み合わせた階層型時空間マンバ(HiSTM)を提案する。
HiSTMは、ネットワークトラフィックの空間的および時間的パターンをキャプチャするために、選択的な状態空間法を用いる。
我々は、HiSTMが様々なデータセットにまたがってうまく一般化し、より長い時間ホライズンよりも精度が向上することを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:18:18 GMT)
Optimal Growth Schedules for Batch Size and Learning Rate in SGD that Reduce SFO Complexity [0.7] 計算勾配法におけるバッチサイズと学習速度のスケジューリングは効率を低下させ、収束を損なう。
理論的には,SFOの複雑性を低減させるバッチサイズと学習率の最適な成長スケジュールを導出した。
本結果は,ディープラーニングにおける大規模バッチ学習をスケーラブルかつ効率的に行うための理論的知見と実践的ガイドラインの両方を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:52:25 GMT)
Adaptive Batch Size and Learning Rate Scheduler for Stochastic Gradient Descent Based on Minimization of Stochastic First-order Oracle Complexity [0.7] ミニバッチ勾配降下(SGD)の収束挙動はバッチサイズと学習速度設定に非常に敏感である。
最近の理論的研究により、第一次オラクルの複雑さを最小限に抑える臨界バッチサイズの存在が確認されている。
臨界バッチサイズに関する理論的な知見を生かしたSGDを高速化するための適応スケジューリング戦略が導入された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:00:53 GMT)
H-Net++: Hierarchical Dynamic Chunking for Tokenizer-Free Language Modelling in Morphologically-Rich Languages [0.7] H-NET++は階層的な動的チャンキングモデルであり、エンドツーエンドのトレーニングを通じて言語的にインフォームドされたセグメンテーションを学ぶ。
1.4Bのペルシャコーパスでは、H-NET++は最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:59:01 GMT)
Current comparator for both AC and DC ratio measurements with 10-8-level accuracy [0.7] 窒素空洞中心を用いたダイヤモンド磁気センサを内蔵した小型室温交流/DCコンパレータを提案する。
この装置は、AC信号とDC信号の両方に対して10-8の精度を実現し、300Hzまでのシステム帯域幅をサポートする。
この統合された低温無解は精度と汎用性を向上するだけでなく、量子電気標準におけるDC抵抗ブリッジへの適用性も拡大する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:18:04 GMT)
Artificial Intelligence-Based Classification of Spitz Tumors [0.7] 従来の黒色腫と非定型的組織像の重複が原因で診断に難渋している。
従来の黒色腫とSpitz腫瘍を鑑別し, 組織学的, 臨床的特徴を用いたAIモデルの有効性を検討した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:41:04 GMT)
Stochastic Trace Optimization of Parameter Dependent Matrices Based on Statistical Learning Theory [0.6] すべての$boldsymbolthetainTheta$に対して$texttrace(boldsymboltheta)$を最小化するモンテカルロ推定器を提案する。
エプシロンネットとジェネリック連鎖に基づく2種類の境界を導出する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:23:13 GMT)
Periodic evaluation of defined-contribution pension fund: A dynamic risk measure approach [0.6] 本稿では,定義拠出年金基金の定期的評価のための革新的枠組みを紹介する。
我々は、動的リスク尺度を基準とし、年金基金のテールリスクを動的に管理する。
米国のデータを用いて、私たちはリー・カーターモデルを通じて年金メンバーの死亡率と死亡率の予測を調整します。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:31:01 GMT)
Probabilities of Chat LLMs Are Miscalibrated but Still Predict Correctness on Multiple-Choice Q&A [0.6] チャット用に微調整された15の大規模言語モデル(LLM)について検討する。
最大ソフトマックス確率 (MSPs) は, 多重選択Q&Aにおいて常に誤校正される。
この仮説は、基礎となるQ&Aタスクでよく機能するモデルに対して成り立つことを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:33:12 GMT)
ANPrompt: Anti-noise Prompt Tuning for Vision-Language Models [0.6] 本稿では,ノイズ摂動下でのロバスト性向上のための新しいプロンプトチューニングフレームワークであるANPromptを提案する。
ANPromptは、オリジナルとノイズの混在したテキストを融合して弱いノイズテキスト機能を構築し、それをクラスタ化してノイズプロンプトを形成する。
11ベンチマークの実験では、ANPromptが既存のプロンプトチューニングアプローチを一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:50:06 GMT)
Deep Learning Methods for Detecting Thermal Runaway Events in Battery Production Lines [0.6] オランダの自動車メーカーであるVDL Nedcar のバッテリ生産ラインにおけるサーマルランウェイ検出におけるディープラーニングの適用について検討した。
生産ラインからデータを収集し、ベースライン(非熱流出)と熱流出条件の両方を表現します。
データは光学画像と熱画像の両方で構成され、それを前処理して融合させた後、我々のモデルへの入力として機能した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:25:02 GMT)
Quantum Geometric Phases as a New Window on Gravitational Waves [0.6] 低周波重力波は、メソスコピック光学系において純粋に量子幾何学的な位相を誘導する。
本稿では,光モードの光子数状態がミラーの中心運動と絡み合うラムゼー型干渉計プロトコルを提案する。
この枠組みは低周波重力波モードを求めるための明確な量子的アプローチを確立し、時空ひずみに基づく従来の検出方法に代わるものである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 22:22:24 GMT)
Predicting the Lifespan of Industrial Printheads with Survival Analysis [0.5] 重要なデバイスコンポーネントの寿命を正確に予測することは、メンテナンス計画と生産最適化に不可欠である。
本研究では,キヤノン印刷による印刷ヘッドの寿命予測における生存分析の利用について検討する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:51:18 GMT)
An Effective Approach for Node Classification in Textual Graphs [0.5] 本稿では,TAPE(Text-Attributed Graph Representation Enhancement)とGraphormerを統合する新しいフレームワークを提案する。
提案手法は,論文の内容から意味的に豊かな説明を生成し,それを拡張ノード表現に融合させる。
我々は,本フレームワークの課題であるogbn-arxivデータセットに対する有効性を示し,分類精度0.772で最先端性能を実現した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:24:00 GMT)
Task complexity shapes internal representations and robustness in neural networks [0.5] ハードタスクモデルにおけるバイナライズ重みは精度を低下させるが、簡単なタスクモデルは頑健であることを示す。
また、二項化ハードタスクモデルにおける低次エッジのプルーニングは、性能の急激な位相遷移を示す。
これらの現象は、タスク複雑性のモデルおよびモダリティに依存しない尺度を定義する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:02:39 GMT)
A Study of the Framework and Real-World Applications of Language Embedding for 3D Scene Understanding [0.5] Gaussian Splattingはリアルタイム3Dシーン表現の変換技術として登場した。
複雑なシーンを高い忠実度でレンダリングする能力は、シーン再構築、ロボティクス、インタラクティブなコンテンツ作成といった領域をまたいだ進歩を可能にした。
本調査では,言語指導と3次元ガウススプラッティングを組み合わせた最近の研究成果について概説する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:33:08 GMT)
Towards Embodied Agentic AI: Review and Classification of LLM- and VLM-Driven Robot Autonomy and Interaction [0.5] 大規模言語モデル(LLM)や視覚言語モデル(VLM)を含む基礎モデルは、ロボットの自律性とヒューマンロボットインタフェースに対する新しいアプローチを実現した。
並行して、視覚言語行動モデル(VLA)や大きな行動モデル(BLM)は、ロボットシステムのデクスタリティと能力を高めている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:48:03 GMT)
MedPatch: Confidence-Guided Multi-Stage Fusion for Multimodal Clinical Data [0.5] 現実世界の医療データは本質的に異質であり、サイズは限られており、モダリティが欠如しているためスパースである。
臨床予測タスクにインスパイアされたMedPatchを導入し,複数のモダリティをシームレスに統合する。
我々は,MIMIC-IV,MIMIC-CXR,MIMIC-Notesデータセットから抽出した臨床時系列データ,胸部X線画像,放射線検査,および放電記録からなる実世界のデータを用いてMedPatchを評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:46:26 GMT)
SMOL-MapSeg: Show Me One Label [0.4] SMOL-MapSegはOND知識によって定義されたクラスを正確にセグメント化できることを示す。
数ショットの微調整によって、目に見えないクラスにも適応できる。
平均セグメンテーション性能では、UNetベースのベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:36:17 GMT)
Physical Scales Matter: The Role of Receptive Fields and Advection in Satellite-Based Thunderstorm Nowcasting with Convolutional Neural Networks [0.4] 最近の研究は、機械学習のバリューチェーンに対流を組み込むことで、レーダベースの降水流のスキルが向上したことを示している。
本研究は,衛星による雷雨の流星群への接近を初めて調査し,一般性について検討する。
本質的には、予報時において、今流に関係のある雷雨パターンが受容野に含まれることが保証される。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:12:40 GMT)
AdvDINO: Domain-Adversarial Self-Supervised Representation Learning for Spatial Proteomics [0.4] 自己教師付き学習(SSL)は、手動のアノテーションなしで視覚表現を学習するための強力なアプローチとして登場した。
本稿では,ドメイン逆転層をDINOv2アーキテクチャに統合し,ドメイン不変の特徴学習を促進するドメイン逆転型自己教師型学習フレームワークAdvDINOを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:51:54 GMT)
An ML-based Approach to Predicting Software Change Dependencies: Insights from an Empirical Study on OpenStack [0.4] 現代のソフトウェアシステムでは、依存関係はチーム間で複数のコンポーネントにまたがり、開発とデプロイメントの課題を生み出します。
2つのMLモデルを利用する半自動アプローチを提案する。
提案モデルでは,平均AUCスコアは79.33%,91.89%,Brierスコアは0.11,0.014であった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:16:29 GMT)
The Term 'Agent' Has Been Diluted Beyond Utility and Requires Redefinition [0.4] 人工知能における「エージェント」という言葉は、長い間、様々なサブフィールドにまたがって複数の解釈をしてきた。
AI機能、特に大規模言語モデルシステムにおける最近の発展は、この曖昧さを増幅している。
本稿では,エージェントとみなすシステムに対して,最小限の要件を明確に定義するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:40:25 GMT)
Detecting Model Misspecification in Cosmology with Scale-Dependent Normalizing Flows [0.4] 本稿では,スケール依存型ニューラルサプリメント統計と正規化フローを組み合わせた新しいフレームワークを提案する。
本稿では,3つのCAMELSシミュレーションスイートの物質密度場とガス密度場を用いたアプローチへの最初の適用例を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:00:09 GMT)
Method-Based Reasoning for Large Language Models: Extraction, Reuse, and Continuous Improvement [0.4] 本稿では,学習内容,生成応答,ユーザインタラクションから抽出した,大規模言語モデル(LLM)を明示的かつ再利用可能な手順で拡張する手法に基づくモデルを提案する。
我々のモデルは,次の予測を超える連続的な学習,手法の再利用,論理的一貫性を実現する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:14:31 GMT)
ImpliHateVid: A Benchmark Dataset and Two-stage Contrastive Learning Framework for Implicit Hate Speech Detection in Videos [0.4] ビデオに暗黙のヘイトスピーチ検出のための新しいデータセット、ImpliHateVidを導入する。
ImpliHateVidは、509本の暗黙のヘイトビデオ、500本の明示的なヘイトビデオ、1000本の非ヘイトビデオからなる2,009本のビデオで構成されている。
また,ビデオにおけるヘイトスピーチ検出のための2段階のコントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:57:22 GMT)
Domain-driven Metrics for Reinforcement Learning: A Case Study on Epidemic Control using Agent-based Simulation [0.3] 本研究では、最先端のメトリクスを構築しながら、RLのためのドメイン駆動メトリクスを開発している。
結果は、いくつかの異なるシミュレーションシナリオにおいて、伝統的な、そして最先端のメトリクスと一緒にドメイン駆動の報酬を使うことを示しています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:40:19 GMT)
Classical simulation of noisy quantum circuits via locally entanglement-optimal unravelings [0.3] ノイズ量子回路をシミュレーションするための並列化可能なテンソルネットワークに基づく古典的アルゴリズムを提案する。
我々のアルゴリズムは、行列積状態の特定のアンサンブルによるノイズ量子系の状態を表す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:00:20 GMT)
High-Dimensional Differentially Private Quantile Regression: Distributed Estimation and Statistical Inference [0.3] 分散環境での高次元データに対する微分プライベート量子回帰法を提案する。
我々は、反復的な更新を行い、ほぼ最適な統計精度と正式なプライバシー保証を確保する、微分プライベートな推定アルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:47:44 GMT)
Learning from Similarity-Confidence and Confidence-Difference [0.2] 複数の視点から補完的な弱監督信号を利用する新しい弱監視学習(WSL)フレームワークを提案する。
具体的には,2種類の弱いラベルを統合する手法であるSconfConfDiff Classificationを紹介する。
両推定器が推定誤差境界に対して最適収束率を達成することを証明した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:42:59 GMT)
Contrastive Representation Modeling for Anomaly Detection [0.2] 本研究では,学習中の正と負の関係を再定義し,これらの特性を明示的な異常ラベルを必要とせずに促進する構造的コントラスト目的を提案する。
本フレームワークは, 産業環境における局所的異常の検出を改善するために, パッチベースの学習評価戦略を用いて拡張する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:48:53 GMT)
Fair Play in the Newsroom: Actor-Based Filtering Gender Discrimination in Text Corpora [0.2] 本稿では,大規模テキストコーパスにおける性差別を検知・緩和するためのアクターレベルの拡張パイプラインを提案する。
本稿では,感情,統語的エージェンシー,引用スタイルの非対称性を捉える新しいアクターレベルのメトリクスを紹介する。
1980年から2024年までのドイツの新聞記事のtaz2024fullコーパスにアプローチを適用し,性別バランスを大幅に改善した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:43:58 GMT)
Enhancing PyKEEN with Multiple Negative Sampling Solutions for Knowledge Graph Embedding Models [0.2] 負のアサーションがない場合、埋め込みモデルは通常、様々な負のサンプリング戦略を用いて人工的に生成される。
知識グラフの埋め込みのための人気のあるライブラリのほとんどは、基本的な戦略のみをサポートし、高度なソリューションを欠いている。
我々はKGEフレームワークであるPyKEENの拡張を提供し、いくつかの高度な負のサンプルを統合しています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:24:34 GMT)
An MLI-Guided Framework for Subgroup-Aware Modeling in Electronic Health Records (AdaptHetero) [0.2] AdaptHeteroは、解釈可能性の洞察を実行可能なガイダンスに変換する、新しいMLI駆動のフレームワークである。
AdaptHeteroは、ICU死亡率、院内死亡率、隠された低酸素症を予測するための不均一なモデル挙動を一貫して明らかにしている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:08:12 GMT)
VerificAgent: Domain-Specific Memory Verification for Scalable Oversight of Aligned Computer-Use Agents [0.2] 未確認の記憶は、ユーザの意図や安全性の制約から逸脱することがある。
CUAのためのスケーラブルな監視フレームワークであるVerificAgentを紹介する。
VerificAgentはタスクの信頼性を改善し、幻覚による障害を低減し、解釈可能な監査可能なガイダンスを保持する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:48:01 GMT)
Quantum criticality and nonequilibrium dynamics on a Lieb lattice of Rydberg atoms [0.1] 中性原子量子シミュレータは、強く相互作用する多体系の探索に有望なアプローチを提供する。
我々は、リーブ格子上に配置されたレイドバーグ原子の配列を研究することによって、そのような量子シミュレータ上でアクセス可能な豊富な現象の集合を実証する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:00:00 GMT)
Can open source large language models be used for tumor documentation in Germany? -- An evaluation on urological doctors' notes [0.1] この評価は、腫瘍ドキュメンテーションプロセスの3つの基本的なタスクについて、11の異なるオープンソース言語モデル(LLM)をテストする。
モデルLlama 3.1 8B、Mistral 7B、Mistral NeMo 12Bはタスクにおいて相容れない性能を発揮した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:43:09 GMT)
A Context-aware Attention and Graph Neural Network-based Multimodal Framework for Misogyny Detection [0.1] ソーシャルメディア上の攻撃的なコンテンツの大部分は、女性に向けられている。
異性愛的・異性愛的なコンテンツを検出するための新しい枠組みを提案する。
このフレームワークは、Multimodal Attention Module (MANM)、Graph-based Feature Restruction Module (GFRM)、Content-specific Features Learning Module (CFLM)の3つのモジュールから構成されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:41:17 GMT)
Utilizing Composer Packages to Accelerate Laravel-Based Project Development Among Students: A Pedagogical and Practical Framework [0.1] 本稿では,プロのソフトウェアプラクティスを育成しながら開発労力を大幅に削減するComposerパッケージを紹介する。
このアプローチの中心は、コード品質の維持と概念的理解の強化です。
目標は開発を加速することにあるが、より深い目的は、プロフェッショナルな業界の準備を補強することである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:01:54 GMT)
FAITH: A Framework for Assessing Intrinsic Tabular Hallucinations in finance [0.1] 金融に大規模言語モデル(LLM)をデプロイする上で、幻覚は依然として重要な課題である。
金融LLMにおける内因性幻覚を評価するための厳密でスケーラブルなフレームワークを開発する。
私たちの仕事は、より信頼性が高く信頼性の高い財務生成AIシステムを構築するための重要なステップとして役立ちます。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:37:14 GMT)
Efficient Knowledge Graph Construction and Retrieval from Unstructured Text for Large-Scale RAG Systems [0.1] 企業環境にグラフベースの検索拡張生成(GraphRAG)をデプロイするためのスケーラブルで費用効率のよいフレームワークを提案する。
これらの結果は、現実の大規模エンタープライズアプリケーションにGraphRAGシステムをデプロイできる可能性を検証する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:41:28 GMT)
Vector Quantized-Elites: Unsupervised and Problem-Agnostic Quality-Diversity Optimization [0.0] 本稿では,構造化された行動空間グリッドを自律的に構築する新しい品質多様性アルゴリズムであるベクトル量子エリート(VQ-Elites)を紹介する。
VQ-Elitesのコアとなるのは、ベクトル量子化変分自動エンコーダの統合で、振る舞い記述子の動的学習を可能にする。
ロボットアームのポーズ取得,移動ロボットの空間探索,ミニグリッド探索におけるVQ-Elitesの有効性を検証した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:56:27 GMT)
VISTA: Vision-Language Imitation of Situational Thinking and Attention for Human-Like Driver Focus in Dynamic Environments [0.0] 運転者の視線の変化を自然言語でモデル化する視覚言語フレームワークを提案する。
提案手法は,低レベルキューとトップダウンコンテキストの両方を統合し,視線行動の言語による記述を可能にする。
その結果,微調整モデルでは,注目シフト検出や解釈可能性において汎用VLMよりも優れていた。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:01:43 GMT)
Using Sentiment Analysis to Investigate Peer Feedback by Native and Non-Native English Speakers [0.0] 本稿では,母国英語話者と母国英語話者の状況が,オンライン・コンピュータ・コースにおけるピアフィードバック経験の3つの指標にどのように影響するかを検討する。
その結果、母国英語話者はフィードバックを好ましくないが、母国英語話者はより肯定的に書くが、見返りに肯定的な感情を受けないことがわかった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:56:04 GMT)
Use of a genetic algorithm to find solutions to introductory physics problems [0.0] 導入物理問題に対するステップ・バイ・ステップの解を見つけるために,遺伝的アルゴリズムを用いる方法を示す。
これの根底にある課題は、必要な答えにつながる方程式の列を見つけることである。
本手法は,1次元キネマティクスを含む導入物理問題に対する解答に学生を導くことができることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:36:38 GMT)
ULU: A Unified Activation Function [0.0] ULUは正と負の入力を異なる方法で扱う。
ULUは画像分類やオブジェクト検出タスクでReLUとMishを大きく上回っている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:58:22 GMT)
Training chord recognition models on artificially generated audio [0.0] 本研究では,2つのトランスフォーマーベースニューラルネットワークモデルを用いて,音声録音におけるコードシーケンス認識について比較した。
実験により、人工的に生成された音楽と人間の構成音楽の間には複雑さと構造の違いがあるにもかかわらず、前者は特定のシナリオで有用であることが証明された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 22:01:58 GMT)
Towards integrated sensors for optimized OCT with undetected photons [0.0] 非線形Ti:LiNbO$_3$導波路に基づく未検出光子を用いたOCT測定手法を開発した。
どちらのスキームにおいても、検出されていない光子を28ドル(約28万円)の低分解能で測定し、ポンプゲインの最適化とOCT測定を行う。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:24:36 GMT)
Towards Transparent Ethical AI: A Roadmap for Trustworthy Robotic Systems [0.0] 本稿では、AI意思決定プロセスにおける透明性が、信頼性と倫理的に整合したロボットシステムの開発に不可欠である、と論じる。
透明性の実現における技術的,倫理的,実践的な課題について概説し,それを強化するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:49:16 GMT)
Towards Practical Quantum Phase Estimation: A Modular, Scalable, and Adaptive Approach [0.0] 本稿では,適応ウィンドウ量子位相推定(AWQPE)アルゴリズムを提案する。
AWQPEは、所望の精度を達成するのに必要なイテレーションの数を大幅に削減する。
我々の数値シミュレーションは、AWQPEの精度と堅牢性を示し、資源効率と計算速度の明確なバランスを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:35:02 GMT)
Third harmonic-mediated amplification in TWPA [0.0] 第3高調波は増幅性能を向上し、利得と帯域幅の両方を向上できることを示す。
最近開発されたプラズマ発振増幅器は、この効果を利用するのに特に適している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 11:51:28 GMT)
The Memory Wars: AI Memory, Network Effects, and the Geopolitics of Cognitive Sovereignty [0.0] 認知主権」とは、強力なAIシステムの時代において、個人、グループ、国家が自律的な思考を維持し、アイデンティティを保持する能力である。
認知的オフロードやアイデンティティ依存など,このようなシステムの心理的リスクを分析する。
これらの脅威に対処するため、メモリポータビリティ、透明性、主権認知基盤、戦略的アライアンスを中心にした政策枠組みを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:37:37 GMT)
Taming coherent noise with teleportation [0.0] コヒーレントエラーは、量子コンピューティングと量子誤り訂正におけるいくつかの新しい課題を示す。
コヒーレントエラーは、長い回路上で構成的に干渉し、パウリノイズと比較して全体の故障率を大幅に上昇させる。
コヒーレントエラー下でのQECの性能を数値的に推定することは困難である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:29:08 GMT)
System Security Framework for 5G Advanced /6G IoT Integrated Terrestrial Network-Non-Terrestrial Network (TN-NTN) with AI-Enabled Cloud Security [0.0] TN(Terrestrial Networks)とNTN(Non-Terrestrial Networks)の統合は、グローバル接続の展望を再定義している。
本稿では,AIネイティブクラウドセキュリティを備えた5G Advanced/6G IoT統合TN-NTNのための,新たなシステムレベルのセキュリティフレームワークを提案する。
このアプローチでは、ゼロトラストの原則、フェデレートされた学習、セキュアなオーケストレーション、階層化されたセキュリティフレームワーク、敵の脅威に対するレジリエンスを強調しています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:04:57 GMT)
Sprouting technology otherwise, hospicing negative commons -- Rethinking technology in the transition to sustainability-oriented futures [0.0] ICTは、持続可能性指向の未来に合わせて、根本的にリダイレクトされる必要がある。
本稿では、このリダイレクトをナビゲートするための概念的枠組みを提案する。
遺跡、幽霊、種、視覚の4つのカテゴリーが紹介されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:23:14 GMT)
Sparse Asymptotic PCA: Identifying Sparse Latent Factors Across Time Horizon in High-Dimensional Time Series [0.0] 本稿では、スパース主成分分析(APCA)を用いた新しいスパース潜在因子モデリングフレームワークを提案する。
スパースPCAをベースとした既存手法とは異なり,本手法は非スパース負荷を許容しながら,因子プロセスのスパース性を実証する。
我々は,新しい断面交叉検証法を用いて,時間的地平線上の危険因子の空間性を特定するためのデータ駆動型手法を開発した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 03:52:28 GMT)
SincVAE: A new semi-supervised approach to improve anomaly detection on EEG data using SincNet and variational autoencoder [0.0] 本研究では,脳波データからてんかん発作を検出するための半教師付きアプローチを提案する。
以上の結果から,SncVAEは脳波データにおける発作検出を改善し,早期発作の早期発見と術後経過のモニタリングが可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:33:41 GMT)
Simultaneous sweet-spot locking of gradiometric fluxonium qubits [0.0] 近傍のフラックス線間のクロストークは、ゼロフィールドのスイートスポットのキュービットをバイアスするために必要である。
グラジオメトリック・ループ(gradiometric loops)は、対称なときにフラクトンが閉じ込められると、デバイスをスイートスポットに保持するフラックスロック機構を組み込んだものだ。
アルミニウムループが捕捉されたフラッションを無期限に保持する複数のグラジオメトリックフラッソニウム量子ビットを同時にロックすることで、この手法を実証する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:32:07 GMT)
Simulating Hawking radiation in quantum many-body systems: deviations from the thermal spectrum [0.0] 最近提案された2次元曲面時空と量子多体系の量子場理論の1対1対応について検討する。
熱スペクトルからの偏差は、よく知られたトンネル法によって予測されるように、多体シミュレーションで観察できることが示されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:19:39 GMT)
Self-consistent GW via conservation of spectral moments [0.0] 本稿では、GW自己エネルギーの直接計算されたスペクトルモーメントの保存に基づく荷電励起のGW$シミュレーションのための代替フレームワークを提案する。
また、このフレームワーク内では、全ての動的変数の完全自己整合性を含む、一連の自己整合性$GW$変種の適用性についても詳述する。
我々はクロロフィルA分子を実験的不確実性の中での実験と一致し、荷電励起のフル周波数スペクトルを記述する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:01:01 GMT)
Secure and practical Quantum Digital Signatures [0.0] 量子デジタル署名 (Quantum Digital Signatures, QDS) は、情報理論的に(IT)安全であり、量子攻撃に免疫を持つソリューションを提供する。
我々は,事前鍵とユニバーサルハッシュファミリに基づいて,既存のQDSプロトコルを3つ分析する。
我々は,事前のビット消費と署名長の観点から,プロトコルパラメータを数値的に最適化し,効率を向上する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:03:43 GMT)
Secure and Scalable Blockchain Voting: A Comparative Framework and the Role of Large Language Models [0.0] 本稿では,ブロックチェーンベースのE-Votingアーキテクチャ,コンセンサス機構,暗号プロトコルを解析するための比較フレームワークを提案する。
本稿では,ハイブリッドコンセンサス,軽量暗号,分散ID管理などを含む最適化戦略を提案する。
私たちの発見は、国家規模のデプロイメントに適したセキュアでスケーラブルでインテリジェントなブロックチェーンベースのE-Votingシステムを設計するための基盤を提供します。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:34:21 GMT)
Secure Quantum Key Distribution via Entangled Quantum Walkers [0.0] 量子鍵分配(Quantum Key Distribution, QKD)は、セキュアな鍵共有のために設計された暗号手法である。
2つの絡み合った量子ウォーカに基づく新しいQKDプロトコルを提案する。
本プロトコルでは,歩行の極端位置における歩行者間のユニークな相関を利用して,両当事者が独占的に共有する秘密鍵を確立する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:34:15 GMT)
Scaling of diffusion constants in perturbed easy-axis Heisenberg spin chains [0.0] 等方点における超拡散の安定性と容易軸状態における拡散定数の変化について検討した。
閉系では、摂動強度の全範囲にわたる拡散定数の連続的な変化の証拠が見つかる。
開系では、非弱摂動の範囲で閉系内のものと定量的に一致して拡散定数を求める。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:37:47 GMT)
Scaling LLM Planning: NL2FLOW for Parametric Problem Generation and Rigorous Evaluation [0.0] NL2Flowは計画問題をパラメトリックに生成するための完全に自動化されたシステムである。
自動ワークフロー生成における2296の低微分問題データセットを生成する。
タスク固有の最適化やアーキテクチャの変更なしに、複数のオープンソースでインストラクトしたLLMを評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:29:47 GMT)
Salt-Rock Creep Deformation Forecasting Using Deep Neural Networks and Analytical Models for Subsurface Energy Storage Applications [0.0] クリープ変形評価は、核廃棄物、水素エネルギー、放射性物質の地下貯蔵施設の設計と運用に不可欠である。
本研究は, 塩岩の時間依存性変形傾向(クリープ)を予測するための時系列予測法について, 種々の凝縮圧力条件下での詳細な解析を行った。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:37:15 GMT)
SAMUeL: Efficient Vocal-Conditioned Music Generation via Soft Alignment Attention and Latent Diffusion [0.0] 声調伴奏生成のための軽量潜時拡散モデルを提案する。
このモデルは、52倍高速な推論を実現しつつ、最先端システムと比較して220倍のパラメータ削減を実現している。
超軽量アーキテクチャは、コンシューマハードウェアへのリアルタイムデプロイメントを可能にし、対話型アプリケーションやリソース制約のある環境に対してAI支援音楽の作成を可能にする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:39:40 GMT)
Riemann-Zeta-Regularisation of Feynman Path Integrals [0.0] 異方性高調波電位に制限された荷電粒子のFeynman Propagatorを電磁界上での移動を計算する。
ゼータ函数が発散経路積分の正規化子として非常に適しているという事実は驚くべき事実である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:37:42 GMT)
Resource-Free Quantum Hamiltonian Learning Below the Standard Quantum Limit [0.0] 本稿では, エンタングルメント資源やコヒーレント測定, 動的制御を必要とせず, 標準量子限界を超える手法を実証する。
提案手法は,局所的ランダム化前処理を探索状態に適用する,軌道に基づくハミルトン学習に依存する。
我々の数値は、我々の手法はパウリ測度当たり1ショットしか必要とせず、実験シナリオに適していることを示している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:59:22 GMT)
Resource-Efficient Synthesis of Sparse Quantum States [0.0] 量子資源を特別に扱ったスパース量子状態のアルゴリズムを提供する。
アルゴリズムによって生成された回路の回路深さ、アンシラ数、および重要な非クリフォード数はすべて、空間において線形である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:35:55 GMT)
RegionMed-CLIP: A Region-Aware Multimodal Contrastive Learning Pre-trained Model for Medical Image Understanding [0.0] RegionMed-CLIPは、局所的な病理信号と全体論的意味表現を組み込んだマルチモーダルコントラスト学習フレームワークである。
MedRegion-500kは、広範囲な地域アノテーションと多段階の臨床的記述を特徴とする総合的な医用画像テキストコーパスである。
本研究は,マルチモーダル医用画像理解の基盤として,地域対応型コントラスト事前訓練の重要性を強調した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:32:03 GMT)
Refining Gaussian Splatting: A Volumetric Densification Approach [0.0] 本稿では,各ガウス関数に付随する慣性量を利用して精製過程を導出する新しい密度制御法を提案する。
提案手法は3DGSを超越し,様々な場面で性能向上を実現している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:23:17 GMT)
Reduction Techniques for Survival Analysis [0.0] 本稿では,異なる還元技術の概要と,それぞれの長所と短所について論じる。
私たちは、標準的な機械学習で直接利用できるような、これらの削減のいくつかを原則として実装しています。
専用例を用いて各リダクションを例示し、その予測性能と、サバイバル分析のための確立した機械学習手法を比較するベンチマーク分析を行う。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:20:19 GMT)
Rayleigh-Taylor, Kelvin-Helmholtz and immiscible to miscible quenching instabilities in binary Bose-Einstein condensates [0.0] 本研究では,2次元の円箱に閉じ込められたルビジウム同位体8,5$Rb,8,7$Rbを考慮し,二元不和合体ボース・アインシュタイン凝縮体の3種類の不安定性について検討した。
RTおよびケルビン・ヘルムホルツ不安定型(KH)は強い摂動下で研究される。
数値シミュレーションにより、このような不安定なダイナミクスは、大きな渦発生と音波伝搬が支配的であることが示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:05:11 GMT)
RRRA: Resampling and Reranking through a Retriever Adapter [0.0] 本稿では,Bi-Encoder表現をモニタし,ハード負が実際に偽陰性である可能性を推定する学習可能なアダプタモジュールを提案する。
この確率は動的かつ文脈的にモデル化され、きめ細かいクエリ特有の判断を可能にする。
標準ベンチマークにおける実証的な結果から、我々のアダプタ強化フレームワークは、強いBi-Encoderベースラインを一貫して上回っていることが分かる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:59:57 GMT)
Quench dynamics of entanglement entropy under projective charge measurements: the free fermion case [0.0] 一次元自由フェルミオン系における両部エンタングルメントエントロピーのクエンチダイナミクスに対する射影測定の影響を考察する。
測定は2つの異なる種類の補正を導入し、古典的および量子的寄与と別々に解釈できることを示した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:25:39 GMT)
Quantum many-body scarring from Kramers-Wannier duality [0.0] クラマース=ワニエ双対性は、状態レベルの作用を持つ非可逆対称性として再解釈することで、最近新たな関心を集めている。
この双対性は、非可積分モデルにおける量子多体散乱状態の安定性を支配する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:55:38 GMT)
Quantum interferometry in external gravitational fields [0.0] 外部重力場における量子干渉実験の現在のモデルは共通の枠組みを欠いている。
本稿では、一般定常時空における量子干渉計のモデリングのための統一的なフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:02:44 GMT)
Quantum hydrodynamics of a polariton fluid: pure energy relaxation terms [0.0] キャビティ・ポラリトン(Cavity polariton)は、量子マイクロキャビティにおける半光半質量のハイブリッド励起である。
エネルギー緩和項が自然に現れるような方程式を導出する。
空洞偏光子の場合に焦点をあてるが, 他のボソニック凝縮体にも適用できる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:27:16 GMT)
Quantum State Preparation Of Multiconfigurational States For Quantum Chemistry [0.0] 量子化学応用のための多構成状態のための2つの量子回路準備法を実装し,検討する。
本稿では,量子回路上でのマルチコンフィグレーション状態の生成に必要な外部制御を自動的に検出する手法を実装した。
我々は、強相関分子の基底状態を含む様々な応用において、これらの手法の利点を実証する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 13:40:59 GMT)
Quantum Reservoir GAN [0.0] 我々は,GAN(Quantum Reservoir Generative Adrial Network)と呼ばれるソフトウェアからのアプローチを提案する。
GANはGANのジェネレータとしてQuantum Reservoir Computersを使用している。
CIFAR10データセット上で手書き単一桁とモノクロ画像の生成を行った。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:38:42 GMT)
Quantum Circuit Benchmarking on IBM Brisbane: Performance Insights from Superconducting Qubit Models [0.0] 本稿では,IBM Brisbane量子プロセッサによる量子システムのシミュレーションと制御を強調する。
我々は,安全かつ信頼性の高い情報伝達に不可欠な,基本量子ゲートの実装と絡み合った状態の進化を分析することに注力する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:34:28 GMT)
Quantifying the rotating-wave approximation of the Dicke model [0.0] 我々は、量子Rabiモデルの多原子一般化に対する回転波近似(RWA)の有効性に対する定量的、非摂動的境界を解析的に見出した。
我々の境界は本質的に状態依存であり、特に初期状態の角運動量に対する非自明な依存を捉えている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:25:49 GMT)
Quantifying information flow in quantum processes [0.0] 本稿では,量子チャネルの信号伝達能力について紹介し,その動作特性について論じる。
この関数は高階写像の拡張をサポートし、一般的な量子因果ネットワークにおける情報フローの評価を可能にする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:05:05 GMT)
Proposal for realizing Heisenberg-type quantum-spin models in Rydberg atom quantum simulators [0.0] 本研究は, 磁場印加により, XXZモデルの異方性パラメータを調整可能であることを示す。
我々は、Rydberg原子量子シミュレータにおけるスピン1/2およびスピン-1ハイゼンベルク型量子スピンモデルの実験的実現を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:20:24 GMT)
Probing and Enhancing the Robustness of GNN-based QEC Decoders with Reinforcement Learning [0.0] グラフニューラルネットワーク(GNN)は量子エラー訂正(QEC)デコードのための強力なデータ駆動型アプローチとして登場した。
本研究では、強化学習(RL)エージェントを用いてGNNデコーダの脆弱性を系統的に調査する新しいフレームワークを導入する。
このフレームワークをGoogle Quantum AIの実験的な表面コードデータに基づいてトレーニングされたグラフ注意ネットワーク(GAT)デコーダに適用する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:27:20 GMT)
Planning Agents on an Ego-Trip: Leveraging Hybrid Ego-Graph Ensembles for Improved Tool Retrieval in Enterprise Task Planning [0.0] 本稿では,ツール間のセマンティックな関係と機能的依存関係をキャプチャする,知識グラフに基づくツール検索フレームワークを提案する。
検索アルゴリズムは1-hop egoツールグラフのアンサンブルを利用して,ツール間の直接的および間接的な接続をモデル化する。
その結果,ツールグラフに基づく手法は,マイクロアベレージ・コンプリート・リコール・メトリックにおいて91.85%のツールカバレッジを実現していることがわかった。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 22:41:12 GMT)
Physics-Informed Time-Integrated DeepONet: Temporal Tangent Space Operator Learning for High-Accuracy Inference [0.0] 我々は、完全な物理インフォームドまたはハイブリッドな物理とデータ駆動の目的によって訓練された2次元アーキテクチャを導入する。
将来の状態を予測する代わりに、ネットワークは時間デリバティブ演算子を現在の状態から学習し、古典的なタイムステッピングスキームを用いて統合する。
ベンチマーク問題に適用すると、PITI-DeepONetは従来の方法と比較して、拡張時間地平線よりも精度が向上している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:25:52 GMT)
Physically Controllable Relighting of Photographs [0.0] 我々は、完全に制御可能で物理的に照明の編集を可能にする、Wild画像のリライトに対する自己教師型アプローチを提案する。
従来のレンダリングの物理的精度と、ニューラルレンダリングによって実現されたフォトリアリスティックな外観を組み合わせることで、これを実現する。
提案手法は,Blenderなどの一般的な3次元コンピュータグラフィックスツールで利用可能な光の物理的制御を,電球内でのリライト化に利用するための重要なステップである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:58:42 GMT)
Partial projected ensembles and spatiotemporal structure of information scrambling [0.0] 本研究では,アンサンブルにスクランブルがどのように印字されるかを研究するためのフレームワークとして,プロジェクテッド部分アンサンブル(PPE)を紹介した。
PPEは、サブシステム上で誘導される混合状態のアンサンブルを、その補体の空間的に分離された部分で測定することによって構成する。
PPEの統計的揺らぎは情報拡散の因果光円錐を忠実に追跡し、スクランブルダイナミクスがアンサンブル構造にどのように符号化されているかを明らかにする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:59:31 GMT)
PEACH: A sentence-aligned Parallel English-Arabic Corpus for Healthcare [0.0] PEACHは、英語とアラビア語の平行した医療テキストのコーパスである。
コーパスには51,671のパラレルな文があり、約590,517の英語と567,707のアラビア語の単語トークンがある。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:49:48 GMT)
Operationalizing Serendipity: Multi-Agent AI Workflows for Enhanced Materials Characterization with Theory-in-the-Loop [0.0] SciLinkは、材料研究におけるセレンディピティーを運用するために設計された、オープンソースのマルチエージェント人工知能フレームワークである。
実験観察、新規性評価、理論シミュレーションの直接的な自動リンクを生成する。
本稿では,原子分解能およびハイパースペクトルデータへの応用,リアルタイムな人間専門家指導の統合能力,研究ループを閉じる能力について述べる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:59:17 GMT)
One Small Step with Fingerprints, One Giant Leap for De Novo Molecule Generation from Mass Spectra [0.0] 我々は、MISTをエンコーダとして、MolForgeをデコーダとして採用し、事前学習を利用してパフォーマンスを向上させる。
我々はこのパイプラインを、質量スペクトルから脱離するデノボ分子の研究のための強力なベースラインとして位置付ける。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:16:55 GMT)
On Digital Twins in Defence: Overview and Applications [0.0] デジタルツインは物理システムの仮想レプリカを作成し、リアルタイム監視、最適化、シミュレーションを可能にする。
本稿では,システム設計・開発,運用計画・訓練,ミッション実行・分担といった重要なユースケースに焦点をあてて,防衛アプリケーションにおけるディジタルツインの統合について検討する。
デジタル双生児のための新しいキャラクタリゼーションフレームワークを導入し、相互運用を容易にするために、異なる防衛領域にまたがってアプリケーションを標準化し統一することを目的としている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:41:27 GMT)
Necessity of Block Designs for Optimal Locally Private Distribution Estimation [0.0] 最適なエラーを達成するプロトコルは、バランスのとれた不完全なブロック設計に対応しなければならないことを証明します。
結果として、最適なエラーと最適な通信を実現するプロトコルは、対称バランスの不完全なブロック設計に基づくものである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:44:04 GMT)
Modular Quantum Amplitude Estimation: A Scalable and Adaptive Framework [0.0] 本稿では,AWQAE(Adaptive Windowed Quantum Amplitude Estimation)フレームワークを紹介する。
これはモジュラーでスケーラブルで適応的なアプローチであり、単一の回路に必要な物理量子ビットの数から推定精度を分離する。
AWQAEは、リソース制約のある量子ハードウェア上で高精度QAEを実行するための強力で柔軟なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:19:11 GMT)
Modular Delta Merging with Orthogonal Constraints: A Scalable Framework for Continual and Reversible Model Composition [0.0] 既存のモデルマージと継続的学習へのアプローチは、しばしばタスクの干渉、破滅的な忘れ込み、あるいは可逆性の欠如に悩まされる。
本稿では, 拡張性, 干渉フリー, 微調整モデルの構成が可能な新しいフレームワークである Orthogonal Constraints (MDM-OC) を用いた Modular Delta Merging を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:44:42 GMT)
Model-based framework for automated quantification of error sources in quantum state tomography [0.0] 量子状態トモグラフィ(QST)では、複数の誤差源が単一の密度行列に集まり、個々のエラー源を特定するのが困難である。
シミュレーションとパラメータ最適化を組み合わせた誤差源の自動定量化手法を提案する。
この枠組みは超伝導量子ビット、原子、固体スピンなどの他の量子プラットフォームにも適用できる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:13:27 GMT)
Mind the Gap: From Resolving Theoretical Foundations of Chiral(ity)-Induced Spin Selectivity to Pioneering Implementations in Quantum Sensing [0.0] キラル(シティ)によるスピン選択性(CISS)効果は実験的に広く観測されているが、その理論的基礎は現在も活発に議論されている。
CISS効果の最近の研究は、スピントロニクス、分子センサー、量子情報処理における幅広い概念的関連性と潜在的な応用を強調している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:52:04 GMT)
Material-Driven Optimization of Transmon Qubits for Scalable and Efficient Quantum Architectures [0.0] 超伝導量子ビット最適化問題に対処するために, 設計, 材料解析, シミュレーションの組み合わせを用いる。
そこで我々は,Qiskit Metalを用いた4キュービットと8キュービットのトランスモンベースのレイアウトを作成し,各キュービットの個別解析を行った。
次に,COMSOL多物理系における単一量子ビット設計の2次元断面を作成し,異なる材料が性能に与える影響を評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:41:04 GMT)
MPS-JuliQAOA: User-friendly, Scalable MPS-based Simulation for Quantum Optimization [0.0] 本稿では,ユーザフレンドリなオープンソースツールであるMPS-JuliQAOAシミュレータを,対角ハミルトニアンとして表現可能な最適化問題の量子近似最適化アルゴリズム(QAOA)をシミュレートする。
Julia- language constructs と ITensor package を利用して、QAOA をシミュレートする Matrix Product State (MPS) アプローチを実装することで、MPS-Juli-QAOA は標準のデファクトベンチマーク 3 正規の MaxCut QAOA 問題に対して、512 qubit と 20 のシミュレーションラウンドに懸命にスケールする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 22:25:51 GMT)
ML-based Short Physical Performance Battery future score prediction based on questionnaire data [0.0] アンケートデータに基づいて,SPPB(Short Physical Performance Battery)スコアを4年間の地平線で予測する可能性を分析した。
最良の結果はXGBoost(絶対誤差0.79点)で達成された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:09:04 GMT)
MIBoost: A Gradient Boosting Algorithm for Variable Selection After Multiple Imputation [0.0] 実際には、分析は欠落データによって複雑になることが多い。
提案するMIBoostは,命令付きデータセット間で均一な可変選択機構を持つ新しいアルゴリズムである。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:16:44 GMT)
Learning Geometric-Aware Quadrature Rules for Functional Minimization [0.0] 我々は、点雲の基底となる幾何学から直接最適な2次重みを学習するために設計されたニューラルネットワーク(GNN)アーキテクチャを導入する。
この研究はエネルギー汎関数変動の最適化に不可欠であり、深層学習に基づく変分解法の改善につながる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:37:23 GMT)
LLM-Based Intelligent Agents for Music Recommendation: A Comparison with Classical Content-Based Filtering [0.0] 本研究では,パーソナライズされた音楽レコメンデーションシステムにおけるLarge Language Models (LLM)の使用について検討する。
LLMは最大で89,32%の満足度を達成し、音楽レコメンデーションシステムに期待できる可能性を示した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:58:08 GMT)
LLM-BI: Towards Fully Automated Bayesian Inference with Large Language Models [0.0] 本稿では,Large Language Model (LLM) を用いた事前分布と可能性の仕様の自動化の実現可能性について検討する。
概念実証として、ベイズ線形回帰に着目した2つの実験を示す。
ベイズモデルにおいて,LLMが重要なステップを自動生成する可能性を検証した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:00:59 GMT)
L1-Regularized Functional Support Vector Machine [0.0] バイナリ分類のための$L_1$-regularized functional support vector machineを提案する。
分類器に適合するように付随するアルゴリズムが開発された。
シミュレーションと1つの実世界の応用による数値的な結果から,提案した分類器は,予測と特徴選択の両方において良好な性能を示すことが示された。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:00:29 GMT)
Krylov exponents and power spectra for maximal quantum chaos: an EFT approach [0.0] 時間外秩序付き相関器(OTOC)とクリロフ複雑性(Krylov complexity)という,量子カオスの2つの尺度の関係を検証した。
シフト対称性だけでは、リャプノフ指数が極大である場合でも、極大クリロフ指数を強制するには不十分である。
ホログラフィックシステムで見られるいわゆる熱生成式によく似たスペクトルを持つ自己相関式を同定する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:33:06 GMT)
Integrating Vision Foundation Models with Reinforcement Learning for Enhanced Object Interaction [0.0] 本稿では,視覚基盤モデルと強化学習を統合し,シミュレーション環境におけるオブジェクトインタラクション機能を向上させる新しいアプローチを提案する。
4つの屋内キッチンで実施した総合的な実験では,物体の相互作用の成功率とナビゲーション効率が著しく向上した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 20:29:01 GMT)
Input-Output Optics as a Causal Time Series Mapping: A Generative Machine Learning Solution [0.0] 生成モデル,特に変分オートエンコーダは,多体量子系の複雑な応答を学習する上で,従来のオートエンコーダよりも優れていることを示す。
最も複雑なマッピングを生成する例として、変分自動エンコーダは、テストデータ全体の90%以上の入力に対して10%未満のエラーを持つ出力を生成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:05:15 GMT)
Implementation of a quantum linear solver for the Vlasov-Ampere equation [0.0] 一次元のVlasov-Ampere方程式に対する量子線形解法を実装した。
厳密なベースライン実装と比較して、我々の手法は量子リソース要求の明確な削減をもたらす。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:51:03 GMT)
Human-like fleeting memory improves language learning but impairs reading time prediction in transformer language models [0.0] 本稿では,トランスフォーマー言語モデルを用いた実験において,言語学習におけるフラッキングメモリの利点について検討する。
フラッキングメモリは、言語学習を継続的に改善するが、意外なことに、人間の読解時間の前提に基づく予測を損なう。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:17:53 GMT)
HemePLM-Diffuse: A Scalable Generative Framework for Protein-Ligand Dynamics in Large Biomolecular System [0.0] 本稿では,タンパク質リガンド軌道の正確なシミュレーションを目的とした,革新的な生成変換モデルであるHemeM-Diffuseを紹介する。
本稿では,3CQV HEMEシステムを用いて,TorchMD-Net,MDGEN,Uni-Molなどの先行モデルと比較して,精度とスケーラビリティを向上した性能を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:29:52 GMT)
Harmonic fractal transformation for modeling complex neuronal effects: from bursting and noise shaping to waveform sensitivity and noise-induced subthreshold spiking [0.0] 簡単な形態で複雑なニューロン効果を再現できる最初のフラクタル周波数マッピングを提案する。
提案モデルでは、非線形変換周波数領域上でのスペクトルの線形和として神経機能を捉えることができる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:42:21 GMT)
HSM and TPM Failures in Cloud: A Real-World Taxonomy and Emerging Defenses [0.0] 本稿では,クラウド環境におけるHSMとTPMの攻撃と侵入に関する包括的分析を行う。
本稿では,実際のケーススタディと脅威情報レポートに基づく攻撃ベクトルの分類を提案し,ハードウェアトラストアンカーと動的クラウドエコシステムのギャップを浮き彫りにする。
我々の発見は、クラウドベースの暗号化信頼を確保するには、階層化されたコンテキスト認識アプローチが必要であることを強調している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:19:06 GMT)
Graph-Based Fault Diagnosis for Rotating Machinery: Adaptive Segmentation and Structural Feature Integration [0.0] 本稿では,回転機械における頑健かつ解釈可能なマルチクラス故障診断のためのグラフベースフレームワークを提案する。
エントロピー最適化信号セグメンテーション、時間周波数特徴抽出、グラフ理論モデリングを統合し、振動信号を構造化表現に変換する。
提案手法は,2つのベンチマークデータセットで評価した場合,高い診断精度を実現する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:07:31 GMT)
Global graph features unveiled by unsupervised geometric deep learning [0.0] GAUDIは,局所的な詳細とグローバルな構造の両方を捉えるために設計された,教師なしの新たなディープラーニングフレームワークである。
GAUDIはそれらを構造的かつ連続的な潜伏空間の近傍領域に一貫してマッピングし、事実上ノイズからプロセスレベルの特徴を引き離す。
我々は,小世界のモデリング,タンパク質集合体のキャラクタリゼーション,Vicsekモデルにおける集団運動の解析,脳接続の年齢変化の同定など,複数のアプリケーションにまたがるGAUDIの汎用性を実証した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:29:26 GMT)
Getting out of the Big-Muddy: Escalation of Commitment in LLMs [0.0] 大規模言語モデル(LLM)は、自律的な意思決定の役割にますます取り組まれている。
LLMは、コミットメントのエスカレーションを含む人間の判断を体系的に歪める認知バイアスを継承することができる。
本稿では,これらのバイアスがLLMに一貫して現れるか,あるいは特定のトリガー条件を必要とするかを検討する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:04:14 GMT)
Generalized Holstein-Primakoff mapping and $1/N$ expansion of collective spin systems undergoing single particle dissipation [0.0] 我々はシュヴィンガーボソンとホルシュタイン・プリマコフ変換の一般化を開発し、弱い置換対称性を持つ$N$ spin $1/2$'sのアンサンブルに適用できる。
これらの写像は、単一粒子散逸または有限温度下での全対全系の共通でブロッホ球に基づく幾何学的な記述を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:09:16 GMT)
Generalization Bound for Diffusion Models using Random Features [0.0] 本稿では,拡散モデルにインスパイアされた深部ランダム特徴モデルを提案する。
サンプルデータの分布と真の分布との一般化境界をスコアマッチングの特性を用いて導出する。
ファッションMNISTデータセットとインストゥルメンタルオーディオデータに基づいてサンプルを生成し,本研究の検証を行った。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:30:18 GMT)
Gauge invariance of the natural lineshape and dissipative dynamics of a two-level atom [0.0] 我々は、ゲージ原理と整合した方法でトランケートされたクーロンゲージハミルトンを用いて、正しい出力スペクトルを得ることができることを示す。
追加のハミルトン結合から生じる力学を経る TLA に対して、マスター方程式が同じ有効条件下でゲージ不変であることも示している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:07:15 GMT)
GFlowNets for Learning Better Drug-Drug Interaction Representations [0.0] 本稿では,生成フローネットワーク(GFlowNet)と変分グラフオートエンコーダ(VGAE)を組み合わせて,希少クラスの合成サンプルを生成するフレームワークを提案する。
我々のアプローチは、相互作用タイプ間の予測性能を高め、臨床信頼性を向上する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:03:23 GMT)
From Autonomy to Agency: Agentic Vehicles for Human-Centered Mobility Systems [0.0] 本稿ではエージェント車両(AgV)を特徴付けるシステムレベルの枠組みを提案する。
AgVはエージェントAIを統合し、複雑な環境で推論、適応、相互作用を行う。
論文は、AgVsの開発とガバナンスにおける重要な課題を特定することで締めくくっている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:04:36 GMT)
FedGIN: Federated Learning with Dynamic Global Intensity Non-linear Augmentation for Organ Segmentation using Multi-modal Images [0.0] 医用画像のセグメンテーションは、AIによる診断、手術計画、治療監視において重要な役割を果たす。
患者データを共有することなくマルチモーダル臓器分割を可能にするフェデレートラーニングフレームワークであるFedGINを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 08:16:35 GMT)
Fault-tolerant Fusion-based Quantum Computing with the Four-legged Cat Code [0.0] 4本脚の猫符号は、ボソニックモードにおける主なエラーに対処するために設計された量子エラー訂正符号である。
本稿では,核融合による誤り訂正によるXZZXコードとの結合により,このコードに対する平面的フォールトトレラントアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 00:25:48 GMT)
Fast-forward scaling theory for quantum dynamics on curved space-time [0.0] 重力が重要な役割を果たす曲線時空上で量子力学のスケーリング特性を示す。
速度制御力学を実現するシステムパラメーターを導出する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:29:31 GMT)
Factorizability of multi-party quantum sequence discrimination under local operations and classical communication [0.0] 局所演算と古典的通信(LOCC)による複数パーティの量子シーケンスの識別について検討する。
複数パーティの量子シーケンスアンサンブルの最適LOCC識別を個々のアンサンブルに分解できる条件を提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 06:05:45 GMT)
Expressivity Limits and Trainability Guarantees in Quantum Walk-based Optimization [0.0] 量子ウォーク最適化アルゴリズム(QWOA)は,近年注目されている変分法の一つである。
本研究では、任意の最適化問題に適用されたQWOAのリー代数次元に関する新しい上限を導出する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:04:20 GMT)
Exploring Satellite Quantum Key Distribution under Atmospheric Constraints [0.0] 地中-衛星間量子鍵分布リンクは大気乱流により劣化する。
本稿では, 角スペクトル伝搬, 乱流Humnagel-Valleyモデル, Von Karman位相スクリーンを用いた数値的枠組みを提案する。
その結果、自由空間光量子鍵分布リンクの生存可能性を測定するために、期待されるリンク予算と安全なキーレートを定量化した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 10:23:26 GMT)
Explicit Instances of Quantum Tanner Codes [0.0] 我々は、量子タナー符号のいくつかの明示的な例、つまり、量子の低密度パリティチェック(qLDPC)のクラスを構築した。
符号は二面体群とランダムな古典符号のペアを用いて構築され、高い符号化率、相対距離、擬似閾値を示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:29:03 GMT)
Exact and Heuristic Algorithms for Constrained Biclustering [0.0] コクラスタリング(co-clustering)または双方向クラスタリング( two-way clustering)とも呼ばれるビクラスタリングは、データマトリックスの行と列を同時にパーティショニングすることで、コヒーレントパターンによるサブマトリクスを明らかにする。
我々は、オブジェクトが同一または異なるビクラスタに属するべきか否かを規定する制約付きビクラスタリング、すなわち、マスタリンクとナントリンクの制約について研究する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:29:22 GMT)
Evaluation of LLMs in AMR Parsing [0.0] ファインタニングデコーダはLarge Language Models (LLMs) のみであり、AMR解析のための新しい真正面方向を示す。
本稿では,Phi 3.5,Gemma 2,LLaMA 3.2,DeepSeek R1 LLaMA Distilledの4つの異なるLLMアーキテクチャを微調整して総合評価する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 04:43:47 GMT)
Energy Experience Design [0.0] 本稿では, エネルギー貯蔵システム, 特にバッテリについて検討し, 年間150億の電力消費率で廃棄されている。
IEAは現在、低炭素システムへのエネルギー移行を重要なミネラル問題として言及しており、各国は政策文書で「鉱山安全」を公然と語っています。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 21:40:29 GMT)
Emulating isomerization with two-dimensional Coulomb crystals [0.0] 2次元クーロン結晶が分子異性化をエミュレートできることを実証した。
我々は6つの138Ba+イオンの平面結晶を用い、高調波トラップ電位のアスペクト比に応じて2つの安定な配置を示す。
両異性体間の不安定性領域を同定し, コンフィグレーション分解画像を用いて異性化をリアルタイムで検出する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:39:50 GMT)
Efficient Mediated Multiparty Semi-Quantum Secret Sharing Protocol Based on Single-Qubit Reordering [0.0] 本稿では、AliceがM$M$ classical Bobsと秘密を共有することができる新しいMSQSSプロトコルを提案する。
量子資源として、絡み合った状態ではなく単一の量子ビットを採用した最初のSQSSプロトコルである。
セキュリティ分析は、プロトコルがよく知られた攻撃に対して安全であることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 15:24:10 GMT)
Dynamical Logical Qubits in the Bacon-Shor Code [0.0] Bacon-Shor符号(Bacon-Shor code)は、重み2チェック演算子からなる量子誤り訂正サブシステム符号である。
Floquetコードと見なすと、いくつかの動的論理量子ビットをホストできることを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:25:10 GMT)
Dissipative quantum phase transitions monitored by current fluctuations [0.0] 散逸相転移(DPT)は、非平衡開量子系の物理的性質の急激な変化によって定義される。
ここでは、オープン量子システムと環境の間の単位時間あたりの平均量子ジャンプとして定義される$textitoutput current$を考える。
本稿では, 出力電流変動, 特にその動的相関, パワースペクトル, 特性時間スケールが, DPTに関する貴重な情報を提供することができることを提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:21:38 GMT)
Dirac-von Neumann Type Axiomatic Structure for Classical Electromagnetism [0.0] 我々は,Hermitian演算子を持つ複素ヒルベルト空間の存在を,古典的電磁気学の計算のために示す。
また、波動可換関係 $[hatx,hatk]=i$ の存在を実証し、これは標準可換作用素 $[hatx,hatp]=ihbar$ のユニークな古典的な類似点である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:00:00 GMT)
Data Leakage and Redundancy in the LIT-PCBA Benchmark [0.0] LIT-PCBAは仮想スクリーニングモデルのベンチマークに広く使われている。
データ漏洩と分子の冗長性は、そのモデルにまたがっている。
LIT-PCBAで公表された結果のほとんどすべてが弱体化されている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 01:10:51 GMT)
DFW: A Novel Weighting Scheme for Covariate Balancing and Treatment Effect Estimation [0.0] 観測データから因果効果を推定することは、選択バイアスのため困難である。
本稿では,新しい確率スコアに基づく手法であるDeconfounding Factor Weighting (DFW)を提案する。
DFWは、高度に凝縮したサンプルの影響を緩和しながら、より縮小されたサンプルを優先する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:51:55 GMT)
Corner functions from entanglement indices of harmonic lattices [0.0] 本研究では,2つの隣接部分集合間の対数ネガティビティ(LN)や相互情報(MI)といった絡み合いの指標を,調和振動子の単独集合$U$で検討する。
まず、前回の研究では、角度 $pi/2, pi/4, 3pi/4$ のコーナー関数の値を検証する。
普遍システム$U$が固定端境界条件(FBCs)を満たす場合、$U$のいくつかの場所でLN, MIsを計算し、特にコーナー関数と得られた値を比較する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 02:56:02 GMT)
Conformal P-Value in Multiple-Choice Question Answering Tasks with Provable Risk Control [0.0] 本研究では,多目的質問応答(MCQA)における大規模言語モデル(LLM)の信頼性向上を目的とした,テスト強化型コンフォメーション予測(CP)フレームワークを提案する。
CPは予測セットに対して統計的に厳格な限界被覆保証を提供し、重要試験は確立された統計的厳密さを提供する。
本研究は,高度QAアプリケーションにおける信頼性の高いLCMデプロイメントの統計的枠組みを確立する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:46:47 GMT)
Confidence in Assurance 2.0 Cases [0.0] 私たちは、アシュアランス2.0と呼ばれる厳格なアプローチで、いかに自信を評価できるかを考えます。
私たちの目標は信頼を損なうことであり、それを4つの異なる視点からアプローチすることです。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:40:30 GMT)
Competing Risks: Impact on Risk Estimation and Algorithmic Fairness [0.0] 生存分析(Survival analysis)は、検閲患者として知られる研究期間中に興味のある出来事を経験していない患者のことを指す。
競合するリスクは、しばしば検閲として扱われる。
我々の研究は、競合するリスクを検閲として扱うことが、生存率のかなりのバイアスをもたらし、リスクを体系的に過大評価し、そして批判的に、格差を増幅する理由を示している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:25:43 GMT)
Cold Start Active Preference Learning in Socio-Economic Domains [0.0] コールドスタート型アクティブな嗜好学習のための新しいフレームワークを提案する。
本手法は,自己指導型事前学習フェーズを通じて学習プロセスを開始する。
異なるドメインからの多様なデータセットについて実験を行う。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:18:50 GMT)
Classical Simulation of Non-Classical Systems: A Large Deviation Analysis [0.0] 古典的シミュレーションの下での大きな揺らぎの確率は、実際の非古典的システムよりも厳密に大きいことを示す。
本稿では、量子優位の新たな形態として、量子(および符号なし)系の潜在的な大きな偏差安定性を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:54:07 GMT)
CLAPP: The CLASS LLM Agent for Pair Programming [0.0] Einstein-BoltzmannソルバCLASSで作業する研究者を支援するために設計された対話型AIアシスタントCLAPPを紹介する。
ClAPPは、大規模言語モデル(LLM)とドメイン固有検索を活用して、CLASS回答質問に対する対話型コーディングサポートを提供する。
ユーザフレンドリーなWebアプリケーションとしてデプロイされたCLAPPは、AIツールに精通していない科学者のエントリーバリアを低くする。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:35:06 GMT)
Breath as a biomarker: A survey of contact and contactless applications and approaches in respiratory monitoring [0.0] 呼吸分析は、呼吸機能、疾患の検出、継続的な健康評価に関する洞察を提供する健康モニタリングにおいて重要なツールとして登場した。
従来のコンタクトベースの手法は信頼性が高いが、特に長期監視において、快適さと実用性に課題を生じさせることが多い。
本調査では, 呼吸分析に応用された機械学習と深層学習技術の最近の進歩を強調し, 接触型アプローチと非接触型アプローチについて検討した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:51:37 GMT)
Block entanglement bounds distribution of regionally localized entanglement [0.0] 量子ネットワークでは、ノード間の接続をなくすことがデコヒーレンスの影響を軽減するために重要である。
局所的局所的絡み合いの概念を導入し、2量子領域に集中する平均絡み合いとして定義する。
特定のハブに対応する局所的局所的絡み合いが、局所化可能なブロック絡み合いを介して、上下に束縛されていることを証明した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 14:19:54 GMT)
Bipartite Fluctuations and Charge Fractionalization in Quantum Wires [0.0] 弾道的量子ワイヤにおける分数電荷を測定するための量子情報手法を提案する。
両分極電流のゆらぎが量子相転移の発見にどのように役立つかを示す。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:38:02 GMT)
Beyond Automation: Socratic AI, Epistemic Agency, and the Implications of the Emergence of Orchestrated Multi-Agent Learning Architectures [0.0] ジェネレーティブAIはもはや高等教育における周辺ツールではない。
本稿では,ソクラティックAIテュータの評価実験から得られた知見について述べる。
テューターを使用する学生は、批判的、独立的、反省的な思考に対する大きな支持を報告した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:49:03 GMT)
Benchmarking quantum computers with any quantum algorithm [0.0] アプリケーションベースのベンチマークは、量子コンピュータの性能を定量化し比較するためにますます使われている。
量子アルゴリズムやアプリケーションからスケーラブルで効率的なベンチマークを作成する方法を提案する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:11:22 GMT)
Automorphic equivalence within gapped phases of infinitely extended fermion systems [0.0] 無限拡張格子フェルミオン系のギャップ位相における自己同型同値性を証明する。
単純な応用として、そのような系に対するゴールドストーンの定理のバージョンを証明する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:43:09 GMT)
Asymptotic Exceptional Steady States in Dissipative Dynamics [0.0] 発散動力学のリウヴィリア生成系におけるスペクトル退化は、一般に例外点として発生し、対応する非エルミート作用素は非対角線となる。
物理値$W=1$の並外れた定常状態は、動的不安定の開始を示す臨界点として理解される可能性がある。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:53:15 GMT)
Anomalies of global symmetries on the lattice [0.0] 格子異常は特定のハミルトニアンの特徴ではなく、むしろ対称性作用の位相不変量である。
格子異常は多くの点でQFT異常の期待された特性を再現するが、重要な違いもある。
格子異常は、可換プロジェクターモデルとの接続を含む、それ自体が興味深い結果をもたらす。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:17:21 GMT)
Analyzing the Impact of Multimodal Perception on Sample Complexity and Optimization Landscapes in Imitation Learning [0.0] 適切に統合されたマルチモーダルポリシーは、より厳密な一般化バウンダリと、より好ましい最適化のランドスケープを実現することができることを示す。
PerActやCLIPortのようなマルチモーダルアーキテクチャが優れたパフォーマンスを実現する理由を説明する理論的フレームワークの包括的なレビューを提供する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:01:53 GMT)
Analyzing negativity criterion in qubit-qutrit system located in external magnetic fields with the Dzyaloshinskii-Moriya interaction [0.0] 量子四重項系で表される複雑な絡み合い力学の研究
Dzyaloshinskii-Moriya(DM)相互作用と外部磁場の存在によってモデルが強化される。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 07:56:52 GMT)
An Adaptive Weighted QITE-VQE Algorithm for Combinatorial Optimization Problems [0.0] 本稿では,適応重み付け方式を用いて,VQE勾配をcQITE更新と統合する適応重み付きQITE-VQE(AWQV)アルゴリズムを提案する。
AWQVは近似の近似比を近似し、重み付けされた ErdHos-R'enyi の場合、古典的な Goemans-Williamson アルゴリズムより優れている。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:13:11 GMT)
Absence of nontrivial local conserved quantities in the Hubbard model on the two or higher dimensional hypercubic lattice [0.0] 我々は、$dge2$を持つ$d$次元超立方体格子上の標準的なHubbardモデルが、非自明な局所保存量を認めていないことを証明した。
これは、保存量がないという白石の証明をフェルミオンモデルに拡張した最初の例である。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 05:07:53 GMT)
AI-assisted JSON Schema Creation and Mapping [0.0] 本稿では,大規模言語モデル(LLM)と決定論的手法を組み合わせて,ユーザによる自然言語入力に基づく生成,修正,スキーママッピングを実現するハイブリッドアプローチを提案する。
この作業は、非専門家のための構造化データモデリングとデータ統合に対する障壁を著しく減らします。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 09:27:10 GMT)
AI-Guided Exploration of Large-Scale Codebases [0.0] 大きな言語モデル(LLM)は、コードの探索を強化する新しい機会を提供する。
大規模言語モデル(LLM)の最近の進歩は、コードの探索を強化する新しい機会を提供する。
この研究は、リバースエンジニアリングとLLM誘導型、意図認識型視覚探索を統合するハイブリッドアプローチを導入している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:15:37 GMT)
A superinductor in a deep sub-micron integrated circuit [0.0] スーパーインダクタは、超伝導抵抗量子を超越した固有のインピーダンスによって特徴づけられる回路素子である。
シリコン集積回路(IC)内で実現したスーパーインダクタを提案する。
同じIC内に形成されたシリコン量子ドットにスーパーインダクタを対向させることで、高周波単一電子トランジスタ(rfSET)を実証する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:10:23 GMT)
A spacetime-covariant approach to inertial and accelerated quantum clocks in first-quantization [0.0] 第一量子化におけるクロックを記述する時空共変形式について提案する。
量子時計対の結合時間進化を2つのケースで計算する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 23:10:46 GMT)
A note on Hall conductance and Hall conductivity in interacting Fermion systems [0.0] NEASS法を線形応答に適用してホール導電率の式を導出する方法を示す。
また、ホール導電性に対する修正位置演算子との二重可換公式との関係についても論じる。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 17:43:26 GMT)
A Runtime-Adaptive Transformer Neural Network Accelerator on FPGAs [0.0] ADAPTORは、FPGA上のトランスフォーマーエンコーダとデコーダの高密度行列計算のためのランタイム適応型アクセラレータである。
FPGAプラットフォームにリソースを分散するための効率的な行列タイリングが組み込まれている。
最新のFPGAベースのアクセラレータと比べて1.7~2.25$times$のスピードアップを実現している。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:31:15 GMT)
A Novel Architecture for Symbolic Reasoning with Decision Trees and LLM Agents [0.0] 本稿では,決定木に基づく記号推論と大規模言語モデルの生成機能を統合するハイブリッドアーキテクチャを提案する。
ツリーベースのモジュールは解釈可能なルール推論と因果論理を可能にし、一方LLMエージェントは帰納的推論、一般化、対話的計画を扱う。
システムは推論ベンチマークで高いパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:11:53 GMT)
A Modular PyTheus Quantum Network Interpreter: Automated Analysis and Visualization of Optimized Quantum Architectures [0.0] PyTheus最適化量子ネットワークのためのモジュラーインタプリタを提案する。
自動最適化によって発見された複雑な量子アーキテクチャを自動的に分析し視覚化する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 18:15:09 GMT)
A Graph Neural Network Approach for Mapping the Conceptual Structure and Inter-Branch Connectivity of Physics [0.0] この研究は、物理法則を重み付き知識グラフとして表現し分析するための新しい枠組みを導入する。
音節のあいまいさを解決するために,厳密な意味的クリーニングを施した659個の物理方程式のデータベースを構築した。
物理概念と方程式の両方をノードとし,重み付き方程式間ブリッジで連結した拡張グラフ表現を開発した。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 16:18:47 GMT)
A Conceptual Model and Methodology for Sustainability-aware, IoT-enhanced Business Processes [0.0] IoT(Internet of Things)が提供するリアルタイムデータ収集と自動化機能は、ビジネスプロセス(BP)に革命をもたらしている。
本研究は、BPの持続可能性を測定し改善するためのIoTの可能性を分析することを目的として、概念モデルと構造化手法を提案する。
この方法論は、既存のBPを体系的に分析し、機会を特定し、持続可能性に配慮したIoT強化BPを実装する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 12:00:21 GMT)
A Comparative Performance Evaluation of Kyber, sntrup761, and FrodoKEM for Post-Quantum Cryptography [0.0] ポスト量子暗号は、量子コンピュータからの攻撃に対してセキュアな暗号アルゴリズムを開発することを目的としている。
本稿では,Kyber,sntrup761,FrodoKEMなどの暗号アルゴリズムを,セキュリティ,性能,実世界の適用性の観点から比較する。
論文参考訳(メタデータ) (Thu, 07 Aug 2025 19:39:59 GMT)