TAR3D: Creating High-Quality 3D Assets via Next-Part Prediction [137.3] TAR3Dは、3D対応ベクトル量子可変オートエンコーダ(VQ-VAE)と生成事前学習トランス(GPT)で構成される新しいフレームワークである。
TAR3Dは,テキスト・ツー・3Dタスクや画像・ツー・3Dタスクにおいて,既存の手法よりも優れた生成品質が得られることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 03:33:36 GMT)
A Survey on Model MoErging: Recycling and Routing Among Specialized Experts for Collaborative Learning [136.9] MoErgingは、専門家のモデルをリサイクルして、パフォーマンスや一般化を改善した集約システムを構築することを目的としている。
MoErgingメソッドの重要なコンポーネントは、特定の入力やアプリケーションに使用する専門家モデルを決定するルータの作成である。
このサーベイには、キーデザインの選択をカタログ化し、各手法に適した適用方法を明確にするための新しい分類が含まれている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:28:21 GMT)
Video Understanding with Large Language Models: A Survey [97.3] 言語・マルチモーダルタスクにおける大規模言語モデル(LLM)の顕著な機能を考えると,近年の映像理解の進歩について概観する。
Vid-LLMの創発的能力は驚くほど進歩しており、特にオープンな多粒性推論能力がある。
本調査は,Vid-LLMのタスク,データセット,ベンチマーク,評価方法論に関する総合的研究である。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:55:20 GMT)
ComPEFT: Compression for Communicating Parameter Efficient Updates via Sparsification and Quantization [92.4] PEFTモデルにおける微調整残差(タスクベクトル)を圧縮する新しい手法であるComPEFTを提案する。
200M - 65Bパラメータを持つT5, T0, LLaMA ベースのモデルにおいて, ComPEFT は圧縮比 8x - 50x を達成する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:52:18 GMT)
SLRTP2025 Sign Language Production Challenge: Methodology, Results, and Future Work [87.9] 第1回手話生産チャレンジはCVPR 2025で第3回SLRTPワークショップの一環として開催された。
コンペティションの目的は、音声言語文からスケルトンポーズのシーケンスに変換するアーキテクチャを評価することである。
本稿では,挑戦設計と入賞方法について述べる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 11:57:33 GMT)
Street Gaussians without 3D Object Tracker [86.6] 既存の方法は、標準空間における動的オブジェクトを再構築するために、オブジェクトポーズの労働集約的な手動ラベリングに依存している。
本研究では,3次元オブジェクト融合戦略における2次元ディープトラッカーの関連性を利用して,安定なオブジェクト追跡モジュールを提案する。
我々は、軌道誤差を自律的に補正し、見逃した検出を回復する暗黙の特徴空間に、モーションラーニング戦略を導入することで、避けられないトラッキングエラーに対処する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 00:40:40 GMT)
SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.2] 我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:18:42 GMT)
LSKNet: A Foundation Lightweight Backbone for Remote Sensing [78.3] 本稿では,軽量なLarge Selective Kernel Network (LSKNet) バックボーンを提案する。
LSKNetはその大きな空間受容場を調整し、リモートセンシングシナリオにおける様々なオブジェクトの範囲をモデル化する。
我々の軽量LSKNetは、標準リモートセンシング分類、オブジェクト検出、セマンティックセグメンテーションベンチマークに基づいて、最先端のスコアを設定しています。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:16:01 GMT)
AR-1-to-3: Single Image to Consistent 3D Object Generation via Next-View Prediction [69.7] 拡散モデルに基づく新しい次世代予測パラダイムAR-1-to-3を提案する。
提案手法は,生成したビューと入力ビューとの整合性を大幅に改善し,高忠実度3Dアセットを生成する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 03:26:26 GMT)
MoGA: 3D Generative Avatar Prior for Monocular Gaussian Avatar Reconstruction [65.5] MoGAは高忠実度3Dガウスアバターを単一視点画像から再構成する新しい手法である。
提案手法は最先端の手法を超越し,実世界のシナリオを一般化する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 13:29:22 GMT)
FOF-X: Towards Real-time Detailed Human Reconstruction from a Single Image [65.0] 本稿では,1枚の画像から詳細な人物形状をリアルタイムに再現するFOF-Xを提案する。
FOFの中核は、3次元占有体を2次元ベクトル場に分解し、3次元領域内の位相的および空間的関係を維持することである。
FOFに基づく新しい再構成フレームワークFOF-Xを設計し,テクスチャや照明による性能劣化を回避する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:03:31 GMT)
MeshPad: Interactive Sketch-Conditioned Artist-Reminiscent Mesh Generation and Editing [64.8] MeshPadは、スケッチ入力から3Dメッシュを生成するジェネレーティブなアプローチである。
我々は、メッシュの領域の"削除"に編集を分解し、新しいメッシュ幾何学の"追加"に続き、一貫した編集を可能にすることに重点を置いている。
提案手法は,メッシュ三角形の追加と削除のために,大規模なTransformerモデルを利用した三角形列に基づくメッシュ表現に基づいている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 16:04:26 GMT)
Anchor Token Matching: Implicit Structure Locking for Training-free AR Image Editing [60.1] Implicit Structure Locking (ISLock)は、ARビジュアルモデルのためのトレーニング不要な編集戦略である。
本手法は,自己注意パターンと参照画像とを動的にアライメントすることで,構造的青写真を保存する。
我々の研究は、ARベースの画像編集を効率的かつ柔軟なものにする方法を開拓し、拡散と自己回帰生成モデルのパフォーマンスギャップをさらに埋めることに成功した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:40:38 GMT)
On the Emergence of Position Bias in Transformers [59.9] 本稿では,多層構造における位置バイアスを解析するためのグラフ理論フレームワークを提案する。
我々のフレームワークは、トランスにおける位置的相互作用を理解するための原則的な基盤を提供する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:48:07 GMT)
Near-Optimal Convergence of Accelerated Gradient Methods under Generalized and $(L_0, L_1)$-Smoothness [57.9] 我々は、最近提案された$ell$-smoothness条件$|nabla2f(x)|| le ellleft(||nabla f(x)||right),$$$L$-smoothnessと$(L_0,L_1)$-smoothnessを一般化する関数を持つ凸最適化問題の一階法について検討する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:28:06 GMT)
AR-GRPO: Training Autoregressive Image Generation Models via Reinforcement Learning [56.7] 本稿では,自己回帰(AR)画像生成モデルにオンラインRLトレーニングを統合するアプローチであるAR-GRPOを提案する。
クラス条件(クラス・ツー・イメージ)とテキスト条件(テキスト・ツー・イメージ)の両方のイメージ生成タスクについて包括的な実験を行う。
その結果,様々な評価指標に対して一貫した改善が得られた。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 10:37:26 GMT)
LIRA: Inferring Segmentation in Large Multi-modal Models with Local Interleaved Region Assistance [54.7] 大規模マルチモーダルモデル(LMM)は不正確なセグメンテーションと幻覚的理解に苦しむ。
視覚的理解とセグメンテーションの相補的関係を生かしたフレームワークであるLIRAを提案する。
LIRAはセグメンテーションと理解タスクの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:40:33 GMT)
Scaling Laws for Native Multimodal Models [53.5] 我々は、ネイティブマルチモーダルモデルのアーキテクチャ設計を再考し、広範なスケーリング法の研究を行う。
我々の調査では、早期核融合アーキテクチャよりも後期核融合アーキテクチャに固有の利点は示されていない。
モデルにMixture of Experts(MoEs)を組み込むことで、モデルがモダリティ固有の重みを学習し、性能を著しく向上できることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 17:12:35 GMT)
Label Inference Attacks against Federated Unlearning [52.1] Federated Unlearning(FU)は、クライアントを忘れる権利に対応するための有望なソリューションとして登場した。
我々は、FUに対する新たなプライバシー脅威を導入・分析し、新しいラベル推論攻撃であるULIAを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:38:24 GMT)
MDK12-Bench: A Comprehensive Evaluation of Multimodal Large Language Models on Multidisciplinary Exams [50.3] MLLM(Multimodal large language model)は、言語と視覚を統合して問題解決を行う。
MLLMのインテリジェンスを測定するための現在のベンチマークは、限られた規模、狭い範囲、構造化されていない知識に悩まされている。
MDK12-Benchは、6つの分野にまたがる実世界のK-12試験から構築された大規模マルチディシプリナベンチマークである。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:21:10 GMT)
Low Cost Bayesian Experimental Design for Quantum Frequency Estimation with Decoherence [45.7] WES: 低コスト適応型ベイズ実験設計のためのウィンドウ拡張戦略を紹介する。
我々は、最適化のオーバーヘッドを低く抑え、スケーリング問題を抑え、高い並列性を実現するために、実証的なコスト削減技術を採用している。
数値シミュレーションにより、WESはハイゼンベルク限界を飽和させ、最も信頼性の高い性能と学習速度を提供することが示された。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 23:41:58 GMT)
DualRAG: A Dual-Process Approach to Integrate Reasoning and Retrieval for Multi-Hop Question Answering [45.2] MHQA(Multi-Hop Question Answering)タスクは、多様な知識領域にまたがる多段階推論のオーケストレーションにおいて課題となる。
推論と検索をシームレスに統合する相乗的デュアルプロセスフレームワークであるDualRAGを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 11:07:11 GMT)
MeteorPred: A Meteorological Multimodal Large Model and Dataset for Severe Weather Event Prediction [44.1] 本稿では,気象予報のための大規模な時間的マルチモーダルデータセットであるMP-Benchを紹介する。
このデータセットの上に,4次元気象入力を直接吸収するマルチモーダル大モデル (MMLM) を開発した。
MMLMは複数のタスクにまたがって非常によく機能し、厳しい気象の理解におけるその有効性を強調している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:54:41 GMT)
Hierarchical Relation-augmented Representation Generalization for Few-shot Action Recognition [43.8] アクション認識は、新しいアクションカテゴリーをほとんど見ない形で認識することを目的としている。
既存の手法は通常、フレーム間の時間的モデリング戦略を設計することで、各ビデオのフレームレベル表現を学習する。
FSARのための階層的関係強化表現一般化フレームワークHR2G-shotを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:05:25 GMT)
TDDBench: A Benchmark for Training data detection [42.5] トレーニングデータ検出(TDD)は、特定のデータインスタンスを使用して機械学習モデルをトレーニングするかどうかを決定するためのタスクである。
TDDメソッドの有効性を徹底的に評価する包括的なベンチマークはありません。
4つの検出パラダイムで21のTDDメソッドをベンチマークし、そのパフォーマンスを5つの観点から評価します。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:55:19 GMT)
MatCLIP: Light- and Shape-Insensitive Assignment of PBR Material Models [42.4] MatCLIPは、PBR材料の形状や光に敏感な記述子を抽出し、画像に基づいて可塑性テクスチャを3Dオブジェクトに割り当てる新しい手法である。
そこで本研究では,PBR表現の領域を写真や描画でブリッジする記述子を生成する。
MatCLIPの分類精度は76.6%で、PhotoShapeやMatAtlasのような最先端の手法よりも優れている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:47:56 GMT)
On the Duality between Gradient Transformations and Adapters [42.3] 線形変換を用いたニューラルネットワークのメモリ効率最適化について検討する。
勾配は全パラメータ空間よりも低次元空間に線型にマッピングされる。
この双対性は、メモリ効率のトレーニングに対する既存のアプローチを統一し、トレーニング効率とメモリ使用量を改善するための新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 23:20:30 GMT)
Sparsity-Driven Plasticity in Multi-Task Reinforcement Learning [41.4] 塑性損失は、訓練が進むにつれて適応する能力の低下であり、深い強化学習において重要な課題である。
特にGMP(Gradual Magnitude Pruning)やSparse Evolutionary Training(SET)などのスペーシフィケーション手法を体系的に検討し,可塑性の向上を図った。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 07:44:44 GMT)
WeatherDiffusion: Weather-Guided Diffusion Model for Forward and Inverse Rendering [40.9] WeatherDiffusionは、自動運転シーンの前方および逆レンダリングのための拡散ベースのフレームワークである。
本手法は, 物質特性, シーン形状, 照明の正確な推定を可能にするとともに, 制御可能な天気や照明の編集もサポートする。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 13:29:39 GMT)
A Multimodal Deep Learning Approach for White Matter Shape Prediction in Diffusion MRI Tractography [40.9] そこで我々は,10個の白質トラクトグラフィー形状を予測できる新しいディープラーニングフレームワークであるTract2Shapeを提案する。
モデル効率を向上させるために,モデルの次元削減アルゴリズムを用いて5つの一次形状成分を予測した。
本研究では,HCP-YAデータセットと未確認PPMIデータセットを用いて,Tract2Shapeの性能評価を行った。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:58:40 GMT)
Story Ribbons: Reimagining Storyline Visualizations with Large Language Models [39.0] 大規模言語モデル(LLM)は、既存のストーリーラインの可視化技術の拡張と再構成に使用されている。
小説や脚本から関連する物語情報を自動抽出するLLM駆動型データ解析パイプラインを提案する。
次に、このパイプラインを適用して、初心者や専門文献アナリストが詳細な性格やテーマの軌跡を探索するのに役立つインタラクティブな可視化システムであるStory Ribbonsを作成します。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:49:30 GMT)
LVBench: An Extreme Long Video Understanding Benchmark [38.8] LVBenchは長いビデオの理解に特化して設計されたベンチマークである。
我々のデータセットは、公開されているビデオからなり、長いビデオの理解と情報抽出を目的とした様々なタスクを包含する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 10:54:59 GMT)
3DGS-IEval-15K: A Large-scale Image Quality Evaluation Database for 3D Gaussian-Splatting [38.7] 3DGSは、視覚的忠実度の高いリアルタイムレンダリングを提供する、新しいビュー合成のための有望なアプローチとして登場した。
圧縮された3DGS表現に特化して設計された最初の大規模画像品質評価(IQA)データセットである3DGS-IEval-15Kを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:08:10 GMT)
MMReID-Bench: Unleashing the Power of MLLMs for Effective and Versatile Person Re-identification [38.4] MMReID-Benchは,人を対象としたマルチタスクマルチモーダルベンチマークである。
MMReID-Benchには20,710のマルチモーダルクエリと10人のReIDタスクをカバーするギャラリーイメージが含まれている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:42:09 GMT)
Continual Multiple Instance Learning for Hematologic Disease Diagnosis [38.1] マルチインスタンス学習(MIL)に特化した,最初の連続学習手法を提案する。
本手法は,複数のバッグから選択した単一インスタンスに対するリハーサル方式である。
提案手法は最先端の手法よりかなり優れており,MILのための最初の連続学習手法を提供する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 21:53:22 GMT)
WSI-LLaVA: A Multimodal Large Language Model for Whole Slide Image [38.0] ギガピクセルのWSI理解のためのフレームワークであるWSI-LLaVAを3段階のトレーニングアプローチで紹介する。
実験の結果、WSI-LLaVAはすべての能力範囲で既存のモデルより優れています。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:17:57 GMT)
Exploring Video-Based Driver Activity Recognition under Noisy Labels [37.8] 実世界のビデオデータは、しばしば間違ったラベル付きサンプルを含み、モデルの信頼性と性能に影響を与える。
運転者行動認識タスクに対して,最初のラベル付きノイズ学習手法を提案する。
全レベルの公開Drive&Actデータセットに関する総合的な実験は,本手法の優れた性能を示すものである。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:43:27 GMT)
Blending Sequential Embeddings, Graphs, and Engineered Features: 4th Place Solution in RecSys Challenge 2025 [37.7] 本稿では,RecSys Challenge 2025に向けたチームによる4番目のソリューションについて述べる。
課題は、6つの下流タスクで効果的にユーザ埋め込みを生成することであった。
本ソリューションは,(1)ユーザ関心の時間的進化を捉えるシーケンシャルエンコーダ,(2)一般化を促進するグラフニューラルネットワーク,(3)高次特徴相互作用をモデル化するディープクロスネットワーク,(4)パフォーマンスクリティカルな特徴工学を統合する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:35:52 GMT)
Intrinsic Explainability of Multimodal Learning for Crop Yield Prediction [36.8] マルチモーダル学習ネットワークを説明するために,トランスフォーマーベースモデルの本質的な説明性を活用する。
本研究は,サブフィールドレベルでの収量予測の課題に焦点を当てた。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 11:09:10 GMT)
Embracing Imperfection: Simulating Students with Diverse Cognitive Levels Using LLM-based Agents [36.7] 大規模言語モデル(LLM)は教育に革命をもたらしており、LLMベースのエージェントは学生の振る舞いをシミュレートする上で重要な役割を果たしている。
学生シミュレーションにおける大きな課題は、様々な認知レベルにおける学生の多様な学習パターンをモデル化することである。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:41:36 GMT)
BharatBBQ: A Multilingual Bias Benchmark for Question Answering in the Indian Context [36.6] Bias Benchmark for Question Answering (BBQ)のような既存のベンチマークは主に西洋の文脈に焦点を当てている。
BharatBBQは、ヒンディー語、英語、マラティー語、ベンガル語、タミル語、テルグ語、オディア語、アッサム語のバイアスを評価するために設計された、文化的に適応したベンチマークである。
我々のデータセットは1つの言語で49,108のサンプルを含み、翻訳と検証によって拡張され、8つの言語で392,864のサンプルとなる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 20:24:24 GMT)
CDP: Towards Robust Autoregressive Visuomotor Policy Learning via Causal Diffusion [35.8] 拡散政策(DP)は、ロボットが行動拡散を通じて専門家のデモンストレーションを模倣することで複雑な行動を学ぶことを可能にする。
本稿では, 過去の行動系列を条件付け, 行動予測を強化するトランスフォーマーに基づく新しい拡散モデルであるCausal Diffusion Policy (CDP)を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 11:31:44 GMT)
Communication-Efficient Multi-Agent 3D Detection via Hybrid Collaboration [34.7] 協調3D検出は、エージェントが相補的な情報を交換できるようにすることで、検出性能を大幅に向上させることができる。
本稿では,2種類のコミュニケーションメッセージを適応的に統合する新しいハイブリッドコラボレーションを提案する。
We present textttHyComm, a communication- efficient LiDAR based collaborative 3D detection system。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 20:33:37 GMT)
Integrating Rules and Semantics for LLM-Based C-to-Rust Translation [34.6] 我々は、翻訳を強化するためにRulEs aNd sEmanticsを統合したLLMベースのフレームワークであるIRENEを提案する。
IRENEは3つのモジュールから構成される。1) 静的アナライザから生成されたルールに基づいて関連する翻訳例を選択するルール拡張された検索モジュールで、Rustルールの処理を改善し、2) LLMを誘導してCコードのセマンティック理解を強化する構造化要約モジュール、3) コンパイラ診断を利用して反復的に翻訳を洗練するエラー駆動翻訳モジュール。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 10:41:03 GMT)
ROODI: Reconstructing Occluded Objects with Denoising Inpainters [34.4] 2つの鍵原理に基づく新しい物体抽出法
シーン全体の3次元表現を生かして,既製の拡散型インペーターとオクルージョン推論を併用する。
本手法は, 複雑なシーンからのオブジェクト抽出において, 最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:45:49 GMT)
Rethinking 1-bit Optimization Leveraging Pre-trained Large Language Models [32.2] 1ビットLLM量子化は、ストレージと計算コストの削減に大きな利点をもたらす。
既存の方法は1ビットのLLMをスクラッチから訓練し、事前訓練されたモデルを完全に活用できなかった。
我々は,浮動小数点重みを二項化にスムーズに変換し,前方および後方の両方に一貫した漸進的トレーニングを導入する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 13:00:16 GMT)
MultiMedEdit: A Scenario-Aware Benchmark for Evaluating Knowledge Editing in Medical VQA [31.3] 知識編集(KE)は、大規模な言語モデルにおいて、完全なリトレーニングなしに事実知識を更新するためのスケーラブルなアプローチを提供する。
臨床マルチモーダルタスクにおけるKEの評価に適した最初のベンチマークであるMultiMedEditを提案する。
我々のフレームワークは,タスクの理解と推論の両方にまたがり,3次元計量スイート(信頼性,一般性,局所性)を定義し,パラダイム間比較をサポートする。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:36:08 GMT)
Towards Effective Prompt Stealing Attack against Text-to-Image Diffusion Models [31.2] Prometheusは、トレーニングなし、プロキシ・イン・ザ・ループ、検索ベースのプロンプト・ステーリング攻撃である。
ローカルプロキシモデルと対話することで、ショーケースの貴重なプロンプトをリバースエンジニアリングする。
Prometheusは、PromptBaseやAIFrogのような人気のあるプラットフォームからプロンプトを抽出することに成功した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:38:38 GMT)
UniCalib: Targetless LiDAR-Camera Calibration via Probabilistic Flow on Unified Depth Representations [30.6] DF-Calibは, キャリブレーションをモード内深さ流量推定問題として再構成するLiDARカメラキャリブレーション法である。
DF-Calibは、カメラ画像から深度マップを推定し、疎LiDAR投影深度マップを完成させる。
本稿では,有効画素を優先する信頼性マップを導入し,深度フロー推定の精度を高めるために,知覚的に重み付けされたスパースフロー損失を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:32:44 GMT)
StarPose: 3D Human Pose Estimation via Spatial-Temporal Autoregressive Diffusion [29.7] StarPoseは3次元人間のポーズ推定のための自己回帰拡散フレームワークである。
歴史的3Dポーズの予測と空間的物理的ガイダンスが組み込まれている。
人間の3次元ポーズ推定における精度と時間的一貫性を向上する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:25:59 GMT)
InfiniBench: A Benchmark for Large Multi-Modal Models in Long-Form Movies and TV Shows [29.7] InfiniBenchは、長いビデオ理解におけるモデルの能力を評価するために設計されたベンチマークである。
1000時間以上のビデオコンテンツがあり、平均的なビデオの長さは53分である。
グラウンドングベース(シーン遷移、キャラクターアクションなど)と推論ベース(ディープコンテキスト理解、マルチイベントリンクなど)にまたがる8つの多様なスキル
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:01:53 GMT)
Large Model Empowered Metaverse: State-of-the-Art, Challenges and Opportunities [28.8] Metaverseは没入型で永続的なデジタルエコシステムであり、ユーザは3D仮想環境内で対話し、社交し、作業することができる。
本稿では,メタバースにおける大規模モデルの統合について検討する。
メタバースレンダリングを最適化するための生成AIベースのフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:28:38 GMT)
Learning Adaptive Dexterous Grasping from Single Demonstrations [27.8] この作業は、2つの重要な課題に対処する。人間による限られたデモンストレーションから、効率的なスキル獲得と、コンテキスト駆動のスキル選択だ。
AdaDexGraspは、スキルごとに1人の人間のデモからスキルを把握できるライブラリを学び、視覚言語モデル(VLM)を使用して最も適切なものを選択する。
我々はAdaDexGraspをシミュレーションと実世界の両方の環境で評価し、RLの効率を大幅に改善し、さまざまなオブジェクト構成をまたいだ人間的な把握戦略の学習を可能にした。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:52:17 GMT)
DatasetResearch: Benchmarking Agent Systems for Demand-Driven Dataset Discovery [26.4] AIエージェントは、通常の検索を超越して、特定のユーザ要求を満たすデータセットを体系的に検出できるだろうか?
我々のベンチマークと包括的な分析は、次世代の自己改善型AIシステムの基礎を提供する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:15:08 GMT)
An Entity Linking Agent for Question Answering [26.2] 本稿では,人間の認知タスクをシミュレートする大規模言語モデルに基づく質問応答システム(QA)のためのエンティティリンクエージェントを提案する。
エージェントは、エンティティの言及を積極的に識別し、候補エンティティを検索し、決定する。
その結果, エージェントの堅牢性と有効性が確認された。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:59:50 GMT)
Class Unbiasing for Generalization in Medical Diagnosis [26.0] 我々は、クラス不均衡とクラス不均衡の両方を同時に緩和するクラス不偏性モデル(Cls-unbias)を訓練することを目指している。
具体的には,正のクラスと負のクラスのサンプルから,分類損失の等しく寄与するクラスワイド不等式損失を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 11:37:44 GMT)
DocRefine: An Intelligent Framework for Scientific Document Understanding and Content Optimization based on Multimodal Large Model Agents [25.2] DocRefineは、インテリジェントな理解、コンテンツの改良、科学的なPDF文書の自動要約のために設計された革新的なフレームワークである。
6つの専門的かつ協調的なエージェントからなる洗練されたマルチエージェントシステムを編成する。
さまざまなタスクにおいて、最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:32:52 GMT)
OmniFluids: Physics Pre-trained Modeling of Fluid Dynamics [25.1] OmniFluidsは、基礎流体力学の法則を捉え、多様な下流タスクに効率的に適応する純粋物理事前学習モデルである。
本研究では,物理のみの事前学習,粗粒度演算子蒸留,小ショットファインチューニングを併用したトレーニングフレームワークを開発した。
テストによると、OmniFluidsは流れ場の予測と統計の点で最先端のAI駆動手法より優れている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:53:51 GMT)
Annotating Errors in English Learners' Written Language Production: Advancing Automated Written Feedback Systems [25.0] 本稿では,各エラーのエラータイプと一般化可能性をモデル化するアノテーションフレームワークを提案する。
我々は、注釈付き学習者の誤りとそれに対応する人間によるフィードバックコメントのデータセットを収集する。
我々は、フィードバックを生成するためのキーワード誘導、キーワードフリー、テンプレート誘導の評価を行う。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 04:06:18 GMT)
A Two-stage Optimization Method for Wide-range Single-electron Quantum Magnetic Sensing [24.3] スピン系に基づく量子磁気センサは、前例のない感度で超弱磁場を検出するための新しいパラダイムとして登場した。
本研究では,2段階最適化手法を用いた新しいプロトコルの設計について報告する。
提案プロトコルは、制約付き全センシング時間予算の下で、NV中心電子スピンの単発読み出しの困難な状況下で開発され、評価される。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:29:32 GMT)
From Explainable to Explained AI: Ideas for Falsifying and Quantifying Explanations [24.0] 本稿では,計算病理学における分類器の説明に適した人間-機械-VLMインタラクションシステムを提案する。
概念実証は,(1)説明文のクレームを検証するためにスライドウインドウ実験を行うAI統合スライドビューアと,(2)汎用視覚言語モデルを用いた説明文の予測性の定量化である。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 10:06:15 GMT)
SEADialogues: A Multilingual Culturally Grounded Multi-turn Dialogue Dataset on Southeast Asian Languages [23.7] 東南アジアを中心とした文化基盤の対話データセットであるSEADialoguesを紹介する。
本データセットは東南アジア6カ国の8言語による対話を特徴としており,その多くが話者数が多いにもかかわらず低資源である。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 18:22:35 GMT)
Differentiable Adaptive Kalman Filtering via Optimal Transport [23.4] OTAKNetは、学習ベースの適応カルマンフィルタリングにおけるノイズ統計のドリフトに対する最初のオンラインソリューションである。
OTAKNetと従来のモデルベース適応カルマンフィルタとオフライン学習ベースフィルタを比較した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 16:36:33 GMT)
BoRA: Towards More Expressive Low-Rank Adaptation with Block Diversity [23.3] 低ランク適応(LoRA)は、大規模言語モデルで広く使われているパラメータ効率のよい微調整(PEFT)手法である。
本稿では,LoRA重みのランクを,少数のパラメータで改善するBlock Diversified Low-Rank Adaptation (BoRA)を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 11:58:39 GMT)
Model-Agnostic Sentiment Distribution Stability Analysis for Robust LLM-Generated Texts Detection [23.2] 大規模言語モデル(LLM)生成テキストを検出するためのモデルに依存しないフレームワークであるSentiDetectを提案する。
本手法は, LLM出力が感情的一貫したパターンを示す傾向を示すのに対して, 人文テキストの方が感情的多様性が高いという経験的観察に動機付けられている。
我々は,Gemini-1.5-Pro,Claude-3,GPT-4-0613,LLaMa-3.3を含む5種類の多種多様なLLMを用いてSentiDetectを評価した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:55:47 GMT)
The ReQAP System for Question Answering over Personal Information [23.1] ReQAPは、フィルタ、結合、異種ソースへの集約を含む複雑な質問に対する回答をサポートする。
ReQAPのユニークな特徴は、質問を分解し、実行のために演算子ツリーをインクリメンタルに構築することだ。
デモでは、高度なユーザ質問のための豊富な機能と、実行ツリーのオペレータによる回答の計算方法の詳細な追跡が紹介されている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:21:53 GMT)
GDBA Revisited: Unleashing the Power of Guided Local Search for Distributed Constraint Optimization [23.1] 局所探索は分散制約最適化問題(DCOP)を解決するための不完全アルゴリズムの重要なクラスである
我々はDCOPのための新しいGLSフレームワークであるDistributed Guided Local Search (DGLS)を提案する。
各種標準ベンチマークにおける実験結果は、最先端のベースラインよりもDGLSが優れていることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:12:06 GMT)
Approximating High-Dimensional Earth Mover's Distance as Fast as Closest Pair [22.2] 我々は、$(varepsilon)$-approximate Earth Mover's Distance (EMD)から$(varepsilon)$-approximate Closest Pair (CP)へ還元する。
CPをn2-phi$で計算し、1+O(varepsilon)$で計算し、n2-phi$で計算できることが示される。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:00:53 GMT)
NoveltyBench: Evaluating Language Models for Humanlike Diversity [21.6] NoveltyBenchは、言語モデルが複数の異なる高品質な出力を生成する能力を評価するために設計されたベンチマークである。
我々は20の指導的言語モデルを評価し、現在の最先端システムは人間の書き手よりも著しく多様性が低いことを発見した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 18:33:13 GMT)
Remote Sensing Image Intelligent Interpretation with the Language-Centered Perspective: Principles, Methods and Challenges [21.2] このレビューは、視覚中心から言語中心のリモートセンシング解釈へのパラダイムシフトを提唱する。
本稿では,Large Language Models(LLM)を認知中心として扱う,リモートセンシング解釈のための言語中心のフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:10:38 GMT)
PAE MobiLLM: Privacy-Aware and Efficient LLM Fine-Tuning on the Mobile Device via Additive Side-Tuning [20.9] PAE MobiLLM は、プライバシを意識した効率的な LLM FT メソッドであり、サーバ支援の付加的なサイドチューニングによってモバイルデバイスにデプロイされる。
PAE MobiLLMは、FT収束をさらに加速し、計算効率を向上させるため、サーバ側でアクティベーションキャッシュを統合する。
PAE MobiLLMは通信コストを削減するために、損失計算に関わるトークンのみを送信するアクティベーションショートカットを開発する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 00:12:01 GMT)
VSI: Visual Subtitle Integration for Keyframe Selection to enhance Long Video Understanding [19.8] 長いビデオ理解は、大言語モデル(ML)に重大な課題をもたらす
VisualSubtitleation (VSI)はサブタイトル、セマンティックタイムスタンプ、シーン境界を統合されたマルチモーダル検索プロセスに統合する。
提案手法は,ビデオフレームの視覚情報と補完的なテキスト情報とを,二重ストリーム検索機構を用いてキャプチャする。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 07:38:48 GMT)
Evaluating Fisheye-Compatible 3D Gaussian Splatting Methods on Real Images Beyond 180 Degree Field of View [19.6] 魚眼をベースとした3Dガウス法(魚眼GS法)と3DGUT法(魚眼GS法と3DGUT法)の視界180度を超える実画像上での最初の評価を行った。
我々は200度の魚眼カメラで捉えた屋内と屋外の両方のシーンについて調査した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:29:17 GMT)
QuProFS: An Evolutionary Training-free Approach to Efficient Quantum Feature Map Search [19.4] 本稿では,トレーニング性,ハードウェアの堅牢性,一般化能力,表現性,複雑性,カーネルターゲットアライメントに着目した回路ベースのQASフレームワークを提案する。
様々なプロキシを持つ回路アーキテクチャをランク付けすることにより、評価コストを削減し、ハードウェア対応回路を組み込むことで、ノイズに対する堅牢性を向上する。
提案手法は,シミュレータと実量子ハードウェアの競合精度を示し,サンプリング効率の点で最先端のQAS手法を超越し,アーキテクチャ検索ランタイムの最大2倍の高速化を実現している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 21:17:24 GMT)
Dual-Phase Playtime-guided Recommendation: Interest Intensity Exploration and Multimodal Random Walks [19.1] DP2Recは,精度と多様性を協調的に最適化する新しいDual-Phase Playtime-Guided Recommendationモデルである。
まず,強い嗜好と弱い嗜好を分離したプレイタイムガイドによる関心度探索モジュールを提案する。
第2に、プレイタイム由来の興味類似性とマルチモーダルセマンティック類似性の両方によって導かれる遷移を用いて、プレイヤーの探索をシミュレートするプレイタイム誘導マルチモーダルウォークモジュールを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 13:51:00 GMT)
Both Direct and Indirect Evidence Contribute to Dative Alternation Preferences in Language Models [18.6] 変更点の選択に影響を与える2つの特性(長さとアニマシー)に焦点を当てる。
長さとアニマシーの直接的な証拠は重要であるが、そのような証拠がなくても、簡単優先の選好は継続する。
LMの創発的な構文的嗜好は、直接的および間接的ソースの混合に由来すると結論付けている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 21:31:31 GMT)
Video Signature: In-generation Watermarking for Latent Video Diffusion Models [18.3] ビデオシグナチャ (VID SIG) は、遅延ビデオ拡散モデルのための次世代透かし方式である。
我々は、潜伏型デコーダを部分的に微調整し、PAS(Perturbation-Aware Suppression)が事前に識別し、知覚に敏感な層を凍結する。
実験結果から, VID SIGは透かし抽出, 視覚的品質, 生成効率において, 最高の総合的な性能を発揮することがわかった。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:16:48 GMT)
Assessing the Quality of AI-Generated Exams: A Large-Scale Field Study [18.1] 大規模言語モデル(LLM)は、従来の教育と学習の方法に挑戦する。
有望な応用の1つは、特定のコースの内容に合わせてカスタマイズされた試験の生成である。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:20:53 GMT)
Membership and Memorization in LLM Knowledge Distillation [17.9] 生徒は、教師が個人データで訓練されたときに、教師のプライバシーを継承することができる。
我々は、既存の知識蒸留(KD)アプローチが、教師から生徒への会員登録と記憶のプライバシーリスクを負っていることを実証した。
また,KD手法の暗記と会員プライバシーリスクの相違が顕著であることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 17:40:41 GMT)
Neural Beam Field for Spatial Beam RSRP Prediction [17.8] 高密度無線ネットワークにおけるビーム管理には、正確なビームレベル基準信号受信電力(RSRP)の予測が不可欠である。
本稿では,空間ビームRSRP予測の効率的かつ解釈可能なハイブリッドニューラルネットワーク物理フレームワークであるNeural Beam Field (NBF)を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:05:51 GMT)
Bridging Classical and Quantum Computing for Next-Generation Language Models [17.8] 本稿では,古典処理と量子処理のギャップを埋める最初のフレームワークであるAdaptive Quantum-Classical Fusion (AQCF)を紹介する。
AQCFの中核となる原理はリアルタイム適応であり、古典処理と量子処理のシームレスな遷移をオーケストレーションするために入力の複雑さを分析する。
感情分析の実験は、AQCFが競争性能を達成し、量子リソース効率を大幅に改善し、典型的なNISQ制約の中で正常に動作することを示した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:49:26 GMT)
When Prompt Engineering Meets Software Engineering: CNL-P as Natural and Robust "APIs'' for Human-AI Interaction [17.8] 制御されたNL for Prompt (CNL-P)は、正確な文法構造と厳密な意味規範を導入している。
CNL-P は LLM のプロンプトの解釈と実行に役立つため、より一貫性があり高品質な出力が得られる。
特に,CNL-Pプロンプトの構文的および意味論的精度をチェックするリンティングツールを開発した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 11:32:33 GMT)
TARS: MinMax Token-Adaptive Preference Strategy for MLLM Hallucination Reduction [17.8] MLLM(Multimodal large language model)は、視覚的推論を可能にするが、実際は正しくない、あるいは視覚的に見当たらない出力を生成することが多い。
直接選好最適化(DPO)は、モデル出力を人間の選好と整合させることで幻覚を補正する一般的な戦略である。
本稿では,DPO を min-max 最適化問題として再構成するトークン適応型選好戦略である TARS を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:17:06 GMT)
Pushdown Reward Machines for Reinforcement Learning [17.6] 我々は、決定論的プッシュダウンオートマトンに基づく報酬機の拡張であるプッシュダウン報酬機(pdRMs)を提案する。
pdRMは、決定論的文脈自由言語で表現可能な時間的に拡張された振る舞いを認識し、報酬を与えることができる。
pdRMを用いて、決定論的文脈自由言語でタスクを表現可能なようにエージェントを訓練する方法を示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:59:09 GMT)
Multi-Modal Requirements Data-based Acceptance Criteria Generation using LLMs [17.4] マルチモーダル要求データから受け入れ基準を生成する新しい手法であるRAGcceptance M2REを提案する。
提案手法は,手作業の労力を効果的に削減し,未払いの利害関係者の意図を捉え,貴重な基準を提供する。
本研究は,ソフトウェア検証プロセスの合理化と開発効率の向上におけるマルチモーダルRAG技術の可能性を明らかにする。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:35:40 GMT)
Membership Inference Attacks with False Discovery Rate Control [17.2] メンバシップ推論攻撃は、データレコードがターゲットモデルをトレーニングするために使用されたかどうかを推測することを目的としている。
偽発見率の保証を提供する新しい会員推論攻撃法を設計する。
また,本手法は,真の非会員データを会員データとしてラベル付けする際の限界確率保証も実現可能であることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 18:14:50 GMT)
TurboBias: Universal ASR Context-Biasing powered by GPU-accelerated Phrase-Boosting Tree [17.2] 本稿では,自動音声認識(ASR)のための普遍的文脈バイアスフレームワークを提案する。
このフレームワークはGPUアクセラレーションされたワードブースティングツリーに基づいており、グレディやビームサーチの復号のために浅い融合モードで使用することができる。
その結果,提案手法の効率性が高く,オープンソースの文脈バイアス手法を超越した結果を得た。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:27:07 GMT)
S2-UniSeg: Fast Universal Agglomerative Pooling for Scalable Segment Anything without Supervision [17.0] 我々は,新しい擬似マスクアルゴリズム,Fast Universal Agglomerative Pooling(UniAP)を提案する。
継続事前学習のための新しいスーパービジョン・ユニバーサル・セグメンテーション(S2-UniSeg)を提案する。
S2-UniSegは4つのベンチマークでSOTA UnSAMモデルを上回っている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:12:39 GMT)
UI-AGILE: Advancing GUI Agents with Effective Reinforcement Learning and Precise Inference-Time Grounding [16.9] トレーニングと推論の両方においてGUIエージェントを強化するUI-AGILEを導入する。
トレーニングのために,スーパービジョン・ファイン・チューニング(SFT)プロセスの一連の改善を提案する。
推測のために,高解像度ディスプレイのグラウンド化精度を劇的に向上させるために,選択による分解グラウンド化を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 17:51:27 GMT)
Large Language Model Evaluated Stand-alone Attention-Assisted Graph Neural Network with Spatial and Structural Information Interaction for Precise Endoscopic Image Segmentation [16.8] 本研究では,空間グラフと構造グラフを融合したFOCUS-Medを提案する。
FOCUS-Medは、Dual Graph Convolutional Network (Dual-GCN)モジュールを統合し、コンテキスト空間および位相構造上の依存関係をキャプチャする。
公開ベンチマークの実験では、FOCUS-Medが5つの主要な指標で最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:53:19 GMT)
SGAD: Semantic and Geometric-aware Descriptor for Local Feature Matching [16.7] 本稿では,領域ベースのマッチングを根本的に再考するSemantic and Geometric-aware Descriptor Network (SGAD)を紹介する。
SGADは、複雑なグラフの最適化なしに直接マッチングを可能にする、高度に識別可能な領域記述子を生成する。
我々は、領域マッチングタスクを分類とランク付けサブタスクに分解する新しい監督戦略により、領域マッチングの性能をさらに改善する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:02:58 GMT)
Fed MobiLLM: Efficient Federated LLM Fine-Tuning over Heterogeneous Mobile Devices via Server Assisted Side-Tuning [16.5] 不均一なモバイルデバイス上の大規模言語モデル(LLM)は、パーソナライズされたインテリジェンスの潜在的な応用を促進する。
従来のLLM FTは、モバイルハードウェア上での計算とメモリの負荷を禁止している。
我々は,多種多様な計算/通信速度と局所モデルアーキテクチャを持つモバイルデバイス間での効率的なLLM FTを実現するための新しい設計であるFed MobiLLMを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 00:41:48 GMT)
PROPS: Progressively Private Self-alignment of Large Language Models [16.0] この研究は、優先順位レベルのプライバシとLLM(Large Language Models)の整合性に焦点を当てている。
本稿では,多段階のプライバシ保護アライメントフレームワークであるPROPS(PROgressively Private Self-alignment)を提案する。
同じプライバシー予算では、PROPSによるアライメントはDP-SGDに比べて最大3倍、Randomized Response (RR)ベースのアライメントに比べて2.5倍高いアライメントを達成することができる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:17:47 GMT)
Multi-Level Service Performance Forecasting via Spatiotemporal Graph Neural Networks [15.9] 本稿では,分散システムにおける性能変動予測の課題を解決するために,時間グラフニューラルネットワークによる性能予測を提案する。
ノードサービスのランタイム機能とサービス間の呼び出し関係を統合し、統一されたフレームワークを構築する。
その結果,提案手法はMAE,RMSE,R2といった主要な指標において,既存の代表手法よりも優れていた。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 23:50:47 GMT)
Hardness-Aware Dynamic Curriculum Learning for Robust Multimodal Emotion Recognition with Missing Modalities [15.8] 本稿では,Hardy-MER という,Hardness-Aware Dynamic Curriculum Learning フレームワークを提案する。
まず、各サンプルの硬度レベルを推定し、次に、トレーニング中の硬度レベルを戦略的に強調する。
ベンチマークデータセットの実験は、HARDY-MERが欠落したモダリティシナリオで既存のメソッドを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 03:10:56 GMT)
eMotions: A Large-Scale Dataset and Audio-Visual Fusion Network for Emotion Analysis in Short-form Videos [15.5] ショートフォームビデオ(SV)は、情報を取得し共有するためのオンラインルーチンの重要な部分になっています。
SVの感情データの可用性が制限されていることから,本研究では,27,996本のビデオからなる大規模データセットであるeMotionsを紹介する。
AV-CANetは,ビデオトランスフォーマを利用して意味的に関連する表現をキャプチャする,エンドツーエンドの音声-視覚融合ネットワークである。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:27:45 GMT)
LifelongPR: Lifelong point cloud place recognition based on sample replay and prompt learning [15.5] 本稿では,PCPRのための新しい連続学習フレームワークであるLifelongPRを提案する。
LifelongPRは、シーケンシャルポイントクラウドデータから知識を効果的に抽出し、融合する。
提案手法はmIR@1の6.50%,mR@1の7.96%,Fの8.95%削減を実現する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:50:51 GMT)
Highlight All the Phrases: Enhancing LLM Transparency through Visual Factuality Indicators [15.1] 大型言語モデル (LLMs) は不正確な情報や偽の情報を生成する可能性があり、しばしば「ハロシン化」や「衝突」と呼ばれる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:00:15 GMT)
An Empirical Study on Method-Level Performance Evolution in Open-Source Java Projects [14.9] 我々は15の成熟したオープンソースのJavaプロジェクトで、パフォーマンスの進化を分析する大規模な実証的研究を行った。
その結果,メソッドレベルの変化の32.7%が測定可能なパフォーマンスに影響を及ぼすことが判明した。
アルゴリズムの変更は、最高の改善可能性を示すが、かなりのレグレッションリスクを持つ。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:39:01 GMT)
MOCA-HESP: Meta High-dimensional Bayesian Optimization for Combinatorial and Mixed Spaces via Hyper-ellipsoid Partitioning [14.6] まず,分散変数と混合変数を分割する新しいBO法MOCA-HESPを提案する。
次に,MOCA-HESPを変数の最先端BOと統合して,標準的なBO,CASMOPOLITAN,Bounceの3つの実用的なBO手法を開発する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:04:59 GMT)
Building Safer Sites: A Large-Scale Multi-Level Dataset for Construction Safety Research [14.5] 建設安全研究は土木工学の重要な分野であり、リスクを軽減し、怪我を防ぐことを目的としている。
既存の建設安全データセットの量の制限と多様性の欠如は、詳細な分析を行う上で大きな課題となる。
本稿では,十分に整理された総合的マルチレベルデータセットであるCSDatasetについて紹介する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:26:51 GMT)
Towards High-Order Mean Flow Generative Models: Feasibility, Expressivity, and Provably Efficient Criteria [14.4] 本稿では,平均加速度場をMeanFlowの目的に組み込む新しい拡張であるSecond-Order MeanFlowに関する理論的研究を紹介する。
まず,平均加速度が1次平均流に類似した一般化整合条件を満たすことを証明し,その実現可能性を確立する。
次に,回路複雑性解析によりその表現性を特徴付け,一様しきい値回路で第2次平均フローサンプリング処理を実現できることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 21:10:58 GMT)
MultiRef: Controllable Image Generation with Multiple Visual References [14.3] 本稿では,複数の視覚参照を用いた制御可能な画像生成の課題に焦点をあてる。
990個の実世界のサンプルと1,000個の実世界のサンプルからなる厳密な評価フレームワークであるMultiRef-benchを紹介する。
我々の実験では、最先端のシステムでさえマルチ参照条件付けに苦戦していることが明らかとなった。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:36:21 GMT)
Low-Rank Expert Merging for Multi-Source Domain Adaptation in Person Re-Identification [14.3] 本稿では、人物のreIDに対して、ソースフリーなAdaptive Gated Experts (SAGE-reID) 手法を提案する。
SAGE-reIDはコスト効率のよいソースフリーなMSDA手法であり、まずソースフリーなUDAを通して、ソース固有のローランクアダプタ(LoRA)を個別に訓練する。
次に、軽量ゲーティングネットワークを導入し、LoRA専門家の融合に最適なマージ重みを動的に割り当てるように訓練する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:10:22 GMT)
Identification of Probabilities of Causation: A Complete Characterization [14.2] 本稿では、因果関係の完全な代表的確率のセットを提案し、それらが構造因果モデル(SCM)の枠組みの中で因果関係のすべての確率を特徴付けるのに十分であることを示す。
次に、形式的な数学的証明を用いて、これらの代表量に対して厳密な境界を導出する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:48:41 GMT)
Understanding Privacy Norms Around LLM-Based Chatbots: A Contextual Integrity Perspective [14.2] 我々は,300人のChatGPTユーザを対象に,ChatGPTデータの共有に関するプライバシー規範の出現を理解するための調査実験を行った。
以上の結果から,ユーザの関心事と行動との間には大きな隔たりがあることが判明した。
参加者は、200ドル相当のプレミアム機能と引き換えに、改善されたサービスのための個人情報の共有を一斉に拒否した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 00:22:46 GMT)
TLCCSP: A Scalable Framework for Enhancing Time Series Forecasting with Time-Lagged Cross-Correlations [14.2] 時系列の予測は、天気、金融、不動産の予測など、様々な領域で重要である。
本稿では,時間ラベルの相互関連配列を統合するTLCCSP(Time-Lagged Cross-Correlations-based Sequence Prediction framework)を提案する。
気象・金融・不動産時系列データセットの実験結果から,本フレームワークの有効性が示された。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:29:14 GMT)
A Comparative Study of Feature Selection in Tsetlin Machines [14.2] 特徴選択(FS)は、モデルの解釈可能性の向上、複雑さの低減、時には精度の向上に不可欠である。
最近導入されたTsetlin Machine (TM)は、解釈可能な節ベースの学習を提供するが、機能の重要性を推定するための確立したツールがない。
本研究は、TMにおけるFSの包括的ベースラインを確立し、特殊なTM特異的解釈可能性技術を開発するための道を開く。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:02:15 GMT)
QuiZSF: An efficient data-model interaction framework for zero-shot time-series forecasting [14.1] 提案するQuick Zero-Shot Time Series Forecaster (Quick Zero-Shot Time Series Forecaster) は,効率的な検索と表現学習,ZSFのモデル適応を両立する軽量かつモジュール化されたフレームワークである。
QuiZSFは、予測設定の75%と87.5%でトップ1にランクインし、メモリと推論時間では高い効率を維持している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:57:07 GMT)
CannyEdit: Selective Canny Control and Dual-Prompt Guidance for Training-Free Image Editing [13.9] CannyEditは、地域画像編集のための新しいトレーニング不要のフレームワークである。
Selective Canny Control and Dual-Prompt Guidanceを紹介する。
CannyEditは2.93から10.49パーセントの改善を達成している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 11:06:58 GMT)
An Evolutionary Game-Theoretic Merging Decision-Making Considering Social Acceptance for Autonomous Driving [13.9] 本稿では,人間ドライバーの有界合理性に基づく,進化的ゲーム理論(EGT)の統合意思決定フレームワークを提案する。
本稿では,人間ライクな運転嗜好を反映した多目的ペイオフ機能を備えたEGT問題として,カットイン決定過程を定式化する。
リアルタイム運転スタイル推定アルゴリズムを提案し,MVの即時反応を観察することにより,オンラインのゲームペイオフ機能を調整する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:18:28 GMT)
Flow Matching Posterior Sampling: A Training-free Conditional Generation for Flow Matching [13.6] 本稿では,Flow Matching を用いた Posterior Smpling (FMPS) を提案し,その適用範囲を拡大する。
この補正項は、サロゲートスコア関数を組み込むように再構成することができる。
FMPSは既存の最先端手法に比べて優れた世代品質が得られることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:22:53 GMT)
Resource-efficient Inference with Foundation Model Programs [13.5] 本稿では,タスクをプログラムに変換し,リソース割り当てのポリシーを学習する手法を提案する。
提案手法は,入力列の質問に応答する2つの視覚的質問応答タスクに対して評価する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:30:32 GMT)
White-Box Reasoning: Synergizing LLM Strategy and gm/Id Data for Automated Analog Circuit Design [12.9] 本稿では,LLMの戦略的推論とgm/Id方法論の物理的精度を統合する「シネジスティック推論」フレームワークを提案する。
当社のフレームワークは, シニアエンジニアの設計と比較して, 精度のオーダー・オブ・マグニチュードの改善を図りながら, 準エキスパートの質を達成している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:25:27 GMT)
Adversarial Video Promotion Against Text-to-Video Retrieval [12.8] 私たちは、ビデオプロモーションアタック(ViPro)と呼ばれる、対向的に動画をプロモートする最初のT2VR攻撃を開拓した。
ViProは他のベースラインを平均30/10/4%以上上回り、ホワイト/グレー/ブラックボックスの設定が可能だ。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:20:13 GMT)
Less Is More: Training-Free Sparse Attention with Global Locality for Efficient Reasoning [12.8] 推論タスクのためのトレーニング不要なスパースアテンション機構であるLessIsMoreを紹介する。
LessIsMoreは、最近のコンテキスト情報とローカルアテンションヘッドからのトークン選択を集約する。
従来のスパースアテンション方式に比べて、エンド・ツー・エンドのスピードアップが1.13タイムズで達成されている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 21:10:33 GMT)
NS-FPN: Improving Infrared Small Target Detection and Segmentation from Noise Suppression Perspective [12.8] 赤外線小目標検出・セグメンテーション(IRS TDS)は、防衛および民間用途において重要な課題である。
近年のCNNに基づく手法は,ノイズの影響を相殺するための特徴表現の強化にのみ焦点をあてている。
本稿では,低周波誘導機能浄化 (LFP) モジュールとスパイラル認識機能サンプリング (SFS) モジュールを統合した新しいノイズ抑圧機能ピラミッドネットワーク (NS-FPN) を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:17:37 GMT)
VOccl3D: A Video Benchmark Dataset for 3D Human Pose and Shape Estimation under real Occlusions [12.7] VOccl3Dは3Dボディポーズと形状アノテーションを備えたビデオベースのヒューマンオクルージョンデータセットである。
AGORAやBEDLAMといった作品に触発されて,先進的なコンピュータグラフィックスレンダリング技術を用いてこのデータセットを構築した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 00:13:46 GMT)
Prompt-Softbox-Prompt: A Free-Text Embedding Control for Image Editing [12.7] PSP(textbfPrompt-textbfSoftbox-textbfPrompt)を提案する。
PSPは、テキストの埋め込みをクロスアテンション層に修正し、Softboxを使ってセマンティックインジェクションの特定の領域を制御することで、正確な画像編集を可能にする。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:59:29 GMT)
A Score-based Diffusion Model Approach for Adaptive Learning of Stochastic Partial Differential Equation Solutions [12.6] 偏微分方程式(SPDE)の時間発展解を適応的に学習する枠組みを提案する。
シミュレーションデータを用いて,制御物理を拡散モデルのスコア関数にエンコードし,確率に基づく補正による観測情報を逆時間微分方程式に組み込む。
これにより、新しいデータが利用可能になると、ソリューションの反復的な洗練を通じて適応的な学習が可能になる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:24:21 GMT)
Neural Channel Knowledge Map Assisted Scheduling Optimization of Active IRSs in Multi-User Systems [12.4] インテリジェントリフレクション・サーフェス(IRS)は、次世代無線ネットワークにおいて大きなパフォーマンス向上をもたらす可能性がある。
IRSはハードウェアの制約により、特に重度の二重パスと複雑なマルチユーザースケジューリングといった重要な課題に直面している。
本稿では,ニューラルチャネル知識マップ(CKM)に基づく新しいスケジューリングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:14:03 GMT)
Talk2Image: A Multi-Agent System for Multi-Turn Image Generation and Editing [12.3] Talk2Imageは,対話型画像生成と編集を行うマルチエージェントシステムである。
提案手法は,対話履歴からの意図的解析,タスクの分解,特殊エージェント間の協調実行を統合した。
Talk2Imageは、コントロール可能性、コヒーレンス、ユーザの満足度において、既存のベースラインよりも優れています。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 10:00:20 GMT)
ESNERA: Empirical and semantic named entity alignment for named entity dataset merging [12.2] ラベル類似度に基づく自動ラベルアライメント手法を提案する。
まず、既存の3つのNERデータセットを統一されたコーパスにマージし、NERのパフォーマンスに最小限の影響を与える。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:15:26 GMT)
UniMove: A Unified Model for Multi-city Human Mobility Prediction [12.2] 人間の移動予測は、都市計画、交通の最適化、パーソナライズされたサービスにとって不可欠である。
既存のソリューションでは、異なる空間表現と地理的カバレッジのために、各都市の個別のモデルを訓練する必要があることが多い。
マルチシティ・ヒューマンモビリティ予測のための統一モデルUniMoveを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 13:47:22 GMT)
AugLift: Boosting Generalization in Lifting-based 3D Human Pose Estimation [12.1] 検出された2Dキーポイントから3Dポーズを予測する方法は、しばしば新しいデータセットや実世界の設定に悪影響を及ぼす。
我々は,データ収集やセンサの追加を必要とせずに,一般化性能を大幅に向上する標準リフトパイプラインの再構成であるemphAugLiftを提案する。
AugLiftはモジュラーアドオンとして機能し、既存のリフトアーキテクチャに簡単に統合できる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 22:36:31 GMT)
Detection of Technical Debt in Java Source Code [12.1] 技術的負債(TD)は、開発者が問題に対して迅速かつ簡単な解決策を選択すると生じる追加コストを記述します。
本研究では、974のJavaプロジェクトからのコメントとそのソースコードの分析を通じて、コードコメントによって識別された最初のTDデータセットをキュレートした。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:45:08 GMT)
Towards Experience-Centered AI: A Framework for Integrating Lived Experience in Design and Development [12.0] 生きた経験は、個人がAIシステムと対話する方法を形作る。
これまでの研究は、人間の好みをエミュレートする技術の開発に重点を置いてきた。
本研究は,AIシステムの設計と評価に生きた経験を有意義に統合する枠組みを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:12:40 GMT)
SEVADE: Self-Evolving Multi-Agent Analysis with Decoupled Evaluation for Hallucination-Resistant Irony Detection [11.7] 本稿では,**D**ecoupled **E**valuation for hallucination-resistant sarcasm detectionについて,**Self-**Ev**olving multi-agent **A**nalysis frameworkを提案する。
我々のフレームワークは最先端のパフォーマンスを実現しており、平均的な精度では**6.75%*、マクロF1スコアでは***6.29%*である。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 03:25:45 GMT)
A Differentiated Reward Method for Reinforcement Learning based Multi-Vehicle Cooperative Decision-Making Algorithms [11.6] 強化学習(Reinforcement Learning, RL)は, 状態-動作-回帰フィードバックループを通じて, 多車両協調運転戦略を最適化する大きな可能性を示す。
本稿では、状態遷移勾配情報を報酬設計に組み込んだ定常遷移系に基づく微分報酬法を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:06:48 GMT)
AI-Generated Compromises for Coalition Formation [11.4] エージェント提案間の妥協を見つけることは、議論、調停、交渉のようなAIサブフィールドの基本である。
エージェント境界合理性と不確実性を組み込んだモデルを定式化し、妥協提案を生成するAI手法を開発する。
提案手法では,自然言語処理技術と大規模言語モデルを用いて,テキスト上の意味的距離空間を誘導する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 18:00:01 GMT)
TechniqueRAG: Retrieval Augmented Generation for Adversarial Technique Annotation in Cyber Threat Intelligence Text [11.4] セキュリティテキストにおける敵のテクニックの正確な識別は、効果的なサイバー防御に不可欠である。
既存のメソッドは基本的なトレードオフに直面している。ドメインの精度が限られているジェネリックモデルに依存するか、リソース集約的なパイプラインを必要とする。
本稿では,このギャップを埋めるドメイン固有検索拡張生成(RAG)フレームワークであるTechnologyRAGを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:28:12 GMT)
Maestro-EVC: Controllable Emotional Voice Conversion Guided by References and Explicit Prosody [11.4] Maestro-EVCは、コンテンツ、話者アイデンティティ、感情の独立した制御を可能にするコントロール可能なECVフレームワークである。
本研究では,時間的感情表現と韻律拡張を用いた明示的韻律モデリングを導入し,対象感情の時間的ダイナミクスを強く捉え,伝達する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:46:32 GMT)
H2C: Hippocampal Circuit-inspired Continual Learning for Lifelong Trajectory Prediction in Autonomous Driving [11.2] 本研究では,海馬回路にインスパイアされた連続学習法(H2C)を提案する。
実験結果から,H2CはDLベースラインの破滅的忘れをタスクフリーで平均22.71%減少させることがわかった。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:28:17 GMT)
Efficient and Reliable Hitting-Set Computations for the Implicit Hitting Set Approach [11.0] 暗黙的なヒットセット(IHS)アプローチは、計算的にハードな最適化問題を解決するための一般的なフレームワークを提供する。
我々は、擬似ブール推論(PB)を用いた様々な手法に基づいて、集合最適化を打つための代替アルゴリズムについて検討する。
PB推論によってインスタンス化された正確なHS計算は、数値的に正確なIPソルバと競合できることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:27:36 GMT)
SEF-MK: Speaker-Embedding-Free Voice Anonymization through Multi-k-means Quantization [11.0] 我々はSEF-MKと呼ばれる話者埋め込み不要なフレームワークを提案する。
データセット全体をトレーニングした単一のk平均モデルを使用する代わりに、SEF-MKは複数のk平均モデルの1つをランダムに選択することで、各発話に対するSSL表現を匿名化する。
実験によると、単一のk平均モデルと比較して、複数のk平均モデルを持つSEF-MKは、ユーザの視点から言語的および感情的なコンテンツをよりよく保存する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:47:34 GMT)
Leaps Beyond the Seen: Reinforced Reasoning Augmented Generation for Clinical Notes [10.9] ReinRAG (ReinRAG) は、入力前情報に基づく長期放電命令のための推論拡張生成(RAG)である。
情報ギャップを埋めるため,グループ正規化報酬による検索品質の向上を目的としたグループベースレトリバー最適化(GRO)を提案する。
実世界のデータセットの実験では、ReinRAGは臨床効果と自然言語生成の指標の両方においてベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:31:11 GMT)
CycleDistill: Bootstrapping Machine Translation using LLMs with Cyclical Distillation [10.9] CycleDistillはモノリンガルコーパスからゼロまたは少数ショットMTを介して合成平行コーパスを生成するブートストラップ方式である。
単言語コーパスにのみ依存することで、CycleDistillは高品質な機械翻訳を実現し、最初のイテレーションで20-30 chrFポイントを超える数ショットのベースラインモデルを改善することができる。
また, 蒸留プロセスにおけるソフトマックス活性化の効果について検討し, 翻訳品質の軽度改善を観察した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:28:53 GMT)
Deep Code Search with Naming-Agnostic Contrastive Multi-View Learning [10.8] コントラッシブな多視点コード表現学習に基づく命名非依存コード探索法(NACS)を提案する。
NACSは、ソースコードの抽象構文構造の表現であるAST(Abstract Syntax Tree)から変数名に結びついた情報を取り除き、AST構造のみから固有のプロパティを取得することに重点を置いている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:08:12 GMT)
When Domains Collide: An Activity Theory Exploration of Cross-Disciplinary Collaboration [10.7] 学際的ソフトウェア開発チームは、ますます多様化し、組み込まれ、学際的になっています。
予想に異議を唱え、問題解決の視点を分散させ、対立する優先順位は摩擦を引き起こす。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:04:34 GMT)
TeSO: Representing and Compressing 3D Point Cloud Scenes with Textured Surfel Octree [10.4] 3Dビジュアルコンテンツストリーミングは、新しい3DテレプレゼンスとAR/VRアプリケーションのための重要な技術である。
ポイントクラウド、メッシュ、そして3Dガウスのような既存の3D表現は、それぞれレンダリング品質、表面定義、圧縮性に制限がある。
我々は,点雲から構築される新しい3次元表現であるTextured Surfel Octree (TeSO)を提示する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:37:43 GMT)
Consensus-based Decentralized Multi-agent Reinforcement Learning for Random Access Network Optimization [10.2] 我々は、衝突を最小限に抑え、デバイス間の通信の公平性を確保するために、効率的なランダムアクセス媒体アクセス制御プロトコルを設計する。
提案するMARLアルゴリズムは,他のベースラインと比較してRAネットワーク性能を著しく向上させることができる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:39:27 GMT)
CROP: Integrating Topological and Spatial Structures via Cross-View Prefixes for Molecular LLMs [10.2] 本稿では,CROss-view Prefixes (CROP) を提案する。
我々のフレームワークは、ビューリサンプリング用に慎重に設計されたSMILES Guided Resamplerと、その結果の埋め込みをLLMのプレフィックスに変換する構造的埋め込みゲートを備えている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 10:06:28 GMT)
BASIC: Boosting Visual Alignment with Intrinsic Refined Embeddings in Multimodal Large Language Models [10.2] マルチモーダル大言語モデル (MLLM) は、視覚プロジェクタを用いて、よく訓練された視覚エンコーダと大きな言語モデルをブリッジすることで、視覚的理解を実現する。
現在のアライメントアプローチは、視覚埋め込みを文脈的手がかりとして扱い、単にテキスト出力に自己回帰的監督を適用するだけである。
本稿では,初期視覚埋め込み生成において,プロジェクタを直接指導する手法として,LLM内の洗練された視覚埋め込みを利用するBASICを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:00:45 GMT)
3DGS-VBench: A Comprehensive Video Quality Evaluation Benchmark for 3DGS Compression [9.9] 3DGS-VBenchは大規模なビデオ品質アセスメント(VQA)データセットであり、ベンチマークには660の圧縮された3DGSモデルと11のシーンから生成されたビデオシーケンスがある。
ストレージ効率と視覚的品質に関する6つの3DGS圧縮アルゴリズムをベンチマークし、複数のパラダイムにまたがる15の品質評価指標を評価した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 16:47:19 GMT)
OceanSim: A GPU-Accelerated Underwater Robot Perception Simulation Framework [9.8] 高速GPU加速水中シミュレータであるOceanSimを提案する。
そこで本研究では,水中画像シミュレーションにおけるシミュレートと現実のギャップを低減するために,物理に基づく高度なレンダリング手法を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:58:59 GMT)
Advancements in Chinese font generation since deep learning era: A survey [9.4] 中国のフォント生成は、いくつかの参照サンプルに基づいて、新しい中国語フォントライブラリを作成することを目的としている。
深層学習に基づく最近の中国語フォント生成手法に関する総合的な調査を行う。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:15:05 GMT)
A Quantum Walk-Driven Algorithm for the Minimum Spanning Tree Problem under a Maximal Degree Constraint [9.4] 我々は、最小スパンニングツリー(MST)問題を最大度制約(MDC)の下で解くための新しい量子ウォークに基づくアプローチを提案する。
量子進化は, 累積遷移確率(すなわちシャノンエントロピー)を最大化することにより, MSTを自然選択することを示した。
MDCを用いたQuantum Kruskalと呼ばれるこの手法は、競合する古典的な計算複雑性を維持しながら、量子リソースの要求を$mathcalO(log N)$ qubitsに大幅に削減する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:59:47 GMT)
LWT-ARTERY-LABEL: A Lightweight Framework for Automated Coronary Artery Identification [9.3] 本稿では, 解剖学的知識を規則に基づくトポロジー制約と統合し, 効率的な冠状動脈ラベリングを実現するための軽量な手法を提案する。
提案手法は, 冠状動脈自動ラベルリングの代替として, ベンチマークデータセットの最先端性能を実現する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:03:54 GMT)
Language Arithmetics: Towards Systematic Language Neuron Identification and Manipulation [9.3] Llama-3.1-8B, Mistral-Nemo-12B, Aya-Expanse-8B & 32B の言語特異的ニューロンを21言語で解析した。
これらのニューロンはより深い層に集結し、非ラテン語のスクリプトはより高度な特殊化を示す。
不要な言語を非活性化し、望ましい言語をアクティベートし、より単純な代替アプローチよりも優れた性能を発揮する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 13:29:36 GMT)
CFM-GP: Unified Conditional Flow Matching to Learn Gene Perturbation Across Cell Types [9.0] 細胞型非依存的遺伝子摂動予測法であるCFM-GPを提案する。
CFM-GPは、摂動遺伝子と摂動遺伝子発現の連続的、時間依存的な変換を学習する。
SARS-CoV-2感染, IFN-β刺激PBMCs, グリオ芽腫パノビノスタット, IFN-β刺激下でのループス, およびStatefate前駆者運命マッピングの5つのデータセットについて検討した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 00:00:17 GMT)
Vibration-Based Energy Metric for Restoring Needle Alignment in Autonomous Robotic Ultrasound [9.0] 本稿では,超音波画像面と針挿入面とが一致していない場合に針のアライメントを復元する手法を提案する。
メカニカルシステムを用いて針を周期的に振動させることにより, より頑健な特徴を用いる。
両腕式超音波ガイド下針挿入システムを用いたブタ組織標本を用いた実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 10:22:48 GMT)
Beyond Frequency: Seeing Subtle Cues Through the Lens of Spatial Decomposition for Fine-Grained Visual Classification [8.9] 本稿では,空間領域における低レベル細部および高レベル意味論の表現能力を適応的に向上する Subtle-Cue Oriented Perception Engine (SCOPE) を提案する。
SCOPEは4つの一般的なきめ細かい画像分類ベンチマークで新しい最先端を実現する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:13:40 GMT)
Towards Practical Data-Dependent Memory-Hard Functions with Optimal Sustained Space Trade-offs in the Parallel Random Oracle Model [8.9] メモリハード関数(MHF)は、平等主義的な作業証明を構築するのに有用な暗号プリミティブである。
我々は[BH22]のような高価な構造に依存しない新しいMHF EGSampleを開発した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:57:22 GMT)
TFMPathy: Tabular Foundation Model for Privacy-Aware, Generalisable Empathy Detection from Videos [8.8] ビデオインタラクションからの共感を検出することは、特に医療や社会ロボティクスにおける研究の新たな領域である。
このようなデータセットに関するこれまでの研究は、古典的な木に基づくモデルを最先端技術として確立してきた。
近年,テキストの大規模基盤モデルの成功に触発され,共感検出のための表層基盤モデルの可能性について検討した。
提案システムであるTFMPathyは、テキスト内学習と微調整の両方のパラダイムの下で、最近の2つのFMで実証されている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 03:32:50 GMT)
$μ$KE: Matryoshka Unstructured Knowledge Editing of Large Language Models [8.5] Matryoshka Unstructured Knowledge Editingは、メモリ更新と出力トークン間の依存関係を保存する。
$mu$KEは、最先端の方法よりも編集効率を最大12.33%向上させる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 03:59:49 GMT)
Algebraic non-Hermitian skin effect and generalized Fermi surface formula in arbitrary dimensions [8.1] 非エルミート皮膚効果は、オープンバウンダリ系において指数関数的に局在したエッジモードの増殖によって特徴づけられる。
2つ以上の空間次元を持つ非エルミート系において、一般化的に現れる代数的非エルミートスキン効果という別の現象を報告する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:41:29 GMT)
Spatio-Temporal Conditional Diffusion Models for Forecasting Future Multiple Sclerosis Lesion Masks Conditioned on Treatments [8.0] 我々は,MSにおける病変の進展を示す将来のマスクを生成できる最初の治療適応拡散モデルを提案する。
我々の生成モデルは、6つの異なる治療における患者の病変マスクを正確に予測することができる。
この研究は、MSにおけるデータ駆動診断を前進させるための強力なツールとして、因果的画像ベース生成モデルの可能性を強調している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:56:25 GMT)
λ-SecAgg: Partial Vector Freezing for Lightweight Secure Aggregation in Federated Learning [7.9] textbfPartial textbfVector textbfFreezing (textbfPVF)は、追加の通信オーバーヘッドを導入することなく計算コストを圧縮するポータブルモジュールである。
SAPとPVFを統合する textbf$bmlambda$-SecAgg は、特定の変換を通じてプライベートベクトルのかなりの部分を凍結する。
我々はPVFが様々なSAPとシームレスに統合できることを実証し、半正直でアクティブな敵の設定においてユーザーのプライバシーに脅威を与えないことを示した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:11:09 GMT)
Mode-Aware Non-Linear Tucker Autoencoder for Tensor-based Unsupervised Learning [7.7] 高次元データは、自己教師あり学習において大きな課題となる。
モード対応非線形タッカーオートエンコーダ(MA-NTAE)について紹介する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:26:32 GMT)
MMET: A Multi-Input and Multi-Scale Transformer for Efficient PDEs Solving [7.7] MMET(Multi-Input and Multi-scale Efficient Transformer)は、上記の課題に対処するために設計された新しいフレームワークである。
MMETはメッシュとクエリポイントを2つのシーケンスとして分離し、それぞれエンコーダとデコーダに供給する。
この研究は、工学および物理学に基づくアプリケーションにおけるリアルタイムPDE解決のための堅牢でスケーラブルなソリューションとしてのMMETの可能性を強調している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:20:15 GMT)
DexVLA: Vision-Language Model with Plug-In Diffusion Expert for General Robot Control [7.6] 視覚言語アクション(VLA)モデルは、一般化可能なロボットスキルを約束している。
現在のVLAモデルは視覚言語モデル(VLM)コンポーネントのスケーリングに重点を置いていることが多いが、アクション空間の表現は依然として重要なボトルネックである。
本稿では,複雑な長期タスクに対するVLAの効率性と一般化能力を向上する新しいフレームワークであるDexVLAを紹介する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 10:58:17 GMT)
X2I: Seamless Integration of Multimodal Understanding into Diffusion Transformer via Attention Distillation [7.6] 本稿では,Diffusion Transformer (DiT) モデルに様々なモダリティを理解する能力を備えた X2I フレームワークを提案する。
X2Iは,マルチモーダル理解能力を有しながら,1%未満の性能低下を示した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:39:17 GMT)
Bridging Foundation Models and Efficient Architectures: A Modular Brain Imaging Framework with Local Masking and Pretrained Representation Learning [7.6] ファンデーションモデル(FM)の原則を効率よくドメイン固有のアーキテクチャと統合するモジュラーフレームワークを提案する。
平均絶対誤差は, 年齢予測では5.343, 流体知能では2.940, ピアソン相関係数は0.928, 0.887であった。
この研究は、LLMに基づくfMRI分析のアプローチに代わる堅牢で解釈可能な代替手段を提供し、脳の老化と認知機能に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:06:01 GMT)
Covering Multiple Objectives with a Small Set of Solutions Using Bayesian Optimization [7.5] この問題のモチベーションの例としては、薬物設計が挙げられる。
本稿では,多目的被覆ベイズ最適化(MOCOBO)を提案する。
その結果,MOCOBOにより得られたKT溶液のカバレッジは,各目的を個別に最適化したT溶液のカバレッジと一致するか,ほぼ一致していることがわかった。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 13:21:13 GMT)
ForeSight: Multi-View Streaming Joint Object Detection and Trajectory Forecasting [7.4] ForeSightは、自動運転車における視覚に基づく3D知覚のための、新しい共同検出および予測フレームワークである。
ForeSightは最先端のパフォーマンスを達成し、EPAの54.9%を達成し、従来の手法を9.3%上回る結果となった。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 20:18:10 GMT)
Whisfusion: Parallel ASR Decoding via a Diffusion Transformer [7.3] Whisfusionは、トレーニング済みのWhisperエンコーダをテキスト拡散デコーダで融合するフレームワークである。
パラメータ効率細調整(PEFT)によって訓練された軽量なクロスアテンションアダプタは、2つのモードをブリッジする。
LibriSpeech (960h)のみに微調整されたWhisfusionは、Whisper-tinyよりも低いWERを実現し、短いオーディオに匹敵するレイテンシを提供する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 17:20:54 GMT)
Average-DICE: Stationary Distribution Correction by Regression [7.2] オフ政治政策評価(OPE)は、長い間、定常的な状態分布ミスマッチに悩まされてきた。
AVG-DICEは密度比を計算的にシンプルなモンテカルロ推定器である。
我々の実験では、AVG-DICEは最先端の推定器と同じくらい正確であり、時にはマグニチュードの改良を提供する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:03:21 GMT)
Context Misleads LLMs: The Role of Context Filtering in Maintaining Safe Alignment of LLMs [7.2] 悪意のあるユーザは、しばしば敵の文脈を利用して、大規模言語モデル(LLM)を欺く。
本研究では,コンテキストフィルタリングモデルと呼ばれる新しい防御機構を提案する。
我々のモデルは、ジェイルブレイク攻撃の攻撃成功率を最大88%下げる能力を示している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:37:59 GMT)
Gradient Extrapolation for Debiased Representation Learning [7.2] GERNE(Gradient Extrapolation for Debiased Representation Learning)は、未知の属性トレーニングケースと未知の属性トレーニングケースの両方において、バイアス付き表現を学習するように設計されている。
解析の結果,外挿した勾配がバッチ勾配に向けられた場合,緩やかな相関が小さくなると,脱バイアスモデルを学ぶためのトレーニングを効果的に導くことが示唆された。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:59:33 GMT)
CLAP: Coreference-Linked Augmentation for Passage Retrieval [7.2] 軽量LLM拡張フレームワークであるCLAP(Coreference-Linked Augmentation for Passage Retrieval)を提案する。
CLAPは、パスをコヒーレントなチャンクに分割し、コア参照チェーンを分解し、密度の高いレトリバー表現と整合した局所的な擬似クエリを生成する。
グローバルなトピック信号と微粒なサブトピック信号の単純な融合は、ドメイン間のロバストなパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 11:26:10 GMT)
Natural Language-Driven Viewpoint Navigation for Volume Exploration via Semantic Block Representation [7.2] 本稿では、自然言語の相互作用を利用してボリュームデータ探索を強化する新しいフレームワークを提案する。
提案手法では,ボリュームブロックを符号化し,基礎構造を捕捉・識別する。
さらにCLIP Scoreメカニズムが組み込まれており、ナビゲーションをガイドするブロックに意味情報を提供する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 04:44:59 GMT)
Statistical Inference for Autoencoder-based Anomaly Detection after Representation Learning-based Domain Adaptation [7.1] 異常検出は、幅広い領域で重要な役割を果たすが、限られたデータを持つ対象領域に適用した場合、その性能は低下する可能性がある。
我々は,Representation Learning-based DA の後,統計的に厳格な Autoencoder-based AD のための新しいフレームワーク STAND-DA を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 17:24:02 GMT)
A Joint Sparse Self-Representation Learning Method for Multiview Clustering [7.0] マルチビュークラスタリング(MC)は、様々なビューにまたがる一貫性とスパース情報を用いてサンプルをグループ化する。
本稿では,正規化に代えてグラフ性を導入する,MCのための新しい自己表現モデルを提案する。
各視点の下では、濃度制約は自己表現段階で使用されるサンプルを直接制限し、信頼できる地域情報とグローバル情報を抽出する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:49:36 GMT)
Learn to Teach: Sample-Efficient Privileged Learning for Humanoid Locomotion over Diverse Terrains [7.0] 本研究は,教師と学生の政策学習を統合したワンステージ・トレーニング・フレームワーク,Learn to Teach (L2T)を提案する。
提案手法は, サンプルをリサイクルし, 共有力学を用いて学習軌跡を同期させ, サンプルの複雑さと学習時間を著しく低減する。
深度推定モジュールを使わずに12以上の困難な地形上で, ゼロショットのシミュレートとロバストな性能を実証し, シミュレーションとハードウェアテストによりRL変種(L2T-RL)を検証した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:49:39 GMT)
A Simple yet Powerful Instance-Aware Prompting Framework for Training-free Camouflaged Object Segmentation [6.7] タスクジェネリックプロンプトをきめ細かなインスタンスマスクに明示的に変換する,トレーニング不要なCamouflaged Objectパイプラインを提案する。
提案したIAPFは、既存の最先端のトレーニングフリーなCOSメソッドを大幅に上回っている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:35:32 GMT)
Empirical Analysis of Privacy-Fairness-Accuracy Trade-offs in Federated Learning: A Step Towards Responsible AI [6.7] フェデレーテッド・ラーニング(FL)におけるプライバシ・フェアネス・ユーティリティ・トレードオフに関する大規模な実証的研究について紹介する。
フェアネス・アウェアと差分プライバシー(DP)、同相暗号化(HE)、セキュアマルチパーティ暗号化(SMC)を比較した。
DPメカニズムは、公平性、歪み、公平性に悪影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 23:41:23 GMT)
MoQE: Improve Quantization Model performance via Mixture of Quantization Experts [6.7] Mixture of Quantization Experts(略称:MoQE)は、Mixture-of-Expertsアーキテクチャに基づく量子化推論フレームワークである。
MoQEは1つの完全精度モデルの複数の量子化変種を「量子化の専門家」として結合する
我々は,MQEがSOTA量子化モデルに匹敵する性能を達成できることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:58:29 GMT)
Learning to Diagnose Privately: DP-Powered LLMs for Radiology Report Classification [6.6] 本研究は,放射線学レポートテキスト上で,差分プライバシー (DP) を用いた大規模言語モデル (LLM) の微調整を行うためのフレームワークを提案する。
MIMIC-CXR胸部X線写真とCT-RATECTを用いた50,232例の胸部X線撮影を行った。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 18:21:22 GMT)
A Stage-Aware Mixture of Experts Framework for Neurodegenerative Disease Progression Modelling [6.6] 神経変性疾患の長期進行はグラフ拡散過程として一般的に概念化されている。
そこで本研究では,異なるコントリビューション機構が病期においてどのように支配されているかを明確にモデル化する,新たな段階認識型混合エキスパートフレームワークを提案する。
IGND-MoEモデルは、これらの成分を時間的状態にわたって動的に統合し、ステージ特異的な病理機構が進行にどのように寄与するかを理解するための原則化された方法を提供する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 16:09:00 GMT)
Rethinking Privacy Indicators in Extended Reality: Multimodal Design for Situationally Impaired Bystanders [6.5] 本研究では、状況に障害のある傍観者に対して有効なXRプライバシー指標の設計について検討する。
視覚のみの指標は、商用のXRデバイスで典型的なもので、障害シナリオにおける有用性に対する評価が低かった。
マルチモーダル指標は、状況に障害のある傍観者のプライバシーに敏感なシナリオで好まれた。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 17:48:44 GMT)
Quantum Entanglement Autodistillation in Baryon Pair Decays [6.4] 本研究では, E+e-からJ/psi, psi(2S) , BBbar に生成したスピン1/2バリオン-アンティバリオン対のスピン絡み合った混合状態について検討した。
B から b + M へ、Bbar から bbar + Mbar へ、b と bbar はスピン1/2バリオン、M, Mbar はスピン0中間子である。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 03:12:46 GMT)
Rhetorical Text-to-Image Generation via Two-layer Diffusion Policy Optimization [6.2] Rhet2Pixは、多段階ポリシー最適化問題として修辞的テキスト・画像生成を定式化するフレームワークである。
GPT-4o,Grok-3などのSOTA MLLMと,定性評価と定量的評価の両面において,本モデルの方が優れた成績を示した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 10:28:46 GMT)
Engineered Molecular Clock Transitions for Symmetry Violation Searches [6.0] 我々は、多原子分子YbOHにおけるロバスト対称性違反探索を実現するために、クロック遷移を考案し、実証した。
我々は、選択された量子状態を特定し、外部磁場および電界の感度測定を行う。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:32:47 GMT)
GAITGen: Disentangled Motion-Pathology Impaired Gait Generative Model -- Bringing Motion Generation to the Clinical Domain [6.0] GAITGenは、特定の病理重症度レベルに基づいて、現実的な歩行シーケンスを生成する新しいフレームワークである。
新たなPD-GaMデータセットの実験により、GAITGenは、再構成の忠実度と生成品質の両方において、適応された最先端モデルより優れていることが示された。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 16:11:10 GMT)
AMFT: Aligning LLM Reasoners by Meta-Learning the Optimal Imitation-Exploration Balance [5.7] 大規模言語モデル(LLM)は通常、2段階のパイプライン(SFT)と強化学習(RL)による推論タスクのために微調整される。
最近の単段法では、SFTとRLを原理的に統一しようとするが、2つのパラダイムを動的にバランスさせるメカニズムが欠如している。
我々は,SFTの暗黙的,パスレベルの報酬とRLの明示的,結果に基づく報酬との最適バランスを学習する,新しいシングルステージアルゴリズムである textbf Meta Fine-Tuning (AMFT) を紹介する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 11:40:54 GMT)
Empathy Detection from Text, Audiovisual, Audio or Physiological Signals: A Systematic Review of Task Formulations and Machine Learning Methods [5.7] 共感の検出は、社会、医療、教育に潜在的な応用がある。
広範かつ重複するトピックであるにもかかわらず、機械学習を利用した共感検出の道はいまだに探索されていない。
本稿では,近年の進歩と,ロバストな共感検出システム構築に向けた課題について概説する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:53:18 GMT)
SQL-Exchange: Transforming SQL Queries Across Domains [5.6] 我々は、ソースクエリ構造を保存しつつ、ターゲットスキーマに適合するようにドメイン固有の要素を適用することで、異なるデータベーススキーマ間でクエリをマッピングするフレームワークを導入する。
本研究は,テキスト・トゥ・コンテクスト・システムにおけるテキスト・トゥ・コンテクスト・ラーニングの性能向上に対する,そのようなマッピングが有用かつ有益である条件について検討する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:55:54 GMT)
UoMo: A Universal Model of Mobile Traffic Forecasting for Wireless Network Optimization [5.6] モバイルトラフィック予測のための革新的なファンデーションモデル(FoMo)を提案する。
FoMoは、ネットワーク計画と最適化をサポートするために、複数の都市にまたがる短期・長期予測と分布生成の多様な予測タスクを処理することを目的としている。
FoMoは拡散モデルと変換器を組み合わせており、FoMoが様々なタスクの固有の特徴を学習できるようにするために様々な普遍性マスクが提案されている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:22:01 GMT)
Monte Carlo with kernel-based Gibbs measures: Guarantees for probabilistic herding [5.5] 本研究では、カーネルのハーディングと同じ最悪のエラーを最小限に抑えるために、二次ノード上の結合確率分布について検討する。
我々の主な貢献は、最悪の積分誤差に対してより厳密な集中不等式を持つという意味で、モンテカルロよりも優れていることを証明することである。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 17:22:16 GMT)
DRAMA-X: A Fine-grained Intent Prediction and Risk Reasoning Benchmark For Driving [5.4] 既存のベンチマークでは、安全クリティカルな状況下でのマルチクラスの意図予測は評価されていない。
DRAMAデータセットから構築した詳細なベンチマークであるDRAMA-Xを紹介する。
我々は,エゴ車の推論パイプラインを反映した軽量でトレーニング不要なフレームワークであるSGG-Intentを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:21:14 GMT)
Exploring Multidimensional Checkworthiness: Designing AI-assisted Claim Prioritization for Human Fact-checkers [5.2] 我々は,AIによるクレーム優先順位付けのプロトタイプを開発し,クレームの優先順位付けにファクトチェッカーが多次元のチェック価値のある要素をどのように利用するかを探究する。
本研究には16名の専門的ファクトチェッカーが参加し,階層的優先順位付け戦略のファクトチェッカーが暗黙的に使用されていた。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 04:16:38 GMT)
Can Multitask Learning Enhance Model Explainability? [5.1] モデル動作を本質的に説明するために,マルチタスク学習によってモダリティをどのように活用できるかを示す。
特に、追加の入力の代わりに、特定のモダリティを、メインタスクと共に予測される追加のターゲットとして使用します。
このアプローチの成功は、入力モダリティとして残る衛星データの豊富な情報量に依存している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:24:48 GMT)
Investigating Intersectional Bias in Large Language Models using Confidence Disparities in Coreference Resolution [5.1] 大規模言語モデル(LLM)は目覚ましいパフォーマンスを達成し、採用や受け入れといったリソース制約のあるコンテキストで意思決定支援ツールとして広く採用されている。
しかし、AIシステムは社会的バイアスを反映し、さらに悪化させることができるという科学的コンセンサスがあり、批判的な社会的文脈で使用される場合、アイデンティティに基づく害についての懸念が高まる。
本研究では,複数の識別軸が交差する際,異なる不利パターンを生じることを認識して,一軸の公平性評価を拡張し,交差バイアスを検証した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 22:24:40 GMT)
Tensor Decomposition with Unaligned Observations [5.0] アンアラインな観測モードは、再生カーネルヒルベルト空間(RKHS)の関数を用いて表現される
本稿では,2値型,整数値型,正値型など,データの種類を効果的に説明できる多元的損失関数を提案する。
また、$ell$ロス関数を使用する際の効率向上のためにスケッチアルゴリズムも導入された。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 00:39:21 GMT)
Delayed takedown of illegal content on social media makes moderation ineffective [4.4] 本研究は、EUデジタルサービス法透明性データベースのデータを用いて、テイクダウン遅延の系統的解析との関係について検討する。
削除遅延はかなりのばらつきがあり、一部のコンテンツは数週間、あるいは数ヶ月にわたってオンラインに残っています。
我々は、違法なコンテンツ拡散をシミュレートし、急激な削除(数時間以内)が、違法なコンテンツに対する頻度、到達度、露出を著しく減少させることを明らかにした。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 20:52:48 GMT)
Comparative Analysis of Time Series Foundation Models for Demographic Forecasting: Enhancing Predictive Accuracy in US Population Dynamics [4.3] 本研究は,アメリカ合衆国における時系列基盤モデルの人口変動予測への応用について検討した。
従来のベースラインに対する時系列基礎モデル(TimesFM)の性能評価を行った。
人口統計学的に多様性のある6州を対象に行った実験では、TimesFMが86.67%のテストケースで最低値のMean Squared Error(MSE)を達成した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 07:55:09 GMT)
Quo Vadis, Code Review? Exploring the Future of Code Review [4.2] 今日、実践者がコードレビューをどのように反映し、近い将来に期待する変化について検討する。
次に、コードレビューの進化に対するこれらの予想される変化の長期的リスクとその協調ソフトウェアエンジニアリングにおける役割について論じる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:17:57 GMT)
Echo: Decoupling Inference and Training for Large-Scale RL Alignment on Heterogeneous Swarms [4.1] 大規模言語モデルのポストトレーニングは、同じGPUクラスタ上でトラジェクトリサンプリングとポリシ最適化を併用する。
ヘテロジニアスな"推論"と"トレーニング"スワムにまたがって、これらの2つのフェーズをきれいに分離するRLシステムであるEchoを紹介します。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:48:39 GMT)
Uncertainty propagation in feed-forward neural network models [4.0] 我々はフィードフォワードニューラルネットワークアーキテクチャのための新しい不確実性伝搬法を開発した。
ニューラルネットワーク出力の確率密度関数(PDF)の解析式を導出する。
鍵となる発見は、リークReLU活性化関数の適切な線形化が正確な統計的結果をもたらすことである。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 18:01:55 GMT)
K-Dense Analyst: Towards Fully Automated Scientific Analysis [4.0] 我々は,自律型バイオインフォマティクス解析を実現する階層型マルチエージェントシステムであるK-Dense Analystを紹介する。
BixBenchでは、K-Dense Analystが29.2%の精度を達成し、最高のパフォーマンス言語モデル(GPT-5)を6.3%上回っている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 16:59:55 GMT)
Practical Guidelines for Ideology Detection Pipelines and Psychosocial Applications [3.9] 本研究は,大規模オンライン環境における左,右,極端イデオロギーのリアルタイム検出を必要とする実践者に対するガイドラインを提供する。
本稿では,パイプライン構築のためのフレームワークを提案する。
私たちは、12万以上のユーザを含む5つのデータセットでパイプラインの機能を紹介します。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:51:04 GMT)
Mamba-based Deep Learning Approach for Sleep Staging on a Wireless Multimodal Wearable System without Electroencephalography [3.7] 本稿では,アンネワンからの信号に基づいて,マンバをベースとした睡眠ステージングのための深層学習手法について検討する。
健常成人357名を対象に, 同時ポリソムノグラフィーを施行した。
これらの記録に基づいて,Mambaベースのリカレントニューラルネットワークアーキテクチャをトレーニングした。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:59:43 GMT)
The Cost of Thinking: Increased Jailbreak Risk in Large Language Models [3.6] 我々は,AdvBench と HarmBench の 9 個の LLM を評価し,LLM における攻撃的思考モードの成功率は,非思考モードの成功率よりもほぼ高いことを示した。
本稿では, LLMの内部的思考プロセスに, LLMの「特定の思考トークン」を付加することにより, LLMの内部的思考プロセスを明示的にガイドする, LLMに対する安全な思考介入手法を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:49:49 GMT)
Trustworthy Medical Imaging with Large Language Models: A Study of Hallucinations Across Modalities [3.1] 大規模言語モデル(LLM)は、医療画像のタスクにますます応用されている。
これらのモデルは、しばしば幻覚を生じさせ、自信はあるが、誤ったアウトプットが臨床上の決定を誤解させる可能性がある。
本研究では、画像からテキストへの幻覚、X線、CT、MRIスキャンからの報告、およびテキストから画像への幻覚、そしてモデルが臨床的なプロンプトから医療画像を生成する2つの方向について検討する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 16:03:46 GMT)
SAGCNet: Spatial-Aware Graph Completion Network for Missing Slice Imputation in Population CMR Imaging [3.0] 利用可能なスライスから欠落したスライスを補うために、ボリュームMRI合成法が開発されている。
心臓磁気共鳴(CMR)のような体積MRIデータの本質的な3次元特性は、スライス計算の欠如に重大な課題をもたらす。
本稿では,空間対応グラフ補完ネットワーク(SAGCNet)を提案し,全容積データへの依存を克服する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 16:56:07 GMT)
Temporal Rate Reduction Clustering for Human Motion Segmentation [2.9] 本稿では,ビデオ中のフレームのシーケンスを分割するために,構造化表現と親和性を共同で学習する時間的レート削減クラスタリング(textTR2textC$)を提案する。
我々は5つのベンチマーク・ベンチマーク・データセットで広範囲に実験を行い、異なる特徴抽出器を用いて最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 07:00:56 GMT)
LSDTs: LLM-Augmented Semantic Digital Twins for Adaptive Knowledge-Intensive Infrastructure Planning [2.9] LSDT(LLM-Augmented Semantic Digital Twins)は、大規模言語モデルが構造化されていないドキュメントから計画的知識を抽出するのを支援するフレームワークである。
この研究は、複雑な知識駆動計画タスクをサポートするために、生成AIとデジタルツインを組み合わせる可能性を示している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 03:06:40 GMT)
Model Predictive Control for Crowd Navigation via Learning-Based Trajectory Prediction [2.9] 本研究は,物理的コンチネンタルコリールロボット上でのモデル予測制御(MPC)フレームワークにおける,深層学習に基づくソーシャル・インプシシット(SI)歩行者軌道予測器の統合性を評価する。
その結果、SIは軌道予測を改善し、低密度設定でエラーを最大76%削減し、混雑したシーンでの安全性と動きのスムーズさを高めている。
これらの知見はシステムレベルの評価の重要性を強調し、より安全で適応的なナビゲーションを実現するためのSI-MPCフレームワークの約束を強調している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:11:28 GMT)
Machine Learning Algorithms for Improving Exact Classical Solvers in Mixed Integer Continuous Optimization [2.8] 機械学習と強化学習が正確な最適化方法をいかに強化するかを調査する。
個別、連続、混合整数の定式化をカバーしています。
我々は、学習ベースの戦略を分岐、切断、ノード順序付け、パラメータ制御に組み込む統合BBフレームワークを導入する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:36:44 GMT)
From Nodes to Narratives: Explaining Graph Neural Networks with LLMs and Graph Context [2.7] LOGICは軽量でポストホックなフレームワークで、大きな言語モデルを使用して、GNN予測に対する忠実で解釈可能な説明を生成する。
実験の結果,LOGICはインサイトフルネスなどの人間中心の指標を大幅に改善しつつ,忠実さと疎さのトレードオフを良好に達成できることが示された。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 23:22:38 GMT)
Optimal Form Factors for Experimental Proposals on Gravity-Induced Entanglement [2.7] 熱デコヒーレンスは、システムのパラメータに厳格な制約を課す。
本研究では, フォームファクタが2pi$の上限を持つことを証明し, 発振器系の基本的な限界を明らかにする。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:32:54 GMT)
Accurate and thermodynamically consistent hydrogen equation of state for planetary modeling with flow matching [2.6] ab initio 分子動力学シミュレーションに基づく高密度水素のエントロピー計算の諸側面について検討する。
本研究では, 温度・圧力条件の広い範囲で高精度で熱力学的に整合した状態方程式を構築するための信頼性の高い枠組みを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 10:08:05 GMT)
ACCESS DENIED INC: The First Benchmark Environment for Sensitivity Awareness [2.6] 大規模言語モデル(LLM)は、様々な文書フォーマットからテキストを処理する能力のため、企業データ管理にとってますます価値が増している。
この研究は、敏感な言語モデルの基礎を確立し、企業環境におけるプライバシ中心のAIシステムを強化するための洞察を提供する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 18:50:29 GMT)
Forecasting at Full Spectrum: Holistic Multi-Granular Traffic Modeling under High-Throughput Inference Regimes [2.4] 本稿では,新しい交通予測モデルを用いた効率的な霧分散推論システムであるMultiGranGranSTG-Fogを提案する。
提案アルゴリズムは,生成した動的トラヒックグラフ上でのGA-Fog機能融合を利用して,トラフィックのダイナミクスをフルキャプチャする。
実世界のデータセットに対する大規模な実験は、提案手法が選択されたGCNベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 07:28:58 GMT)
Multi-level Advantage Credit Assignment for Cooperative Multi-Agent Reinforcement Learning [2.3] クレジットの割り当てには、共有報酬に対する各エージェントの貢献を評価することが含まれる。
本研究では,報酬を得るために協力するエージェントの数として,クレジット割り当てレベルを定式化する。
異なるレベルにまたがってクレジットを推測するために、明示的な対実的推論を行うマルチレベル・アドバンテージの定式化を導入する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:36:08 GMT)
Reconstruction of Solar EUV Irradiance Using CaII K Images and SOHO/SEM Data with Bayesian Deep Learning and Uncertainty Quantification [2.3] 太陽極端紫外線(EUV)は、地球の電離圏、熱圏、中間圏の加熱に重要な役割を果たしている。
複数の太陽周期にまたがるEUVフラックスの長期的進化を研究する研究はほとんどない。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 18:05:26 GMT)
Vec2Summ: Text Summarization via Probabilistic Sentence Embeddings [2.2] Vec2Summはセマンティック埋め込み空間における1つの平均ベクトルを用いて文書コレクションを表現する。
生成言語モデルを用いて流動的な要約を再構築する。
Vec2Summは、局所的に焦点を絞った順序不変コーパスのためのコヒーレントなサマリーを生成する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:31:02 GMT)
Score Before You Speak: Improving Persona Consistency in Dialogue Generation using Response Quality Scores [2.2] ペルソナに基づく対話生成は、対話型人工知能を構築するための重要なマイルストーンである。
本稿では,従来の手法よりも優れたSBS(Score-Before-Speaking)を提案する。
スコア条件付きトレーニングにより、既存のモデルにより、ペルソナと一貫性のある対話のスペクトルをよりよく捉えることができることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:30:06 GMT)
Simulating Biological Intelligence: Active Inference with Experiment-Informed Generative Model [2.0] 実施エージェントの意思決定をモデル化するための,能動的推論に根ざしたフレームワークを提案する。
実験インフォームド生成モデルを用いて,シミュレーションゲーム環境における意思決定過程をシミュレートする。
知的意思決定における記憶に基づく学習と予測計画の役割について考察した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 13:26:38 GMT)
Resisting AI Solutionism through Workplace Collective Action [1.9] 2024年秋から、ミシガン大学におけるAI対応労働代替の不安定さと脅威に直面する中で、労働者と学生のグループが「AI抵抗」プロジェクトについて協力してきた。
このワークショップでは、これまで採用してきた戦略、集団的抵抗への挑戦、大学内のAIに抵抗する労働者としての私たちの役割について、私たちのリフレクションを取り入れています。
この研究の目的は、技術者、学生、そして彼らの大学におけるAIテクノソリューション主義に抵抗しようとするスタッフに対して、具体的なインスピレーションを提供することです。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:07:03 GMT)
SafePLUG: Empowering Multimodal LLMs with Pixel-Level Insight and Temporal Grounding for Traffic Accident Understanding [1.9] MLLM(Multimodal large language model)は、様々な視覚言語タスクにおいて顕著な進歩を遂げている。
本稿では,Pixel-Level Understanding と temporal Grounding を併用して,交通事故の包括的解析を可能にする新しいフレームワークであるSafePLUGを提案する。
多様な事故シナリオに着目したマルチモーダルな質問応答ペアを含む新しいデータセットを,詳細なピクセルレベルのアノテーションと時間的イベント境界でキュレートする。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 00:25:24 GMT)
A Practice of Post-Training on Llama-3 70B with Optimal Selection of Additional Language Mixture Ratio [1.7] 大規模言語モデル(LLM)は、慣れていない言語スキルを得たり、新しいドメインに適応するために、継続事前訓練(CPT)を必要とすることが多い。
本研究では, 言語混合比 (ALMR) と学習率 (LR) の最適相関を, 最適実験装置を直接示す8Bサイズで検討する。
LLMの最終70Bバージョンを実生活チャットシステムに展開し、満足な性能を得る。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:20:09 GMT)
High-Fidelity Microwave-Polarization Control in a Rydberg-Ensemble Experiment [1.7] マイクロ波の偏光の制御は、多くの原子物理学プラットフォームにおいて重要な実験能力である。
ここでは,Rydbergアンサンブル実験において,高忠実度マイクロ波偏光を発生可能なマイクロ波制御システムを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 04:42:12 GMT)
Conformal Prediction and Trustworthy AI [1.7] コンフォーマル予測器は1990年代にガマーマン、ヴォフク、研究チームによって開発され、信頼度が保証されたセット予測を提供するために開発された。
近年、彼らは人気を博し、機械学習コミュニティにおける不確実性定量化の主流の方法論となっている。
本稿では、その限界有効性を超えて、信頼に値するAIに寄与するコンフォーマル予測の可能性についてレビューする。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:28:59 GMT)
ScamDetect: Towards a Robust, Agnostic Framework to Uncover Threats in Smart Contracts [1.6] ScamDetectは、分散型エコシステムの将来に向けて、積極的にスケーラブルなセキュリティを実現することを目的としている。
本稿では,スマートコントラクトマルウェア検出のための堅牢でモジュール的でプラットフォームに依存しないフレームワークであるScamDetectのビジョンを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 20:38:07 GMT)
Resource-efficient algorithm for estimating the trace of quantum state powers [1.5] 量子状態のトレースを$textTr(rhok)$, for $k$等量子状態と見積もるのは基本的な課題である。
我々は,$mathcalO(widetilder)$ qubitsと$mathcalO(widetilder)$ multi-qubit gatesのみを必要とするアルゴリズムを導入する。
我々はアルゴリズムを拡張して、任意のオブザーバブルに対して$textTr(Mrhok)$と$textTr(rho)を推定します。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:56:05 GMT)
Counter-propagating Entangled Photon Pairs from a Monolayer [1.4] 原子間物質中の非相整合自発的パラメトリックダウンコンバージョンは、新しい自由度と量子情報容量の増強をもたらす。
これらのシステムは量子コンピューティング、通信、イメージングのための有望なプラットフォームとして登場した。
共分散光子対と逆伝播光子対の測定によりモデルの有効性を実験的に検証した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 07:00:30 GMT)
Hide or Highlight: Understanding the Impact of Factuality Expression on User Trust [1.2] 我々は、事実性評価を伴うAI生成出力を開示する4つの異なる方法を試した。
その結果,不透明であいまいな戦略が,回答の品質を維持しながら,信頼度を高めていることがわかった。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 20:45:21 GMT)
Technical Report: Full-Stack Fine-Tuning for the Q Programming Language [1.2] 我々はQ言語の評価データセットをリリースする。
データセット上で主要なフロンティアモデルをベンチマークし、事前トレーニング、教師付き微調整、強化学習を行います。
我々の最高のモデルは、Qベンチマークで59%のパス@1精度を実現し、最高のパフォーマンスのフロンティアモデルを上回っています。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 04:22:07 GMT)
Data-Efficient Neural Training with Dynamic Connectomes [1.2] 本稿では,神経活動の発達を機能的コネクトームとして表現することで,ニューラルネットワークのトレーニングダイナミクスを特徴付ける新しいアプローチを提案する。
これらのシグネチャは,ネットワークの機能的構造において重要な遷移を効果的に捉えていることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 04:32:23 GMT)
TerraMAE: Learning Spatial-Spectral Representations from Hyperspectral Earth Observation Data via Adaptive Masked Autoencoders [1.2] 多様な地理空間解析のための空間スペクトル埋め込みを高度に代表的に学習するために設計された新しいHSI符号化フレームワークTerraMAEを紹介する。
高忠実度画像再構成における空間-スペクトル情報保存によるその効果を実証する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:32:22 GMT)
AGIC: Attention-Guided Image Captioning to Improve Caption Relevance [1.2] 本稿では,キャプション生成のガイドとして,特徴空間の視覚領域を直接増幅するアテンションガイド画像キャプションを提案する。
Flickr8kとFlickr30kのデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:42:25 GMT)
Balancing Privacy and Efficiency: Music Information Retrieval via Additive Homomorphic Encryption [1.2] 生成AIの時代において、音楽データのプライバシを確保することは、ユニークな課題である。
著作権ライセンスのような伝統的手法は、これらの抽象数学的表現を限定的に保護する。
プライバシー保護類似性検索を実現するために,音楽埋め込みの内積を通した効率的なAHEベースのソリューションを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 17:00:34 GMT)
Conformal Set-based Human-AI Complementarity with Multiple Experts [1.2] 本研究は、複数の人間専門家のプールからインスタンス固有の専門家を選定することに焦点を当てる。
我々は、共形集合を利用して、インスタンスの分類に使用される専門家予測のサブセットを識別するグリーディアルゴリズムを導入する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:17:51 GMT)
SPARE: Securing Progressive Web Applications Against Unauthorized Replications [1.1] 悪意のある開発者は、PWA Webリンクを重複させて偽造ネイティブアプリを作成することで、プログレッシブWebアプリケーションを利用することができる。
本稿では,このような攻撃を防御したり軽減したりするための,クエリパラメータに基づく実用的なセキュリティソリューションを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 17:40:13 GMT)
OctreeNCA: Single-Pass 184 MP Segmentation on Consumer Hardware [1.1] 医療アプリケーションは、前立腺MRI、病理診断スライス、手術のビデオなどの大きな入力のセグメンテーションを要求する。
大きな入力をセグメント化すると、GPUのVRAM消費がボトルネックとなる。
我々は、評価中にUNetよりも90%少ないVRAMを占有しながら、高解像度の画像やビデオを素早くセグメントするNAA推論機能を実装した。
これにより184個の病理スライスや1分間の手術ビデオを同時に分割することができます。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:11:26 GMT)
Sensory robustness through top-down feedback and neural stochasticity in recurrent vision models [0.9] 我々は、トップダウンフィードバックプロジェクションの有無のイメージ分類について、畳み込みリカレントニューラルネットワーク(ConvRNN)を訓練した。
トップダウンフィードバックを持つConvRNNは、ノイズの摂動や敵の攻撃に対して、顕著な速度精度のトレードオフと堅牢性を示した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 22:51:50 GMT)
Towards Safer AI Moderation: Evaluating LLM Moderators Through a Unified Benchmark Dataset and Advocating a Human-First Approach [0.9] 大規模言語モデル(LLM)は、複雑さとパフォーマンスにおいて、以前のモデルを上回る優れた機能を示している。
彼らは、これらの問題の主観的で文脈に依存した性質のために、暗黙の憎しみ、攻撃的な言葉、性別の偏見を検出するのに苦労している。
我々は、人間の感情や攻撃行動を評価するために、最先端(SOTA)モデルに基づく実験フレームワークを開発した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 18:00:27 GMT)
Electron charge coherence on a solid neon surface [0.9] 最近の実験では、固体ネオン表面上の単一電子電荷量子ビットの0.1msコヒーレンス時間を示す。
固体ネオン上の電子電荷(横運動)状態の脱コヒーレンス機構に関する理論的研究を行う。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 09:28:21 GMT)
Zero-Direction Probing: A Linear-Algebraic Framework for Deep Analysis of Large-Language-Model Drift [0.9] ZDPは、タスクラベルや出力評価を使わずに、トランスフォーマーアクティベーションの無効方向からモデルドリフトを検出するための理論のみのフレームワークである。
非漸近尾境界と濃度不等式を持つスペクトル核漏れ測定値が導出され,ガウスヌルモデルの下でのドリフトに対するa-プリオリしきい値が得られた。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:05:59 GMT)
Structure-Preserving Digital Twins via Conditional Neural Whitney Forms [0.9] 潜在変数Zに条件付き有限要素モデルの構造保存に基づくリアルタイムディジタルツインを構築するためのフレームワークを提案する。
このアプローチでは、有限要素基底の減少と非線形保存則の両方を学ぶために条件付き注意機構を用いる。
フレームワークは従来の有限要素機械と非侵襲的に相互作用し、複雑なジオメトリを処理できる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 13:26:44 GMT)
Large Language Models Do Not Simulate Human Psychology [0.8] 一部の研究は、Large Language Models (LLM) が人間の心理学をシミュレートできるかもしれないことを示唆している。
我々は、LLMが人間の心理学をシミュレートする仮説に対する概念的議論を提供する。
LLMとヒトの反応に顕著な相違が生じていることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 11:56:59 GMT)
Energy Efficient Task Offloading in UAV-Enabled MEC Using a Fully Decentralized Deep Reinforcement Learning Approach [0.7] 無人航空機(UAV)は近年,マルチアクセスエッジコンピューティング(MEC)においてエッジサーバとして利用されている。
UAVの軌道を設計して、集中的な実行なしに完全に分散化されたセットアップを確保することが望ましい。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 07:24:12 GMT)
Large Language Models Don't Make Sense of Word Problems. A Scoping Review from a Mathematics Education Perspective [0.7] ChatGPTのような大規模言語モデル(LLM)の進歩は、どのように教育に組み込むことができるのかという疑問を提起する。
LLMは手軽にテキスト入力を処理できるので、数学的な単語問題を解くのに適しているように見える。
しかし、彼らの本当の能力、それが現実世界の文脈を理解できるかどうか、そして教室への影響は、いまだに不明である。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 21:42:21 GMT)
VideoSAVi: Self-Aligned Video Language Models without Human Supervision [0.7] VideoSAViは、ビデオ-LLMが外部の監督なしにビデオコンテンツから学ぶことができる自己学習パイプラインである。
我々のアプローチは、モデルの初期応答における推論エラーを識別する自己記述機構を含む。
VideoSAViは、複数のベンチマークで大幅に改善されている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:39:33 GMT)
Robust Behavior Cloning Via Global Lipschitz Regularization [0.6] 行動クローニングは効果的な模倣学習技術であり、自動運転車のような安全上重要な領域でも採用されている。
我々は、学習したポリシーネットワークの堅牢性を高めるために、グローバルなリプシッツ正規化アプローチを使用する。
ポリシの堅牢性を保証するために,リプシッツニューラルネットワークを構築する方法を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:01:55 GMT)
Unambiguous discrimination of the change point for quantum channels [0.5] 量子チャネルが変化した場合の正確な瞬間を特定することは、量子情報理論の基本的な問題である。
チャネルが他のチャネルに遷移する時刻を正確に決定する方法について検討する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:26:58 GMT)
Hybrid Machine Learning Framework for Predicting Geometric Deviations from 3D Surface Metrology [0.5] 本稿では,高分解能な3Dスキャナーを用いて,異なるバッチで生成された237個のコンポーネントから多角面データを取得する手法を提案する。
データは正確なアライメント、ノイズ低減、マージによって処理され、正確な3D表現を生成する。
提案手法は,従来の統計的プロセス制御法よりも73%向上し,95%信頼度で0.012mmの予測精度を達成した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 05:59:35 GMT)
Toward Errorless Training ImageNet-1k [0.4] 我々は、ImageNet 2012コンテストデータセットに基づいてトレーニングされたフィードフォワード人工ニューラルネットワークについて述べる。
最高の性能モデルは322,430,160のパラメータを使用し、4つの10桁の精度を持つ。
我々は、我々のモデルが100%精度を達成できない理由は、二重ラベル問題に起因すると推測する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:35:03 GMT)
Evaluation of State-of-the-Art Deep Learning Techniques for Plant Disease and Pest Detection [0.4] 本研究は、植物病や害虫を画像から検出するためのコンピュータによる最新の技術についてレビューする。
この研究は、システム設計の課題について議論し、解決策を提案し、将来的な研究の方向性を概説することで締めくくられる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:23:33 GMT)
BrainATCL: Adaptive Temporal Brain Connectivity Learning for Functional Link Prediction and Age Estimation [0.3] 本稿では、適応的時間的脳接続学習のための非教師なしノンパラメトリックフレームワークBrainATCLを提案する。
提案手法は,新たに追加されたエッジのレートに基づいて,スナップショット毎のルックバックウィンドウを動的に調整する。
グラフシーケンスはGINE-Mamba2バックボーンを用いて符号化され、静止状態fMRIデータにおける動的機能接続の時空間表現を学習する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 21:18:25 GMT)
Taking the Garbage Out of Data-Driven Prediction Across Climate Timescales [0.3] 気候予測のために設計されたAI/MLモデルの入力データの適切な前処理のためのプロトコルを確立する。
事前処理が気候予測に与える影響について、研究者、開発者、エンドユーザを教育すること。
最終的に、推奨プラクティスを実装することで、気候予測研究におけるAI/MLの堅牢性と透明性が向上する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 17:55:38 GMT)
Explainable AI for Curie Temperature Prediction in Magnetic Materials [0.2] NEMADデータベースを用いて,磁性材料のキュリー温度を予測する機械学習手法について検討する。
Extra Trees Regressorは、バランスの取れたデータセットに対して、最大0.85$pm$0.01のR2スコアに達する最高のパフォーマンスを提供します。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:13:00 GMT)
Deep Learning for School Dropout Detection: A Comparison of Tabular and Graph-Based Models for Predicting At-Risk Students [0.2] 学生の退学は、世界中の教育システムにおいて重要な課題である。
グラフニューラルネットワーク(GNN)は、グラフとして構造化された場合、学生データに固有の複雑な関係をキャプチャすることで潜在的な利点を提供する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:19:32 GMT)
Maximum Dispersion, Maximum Concentration: Enhancing the Quality of MOP Solutions [0.1] 多目的最適化問題(MOP)は、しばしば相反する目的間のトレードオフを必要とし、目的空間における多様性と収束を最大化する。
本研究では, 決定空間における分散と, 目的空間の特定の領域における収束を最適化することにより, MOPソリューションの品質を向上させる手法を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 23:59:46 GMT)
Investigating the Impact of Large-Scale Pre-training on Nutritional Content Estimation from 2D Images [0.1] 画像から食物の栄養含量を推定することは、健康と食事のモニタリングに重要な意味を持つ重要な課題である。
本稿では,2次元画像のみを用いた栄養推定のためのディープラーニングモデルの性能に及ぼす大規模事前学習データセットの影響について検討する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:06:26 GMT)
Enhancing Decision Space Diversity in Multi-Objective Evolutionary Optimization for the Diet Problem [0.1] 本稿では,ハミング距離に基づく均一度尺度をMOEAの選択機構に直接組み込むアプローチを提案する。
ダイエット問題の多目的定式化実験は,提案手法が決定空間の多様性を著しく改善することを示す。
提案手法は、意思決定空間認識をMOEAに統合するための一般化可能な戦略を提供する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:04:12 GMT)
Who's the Evil Twin? Differential Auditing for Undesired Behavior [0.0] 赤いチームは2つの類似したモデルをトレーニングします。1つは良性データのみをトレーニングし、もう1つは隠れた有害な振る舞いを含むデータに基づいてトレーニングします。
我々は、CNNを用いて、ガウスノイズ分析、モデル拡散、統合勾配、敵攻撃など、様々なブルーチーム戦略を試す。
その結果、敵攻撃に基づく手法(100%正解、ヒントを用いた予測)の精度が高く、非常に有望であることがわかった。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 04:57:38 GMT)
VesselRW: Weakly Supervised Subcutaneous Vessel Segmentation via Learned Random Walk Propagation [0.0] 皮下血管セグメンテーションに特化した弱教師付きトレーニングフレームワークを提案する。
臨床皮下画像データセットを用いた実験では, スパースラベルと従来型の濃密な擬似ラベルによるナイーブトレーニングを一貫して上回っている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 04:34:54 GMT)
Variational-toolbox-based separability detection of multiqubit states [0.0] そこで本稿では,純状態の$k$-セパビリティを,合成ノイズの有無に関わらず識別するための変分ツールボックスを提案する。
また、混合状態の$k$-セパビリティを検出するための適応最適化手法も導入する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 02:28:12 GMT)
Unidirectional Key Update in Updatable Encryption, Revisited [0.0] 誤り鍵カプセル化を用いたFrodoPKE学習に基づく,効率的なアップダスタブル暗号方式を構築する。
提案手法の安全性を,ランダ-イン-eu-cpaモデル内の後方リーク一方向設定で解析する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 00:32:48 GMT)
Two-Stage Quranic QA via Ensemble Retrieval and Instruction-Tuned Answer Extraction [0.0] Quranic Question Answeringは、古典アラビア語の言語的複雑さと宗教テキストの意味的な豊かさによって、ユニークな課題を提起している。
本稿では,経路抽出と解答抽出の両方に対処する新しい2段階フレームワークを提案する。
提案手法では, MAP@10が0.3128, MRR@10が0.5763, pAP@10が0.669である。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:37:19 GMT)
The taggedPBC: Annotating a massive parallel corpus for crosslinguistic investigations [0.0] 本稿では,この問題に部分的に対処するために開発された,大規模タグ付き並列データセットについて報告する。
タグ付きPBCは、1,940以上の言語からPOSタグ付き平行テキストデータを含み、155の言語ファミリーと78の分離体を表す。
このデータセットの特定のタグの精度は、既存のSOTAタグと高いソース言語の両方とよく相関している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 04:32:28 GMT)
Text to Speech System for Meitei Mayek Script [0.0] 音節音韻学および低リソース言語環境に適応したニューラルTSアーキテクチャを提案する。
We developed a phoneme mapping for Meitei Mayek to ARPAbet, curate a single-speaker dataset, and demonstrate intelligible and natural speech synthesis。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 07:40:53 GMT)
Surgical Knowledge Rewrite in Compact LLMs: An 'Unlearn-then-Learn' Strategy with ($IA^3$) for Localized Factual Modulation and Catastrophic Forgetting Mitigation [0.0] 本稿では,大規模言語モデルにおける正確な知識編集のための新しい「未学習学習戦略」を紹介し,評価する。
2段階のアプローチは、競合する事実を符号化する原因となる特定の内部コンポーネントを特定し、ターゲットとする初期回路ローカライゼーションフェーズによって実現される。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 18:48:25 GMT)
Strengthening False Information Propagation Detection: Leveraging SVM and Sophisticated Text Vectorization Techniques in comparison to BERT [0.0] 本研究では,機械学習と自然言語処理,具体的にはSVM(Support Vector Machines)とBERTを用いて偽ニュースを検出する。
SVMには、TF-IDF(Term Frequency Inverse Document Frequency)、Word2Vec(Word2Vec)、Bag of Words(BoW)の3つの異なるテキストベクトル化手法を用いる。
これらの手法を変換器の大規模言語モデルであるBERTと比較し,最も効果的な手法を決定する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:10:02 GMT)
Squeezed Magnons-Induced Nonreciprocal Entanglement in a Magnomechanical Cavity [0.0] 本研究では,マグノン,光子,フォノン間の非相互マクロな絡み合いを実現するための新しい理論機構を提案する。
従来の手法とは対照的に、圧縮モードの振幅と位相の正確な制御が、絡み合いの調整可能な非相互性を得るのにどう役立つかを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:15:22 GMT)
Spin Squeezing Enhanced Quantum Magnetometry with Nitrogen-Vacancy Center Qutrits [0.0] 量子磁気学における量子スピンスクイーズの有用性を探求し,ダイヤモンド中の3レベル窒素空洞(NV)中心に焦点をあてる。
以上の結果から,クエトリットとスピンスクイーズを併用すると,デフォーカス効果に制約された磁力測定精度が向上することが明らかとなった。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 16:23:18 GMT)
Rotation Errors Due to Field Quantization for Simultaneously Driven Atoms [0.0] コヒーレントまたは準古典状態の電磁場を用いて2レベル原子のアンサンブルを同時に駆動すると、場の量子的性質は、完全に古典的な場に対して予測されるものと異なる原子状態を引き起こす。
これは、ゲートがレーザーによる原子の回転である量子論理ゲートにおける潜在的なエラー源である。
我々は、圧縮された状態の使用や、古典的な磁場処理から期待されるものと異なる分野と原子間の相互作用時間を調整することを含む、エラーを軽減する可能性について論じる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:37:53 GMT)
Rethinking Theoretical Illumination for Efficient Low-Light Image Enhancement [0.0] 本稿では、CPGA-Net+と呼ばれるChannel-Prior and Gamma-Estimation Network(CPGA-Net)の拡張版を紹介する。
私たちは、同じ設計原則に従って、超軽量とより強力なバージョンの両方を導入します。
提案手法は近年の軽量手法と比較して有効に検証されている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:45:18 GMT)
Perturbation-theory approach for predicting vibronic selectivity by entangled-photon-pair absorption [0.0] 超広帯域光子に励起された二原子系の振動数に対する近似式を導出した。
本結果は,2次摂動理論における通常の近似を超えることが重要であることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 23:21:46 GMT)
Per-sender neural network classifiers for email authorship validation [0.0] ビジネスメールの妥協や横槍によるフィッシング攻撃は、現代組織にとって最もコストがかかり、被害を被る脅威のひとつだ。
オーサシップバリデーションはライトウェイトでリアルタイムなディフェンスで、従来の検出方法を補完する。
著者の検証作業に対して,ネイブベイズモデルと文字レベルの畳み込みニューラルネットワーク(Char-CNN)の2つの分類器を評価した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 17:58:16 GMT)
PANAMA: A Network-Aware MARL Framework for Multi-Agent Path Finding in Digital Twin Ecosystems [0.0] ネットワークマルチエージェント強化学習(MARL)に基づくマルチエージェントパス探索(MAPF)のための優先非対称性を持つ新しいアルゴリズムであるPANAMAを紹介する。
提案手法は,既存のベンチマークと比較して,精度,速度,スケーラビリティにおいて優れたパスフィンディング性能を示す。
PanAMAは、ネットワーク対応意思決定と堅牢なマルチエージェント調整のギャップを埋め、DT、無線ネットワーク、AI駆動自動化のシナジーを前進させる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 00:59:55 GMT)
On the electromagnetic couplings in superconducting qubit circuits [0.0] 本稿では,超伝導デバイスの基本電磁結合機構の包括的理論的検討を行う。
動作方程式を定式化し、マルチポートマイクロ波ネットワークに結合された単一共振器、相互作用共振器、結合伝送線路を含む標準系の入力出力関係を導出する。
本稿では, エネルギー減衰率 (Kappa) や非次元結合係数 (zeta) といった重要なパラメータに対する厳密な定義を概観し, 電磁シミュレーションによるパラメータ抽出の実践的手法と結合する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:28:49 GMT)
Nonequilibrium Phase Transitions in Large $N$ Matrix Quantum Mechanics [0.0] 差分跳躍項を持つリンドブラッドマスター方程式に従う大容量N$ 1-行列量子力学の平面極限について検討する。
平面的未ゲージ行列量子力学における非平衡相転移について検討する。
我々は、駆動散逸性Kerr共振器の量子光学文献で最近報告されたものと類似した非平衡相転移の証拠を見いだす。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 22:59:48 GMT)
Neural Network-Based Detection and Multi-Class Classification of FDI Attacks in Smart Grid Home Energy Systems [0.0] False Data Injection Attacks (FDIA)は、スマートグリッドインフラストラクチャに重大な脅威をもたらす。
本稿では、住宅エネルギーデータを用いたFDIAの検出と分類のための機械学習ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 18:27:31 GMT)
Mind the Gap: From Resolving Theoretical Foundations of Chiral(ity)-Induced Spin Selectivity to Pioneering Implementations in Quantum Sensing [0.0] キラル(シティ)によるスピン選択性(CISS)効果は実験的に広く観測されているが、その理論的基礎は現在も活発に議論されている。
CISS効果の最近の研究は、スピントロニクス、分子センサー、量子情報処理における幅広い概念的関連性と潜在的な応用を強調している。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:44:21 GMT)
Making Effective Decisions: Machine Learning and the Ecogame in 1970 [0.0] 本稿では,1970年のイノベーティブアートプロジェクトであるエコガメについて考察する。
ライブネットワーク上でのシミュレーションと早期機械学習技術を用いて、エコゲームは視覚芸術のパワーと、適応、フィードバック、制御というサイバネティックな概念を組み合わせて、行動が全体システムに影響を及ぼすと提案した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:51:26 GMT)
Magic States in the Asymmetric Quantum Rabi Model [0.0] マジックまたは非安定化器性(英: Magic or non-stabilizerness)は、量子コンピューティングのリソースであり、キュートネットワークで広く研究されている。
我々は、量子光学のパラダイムモデルである非対称量子ラビモデルにおいて魔法を研究する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 16:08:48 GMT)
Jet Image Tagging Using Deep Learning: An Ensemble Model [0.0] 我々は2つのニューラルネットワークを同時にアンサンブルとして使用し、様々なジェットタイプをタグ付けする。
ジェットデータを高次元空間の点として表現するのではなく、2次元ヒストグラムに変換する。
上述のジェットクラスに対して、アンサンブルモデルが二項分類と多項分類の両方に利用できることを示す。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 17:40:15 GMT)
Improving the Rate-Loss Scaling in Polarization Entanglement Distribution using Single-Click Entanglement Swapping [0.0] 偏光絡みは損失の影響を受けやすいが、より正確には、損失チャネルにおける伝達速度は、チャネルの透過率であるO(eta)のスケーリングによって制限される。
ここでは、このレートロススケーリングの限界を比較的単純なプロトコルで克服できることを実験的に実証する。
これは偏光子-光子数のハイブリッド絡み合いとワンクリック絡み合わせのアイデアを統合することで可能となる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 04:56:45 GMT)
Improving Real-Time Concept Drift Detection using a Hybrid Transformer-Autoencoder Framework [0.0] 応用機械学習では、概念ドリフトはモデルの性能を著しく低下させる。
本研究では,複雑な時間力学をモデル化するためのトランスフォーマーとオートエンコーダを組み合わせたハイブリッドフレームワークを提案する。
以上の結果から,トランスフォーメーション・オートエンコーダは,文献で一般的に用いられるオートエンコーダよりも早く,より感度の高いドリフトを検出した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:39:33 GMT)
GreenMind: A Next-Generation Vietnamese Large Language Model for Structured and Logical Reasoning [0.0] CoT(Chain-of-Thought)は、最終回答を生成する前に中間推論ステップを必要とするLCMタスクに取り組むための堅牢なアプローチである。
グループ相対政策最適化に基づく微調整戦略に触発されたベトナムの推論モデルであるGreenMind-Medium-14B-R1を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:54:48 GMT)
Geometry-Controlled Freezing and Revival of Bell Nonlocality through Environmental Memory [0.0] 構造された貯水池に結合された2つの量子ビット間の距離は、ベル非局所性を保存、再生、抑制できる単一の幾何学的制御として機能することを示す。
結果は解析的に解決可能なモデルに依存しており、現在の超伝導やナノフォトニックプラットフォームと互換性がある。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 17:08:03 GMT)
Future progress in artificial intelligence: A survey of expert opinion [0.0] 数十年後には、高レベルのマシンインテリジェンスと超知能AIが登場するのではないか、という懸念がある。
専門家は、30年足らずでシステムは超知能に移行すると予想している。
彼らは、この開発が人類にとって「悪い」あるいは「非常に悪い」ことが判明した3分の1の確率を見積もっている。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:34:53 GMT)
Fusion-Based Brain Tumor Classification Using Deep Learning and Explainable AI, and Rule-Based Reasoning [0.0] 本研究では,MobileNetV2とDenseNet121畳み込みニューラルネットワーク(CNN)を組み合わせたアンサンブルに基づくディープラーニングフレームワークを提案する。
モデルは、階層化された5倍のクロスバリデーションプロトコルを使用して、Figshareデータセット上でトレーニングされ、評価された。
このアンサンブルは個々のCNNよりも優れた性能を示し、精度は91.7%、精度は91.9%、リコールは91.7%、F1スコアは91.6%だった。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:46:36 GMT)
From Imitation to Optimization: A Comparative Study of Offline Learning for Autonomous Driving [0.0] この研究は、この制限に対処するための包括的なパイプラインと比較研究を提示している。
まず,BC(Behavimental Cloning)ベースラインの開発について述べる。
次に、最先端のオフライン強化学習アルゴリズムである保守的Qラーニング(CQL)を同じデータとアーキテクチャに適用することにより、より堅牢なポリシーを学習できることを実証する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 16:03:10 GMT)
FoundBioNet: A Foundation-Based Model for IDH Genotyping of Glioma from Multi-Parametric MRI [0.0] 我々は,多パラメータMRIから非侵襲的にIDH変異を予測できるFoundBioNet(FoundBioNet)を提案する。
1705人のグリオーマ患者を6つの公開データセットから多施設で訓練し, 評価した。
我々のモデルは、EGD、TCGA、Ivy GAP、RHUH、UPennの独立したテストセットに対して90.58%、88.08%、65.41%、および80.31%のAUCを達成した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 00:08:10 GMT)
Edge Detection for Organ Boundaries via Top Down Refinement and SubPixel Upsampling [0.0] 深層畳み込みネットワーク(ConvNets)は、自然画像上のほぼ人間に近い性能に高度な汎用エッジ検出を行う。
それらの出力は、医学的応用において特に有害な、正確な局所化を欠くことが多い。
医用画像に新しいトップダウン・バックワード・リファインメント・アーキテクチャを適用した医療用クリップエッジ検出器を提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 03:28:12 GMT)
EU Digital Regulation and Guatemala: AI, 5G, and Cybersecurity [0.0] 本稿は、グアテマラにおける超国家的統治と形成政策として、AI、5G、サイバーセキュリティにおけるEUのルールがどのように機能するかを検討する。
AI Actのリスクアプローチ、5G Action PlanとSecurity Toolbox、ENISA、NIS2、サイバーセキュリティ法、サイバー回復法に基づくサイバーセキュリティ体制について概説している。
グアテマラ特有の影響としては、中小企業のコンプライアンスコスト、調達制限、ロールアウト時の環境トレードオフ、権利リスク、キャパシティギャップなどがある。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 03:34:18 GMT)
DualResolution Residual Architecture with Artifact Suppression for Melanocytic Lesion Segmentation [0.0] メラノサイト腫瘍セグメンテーションに特化して設計されたResNetにインスパイアされた新しいデュアルレゾリューションアーキテクチャであるOur法を紹介する。
本手法は, 細粒度境界情報を保存した完全分解能ストリームを維持し, プールストリームは, 頑健な病変認識のために, 複数スケールのコンテキストキューを集約する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 04:30:34 GMT)
DiffUS: Differentiable Ultrasound Rendering from Volumetric Imaging [0.0] 術中超音波画像検査は、多数の外科手術中にリアルタイムのガイダンスを提供する。
しかし、その解釈はノイズ、ボリュームアーティファクト、高分解能MRI/CTスキャンとの整合性に複雑である。
本稿では,体積像から実写のBモード像を合成する物理ベースの反射法DiffUSを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:04:11 GMT)
Designing a Feedback-Driven Decision Support System for Dynamic Student Intervention [0.0] 教育におけるほとんどの機械学習モデルは静的であり、インターベンション後の結果のような新しいデータが利用可能になると適応できない。
本稿では,連続的なモデル改善を実現するクローズドループアーキテクチャを用いたフィードバック駆動決定支援システムを提案する。
このシステムはLightGBMベースの回帰器をインクリメンタルなリトレーニングと統合し、教育者が最新の学生結果を入力し、自動的にモデル更新をトリガーする。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 21:24:54 GMT)
DSperse: A Framework for Targeted Verification in Zero-Knowledge Machine Learning [0.0] DSperseは、暗号検証による分散機械学習推論のためのフレームワークである。
複数の証明システムを用いてDSperseを評価し,メモリ使用量,実行時間,回路動作に関する実験結果を報告する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 12:38:18 GMT)
Context Engineering for Multi-Agent LLM Code Assistants Using Elicit, NotebookLM, ChatGPT, and Claude Code [0.0] 大規模言語モデル(LLM)は、コード生成とソフトウェアエンジニアリングタスクの自動化において有望であることを示しているが、コンテキスト制限と知識ギャップのため、複雑なマルチファイルプロジェクトに苦戦することが多い。
ユーザ要求を明確にするIntent Translator (GPT-5)、ドメイン知識を注入するElicitを利用したセマンティック文献検索、コンテキスト理解のためのNotebookLMベースの文書合成、コード生成と検証のためのClaude Codeマルチエージェントシステムなど、複数のAIコンポーネントを組み合わせた新しいコンテキストエンジニアリングワークフローを提案する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 14:45:53 GMT)
Complex entanglement entropy for complex conformal field theory [0.0] コンフォーマル場の理論は、量子多体系の臨界基底状態の根底にある。
非エルミート五状態ポッツモデルの複素絡みエントロピーを数値計算する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 13:48:02 GMT)
Collective Reasoning Among LLMs: A Framework for Answer Validation Without Ground Truth [0.0] いくつかの先進的な大規模言語モデルが複雑で博士レベルの確率問題を生成・解き出す新しいアプローチを導入する。
本研究は, 多様なモデル間の合意が, アウトプットの信頼性を如何に示すかに焦点を当てる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 01:28:54 GMT)
Cognitive Cybersecurity for Artificial Intelligence: Guardrail Engineering with CCS-7 [0.0] CCS-7は、人間の認知セキュリティ研究に根ざした7つの脆弱性の分類である。
12180の実験でTFVAスタイルのガードレールを7つの多様な言語モデルアーキテクチャ上で評価した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 15:46:30 GMT)
Between Fear and Desire, the Monster Artificial Intelligence (AI): Analysis through the Lenses of Monster Theory [0.0] 本研究は,モンスター理論の7つの論点を通じて,AIの知覚と開発について議論することを目的とする。
モンスターと同じように、AIは本質的に複雑であり、独立した実体としてではなく、特定の社会や文化の中で研究されるべきである。
この研究で示されているように、AIとモンスターの関係は、最初ほど奇妙ではないようだ。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 08:35:14 GMT)
Approaching Maximal Information Extraction in Low-Signal Regimes via Multiple Instance Learning [0.0] より正確な予測を得るために,機械学習(ML)手法を提案する。
提案手法では,データセットに潜伏する理論上の最大漁獲量の抽出が可能である可能性が示唆された。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 22:46:55 GMT)
Anatomy of a Machine Learning Ecosystem: 2 Million Models on Hugging Face [0.0] 本稿では,モデル開発をリードするピアプロダクションプラットフォームであるHugging Faceの186万モデルについて分析する。
進化生物学のレンズを用いて、モデルファミリー上の形質の遺伝的類似性と突然変異を測定する。
その結果、モデルが同じモデルファミリーに属すると、遺伝的マーカーや形質が重なり合う傾向にあることがわかった。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 04:08:49 GMT)
Algorithmic Collusion of Pricing and Advertising on E-commerce Platforms [0.0] オンライン販売者は、Eコマースプラットフォーム上で製品価格と広告決定を自動的に行うためにAI学習アルゴリズムを採用してきた。
アルゴリズムは競争力よりも高いコーディネートを学習する。
販売者が価格決定と広告決定を一緒に行う場合、これらの懸念が有効かどうかを実証的に検討する。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 18:44:17 GMT)
Age-Normalized HRV Features for Non-Invasive Glucose Prediction: A Pilot Sleep-Aware Machine Learning Study [0.0] 年齢正規化法は, 年齢因子による生値の分割により, HRV特徴量に適用した。
年齢正規化HRVの特徴は、従来のアプローチに比べてグルコース予測精度を著しく向上させる。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 19:24:31 GMT)
AI Feedback Enhances Community-Based Content Moderation through Engagement with Counterarguments [0.0] 本研究は,AIを用いたハイブリット・モデレーション・フレームワークについて検討した。
その結果,フィードバックを取り入れることで音質が向上することがわかった。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 06:23:57 GMT)
A Cooperative Game-Based Multi-Criteria Weighted Ensemble Approach for Multi-Class Classification [0.0] 機械学習アルゴリズムはOpen-ML-CC18データセットに適用され、既存のアンサンブル重み付け手法と比較された。
実験の結果, 他の重み付け法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Sat, 09 Aug 2025 07:50:49 GMT)