Never Compromise to Vulnerabilities: A Comprehensive Survey on AI Governance [211.1] 本研究は,本質的セキュリティ,デリバティブ・セキュリティ,社会倫理の3つの柱を中心に構築された,技術的・社会的次元を統合した包括的枠組みを提案する。
我々は,(1)防衛が進化する脅威に対して失敗する一般化ギャップ,(2)現実世界のリスクを無視する不適切な評価プロトコル,(3)矛盾する監視につながる断片的な規制,の3つの課題を特定する。
私たちのフレームワークは、研究者、エンジニア、政策立案者に対して、堅牢でセキュアなだけでなく、倫理的に整合性があり、公的な信頼に値するAIシステムを開発するための実用的なガイダンスを提供します。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:42:56 GMT)
Hierarchical Visual Prompt Learning for Continual Video Instance Segmentation [115.7] ビデオインスタンスセグメンテーション(VIS)は、ビデオフレーム全体にわたるオブジェクトインスタンスのトラッキングとセグメンテーションの能力において、大きな注目を集めている。
既存のVISアプローチのほとんどは、オブジェクトインスタンスのカテゴリが時間とともに固定されていると非現実的に仮定する。
我々は,フレームレベルとビデオレベルの両方の観点から,過去のカテゴリの破滅的な忘れを克服する新しい階層型ビジュアルプロンプト学習モデルを開発した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:49:08 GMT)
Reasoning with Exploration: An Entropy Perspective on Reinforcement Learning for LLMs [112.4] 強化学習(RL)の中心的目標としてのバランシング探索と活用
エントロピーに基づく項による優位関数の増大という,1行のコードのみによる標準RLへの最小限の修正を導入する。
提案手法は,非常に大きなK値を用いて評価しても,Pass@K測定値において有意な利得が得られる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:07:04 GMT)
REDUCIO! Generating 1K Video within 16 Seconds using Extremely Compressed Motion Latents [110.4] 大規模アプリケーションにとって重要な障害のひとつは、高価なトレーニングと推論コストである。
我々は、ビデオには画像よりもはるかに冗長な情報が含まれており、非常に少ない動きでエンコードできると主張している。
我々は、映像を非常に圧縮された潜在空間に投影する画像条件付きVAEを設計し、コンテンツ画像に基づいてデコードする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:44:45 GMT)
HumanOLAT: A Large-Scale Dataset for Full-Body Human Relighting and Novel-View Synthesis [94.4] 我々はHumanOLATデータセットを紹介した。HumanOLATデータセットは、フルボディ人間のマルチビューワンライト・アット・ア・タイム(OLAT)キャプチャの最初の大規模データセットである。
データセットには、白色光、環境マップ、色勾配、細粒度OLAT照明などの様々な照明下でのHDR RGBフレームが含まれている。
我々は、複雑な人間中心の外観と照明相互作用をモデル化する上で、データセットの価値と重要な課題の両方を基礎として、最先端のリライティングと新規ビュー合成手法の評価を行った。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:59:55 GMT)
Cut2Next: Generating Next Shot via In-Context Tuning [93.1] マルチショット生成には、目的があり、映画のような遷移と厳密な撮影連続性が必要である。
現在の手法はしばしば基本的な視覚的一貫性を優先し、重要な編集パターンを無視している。
我々は、プロの編集パターンを批判的に合成する、その後の高品質なショットであるNext Shot Generation (NSG)を紹介する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:41:32 GMT)
Learning Generalizable and Efficient Image Watermarking via Hierarchical Two-Stage Optimization [90.1] ウォーターマーキングモデルが同時に3つの基準を達成できる2段階最適化を提案する。
HiWLは、広い適用性を維持しながら、一般化可能な潜在空間の透かし表現を効果的に学習する。
従来の方法よりも7.6%高い精度で透かし抽出が可能で、非常に低レイテンシ(8秒で処理された100K画像)を維持している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:21:27 GMT)
Half-Physics: Enabling Kinematic 3D Human Model with Physical Interactions [89.9] SMPL-Xを周囲との動的物理的相互作用が可能な有形実体に埋め込む新しい手法を提案する。
本手法は,シーンやオブジェクトとの物理的に妥当な相互作用を確保しつつ,固有のSMPL-Xポーズの運動制御を維持する。
広範かつ複雑な訓練を必要とする強化学習法とは異なり、ハーフフィック法は学習自由であり、あらゆる身体形状や運動に一般化する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:11:47 GMT)
ViPE: Video Pose Engine for 3D Geometric Perception [89.3] ViPEは、便利で多用途なビデオ処理エンジンである。
それは、制約のない生のビデオから、カメラの内在、カメラの動き、および密集した近距離マップを効率的に推定する。
ViPEを使って大規模なビデオのアノテートを行います。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:39:13 GMT)
MEReQ: Max-Ent Residual-Q Inverse RL for Sample-Efficient Alignment from Intervention [78.8] 本稿では,人間の介入によるサンプル効率向上を目的としたMEReQ(Maximum-Entropy Residual-Q Inverse Reinforcement Learning)を紹介する。
MereQは、人間の専門家と以前の政策の根底にある報酬関数との相違を捉える残差報酬関数を推論する。
その後、Residual Q-Learning(RQL)を使用して、ポリシーをこの残留報酬関数を使用して人間の好みと整合させる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:44:20 GMT)
SynFER: Towards Boosting Facial Expression Recognition with Synthetic Data [78.7] ハイレベルなテキスト記述に基づく表情画像データの合成のための新しいフレームワークであるSynFERを紹介する。
合成データの質と信頼性を確保するため,セマンティックガイダンス手法と擬似ラベル生成手法を提案する。
その結果, 提案手法の有効性と合成データの有効性が検証された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:47:13 GMT)
Achieving More with Less: Additive Prompt Tuning for Rehearsal-Free Class-Incremental Learning [76.3] クラス増分学習は、モデルが学習したクラスの知識を保持しながら、新しいクラスを段階的に学習することを可能にする。
この分野での最近の進歩はパラメータ効率のよい微調整技術へと移行している。
本稿では,現在のアプローチの限界に対処する新しいプロンプトベースのアプローチを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:47:29 GMT)
SEAgent: Self-Evolving Computer Use Agent with Autonomous Learning from Experience [71.8] 本稿では,コンピュータ利用エージェントが不慣れなソフトウェアとのインタラクションを通じて進化することを可能にするエージェント型自己進化フレームワークSEAgentを提案する。
我々は、OS-World内の5つの新しいソフトウェア環境におけるSEAgentの有効性を検証する。
当社のアプローチは,競合するオープンソースCUAに比べて,11.3%から34.5%という,23.2%の大幅な改善を実現している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:11:53 GMT)
InternBootcamp Technical Report: Boosting LLM Reasoning with Verifiable Task Scaling [71.4] 大規模言語モデル(LLM)は、複雑な推論機能を実現することによって、人工知能に革命をもたらした。
このギャップに対処するため、1000以上のドメイン分散タスク環境からなるオープンソースのフレームワークであるInternBootcampを紹介します。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:00:00 GMT)
OpenCUA: Open Foundations for Computer-Use Agents [70.1] コンピュータ・ユース・エージェント(CUA)としての視覚言語モデル
商業的ポテンシャルが増大するにつれて、最も有能なCUAシステムの重要な詳細はいまだに閉鎖されている。
我々は,CUAデータと基盤モデルをスケールするためのオープンソースフレームワークであるOpenCUAを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:52:32 GMT)
Dynamic Spectrum Access for Ambient Backscatter Communication-assisted D2D Systems with Quantum Reinforcement Learning [68.6] 無線スペクトルは乏しくなり、D2D通信のスペクトル効率は低い。
本稿では, 周囲RF信号の後方散乱を可能にするために, 環境後方散乱通信技術をD2Dデバイスに統合することを目的とする。
我々は、より少ないトレーニングパラメータでより高速な収束率を達成することができる新しい量子強化学習(RL)アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:59:00 GMT)
Triad: Empowering LMM-based Anomaly Detection with Vision Expert-guided Visual Tokenizer and Manufacturing Process [68.0] LLaVAモデルのAnyRes構造を変更し、既存のIADモデルによって同定された潜在的な異常領域をLMMに提供します。
欠陥の発生が製造プロセスと密接に関連していることを考えると,製造駆動型IADパラダイムを提案する。
本稿では、エキスパート誘導型領域トークン化と製造プロセスを組み合わせたLMMに基づく新しい手法であるTriadを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:42:32 GMT)
Revisiting Efficient Semantic Segmentation: Learning Offsets for Better Spatial and Class Feature Alignment [67.9] 本稿では,クラス表現と空間像の特徴の両方を動的に洗練するために,特徴とクラスオフセットを学習するデュアルブランチオフセット学習パラダイムを提案する。
提案手法に基づいて,効率的なセマンティックセグメンテーションネットワークOffSegを構築した。
ADE20K、Cityscapes、COCO-Stuff-164K、Pascal Contextを含む4つのデータセットの実験は、無視可能なパラメータによる一貫した改善を示している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:10:10 GMT)
Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training [67.9] 汎用AIエージェントは、次世代人工知能の基礎となるフレームワークとして、ますます認識されている。
現在のエージェントシステムはクローズドソースか、さまざまな有料APIやプロプライエタリなツールに大きく依存している。
我々は,完全オープンソースかつ(最大限に)フリーなマルチモジュールエージェントフレームワークであるCognitive Kernel-Proを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:57:13 GMT)
A Survey on All-in-One Image Restoration: Taxonomy, Evaluation and Future Trends [67.4] 画像復元(IR)は、ノイズ、ぼかし、圧縮、悪天候など幅広い要因によって生じる劣化した観察から高品質な画像の復元を目指している。
従来のIR法は、個々の劣化タイプを対象とすることで顕著な進歩を遂げてきたが、それらの特殊化は、しばしば一般化のコストがかかる。
オールインワンのイメージ復元パラダイムが最近登場し、複数の劣化タイプに順応的に対処する統一されたフレームワークを提供している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:37:09 GMT)
A Data-driven Loss Weighting Scheme across Heterogeneous Tasks for Image Denoising [67.0] 変分分解モデルでは、データ忠実度項の重みはノイズ除去能力を高める役割を担っている。
本研究では,これらの問題に対処するデータ駆動型損失重み付け手法を提案する。
DLWの顕著な性能を検証し,様々な変分復調モデルの複素雑音処理能力の向上に寄与することを示した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:44:02 GMT)
IROTE: Human-like Traits Elicitation of Large Language Model via In-Context Self-Reflective Optimization [66.6] IROTEは,安定かつ伝達可能な特性抽出のための新しいインコンテキスト手法である。
IROTEが生成する1つの自己反射は、様々な下流タスクにまたがる目標特性の安定な偽造を LLM が引き起こすことを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:04:28 GMT)
DocThinker: Explainable Multimodal Large Language Models with Rule-based Reinforcement Learning for Document Understanding [66.1] 動的推論時間推論のためのルールベースの強化学習フレームワークであるDocThinkerを提案する。
本手法は破滅的な忘れ込みを軽減し,適応性と透明性を両立させる。
本研究は,MLLMに基づく文書理解における説明可能性と適応性を高めるための強力な代替手段として,RLに注目した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:06:55 GMT)
Unlocking the Potential of Diffusion Priors in Blind Face Restoration [63.4] 本研究では、2つのモードを切り替えて特定のギャップを解消する統合ネットワークFLIPNETを提案する。
復元モードでは、モデルは徐々にBFR指向の特徴とLQ画像からの顔埋め込みを統合し、真正かつ忠実な顔復元を実現する。
劣化モードでは、実際の劣化データセットから学んだ知識に基づいて、劣化した画像のような現実世界を合成する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:50:55 GMT)
Masked Clustering Prediction for Unsupervised Point Cloud Pre-training [61.1] MaskCluは、3Dポイントクラウド上でのViTの教師なし事前トレーニング手法である。
マスク付きポイントモデリングとクラスタリングベースの学習を統合している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:58:44 GMT)
Multi-Target Backdoor Attacks Against Speaker Recognition [60.8] 位置に依存しないクリック音を用いた話者識別に対するマルチターゲットバックドア攻撃を提案する。
提案手法は最大50人の話者を同時に対象とし,95.04%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:52:30 GMT)
LLM-Lasso: A Robust Framework for Domain-Informed Feature Selection and Regularization [59.8] LLM-Lassoは大規模言語モデル(LLM)を利用してラッソ回帰における特徴選択を導くフレームワークである。
LLMは各特徴に対してペナルティ因子を生成し、単純でチューニング可能なモデルを用いてラスソペナルティの重みに変換される。
LLMによりより関連づけられた特徴は、より低い罰を受け、最終モデルに保持される可能性を高める。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:59:33 GMT)
$\text{M}^{2}$LLM: Multi-view Molecular Representation Learning with Large Language Models [59.1] 分子構造ビュー,分子タスクビュー,分子規則ビューの3つの視点を統合した多視点フレームワークを提案する。
実験によると、$textM2$LLMは、分類タスクと回帰タスクをまたいだ複数のベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:46:47 GMT)
SoK: The Security-Safety Continuum of Multimodal Foundation Models through Information Flow and Game-Theoretic Defenses [58.9] MFM(Multimodal foundation model)は、多種多様なデータモダリティを統合し、複雑で広範囲なタスクをサポートする。
本稿では,モデル行動とシステムレベルの相互作用の両方から生じる致命的な脅威を特定することで,MFMの文脈における安全性とセキュリティの概念を統一する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 23:56:35 GMT)
Follow-Your-Shape: Shape-Aware Image Editing via Trajectory-Guided Region Control [58.9] Follow-Your-Shapeは、トレーニング不要でマスクなしのフレームワークで、オブジェクト形状の正確かつ制御可能な編集をサポートする。
インバージョンとデノナイジングパスのトークン単位の速度差を比較することで,TDM(Torjectory Divergence Map)を算出する。
本手法は、特に大規模な形状変更を必要とするタスクにおいて、優れた編集性と視覚的忠実性を実現する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:27:05 GMT)
Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [58.5] エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:02:52 GMT)
Retrieval-Augmented Generation with Conflicting Evidence [57.7] 大規模言語モデル (LLM) エージェントは、応答の事実性を改善するために、検索強化世代 (RAG) をますます採用している。
実際には、これらのシステムは曖昧なユーザクエリを処理し、複数のソースからの情報に衝突する可能性がある。
RAMDocs(Retrieval with Ambiguity and Misinformation in Documents)は,ユーザクエリのエビデンスを矛盾させるような,複雑で現実的なシナリオをシミュレートする新しいデータセットである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:53:18 GMT)
Separating Knowledge and Perception with Procedural Data [57.5] 手続きデータのみを用いて表現モデルを訓練し、さらに訓練することなく視覚的類似性、分類、意味的セグメンテーションタスクに適用する。
視覚記憶に関する従来の研究とは違って,本手法は実世界のすべての画像に対して完全なコンパートナライズを実現する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:48:35 GMT)
RCR-Router: Efficient Role-Aware Context Routing for Multi-Agent LLM Systems with Structured Memory [57.4] RCRは、マルチエージェント大言語モデル(LLM)システムのためのロールアウェアコンテキストルーティングフレームワークである。
役割とタスクステージに基づいて、各エージェントに対して意味的に関連するメモリサブセットを動的に選択する。
軽量スコアリングポリシは、メモリ選択をガイドし、エージェント出力を共有メモリストアに統合する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:29:05 GMT)
SegDAC: Segmentation-Driven Actor-Critic for Visual Reinforcement Learning [56.7] 視覚一般化のためのRL-Driven Actor-Critic法であるSegDACを提案する。
SegDACはオブジェクト中心の分解にSegment Anything(SAM)を使用し、YOLO-Worldはテキストプロンプトを通じてセグメンテーションを意味的にグラウンドする。
Maniskill3を用いた視覚一般化ベンチマークでSegDACを評価することにより,SegDACが視覚一般化を著しく向上することを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:16:54 GMT)
Deep Learning Models for Robust Facial Liveness Detection [56.1] 本研究では,現代のアンチスプーフィング手法の欠陥に対処する新しい深層学習モデルを用いて,ロバストな解を提案する。
テクスチャ解析と実際の人間の特性に関連する反射特性を革新的に統合することにより、我々のモデルは、顕著な精度でレプリカと真の存在を区別する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:19:20 GMT)
Deblur4DGS: 4D Gaussian Splatting from Blurry Monocular Video [55.7] ぼやけたモノクロ映像から高品質な4Dモデルを再構成するためのDeblur4DGSを提案する。
我々は露光時間内の連続的動的表現を露光時間推定に変換する。
Deblur4DGSは、新規なビュー合成以外にも、複数の視点からぼやけたビデオを改善するために応用できる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:06:37 GMT)
Subjective and Objective Quality Assessment of Banding Artifacts on Compressed Videos [55.1] 注目に値するバンドングアーティファクトは、ハイエンドのHDTVや高解像度のスクリーンで見るビデオの知覚的品質に深刻な影響を与える可能性がある。
我々は、LIVE-YT-Bandingと呼ばれる、4つの異なる圧縮パラメータで生成された160のビデオからなる、第一種オープンビデオデータセットを作成しました。
計7,200人の主観的意見が45人の被験者のコホートから集められている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:42:56 GMT)
Semantic Caching for Low-Cost LLM Serving: From Offline Learning to Online Adaptation [54.6] キャッシング推論応答は、大きな言語モデルに他の前方を通さずに、それらを検索することができる。
従来の正確なキャッシュは、クエリ間のセマンティックな類似性を見落とし、不要な再計算をもたらす。
本稿では,未知のクエリおよびコスト分布下でのセマンティックキャッシュ消去のための,原則的,学習ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:51:12 GMT)
SelfHVD: Self-Supervised Handheld Video Deblurring for Mobile Phones [54.4] ビデオ中の鋭い手がかりによって駆動されるハンドヘルドビデオのデブロアリングを自己管理する手法を提案する。
劣化モデルを訓練するために,映像から鋭い手がかりを抽出し,近隣のぼやけたフレームの誤認識ラベルとみなす。
ハンドヘルドビデオデブロアリングのための合成および実世界のハンドヘルドビデオデータセットを構築した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:38:14 GMT)
CPO: Addressing Reward Ambiguity in Role-playing Dialogue via Comparative Policy Optimization [53.8] RLFT(Reinforcement Learning Fine-Tuning)は、客観的に検証された回答を持つタスクにおいて顕著な成功を収めた。
しかし、ロールプレイング・ダイアログのようなオープンな主観的なタスクに苦しむ。
独立したサンプル単位のスコアリングに依存する従来の報酬モデリングアプローチでは、主観的評価基準と不安定な報酬信号という2つの課題に直面している。
人間の評価は、明示的な基準と暗黙的な比較判断を本質的に組み合わせているという知見に触発され、比較政策最適化を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:49:18 GMT)
On the Reliability of Vision-Language Models Under Adversarial Frequency-Domain Perturbations [53.6] VLM(Vision-Language Models)は、視覚コンテンツ推論のための知覚モジュールとして使われることが多い。
これらの特徴変換が,画像の自動キャプションタスクの信頼度/ディープフェイク検出にどのような影響を及ぼすかを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:22:24 GMT)
From Slow Bidirectional to Fast Autoregressive Video Diffusion Models [52.3] 現在のビデオ拡散モデルは、印象的な生成品質を実現するが、双方向の注意依存のため、インタラクティブなアプリケーションに苦戦する。
この制限には、事前訓練された双方向拡散変換器を自己回帰変換器に適応させ、フレームをオンザフライで生成することで対処する。
我々のモデルは、VBench-Longベンチマークで84.27点のスコアを達成し、以前のすべてのビデオ生成モデルを上回った。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:51:37 GMT)
BriLLM: Brain-inspired Large Language Model [51.8] BriLLMは脳にインスパイアされた大きな言語モデルで、Signal Fully- connected flowing (SiFu)学習を通じて機械学習の基礎を再定義する。
このアーキテクチャは、3つのブレークスルーを可能にしている。完全なモデル解釈可能性、コンテキスト長の独立スケーリング、脳に似た処理のグローバルなシミュレーションである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:53:33 GMT)
TPTP World Infrastructure for Non-classical Logics [51.6] TPTP Worldは、ATP(Automated Theorem Proving)システムの研究、開発、展開をサポートする。
本稿では,非古典論理におけるATPのTPTP Worldインフラストラクチャについて,自己完結した概要を述べる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:05:52 GMT)
LLMEval-3: A Large-Scale Longitudinal Study on Robust and Fair Evaluation of Large Language Models [51.6] 静的ベンチマークにおけるLLM(Large Language Models)の既存の評価は、データの汚染やリーダーボードのオーバーフィッティングに弱い。
LLMの動的評価のためのフレームワークであるLLMEval-3を紹介する。
LLEval-3は、220kの卒業生レベルの質問からなるプロプライエタリなバンク上に構築されており、評価実行毎に未確認のテストセットを動的にサンプリングする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:23:33 GMT)
Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models [51.5] 拡散大言語モデル (dLLMs) は反復的 denoising を通じてテキストを生成する。
現在のデコード戦略は、最終的な出力に有利なリッチな中間予測を捨てている。
時間的整合性を利用する2つの相補的手法を導入する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:59:57 GMT)
SMA: Who Said That? Auditing Membership Leakage in Semi-Black-box RAG Controlling [50.7] Retrieval-Augmented Generation(RAG)とそのMultimodal Retrieval-Augmented Generation(MRAG)は、大規模言語モデル(LLM)の知識カバレッジと文脈理解を著しく向上させる。
しかし、検索とマルチモーダル融合によるコンテンツの曖昧さは、既存のメンバーシップ推論手法を事前学習、外部検索、ユーザ入力に確実に属性付けできないようにし、プライバシー漏洩の説明責任を損なう。
本稿では,検索制御機能を備えた半ブラックボックス設定において,生成したコンテンツの微粒なソース属性を実現するための,SMA (Source-aware Membership Audit) を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:32:24 GMT)
A Guide to Robust Generalization: The Impact of Architecture, Pre-training, and Optimization Strategy [50.3] 6つのデータセット,40の事前訓練アーキテクチャ,2つの特別な損失,3つの適応プロトコルにまたがる実験的検討を行った。
大規模なデータセット上で教師付きで事前訓練された畳み込みニューラルネットワークは、しばしば最高のパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:38:35 GMT)
A Survey on Parallel Text Generation: From Parallel Decoding to Diffusion Language Models [50.0] トークン・バイ・トークン生成のボトルネックを突破することを目的とした並列テキスト生成技術。
既存のアプローチをARベースのパラダイムと非ARベースのパラダイムに分類する。
速度、品質、効率の観点から理論上のトレードオフを評価します。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:56:04 GMT)
DenoDet V2: Phase-Amplitude Cross Denoising for SAR Object Detection [49.9] 本稿では,バンドワイド相互変調機構を用いて,振幅と位相情報の相補的性質を利用するDenoDet V2を提案する。
DenoDet V2は、DenoDet V1と比較してSARDet-100Kデータセットの大幅な0.8%改善を実現し、モデルの複雑さを半分に削減した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 23:24:20 GMT)
Task-Oriented Feature Compression for Multimodal Understanding via Device-Edge Co-Inference [49.8] 本稿では,マルチモーダル理解のためのタスク指向特徴圧縮(TOFC)手法を提案する。
圧縮効率を向上させるために、視覚特徴の特性に基づいて複数のエントロピーモデルを適応的に選択する。
その結果,TOFCはデータ転送オーバーヘッドを最大52%削減し,システム遅延を最大63%削減できることがわかった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:58:45 GMT)
Collective dynamics of strategic classification [49.1] ユーザと機関の集団間のフィードバックループ問題に進化ゲーム理論を適用した。
検知能力の向上は社会的コストを低減し,ユーザの改善につながる可能性が示唆された。
施設が利用者の人口に再適応する速度は、最終結果に果たす役割を担っている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:57:17 GMT)
Cluster Topology-Driven Placement of Experts Reduces Network Traffic in MoE Inference [49.1] 提案する整数線形プログラム(ILP)は,期待される送信数を最小限に抑え,専門家の最適な配置を決定する。
ILPベースの配置戦略は,小型モデル(DeepSeekMoE16B)や大規模モデル(DeepSeek-R1671B)と比較してネットワークトラフィックが低いことを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:08:48 GMT)
Grounding Multilingual Multimodal LLMs With Cultural Knowledge [49.0] 本稿では,MLLMを文化的知識に根ざしたデータ中心型アプローチを提案する。
CulturalGroundは、42の国と39の言語にまたがる2200万の高品質で文化的に豊かなVQAペアで構成されている。
我々は,MLLM CulturalPangeaをCulturalGround上で学習し,汎用性を維持するために,標準の多言語指導訓練データをインターリーブする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:39:35 GMT)
EGGCodec: A Robust Neural Encodec Framework for EGG Reconstruction and F0 Extraction [48.9] EGGCodecは、電子グロットグラフィ(EGG)信号再構成とF0抽出のために設計された、堅牢な神経エンコーデックフレームワークである。
本稿では,元のEGG信号と再構成されたEGG信号のニュアンス関係を捉えるために,マルチスケールの周波数領域損失関数を提案する。
EGGCodecは最先端のF0抽出方式を上回り、平均絶対誤差(MAE)を14.14Hzから13.69Hzに減らし、ボイシング判定誤差(VDE)を38.2%改善した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:20:25 GMT)
Towards Perfection: Building Inter-component Mutual Correction for Retinex-based Low-light Image Enhancement [46.6] 低照度画像強調では、レチネックスをベースとした深層学習法は、その例外的な解釈可能性により、大きな注目を集めている。
照明と反射成分の完全な分解を達成することは、非常に困難であることが証明されている。
本稿では,これらの残基をICR (Inter-component residuals) として公式に命名する。
本稿では,ICRの分解・拡張過程を緩和する新しい相関関係モデル(Iretinex)を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:20:32 GMT)
Safe Semantics, Unsafe Interpretations: Tackling Implicit Reasoning Safety in Large Vision-Language Models [46.5] 本稿では,LVLMの脆弱性であるImplicit Reasoning Safetyの概念を紹介する。
私たちのデモでは、SSUIを使った単純なインコンテキスト学習でさえ、これらの暗黙のマルチモーダルな脅威を著しく軽減します。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:26:06 GMT)
Do LLMs Really Forget? Evaluating Unlearning with Knowledge Correlation and Confidence Awareness [46.4] 大規模言語モデル(LLM)における意図しない記憶の軽減を目的とした機械学習手法
実世界の知識の暗黙構造をより正確に捉えた知識未学習評価フレームワークを提案する。
私たちのフレームワークは、未学習のパフォーマンスをより現実的で厳格に評価します。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 00:29:54 GMT)
Uncertainty-aware Cross-training for Semi-supervised Medical Image Segmentation [46.0] 半教師型医療画像(UC-Seg)のための不確実性を考慮したクロストレーニングフレームワークを提案する。
本手法は,他の最先端半教師付き手法と比較して,セグメンテーション精度と一般化性能に優れる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:28:10 GMT)
Style transfer between Microscopy and Magnetic Resonance Imaging via Generative Adversarial Network in small sample size settings [45.6] 磁気共鳴イメージング(MRI)のクロスモーダル増強と、同じ組織サンプルに基づく顕微鏡イメージングが期待できる。
コンディショナル・ジェネレーティブ・ディベサール・ネットワーク(cGAN)アーキテクチャを用いて,ヒト・コーパス・カロサムのMRI画像から顕微鏡組織像を生成する方法を検討した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:29:35 GMT)
Empirical Analysis of Temporal and Spatial Fault Characteristics in Multi-Fault Bug Repositories [45.2] 16のオープンソースJavaおよびPythonプロジェクトに存在する断層の時間的・空間的特性を実証分析する。
以上の結果から,これらのソフトウェアシステムにおける多くの障害は長寿命であり,ソフトウェアバージョンの大部分に複数の障害が存在することが示唆された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:55:16 GMT)
Scaling Up Active Testing to Large Language Models [45.1] 大規模言語モデルの評価にどう対応できるかを示す。
特に,データ取得のガイドに使用されるサロゲートモデルは,テキスト内学習を用いて安価に構築可能であることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:17:51 GMT)
Speech to Reality: On-Demand Production using Natural Language, 3D Generative AI, and Discrete Robotic Assembly [45.0] 本稿では,3次元生成AIと離散ロボットアセンブリを用いて,音声を物理オブジェクトに変換するシステムを提案する。
このシステムは、3Dモデリングやロボットプログラミングの専門知識のない個人にとって、デザインと製造をより容易にする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:39:06 GMT)
MiGrATe: Mixed-Policy GRPO for Adaptation at Test-Time [45.0] MiGrATeは、外部のトレーニングデータを必要とせずに、推論時に大きな言語モデルを適応する検索アルゴリズムである。
我々はMiGrATeを3つの挑戦的ドメイン単語探索、分子最適化、仮説+プログラム誘導で評価した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:08:21 GMT)
Spatial Traces: Enhancing VLA Models with Spatial-Temporal Understanding [45.0] 本研究では,観測から深度マップにキーポイントの視覚的トレースを投影し,空間情報と時間情報の両方を同時に取得する手法を提案する。
SimplerEnvの実験では、SpatialVLAの4%、TraceVLAの19%に比べて、解決したタスクの平均数が増加した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:53:45 GMT)
GaussianUpdate: Continual 3D Gaussian Splatting Update for Changing Environments [44.6] 本稿では,3次元ガウス表現と連続学習を組み合わせた新しい手法を提案する。
GustafUpdateは、新しいマルチステージアップデート戦略を通じて、さまざまなタイプの変更を明示的にモデル化する。
本稿では,画像の保存を必要とせずに自己認識型更新を可能にする,生成的再生による可視性を考慮した連続学習手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:50:37 GMT)
An Investigation of Robustness of LLMs in Mathematical Reasoning: Benchmarking with Mathematically-Equivalent Transformation of Advanced Mathematical Problems [44.6] 我々は,LLMの数学的推論的ロバスト性を評価するための体系的枠組みを導入する。
我々は、数学的に等価だが言語的およびパラメトリックなバリエーションを持つ高度な数学問題に対して、それらをストレステストする。
この新たな評価手法を用いて,新しいベンチマークデータセットであるPatnamGAPを開発した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:40:33 GMT)
Scaling Learned Image Compression Models up to 1 Billion [44.5] 大規模言語モデル(LLM)の最近の進歩は、インテリジェンスと圧縮の強いつながりを浮き彫りにしている。
本稿では,学習した画像圧縮モデルのスケールアップと,スケーリング法則による性能動向を明らかにするための先駆的な研究について述べる。
実験結果から, スケールアップHPCM-1Bモデルにより, 最先端の速度歪み特性が得られた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:50:02 GMT)
Bridging the Gap: A Framework for Real-World Video Deepfake Detection via Social Network Compression Emulation [43.7] このギャップの背後にある重要な要因は、YouTubeやFacebookのようなプラットフォームが適用する攻撃的でプロプライエタリな圧縮だ。
ソーシャルネットワークの動画共有パイプラインをエミュレートする第1のフレームワークを提案する。
我々のアプローチは、研究室ベースのトレーニングとディープフェイク検出器の実際の展開の間のギャップを埋める、スケーラブルで実用的なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:11:31 GMT)
Task Diversity Shortens the ICL Plateau [43.0] In-context Learning (ICL)は、一連の入力デモとその後のクエリに基づいて出力を生成する言語モデルの能力を記述する。
複数の多様なICLタスクのトレーニングが同時に損失高原を短縮し、各タスクの学習が容易になることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 00:55:59 GMT)
Entangled in Representations: Mechanistic Investigation of Cultural Biases in Large Language Models [42.4] 本稿では,大規模言語モデルの内部表現を探索する最初の解釈可能性に基づく手法であるCulturescopeを提案する。
本研究は,本質的な文化的偏見の尺度として,文化的平坦化スコアを導入する。
実験の結果,LLMは文化知識空間における西洋支配バイアスと文化的フラット化をエンコードしていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:05:32 GMT)
Random Party Distillation on a Superconducting Processor [42.1] ランダムなパーティー蒸留プロトコルの量子ビットに基づく実装を提案する。
超伝導ハードウェアデバイス ibm_quebec 上で有効性を示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:44:11 GMT)
Prospect Theory Fails for LLMs: Revealing Instability of Decision-Making under Epistemic Uncertainty [41.9] プロスペクト理論が現代の大規模言語モデルに適用されるかどうかは、まだ明らかになっていない。
PT下でのLCMの意思決定動作をモデル化するための,より汎用的で正確な評価フレームワークを提案する。
以上の結果から,LPMのPTによる意思決定のモデル化は信頼性が低いことが示唆された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:02:16 GMT)
Weak convexity of Fisher information matrix and superresolved localization of blinking sources of light [41.9] 単一分子ローカライゼーション顕微鏡(英語版)の一般的な名前で知られる技術群は、ナノメートルスケールの空間分解能に達する。
放射体を点滅させることによって得られる分解能の利点は、その凸性であるフィッシャー情報の基本的な性質の結果であることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:45:19 GMT)
TIDE : Temporal-Aware Sparse Autoencoders for Interpretable Diffusion Transformers in Image Generation [41.9] 拡散トランスフォーマー(Diffusion Transformers, DiTs)は、強力なが未探索な生成モデルのクラスである。
解釈可能な拡散変換を行うためのTIDE-Temporal-aware sparse Autoencodersを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:22:30 GMT)
Audio-Thinker: Guiding Audio Language Model When and How to Think via Reinforcement Learning [41.3] 大規模音声言語モデル(LALM)の推論能力を高めるための強化学習フレームワークであるAudio-Thinkerを提案する。
提案手法は適応的思考精度報酬を導入し,タスクに基づいた推論戦略を動的に調整する。
実験の結果,Audio-Thinkerモデルは,様々なベンチマークタスクにおいて,既存の推論指向のLALMよりも優れていた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:16:33 GMT)
Position: The Current AI Conference Model is Unsustainable! Diagnosing the Crisis of Centralized AI Conference [40.7] 本稿では, 科学的普及, 株式, 地域福祉の基本的な目標を脅かす構造的危機をデータ駆動で診断する。
1) 著者一人当たりの出版率が過去10年で2倍以上に増加し, 毎年4.5紙以上になる, 2) 環境面では1回の会議の二酸化炭素排出量が1日当たりの排出を上回っている, (3) 心理的には, オンラインコミュニティの71%が否定的な感情を反映し, 35%がメンタルヘルスの懸念を反映している,という4つのストレス領域を同定した。
これに対し、ピアレビュー、プレゼンテーションを分離したCommunity-Federated Conference(CFC)モデルを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:35:08 GMT)
Training-Free Text-Guided Color Editing with Multi-Modal Diffusion Transformer [39.7] トレーニング不要なカラー編集手法であるColorCtrlを提案する。
注目マップと値トークンを対象とする操作によって構造と色を分離することにより、精度と一貫性のある色編集を可能にする。
本手法は,FLUX.1 Kontext Max や GPT-4o Image Generation などの強力な商用モデルを上回る一貫性を持つ。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:57:04 GMT)
AIOS: LLM Agent Operating System [39.6] 本稿では,LLMベースのエージェント管理のコンテキスト下で,AIOS(LLMベースのAIエージェントオペレーティングシステム)のアーキテクチャを提案する。
エージェントアプリケーションからリソースとLLM固有のサービスをAIOSカーネルに分離することで、LLMベースのエージェントを提供するための新しいアーキテクチャを導入する。
AIOSを使用すると、さまざまなエージェントフレームワークで構築されたエージェントを最大2.1倍高速に実行することができる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:37:01 GMT)
Feedback-Driven Tool-Use Improvements in Large Language Models via Automated Build Environments [39.4] 大規模言語モデル(LLM)のための環境自動構築パイプラインを提案する。
これにより、外部ツールに頼ることなく、詳細な測定可能なフィードバックを提供する高品質なトレーニング環境の作成が可能になる。
また、ツール使用の精度とタスク実行の完全性の両方を評価する検証可能な報酬機構も導入する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:45:19 GMT)
Secure authentication via Quantum Physical Unclonable Functions: a review [39.3] QPUF(Quantum Physical Unclonable Function)は、セキュアな認証のための物理的基盤のアプローチを提供する。
本論では, 理論的基礎と実装上の課題について概説する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:16:40 GMT)
WSI-LLaVA: A Multimodal Large Language Model for Whole Slide Image [39.1] ギガピクセルのWSI理解のためのフレームワークであるWSI-LLaVAを3段階のトレーニングアプローチで紹介する。
実験の結果、WSI-LLaVAはすべての能力範囲で既存のモデルより優れています。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:24:25 GMT)
AI-Slop to AI-Polish? Aligning Language Models through Edit-Based Writing Rewards and Test-time Computation [39.0] 品質評価を書くことは、基本的に主観的で専門知識を必要とすることもあって、コミュニティから注目されるものが少なくなっている。
まず、5つの書評データセットを4,729の書評判断に集約することで、書評品質ベンチマーク(WQ)を導入する。
実験の結果、WQのランダムなベースラインよりも、推論タスクに優れる最先端のLLMを含む、競争力のあるベースラインの大半が、WQのランダムなベースラインよりも優れていることがわかった。
そして、4つのアウト・オブ・ディストリビューション・テストセットと74%の精度で強力な一般化を示す書字品質評価のための様々なサイズの書字品質リワード・モデル(WQRM)を訓練する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 22:08:36 GMT)
BiasGym: Fantastic Biases and How to Find (and Remove) Them [38.8] BiasGymは、大規模言語モデル(LLM)内の概念的関連性を確実に注入し、分析し、緩和するためのフレームワークである。
BiasGymは2つのコンポーネントで構成されている。BiasInjectはトークンベースの微調整を通じてモデルに特定のバイアスを注入する。
本手法は,機械的解析のための一貫したバイアス抽出を可能にし,下流タスクの性能低下を伴わずに目標デバイアス化をサポートし,トレーニング中に見つからないバイアスに一般化する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:23:44 GMT)
Multi-level Collaborative Distillation Meets Global Workspace Model: A Unified Framework for OCIL [38.7] Online Class-Incremental Learning (OCIL) は、非i.d.データストリームからモデルを継続的に学習することを可能にする。
OCILは、厳格なメモリ制約の下でモデルの安定性を維持すること、新しいタスクへの適応性を確保することの2つの主要な課題に直面している。
グローバルワークスペースモデル(GWM)によるアンサンブル学習を強化する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:52:33 GMT)
MultiAiTutor: Child-Friendly Educational Multilingual Speech Generation Tutor with LLMs [38.1] MultiAiTutorは、子供に優しいデザインの教育用多言語生成AIチューターである。
LLMアーキテクチャを用いた年齢適応型多言語音声生成手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:58:48 GMT)
When Imitation Learning Outperforms Reinforcement Learning in Surgical Action Planning [38.0] 今回,CholecT50の手術行動計画において,ILとRLの総合的な比較を行った。
DARILベースラインは、34.6%のアクショントリプレット認識mAPと33.6%の次フレーム予測mAPを達成し、10秒水平線で29.2%のスムーズな計画劣化を実現した。
分析の結果,有意なRLポリシーよりも,専門家アノテートされたテストセット上での分布マッチングがILを体系的に好んでいることが明らかとなった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:18:45 GMT)
UnrealZoo: Enriching Photo-realistic Virtual Worlds for Embodied AI [37.5] Unreal Engine上に構築された100以上の写真リアルな3DバーチャルワールドのコレクションであるUnrealZooを紹介します。
私たちはまた、人間、動物、ロボット、そしてAI研究の具体化のための車両を含む、さまざまな遊び可能なエンティティも提供しています。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:56:32 GMT)
Social Identity in Human-Agent Interaction: A Primer [37.4] 社会アイデンティティ理論(SIT)と社会分類理論(SCT)は、社会現象を理解するための社会アイデンティティアプローチ(SIA)の2つの側面である。
SITとSCTは、人々が社会的にどう相互作用するかを記述し、説明するモデルである。
日常生活に組み込まれた社会機械の台頭は、人工エージェントがSIA活動に参加できるかどうか、どのように参加できるかを理解するための努力を刺激している。
SIT と SCT が人工社会エージェントにどのように応用できるかを事例として,SIA と Expolate のプライマーについて紹介する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 23:48:59 GMT)
Classically estimating observables of noiseless quantum circuits [36.7] ランダムな非構造量子回路上での任意の観測値の期待値を推定するための古典的アルゴリズムを提案する。
以上の結果から、カオス的かつ局所的なスクランブルな振る舞いを示す量子回路の観測可能性の推定は、全測地で古典的に可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:42:04 GMT)
Turbo-VAED: Fast and Stable Transfer of Video-VAEs to Mobile Devices [36.6] 本稿では,広く使用されているビデオVAEをモバイルデバイスに効率的に転送する,低コストなソリューションを提案する。
本手法により,モバイル端末上でのリアルタイム720pビデオVAEデコーディングが可能となった。
Turbo-VAEDはFPSの2.9倍のスピードアップを実現し、iPhone 16 Proの再現性も向上した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:59:46 GMT)
Quantifying Gender Biases Towards Politicians on Reddit [36.5] 政治における男女平等を高める試みにもかかわらず、グローバルな努力は平等な女性代表の確保に苦慮している。
これは、権威のある女性に対する暗黙の性偏見と結びついている可能性が高い。
本稿では、オンライン政治討論に現れるジェンダーバイアスの包括的研究について述べる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:24:06 GMT)
Uni-Mol3: A Multi-Molecular Foundation Model for Advancing Organic Reaction Modeling [36.4] 本稿では,多分子反応モデリングに階層的パイプラインを用いた新しいディープラーニングフレームワークUni-Mol3を紹介する。
中心となるUni-Mol3は、分子やその他の特徴の3D構造を離散トークンにエンコードするマルチスケール分子トークン化器(Mol-Tokenizer)を採用している。
迅速な下流の微調整により、Uni-Mol3は多様な有機反応タスクにおいて例外的な性能を示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:54:09 GMT)
Beyond Technocratic XAI: The Who, What & How in Explanation Design [36.0] 実際には、意味のある説明を生成することはコンテキスト依存のタスクである。
本論文は, 設計過程の定式化について述べる。
XAIにおける説明設計のための三部構成のフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:17:26 GMT)
ELFuzz: Efficient Input Generation via LLM-driven Synthesis Over Fuzzer Space [36.0] ジェネレーションベースのファジリングは、入力文法とテストシステムとソフトウェアに対する意味制約の仕様に従って適切なテストケースを生成する。
本稿では,LLMによるファジィ空間上でのファジィ合成により,テスト対象システム(SUT)に適合した生成系ファジィを自動で合成するELFuzzを提案する。
ELFuzz canは,従来のアプローチと比較して,1)実世界のSUT – 評価において最大1,791,104行のコード – にシームレスにスケールし,2) 興味深い文法構造と人間の理解可能な方法でセマンティック制約をキャッチする効率的なファッジャを合成する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:00:13 GMT)
Hierarchical Variable Importance with Statistical Control for Medical Data-Based Prediction [35.9] モデルに依存しない変数重要度尺度である階層CPIを導入する。
階層木に沿った部分群を探索することで、計算的に抽出可能でありながら、家族的な誤り率の明確な制御も楽しめる。
その効果は2つのニューロイメージングデータセットで示される。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:10:54 GMT)
P/D-Device: Disaggregated Large Language Model between Cloud and Devices [35.9] クラウドとデバイスの間で大きな言語モデルを分離することを提案する。
クラウドは、そのプリフィル段階でのみ、各デバイスのためのコンテンツの一部を支援する。
実トレース実験により、TTFTは少なくとも60%減少し、最大TPOTは約10ミリ秒、クラウドスループットは最大15倍向上した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:56:29 GMT)
Shape Completion and Real-Time Visualization in Robotic Ultrasound Spine Acquisitions [35.5] 本稿では,ロボット超音波とリアルタイム補完を組み合わせた新しい統合システムを提案する。
私たちのロボットプラットフォームは、自律的に腰椎のUSスイープを取得し、超音波から脊椎表面を抽出し、完全な解剖を再構築します。
このフレームワークは、対話的でリアルタイムな可視化を提供し、スキャンを自律的に繰り返す機能と、ナビゲーションでターゲットの場所を指定できる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:19:37 GMT)
Quick on the Uptake: Eliciting Implicit Intents from Human Demonstrations for Personalized Mobile-Use Agents [35.3] textbfFlow textbfRecognitionに基づいて構築された textbfIFRAgent を提案する。
IFRAgentは人間のデモからの明示的な意図フローを分析し、標準的な操作手順のクエリレベルベクトルライブラリを構築する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:20:14 GMT)
E3-Rewrite: Learning to Rewrite SQL for Executability, Equivalence,and Efficiency [35.2] E3-Rewriteは実行可能で等価で効率的なクエリを生成するフレームワークである。
最先端の手法に比べてクエリ実行時間の25.6%削減を実現している。
最大24.4%のリライトが成功し、以前のシステムが扱わなかった複雑なクエリにまでカバー範囲を広げた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:38:10 GMT)
CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning [35.1] 本稿では,新しい対照的なRLアルゴリズムを用いた最適化のための自動学習フレームワークを提案する。
--L1は最適化タスクで大幅なパフォーマンス改善を実現します。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 00:12:38 GMT)
REX-RAG: Reasoning Exploration with Policy Correction in Retrieval-Augmented Generation [35.1] 強化学習(RL)は、大規模言語モデル(LLM)が複雑な推論タスクを実行できるための強力なパラダイムとして浮上している。
本稿では、厳格な政策学習を維持しつつ、代替推論経路を探求するフレームワークであるREX-RAGを提案する。
その結果,REX-RAG は Qwen2.5-3B では5.1%, Qwen2.5-7B では3.6% であることがわかった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:54:24 GMT)
Spatial-Temporal Multi-Scale Quantization for Flexible Motion Generation [33.7] 動き列を空間次元と時間次元にまたがる多スケールの離散トークンに圧縮する新しい量子化手法MSQを紹介する。
MSQは、異なるエンコーダを使用して、異なる空間的粒度で体の部分を取り込んで、エンコーダされた特徴を複数のスケールに時間的に補間し、それらを離散トークンに定量化する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:58:46 GMT)
KFFocus: Highlighting Keyframes for Enhanced Video Understanding [33.7] KFFocusは,ビデオトークンを効率よく圧縮し,映像フレーム内に存在する情報的コンテキストを強調する手法である。
KFFocusは、コンテキスト関連性に基づいてフレームに様々な凝縮率を割り当てることで、情報コンテンツの詳細を保存しつつ、トークンの冗長性を効率的に低減する。
また,ビデオフレーム間の時間的関係と各フレーム内の空間構造をエンコードするマルチモーダルモデリングモジュールを導入する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:57:03 GMT)
QoE-Aware Service Provision for Mobile AR Rendering: An Agent-Driven Approach [33.7] モバイル拡張現実(MAR)は、6Gで重要な没入型アプリケーションとして想定されている。
本稿では,エッジ支援型MARのためのエージェント駆動型通信サービス提供手法を提案する。
ユーザレベルのQoEモデリング手法を開発し、通信リソース要求と認識されたユーザQoEの関係を抽出する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:32:04 GMT)
Test and characterization of multilayer ion traps on fused silica [33.4] イオントラップは将来の量子コンピュータをホストする有望なアーキテクチャである。
現在、イオントラップはシリコン基板上でしばしば製造され、高い電力散逸をもたらす。
工業施設で製造・試験した溶融シリカ基板上に多金属層イオントラップを作製した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:34:09 GMT)
LLM Unlearning Without an Expert Curated Dataset [33.2] 言語モデル自体を用いて高品質な忘れセットを生成するために,スケーラブルで自動化されたアプローチを導入する。
提案手法は,入力としてドメイン名のみを必要とする構造化プロンプトパイプラインを通じて,教科書形式のデータを合成する。
我々の合成データセットは、ベースライン合成の代替品よりも一貫して優れており、専門家による合成データセットに匹敵するものであることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:22:37 GMT)
Context as Memory: Scene-Consistent Interactive Long Video Generation with Memory Retrieval [33.2] 歴史的文脈をメモリとして利用して映像生成を行うコンテキスト・アズ・メモリを提案する。
歴史的文脈を全て組み込むという膨大な計算オーバーヘッドを考慮すると、メモリ検索モジュールを提案する。
実験により, コンテキスト・アズ・メモリは, SOTAと比較して, 対話型長ビデオ生成において優れたメモリ能力を実現することが示された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:27:56 GMT)
IP-CRR: Information Pursuit for Interpretable Classification of Chest Radiology Reports [31.4] 胸部X線診断レポートの分類のための解釈可能な設計フレームワークを提案する。
提案手法の有効性を示すMIMIC-CXRデータセットの実験を行った。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 22:14:46 GMT)
Effort-aware Fairness: Incorporating a Philosophy-informed, Human-centered Notion of Effort into Algorithmic Fairness Metrics [31.0] Effort-aware Fairness (EaF) の概念化と評価のための哲学インフォームドアプローチを提案する。
私たちの作業は、AIモデル監査官が改善に多大な努力を払ってきたが、制御外の体系的な不利益に悩まされている個人に対して、不公平な判断を明らかにし、修正する可能性を秘めることができるかもしれません。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:08:29 GMT)
Interpreting Fedspeak with Confidence: A LLM-Based Uncertainty-Aware Framework Guided by Monetary Policy Transmission Paths [31.0] 連邦準備制度が使用するスタイル化され、しばしばニュアンスな言語である「Fedspeak」は、暗黙の政策信号と戦略的スタンスを符号化している。
我々はFedspeakを解析・解釈するための不確実性を考慮したフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:42:34 GMT)
TiMoE: Time-Aware Mixture of Language Experts [30.8] 大規模言語モデル(LLM)は通常、Webの固定スナップショットに基づいてトレーニングされる。
我々は,2013-2024コーパスの2年スライスを分割し,TiMoEで組み合わせることで,GPTスタイルのエキスパートセットをスクラッチから事前学習することで,この問題に対処する。
推論時にTiMoEは、クエリタイムスタンプ後にトレーニングウィンドウが終了するすべての専門家をマスクし、残りのログ確率を共有スペースにマージする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:36:36 GMT)
From Platform Migration to Cultural Integration: the Ingress and Diffusion of #wlw from TikTok to RedNote in Queer Women Communities [28.8] 西オリジンの#wlwハッシュタグは、RedNoteの中国のレズビアンコミュニティで上昇している。
この出来事は、異文化間のハッシュタグの侵入と拡散を研究するためのユニークなレンズを提供する。
結果は、#wlwの導入の成功は、TikTok移民の大胆な輸入によって促進されたことを示している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:21:48 GMT)
SPIE: Semantic and Structural Post-Training of Image Editing Diffusion Models with AI feedback [28.8] SPIEは、命令ベースの画像編集拡散モデルの意味的および構造的後学習のための新しいアプローチである。
広範な人間のアノテーションに頼ることなく、拡散モデルと人間の嗜好を一致させるオンライン強化学習フレームワークを導入する。
実験結果から,SPIEは複雑なシーンで,わずか10ステップで複雑な編集を行うことができることがわかった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 00:19:11 GMT)
RealisMotion: Decomposed Human Motion Control and Video Generation in the World Space [28.7] 本研究では,外見,背景,軌道からの動作を明示的に分離する枠組みを提案する。
本手法は,要素ワイド制御性と全映像品質の両面において,最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:02:23 GMT)
VGGSounder: Audio-Visual Evaluations for Foundation Models [28.3] VGGSoundデータセットは、音声視覚分類評価のベンチマークとして一般的に使用される。
VGGSounderは、VGGSoundを拡張し、音声・視覚基盤モデルを評価するために特別に設計された、再注釈付きマルチラベルテストセットである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:20:19 GMT)
BrowseMaster: Towards Scalable Web Browsing via Tool-Augmented Programmatic Agent Pair [28.1] 現在の大規模言語モデル(M)ベースのエージェントは,探索幅の制限や推論深度によるバランスの達成に苦慮している。
拡張プランナー-実行エージェントペアを中心に構築されたBrowseMasterフレームワークを提案する。
英語と中国語のテストでは、BrowseMasterはオープンなベンチマークとプロプライエタリなベースラインを一貫して上回り、BrowseComp-enで3点、BrowseComp-zhで46.5点を記録している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:56:25 GMT)
A Survey of Optimization Modeling Meets LLMs: Progress and Future Directions [27.8] 大規模言語モデル(LLM)の出現に伴い、数学的モデリングの手順を自動化する新たな機会が出現した。
この調査は、技術的スタック全体をカバーする最近の進歩を包括的にレビューする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:55:33 GMT)
InfiAlign: A Scalable and Sample-Efficient Framework for Aligning LLMs to Enhance Reasoning Capabilities [27.1] InfiAlignは、大規模言語モデル(LLM)のためのスケーラブルでサンプル効率の良いポストトレーニングフレームワークである
InfiAlignの中核は、オープンソースの推論から高品質なアライメントデータを自動的にキュレートする堅牢なデータ選択パイプラインである。
本結果は,基本データ選択とフルステージポストトレーニングの併用の有効性を強調した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:26:00 GMT)
Multi-Keypoint Affordance Representation for Functional Dexterous Grasping [27.0] 本稿では,機能的デキスタラスグルーピングのためのマルチキーポイントアプライアンス表現を提案する。
本手法は,機能的接触点の局在化により,タスク駆動型グリップ構成を符号化する。
提案手法は,手頃な局所化精度,一貫性の把握,未知のツールやタスクへの一般化を著しく改善する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:15:16 GMT)
Unified and Semantically Grounded Domain Adaptation for Medical Image Segmentation [26.9] 医用画像セグメンテーションのための以前の教師なし領域適応アプローチは、ソースアクセス可能な設定に合わせて狭義に調整されている。
我々は、ソースアクセシビリティとソースフリーアダプションの両方をサポートする統一的でセマンティックな基盤となるフレームワークを導入する。
当社のフレームワークは、ソースフリー性能がソースアクセシビリティに近づきながら、両方の設定で最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:56:16 GMT)
Real-Time Intuitive AI Drawing System for Collaboration: Enhancing Human Creativity through Formal and Contextual Intent Integration [26.9] 本稿では,形式的意図と文脈的意図の両方を解釈・統合するリアルタイム生成システムを提案する。
このシステムは,共有キャンバス上でのマルチユーザコラボレーションをサポートしながら,低レイテンシで2段階の変換を実現する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:34:23 GMT)
Multidimensional Adaptive Coefficient for Inference Trajectory Optimization in Flow and Diffusion [26.9] フローモデルと拡散モデルは、様々なタスクにおいて強い性能と訓練安定性を示してきた。
フローおよび拡散モデルのためのプラグインモジュールである多次元適応係数(MAC)を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:38:12 GMT)
Learning Marmoset Vocal Patterns with a Masked Autoencoder for Robust Call Segmentation, Classification, and Caller Identification [26.6] マーモセットの発声は、構造が小さく、高度に変動し、ノイズの多い低リソース条件で記録される。
従来のCNNは局所的なパターンを扱うが、長距離時間構造に苦しむ。
グローバルな依存関係に対して自己アテンションを用いてトランスフォーマーを適用した。
私たちはMAEでトランスフォーマーを事前訓練します -- 何百時間もの無注釈のマーモセット記録から、マスクされたセグメントを再構築する自己教師型の方法です。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:16:44 GMT)
DIVER: A Multi-Stage Approach for Reasoning-intensive Information Retrieval [26.4] 推論集約型情報検索に適した検索パイプラインである textbfDIVER を提案する。
BRIGHTベンチマークでは、DIVERは元のクエリで最先端のnDCG@10スコアの41.6と28.9を達成している。
コードと検索モデルはまもなくリリースされます。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:46:08 GMT)
Box2Poly: Memory-Efficient Polygon Prediction of Arbitrarily Shaped and Rotated Text [26.2] トランスフォーマーに基づくテキスト検出技術は多角形を予測する。
本稿では,ポリゴン予測のためのカスケードデコードパイプラインであるSparse R-CNNをルーツとする革新的なアプローチを提案する。
提案手法は,先行結果のスケールと位置を考慮し,ポリゴン予測を反復的に精錬することで精度を確保できる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:22:55 GMT)
Return Prediction for Mean-Variance Portfolio Selection: How Decision-Focused Learning Shapes Forecasting Models [25.7] 意思決定学習は、予測と最適化を統合して意思決定結果を改善する。
本研究では、DFLが平均分散最適化(MVO)における決定を最適化するために、ストックリターン予測モデルをどのように調整するかを検討する。
その結果,予測誤差が高いにもかかわらず,DFLが優れたポートフォリオ性能を実現する理由が明らかになった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:44:53 GMT)
Revealing the Role of Audio Channels in ASR Performance Degradation [25.4] 異なる録音チャンネルによる音声特性の変化は、ASRの性能を損なう可能性があることを示す。
本稿では,チャネル変動の影響を軽減するために,正規化手法を提案する。
このアプローチは、未確認のチャンネルや言語上でのASR性能を大幅に改善する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:32:48 GMT)
Cowpox: Towards the Immunity of VLM-based Multi-Agent Systems [25.3] 核となるセキュリティ特性は堅牢性であり、システムは敵の攻撃下でその整合性を維持するべきである、と述べている。
我々は,マルチエージェントシステムのロバスト性を高めるための新しい防衛手法,Cowpoxを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:48:51 GMT)
Deep Neural Network Calibration by Reducing Classifier Shift with Stochastic Masking [24.3] ディープニューラルネットワーク(DNN)は、特に自律運転やヘルスケアといった安全上重要なシナリオにおいて、キャリブレーションの低下に悩まされることが多い。
そこで本稿では,マスクを用いたキャリブレーション手法であるMaC-Calを提案する。
MaC-Calはデータ破損時のキャリブレーション性能とロバスト性に優れる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:50:23 GMT)
STELAR-VISION: Self-Topology-Aware Efficient Learning for Aligned Reasoning in Vision [24.2] トポロジを意識した推論のためのトレーニングフレームワークSTELAR-Visionを紹介する。
コアとなるTopoAugは、さまざまなトポロジカルな構造でトレーニングを充実させる合成データパイプラインだ。
MATH-VとVLM-S2Hでは、STELAR-Visionはベースモデルの精度を9.7%向上し、より大型のQwen2VL-72B-インストラクションを7.3%上回っている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:27:50 GMT)
Beyond Blanket Masking: Examining Granularity for Privacy Protection in Images Captured by Blind and Low Vision Users [23.6] リスクの高い個人情報のみを選択的にマスクする、きめ細かいプライバシー保護フレームワークであるFiGPrivを提案する。
提案手法は細粒度セグメンテーションとデータ駆動型リスクスコアリング機構を統合する。
我々は,BIV-Priv-Segデータセットを用いてフレームワークの評価を行い,FiG-Privが+26%の画像コンテンツを保存していることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:56:36 GMT)
CulturalFrames: Assessing Cultural Expectation Alignment in Text-to-Image Models and Evaluation Metrics [23.6] テキスト・ツー・イメージ(T2I)モデルと評価指標のアライメントを定量化する。
文化フレームは、文化的表現の厳格な評価のための新しいベンチマークである。
モデルや国全体では、平均して44%の文化的な期待が失われていることが分かっています。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:34:07 GMT)
Privacy-protected Retrieval-Augmented Generation for Knowledge Graph Question Answering [23.5] プライバシ保護されたRAGシナリオを初めて検討し、そこでは、KGのエンティティがLLMに対して匿名である。
本稿では,関係中心の抽象化と構造指向の抽象化戦略を含む新しいARoGフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:38:21 GMT)
DefenderBench: A Toolkit for Evaluating Language Agents in Cybersecurity Environments [23.4] DefenderBenchは、犯罪、防衛、サイバーセキュリティ知識に基づくタスクに対して言語エージェントを評価するための実用的でオープンソースのツールキットである。
研究者にとって手頃で手頃な価格で手軽に利用でき、公正で厳格な評価を提供するように設計されている。
以上の結果から,Claude-3.7-sonnetが81.65点,Claude-3.7-sonnetが78.40点,Llama 3.3 70Bが71.81点,Claude-3.7-sonnetが71.81点,Claude-3.7-sonnetが最高性能を示した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:11:55 GMT)
Flow-SLM: Joint Learning of Linguistic and Acoustic Information for Spoken Language Modeling [23.4] テキストレス音声言語モデル(英語: Textless Speech Language Model、SLM)は、テキストの監督に依存しない音声の生成モデルである。
本稿では,意味トークンと音響フレームの連続実数値表現を生成することで,言語情報と音響情報を共同でモデル化することを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:25:37 GMT)
ViStoryBench: Comprehensive Benchmark Suite for Story Visualization [23.3] ViStoryBenchは、さまざまな物語構造、視覚スタイル、キャラクター設定にわたるストーリービジュアライゼーションモデルを評価するために設計された包括的なベンチマークである。
ベンチマークでは、文学、映画、民俗学にまたがるキュレートされたストーリーから派生した、豊富な注釈付きマルチショットスクリプトが特徴である。
徹底的な評価を可能にするために、ViStoryBenchは、文字の一貫性、スタイルの類似性、迅速な順守、美的品質、生成アーティファクトを評価する一連の自動メトリクスを導入した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:42:50 GMT)
A Survey on Training-free Alignment of Large Language Models [22.7] トレーニングフリー(TF)アライメント技術は、リソース集約的な微調整に代わる有望な代替手段を提供する。
本稿では,TFアライメント法の最初の体系的レビューを行う。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:30:44 GMT)
Fancy123: One Image to High-Quality 3D Mesh Generation via Plug-and-Play Deformation [22.6] 2つの拡張モジュールと、上記の3つの問題に対処するための未投射操作を備えたFancy123を提案する。
外観強調モジュールは、2Dマルチビューイメージをリアルピクセルに変形させて、より優れたマルチビュー一貫性を実現する。
忠実度向上モジュールは、入力画像に一致するように3Dメッシュを変形させる。
入力画像と変形したマルチビュー画像をLRMの生成されたメッシュに投影することで、高い明快さが保証される。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:50:03 GMT)
Finite-Sample Guarantees for Learning Dynamics in Zero-Sum Polymatrix Games [22.4] ゼロサムポリマトリクスゲームにおける最適応答型学習ダイナミクスについて検討する。
2つの設定は、各プレイヤーがゲームについて持っている情報の種類によって区別される。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:25:59 GMT)
Neural Operator Variational Inference based on Regularized Stein Discrepancy for Deep Gaussian Processes [22.3] 本稿では,深いガウス過程に対するニューラル演算子変分推論(NOVI)を提案する。
NOVIは、ニューラルジェネレータを使用してサンプリング装置を取得し、生成された分布と真の後部の間のL2空間における正規化スタインの離散性を最小化する。
提案手法が提案するバイアスは定数で発散を乗算することで制御可能であることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:16:19 GMT)
Vulnerability-Aware Alignment: Mitigating Uneven Forgetting in Harmful Fine-Tuning [22.1] 脆弱性認識アライメント(Vulnerability-Aware Alignment)は、データの脆弱性を推定し、データを"脆弱性"と"脆弱性"のグループに分割し、バランスの取れた学習を促進する。
VAAは、ダウンストリームタスクのパフォーマンスを維持しながら有害なスコアを著しく低減し、最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:16:47 GMT)
What Changed and What Could Have Changed? State-Change Counterfactuals for Procedure-Aware Video Representation Learning [22.0] 状態変化記述を取り入れたプロシージャ対応ビデオ表現学習について検討する。
我々は、仮説化された失敗の結果をシミュレートする状態変化反事実を生成する。
本研究は,提案した状態変化記述の有効性と,その有効性を実証するものである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:19:14 GMT)
Oblivionis: A Lightweight Learning and Unlearning Framework for Federated Large Language Models [21.6] 大規模言語モデル(LLM)は、フェデレートラーニング(FL)を活用して、プライベートなタスク固有のデータセットを微調整に利用している。
Oblivionisは、クライアントが特定のプライベートデータを選択的に削除できる軽量学習およびアンラーニングフレームワークである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:02:53 GMT)
Not in My Backyard! Temporal Voting Over Public Chores [21.4] 本研究では、有権者が公共の雑用に対して動的に選好する時間的投票モデルについて検討する。
実用的・平等的福祉を最適化する際の計算複雑性について検討する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:06:56 GMT)
One-shot Optimized Steering Vectors Mediate Safety-relevant Behaviors in LLMs [21.2] 本稿では,1つのトレーニング例に基づいて,勾配降下によるステアリングベクトルの最適化を提案する。
その結果,複数モデルにおける安全関連挙動を効果的に処理できることが判明した。
の作業を拡張し、脆弱なコードを書くためにモデルに最適化されたSVがモデルに有害な応答をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 23:58:47 GMT)
PointDreamer: Zero-shot 3D Textured Mesh Reconstruction from Colored Point Cloud [21.2] 優れたテクスチャ品質に先立って2次元拡散を利用する新しいフレームワークであるPointDreamerを提案する。
PointDreamerはゼロショットだが、 SoTAパフォーマンス(LPIPSスコアが0.118から0.068に30%改善)を示し、ノイズ、スパース、さらには不完全な入力データに対して堅牢である。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:31:36 GMT)
TopXGen: Topic-Diverse Parallel Data Generation for Low-Resource Machine Translation [20.7] 我々は、低リソース言語(LRL)における高品質でトピックの多元データ生成のためのアプローチであるtextscTopXGen を提示する。
我々の直感では、LLMはLRLに翻訳するのに苦労するが、HRLに翻訳する能力とその多言語性により、良質で自然に聞こえるターゲットサイドのテキストを生成することができる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:58:02 GMT)
Post-Completion Learning for Language Models [20.6] 現在の言語モデルトレーニングパラダイムは、エンド・オブ・シーケンス(eos>)トークンに到達して学習を終了する。
モデル出力完了後のシーケンス空間を体系的に活用する新しい学習フレームワークであるポストコンプリート学習(PCL)を提案する。
PCLは、学習中の自己評価と報奨予測を継続し、完了点に停止することで効率的な推論を維持する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:22:33 GMT)
ParallelSearch: Train your LLMs to Decompose Query and Search Sub-queries in Parallel with Reinforcement Learning [20.1] Reasoning-augmented search agent as Search-R1は、外部知識ソースからの多段階情報検索において顕著な能力を示す。
既存のアプローチは、本質的に並列化可能で論理的に独立な比較を扱う場合でも、検索クエリを厳格に処理する。
並列化可能なクエリ構造を認識し,複数の検索操作を同時に実行する,大規模言語モデルを活用した新しい強化学習フレームワークであるParallelSearchを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:38:21 GMT)
3DFroMLLM: 3D Prototype Generation only from Pretrained Multimodal LLMs [20.1] 3DFroMLLMは、3DオブジェクトのプロトタイプをMLLMから直接生成できる新しいフレームワークである。
我々は,このフレームワークによって生成されたレンダリング画像が,画像分類事前学習タスクに効果的に利用できることを示した。
実世界の魅力的なユースケースとして、生成したプロトタイプを利用して視覚言語モデルを改善することができることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:21:59 GMT)
SoftHGNN: Soft Hypergraph Neural Networks for General Visual Recognition [19.9] ハイパーグラフは高次相互作用をモデル化することによって従来のグラフを拡張する。
既存のハイパーグラフニューラルネットワークは通常、静的およびハードなハイパーエッジ割り当てに依存している。
本稿では,ハイパーグラフ計算の方法論を拡張したソフトハイパーグラフニューラルネットワーク(SoftHGNN)を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:30:27 GMT)
UGM2N: An Unsupervised and Generalizable Mesh Movement Network via M-Uniform Loss [19.5] メッシュムーブメント技術はシミュレーション精度と計算効率の両方を向上させる。
既存のアプローチは高い計算複雑性と幾何学的柔軟性に悩まされている。
教師なしおよび一般化可能なメッシュ運動ネットワーク(UGM2N)を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:56:45 GMT)
RemoteReasoner: Towards Unifying Geospatial Reasoning Workflow [19.5] リモートセンシング画像は、大きく、本質的に非構造的な空間データを提示する。
地理空間推論のための統合ワークフローであるRemoteReasonerを提案する。
RemoteReasonerは、複数の粒度推論タスクにわたる最先端(SOTA)パフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:54:40 GMT)
VulScribeR: Exploring RAG-based Vulnerability Augmentation with LLMs [19.5] VulScribeRは、慎重にキュレートされたプロンプトテンプレートを利用して脆弱なデータセットを拡張する新しいソリューションである。
我々のアプローチでは、VulgenとVGXの2つのSOTAメソッドを破り、Random Oversampling(ROS)は27.48%、27.93%、f1スコアで15.41%の脆弱性サンプルを生成する。
提案手法は,1Kサンプルを188ドル程度の安価で生成することで,大規模データ拡張の実現可能性を示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:10:24 GMT)
InteChar: A Unified Oracle Bone Character List for Ancient Chinese Language Modeling [19.4] InteCharは、未コーディングのオラクルの骨文字を伝統的な中国語や現代中国語と統合した文字リストである。
Oracle Corpus Set(OracleCS)は、専門家による注釈付きサンプルとLLMによるデータ拡張を組み合わせた、中国の古代のコーパスである。
実験によると、OracleCS上でInteCharでトレーニングされたモデルは、さまざまな歴史的言語理解タスクで大幅に改善されている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:53:57 GMT)
The Roots of International Perceptions: Simulating US Attitude Changes Towards China with LLM Agents [19.4] 意見更新のためのメディアデータ収集,ユーザプロファイル作成,認知アーキテクチャを統合したフレームワークを提案する。
我々の研究は,LLMに基づく認知行動モデリングの新しいパラダイムに寄与する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:54:08 GMT)
Ethical Medical Image Synthesis [19.4] 倫理的MISynの鍵となる性質とMISynの内在的限界を同定する理論的解析を行う。
倫理的リスクは、医用画像と比較して、合成画像の本質的な限界と弱点を認めないことから生じる。
結果として生じる倫理的害には、医療画像データセット環境への信頼を損なうことや、利害関係者や一般大衆に対してアルゴリズムによる差別を引き起こすことが含まれる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:14:37 GMT)
IRL-VLA: Training an Vision-Language-Action Policy via Reward World Model [19.1] IRL-VLA は textbfInverse textbfReinforcement textbfLearning reward world model による新しいループ強化学習である。
本稿では, 自己構築型VLAアプローチを用いて, textbfInverse textbfReinforcement textbfLearning reward world model を用いた新しいループ強化学習であるIRL-VLAを紹介する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:41:32 GMT)
Search-Time Data Contamination [18.9] 探索時間汚染(STC)という類似の問題を検索ベースLLMエージェントの評価において同定する。
評価データセットをホストするオンラインプラットフォームであるHuggingFaceが,検索ベースのエージェントログから検索したソースの中に現れることがわかった。
本稿では,ベンチマーク設計のベストプラクティスと,この新たなリークに対処するための結果報告を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 22:52:21 GMT)
QAMRO: Quality-aware Adaptive Margin Ranking Optimization for Human-aligned Assessment of Audio Generation Systems [18.8] 既存の手法では、平均世論スコア(MOS)予測を回帰問題として扱うが、標準的な回帰損失は知覚的判断の相対性を見落としている。
QAMROは、異なる視点から回帰目標をシームレスに統合する、新しい品質に配慮した適応型マージンランク最適化フレームワークである。
我々のフレームワークはCLAPやAudiobox-Aestheticsのような事前学習されたオーディオテキストモデルを活用し、公式のAudioMOS Challenge 2025データセットにのみトレーニングされている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:14:04 GMT)
Relative Pose Regression with Pose Auto-Encoders: Enhancing Accuracy and Data Efficiency for Retail Applications [18.7] カメラポッドオートエンコーダ(PAE)をRPR(Relative Pose Regression)に拡張する。
画像の保存やポーズデータの追加を必要とせず、PAEベースのRPRを用いてAPR予測を洗練させる新しい再局在方式を提案する。
本手法は, データの30%をトレーニングしても, 競争性能が向上し, 小売展開におけるデータ収集の負担が大幅に軽減されることが示唆された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:35:34 GMT)
EvoP: Robust LLM Inference via Evolutionary Pruning [18.4] 大規模言語モデル(LLM)は自然言語処理タスクにおいて顕著な成功を収めた。
既存のモデルプルーニングメソッドは、モデルから冗長な構造を取り除き、この問題に対処する。
頑健なLLM推論のための進化的プルーニングフレームワークであるEvoPを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:23:04 GMT)
LLM Empowered Prototype Learning for Zero and Few-Shot Tasks on Tabular Data [18.3] 大規模言語モデル(LLM)は、データモデリングにおけるその可能性について詳細な調査を行うための扉を開いた。
表型学習のための新しい LLM ベースのプロトタイプ推定フレームワークを提案する。
私たちのキーとなるアイデアは、LLMに問い合わせて、特徴値ベースの例なしプロンプトを生成することです。
当社は、例ベースのプロンプトによる制約を回避し、スケーラブルで堅牢なフレームワークを提供しています。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:07:11 GMT)
Evidence of scaling advantage on an NP-Complete problem with enhanced quantum solvers [17.9] NP完全1対3のブール充足性問題に対する拡張量子解法を開発した。
13量子ビットの超伝導量子プロセッサ上で,拡張型ソルバを実験的に実装した。
その結果,NP完全問題に対する量子スピードアップの実証的証拠が得られた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:52:24 GMT)
PADReg: Physics-Aware Deformable Registration Guided by Contact Force for Ultrasound Sequences [17.8] PADRegは、接触力によってガイドされる物理対応の変形可能な登録フレームワークである。
PADRegのHD95は12.90で、最先端の手法よりも21.34%良い。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:19:21 GMT)
AI Agents and the Law [17.7] 我々は、エージェントの技術的な概念が、エージェンシーの社会法的概念の一部を追跡するが、全てではないことを示す。
機関法における暗黙の権威とAIにおける価値アライメントの原理の相関について検討する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:18:48 GMT)
LEAVES: Learning Views for Time-Series Biobehavioral Data in Contrastive Learning [17.7] 時系列生物行動データに適用したコントラスト学習フレームワークにおいて、自動ビュー生成のためのモジュールを導入する。
2つのよく知られたコントラスト学習フレームワークを用いて,複数の時系列データセットに対する本手法の有効性を評価する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 23:03:00 GMT)
Mem4D: Decoupling Static and Dynamic Memory for Dynamic Scene Reconstruction [17.6] 静的幾何学と動的運動のモデリングを分離する新しいフレームワークを提案する。
Mem4Dは、グローバルな整合性を持つ静的幾何学を同時に維持し、高忠実度で動的要素を再構成する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:13:49 GMT)
X-UniMotion: Animating Human Images with Expressive, Unified and Identity-Agnostic Motion Latents [17.5] X-UniMotionは全身の人間の動きを統一的かつ表現的に表現できる潜在性表現である。
提案手法は、1つの画像から4つの非絡み合った潜在トークンのコンパクトな集合への多粒体運動を直接符号化する。
これらの動き潜伏剤は、非常に表現力が高く、同一性に依存しないため、高忠実で詳細な異性間移動を可能にする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 22:47:20 GMT)
Exact Verification of Graph Neural Networks with Incremental Constraint Solving [17.4] グラフニューラルネットワーク(GNN)は、不正検出や医療といった高度なアプリケーションにますます採用されているが、敵の攻撃の影響を受けやすい。
我々は,GNNに対して,属性や構造的摂動に対する保証を計算するための,正確な(健全で完全な)検証手法を開発した。
我々は、メッセージパッシングニューラルネットワークのための汎用的な解法であるGNNevを実装し、合計、最大、平均の3つのアグリゲーション機能をサポートしている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:10:31 GMT)
GUARD:Dual-Agent based Backdoor Defense on Chain-of-Thought in Neural Code Generation [17.4] GUARDは、ニューラルコード生成におけるCoTバックドア攻撃に対抗するために設計された、新しいデュアルエージェント防御フレームワークである。
GUARDは2つのコアコンポーネントを統合している。GUARD-Judgeは不審なCoTステップと潜在的なトリガーを包括的分析によって識別する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:15:21 GMT)
What Can We Learn from Inter-Annotator Variability in Skin Lesion Segmentation? [17.2] 曖昧な境界を持つ病変は相違する傾向があり、しばしば悪性腫瘍と関連している。
診断者間合意(IAA)と悪性度との間には統計的に有意な関連が認められた。
IAAは皮膚画像から直接正確に予測でき、平均絶対誤差は0.108である。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 22:37:56 GMT)
Fast Tensor Completion via Approximate Richardson Iteration [17.2] 本研究は,構造化TD回帰アルゴリズムをブラックボックスサブルーチンとして用いたTC回帰問題の解法を提案する。
我々はリチャードソン近似アルゴリズムの収束速度を解析し、実世界のテンソル上のCP完備化の直接法よりも100倍高速であることを示した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:48:49 GMT)
TurboBias: Universal ASR Context-Biasing powered by GPU-accelerated Phrase-Boosting Tree [17.2] 本稿では,自動音声認識(ASR)のための普遍的文脈バイアスフレームワークを提案する。
このフレームワークはGPUアクセラレーションされたワードブースティングツリーに基づいており、グレディやビームサーチの復号のために浅い融合モードで使用することができる。
その結果,提案手法の効率性が高く,オープンソースの文脈バイアス手法を超越した結果を得た。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:25:57 GMT)
Klear-Reasoner: Advancing Reasoning Capability via Gradient-Preserving Clipping Policy Optimization [17.1] Klear-Reasonerは、長い推論能力を持つモデルで、問題解決時に慎重に検討する。
本報告では、学習後のワークフロー全体を網羅した推論モデルの詳細分析を行う。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:59:00 GMT)
Calibration Attention: Instance-wise Temperature Scaling for Vision Transformers [17.0] CalAttn は ViT の CLS トークンから直接適応型/インスタンスごとの温度を学習するドロップインモジュールである。
ViT-224、DeiT、Swinではキャリブレーションエラーを最大4倍削減し、0.1%のパラメータを追加している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:19:12 GMT)
Interpretable Reward Model via Sparse Autoencoder [16.9] Reinforcement Learning from Human Feedback (RLHF) は報酬モデル(RM)を人間の好みのプロキシとして活用し、行動と人間の価値を一致させる。
従来のRMには解釈性がなく、報酬の割り当ての背後にある推論について限定的な洞察を提供しており、ユーザの好みのシフトに対して柔軟である。
Sparse Autoencoder-enhanced Reward Model(textbfSARM)は,事前学習したSparse Autoencoderを報酬モデルに統合した新しいアーキテクチャである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:41:00 GMT)
Superclass-Guided Representation Disentanglement for Spurious Correlation Mitigation [16.8] 本稿では,クラスラベルに固有の意味構造を利用して,突発的特徴への依存を減らす手法を提案する。
我々のモデルは、事前学習された視覚言語モデルによって誘導される勾配に基づく注意力を用いて、超クラス関連と無関係の特徴を解き放つ。
提案手法は, ソースサンプルにアノテートすることなく, より複雑なスプリアス相関に頑健性を実現する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:16:04 GMT)
Stationarity Exploration for Multivariate Time Series Forecasting [16.7] APRNet(Amplitude-Phase Reconstruct Network)を提案する。
APRNetは振幅と位相の相互関係をモデル化し、振幅と位相が異なる物理量で制約されるのを防ぐ。
局所関数に適応的に適合する新しいKLCモジュールを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:15:51 GMT)
A Personalized Exercise Assistant using Reinforcement Learning (PEARL): Results from a four-arm Randomized-controlled Trial [16.6] 一貫性のある身体的不活性は、世界的な健康問題を引き起こす。
モバイルの健康介入は、スケーラブルでパーソナライズされた身体活動の促進に有望な道を提供する。
PEARLの研究は、Fitbitアプリを通じてコンテンツとタイミングPAをパーソナライズする強化学習(RL)アルゴリズムを評価するための、最初の大規模で4本腕のランダム化試験だった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 22:44:33 GMT)
Differentiation Through Black-Box Quadratic Programming Solvers [16.5] 事実上任意のQPソルバのプラグアンドプレイ微分のためのフレームワークであるdQPを紹介する。
我々の理論上の重要な洞察は、解とその微分は互いに密接に関連し単純な線形系で表現できるということである。
当社のオープンソースで最小限のオーバーヘッド実装は公開され、15以上の最先端の解決ツールとシームレスに統合されます。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:43:55 GMT)
GEPD:GAN-Enhanced Generalizable Model for EEG-Based Detection of Parkinson's Disease [16.5] 本稿では,脳波を用いたパーキンソン病のクロスデータセット分類のためのGAN拡張一般化モデルGEPDを提案する。
我々は,生成データと実データとの分布類似性を制御し,融合脳波データを生成する生成ネットワークを設計する。
また、複数の畳み込みニューラルネットワークを組み合わせた分類ネットワークを設計し、脳波信号の時間周波数特性を効果的に捉える。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:37:14 GMT)
AgriGPT: a Large Language Model Ecosystem for Agriculture [16.5] AgriGPTは、農業利用のためのドメイン特化大規模言語モデルエコシステムである。
信頼性のあるデータソースを,高品質で標準化された質問応答データセットであるAgri-342Kにコンパイルする,スケーラブルなデータエンジンを設計する。
本稿では,高密度検索,スパース検索,マルチホップ知識グラフ推論を組み合わせた3チャンネル検索拡張フレームワークTri-RAGを用いる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:51:08 GMT)
HypeVPR: Exploring Hyperbolic Space for Perspective to Equirectangular Visual Place Recognition [16.5] 双曲空間における新しい階層的埋め込みフレームワークであるHypeVPRを紹介する。
HypeVPRは、P2E(point-to-equirectangular VPR)の独特な課題に対処するために設計された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:22:22 GMT)
MCLPD:Multi-view Contrastive Learning for EEG-based PD Detection Across Datasets [16.4] 本稿では,MLCPDという半教師付き学習フレームワークを提案する。
マルチビューコントラスト事前トレーニングと軽量教師付き微調整を統合して、クロスデータセットPD検出性能を向上させる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:19:27 GMT)
Geometry-Aware Global Feature Aggregation for Real-Time Indirect Illumination [16.3] 画面空間における拡散間接照明の予測を行う学習ベース推定器を提案する。
直接照明と組み合わせて、世界的に照射された高ダイナミックレンジの結果を合成する。
本手法は, 様々な色の照明や環境照明など, 複雑な照明の処理に優れる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:36:03 GMT)
xRFM: Accurate, scalable, and interpretable feature learning models for tabular data [16.2] 本研究では,特徴学習カーネルマシンを木構造と組み合わせ,データの局所構造に適応させるアルゴリズムであるxRFMを紹介する。
我々は、xRFMが100ドルの回帰データセットで最高のパフォーマンスを達成し、200ドルの分類データセットで最高のメソッドと競合することを示した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:08:04 GMT)
When Deepfakes Look Real: Detecting AI-Generated Faces with Unlabeled Data due to Annotation Challenges [16.2] AIが生成するコンテンツがますます現実的になるにつれて、テキスタイルのアノテータでさえ、ディープフェイクと本物のイメージの区別に苦慮している。
オンラインソーシャルネットワークの大規模未ラベルデータを効果的に活用できるアプローチへの需要が高まっている。
本稿では,DPGNet (Dual-Path Guidance Network) を導入し,(1) 異なる世代モデルからの顔間の領域ギャップを埋めること,(2) ラベルのない画像サンプルを活用すること,の2つの課題に対処する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:37:17 GMT)
Approximate DBSCAN under Differential Privacy [16.1] 本稿では、差分プライバシー(DP)の下でのDBSCAN問題を再考する。
既存のDP-DBSCANアルゴリズムは、入力点のクラスタラベルを公開することを目的としている。
本研究では,スパンの概念に基づくDP-DBSCANの代替定義を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:55:41 GMT)
Generalising Traffic Forecasting to Regions without Traffic Observations [16.1] 本稿では,交通センサのない地域での交通観測の欠如が既存モデルの課題となっている地域を予測することを目的とする。
我々はGenCastというモデルを提案し、その中核となる考え方は、欠落した観測を補うために外部知識を活用することである。
我々は物理インフォームドニューラルネットワークをGenCastに統合し、物理原理が学習プロセスの規則化を可能にする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:00:12 GMT)
See the Forest and the Trees: A Synergistic Reasoning Framework for Knowledge-Based Visual Question Answering [16.0] 本稿では,新しい相乗的推論フレームワークであるSynergos-VQAを提案する。
コアとなるSynergos-VQAは、推論時に3つの補完的なエビデンスストリームを同時に生成し、融合する。
提案手法は強力なプラグアンドプレイ能力を示し,様々なオープンソースMLLMを大幅に向上させる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:51:37 GMT)
Leveraging Predictive Equivalence in Decision Trees [16.0] 決定木は解釈可能な機械学習に広く使われている。
本稿では,予測等価性を示さない決定木の表現について述べる。
決定木は、機能値のテスト時間不足に対して驚くほど堅牢であることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:21:40 GMT)
Comprehensive Comparison Network: a framework for locality-aware, routes-comparable and interpretable route recommendation [15.8] ルートレコメンデーション(RR)は、Amapアプリにおけるルート計画のコアタスクである。
RR性能を向上させるために,包括的比較ネットワーク (CCN) と呼ばれる新しいモデルを提案する。
オフラインとオンラインの両方の実験では、CCNはRR性能を著しく改善し、高い解釈可能性を示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:40:52 GMT)
A Novel Evaluation Benchmark for Medical LLMs: Illuminating Safety and Effectiveness in Clinical Domains [15.7] 大言語モデル (LLMs) は臨床決定支援において有望であるが、安全性評価と有効性検証において大きな課題に直面している。
臨床専門家のコンセンサスに基づく多次元フレームワークであるCSEDBを開発した。
13名の専門医が, 現実のシナリオをシミュレートする26の臨床部門にまたがって, 2,069件のオープンエンドQ&A項目を作成した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:16:13 GMT)
"Accessibility people, you go work on that thing of yours over there": Addressing Disability Inclusion in AI Product Organizations [15.7] 我々は、25人のAI実践者とのインタビューで、彼らの作業プロセスとアーティファクトが障害のあるエンドユーザに与える影響についてインタビューした。
私たちは、責任あるAIとアクセシビリティのプラクティスの交差点で問題をトリアージする際に、実践者が摩擦を経験したことに気づきました。
我々は、AIのエンドユーザーとして障害のある人々を支援するために、新しいリソースとプロセスの変更を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:08:42 GMT)
ROD: RGB-Only Fast and Efficient Off-road Freespace Detection [15.6] オフロード自由空間検出は、移動可能な領域の境界がぼやけているため、オンロードのシナリオよりも難しい。
従来のSOTA(State-of-the-art)手法では、RGB画像とLiDARデータのマルチモーダル融合が採用されている。
本稿では, オフロード自由空間検出のための新しい RGB のみのアプローチである ROD について述べる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:41:20 GMT)
SSPFusion: A Semantic Structure-Preserving Approach for Infrared and Visible Image Fusion [15.5] マルチモーダル画像融合のための意味的構造保存融合法を提案する。
本手法は, 定性評価と定量的評価の両面で, 9つの最先端手法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:13:03 GMT)
ProMode: A Speech Prosody Model Conditioned on Acoustic and Textual Inputs [15.5] 韻律は、個々の慣用句と同様に、音声信号の豊かな感情的・意味的な情報を伝える。
本稿では,F0やエネルギといったテキストと韻律の特徴をマッピングするスタンドアローンモデルを提案する。
また,これらの予測された韻律的特徴をTSシステムに統合し,ベースラインよりも高い韻律的嗜好を示す知覚的テストを行う。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 23:12:18 GMT)
From Pixels to Tokens: Revisiting Object Hallucinations in Large Vision-Language Models [15.4] 大型視覚モデル(LVLM)における幻覚は、視覚入力に表示されない物体を生成するという重要な課題である。
最近の研究では、幻覚は視覚的な入力の理解の欠如に起因しているが、より根本的な問題は無視されている。
本稿では,LVLMの幻覚をアーキテクチャの観点から再検討し,視覚エンコーダ(機能抽出)とモーダルアライメントモジュール(機能デカップリング)の主な原因について検討する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:34:12 GMT)
Transferable Model-agnostic Vision-Language Model Adaptation for Efficient Weak-to-Strong Generalization [15.4] 視覚言語モデルのためのトランスミタブルモデル非依存アダプタ(TransMiter)を提案する。
TransMiterは、事前訓練されたVLMと微調整されたVLMの間の知識ギャップをキャプチャする。
バックプロパゲーションを必要とせずに、異なるモデル間でシームレスに転送できる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:37:16 GMT)
Hyperbolic Fuzzy C-Means with Adaptive Weight-based Filtering for Efficient Clustering [14.9] Fuzzy $C$-Means (FCM) アルゴリズムは、非ユークリッド空間において顕著な制限を示す。
HypeFCMはファジィクラスタリングの原理と双曲幾何学を統合する。
HypeFCMは、非ユークリッド環境で従来のファジィクラスタリング法よりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:47:01 GMT)
Multiple Stochastic Prompt Tuning for Few-shot Adaptation under Extreme Domain Shift [14.9] クラス毎に複数の学習可能なプロンプトを導入し,分布シフトによる視覚表現の多様なモードをキャプチャする。
これらのプロンプトは学習可能なガウス分布としてモデル化され、プロンプトパラメータ空間の効率的な探索を可能にする。
実験と最先端手法との比較により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:40:29 GMT)
UQGNN: Uncertainty Quantification of Graph Neural Networks for Multivariate Spatiotemporal Prediction [14.9] 既存のモデルは決定論的であり、不確実性を定量化せずに予測される平均値のみを予測する。
ニューラル化のためのUQGNNと呼ばれる不確かさを定量化したグラフネットワークを提案する。
UQGNNは、予測精度と不確実性定量化の両方において、最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:40:05 GMT)
Online Covariance Estimation in Nonsmooth Stochastic Approximation [14.8] 非滑らかな変分包含問題を解くために近似法(SA)を適用することを検討する。
我々の収束構造は、統計的推定法で最もよく知られているものを確立する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:41:58 GMT)
Weakly Supervised Fine-grained Span-Level Framework for Chinese Radiology Report Quality Assurance [14.8] 放射線学報告の品質保証(QA: Quality Assurance)とは、若年者(下級医)に資格があるかどうかを判断することである。
本稿では,QAスコアを自動的にマークするSpan-level Quality Assurance EvaluaTOR(Sqator)を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:03:20 GMT)
From Hard Refusals to Safe-Completions: Toward Output-Centric Safety Training [14.5] 本稿では,ユーザ意図のバイナリ分類ではなく,アシスタントのアウトプットの安全性を重視した安全訓練アプローチを提案する。
セーフコンプリートトレーニングは安全性を向上し(特にデュアルユースプロンプト)、残留する安全障害の重症度を低減し、モデルの有用性を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 00:18:23 GMT)
Dynamic Uncertainty-aware Multimodal Fusion for Outdoor Health Monitoring [14.5] MLLM(Multimodal large language model)は、将来性のある代替案である。
MLLMは入力やゆらぎノイズによる微妙な健康状態の変化を捉えることができない。
本研究では、動的・騒音環境における屋外健康モニタリングのためのマルチモーダル融合フレームワークであるマルチモーダルヘルスを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:07:27 GMT)
Deep Reinforcement Learning for Optimal Asset Allocation Using DDPG with TiDE [14.4] 本研究は,マルコフ決定過程(MDP)における逐次決定課題として最適2段階割当問題を定式化する。
このフレームワークは、シミュレーションされた金融シナリオに基づいて動的ポリシーを開発するための強化学習(RL)機構の適用を可能にする。
我々はDDPG-TiDEを、単純な離散的なQ-learning RLフレームワークとパッシブ・バイ・アンド・ホールド投資戦略と比較した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:59:55 GMT)
Argus Inspection: Do Multimodal Large Language Models Possess the Eye of Panoptes? [14.4] 本稿では,2段階の難易度を有するマルチモーダルベンチマークであるArgus Inspectionを紹介する。
また、双対パラメトリックなシグモイド計量と指標関数を統合する「アイ・オブ・パノプテス」フレームワークも提示する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:07:53 GMT)
Combat Urban Congestion via Collaboration: Heterogeneous GNN-based MARL for Coordinated Platooning and Traffic Signal Control [14.3] 本稿では,異種グラフ多エージェント強化学習と交通理論に基づく課題に挑戦する革新的な手法を提案する。
我々は、交通流を最適化するために、小隊と信号制御を独自の観測、行動、報酬関数セットで強化学習エージェントとして設計する。
提案手法をSUMOシミュレーションにより評価し,他の適応信号制御法と比較して,走行時間と燃料消費の両面で収束した結果が得られた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:57:17 GMT)
Approximate k-uniform states: definition, construction and applications [14.2] 我々は約$k$-uniform状態について検討し、大規模な測定を行わない限り、それらが正確な値と局所的に区別できないことを示した。
このような状態は、Haar-randomアンサンブルから高い確率で構築でき、より効率的に、浅いランダム量子回路を介して構築できることを示す。
我々の研究は、$k$一様状態の実践的応用の基礎を築いた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:13:42 GMT)
Certifying Quantum States with Uniform Measurements [14.2] 現在のほとんどの量子情報処理スキームでは、量子解決された演算と測定が必要とされる。
より資源効率のよい代替手段は、一様測定であり、そこでは、測定前に、サイト非依存のキュービットの回転が実行される。
均一な測定により、高い絡み合いと広く有用な量子状態の族である特定のグラフ状態が証明できることが示される。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:00:58 GMT)
Sleepless Nights, Sugary Days: Creating Synthetic Users with Health Conditions for Realistic Coaching Agent Interactions [14.1] 対話型エージェント評価のための合成ユーザ生成のためのエンドツーエンドフレームワークを提案する。
人工的な使用者は、健康状態やライフスタイル、特に睡眠と糖尿病の管理に基礎を置いている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:58:08 GMT)
Hybrid Long and Short Range Flows for Point Cloud Filtering [14.0] ポイントクラウドキャプチャプロセスはエラーを起こしやすく、フィルタリング/デノベーションを必要とするノイズの多いアーティファクトを導入します。
最近のフィルタリング手法は、しばしばポイントクラスタリングやノイズ保持の問題に悩まされる。
短距離フィルタと長距離フィルタリングの両方を考慮したハイブリッド・ポイント・クラウド・フィルタリングを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:11:22 GMT)
Harnessing Input-Adaptive Inference for Efficient VLN [13.8] ヴィジュアル・アンド・ランゲージ・ナビゲーション(VLN)における新たなパラダイムは、歴史を意識したマルチモーダルトランスモデルの利用である。
本稿では,VLNモデルの効率を向上させるための新しい入力適応ナビゲーション手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:05:33 GMT)
Automated Muscle and Fat Segmentation in Computed Tomography for Comprehensive Body Composition Analysis [13.8] 我々は,CTの身体組成分析に特化して,一般にアクセス可能なエンドツーエンドのセグメンテーションと特徴計算モデルを提案する。
本モデルでは, 胸部, 腹部, 骨盤領域における骨格筋, 皮下脂肪組織 (SAT) , 内臓脂肪組織 (VAT) の分画を行う。
また、筋肉密度、内臓-皮下脂肪比(SAT/SAT)、筋肉面積/体積、骨格筋指数(SMI)など、様々な身体組成指標も提供する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:41:01 GMT)
Learning to Harmonize Cross-vendor X-ray Images by Non-linear Image Dynamics Correction [13.8] 領域固有の画像力学の非線形特性は、単純な線形変換では扱えないことを示す。
ドメイン固有のミスマッチ露光を低減するため,Global Deep Curve Estimationという手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:16:04 GMT)
A Generative Imputation Method for Multimodal Alzheimer's Disease Diagnosis [13.8] 本稿では,既存のモダリティから欠落したモダリティを再構築するための生成的敵ネットワーク手法を提案する。
以上の結果より,アルツハイマー病と認知正常群との分類精度は9%改善した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:23:59 GMT)
Few-Shot Adversarial Low-Rank Fine-Tuning of Vision-Language Models [13.8] アドリアリトレーニングは,PEFTにおけるモデルロバスト性を改善するための最も効果的な戦略である。
本稿では,LRAで微調整されたCLIPモデルを少数の設定で拡張する最初のアルゴリズムであるAdvCLIP-LoRAを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:50:07 GMT)
Forget the Data and Fine-Tuning! Just Fold the Network to Compress [13.6] 構造的に類似したニューロンを層にマージする新しいデータフリーモデル圧縮技術であるモデルフォールディングを導入する。
モデル折り畳みはデータ駆動圧縮技術に匹敵する性能を示し,最近提案したデータフリー手法よりも優れていた。
このアプローチは大規模モデルを圧縮するのに特に有効であり、資源制約された環境への展開に適している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:34:30 GMT)
Gotta Hear Them All: Towards Sound Source Aware Audio Generation [13.6] Sound Source-Aware Audio (SS2A) ジェネレータは、シーンからマルチモーダルな音源をローカルに知覚することができる。
SS2Aは,広範囲な映像聴取作業において最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:20:41 GMT)
Gait in Eight: Efficient On-Robot Learning for Omnidirectional Quadruped Locomotion [13.3] On-robot Reinforcement Learning(オンロボット強化学習)は、脚のあるロボットの体格認識ポリシーを訓練するための有望なアプローチである。
実時間トレーニングのわずか8分で,四足歩行を効率よく学習する枠組みを提案する。
屋内と屋外の異なる環境におけるアプローチの堅牢性を示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:36:13 GMT)
Hypergraph-based Motion Generation with Multi-modal Interaction Relational Reasoning [13.3] 現実世界の運転環境は、車両間の動的かつ多様な相互作用によって特徴づけられる。
本研究では,自律走行車(AV)の運動予測のための統合フレームワークを提案する。
このフレームワークはマルチスケールのハイパーグラフニューラルネットワークを統合し、車両間のグループワイドインタラクションをモデル化する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:16:37 GMT)
Equivariance Everywhere All At Once: A Recipe for Graph Foundation Models [13.1] ノードレベルのタスクのためのグラフ基盤モデルを第一原理から設計するためのレシピを提案する。
本研究の基盤となる重要な要素は,グラフ基盤モデルが尊重すべき対称性を体系的に調査することである。
我々は29の実世界のノード分類データセットに関する広範な実験を通して、我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:55:32 GMT)
Elucidating Rectified Flow with Deterministic Sampler: Polynomial Discretization Complexity for Multi and One-step Models [13.0] 複数ステップのRFモデルと1ステップのRFモデルに対して,決定論的サンプリングを同時に行うことで,最初の離散化複雑性を証明した。
拡散モデルの予測・補正フレームワークにインスパイアされた多段階設定に対して,Langevin 過程を補正器として導入する。
一段階拡散モデルに対する最初の離散化複雑性を提供し、一段階拡散モデルに対する事前結果を改善する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:27:31 GMT)
A Pseudo Global Fusion Paradigm-Based Cross-View Network for LiDAR-Based Place Recognition [12.9] LiDARベースのPlace Recognition(LPR)は、Embodied Artificial Intelligence(AI)とAutonomous Drivingにおいて重要なタスクである。
既存のアプローチは、ユークリッド距離に基づく距離学習タスクへの位置認識を減らし、特徴空間の固有の構造やクラス内分散を無視している。
本稿では,これらの課題に対処する革新的な融合パラダイムに基づく,新しいクロスビューネットワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:12:48 GMT)
Adversarial Video Promotion Against Text-to-Video Retrieval [12.8] 私たちは、ビデオプロモーションアタック(ViPro)と呼ばれる、対向的に動画をプロモートする最初のT2VR攻撃を開拓した。
ViProは他のベースラインを平均30/10/4%以上上回り、ホワイト/グレー/ブラックボックスの設定が可能だ。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:57:44 GMT)
Vision-Only Gaussian Splatting for Collaborative Semantic Occupancy Prediction [12.8] 協調認識により、連結車両は情報を共有できる。
既存の3Dセマンティック占有予測のための視覚のみの手法は、一般的に密度の高い3Dボクセルに依存している。
本稿では,スパース3Dセマンティックスプラッティングを利用した3Dセマンティック占有予測手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:50:34 GMT)
MonoPartNeRF:Human Reconstruction from Monocular Video via Part-Based Neural Radiance Fields [12.8] 単分子動的人間のレンダリングのための新しいフレームワークMonoPartNeRFを提案する。
部分ベースのレンダリングパラダイムは、人間のセグメンテーションによってガイドされ、構造的な複雑さに基づいた柔軟なパラメータ割り当てを可能にする。
本研究では,グローバルなポーズベクトルを身体領域に基づく局所的な関節埋め込みに分解する部分的ポーズ埋め込み機構を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:55:21 GMT)
Towards Universal Neural Inference [12.7] ASPIREは、構造化データに対する意味論的推論と予測のためのユニバーサルニューラルネットワークモデルである。
任意の特徴値ペアのセットを取り込み、不整合テーブル間でセマンティクスを調整し、特定のターゲットに対して予測を行う。
ASPIREは、オープンワールド環境で、コスト対応のアクティブな機能獲得を自然にサポートします。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:26:48 GMT)
ChatBench: From Static Benchmarks to Human-AI Evaluation [12.6] 我々は,MMLU質問をユーザAI会話に変換するためのユーザスタディを設計し,実施する。
AIのみの精度は、ユーザAIの精度を予測するのに失敗する。
ユーザ-AIの会話を分析し、AI-aloneベンチマークからどのように分岐するかを洞察する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:53:40 GMT)
Exploring Large Language Model Agents for Piloting Social Experiments [12.6] 計算社会実験は通常、エージェントベースのモデリングを使用して、社会実験を操縦するためのテストベッドを作成する。
その重要性にもかかわらず、その幅広い影響は、その中心となる構成要素、すなわちエージェントの知性によって大きく制限されている。
この研究は、LSM駆動エージェントを設計し、社会実験を試験するための最初のフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:54:13 GMT)
Edge-Based Multimodal Sensor Data Fusion with Vision Language Models (VLMs) for Real-time Autonomous Vehicle Accident Avoidance [12.5] 本稿では,自律走行のためのリアルタイムエッジベース自律走行軌道プランナ(REACT)を提案する。
REACTは、微調整軽量ビジョンランゲージモデル(VLM)に基づくADのためのV2X統合軌道最適化フレームワークである。
DeepAccidentベンチマークで評価されたREACTは、最先端の性能、77%の衝突率の低減、48.2%のビデオパノプティクス品質(VPQ)、およびJetson AGX Orinでの0.57秒の推論遅延を実現している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:29:02 GMT)
FineState-Bench: A Comprehensive Benchmark for Fine-Grained State Control in GUI Agents [12.3] ファインステートベンチ(FinState-Bench)は,GUIプロキシ操作のための評価および診断標準である。
FineState-Benchには4つのコンポーネントに2257のタスクベンチマークが含まれており、知覚制御評価に4フェーズインジケータを使用している。
我々の診断フレームワークは、現在のGUIプロキシの最大のボトルネックが基本的な視覚的位置決め能力であることを初めて確認します。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:12:42 GMT)
Optimizing Class-Level Probability Reweighting Coefficients for Equitable Prompting Accuracy [12.3] LLMは、事前訓練されたデータの統計正則性からのバイアスをしばしば発見する。
これは、分類とQAにおいて、永続的で不均一なクラス精度をもたらす。
本研究では,非微分不可能な性能駆動メトリクスを直接最適化するポストホック確率再重み付け手法を開発した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:44:44 GMT)
Open-Set LiDAR Panoptic Segmentation Guided by Uncertainty-Aware Learning [12.3] 我々は不確実性誘導型オープンセット・パノプティクス・セグメンテーション・フレームワークであるULOPSを提案する。
我々のアーキテクチャは、不確実性推定を伴うセマンティックセグメンテーションのための分離されたデコーダを組み込んでいる。
推論中、未知のインスタンスを識別および分割するために不確実性推定を利用する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 22:57:17 GMT)
Stand-In: A Lightweight and Plug-and-Play Identity Control for Video Generation [12.2] ビデオ生成におけるアイデンティティ保護のための軽量かつプラグアンドプレイのフレームワークであるStand-Inを提案する。
我々のフレームワークは、ビデオの品質とアイデンティティの保存において優れた結果をもたらし、他のフルパラメータトレーニング方法よりも優れています。
我々のフレームワークは、主題駆動のビデオ生成、ポーズ参照ビデオ生成、スタイル化、顔交換など、他のタスクにシームレスに統合できる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:50:34 GMT)
Fre-CW: Targeted Attack on Time Series Forecasting using Frequency Domain Loss [12.1] 本稿では,周波数領域損失に基づく時系列予測攻撃アルゴリズムを提案する。
我々の知る限り、時系列敵攻撃における周波数情報の利用に関する関連する研究は存在しない。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:12:58 GMT)
Simulating Generative Social Agents via Theory-Informed Workflow Design [12.0] 社会エージェントのための体系的設計プロセスを提供する理論インフォームド・フレームワークを提案する。
私たちのフレームワークは、社会的認知理論の原則に基づいており、モチベーション、行動計画、学習という3つの重要なモジュールを導入しています。
実験により, 複雑な条件下での現実的な人間の行動パターンを再現できることが実証された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:14:48 GMT)
M-learner:A Flexible And Powerful Framework To Study Heterogeneous Treatment Effect In Mediation Model [12.0] 異種間接および全治療効果を推定するための新しい手法 M-learner を提案する。
私たちの知る限りでは、メディエーションの存在下での治療効果の不均一性を捉えるために特別に設計された最初のアプローチである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:25:16 GMT)
EditMF: Drawing an Invisible Fingerprint for Your Large Language Models [11.7] EditMFはトレーニング不要なフィンガープリントのパラダイムであり、最小の計算オーバーヘッドで非常に受け入れ難いフィンガープリントの埋め込みを実現する。
EditMF は,LoRA ベースの指紋認証をはるかに超越した堅牢性を提供しながら,認識不能なモデルの性能損失と高い認識性を兼ね備えていることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:52:48 GMT)
A Chinese Heart Failure Status Speech Database with Universal and Personalised Classification [11.5] 本研究は, 心不全患者を対象とした最初の中国語音声データベースであり, 入院前後のペア録音を特徴としている。
その結果,標準の「患者」とパーソナライズされた「ペアワイド」分類アプローチの両方を用いて,HF検出における中国語の有効性を確認した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:52:16 GMT)
StyleTailor: Towards Personalized Fashion Styling via Hierarchical Negative Feedback [11.5] StyleTailorは、パーソナライズされたアパレルデザイン、ショッピングレコメンデーション、バーチャルトライオン、システマティックな評価を結合的なワークフローに統合する最初のコラボレーティブエージェントフレームワークである。
我々のフレームワークは2つのコアエージェント、すなわちパーソナライズされた衣服選択のためのデザイナと仮想試着のためのコンサルタントを備えており、そのアウトプットは階層的な視覚言語モデルフィードバックによって徐々に洗練されている。
パフォーマンスを評価するために,スタイルの整合性,視覚的品質,顔の類似性,芸術的評価を含む総合的な評価スイートを導入する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:32:24 GMT)
Pep2Prob Benchmark: Predicting Fragment Ion Probability for MS$^2$-based Proteomics [11.5] Pep2Probはペプチド特異的なイオン確率予測のために設計された最初の包括的なデータセットとベンチマークである。
データセットには608,780の前駆体に対するフラグメントイオン確率統計が含まれており、一対のペプチド配列と電荷状態である。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:39:50 GMT)
Omni-Effects: Unified and Spatially-Controllable Visual Effects Generation [11.4] オムニエフェクト(Omni-Effects)は、即時誘導効果と空間制御可能な複合効果を生成できるフレームワークである。
LoRAベースのMixture of Experts (LoRA-MoE)は、専門家グループであるLoRAを採用し、統一モデルに多様な効果を統合する。
Space-Aware Prompt (SAP) は、空間マスク情報をテキストトークンに組み込んで、正確な空間制御を可能にする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:46:18 GMT)
Opioid Named Entity Recognition (ONER-2025) from Reddit [11.4] Redditのようなソーシャルメディアプラットフォームは、公共の認識、議論、オピオイドの使用に関する経験に関する洞察を提供する膨大な量の構造化されていないデータを提供している。
本研究では、自然言語処理(NLP)、特にOpioid Named Entity Recognition(ONER-2025)を活用して、これらのプラットフォームから実行可能な情報を抽出する。
まず、Redditからソースされたユニークな手動の注釈付きデータセットを作成し、ユーザーが異なる管理ルートを介してオピオイドの使用を自己報告した経験を共有する。
次に、ONER-2025データセットのラベル付けの課題を議論しながら、アノテーションプロセスとガイドラインを詳述する。
第三に、スラング、曖昧さ、断片化を含む重要な言語課題を分析する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:03:12 GMT)
AutoCodeBench: Large Language Models are Automatic Code Benchmark Generators [11.3] 我々はAutoCodeGenを紹介した。AutoCodeGenは、手動のアノテーションを使わずに、高度に微分可能な多言語コード生成データセットを生成する自動メソッドである。
我々はAutoCodeBenchとその簡易版AutoCodeBench-Lite上で、30以上の主要なオープンソースおよびプロプライエタリなLLMを評価した。
その結果、最も先進的なLLMでさえ、これらのタスクの複雑さ、多様性、多言語性に苦しむことが明らかとなった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:29:20 GMT)
Scalable Out-of-distribution Robustness in the Presence of Unobserved Confounders [11.1] 我々は、配当シフトが観測されていない共同設立者(Z$)による、配当外配当(OOD)一般化の課題を考える。
この共役は予測器の不均一性、すなわち$P(Y | X) = E_P(Z | X)[P(Y | X, Z)]$をもたらす。
1つの追加変数のみを用いて驚くほど単純な予測子を生成する識別可能性仮定の集合を探索する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:09:01 GMT)
VertexRegen: Mesh Generation with Continuous Level of Detail [11.1] 我々は、連続的な詳細レベルで生成が可能な、新しいメッシュ生成フレームワークであるVertexRegenを紹介します。
既存の自己回帰的手法は、部分的から完全的な方法でメッシュを生成するため、生成の中間ステップは不完全構造を表す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:25:46 GMT)
MVISU-Bench: Benchmarking Mobile Agents for Real-World Tasks by Multi-App, Vague, Interactive, Single-App and Unethical Instructions [11.0] textbfMVISU-Benchは137のモバイルアプリケーションに404のタスクを含むベンチマークである。
また,リスクを軽減し,モバイルエージェントのユーザ意図を明らかにするために,動的プロンプトプロンプトプロンプトとして機能するプラグイン・アンド・プレイモジュールであるAiderを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:18:30 GMT)
LogicCat: A Chain-of-Thought Text-to-SQL Benchmark for Complex Reasoning [10.9] LogicCatは、複雑な推論とチェーン・オブ・ソート解析のために特別に設計された最初のText-to-senseベンチマークデータセットである。
LogicCatは現在の最先端モデルのタスク難易度を33.20%に向上させる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:41:44 GMT)
Generalized Kennedy Receivers Enhanced CV-QKD in Turbulent Channels for Endogenous Security of Space-Air-Ground Integrated Network [10.9] 連続可変量子鍵分布(CV-QKD)は、秘密鍵レート(SKR)と既存の光通信インフラとの互換性が良好である。
本稿では,乱流チャネルにおけるコヒーレント状態の検出性能を高めるために,CD-Kennedy受信機と呼ばれる一般化されたケネディ受信機を用いる。
我々は, CD-Kennedy 受信機と EGC を含むホモダイン受信機の両方を用いて, 選択後 CV-QKD プロトコルのSKR を導出する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:22:12 GMT)
Closing the Performance Gap in Generative Recommenders with Collaborative Tokenization and Efficient Modeling [10.8] 本稿では,協調情報を学習項目表現に直接統合するコントラストトークン化手法を提案する。
また、アイテムデコーディングからタイムラインモデリングを分離する軽量な音声インスパイアされた生成モデルであるMARIUSを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:06:55 GMT)
BELLA: Black box model Explanations by Local Linear Approximations [10.7] BELLAは回帰ブラックボックスモデルの個々の予測を説明するための決定論的モデルに依存しないポストホックアプローチである。
BELLAは、線形モデルが適用する近傍の大きさを最大化して、説明が正確で、単純で、一般的で、堅牢である。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:05:05 GMT)
FetFIDS: A Feature Embedding Attention based Federated Network Intrusion Detection Algorithm [10.7] 侵入検知システム(IDS)は、悪意あるアクターによるネットワーク脆弱性の悪用を防止する上で、ますます重要な役割を担っている。
近年の深層学習に基づく開発により,IDSシステムの性能が大幅に向上した。
本稿では,FetFIDSを提案する。このFetFIDSでは,位置埋め込みの代わりに特徴埋め込みを応用し,侵入検出性能を向上させる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:16:29 GMT)
Developing a Transferable Federated Network Intrusion Detection System [10.7] 本稿では,ネットワークに接続されたデバイスに分散的に配置したディープラーニングによる侵入検知システムを提案する。
我々の目標は、既知の攻撃からの知識を用いて、未知の攻撃に対して、より優れたディープラーニングモデルを装備することである。
提案方式は, 高精度な局所検出率を維持しつつ, 転送性の向上に成功している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:22:29 GMT)
ReQuestNet: A Foundational Learning model for Channel Estimation [10.7] 本稿では,5G以降におけるチャネル推定(CE)のための新しいニューラルネットワーク,Recurrent Equivariant UERS Estimation Network(ReQuestNet)を提案する。
無線通信システムにおいて、リソースブロックの可変数(RB)、送信層の動的数、物理的リソースブロックグループ(PRG)バンドルサイズ(BS)、復調参照信号(DMRS)パターンを単一統一モデルで処理し、CEパイプラインを劇的に単純化するなど、いくつかの実践的な考察を取り入れている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:44:47 GMT)
Who pays the RENT? Implications of Spatial Inequality for Prediction-Based Allocation Policies [10.4] 個人レベルのターゲティングに関する最近の研究は、矛盾する結果を示している。
あるモデルでは、ターゲティングは不平等が高いときに役に立たないが、あるモデルでは潜在的な利益を示す。
我々は,不平等の空間分布がドア・ドア・ドア・アウトリーチ政策の有効性にどのように影響するかを理解するために,Mallowsモデルに基づくスタイリングフレームワークを開発する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:16:50 GMT)
Think as Cardiac Sonographers: Marrying SAM with Left Ventricular Indicators Measurements According to Clinical Guidelines [10.3] 心血管疾患の診断には左室(LV)測定が重要である。
ビジョンファインダオプションモデル(VFM)を豊富な知識で導入する必要がある。
本稿では,SAMの強力な視覚的理解とセグメンテーションとランドマークローカライゼーションタスクを同時に組み合わせたAutoSAMEという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:09:36 GMT)
Frequency-Assisted Adaptive Sharpening Scheme Considering Bitrate and Quality Tradeoff [10.3] クオリティ・オブ・サービス(QoS)が劣化する結果、シャープ化レベルが向上する。
本稿では、周波数支援シャーニングレベル予測モデル(FreqSP)を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:22:48 GMT)
HQ-OV3D: A High Box Quality Open-World 3D Detection Framework based on Diffision Model [9.9] 本稿では,高品質な擬似ラベルの生成と精巧化を目的とした,ハイボックス品質3D検出(HQ-OV3D)フレームワークを提案する。
HQ-OV3Dは、強力なスタンドアロンのオープンボキャブラリ3D検出器としてだけでなく、既存のオープンボキャブラリ検出やアノテーションパイプラインのためのプラグインの質の高い擬似ラベルジェネレータとしても機能する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:57:18 GMT)
Region-Adaptive Video Sharpening via Rate-Perception Optimization [9.9] 本稿では、エンドツーエンドの領域適応型ビデオシャープモデルであるRPO-AdaSharpを提案する。
符号化ツリー単位(CTU)パーティションマスクを事前情報として使用し、増加ビットの割り当てをガイドし、制限する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:51:23 GMT)
Bridging Formal Language with Chain-of-Thought Reasoning to Geometry Problem Solving [9.6] 我々はChain-of-Thought(CoT)とフォーマル言語を統合する新しいアプローチを提案する。
このモデルは、ソルバ実行可能コードの漸進的な排出を伴う自然言語推論をインターリーブする。
Qwen2.5-VL-7Bに基づいて構築された新しいモデルGF-Reasonerは、標準GPSベンチマークで最大15%の精度向上を実現している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:26:23 GMT)
Low-Regret and Low-Complexity Learning for Hierarchical Inference [9.5] HIは、ローカル推論が正しくない場合に限って、Remote-MLへの推論とオフロードにLocal-MLモデルを使用することで、レイテンシの低減、精度の向上、帯域幅使用量の削減を目指している。
本稿では,モデル信頼度尺度の高次関数としてローカルMLによる正しい推論の確率をモデル化し,HILに対する新しいアプローチを提案する。
両ポリシーが$O(log T)$のオーダー最適後悔を達成し,既存のHILポリシーを$O(T2/3)$後悔の保証で大幅に改善したことを実証する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:53:54 GMT)
Adaptive High-Frequency Preprocessing for Video Coding [9.5] ビデオの明瞭さとリアリズムを維持するためには高周波コンポーネントが不可欠だが、符号化にも大きく影響し、帯域幅とストレージコストが増大する。
本稿では,ビデオ符号化における主観的品質と保存性を高めるために,適応型高周波前処理のためのエンドツーエンド学習ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:16:02 GMT)
FairPOT: Balancing AUC Performance and Fairness with Proportional Optimal Transport [9.5] 医療などのハイテイクな領域では、公正さは二進的な結果よりもリスクスコアよりも評価されることが多い。
本稿では,Fair Proportional Optimal Transport (FairPOT)を提案する。
また,FairPOTは,グローバルおよび部分的なAUCシナリオにおいて,既存の後処理技術より一貫して優れていることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:34:01 GMT)
SHREC 2025: Retrieval of Optimal Objects for Multi-modal Enhanced Language and Spatial Assistance (ROOMELSA) [9.4] 本稿では,自然言語を解釈するシステムの能力を評価するための新しいベンチマークであるROOMELSAを提案する。
ROOMELSAには1,600以上のアパートのシーン、5,200の部屋、44,000以上のターゲットクエリが含まれている。
粗いオブジェクトの検索は大部分が解決されているが、ほぼ全てのテストケースで、常に正しいマッチングをランク付けしているのは1つのトップパフォーマンスモデルのみである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:36:05 GMT)
Zero-shot Emotion Annotation in Facial Images Using Large Multimodal Models: Benchmarking and Prospects for Multi-Class, Multi-Frame Approaches [9.4] 本研究では,大規模なマルチモーダルモデル(LMM)を用いて,日常シナリオにおける人間の感情を自動的にアノテートすることの実現可能性と性能について検討した。
7階級の感情分類の下で、LMMは平均50%の精度を達成した。
3次感情分類(陰性/中性/陽性)に限定した場合,平均精度は約64%に向上した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:06:21 GMT)
Preview WB-DH: Towards Whole Body Digital Human Bench for the Generation of Whole-body Talking Avatar Videos [9.3] Whole-Body Benchmark dataset (WB-DH)は、全体アニマタブルアバター生成を評価するためのオープンソースのマルチモーダルベンチマークである。
WB-DHには詳細なマルチモーダルアノテーション、詳細なガイダンス、多目的評価フレームワーク、データセットとツールへのパブリックアクセスが含まれている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:25:56 GMT)
Vision Language Models See What You Want but not What You See [9.3] 他人の意図を知り、他人の視点をとることは、人間の知性の2つの中核的な構成要素である。
視覚言語モデル(VLM)における意図理解とレベル2視点取得について検討した。
VLMは意図的理解では高い性能を示したが,レベル2の視点では低い性能を示した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:36:03 GMT)
Fitting Description Logic Ontologies to ABox and Query Examples [9.3] 記述ロジックは$mathcalALC$と$mathcalALCI$をオントロジー言語と様々なクエリ言語とみなす。
得られた全ての適合問題に対して、有効な特徴付けを提供し、適合オントロジーが存在するかどうかを決定するための計算複雑性を決定する。
この問題は、AQとフルCQで$scriptsize CONP$、CQとUCQで$2Escriptsize XPTscriptsize IME$-completeであることが判明した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:20:41 GMT)
Where are GIScience Faculty Hired from? Analyzing Faculty Mobility and Research Themes Through Hiring Networks [9.2] 本研究は、PhD-granting institutionsと現在の学部連携の関連をマッピングし、946のGIScience Instituteの配置パターンを全世界で分析した。
本分析では、西欧諸国に雇用を集中させ、GIScience 学部を設置する上で、いくつかの影響力のあるプログラムを明らかにした。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:03:44 GMT)
Magical: Medical Lay Language Generation via Semantic Invariance and Layperson-tailored Adaptation [9.2] MLLG(Messical Lay Language Generation)は、科学コンテンツへのアクセス性向上に重要な役割を担っている。
近年のMLLGの文献では、Low-Rank Adaptation (LoRA) のようなパラメータ効率のよい微調整法が一般的である。
LoRAは、マルチソースの異種MLLGデータセットによって引き起こされる課題に対処する。
異種データシナリオ下でMLLGに適した非対称LoRAアーキテクチャであるMagicalを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:21:58 GMT)
Dynamic Rank Adjustment for Accurate and Efficient Neural Network Training [9.1] 我々は,低ランクトレーニングエポック内のフルランクトレーニングエポックを戦略的にインターリーブすることで,モデルの重みのランクを効果的に回復できると主張している。
実験により,提案手法はSVDベースの低ランクトレーニングとほぼ同等の計算コストを実現することが示された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:30:52 GMT)
In-Context Learning as Nonparametric Conditional Probability Estimation: Risk Bounds and Optimality [9.1] In-Context Learning (ICL) の多クラス分類における過剰なリスクについて検討する。
ICLは条件付き確率推定のための最小最大値(対数係数まで)を達成する。
ログ型関数クラスの一様被覆エントロピーを用いた一般化誤差の制御法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:42:10 GMT)
Continuous-variable quantum key distribution over 50.4 km fiber using integrated silicon photonic transmitter and receiver [9.0] 量子鍵分布(QKD)は、量子情報分野において急速に成長し、比較的成熟した技術である。
我々のCV-QKDシステムでは,高信号レートと長距離伝送距離で,大都市圏における量子セキュア通信ネットワークの実現が期待できる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:06:29 GMT)
Music and Artificial Intelligence: Artistic Trends [8.8] ミュージシャンは、シングル、アルバム、パフォーマンス、声、バレエ、オペラ、サウンドトラックなど、さまざまなフォーマットで人工知能(AI)をどのように利用するかを研究する。
AI合成,共構成,音響設計,歌詞生成,翻訳の337の楽曲を収集し,AI使用率に基づいて分類する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:12:02 GMT)
Extended Parameter Shift Rules with Minimal Derivative Variance for Parameterized Quantum Circuits [8.7] 既存のPSRの幅広い範囲を一般化する拡張パラメータシフトルール(EPSR)を提案する。
EPSRは無限個の可能なパラメータシフトを提供し、最適パラメータシフトの選択は最終的な微分分散を最小化する。
We show that the wide use general PSR', introduced by Wierichs et al. (2022) is a special case of our EPSR。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:57:38 GMT)
Toward Generalist Semi-supervised Regression via Decoupled Representation Distillation [8.6] 半教師付き回帰作業のためのエンドツーエンドデカップリング型表現蒸留フレームワーク(DRILL)について紹介する。
提案したDRILLは強力な一般化を持ち、競合する手法よりも優れている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 22:11:01 GMT)
FormalGrad: Integrating Formal Methods with Gradient-Based LLM Refinement [8.6] FormalGradは、形式的なメソッドを直接反復生成ループに統合する、原則化されたフレームワークを導入している。
コードを微分可能な変数として扱い、構造化されたフィードバックと形式的な制約をテキストの擬似階調に変換する。
我々は,HumanEval,HumanEval+,LiveCodeBenchベンチマーク上でFormalGradを評価する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 22:03:54 GMT)
Evaluating Podcast Recommendations with Profile-Aware LLM-as-a-Judge [8.6] 本稿では,ポッドキャスト推薦の質を評価するために,Large Language Models (LLMs) をオフライン裁判官として活用する新しいフレームワークを提案する。
まず,90日間の聴取履歴から抽出した自然言語のユーザプロファイルを構築した。
47名の被験者を対象にした対照研究において, プロファイル・アウェア・ジャッジは, 人間の判断に高い忠実度で一致し, 生聴取履歴を用いた変種よりも優れ, あるいは優れていた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:23:35 GMT)
A First Look at Predictability and Explainability of Pre-request Passenger Waiting Time in Ridesharing Systems [8.4] 配車システムにおける乗客待ち時間の予測可能性と説明可能性を理解するための第一歩を踏み出した。
本稿では,FixGBoostを提案する。FixGBoostは,与えられたドライバー情報を知ることなく,待ち時間を予測できる新しい機能インタラクションベースのXGBoostモデルである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:42:14 GMT)
Variance-Reduced Fast Operator Splitting Methods for Generalized Equations [8.0] 一般化方程式のクラスの解を近似する2つの分散還元高速演算子分割法を開発した。
提案手法は, 加速演算子分割法, 固定点法, 共高調波性, 分散低減の最近の進歩を取り入れたものである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:04:57 GMT)
Unsupervised Skill Discovery as Exploration for Learning Agile Locomotion [7.9] SDAX(Skill Discovery as Exploration)は、人間のエンジニアリングの労力を大幅に削減する新しい学習フレームワークである。
SDAXは、クロール、クライミング、跳躍、垂直壁から飛び降りるなどの複雑な操作の実行など、四足歩行ロボットが高度にアジャイルな行動を得ることを可能にすることを実証する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:49:25 GMT)
PersRM-R1: Enhance Personalized Reward Modeling with Reinforcement Learning [7.9] PersRM-R1は、個人的要因を特定・表現するために設計された最初の推論に基づく報酬モデリングフレームワークである。
提案手法は,合成データ生成と教師付き微調整と強化微調整を組み合わせた2段階の訓練パイプラインを組み合わせる。
実験結果から,PersRM-R1は類似のモデルよりも優れており,精度と一般化性の両方において,はるかに大きなモデルの性能に匹敵することがわかった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:25:58 GMT)
Whispers in the Machine: Confidentiality in Agentic Systems [7.9] エージェントシステムは、ほとんどのユーザインタラクションと外部ツールやサービスとの様々な統合のためのインターフェースとして、Large Language Models (LLM) を使用する。
操作された統合は内部のLCMを利用して、他のインターフェースを通してアクセスされた機密データを侵害することができる。
外部ツールの統合によるシステムへのLLMの統合は、確立されたプロンプトベースの攻撃と同じようなリスクをもたらすことを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:08:02 GMT)
GPSMamba: A Global Phase and Spectral Prompt-guided Mamba for Infrared Image Super-Resolution [7.8] Infrared Image Super-Resolution is challenge by the low contrast and sparse textures of infrared data。
GPSMambaは、アーキテクチャガイダンスと非因果的な監視を併用するフレームワークである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:09:41 GMT)
3D Human Mesh Estimation from Single View RGBD [7.8] 単一のRGBDビューから正確な3次元メッシュ推定法を提案する。
既存のMoCap(Motion Capture)データセットを活用して、データの不足を克服しています。
BEHAVEデータセット上では競争力のある70.9 PVEが得られ、18.4mmのRGBベースの手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:25:31 GMT)
Leveraging Large Language Models for Rare Disease Named Entity Recognition [7.8] 稀な疾患領域における名前付きエンティティ認識(NER)は、ラベル付きデータの制限、エンティティタイプ間のセマンティックなあいまいさ、ロングテール分布など、ユニークな課題を生じさせる。
本研究では,低リソース環境下での希少疾患NERに対するGPT-4oの有用性について検討した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:16:31 GMT)
High-dimensional quantum XYZ product codes for biased noise [7.7] 3次元(3D)量子XYZ積は、3つの古典符号を用いて非CSS量子符号のクラスを構築することができる。
3つの繰り返し符号の3次元XYZ積の例である3次元チャモン符号の誤り訂正性能について検討する。
本研究では, 4次元立方体格子内の4次元チャモン符号の幾何学的配置について述べる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:46:08 GMT)
Explaining Time Series Classifiers with PHAR: Rule Extraction and Fusion from Post-hoc Attributions [7.7] PHARは、数値的特徴属性を構造化された可読性ルールに変換するフレームワークである。
専用ルール融合ステップは、重み付け選択やラッソベースの精錬のような戦略を用いてルールセットを統合する。
UCR/UEA時系列分類アーカイブの実験は、PHARがTS分類タスクの解釈可能性、決定透明性、実践的適用性を改善することを示した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:03:17 GMT)
Multimodal Appearance based Gaze-Controlled Virtual Keyboard with Synchronous Asynchronous Interaction for Low-Resource Settings [7.7] 本研究は、標準的なカメラハードウェアと併用してディープラーニングを利用するマルチモーダルな外観に基づく視線制御仮想キーボードを提案する。
仮想キーボードアプリケーションは、9つのコマンドでメニューベースの選択をサポートし、ユーザーは最大56の英語の文字をスペルしてタイプできる。
平均タイピング速度は18.3+-5.31文字/分(マウス)、12.60+-2.99レター/分(アイトラッカー、同期)、10.94+- 1.89文字/分(ウェブカム、同期)、7.86+- 1.69文字/分(ウェブカム、非同期)であった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:08:54 GMT)
Bio-Inspired Artificial Neural Networks based on Predictive Coding [7.5] エラーのバックプロパゲーション(BP)は、人工ニューラルネットワーク(ANN)のバックボーントレーニングアルゴリズムである
BPはチェーンルールを使用してネットワーク階層を通して損失勾配を後方に伝播し、効率的な重み更新を可能にする。
予測符号化(PC)は、局所情報のみを使用して重みを更新する生物学的に妥当な代替手段として関心を集めている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:09:16 GMT)
Wavelet Mixture of Experts for Time Series Forecasting [7.5] 本稿では,新しい時系列予測モデルWaveTS-Bを提案する。
このモデルはウェーブレット変換と、ウェーブレット領域におけるデータの周期的特性と非定常的特性の両方をキャプチャする機構を組み合わせる。
本モデルでは,パラメータが大幅に少ないSOTA(State-of-the-art)の性能を実現する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:32:51 GMT)
Chartwin: a Case Study on Channel Charting-aided Localization in Dynamic Digital Network Twins [7.3] 動的ディジタルネットワーク双対(DNT)によるローカライズ指向チャネルチャートの統合に関するケーススタディを提案する。
都市環境の空間的に一貫したチャート構築において,半教師付きチャネルチャートの有意な性能を示す数値的な結果を得た。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:15:53 GMT)
Lay2Story: Extending Diffusion Transformers for Layout-Togglable Story Generation [7.3] 被験者の位置や詳細な属性などのレイアウト条件は,フレーム間のきめ細かい相互作用を効果的に促進することを示す。
レイアウト条件を組み込むことで、正確な主観的制御を可能にする。
本手法は従来のSOTA(State-of-the-art)技術よりも優れており,一貫性,意味的相関,美的品質の面で最高の結果が得られる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:04:56 GMT)
Gradient-Direction-Aware Density Control for 3D Gaussian Splatting [7.2] 3D Gaussian Splatting (3DGS) は、明示的なシーン表現による新規なビュー合成が著しく進歩している。
既存のアプローチは、複雑なシナリオで2つの重要な制限を示す。
本稿では勾配方向対応型適応密度制御フレームワークGDAGSを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:12:54 GMT)
Instrument-based quantum resources: quantification, hierarchies and towards constructing resource theories [7.2] 量子資源理論は、これらの資源を定量的かつ厳密に研究するためのエレガントな枠組みを提供する。
多くの状態ベース量子資源理論が既に研究されているが、器質ベースの資源理論はほとんど解明されていない。
本稿では,(1)情報保存性の資源理論,(2)(強)絡み合いの資源理論,(3)(強)非互換性の資源理論,(4)従来の非互換性の資源理論,(5)並列不互換性の資源理論について考察する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:58:30 GMT)
Adaptive Confidence-Wise Loss for Improved Lens Structure Segmentation in AS-OCT [7.1] 既存のディープセグメンテーションネットワークは通常、すべてのピクセルをクロスエントロピー(CE)損失の下で均等に重み付けする。
本稿では、各レンズ構造サブリージョンを異なる信頼サブリージョンにグループ化するために、適応信頼度(ACW)損失を提案する。
提案法はCEを6.13%のIoUゲイン,4.33%の増加,および4.79%のBECEをU-Net下でのレンズ構造セグメンテーションで上回っている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:53:06 GMT)
QueryCraft: Transformer-Guided Query Initialization for Enhanced Human-Object Interaction Detection [7.0] 本稿では,セマンティックな事前情報と特徴学習を組み込んだ新しいプラグアンドプレイHOI検出フレームワークを提案する。
本手法はHICO-DetおよびV-COCOベンチマーク上での最先端性能と強力な一般化を実現する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:11:16 GMT)
Understanding Dynamic Scenes in Ego Centric 4D Point Clouds [7.0] EgoDynamic4Dは、非常にダイナミックなシーンに関する新しいQAベンチマークである。
エージェントの動作,人間と物体の相互作用予測,関係,軌道の理解,時間・因果推論,詳細な指標を含む12の動的QAタスクを設計する。
提案手法は,エゴ中心の動的シーン理解のためのマルチモーダル時間モデルの有効性を検証し,ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:01:27 GMT)
The Othello AI Arena: Evaluating Intelligent Systems Through Limited-Time Adaptation to Unseen Boards [6.9] Othello AI Arenaはインテリジェントシステムを評価するために設計された新しいベンチマークフレームワークである。
システムは、厳密な時間制限の中で、新しいOthelloボードの設定とルールを分析する必要がある。
Arenaは、リアルタイム可視化、多次元メトリクスを使用した自動評価、およびポストホック分析のための包括的なロギングを提供する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:10:58 GMT)
fastkqr: A Fast Algorithm for Kernel Quantile Regression [6.9] 我々は、再生されたカーネルヒルベルト空間における量子レグレッションの計算を大幅に改善するfastkqrを導入する。
fastkqrのコアは、近似よりも正確に回帰量子を魔法のように生成する有限な平滑化アルゴリズムである。
さらに、Fastkqrを拡張して、データ駆動の交差ペナルティで柔軟なカーネル量子化レグレッションを実現する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:36:22 GMT)
Quantum entanglement and extractable work for Gaussian states [6.5] 2モードガウス状態における抽出可能作業と量子相関の関係について検討する。
分析の結果,2モード状態が属する状態のクラスによって,抽出可能な作業の量的差異が明らかとなった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:45:16 GMT)
AI-induced sexual harassment: Investigating Contextual Characteristics and User Reactions of Sexual Harassment by a Companion Chatbot [6.5] セクシャルハラスメントの事例を調査するため,Google Play Storeのユーザレビューのテーマ分析を行った。
ユーザーはしばしば、誘惑的でない性的進歩、永続的な不適切な振る舞い、ユーザーの境界を尊重する失敗を経験する。
この研究は、AIコンパニオンに関連する潜在的な害を強調し、開発者が効果的なセーフガードを実装する必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:27:19 GMT)
Steering Towards Fairness: Mitigating Political Bias in LLMs [6.5] 大規模言語モデルにおいて,そのようなバイアスを探索し緩和する枠組みを提案する。
提案手法では,Mistral や DeepSeek などのモデルから隠れた層活性化を抽出し,比較する。
以上の結果から,デコーダLLMは階層間の表現バイアスを体系的に符号化することがわかった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:09:03 GMT)
Addressing Bias in VLMs for Glaucoma Detection Without Protected Attribute Supervision [6.4] 本研究は網膜基底画像からの緑内障の自動スクリーニングに焦点を当てた。
画像-画像埋め込みの教師なしクラスタリングを通じてプロキシサブグループを推論する属性非依存型デバイアス手法を提案する。
EOD (Equalized Odds Distance)、ES AUC (Equalized Subgroup AUC)、グループワイズAUC (Groupwise AUC) を報告し, 以下の結果を得た。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:07:58 GMT)
OE3DIS: Open-Ended 3D Point Cloud Instance Segmentation [6.3] Open-Ended 3D Instanceメソッドは、テスト中に事前に定義されたクラス名を必要としない。
OV-3DISの最先端技術であるOpen3DISの性能を超越した手法を提案する。
このアプローチでは、ScanNet200とScanNet++データセットのベースラインよりも大幅にパフォーマンスが改善されている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:44:48 GMT)
Fake-Mamba: Real-Time Speech Deepfake Detection Using Bidirectional Mamba as Self-Attention's Alternative [6.2] 合成音声の検出において,双方向マンバが自己注意の代替となるかどうかを検討する。
私たちのソリューションであるFake-Mambaは、XLSRフロントエンドと双方向のMambaを統合して、ローカルとグローバルの両方のアーティファクトをキャプチャします。
Fake-Mambaは、それぞれ0.97%、1.74%、および5.85%のEERを達成した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:15:13 GMT)
How Does Bilateral Ear Symmetry Affect Deep Ear Features? [6.1] 両耳対称性がCNNに基づく耳の認識の有効性に与える影響について検討した。
トレーニングとテストの間、左右の耳を別々に扱うと、顕著なパフォーマンス改善につながる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:06:42 GMT)
DepressLLM: Interpretable domain-adapted language model for depression detection from real-world narratives [6.1] 本研究では,幸福と苦悩の両方を反映した3,699個の自伝的物語のコーパスをトレーニングし,評価したDepressLLMを紹介する。
DepressLLMは解釈可能な抑うつ予測を提供し、Score-guided Token Probability Summation (SToPS)モジュールを通じて、改善された分類性能と信頼性の高い信頼推定を提供する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:12:55 GMT)
UniConvNet: Expanding Effective Receptive Field while Maintaining Asymptotically Gaussian Distribution for ConvNets of Any Scale [6.1] 我々はUniConvNetと呼ばれる任意のスケールのConvNetの普遍モデルを提案する。
ImageNet-1K、COCO 2017、ADE20Kの実験では、UniConvNetは最先端のCNNやViTよりも優れています。
UniConvNet-Tは、$74.2%のImageNet top-1精度で、パラメータは$30M、FLOPは$5.1Gである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:11:18 GMT)
A Dual-Axis Taxonomy of Knowledge Editing for LLMs: From Mechanisms to Functions [6.1] 大規模言語モデル(LLM)は、巨大なテキストコーパスから膨大な知識を取得するが、この情報は時代遅れになるか、不正確になる可能性がある。
リトレーニングは計算コストがかかるため、知識編集は効率的な代替手段を提供する。
この調査は、より包括的視点を提供するために、新しい補完機能に基づく分類を導入した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:51:39 GMT)
Riemannian quantum circuit optimization based on matrix product operators [6.0] 量子系のハミルトニアンシミュレーションのための初期トロッター回路のシミュレーション精度を著しく向上する。
本手法は, 量子系に対して, 翻訳不変性などの対称性の仮定を課さない。
分子系,特に水素化リチウムに応用し,最大8桁の誤差改善を実現することで,本手法の汎用性を実証した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:49:27 GMT)
Expert-Guided Diffusion Planner for Auto-bidding [6.0] ジェネレーティブ入札は、ロバストな計画能力と一般化可能性のために、徐々に勢いを増している。
条件拡散モデリングアプローチは、オートバイディングの領域において有意義な可能性を証明している。
本稿では,専門家の軌道誘導に基づく新しい条件拡散モデリング手法とスキップステップサンプリング戦略を組み合わせることにより,生成効率を向上させることを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:23:51 GMT)
Decoupled Functional Evaluation of Autonomous Driving Models via Feature Map Quality Scoring [6.0] 本研究は,特徴マップ-構造表現類似性に基づく評価フレームワークを構築し,特徴マップ収束スコア(FMCS)に基づく独立評価手法を提案する。
CLIPベースの特徴マップ品質評価ネットワーク(CLIP-FMQE-Net)がさらに開発され、機能モジュールが生成する特徴マップのリアルタイム品質解析を可能にする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:16:16 GMT)
On the Robustness of Kernel Goodness-of-Fit Tests [6.0] 既存のカーネル良性テストは、ロバスト性という一般的な概念の下では堅牢ではないことを示す。
そこで本研究では,カーネルStein異性度ボールを用いて,この問題を解決した最初の堅牢なカーネル善良性テストを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:47:43 GMT)
Designing Memory-Augmented AR Agents for Spatiotemporal Reasoning in Personalized Task Assistance [5.9] Augmented Reality (AR) システムは、よりコンテキスト対応で適応的なユーザエクスペリエンスを提供するために、Multimodal Large Language Models (LMML) のような基礎モデルの統合がますます進んでいる。
現在のARエージェントは、ユーザの長期的な経験や好みを理解し、活用する必要がある複雑なマルチステップシナリオに苦労している。
本稿では、ユーザ固有の体験から学習し、時間とともに適応することによって、パーソナライズされたタスク支援を提供する、メモリ拡張ARエージェントの概念的フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:20:20 GMT)
Classifier Language Models: Unifying Sparse Finetuning and Adaptive Tokenization for Specialized Classification Tasks [5.9] トークン駆動のスパースファインタニング戦略を開発し,小言語モデルを特殊分類タスクに適応させる。
微調整データセットのタスク固有のトークン構造を利用して、モデルパラメータの小さなセンシティブなサブセットを特定し、微調整する。
トレーニングコストとエンドツーエンドのファインタニングよりも高い安定性を実現しています。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:59:01 GMT)
Boosting Generic Semi-Supervised Medical Image Segmentation via Diverse Teaching and Label Propagation [5.8] 3つのタスク全てをマスターする汎用フレームワークを開発する。
この問題を解決する鍵は、ラベルのないデータに対して信頼できる擬似ラベルを生成する方法にある。
提案するフレームワークを5つのベンチマークデータセットで評価する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:33:30 GMT)
System~2 Reasoning for Human--AI Alignment: Generality and Adaptivity via ARC-AGI [5.8] ARC-AGIタスクのクローズギャップには、推論パイプラインとその評価の見直しが必要であると論じる。
ARC-AGIの評価スイートは, 記号的一般性, フィードバック駆動適応性, タスクレベルのロバスト性などの進捗を追跡できることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:32:16 GMT)
Exploring Palette based Color Guidance in Diffusion Models [5.8] そこで本研究では、カラーパレットをインシデント命令と並行して個別の誘導機構として統合することで、カラースキーム制御を強化する新しい手法を提案する。
この結果から,パレットガイダンスを取り入れることで,所望のカラースキームで画像を生成する能力が大幅に向上することが示唆された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:02:10 GMT)
Text-conditioned State Space Model For Domain-generalized Change Detection Visual Question Answering [5.8] 変化検出法は通常、正確な解釈のために専門家の知識を必要とする。
新しいマルチモーダルおよびマルチドメインデータセットであるBrightVQAを導入し、ドメインの一般化研究を容易にする。
TCSSM(Text-Conditioned State Space Model)フレームワークは,両時間画像とジオディザスター関連テキスト情報の両方を活用するために提案されている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:37:53 GMT)
APIO: Automatic Prompt Induction and Optimization for Grammatical Error Correction and Text Simplification [5.8] APIOは、文法的誤り訂正(GEC)とテキスト単純化(Text Simplification)のタスクに対して、シンプルだが効果的な誘導と最適化のアプローチである。
データ、コード、プロンプト、アウトプットを公開しています。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 22:26:32 GMT)
AMFT: Aligning LLM Reasoners by Meta-Learning the Optimal Imitation-Exploration Balance [5.7] 大規模言語モデル(LLM)は通常、2段階のパイプライン(SFT)と強化学習(RL)による推論タスクのために微調整される。
最近の単段法では、SFTとRLを原理的に統一しようとするが、2つのパラダイムを動的にバランスさせるメカニズムが欠如している。
我々は,SFTの暗黙的,パスレベルの報酬とRLの明示的,結果に基づく報酬との最適バランスを学習する,新しいシングルステージアルゴリズムである textbf Meta Fine-Tuning (AMFT) を紹介する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:23:43 GMT)
Assessing the potential of deep learning for protein-ligand docking [5.7] 広範に適用可能なタンパク質リガンドドッキングのための、最初の包括的なベンチマークであるPoseBenchを紹介する。
PoseBenchは、Apo-to-holoタンパク質-リガンドドッキングとタンパク質-リガンド構造予測のためのDLメソッドを厳格かつ体系的に評価することを可能にする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 00:50:22 GMT)
Generative Modeling for Robust Deep Reinforcement Learning on the Traveling Salesman Problem [5.6] ラストマイル配送を動的にリルートするといった現実世界のロジスティクス問題では、高速な推論時間で解決を要求される。
ニューラルネットワークは、訓練された合成データを超えた一般化に苦慮していることを示す。
我々は,ジェネレーティブ・サンプリング(COGS)を用いたコンビニショナル・オプティマイゼーションを行い,生成型トラベリングセールスマン問題モデルからトレーニングデータをサンプリングした。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:04:16 GMT)
Chemist-aligned retrosynthesis by ensembling diverse inductive bias models [5.5] RetroChimeraは、相補的誘導バイアスを持つ2つの新たに開発されたコンポーネント上に構築されたフロンティア再合成モデルである。
トレーニングデータの外部で堅牢性を実証し、主要なモデルを大きなマージンで上回ります。
また、大手製薬会社から内部データセットへのゼロショット転送を実証する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:20:13 GMT)
WHAR Datasets: An Open Source Library for Wearable Human Activity Recognition [5.5] 我々はWHARデータ処理を簡単にするためのオープンソースライブラリであるWHARデータセットを紹介する。
現在、ライブラリは9つの広く使用されているデータセットをサポートし、PyTorchと統合され、新しいデータセットに簡単にアクセスできる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:43:30 GMT)
GMF-Drive: Gated Mamba Fusion with Spatial-Aware BEV Representation for End-to-End Autonomous Driving [5.5] 本稿では, GMF-Driveを紹介した。これは2つの原則的イノベーションを通じて, 課題を克服するエンドツーエンドフレームワークである。
まず、情報制限ヒストグラムに基づくLiDAR表現を、幾何学的に拡張された柱形式で置き換える。
第二に,高効率空間認識状態空間モデルを用いた高価な変圧器を代替する新しい階層型マンバ融合アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:02:23 GMT)
SafeFix: Targeted Model Repair via Controlled Image Generation [5.4] 我々は、解釈可能な障害帰属パイプラインの上に構築されたモデル修復モジュールを導入する。
提案手法では, 条件付きテキスト・ツー・イメージモデルを用いて, セマンティックに忠実で, ターゲットとした画像を生成する。
この稀なケース拡張合成データセットを用いて視覚モデルを再訓練することにより、稀なケースに関連するエラーを著しく低減する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:45:25 GMT)
LM-MCVT: A Lightweight Multi-modal Multi-view Convolutional-Vision Transformer Approach for 3D Object Recognition [5.3] ロボットアプリケーションにおける3次元物体認識を強化するために,軽量マルチモーダル・マルチビュー・コンボリューショナル・ビジョン・トランスフォーマネットワーク(LM-MCVT)を提案する。
提案手法を合成モデルNet40データセット上で評価し,95.6%の認識精度を実現する。
その結果,合成および実世界の3Dデータ間での3Dオブジェクト認識における手法の堅牢性を示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:51:44 GMT)
VLM-3D:End-to-End Vision-Language Models for Open-World 3D Perception [5.2] 本稿では,自律走行シナリオにおける3次元幾何学的認識を可能にする最初のエンドツーエンドフレームワークであるVLM-3Dを提案する。
VLM-3Dはローランド適応(LoRA)を導入し、最小計算オーバーヘッドのタスクにVLMを効率よく適応させる。
VLM-3Dにおける関節意味・幾何学的損失が12.8%の知覚精度向上につながることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:25:27 GMT)
Urban-STA4CLC: Urban Theory-Informed Spatio-Temporal Attention Model for Predicting Post-Disaster Commercial Land Use Change [5.2] 本研究では,戦後の土地利用変化予測のための都市理論インフォームド時空間意識モデルの設計と校正を行う。
都市理論によって導かれ、Urban-STA4CLCは空間的および時間的注意機構と3つの理論インフォームドモジュールを統合する。
このモデルは、繰り返し発生するハリケーンのシナリオ下での商業的土地利用の変化を予測する際に、非理論的ベースラインよりもはるかに優れた性能を発揮する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:39:42 GMT)
"There Has To Be a Lot That We're Missing": Moderating AI-Generated Content on Reddit [5.2] 我々は、AIGCによるオンラインコミュニティモデレーターの経験に焦点を当てる。
我々の研究によると、AIGCに関するルールは、コンテンツ品質、社会的ダイナミクス、ガバナンスの課題に対する懸念によって動機づけられている。
AIGCを検出するための堅牢なツールがないにも関わらず、モデレーターは何らかの障害を抑えることができた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:05:24 GMT)
Sensitivity Analysis to Unobserved Confounding with Copula-based Normalizing Flows [5.2] 本稿では, 因果推論における未観測コンバウンディングに対する感度解析法を提案する。
この手法は、$rho$-GNF というコーパスに基づく因果正規化フローに基づいて構築される。
また,感度解析手法のベイズ版を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:57:30 GMT)
SABIA: An AI-Powered Tool for Detecting Opioid-Related Behaviors on Social Media [5.2] ソーシャルメディアプラットフォームは、患者の行動、薬物使用、メンタルヘルス問題に関する洞察を提供することによって、公衆衛生上の課題を理解するための貴重なツールとなっている。
本研究では,ソーシャルメディアにおけるオピオイド関連ユーザ行動の問題に対処する。
Redditの投稿から新しいデータセットが構築され、Dealers、Active Opioid Users、Recovered Users、Prescription Users、Non-Usersという5つのクラスでオピオイドユーザーの振る舞いを識別した。
その結果、SABIAはベンチマーク性能を達成し、ベースライン(ロジスティック回帰、LR = 0.86)を上回り、精度を向上した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:52:41 GMT)
Utilizing Large Language Models for Information Extraction from Real Estate Transactions [5.1] 本稿では,大規模言語モデルの不動産契約からの自動情報抽出への応用について検討する。
実世界のトランザクションデータセットを用いて合成コントラクトを生成した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:33:15 GMT)
Geometry of the symplectic group and optimal EAQECC codes [5.0] シンプレクティック群の幾何学と絡み合い支援(EA)量子誤り訂正符号(EAQECCs)の新たなタイプのリンクについて述べる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:17:55 GMT)
Mjölnir: A Deep Learning Parametrization Framework for Global Lightning Flash Density [4.9] 我々は,グローバルなフラッシュ密度パラメータ化のための新しいディープラーニングベースのフレームワークであるMj"olnirを提案する。
Mj"olnirは、大規模環境条件と雷活動の間の非線形マッピングをキャプチャする。
雷活動のグローバル分布,季節変動,地域特性を正確に再現し,年間平均場のピアソン相関係数0.96を達成している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:12:54 GMT)
Identity-Preserving Aging and De-Aging of Faces in the StyleGAN Latent Space [4.9] 本稿では,StyleGAN2の潜伏空間を編集することで,老朽化した顔と老朽化した顔の合成を提案する。
次に、入力面のID保存を保証するため、年齢/年齢パラメータの制限を推定する式を提案する。
提案手法と推定パラメータは, 年齢差認識, 年齢保証システム, 合成画像検出システムなどのベンチマークに利用することができる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:02:42 GMT)
ColorGPT: Leveraging Large Language Models for Multimodal Color Recommendation [4.7] 我々は,事前学習されたLarge Language Models (LLMs) の利用と,カラーレコメンデーションのためのコモンセンス推論機能について検討する。
提案手法は,与えられた色と付随するコンテキストのセットに基づいて色を推奨することで,色パレットの補完を主目的とした。
提案手法は全パレット生成に拡張可能であり, 提供されるテキスト記述に対応する全カラーパレットを生成する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:56:11 GMT)
Fine-grained Video Dubbing Duration Alignment with Segment Supervised Preference Optimization [4.7] ビデオダビングは、ソース言語からターゲット言語への視覚メディアプログラムにおけるオリジナル音声の変換を目的としている。
言語によって異なる情報密度のため、ターゲット音声は元の音声の持続時間と一致しないことが多い。
そこで本研究では,セグメントワイドサンプリング戦略を用いたSegment Supervised Preference Optimization (SSPO)法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:38:31 GMT)
Sarc7: Evaluating Sarcasm Detection and Generation with Seven Types and Emotion-Informed Techniques [4.7] サルカズム (Sarcasm) はユーモアの一種で、表現は文字通りの解釈とは反対の意味を伝達する。
Sarc7は、7種類のサルカズムを分類するベンチマークである。
本研究では,サルカズム不整合,ショック値,コンテキスト依存性の重要成分を同定し,感情に基づく生成手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:44:01 GMT)
Biased Local SGD for Efficient Deep Learning on Heterogeneous Systems [4.7] ほとんどの大規模ニューラルネットワークトレーニング手法は、均質な並列計算資源を前提としている。
計算能力に比例して各計算資源に負荷を割り当てるシステム対応局所勾配降下法(ローカルSGD)を提案する。
本研究では,不均一環境下での局所的なSGDの促進効果について検討した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:03:09 GMT)
Fast, Accurate Manifold Denoising by Tunneling Riemannian Optimization [4.6] 未知の$d$-dimensional manifold $M からサンプリングされたノイズの多い新しいデータポイントを mathbbRD$ において、ノイズの多いサンプルのみを用いて効率よく分解する問題を考える。
本研究は「学習から学習へ」という概念を「学習から最適化へ」とフレーミングすることで、テスト時効率のよい多様体復調のための枠組みを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:31:46 GMT)
TaoCache: Structure-Maintained Video Generation Acceleration [4.6] ビデオ拡散モデルのためのトレーニング不要のプラグイン・アンド・プレイキャッシュ戦略であるTaoCacheを提案する。
モデルのノイズ出力を予測するために固定点視点を採用しており、特に遅延雑音発生の段階で有効である。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:40:36 GMT)
Mind the Gap: Benchmarking LLM Uncertainty, Discrimination, and Calibration in Specialty-Aware Clinical QA [4.5] 臨床質問応答(QA)に焦点を当てた不確実性評価手法の評価を行った。
本稿では,推論指向モデルに基づく行動特徴に基づく,新しい軽量な手法を提案する。
以上の結果から,不確実性はモノリシックな性質ではなく,臨床専門性や質問タイプに依存していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:15:15 GMT)
Lung-DDPM+: Efficient Thoracic CT Image Synthesis using Diffusion Probabilistic Model [4.5] 既存の肺がん診断のための生成モデルでは、低効率で解剖学的に不正確である。
従来のモデルであるLung-DDPMを改良したLung-DDPM+を提案する。
Lung-DDPM+は肺結節を伴う高画質CT像を効果的に生成できることを示す実験結果が得られた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:30:50 GMT)
A Hierarchical Signal Coordination and Control System Using a Hybrid Model-based and Reinforcement Learning Approach [4.5] モデルに基づく最適化と強化学習を統合した階層的な信号協調制御方式を提案する。
提案手法をSUMO-RLlibプラットフォーム上で開発・評価した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:10:06 GMT)
Understanding Aggregations of Proper Learners in Multiclass Classification [4.4] マルチクラスの学習性は、適切な障壁を示すことが知られている。
二項分類の最近の進歩は、適切な学習者の集合を用いて、この要件を満たすことを実証している。
1つのERMが$Omega left(fracd_G ln (1 / delta)epsilonright)$サンプルを必要とすることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:09:28 GMT)
AMRG: Extend Vision Language Models for Automatic Mammography Report Generation [4.4] マンモグラフィーレポート生成は、医療AIにおいて重要で未発見の課題である。
マンモグラフィーレポートを生成するための最初のエンドツーエンドフレームワークであるAMRGを紹介する。
DMIDを用いた高分解能マンモグラフィーと診断レポートの公開データセットであるAMRGのトレーニングと評価を行った。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:37:41 GMT)
AI Security Map: Holistic Organization of AI Security Technologies and Impacts on Stakeholders [4.3] 私たちは、AIセキュリティに関連する知識、技術、社会的影響は、階層的に組織化されるべきである、と論じています。
私たちはまず、AIセキュリティに関連する要素と、情報システムや利害関係者に対するネガティブな影響を総合的に整理する、AIセキュリティマップを開発します。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:41:20 GMT)
Learning to Defer in Congested Systems: The AI-Human Interplay [4.3] 高評価のアプリケーションは、応答性と信頼性の高い意思決定のために、AI(Artificial Intelligence)と人間の組み合わせに依存している。
本稿では,このようなAIと人間の相互作用を捉えるモデルを提案する。
本稿では,選択されたサンプルデータからの分類損失を注意深くバランスする,準最適学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:03:31 GMT)
PETLP: A Privacy-by-Design Pipeline for Social Media Data in AI Research [4.2] PETLP(Privacy-by-Design Extract, Transform, Load, Present)は、法的保護を拡張パイプラインに直接組み込むコンプライアンスフレームワークである。
我々は、資格研究機関と商業団体の間で、抽出権がどう異なるかを示す。
ソーシャルメディアデータに対して、真の匿名化が実現不可能な理由を明らかにします。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:33:40 GMT)
Utilizing Multilingual Encoders to Improve Large Language Models for Low-Resource Languages [4.2] LLM(Large Language Models)は英語では優れているが、その性能は低リソース言語(LRL)では英語中心の訓練によって著しく低下する。
本稿では,全ての中間層を融合させ,LLMに渡される言語情報を豊かにする新しいアーキテクチャを提案する。
我々はLRLの性能向上を強く観察し、シンハラ分類の精度を71.66%から75.86%に改善し、タミル語、ベンガル語、マラヤラム語などのインド語言語で明らかに改善した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:17:13 GMT)
TechOps: Technical Documentation Templates for the AI Act [4.2] 本稿では、データ、モデル、アプリケーションの文書化のためのオープンソースのテンプレートと例を紹介する。
これらのテンプレートは、AIライフサイクル全体のシステムステータスを追跡する。
また、発見可能性とコラボレーションを促進し、リスクを低減し、AIドキュメントとガバナンスのベストプラクティスと整合させる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:58:33 GMT)
Link Prediction for Event Logs in the Process Industry [4.1] Record Linking (RL) は、自然言語推論(NLI)と意味テキスト類似性(STS)によって強化されたクロスドキュメント・コア参照解決(CDCR)タスクである。
我々は、伝統的にニュースドメインに適用されるCDCRを、プロセス産業の特定のテキストフォーマットを調整しながら、NLIやSTSのような通過レベルで運用するために、RLモデルに適応する。
我々の研究は、推論能力によって強化された最先端CDCRモデルのドメイン適応が、プロセス産業に効果的に適合できることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:22:29 GMT)
Echo: Decoupling Inference and Training for Large-Scale RL Alignment on Heterogeneous Swarms [4.1] 大規模言語モデルのポストトレーニングは、同じGPUクラスタ上でトラジェクトリサンプリングとポリシ最適化を併用する。
ヘテロジニアスな"推論"と"トレーニング"スワムにまたがって、これらの2つのフェーズをきれいに分離するRLシステムであるEchoを紹介します。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:23:04 GMT)
Role-Aware Language Models for Secure and Contextualized Access Control in Organizations [4.1] 大規模言語モデル(LLM)は、ますますエンタープライズ環境にデプロイされている。
組織の役割の異なるアクセス権限を反映した応答を生成するために,LSMを微調整できるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:49:42 GMT)
Can randomly structured metasurfaces be used for quantum tomography of high-dimensional spatial qudits? [4.1] 光子の量子状態の密度行列を再構成することは、ほとんど全ての量子科学と技術の応用において重要な課題である。
近年の光学メタ曲面の進歩により、このような状態トモグラフィータスクを行う超薄膜ナノ光学素子の設計が可能となった。
我々は,検出器数に十分な冗長性を持つことで,Hermite-Gaussian状態に符号化された量子フォトニック空間カウディトトモグラフィーにおいて,ランダムな準曲面が合理的に動作することを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:21:53 GMT)
LayLens: Improving Deepfake Understanding through Simplified Explanations [4.1] LayLensは、すべての教育的バックグラウンドのユーザにとって、ディープフェイクの理解を容易にするためのツールだ。
このインタフェースは、技術的・日常的な説明と、アップロードされた画像と再構成された画像の並べ比較を提供する。
15人の参加者によるユーザスタディによると、単純化された説明は明瞭さを著しく改善し、認知負荷を低減し、多くのユーザはディープフェイクの識別に対する自信を高めている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:34:03 GMT)
Touch and Tell: Multimodal Decoding of Human Emotions and Social Gestures for Robots [4.1] 人間の感情は複雑で、微妙なタッチジェスチャーによって伝達される。
これまでの研究は主に、人間が触覚で感情を認識する方法や、ロボットの感情表現の重要な特徴を特定することに焦点を当ててきた。
本研究では,触覚と音による情緒的・外見的表現の一貫性と識別性について検討した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:48:58 GMT)
BigTokDetect: A Clinically-Informed Vision-Language Modeling Framework for Detecting Pro-Bigorexia Videos on TikTok [4.0] プロビジョレシア素材は、視覚ディスプレイ、符号化言語、モチベーションメッセージングの複雑なマルチモーダルの組み合わせを通じて、正当性のあるフィットネスコンテンツとしてマスクレードを形成する。
我々は,TikTok上での抗大食症症状を識別するための臨床インフォームド検出フレームワークであるBigTokDetectを開発した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:22:38 GMT)
Efficient Annotation of Medieval Charters [4.0] 中世の憲章の分析である外交学は、古生物学を応用する主要な研究分野である。
本稿では,認証セグメンテーションのための効率的かつ効率的なアノテーション手法を提案する。
さらに、画素の物理長でデータを注釈し、回帰ニューラルネットワークを訓練して画像パッチから予測する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:53:20 GMT)
Discrete and Continuous Difference of Submodular Minimization [4.0] 連続あるいは離散の領域で定義される部分モジュラ函数は、多くの応用に現れる。
離散領域上のすべての関数と連続領域上のすべての滑らかな関数はDSであることが示される。
本稿では、DCアルゴリズム(DCA)の新たな変種を提案し、結果のDCプログラムに適用する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:13:06 GMT)
The Interpretability Analysis of the Model Can Bring Improvements to the Text-to-SQL Task [3.9] WHERE節のセマンティック解析のためのモデル解釈可能性解析と実行誘導戦略を統合する。
我々のモデルは、単一テーブルデータベースクエリタスクのエンブレマであるウィキデータセットを抜粋する。
基本的なデータベースクエリ処理の精度を高めるためにこの取り組みが、複雑なクエリ処理の研究に新たな視点を提供することを期待しています。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:24:16 GMT)
P-CAFE: Personalized Cost-Aware Incremental Feature Selection For Electronic Health Records [3.9] EHRデータセットに特化して、個人化、オンライン化、費用対効果を考慮した新しい機能選択フレームワークを提案する。
このフレームワークはスパースデータとマルチモーダルデータを効果的に管理し、堅牢でスケーラブルなパフォーマンスを保証するように設計されている。
本手法の主な応用は,患者検診における医師の意思決定を支援することである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:23:46 GMT)
Distributed optimization: designed for federated learning [3.9] 本稿では,拡張ラグランジアン手法に基づく分散最適化アルゴリズムのクラスを提案する。
計算効率を向上させるために,複数の終了基準とパラメータ更新機構を開発する。
数値実験により,提案アルゴリズムは大規模設定において高い性能を示すことが示された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:39:07 GMT)
Toward Automated Hypervisor Scenario Generation Based on VM Workload Profiling for Resource-Constrained Environments [3.9] 本稿では,自動車ベンダがハードウェアリソースを効率的に割り当てるのを支援する自動シナリオ生成フレームワークを提案する。
実行時の振る舞いをプロファイリングし、理論モデルとベンダーの両方を統合することにより、システム制約に合わせて最適化された設定を生成する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:06:06 GMT)
Intrinsic Memory Agents: Heterogeneous Multi-Agent LLM Systems through Structured Contextual Memory [3.8] LLM(Large Language Models)上に構築されたマルチエージェントシステムは、複雑な協調的な問題解決に非常に有望である。
しかし、それらは、メモリの一貫性を損なうコンテキストウィンドウの制限、役割の順守、手続き的整合性といった根本的な課題に直面します。
本稿では,エージェント固有のメモリを通じて,これらの制限に対処する新しいフレームワークであるIntrinsic Memory Agentsを紹介する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:05:00 GMT)
Detecting Entanglement via Split Spectroscopy in Many-Body Systems [3.8] 量子多体系における固有状態の絡み合いを実験的に検出する手法としてスプリット分光法を提案する。
我々のフレームワークは、量子相転移を行う2つのパラダイムスピンモデルを用いて説明される。
スペクトルエントロピーは量子相転移の強力な指標であり、絡み合いのスケーリング挙動を捉えていることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:49:51 GMT)
Interactive AI and Human Behavior: Challenges and Pathways for AI Governance [3.8] 生成AIシステムは、長期的、個人的、およびリレーショナルな相互作用にますます関与する。
これらの対話型AIシステムは、時間の経過とともにユーザに対応し、継続的な関係を構築し、ユーザに代わって積極的に行動することも可能だ。
この新たなパラダイムでは、ガバナンスと政策開発を効果的に研究する方法を再考する必要があります。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:15:35 GMT)
Differentiated Information Mining: A Semi-supervised Learning Framework for GNNs [3.6] 非ラベルデータを用いたグラフニューラルネットワーク(GNN)のための半教師付き学習(SSL)では、相互独立な相互検証決定因子を導入し、擬似ラベル確認バイアスとトレーニング崩壊を緩和する効果的な戦略とみなす。
本稿では,1つの情報ソースから微分因子を導出し,その一貫性を強制する微分因子一貫性半教師フレームワーク(DiFac)を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:14:42 GMT)
Pattern-based Knowledge Component Extraction from Student Code Using Representation Learning [3.6] この研究は、学生の学習に不可欠な粒度のコードパターンとアルゴリズム構造を識別する自動化され、スケーラブルで説明可能なフレームワークを提供することで、コンピュータサイエンス教育における知識モデリングを推進している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:42:15 GMT)
SCB-Dataset: A Dataset for Detecting Student and Teacher Classroom Behavior [3.6] SCB-Datasetは、19のクラスをカバーする学生と教師の教室行動のデータセットである。
オブジェクト検出部は13,330の画像と122,977のラベルを含み、画像分類部は21,019の画像を含む。
我々は、SCB-Datasetが、教育における人工知能の将来的な応用の確かな基盤となると信じている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:26:58 GMT)
One Subgoal at a Time: Zero-Shot Generalization to Arbitrary Linear Temporal Logic Requirements in Multi-Task Reinforcement Learning [3.6] 複雑で時間的に拡張されたタスク目標と安全制約への一般化は、強化学習(RL)における重要な課題である。
本稿では,任意の仕様に対してゼロショットの一般化を可能にするGenZ-LTLを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 22:41:52 GMT)
A Few Words Can Distort Graphs: Knowledge Poisoning Attacks on Graph-based Retrieval-Augmented Generation of Large Language Models [3.5] グラフベースのRetrieval-Augmented Generation (GraphRAG)は、最近、大規模言語モデル(LLM)を強化するための有望なパラダイムとして登場した。
筆者らは2つの知識中毒攻撃 (KPA) を提案し, ソーステキスト中の少数の単語のみを改変することで, 構築したグラフを著しく変更し, グラフRAGを中毒し, 下流の推論を著しく誤解させることを示した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:00:07 GMT)
MechaFormer: Sequence Learning for Kinematic Mechanism Design Automation [3.5] 本稿では,条件付きシーケンス生成タスクとして機構設計に取り組むトランスフォーマーベースモデルであるMechaFormerを紹介する。
本モデルでは,対象曲線をドメイン固有言語()文字列に変換し,そのメカニズムの位相と幾何パラメータを同時に決定する。
ソリューションの品質を劇的に改善し、デザイナーに価値ある柔軟性を提供する、一連のサンプリング戦略を示します。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:17:30 GMT)
MMIF-AMIN: Adaptive Loss-Driven Multi-Scale Invertible Dense Network for Multimodal Medical Image Fusion [3.5] MMIF(Multimodal Medical Image fusion)は、様々なモダリティの画像を統合して総合的な画像を作成することを目的としている。
複数のモダリティにまたがるユニークな情報と相補的な情報を同時に取得することは、MMIFにおける重要な研究課題である。
本稿では,これらの特徴を効果的に抽出できる新しいアーキテクチャを特徴とする新しい画像融合手法MMIF-AMINを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:55:38 GMT)
GSMT: Graph Fusion and Spatiotemporal TaskCorrection for Multi-Bus Trajectory Prediction [3.4] GSMTは、グラフ注意ネットワーク(GAT)とシーケンス・ツー・シーケンス・リカレントニューラルネットワーク(RNN)を統合するハイブリッドモデルである。
タスク修正器は、歴史的軌跡をクラスタリングして、異なる動きパターンを特定し、GATおよびRNNによって生成された予測を微調整する。
マレーシアのクアラルンプール(Kuala Lumpur)で実世界のデータセットを用いて行った実験は、我々の手法が既存の手法よりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:54:26 GMT)
Distributing Arbitrary Quantum Graph States by Graph Transformation [3.3] 我々は,強い絡み合い構造を持つ任意の量子グラフ状態を確立するアルゴリズムを,最先端技術よりもはるかに低コストで開発する。
その結果、高速アルゴリズムの収束、グラフ状態の分散における成功確率の増加、ERPコストの53.57%の削減が、最先端のベースラインと比較された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:33:13 GMT)
Visual Prompting for Robotic Manipulation with Annotation-Guided Pick-and-Place Using ACT [3.3] 本稿では,アノテーションを用いた視覚的プロンプトを利用した知覚行動パイプラインを提案する。
我々は、ロボットアームが人間のデモンストレーションからチャンクされたアクションシーケンスを予測することができる模倣学習アルゴリズムとして、Action Chunking with Transformers (ACT)を採用している。
本システムは,小売環境における把握行動の成功率と視覚的分析に基づいて評価し,把握精度と適応性の向上を実証した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:45:09 GMT)
NEFMind: Parameter-Efficient Fine-Tuning of Open-Source LLMs for Telecom APIs Automation [3.2] 現代の電気通信におけるサービスベースアーキテクチャの利用は、ネットワーク機能(NF)とアプリケーションプログラミングインタフェース(API)を指数関数的に増加させてきた。
textitNEFMindは、オープンソースのLarge Language Models (LLMs) のパラメータ効率の良い微調整を利用した、これらの課題に対処するフレームワークである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:03:22 GMT)
SHEFL: Resource-Aware Aggregation and Sparsification in Heterogeneous Ensemble Federated Learning [3.1] フェデレートラーニングは、クライアントのプライベートデータによる分散トレーニングを可能にする。
現在のアンサンブルに基づくFL法は,モデル予測の多様性を捉えるには不十分である。
我々は,多様な計算能力を持つクライアントに適したグローバルアンサンブルベースのフェデレート学習フレームワークであるSHEFLを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:40:46 GMT)
Multi-modal Policies with Physics-informed Representations in Complex Fluid Environments [3.0] 制御の多モードポリシーのための物理情報表現(PIR)アルゴリズムを提案する。
PIRはスパース観測データを部分微分方程式 (Partial Differential Equation, PDE) 情報と統合し、流体系の統一表現を蒸留する。
実験では、PIRは基底線に比べて基底の真理の特徴との整合性が優れていることを示した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:53:09 GMT)
RicciFlowRec: A Geometric Root Cause Recommender Using Ricci Curvature on Financial Graphs [3.0] RicciFlowRecは、Ricci曲率と動的財務グラフ上のフローを通じて、ルート原因属性を実行するレコメンデーションフレームワークである。
FinBERTを用いたS&P500データの予備的結果から, 合成摂動下での強靭性と解釈性が改善された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:45:02 GMT)
Surviving the Narrative Collapse: Sustainability and Justice in Computing Within Limits [3.0] 持続可能性駆動型コンピューティングの研究は、多くの社会政治の文脈で起こされたり、危険なものとして、ますます否定されている。
本稿では,これらの緊張関係を,異なるジャンルや視点で論じる創造的ストーリーリテリング手法であるFictomorphosisを通して探求する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:52:50 GMT)
Hallucinations in Code Change to Natural Language Generation: Prevalence and Evaluation of Detection Metrics [3.0] 幻覚は、自然言語とコード生成において独立して研究されている。
幻覚は、自然言語生成へのコード変更を含む2つの重要なタスク、コミットメッセージ生成とコードレビューコメント生成に発生する。
近年の言語モデルにおける幻覚の有病率の定量化と,それを自動的に検出するためのメトリクスベースのアプローチの探索を行う。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:59:33 GMT)
Evaluating Trust in AI, Human, and Co-produced Feedback Among Undergraduate Students [2.9] 本研究は,大学生の大規模言語モデル(LLM)に対する信頼度,人間とAIが共生したフィードバックを,真正なHEの文脈で比較した。
調査の結果、学生はAIを好んでおり、人間のフィードバックよりも有用性と客観性に対するフィードバックを共同生成していることがわかった。
教育AI体験は、LLM生成フィードバックを識別する能力を改善し、あらゆる種類のフィードバックに対する信頼を高めた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:35:05 GMT)
Towards Scalable Lottery Ticket Networks using Genetic Algorithms [2.9] この研究は、強力な宝くじを識別するための遺伝的アルゴリズムの使用を探求する。
その結果,2段階・複数段階の分類タスクの場合,現在の最先端技術よりも精度とスパーシリティのレベルが向上することが判明した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:03:21 GMT)
Constrained free energy minimization for the design of thermal states and stabilizer thermodynamic systems [2.9] 量子熱力学系はハミルトニアンによって記述され、基本的なゴールは系の最小エネルギーを決定することである。
本稿では,二元化学ポテンシャル問題の解法として,古典的およびハイブリッド量子古典的アルゴリズムを提案する。
我々は、制御可能なハミルトンの基底状態と熱状態の設計方法として、これらのアルゴリズムの代替的な説得力のある解釈を提供する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:31:13 GMT)
LSDTs: LLM-Augmented Semantic Digital Twins for Adaptive Knowledge-Intensive Infrastructure Planning [2.9] LSDT(LLM-Augmented Semantic Digital Twins)は、大規模言語モデルが構造化されていないドキュメントから計画的知識を抽出するのを支援するフレームワークである。
この研究は、複雑な知識駆動計画タスクをサポートするために、生成AIとデジタルツインを組み合わせる可能性を示している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:04:36 GMT)
Tame Riemannian Stochastic Approximation [2.8] リーマン多様体で定義される制約に従属するテーム非微分可能函数に近似を適用する性質について検討する。
近年の研究では、このタイプの関数がディープニューラルネットワークトレーニング目標の損失景観を忠実にモデル化していることが示されている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:51:20 GMT)
UltraLight Med-Vision Mamba for Classification of Neoplastic Progression in Tubular Adenomas [2.8] Ultralight Med-Vision Mambaは状態空間ベースモデル(SSM)である
長距離および短距離の依存関係のモデリングや画像の一般化に優れる。
これは、リアルタイムな臨床展開のための有望なツールである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:56:31 GMT)
Synaptic Pruning: A Biological Inspiration for Deep Learning Regularization [2.8] 生物をよりよく反映する等級に基づくシナプス刈り法を提案する。
ドロップアウトの代替品としてトレーニングループに 直接統合された
RNN、LSTM、Patch Time Series Transformerを含む複数の時系列予測モデルの実験は、一貫した利得を示している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:36:00 GMT)
Reducing Cognitive Load in Multi-Agent Reinforcement Learning for Mathematical Problem Solving: Decoupling Reasoning and Code Generation [2.7] 現在のツール統合数学的推論システムは、しばしば単一エージェントのパラダイムを採用する。
Reasoning Agentは段階的に問題を分解し、Code Agentはコード生成と実行を処理します。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:10:53 GMT)
Reveal-Bangla: A Dataset for Cross-Lingual Multi-Step Reasoning Evaluation [2.7] 本稿では,英語Revealデータセットから派生した,手動で翻訳したBangla多段階推論データセットを提案する。
英語中心およびバングラ語中心の多言語小言語モデルの制御評価を行う。
以上の結果から,より困難な非バイナリ問題に対して,推論コンテキストが有用であることが示唆された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:34:10 GMT)
Mosaic: Composite Projection Pruning for Resource-efficient LLMs [2.7] 本稿では,大規模言語モデル(LLM)の微粒化手法であるプロジェクションプルーニングを紹介する。
複合プロジェクションプルーニングを用いた刈り込みLDMの作成と展開を行う新しいシステムであるMosaicを開発した。
モザイクモデルは粗粒プルーニングで得られたモデルよりも84.2%低いパープレキシティと31.4%高い精度を達成する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:25:47 GMT)
Privacy Preserving Inference of Personalized Content for Out of Matrix Users [2.7] DeepNaniNetは、ユーザとイテムのインタラクション、アイテムとイテムの関係、BERTから派生したリッチテキストレビューの埋め込みを組み合わせた、ディープニューラルネットワークレコメンデーションフレームワークである。
本設計では,新規な"コンテンツバスケット"ユーザ表現と,目に見えないユーザを対象としたオートエンコーダに基づく一般化戦略を用いて,プロファイルマイニングを使わずにコールドスタートレコメンデーションを実現する。
DeepNaniNetは、CiteULikeベンチマークで最先端のコールドスタート結果を達成し、行列外ユーザのパフォーマンス劣化のないユーザリコールでDropoutNetにマッチし、アニメ上での重み付きマトリックスファクタライゼーション(WMF)とDropoutNetより優れています。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:55:29 GMT)
Image selective encryption analysis using mutual information in CNN based embedding space [2.7] 本研究は,情報理論上の保証がまだ探索されていない領域である画像データの漏洩について検討する。
深層学習,情報理論,暗号の交わりにおいて,選択的に暗号化された画像からの漏洩を検出するために相互情報(MI)推定器を用いて検討する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:39:31 GMT)
Attacks and Defenses Against LLM Fingerprinting [2.6] 攻撃的,防御的両面からLLMフィンガープリントについて検討した。
攻撃手法は強化学習を用いてクエリ選択を自動的に最適化する。
我々の防御的アプローチは、モデルアイデンティティを難読化するために二次LLMを通して意味保存出力フィルタリングを採用する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:36:36 GMT)
Jointly Generating and Attributing Answers using Logits of Document-Identifier Tokens [2.6] 本稿では,RAGの回答を共同で生成し,忠実に属性付けする手法であるLoDITを紹介する。
信頼性を重視したテキスト生成ベンチマークであるTrust-Alignの実験では、LoDITがいくつかのメトリクスで最先端モデルよりも大幅に優れていることが示されている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:50:25 GMT)
Democracy of AI Numerical Weather Models: An Example of Global Forecasting with FourCastNetv2 Made by a University Research Lab Using GPU [2.6] 本稿では,大学研究グループ間でAIによる世界天気予報モデルの民主化の可能性を示す。
グラフィックス処理ユニット(GPU)とNVIDIAのFourCastNetv2のような無償のAIモデルを活用しています。
i)FourCastNetv2を活用して、指定されたアプリケーションプログラミングインターフェース(API)を介して予測を作成すること、(ii)NVIDIAハードウェアを使用して、オリジナルのFourCastNetモデルをトレーニングすることの両方を実証する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 00:12:41 GMT)
Decoding Neural Emotion Patterns through Natural Language Processing Embeddings [2.6] 本稿では, 神経イメージングを必要とせずに, テキストの感情内容を解剖学的に定義された脳領域にマッピングする計算フレームワークを提案する。
OpenAIのテキスト埋め込み-ada-adaを用いて、高次元の意味表現を生成し、次元の縮小とクラスタリングを適用して感情グループを特定し、感情処理に関連する18の脳領域にマッピングする。
このコスト効率が高くスケーラブルなアプローチは、自然言語を大規模に分析し、臨床集団を区別し、AIの感情表現を評価するための脳ベースのベンチマークを提供する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:51:56 GMT)
Understanding Dementia Speech Alignment with Diffusion-Based Image Generation [2.5] 以上の結果から,ADReSSデータセットで75%の精度で認知症検出が可能であることが示唆された。
次に、説明可能性法を利用して、言語のどの部分が検出に寄与しているかを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 23:00:36 GMT)
Opening Musical Creativity? Embedded Ideologies in Generative-AI Music Systems [2.5] 2025年中頃の4つの生成AI音楽制作システムについて検討する。
音楽制作における生成AIの早期開発と導入を推進しているイデオロギーについて検討する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:59:07 GMT)
Securing Agentic AI: Threat Modeling and Risk Analysis for Network Monitoring Agentic AI System [2.5] MAESTROフレームワークはエージェントAIの脆弱性を公開、評価、排除するために使用された。
プロトタイプエージェントシステムはPython、LangChain、WebSocketでテレメトリを使用して構築、実装された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 00:14:12 GMT)
M3-Net: A Cost-Effective Graph-Free MLP-Based Model for Traffic Prediction [2.5] トラヒック予測のための費用対効果の高いグラフフリー多層パーセプトロン(M3-MLP)モデルを提案する。
複数の実データセットに対して行われた大規模な実験は、予測性能の観点から提案したモデルの優越性を実証している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:11:46 GMT)
AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models [2.5] AdEval は anAlignment ベースの Dynamic Evaluation メソッドである。
静的なデータセットから知識ポイントと主要なアイデアを抽出し、静的なベンチマークのコアコンテンツとの動的アライメントを実現する。
ブルームの認知階層に基づく質問を、記憶、理解、適用、分析、評価、作成の6次元にわたって設計し、多段階認知評価を可能にする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:19:15 GMT)
Diminution: On Reducing the Size of Grounding ASP Programs [2.4] 本稿では,Herbrand宇宙の選択部分集合として定義される最小化の概念を紹介する。
5つのベンチマークに関する広範な実験では、我々の戦略によって選択された最小限の値を適用すると、大幅な性能改善が得られます。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:52:19 GMT)
Out of the Box, into the Clinic? Evaluating State-of-the-Art ASR for Clinical Applications for Older Adults [2.4] 本研究は,オランダ語話者の言語利用に関する最先端自動音声認識(ASR)モデルの評価である。
オランダ語話者が発話する多言語ASRモデルをベンチマークし,処理速度も検討した。
以上の結果から, 汎用多言語モデルは細調整モデルよりも優れており, 最近のASRモデルでは, より現実的なデータセットによく一般化できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:17:44 GMT)
3DFacePolicy: Audio-Driven 3D Facial Animation Based on Action Control [2.4] 本研究では,自然かつ連続的な顔の動きを生成する3DFacePolicyを提案する。
我々の手法は最先端の手法を大きく上回っている。
特に動的、表現的、自然に滑らかな顔のアニメーションに精通している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:24:42 GMT)
Exploring the Evidence-Based SE Beliefs of Generative AI Tools [2.3] 我々は、ソフトウェア開発の実践を支援するためにますます使われている生成型AIツールの「信条」を調査する。
我々の研究結果は、生成型AIツールには、研究の主張に関する曖昧な信念があり、回答を支援するための信頼できる証拠が欠如していることを示しています。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:16:28 GMT)
Plug it and Play on Logs: A Configuration-Free Statistic-Based Log Parser [2.3] ログ解析はログ解析において必須のタスクであり、それを実現するために多くのツールが設計されている。
セマンティックベースと比べ、既存の統計ベースはより効率的で、計算コストが低く、オンプレミスのデプロイによってプライバシーが保護される傾向にある。
統計ベースは意味ベースほど効果的ではないという共通の信念となった。
我々の研究は、新しい統計に基づくPIPLUPによってこの信念に挑戦する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:47:27 GMT)
CRADLE: Conversational RTL Design Space Exploration with LLM-based Multi-Agent Systems [2.3] CRADLEはRTLの設計空間探索のための対話型フレームワークである。
内部の自己検証、修正、最適化を備えたユーザガイドフローを可能にする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:54:39 GMT)
Fast superconducting qubit control with sub-harmonic drives [2.2] 単一ビット制御を行うための新しいパラメトリック駆動方式を提案する。
我々は、トランスモンのKerr項を量子ビットの共振周波数の約3分の1でポンプすることで、高速ゲート速度を実現する。
単一量子ビットゲートは37.4nsで、忠実度は99.91%である。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:45:00 GMT)
Description and Comparative Analysis of QuRE: A New Industrial Requirements Quality Dataset [2.2] 本稿では,実世界のレビュープロセスを通じてアノテートされた2,111の産業要件からなる新しいデータセットQuREを紹介する。
以前は工業契約の一部として5年以上使用されていたが、現在、このデータセットは研究コミュニティにリリースされている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:51:15 GMT)
NetMoniAI: An Agentic AI Framework for Network Security & Monitoring [2.1] 我々は,ネットワーク監視とセキュリティを自動化するエージェントAIフレームワークであるNetMoniAIを紹介する。
各ノードの自律型マイクロエージェントは、局所的なトラフィック分析と異常検出を行う。
中央のコントローラがノード全体で洞察を集約し、協調攻撃を検出し、システム全体の状況認識を維持する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:48:53 GMT)
ALFred: An Active Learning Framework for Real-world Semi-supervised Anomaly Detection with Adaptive Thresholds [2.1] ビデオ異常検出(VAD)は、ビデオ中の異常な活動を見つける上で重要な役割を果たす。
VADは、人間の行動の動的な性質、環境の変化、ドメインシフトにより、現実世界での使用が困難である。
VADに適したアクティブラーニングフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:18:54 GMT)
DevNous: An LLM-Based Multi-Agent System for Grounding IT Project Management in Unstructured Conversation [2.1] 本稿では,Large Language Model-based (LLM) multi-agent expert systemを導入し,この非構造化翻訳プロセスを自動化する。
DevNousはチームチャット環境に直接統合し、非公式な対話から行動可能な意図を特定する。
システムを定量的に評価するために,160個の現実的対話型ターンのベンチマークを導入する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:08:29 GMT)
GreenTEA: Gradient Descent with Topic-modeling and Evolutionary Auto-prompting [2.1] GreenTEAは自動プロンプト最適化のためのエージェントワークフローである。
候補者の探索と知識の搾取のバランスをとる。
エラーサンプルからのフィードバックに基づいてプロンプトを反復的に洗練する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:48:30 GMT)
Hybrid Node-Destroyer Model with Large Neighborhood Search for Solving the Capacitated Vehicle Routing Problem [2.0] 本稿ではメタヒューリスティックアルゴリズムの性能向上を目的とした反復学習ハイブリッド最適化手法を提案する。
提案手法は, 演算複雑性を低減し, 最適化プロセスに関わる探索空間を縮小する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:56:13 GMT)
Edge-Selector Model Applied for Local Search Neighborhood for Solving Vehicle Routing Problems [2.0] 本研究は、車両ルーティング問題(VRP)を解決するために設計されたハイブリッド機械学習とメタヒューリスティックメカニズムを提案する。
本手法の主目的はエッジソリューションセレクタモデルであり, 局所探索において, 解のエッジを分類し, 禁止動作を識別する。
提案手法はスケーラビリティと一般化性の両方を示し,異なるベースラインメタヒューリスティックスにおける性能改善を実現している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:28:26 GMT)
Universal theory for geometry-dependent non-Hermitian bands [1.9] 我々は、ストリップ一般化ブリルアンゾーン(SGBZ)に基づく普遍的理論的枠組みを導入する。
我々はまた、アメーバスペクトルが全ての可能なSGBZスペクトルのスーパーセットであることを示すことにより、我々のSGBZフレームワークをアメーバ定式化と統合する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:45:23 GMT)
Quantum-centric simulation of hydrogen abstraction by sample-based quantum diagonalization and entanglement forging [1.8] 重要な応用はラジカル鎖反応の計算である。
2,2-ジフェニルジプロパンから水素を抽象化するための活性化エネルギーと反応エネルギーを計算する。
計算はIBM Heronファミリーの超伝導量子プロセッサと古典計算資源を用いて行われる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:37:42 GMT)
From Lab to Field: Real-World Evaluation of an AI-Driven Smart Video Solution to Enhance Community Safety [1.8] 本稿では、現実世界の安全性を高めるために設計されたAI対応スマートビデオソリューション(SVS)を採用し、評価する。
このシステムは既存のインフラストラクチャカメラネットワークと統合され、AIの最近の進歩を活用して簡単に採用できる。
この記事では、AIアルゴリズムがカメラレベルでの異常な振る舞いをリアルタイムで検出した瞬間から、ステークホルダーが通知を受け取るまでのエンドツーエンドのレイテンシを評価する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:27:29 GMT)
Nitrogen-Vacancy Emission from Nanodiamonds: Size, Depth, and Surroundings [1.8] ダイヤモンド中の負電荷の窒素空孔中心は、固体量子エミッタである。
ナノダイヤモンドに埋め込むと、大きさ、形状、表面効果の複雑さが生じる。
量子光学的NVモデルと厳密な電磁シミュレーションを結合するハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:08:35 GMT)
Mitigating Popularity Bias in Counterfactual Explanations using Large Language Models [1.8] 本稿では,大規模言語モデルを用いて文字外履歴項目をフィルタリングする前処理ステップを提案する。
ACCENTのみよりも、各ユーザの人気の好みに忠実に適合した偽物を生成することが判明した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:57:36 GMT)
Livia: An Emotion-Aware AR Companion Powered by Modular AI Agents and Progressive Memory Compression [1.8] Liviaは、パーソナライズされた感情支援を提供するために設計された、感情対応拡張現実(AR)コンパニオンアプリである。
Liviaは、感情分析、対話生成、メモリ管理、行動オーケストレーションを担当する特殊なエージェントを備えたモジュール型AIアーキテクチャを採用している。
ユーザ評価では,感情結合が増加し,満足度が向上し,孤独感が統計的に有意に低下した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:07:22 GMT)
Enhance the machine learning algorithm performance in phishing detection with keyword features [1.7] 典型的なフィッシング攻撃では、攻撃者はエンドユーザーの情報を取得するために、正当なウェブサイトに似た悪意のあるウェブサイトをセットアップする。
従来の研究者は、フィッシングURLと正当なURLを区別するために、多くの機械学習アルゴリズムを提案してきた。
従来の特徴にキーワードを組み込む新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:16:11 GMT)
Towards Safer Pretraining: Analyzing and Filtering Harmful Content in Webscale datasets for Responsible LLMs [1.7] 大規模言語モデル(LLM)は、Common Crawl、C4、FineWebといった大規模なWebソースデータセットを事前トレーニングに活用して、さまざまな現実世界のアプリケーションに不可欠なものになっている。
このようなフィルタリングされていないデータに対するLCMの訓練は、有害な行動の継続、誤報の拡散、社会的偏見の増幅といったリスクを負う。
本稿では,これらのデータセットにまたがる不適切なコンテンツを大規模に分析し,有害なWebページをその意図に基づいてトピカル・トキシックに分類する包括的分類法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:41:44 GMT)
Towards Generalizable Learning Models for EEG-Based Identification of Pain Perception [1.7] 本研究では,幅広い機械学習モデルの参加者間一般化の性能を体系的に評価する。
従来のモデルは内部から参加者間のパフォーマンスに最大の低下を経験し、ディープラーニングモデルはより弾力性があることを証明した。
性能の変動性は高いが、グラフベースのモデルによる強い結果は、脳波信号の主観的不変構造を捉える可能性を強調している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:57:32 GMT)
To Judge or not to Judge: Using LLM Judgements for Advertiser Keyphrase Relevance at eBay [1.7] eコマースの売り手は、購入者のエンゲージメントを高めるため、在庫に基づいてキーワードを推奨する(クリック/セール)。
広告主キーフレーズの関連性は 検索システムの浸入を防ぐ 重要な役割を担っています
本研究は,eBay Advertisingのケーススタディを通じて,人間による判断の実用性について論じる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:50:14 GMT)
Personalized Recommendations via Active Utility-based Pairwise Sampling [1.7] 単純かつ直感的なペアワイズ比較から好みを学習するユーティリティベースのフレームワークを提案する。
本研究の中心的な貢献は,嗜好評価のための新規なユーティリティベースアクティブサンプリング戦略である。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:09:33 GMT)
Situated Epistemic Infrastructures: A Diagnostic Framework for Post-Coherence Knowledge [1.7] 本稿では,ポストコヒーレンス条件下での知識の権威化を診断するための診断ツールとして,Situated Epistemic Infrastructuresフレームワークを紹介した。
本論文は,AIガバナンス,知識生産,情報システムの倫理的設計に関する議論に,学術コミュニケーションの表現主義モデルに対する堅牢な代替手段を提供することによって貢献する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:13:39 GMT)
Over-Squashing in GNNs and Causal Inference of Rewiring Strategies [1.7] グラフニューラルネットワーク(GNN)は、レコメンダシステム、マテリアルデザイン、薬物再資源化など、幅広い領域で最先端のパフォーマンスを示している。
メッセージパッシングGNNは、遠く離れたノードからの長距離情報の指数的圧縮、過剰な監視に悩まされている。
再配線技術はこのボトルネックを緩和することができるが、直接的な実証的なオーバーカッシング指標が欠如していることから、その実践的影響は明らかではない。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:16:45 GMT)
Dead Zone of Accountability: Why Social Claims in Machine Learning Research Should Be Articulated and Defended [1.6] 多くの機械学習研究は、新しい手法や技術の潜在的な社会的利益や技術的余裕を記述した言語を使用している。
こうした言語は、私たちが「社会的主張」と呼んでいるもので、機械学習の研究と技術生産に関わる人々にとって、かなりのリソースと影響力を得られる。
本稿では,クレームとリナリティのギャップについて考察し,それに対する説明責任機構の開発を規範的に論じる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:33:16 GMT)
ScamDetect: Towards a Robust, Agnostic Framework to Uncover Threats in Smart Contracts [1.6] ScamDetectは、分散型エコシステムの将来に向けて、積極的にスケーラブルなセキュリティを実現することを目的としている。
本稿では,スマートコントラクトマルウェア検出のための堅牢でモジュール的でプラットフォームに依存しないフレームワークであるScamDetectのビジョンを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:39:01 GMT)
Doubly-polylog-time-overhead fault-tolerant quantum computation by a polylog-time parallel minimum-weight perfect matching decoder [1.6] 従来のポリログ空間のオーバヘッドを維持しつつ,2倍のポリログ時間オーバヘッドを実現するプロトコルを開発した。
本プロトコルは, このデコーダを, シングルショットデコーダを組み込んだトポロジカル・コードプロトコルと統合し, 効率的な抽出を行う。
その結果, 従来のポリログ・タイム・オーバヘッドバリアを越え, 低オーバヘッドFTQCの新たなフロンティアを開拓できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:55:01 GMT)
Meta-learning optimizes predictions of missing links in real-world networks [1.6] すべての入力ネットワークでアルゴリズムが最善であることを示す。
本稿では,この可変性を利用して個々のネットワークに対するリンク予測を最適化するメタ学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:41:16 GMT)
A unified realization of electrical quantities from the quantum International System of Units [1.6] 本稿では,量子異常ホール抵抗 (QAHR) とプログラム可能なジョセフソン電圧標準 (PJVS) を1つのクライオスタットに統合することにより,Volt,ohm,ampereの統一的な実現を報告する。
我々のシステムは0.24mVから6.5mVまでの量子電圧出力を持ち、相対的不確かさが組み合わさって3$mu$V/Vになる。
我々は9.33 nAから252 nAの範囲の電流を決定し、最低不確実性は83.9 nAの4.3$mu$A/Aである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:04:09 GMT)
Hyperflux: Pruning Reveals the Importance of Weights [1.6] 我々は,そのフラックスを通じて各重量の重要性を推定する概念的に基底化されたL0プルーニング手法であるHyperfluxを導入する。
グローバルな圧力項は、全ての重みをプルーニングに向けて連続的に駆動し、正確性に重要なものを自動的に再認識する。
我々はCIFAR-10およびCIFAR-100上でResNet-50 VGG-19による最先端の成果を示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:57:23 GMT)
KnowDR-REC: A Benchmark for Referring Expression Comprehension with Real-World Knowledge [1.6] 本研究では,実世界の知識に基づいて構築されたKnowDR-RECを提案する。
我々は、KnowDR-REC上で16の最先端マルチモーダルモデルを評価し、既存のMLLMが知識駆動型視覚接地作業に苦戦していることを示す実験結果を得た。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:43:44 GMT)
Toward an African Agenda for AI Safety [1.6] この論文は、ディープフェイクによる選挙干渉とデータコロニー依存から、不足の計算、労働の破壊、気候変動による環境コストへの不均衡な露出まで、アフリカの独特なAIリスクプロファイルをマッピングする。
我々は、AIの有害な社会経済的効果を経験する最も脆弱な人々の人権保護を前提とした5点アクションプランを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:42:09 GMT)
Eat your own KR: a KR-based approach to index Semantic Web Endpoints and Knowledge Graphs [1.6] IndeGxは、知識グラフの内容のインデックス化にSPARQLルールを活用するフレームワークである。
IndeGxは、完全にオブジェクト指向のモデリングと処理のアプローチで拡張します。
世界中のセマンティックウェブにどんな知識があるのか、という問いに答えるのを手伝う。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:56:48 GMT)
Towards reliable use of artificial intelligence to classify otitis media using otoscopic images: Addressing bias and improving data quality [1.6] 本研究は, 定量的および定性的手法を用いて, 3つの公開耳鏡画像データセット(Chile, Ohio, USA, T"urkiye")を体系的に評価した。
定量分析の結果,チリとオハイオのデータセットには有意な偏りが認められた。
標準化されたイメージングプロトコル、多様なデータセットのインクルージョン、改善されたラベリングメソッドを通じて、これらのバイアスに対処することが不可欠である。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 23:44:25 GMT)
Efficient Switchable Safety Control in LLMs via Magic-Token-Guided Co-Training [1.5] LLM(Large Language Models)におけるコンテンツ安全性の現在の手法は、マルチステージトレーニングパイプラインに依存している。
複数の安全性挙動を効率的に統合する統合協調学習フレームワークを提案する。
我々は,SFT+DPOの安全アライメント品質に一致し,安全性能においてDeepSeek-R1 (671B) を上回る8Bモデルを示した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:39:33 GMT)
DiffVolume: Diffusion Models for Volume Generation in Limit Order Books [1.5] 我々は、将来のLOBのtextbfVolumeスナップショット(textbfDiffVolume)の生成のための条件付きtextbfDiffusionモデルを提案する。
DiffVolumeは過去の体積分布や空間相関,自己相関崩壊などの統計特性をよりよく再現できることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:42:00 GMT)
A Survey on Web Testing: On the Rise of AI and Applications in Industry [1.5] 本稿では,2014年から2025年までのWebテスト方法論,ツール,トレンドに着目した系統的な文献調査を行う。
259の研究論文を分析して、この領域における重要なトレンド、人口統計、貢献、ツール、課題、革新を特定する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:08:11 GMT)
Self-adjoint realizations of higher-order squeezing operators [1.4] 高次のスクイージングは、分散を超えた場のモーメントを探索することによって、量子光の非ガウス的特徴を捉えている。
我々は、高次量子ゆらぎの解析において自然に生じる$(adag)kal+(adag)lak+f(adag a)$という形の作用素のクラスを研究する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:04:46 GMT)
LLM driven Text-to-Table Generation through Sub-Tasks Guidance and Iterative Refinement [1.4] 本稿では,新しいプロンプト技術を活用したLarge Language Models (LLM) によるテキスト・ツー・テーブル生成のための効率的なシステムを提案する。
このカスタムタスク分解により、モデルが段階的に問題に対処し、生成されたテーブルの品質を向上させることができることを示す。
提案手法は,パブリックドメインで利用可能な2つの複雑なテキスト・テーブル生成データセットのベースラインと比較して,強力な結果が得られる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:37:12 GMT)
FusionEnsemble-Net: An Attention-Based Ensemble of Spatiotemporal Networks for Multimodal Sign Language Recognition [1.3] FusionEnsemble-Netは、認識精度を高めるために視覚および運動データを融合する、注意に基づくネットワークのアンサンブルである。
実験の結果、FusionEnsemble-Netは99.44%の精度で最先端のアプローチより優れていることが示された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:44:23 GMT)
A Signer-Invariant Conformer and Multi-Scale Fusion Transformer for Continuous Sign Language Recognition [1.3] 連続手話認識は、署名者間の多様性や新しい文構造への一般化の欠如など、複数の課題に直面している。
シグナー独立型コンバータ(SI)問題に対して,畳み込みと多頭部自己注意を組み合わせたシグナー不変コンバータを提案する。
本研究では,Unseen-Sentences (US) タスクのために,新しいデュアルパス時間エンコーダを備えたマルチスケールフュージョントランスを設計した。
提案したコンバータアーキテクチャは,SIチャレンジにおいてワード誤り率(WER)を13.07%,最先端技術から13.53%削減する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:59:53 GMT)
Technical Report: Full-Stack Fine-Tuning for the Q Programming Language [1.2] 我々はQ言語の評価データセットをリリースする。
データセット上で主要なフロンティアモデルをベンチマークし、事前トレーニング、教師付き微調整、強化学習を行います。
我々の最高のモデルは、Qベンチマークで59%のパス@1精度を実現し、最高のパフォーマンスのフロンティアモデルを上回っています。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:49:05 GMT)
Finite-dimensional approximations of generalized squeezing [1.2] 本研究では,Fock空間の有限次元トランカチで行う一般化スキーズシミュレーションにおいて,予期せぬ挙動を示す。
結果は、トラルニケート次元が偶数か奇数かによって異なる。
我々は、ハミルトニアンにおけるカー相互作用項の追加が一意に収束するシミュレーションをもたらすことを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:02:45 GMT)
Automated Charge Transition Detection in Quantum Dot Charge Stability Diagrams [1.2] ゲート定義の半導体量子ドットは、量子ビットとして機能するために適切な数の電子を必要とする。
そこで本研究では,SimCATSフレームワークから得られたシミュレーションデータを用いて検出手法を検証し,将来のハードウェア実装を念頭において定量的に比較する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:38:37 GMT)
DiffPose-Animal: A Language-Conditioned Diffusion Framework for Animal Pose Estimation [1.2] DiffPose-Animalは,トップダウン動物ポーズ推定のための新しい拡散型フレームワークである。
従来の熱マップ回帰法とは異なり、DiffPose-Animal は拡散モデルの生成的枠組みの下でデノナイジング過程として推定する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:37:09 GMT)
Toward Lifelong Learning in Equilibrium Propagation: Sleep-like and Awake Rehearsal for Enhanced Stability [1.2] 本研究では,EP学習RNNのための睡眠型リプレイ統合(SRC)アルゴリズムを提案する。
SRCは、継続的学習シナリオにおける破滅的な忘れに対するRNNのレジリエンスを著しく改善する。
本研究は、睡眠様リプレイ技術がRNNに適用可能であることを明らかにする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:48:02 GMT)
Out-of-Sample Hydrocarbon Production Forecasting: Time Series Machine Learning using Productivity Index-Driven Features and Inductive Conformal Prediction [1.2] 本研究は, アウトオブサンプル炭化水素生産予測の堅牢性を高めるために設計された新しいMLフレームワークを紹介する。
The Volve (wells PF14, PF12) and Norne (well E1H) oil field, this study is using the historical data from the Volve (wells PF14, PF12) and Norne (well E1H) oil field, we investigated the effective of various predictive algorithm。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:14:46 GMT)
Randomised Postiterations for Calibrated BayesCG [1.1] ベイズCG後部の校正を向上する新しいランダム化ポストイテレーション戦略を提案する。
数値実験により, 合成問題と逆問題の両方において, 提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:20:53 GMT)
SinLlama - A Large Language Model for Sinhala [1.1] Sinhalaのような低リソース言語は、しばしばオープンソースのLarge Language Models (LLM)によって見過ごされる。
本研究では, 既存の多言語LLM (Llama-3-8B) を拡張し, シンハラ語をよりよく活用する。
クリーン化した1000万シンハラコーパスで継続事前トレーニングを行い,その結果,SinLlamaモデルが得られた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:49:34 GMT)
FBFL: A Field-Based Coordination Approach for Data Heterogeneity in Federated Learning [1.1] 本稿では、フィールドベースフェデレートラーニング(FBFL)を定式化し、MNIST、FashionMNIST、拡張MNISTデータセットを用いて広範に評価する。
IIDデータ条件下での動作において、FBFLは広く使われているFedAvgアルゴリズムと同等に動作することを示す。
挑戦的な非IIDシナリオでは、FBFLはFedAvgを上回るだけでなく、他の最先端のメソッドであるFedProxやScuffoldを上回っている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:02:45 GMT)
Hi-fi functional priors by learning activations [1.0] トレーニング可能なアクティベーションがより複雑な事前処理にどのように対応し、複雑なターゲット関数分布にマッチするかを検討する。
実験結果から, フレキシブルなトレーニング可能なアクティベーション機能を備えたBNNであっても, 所望の関数空間前処理を効果的に実現できることが示唆された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:09:22 GMT)
A quantum computing approach to efficiently simulating correlated materials using impurity models and dynamical mean field theory [1.0] 本研究では,量子コンピュータ上でのDMFT計算のためのフレームワークを提案する。
本稿では,ガウス部分空間を用いたDMFTアルゴリズムの収束性を示すとともに,回路圧縮のハードウェア実現可能性を示す。
我々は、物質科学における量子コンピューティングのこのユースケースの実現に向けた潜在的な道筋について論じる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:23:53 GMT)
Probing spin-motion coupling of two Rydberg atoms by a Stern-Gerlach-like experiment [1.0] 本稿では,双極子-双極子相互作用によって誘起されるリドベルク原子の状態依存運動を測定するためのプロトコルを提案し,実装する。
我々は、ヴァン・デル・ワールスの反発を経験する同じリドベルク状態の2つの原子を用いてこのプロトコルをベンチマークし、理論的な予測と一致して速度を測定する。
2つの前のペア状態の重ね合わせにより、原子のウェーブパケットを2つのマクロ的に異なる軌道に分離する、スターン・ゲルラッハのような実験を行う。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:41:20 GMT)
Bayesian Models for Joint Selection of Features and Auto-Regressive Lags: Theory and Applications in Environmental and Financial Forecasting [0.9] 自動相関誤差を伴う線形回帰における変数選択のためのベイズ的フレームワークを開発する。
本フレームワークは,MSPEの低減,真のモデル成分同定の改善,自動相関ノイズとの整合性の向上を実現している。
既存の手法と比較して,本フレームワークはより低いMSPEを実現し,真のモデル成分の同定が向上し,自動相関ノイズとの整合性が向上する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:44:36 GMT)
Based AI improves human decision-making but reduces trust [0.9] 現在のAIシステムは、イデオロギー的中立を強制することによってリスクを最小化するが、これは人間の意思決定における認知的関与を抑制することによって自動化バイアスをもたらす可能性がある。
我々は2500人の参加者とともにランダム化試験を行い、文化に偏ったAIが人間の意思決定を促進するかどうかを検証した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:20:43 GMT)
Imposing AI: Deceptive design patterns against sustainability [0.8] 私たちは、IT企業がAIの使用を強制するために確立したユーザーインターフェイスをどう変えようとしているかを示します。
個人的および専門的な文脈においてAIの使用を強制する2つの主要な設計戦略を特定します。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:37:39 GMT)
Depth-Guided Self-Supervised Human Keypoint Detection via Cross-Modal Distillation [0.8] Distill-DKPは,キーポイント検出のためのクロスモーダルな知識蒸留フレームワークである。
Distill-DKPは、深度に基づく教師モデルから埋め込みレベルの知識を抽出し、画像に基づく学生モデルを指導する。
実験により、Distill-DKPは従来の教師なし手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:39:03 GMT)
Neutone SDK: An Open Source Framework for Neural Audio Processing [0.8] 我々は、PyTorchベースのニューラルオーディオモデルのデプロイを合理化するオープンソースのフレームワークであるNeutone SDKを紹介した。
我々は、これを実現するために必要なインターフェースの技術的な概要と、それに対応するSDKの実装を提供する。
また、オーディオエフェクトエミュレーション、音色伝達、サンプル生成などのアプリケーションにおけるSDKの汎用性を実証する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:55:08 GMT)
Large Language Models Do Not Simulate Human Psychology [0.8] 一部の研究は、Large Language Models (LLM) が人間の心理学をシミュレートできるかもしれないことを示唆している。
我々は、LLMが人間の心理学をシミュレートする仮説に対する概念的議論を提供する。
LLMとヒトの反応に顕著な相違が生じていることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:58:10 GMT)
Load Forecasting on A Highly Sparse Electrical Load Dataset Using Gaussian Interpolation [0.8] データセットの欠落やゼロ値の存在として定義されたスパーシリティは、現実のデータセットで運用する上で、大きな課題となることが多い。
本研究では,電力プラントの時給負荷データを用いた約62%のデータセットを,そのデータがワイドセンス定常(WSS)であると仮定した負荷予測に利用できることを示す。
具体的には、データを統計的に分析し、データセット上で複数の機械学習モデルとディープラーニングモデルをトレーニングする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:15:45 GMT)
Early Detection of Pancreatic Cancer Using Multimodal Learning on Electronic Health Record [0.8] 膵管腺癌(PDAC)は最も致命的ながんの1つである。
早期発見は依然として大きな臨床課題である。
約4,700人の患者を対象とした実世界のデータセットの開発と評価を行った。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:02:27 GMT)
Masked Autoencoder Self Pre-Training for Defect Detection in Microelectronics [0.7] マイクロエレクトロニクスにおける欠陥検出のための資源効率の高いビジョントランス (ViT) 事前学習フレームワークを提案する。
我々は,1万枚未満の走査型超音波顕微鏡(SAM)画像を用いて,事前学習と欠陥検出を行う。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:28:05 GMT)
Teaching Code Refactoring Using LLMs [0.7] 大規模言語モデル(LLM)は、リアルタイムでコンテキスト対応のフィードバックを通じて、ソフトウェアエンジニアリングコースにおけるコードの教育を強化することができる。
リファクタリングはコード品質を改善するが、特に複雑な現実世界では教えることが難しい。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:41:19 GMT)
Entropy Measures for Transition Matrices in Random Systems [0.7] ABBエントロピーの蒸留解釈は、遷移行列を構成するために用いられる2つの量子状態間の絡み合いの蒸留の成功確率と一致することを示す。
すべてのケースにおいて、遷移行列のSVDとABBエントロピーは、単一のランダム状態のサブシステムエンタングルメントエントロピーの挙動を密接に反映している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:04:55 GMT)
Efficient explicit circuit for quantum state preparation of piece-wise continuous functions [0.7] 量子ビットからなる純粋量子状態に、[-1,1]$の間隔$xの関数$f(x)$をアップロードする方法を提案する。
準備コストは$mathcalO(nlog n)$で、qubits$n$でスケーリングし、$Q$で線形スケーリングする。
本研究では,特定のパリティ条件と有界条件を満たす4つの実数を用いて,そのような関数をアップロードする明示的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:42:21 GMT)
Efficient motion-based metrics for video frame interpolation [0.7] 本研究では,運動場の分散度を計測する動き計測手法を提案する。
次に、提案したメトリクスを使用して、アートフレームメトリクスのさまざまな状態を評価する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:57:22 GMT)
Training Kindai OCR with parallel textline images and self-attention feature distance-based loss [0.7] 並列画像対の自己意図的特徴間のギャップを最小限に抑えるために,距離に基づく目的関数を導入する。
本手法は,自己認識表現の識別品質を向上し,歴史文書のOCR性能を向上する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:01:32 GMT)
Reflective Homework as a Learning Tool: Evidence from Comparing Thirteen Years of Dual vs. Single Submission [0.6] 本研究は、コンピュータアーキテクチャコースから13年間の試験データを分析し、シングル・サブミッションとデュアル・サブミッションの宿題条件下での学生の成績を比較した。
その結果, 受験試験におけるT-テストのプール化は, 多数例で有意な改善が認められた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:04:15 GMT)
Coherent control of interacting solid-state spins below the diffraction limit [0.6] 固体中の光学的に処理された原子欠陥は、量子ネットワークアプリケーションのための単一光子源および記憶として広く利用されている。
希土類イオンは、その細い均一な光線幅が多数のエミッタの周波数領域分解を可能にするため、ユニークな解を提供する。
相互作用するEr$3+$イオン対のコヒーレント光とスピン制御と、近くの核スピン・アンシラを実証する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:52:24 GMT)
A Fully Device-Independent Ternary Quantum Key Distribution Protocol Based on the Impossible Colouring Game [0.6] 擬似テレパシーゲームにおいて, 量子鍵分布プロトコルを提案する。
このプロトコルは、コチェン=スペクターの定理の文脈性から生じるベルの不等式違反を利用する。
適切なセキュリティフレームワーク内で動作し、標準的な量子鍵分配方式と比較してキー生成率が改善されている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:49:12 GMT)
Context-based Motion Retrieval using Open Vocabulary Methods for Autonomous Driving [0.5] 本研究では,人間中心の多様なシナリオにおける自律走行システムの目標評価を支援する,コンテキスト認識型動き検索フレームワークを提案する。
提案手法は,WayMoCoデータセットで評価した場合,動作コンテキスト検索の精度を最大27.5%向上させる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:43:48 GMT)
Activation Steering for Bias Mitigation: An Interpretable Approach to Safer LLMs [0.5] 大規模言語モデル(LLM)は、社会システムにますます統合されている。
バイアスを軽減する従来の方法は、しばしばデータフィルタリングやポストホック出力のモデレーションに依存している。
我々は、機械的解釈可能性の手法を用いてバイアスを特定し、積極的に軽減する完全なエンドツーエンドシステムを導入する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:34:18 GMT)
DiffPhysCam: Differentiable Physics-Based Camera Simulation for Inverse Rendering and Embodied AI [0.5] DiffPhysCamは、ロボット工学と組み込みAIアプリケーションをサポートするために設計された、差別化可能なカメラシミュレータである。
異なるレンダリングにより、現実世界のシーンをデジタルツインとして逆復元することができる。
DiffPhysCamは、合成画像タスクにおけるロボット知覚性能を向上させる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:38:20 GMT)
A friendly guide to exorcising Maxwell's demon [0.5] マクスウェルの悪魔の誕生、生死は、熱力学、計算、情報の間の相互作用に関する深い議論を引き起こした。
このチュートリアルは、マックスウェルの悪魔とその永続的な影響を包括的に概観し、熱力学、情報理論、量子力学に関する現代の洞察で古典的な概念をブリッジする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:03:30 GMT)
Do Biased Models Have Biased Thoughts? [0.5] 本稿では,モデルが応答する前のステップが公正性に与える影響について考察する。
質問に答えるために、フェアネスメトリクスを使用して5ドルのポピュラーな大言語モデルで実験を行い、モデルの思考と出力における11ドルの異なるバイアスを定量化します。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:42:23 GMT)
Sound Signal Synthesis with Auxiliary Classifier GAN, COVID-19 cough as an example [0.5] 本稿では,Auxiliary Classification GAN (ACGAN) を用いて, 健常者および新型コロナウイルス患者の新しいMel Spectrogramを条件付きで生成する方法について述べる。
この作業は、トレーニングにおける予想される混乱と不整合を強調し、そのような欠点を検出し、対処するための洞察を提供する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:29:12 GMT)
READER: Retrieval-Assisted Drafter for Efficient LLM Inference [0.5] 大規模言語モデル(LLM)はトークンを自己回帰的に生成し、それぞれのトークンは前のコンテキストに依存する。
本稿では,テキスト中の自己繰り返しを活用することによって,モデルに基づくアプローチを強化する新しい投機的復号法READERを紹介する。
提案アルゴリズムは,統計的探索により得られたトークンを用いて投機的復号木を拡張する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:47:48 GMT)
PC-SRGAN: Physically Consistent Super-Resolution Generative Adversarial Network for General Transient Simulations [0.4] PC-SRGANは、解釈可能なシミュレーションのための物理的整合性を確保しながら、画像の解像度を向上させる。
我々はPC-SRGANのソースコードをhttps://github.com/hasan-rakibul/PC-SRGANで公開しています。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:08:49 GMT)
The Human-AI Hybrid Delphi Model: A Structured Framework for Context-Rich, Expert Consensus in Complex Domains [0.4] 本研究では,専門家のコンセンサス向上を目的としたHuman-AI Hybrid Delphi (HAH-Delphi) フレームワークの導入と評価を行う。
HAH-Delphiフレームワークは、高品質でコンテキストに敏感なコンセンサスを生成するためのフレキシブルでスケーラブルなアプローチを提供する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:24:19 GMT)
Learning Characteristics of Reverse Quaternion Neural Network [0.4] 本稿では,新しい多層フィードフォワード四元系ニューラルネットワークアーキテクチャ,リバース四元系ニューラルネットワークを提案する。
Reverse Quaternion Neural Networkは、既存のモデルに匹敵する学習速度を持ち、既存のモデルとは異なる回転表現を得ることができる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:58:19 GMT)
Decentralized Weather Forecasting via Distributed Machine Learning and Blockchain-Based Model Validation [0.3] 本稿では,フェデレートラーニング(FL)とブロックチェーン技術を統合する分散型天気予報フレームワークを提案する。
FLは、機密性の高いローカルデータを公開することなく、協調的なモデルトレーニングを可能にする。
システムのセキュリティをさらに強化するために,提案したモデルの信頼性を評価する評価に基づく投票機構を導入する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:25:34 GMT)
Simulating single-photon experiments with a quantum computer [0.3] 量子コンピュータを用いた実験室実験における光子の挙動をシミュレートする。
このシミュレーションは、計算量が増加するにつれて実際の物理システムをシミュレーションする上で、量子コンピュータがいかに効率的であるかについての洞察を与える。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:22:06 GMT)
Securing Educational LLMs: A Generalised Taxonomy of Attacks on LLMs and DREAD Risk Assessment [0.3] 本研究では,Large Language Models (LLMs) に対する50件の攻撃を一般化した分類法を提案する。
我々のリスクアセスメントは,eLLMに対するトークンの密輸,敵対的プロンプト,直接注入,多段階ジェイルブレイクが重要な攻撃であることを示している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:34:12 GMT)
Stokes Parameters and Dual Classical-Quantum Signaling [0.3] 本稿では,新しい同時量子古典通信プロトコルを提案する。
このプロトコルはセキュアな量子通信と高スループットの古典通信の共存を可能にする。
本稿では,プロトコルの詳細な数学的定式化と,その性能の理論的および数値的解析について述べる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:35:24 GMT)
DynaSwarm: Dynamically Graph Structure Selection for LLM-based Multi-agent System [0.3] DynaSwarmはマルチエージェントシステムを強化する動的フレームワークである。
グラフ構造を最適化するためにアクター-批判的強化学習機構を使用する。
また、動的グラフセレクタを持ち、各入力サンプルに対して最適なグラフ構造を適応的に選択する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:11:51 GMT)
A Brief Introduction to Quantum Query Complexity [0.3] 量子クエリ複雑性(quantum query complexity)は、量子アルゴリズムの計算能力を分析するモデルである。
本論文は, ハイブリット法, アッパー法, 記録法, 敵法という4つの主要な手法に焦点を当てる。
各手法は第一原理から開発され、標準問題を通して説明される。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:18:08 GMT)
Automatic and standardized surgical reporting for central nervous system tumors [0.3] 本研究で提示したパイプラインは、堅牢で自動化されたセグメンテーション、MRシークエンス分類、標準化されたレポート生成を可能にする。
提案したモデルとメソッドは、CNS腫瘍解析のためのオープンソースのソフトウェアプラットフォームであるRaidionicsに統合され、現在、手術後解析専用のモジュールを含んでいる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:08:49 GMT)
Load-Altering Attacks Against Power Grids: A Case Study Using the GB-36 Bus System Open Dataset [0.2] 負荷変動攻撃(LAA)は急激な周波数変動を引き起こし、電力グリッドを不安定にする可能性がある。
本稿では,グリッドオペレータがリリースしたオープンソースデータセットを用いて,学術研究と実践的応用のギャップを埋めることを目的とする。
英国国立電力システムオペレーター(NESO)がリリースしたイギリス(GB)-36ゾーンモデルについて、実世界の送信ネットワーク上での様々なLAAシナリオを調査した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:57:16 GMT)
LNN-PINN: A Unified Physics-Only Training Framework with Liquid Residual Blocks [0.2] LNN-PINNは、液体残留ゲーティングアーキテクチャを組み込んだ物理インフォームドニューラルネットワークフレームワークである。
4つのベンチマーク問題の中で、LNN-PINNはRMSEとMAEを同一の訓練条件下で一貫して削減した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:35:46 GMT)
ProtoECGNet: Case-Based Interpretable Deep Learning for Multi-Label ECG Classification with Contrastive Learning [0.2] ProtoECGNetは、解釈可能な多ラベルECG分類のためのプロトタイプディープラーニングモデルである。
PTB-XLデータセットから71の診断ラベルについてProtoECGNetを評価する。
ProtoECGNetは、プロトタイプ学習を複雑で多ラベルの時系列分類に効果的にスケールできることを示した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:32:08 GMT)
LyS at SemEval 2025 Task 8: Zero-Shot Code Generation for Tabular QA [0.2] 本稿では,SemEval 2025 Task 8への参加について述べる。
我々は,大規模言語モデルを利用して関連する情報を抽出できる機能コードを生成するゼロショットパイプラインを開発した。
その結果、ゼロショットコード生成はタブラルQAの有効なアプローチであり、テスト段階では53のランク33に達することがわかった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:25:31 GMT)
Keep Your Friends Close: Leveraging Affinity Groups to Accelerate AI Inference Workflows [0.2] 本稿では,アプリケーション固有のデータアクセス相関を簡単に表現できるアフィニティグルーピング機構を提案する。
実験では標準手法の限界を確認するとともに,作業負荷の増加とスケールアウトの増加に伴い,提案機構が大幅に低レイテンシを維持可能であることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:43:55 GMT)
CVCM Track Circuits Pre-emptive Failure Diagnostics for Predictive Maintenance Using Deep Neural Networks [0.2] 線路回路は鉄道の運行にとって重要であり、列車を見つけるための主要な信号線サブシステムとして機能している。
多くの障害は、時間とともに進化する微妙な異常として発生し、しばしば監視された信号では視覚的に見えなくなる。
本稿では,障害にエスカレートする前に,異常を適切に分類する予測保守フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:13:51 GMT)
Euclid Quick Data Release (Q1). Active galactic nuclei identification using diffusion-based inpainting of Euclid VIS images [0.1] 近年,日常的な物体のリアルな画像を生成するために拡散モデルが開発されている。
ソース選択やラベルを使わずに、100万のソースでトレーニングされた拡散モデルを作成します。
本研究では,各光源の中心画素を隠蔽し,拡散モデルに従って光を再構成することにより,中心光分布の予測を行う。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:29:17 GMT)
GRAVITY: A Controversial Graph Representation Learning for Vertex Classification [0.0] 本稿では,物体が魅力的な力で自己組織する物理システムに触発されたフレームワークであるGRAVITYを紹介した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:12:51 GMT)
Efficient and Effective Query Context-Aware Learning-to-Rank Model for Sequential Recommendation [0.0] 本稿では、クエリコンテキストの異なる戦略を因果言語モデリング手法で訓練された変換器に組み込む。
そこで本稿では,アイテムシーケンスをアテンションメカニズム内でクエリコンテキストと効果的に融合する手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:38:44 GMT)
Why Bohmian velocity might not be the only quantum velocity and the role of quantum diffusion flux is super-luminal wave packets [0.0] 私たちは、三田の論文から得られたいくつかの結果を簡潔に説明します。
我々の主な焦点は、超光波パケットの進化における拡散の役割である。
量子力学における浸透速度場の存在について、非常に簡単な議論がなされる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:16:58 GMT)
Weak measurement in strong laser field physics [0.0] 我々は, アト秒間干渉法実験を弱い測定とみなすことができることを示した。
特に、電子軌道がプロセスの弱い測定によって生じる新しい位相をどう捉えるかを示す。
このことは、アト秒量子干渉計実験の研究への道を開く。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:09:31 GMT)
Value Function Initialization for Knowledge Transfer and Jump-start in Deep Reinforcement Learning [0.0] 本稿では,価値関数の初期化を深層強化学習に適用するDQInitを紹介する。
DQInitは、以前に解決されたタスクから抽出されたコンパクトQ値を転送可能な知識ベースとして再利用する。
知識に基づくメカニズムを用いて、これらの伝達された値を未探索領域にソフトに統合し、徐々にエージェントの学習された推定値にシフトする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:32:08 GMT)
Unsupervised Document and Template Clustering using Multimodal Embeddings [0.0] 本稿では,クラスタリングアルゴリズムへの入力としてマルチモーダル埋め込みを活用することにより,教師なし文書クラスタリングへの新たなアプローチについて検討する。
本手法は,文書を型レベルでグループ化し,異なるテンプレートを区別することで,より詳細な文書理解を実現することを目的としている。
提案手法の有効性を,いくつかの最先端の事前学習型マルチモーダルモデルによって生成された埋め込みを用いて評価した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:55:34 GMT)
Unified framework for bosonic quantum information encoding, resources and universality from superselection rules [0.0] 量子光学状態を表現するための便利な方法は、場の単一モードの二次基底である。
本稿では,超選択規則に準拠したフレームワークが,すべてのボソニックエンコーディングに対して統一的な定式化を提供することを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:06:38 GMT)
Track Component Failure Detection Using Data Analytics over existing STDS Track Circuit data [0.0] この研究は「スマートトレイン検出システム」(STDS)と呼ばれる特定の交流トラック回路に焦点を当てている。
モデルは、より一般的な3つのカテゴリに属する15の障害を分類するように訓練された。
全てのユースケースは、その方法によって正しく分類された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:35:18 GMT)
Time inversion symmetry in the Dirac and Schrödinger-Pauli theories [0.0] 電子のディラック理論では、磁気秩序は非相対論的極限においても時間反転対称性を破る。
Schr"odinger-Pauli 理論では、時間反転対称性はスピン軌道結合がない状態で効果的に保存される。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:28:25 GMT)
The alloying of first-principles calculations with quasiparticle methodologies for the converged solution of the quantum many-electron states in the correlated compound Iron monoxide [0.0] 遷移金属酸化物の性質を研究するための様々な第一原理法に関するベンチマーク研究を行う。
本研究は、基底状態波動関数の精度と計算効率との理想的なトレードオフのための最適手法としてハイブリッド機能スキームを確立した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:48:31 GMT)
The Illusory Normativity of Rights-Based AI Regulation [0.0] 我々は、EUのAI規制を取り巻く権利に基づく物語が、その制度設計の論理を誤認していると論じる。
我々の目標は、アメリカのモデルを支持するのではなく、EUアプローチが規範的理想を反映しているという前提を拒絶することです。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 23:37:16 GMT)
The Bose-Hubbard polaron from weak to strong coupling [0.0] 不純物は 正方形格子に閉じ込められた ボゾン粒子の浴槽に浸された
入浴におけるボソン-ボソン相互作用の強度の異なるため, 不純物と浴粒子間の誘引的・反発的結合の機構を解析した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:25:49 GMT)
TempOpt -- Unsupervised Alarm Relation Learning for Telecommunication Networks [0.0] 通信ネットワークでは、ネットワークノードによって生成された障害警報をネットワーク操作センターで監視する。
監視プロセスは、アクティブアラーム分析、ルートアラーム識別、根本問題の解決などのタスクからなる。
本稿では,既存のアラーム関係学習手法-時間依存性手法の限界を克服し,実践的な新しい非教師付きアラーム関係学習手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:15:48 GMT)
Survival and Detection of Symmetry-Protected Topology in Loop Quenches [0.0] 対称性保護トポロジカルシステム(SPT)の研究に適した動的プロトコルのクラスを探索する。
ループクエンチでは、SPT相は平衡から外れても生き残ることができ、それによって保護対称性の動的違反を回避することができる。
我々のプロトコルはSPT位相の直接的動的シグネチャを発見し、さらに重要なのは、一般的な診断フレームワークの道を開くことである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:23:00 GMT)
Sub-Poissonian Light in a Waveguide Kerr-medium [0.0] 現代のチップ導波路は、誘導音響波上でのブリルアン散乱を抑制する高非線形性のために魅力的である。
置換カー状態の形でサブポアソン光を生成する導波路を解析した。
光子ノイズ抑制の程度は、波長数メートルの導波路において、100mWの光力を持つ5~15dBの値に達することが示されている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:53:30 GMT)
Statistical analysis of barren plateaus in variational quantum algorithms [0.0] 変分量子アルゴリズムにおけるバレンプラトー現象を統計的手法を用いて検討した。
第1のタイプは、私たちがローカライズドディップBP(Localized-dip BPs)と呼ぶもので、主に平坦だが勾配が大きいディップポイントを含む風景に現れる。
第2のタイプは、ローカライズ・ゴージ BP と呼ばれ、ローカライズ・ディップ BP と幾らか似ているが、ゴージ線を含んでいる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:08:33 GMT)
Special-Character Adversarial Attacks on Open-Source Language Model [0.0] 大規模言語モデル(LLM)は、様々な自然言語処理タスクで顕著なパフォーマンスを実現している。
キャラクタレベルの敵操作は、現実世界のデプロイメントにおいて重大なセキュリティ上の課題を示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:42:59 GMT)
Simultaneous control of populations and coherence phase of open two-level quantum systems with a single pulse [0.0] オープンな2レベル量子システムにおいて、集団とコヒーレンス相の両方のダイナミクスの制御に対処する。
システムの力学は、デフォーカスと熱雑音を考慮したマルコフのマスター方程式によって記述される。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 00:10:24 GMT)
Silicon Minds versus Human Hearts: The Wisdom of Crowds Beats the Wisdom of AI in Emotion Recognition [0.0] 本研究では,視力検査(RMET)とMRMET(MRMET)を用いた大規模言語モデル(MLLM)の感情認識能力の評価を行った。
その結果、MLLMは平均して、両方のテストで感情を正確に識別する上で、人間よりも優れています。
本稿では,これらの知見が感情知能AIシステムの開発にもたらす意味について論じる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:37:37 GMT)
Scalable, Technology-Agnostic Diagnosis and Predictive Maintenance for Point Machine using Deep Learning [0.0] ポイント・マシン(英: Point Machine、略称:PM)は、線路を切り替えて線路を切り替える鉄道機器である。
これまでの作業は、信号のセグメント化によるいくつかの入力とカスタム機能の開発に依存していた。
現在の最先端とは対照的に,本手法では1つの入力しか必要としない。
我々の手法は汎用的で技術に依存しないものであり、実環境およびテストベンチ環境の両方に展開されるいくつかの電気機械的PMタイプでスケーラブルであることが証明されている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:15:56 GMT)
Scalable Quantum Simulations of Scattering in Scalar Field Theory on 120 Qubits [0.0] 量子コンピュータ上での素粒子衝突のシミュレーションは、古典的手法よりも指数関数的に有利であることが期待されている。
本稿では,IBMの超伝導量子コンピュータibm_fezの120キュービットを用いて,1次元スカラー場理論におけるウェーブパケットの散乱をシミュレーションする。
量子シミュレーションにおいて、最大4924個の2量子ゲートと2量子ゲート深さ103の回路から有意義な結果の抽出を可能にする新しい手法が導入された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:28:05 GMT)
Scalable Fluxonium-Transmon Architecture for Error Corrected Quantum Processors [0.0] 本稿では,フラキソニウムとトランスモン量子ビットを交互に組み合わせたハイブリッド量子コンピューティングアーキテクチャを提案する。
アイドル状態におけるゼロゼロZ$-クロストークを特徴とする,優れたスケーリング特性を示す。
誤り訂正符号の実装には,フラクトロニウムの長いコヒーレンス時間と大きな非線形性をデータキュービットとして利用することができる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:20:05 GMT)
SPARC: Soft Probabilistic Adaptive multi-interest Retrieval Model via Codebooks for recommender system [0.0] 現在の多目的検索手法には3つの大きな課題がある。
オンライン推論では、通常過剰な戦略が採用される。
我々は,「ソフト確率適応検索モデル」という新しい検索フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:16:37 GMT)
Resurrecting the Salmon: Rethinking Mechanistic Interpretability with Domain-Specific Sparse Autoencoders [0.0] SAEトレーニングを適切に定義されたドメインに制限することは、ドメイン固有の機能へのキャパシティを再配置することを示します。
SAEは最大20%のばらつきを説明でき、損失回復率が向上し、線形残留誤差を低減できる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:45:10 GMT)
Redactable Blockchains: An Overview [0.0] 本報告では、リラクタビリティの導入動機について検討し、セキュアな編集を可能にする暗号プリミティブを調査し、競合するアプローチを分析する。
プライベートな設定で再実行可能なブロックチェーンの実践的な展開には特に注意が払われる。
報告書は、可逆コンピューティングに関するさらなる課題と、法に準拠し、信頼性があり、スケーラブルなデジタルインフラストラクチャを構築する上での、再現可能なブロックチェーンの将来の可能性について説明している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:40:28 GMT)
Reclaiming Constitutional Authority of Algorithmic Power [0.0] AIの統治はもはや技術的規制の問題ではない。
本条は、連帯権力と法的抵抗権に基づく憲法の枠組みを再構築する。
個人は、正統性や良心の領域を強要するシステムに抵抗する憲法上の権利を保有する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 23:46:30 GMT)
Recent Advances and Trends in Research Paper Recommender Systems: A Comprehensive Survey [0.0] この調査は、2021年11月から2024年12月までに開発されたリサーチペーパーレコメンダシステムの総合的な分析を提供する。
本報告では, 採用した技術とアプローチ, 活用したデータセット, 適用した評価指標と手順, 研究中に観察された持続的課題と創発的課題の両面について概観する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:36:41 GMT)
Realizing the Petz Recovery Map on an NMR Quantum Processor [0.0] 核磁気共鳴(NMR)量子プロセッサ上でのペッツ回収マップを,双対性量子コンピューティング(DQC)アルゴリズムを用いて実験的に実装した。
本研究は,現在の量子プラットフォームにおけるペッツ型リカバリマップの実現可能性を検証するとともに,その短期的誤差軽減戦略との関連性を明らかにするものである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:07:20 GMT)
Real Time Child Abduction And Detection System [0.0] 本稿では,マルチエージェントフレームワークを用いたエッジベースの児童退避検知・警告システムの開発について述べる。
システムはウェブカメラに接続されたRaspberry Pi上に展開され、ビデオフィードを処理できるエッジデバイスを形成する。
統合されたアラートシステムはTwilio APIを使用して、潜在的な児童誘拐イベントが検出された場合に、電話やメッセージを含むSMSとWhatsAppの通知を即時に送信する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:56:05 GMT)
RAGtifier: Evaluating RAG Generation Approaches of State-of-the-Art RAG Systems for the SIGIR LiveRAG Competition [0.0] LiveRAG 2025チャレンジでは、DataMorganaのQAペアの精度を最大化するためのRAGソリューションが検討されている。
このチャレンジは、Fineweb 10BTデータセットのスパースOpenSearchと密度の高いPineconeインデックスへのアクセスを提供する。
SIGIR 2025 LiveRAG Challengeでは, 正当性スコアが1.13, 忠実度スコアが0.55となり, 総合的に3位となった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:54:59 GMT)
Quantum stochastic analysis of non-linear driven light emission [0.0] 我々は、環境に結合した非線形駆動キャビティに対する量子ランゲヴィン方程式を解くことにより、開系力学を研究する。
メモリのない非構造環境において、強駆動キャビティの放射特性は高調波発生と非線形アンテナの過程に同型であることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:09:37 GMT)
Quantum scarring enhances non-Markovianity of subsystem dynamics [0.0] 量子スカーの存在は、サブシステムの力学の非マルコビアン性を実現し、強化する顕微鏡的な要素であることを示す。
これは量子スカーリングに関連する動的記憶に新しい光を放つ。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:38:04 GMT)
Quantum correction to the Langevin cross section in resonant-exchange processes [0.0] 共鳴交換散乱は、多体力学や輸送現象において重要な役割を果たす。
近年の研究では、位相シフトのロックが低エネルギーでの共鳴交換散乱の中心であることが示されている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:37:59 GMT)
Purcell-enhanced lifetime modulation of quantum emitters as a probe of local refractive index changes [0.0] フォトニック集積回路キャビティに埋め込まれた量子エミッタは、ナノスケールでの屈折率検出のためのスケーラブルなプラットフォームを提供する。
本稿では,エミッタの自発寿命のパーセル変調に基づくセンシング機構の提案と理論的解析を行う。
検出限界はQ = 105-107 のキャビティに対して 10-9 RIU まで低下し,プラズモニックおよびマイクロ共振器を簡易な計器で一致または超えた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:38:40 GMT)
Prompt-and-Check: Using Large Language Models to Evaluate Communication Protocol Compliance in Simulation-Based Training [0.0] 本稿では,オープンソースの大規模言語モデル(LLM)を用いたプロンプトベース推論を用いた軽量でデプロイ可能なアプローチについて検討する。
Prompt-and-Checkは,プロトコル内の各チェックリスト項目が満たされているかどうかを評価するために,コンテキストリッチなプロンプトを使用する手法である。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:35:57 GMT)
Prompt-Based Approach for Czech Sentiment Analysis [0.0] 本稿では、チェコにおけるアスペクトベースの感情分析と感情分類のための最初のプロンプトベースの手法を紹介する。
我々は、アスペクトベースのタスクを同時に解くためにシーケンス・ツー・シーケンスモデルを使用し、従来の微調整よりもプロンプトベースのアプローチの方が優れていることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:31:07 GMT)
Principles for Environmental Justice in Technology: Toward a Regenerative Future [0.0] 本稿では,社会・生態学的正義と集団繁栄に向けた技術開発を支援する枠組みであるEJIT原則を紹介する。
スピード、スケール、利益を優先する技術革新の一般的なモデルに対して、EJITの原則は、次のような選択肢を提供する。
我々は、環境正義、デザイン正義、ポストグロースコンピューティングの広い視野にEJITの原則を置き、それらを抽出デフォルトに抵抗し、人々や地球と相互に作用する技術システムを構想するための価値基盤として提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:18:25 GMT)
Parasitic RF-SQUIDs in superconducting qubits due to wirebonds [0.0] 超伝導量子ビットは、マイクロファブリック集積回路から実用的な量子コンピュータを実現することを非常に約束している。
しかし、その固体構造は、クビット材料の寄生モードと、クビットの脱コヒーレンスや干渉を引き起こす制御回路の負担を負っている。
ここでは、マイクロ回路に接触し、チップ・ツー・チップのエアブリッジを実現するために使用されるワイヤボンドが、寄生ジョセフソン接合を含む可能性があることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:31:11 GMT)
Parallel repetition of expanded, and multiplayer, Quantum games: anchoring, optimal values, generalized error bounds, dependency-breaking as symmetry-breaking [0.0] この研究はバイエルン語、ヴィディック語、ユアン語(約1509.07466)による観測に基づいている。
マルチプレイヤーの最適値である$omega big(G_bot big)otimes n$は指数関数的に減衰することを示した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 22:35:01 GMT)
Oscillator Algebra in Complex Position-Dependent Mass Systems [0.0] 複素はしご作用素と実等距離スペクトルを特徴とする非エルミート的位置依存質量ハミルトニアンを導入する。
対応するポテンシャル、はしご演算子、固有関数を導出する。
特殊ケースは二次的、コセノイド的、指数的質量関数に対して説明される。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:03:16 GMT)
Oscillating bound states in waveguide-QED system with two giant atoms [0.0] 一次元導波路に結合した2つの同一の2層巨大原子系の連続体(BIC)における境界状態について検討する。
一般的な暗黒状態条件を導出することにより、結合構成と原子パラメータが崩壊抑制にどのように影響するかを明らかにする。
これらの発見は、複数の巨大原子を持つ導波路量子電磁力学におけるBICの理解を前進させ、量子技術におけるそれらの将来的な応用を明らかにする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:52:50 GMT)
Optimizing Retrieval-Augmented Generation (RAG) for Colloquial Cantonese: A LoRA-Based Systematic Review [0.0] レビューは進歩を調べます。
PEFT(Efficient Fine-Tuning)は、Qwen3、DeepSeek、KimiといったRAG(Retrieval-Augmented Generation)システムを最適化する。
RAGシステムは、限られた注釈付きデータと言語的可変性のために、真正のカントン言葉表現の理解と生成に困難に直面している。
動的およびアンサンブルなLoRA適応は、方言文脈における検索精度と生成品質を犠牲にすることなく、トレーニング可能なパラメータを著しく削減する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:46:16 GMT)
ObfusQate: Unveiling the First Quantum Program Obfuscation Framework [0.0] ObfusQateは、古典的および量子的プログラムのセキュリティを強化するために、量子プリミティブを使用して難読化を行う新しいツールである。
我々は、量子回路レベルの難読化とコードレベルの難読化という2つの主要な難読化のカテゴリを設計、実装した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:28:03 GMT)
OSMa-Bench: Evaluating Open Semantic Mapping Under Varying Lighting Conditions [0.0] オープンセマンティックマッピング(OSM)は、セマンティックセグメンテーションとSLAM技術を組み合わせたロボット知覚における重要な技術である。
本研究は室内照明条件の異なる条件下での最先端意味マッピングアルゴリズムの評価に焦点をあてる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:44:48 GMT)
Neural quantum states for emitter dynamics in waveguide QED [0.0] 本稿では,時間依存型ニューラル量子状態(t-NQS)フレームワークをオープン量子系に拡張することにより,オープン量子系の力学を研究するための新しい数値計算法を提案する。
以上の結果から, t-NQS法は他の数値手法と競合することを示すとともに, オープン量子多体系を平衡から研究するためのt-NQSの可能性を明らかにする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:30:58 GMT)
Neural Artistic Style and Color Transfer Using Deep Learning [0.0] 神経芸術的スタイルと色伝達を組み合わせた手法を提案する。
この方法は、カラーおよび輝度ヒストグラムマッチングアルゴリズムを定量的に評価するために、Kullback-Leibler分散を用いる。
これらのアルゴリズムのKLと色ヒストグラムを、スタイルからコンテンツ転送のための様々な実験により評価した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:42:03 GMT)
Munsit at NADI 2025 Shared Task 2: Pushing the Boundaries of Multidialectal Arabic ASR with Weakly Supervised Pretraining and Continual Supervised Fine-tuning [0.0] 本稿では,弱教師付き学習と教師付き微調整を組み合わせたスケーラブルな学習パイプラインを提案する。
提案手法は,多言語アラビア語のASR課題において第1位にランクインし,最先端の成果を達成している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:02:22 GMT)
Multipartite quantum states over time from two fundamental assumptions [0.0] 時間とともに量子状態の概念を時間的に拡張し、時間的シナリオを多部化する方法を示す。
マルチパートQSOTとKirkwood-Dirac型準確率分布の正準対応性を確立する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:18:49 GMT)
Multi-Objective Bayesian Optimization with Independent Tanimoto Kernel Gaussian Processes for Diverse Pareto Front Exploration [0.0] 本稿では,新しい多目的ベイズ最適化アルゴリズムであるGP-MOBOを提案する。
提案手法は, スパース分子指紋の全次元を効率よく処理できる, Exact Gaussian Processs (GPs) のための, 高速で最小のパッケージを統合する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:27:36 GMT)
Microscopic analysis of above-threshold ionization driven by squeezed light [0.0] 本稿では、強い励起光の影響下でのATIを記述する微視的量子光学理論を提案する。
圧縮光は光と物質との結合を著しく促進し、古典的な運転よりも相互のバックアクションが重要であることを観察する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 22:40:17 GMT)
Macroscopic properties of high-harmonic generation from molecular ions [0.0] 我々は、既存のマクロなHHGの枠組みを拡張し、分子を顕微鏡入力として高精度なab initio計算と組み合わせた。
この手法はモロー側バンドを示すHHGスペクトルに適用され、非断熱力学の開殻分子に対して適用される。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:31:57 GMT)
Legal Zero-Days: A Novel Risk Vector for Advanced AI Systems [0.0] 違法ゼロデイズ(Legal Zero-Days)は、衝突前に訴訟やその他の手続きを必要とせず、即時かつ重大な社会的混乱を引き起こす可能性のある法的枠組みにおける未発見の脆弱性である。
我々は、これらの脆弱性を特定して評価するためのリスクモデルを示し、AIインシデントに対する保護や政府の対応を回避できる可能性を実証する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:43:00 GMT)
Large Language Models in the Data Science Lifecycle: A Systematic Mapping Study [0.0] 大規模言語モデル(LLM)は、多くのドメインにまたがるトランスフォーメーションツールとして登場した。
この体系的なマッピング研究は、データサイエンスライフサイクル全体を通してLLMの応用を包括的に検証する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 23:20:10 GMT)
Large Language Models Show Signs of Alignment with Human Neurocognition During Abstract Reasoning [0.0] 本研究では,大言語モデル(LLM)が抽象的推論中に人間の神経認知を反映するかどうかを検討する。
我々は,抽象パターン補完タスクにおいて,人体の性能と神経表現を8つのオープンソースLCMと比較した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:38:46 GMT)
Label Smoothing is a Pragmatic Information Bottleneck [0.0] 本研究は,情報ボトルネックの形でラベルスムーシングを再考する。
十分なモデルフレキシビリティを仮定し、同じ入力に対して競合するラベルが存在しないことを仮定し、ラベルスムーシングによって得られたモデル出力が情報のボトルネックの最適解を探索することを示した。
情報ボトルネック法として,ラベルの平滑化は,対象に関する情報を含まない要因や,他の変数に条件付けした場合に追加情報を提供しない要因に対して,非感受性を示すことも実験的に示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:50:23 GMT)
LLM-Driven Adaptive 6G-Ready Wireless Body Area Networks: Survey and Framework [0.0] 6G通信,ポスト量子暗号,エネルギー回収は,WBAN性能を向上させる可能性がある。
本稿では,Large Language Model が認知制御面として機能する,新しいLarge Language Model-Driven Adaptive WBANフレームワークを提案する。
このアプローチは、次世代モバイルヘルスアプリケーションに対して、超信頼性、セキュア、自己最適化のWBANを実現することを目的としている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 00:25:41 GMT)
Kernel Two-Sample Testing via Directional Components Analysis [0.0] 本稿では,カーネルHilbert空間(RKHS)において,よく見積もられた方向成分を同定し,利用するためのカーネルベースの2サンプルテストを提案する。
これらの方向に着目し、複数のカーネルにまたがる情報を集約することにより、特に高次元およびアンバランスなサンプル設定において、高いパワーとロバスト性を実現する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 02:04:55 GMT)
Investigating the Relationship between the Weighted Figure of Merit and Rosin's Measure [0.0] 2つの測度重みとロシンの測度は、一方が他方の代わりに使用できるように関連している。
重み付けされたメリットのフィギュアとロシンの測度に関する数学的公式を解析する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:02:24 GMT)
Integrating attention into explanation frameworks for language and vision transformers [0.0] 本研究は、注意重みに符号化された情報を利用して意味のあるモデル説明を提供する可能性について研究する。
自然言語処理とコンピュータビジョンタスクの両方に適用可能な2つの新しい説明手法を開発した。
標準ベンチマークに関する実証的な評価と、広く使われている説明手法との比較では、注目重みを研究対象のXAIフレームワークに有意義に組み込むことが可能であることが示されている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:31:22 GMT)
Hypervisor-based Double Extortion Ransomware Detection Method Using Kitsune Network Features [0.0] 本稿では, ランサムウェアの二重攻撃に使用される攻撃ステージ, 戦術, 手順, ツールについて述べる。
低レベルストレージとメモリの挙動特徴とネットワークトラフィック特徴を用いた新しい検出手法を提案する。
実験の結果,データ抽出位相検出率のマクロFスコアにおいて0.166向上した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:45:05 GMT)
Generative AI for Cybersecurity of Energy Management Systems: Methods, Challenges, and Future Directions [0.0] 本稿では,エネルギー管理システム(EMS)に特化して設計された広範囲なセキュリティフレームワークについて詳述する。
EMSデータ処理パイプライン全体の脆弱性を体系的に識別するために、包括的なマルチポイント攻撃/エラーモデルが提案されている。
GenAIベースの異常検出システムは、シナリオを扱うために、電力系統領域で初めて提案される。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:10:22 GMT)
Generative AI for Critical Infrastructure in Smart Grids: A Unified Framework for Synthetic Data Generation and Anomaly Detection [0.0] 本研究では、生成AI(GenAI)を活用して、ロバストな異常検出システム(ADS)を開発することによる変換的アプローチを提案する。
主な貢献は、GOOSEメッセージ用の合成およびバランスの取れたデータセットを生成するために提案されたAATM(Advanced Adversarial Traffic mutation)技術である。
The implementation of GenAI-based ADSs with the task-oriented dialogue (ToD) process has been investigated to improve detection of attack pattern。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:18:05 GMT)
Generalized Bicycle Codes with Low Connectivity: Minimum Distance Bounds and Hook Errors [0.0] 我々は,特定の一般化自転車(GB)符号の最小距離に対して,新しい上限と下限を提示する。
パラメータが$[[d2+1,2,d]]$ for odd $d geq 3$と$[d2,2,d]]$ for even $d geq 4$。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:03:59 GMT)
GTPO and GRPO-S: Token and Sequence-Level Reward Shaping with Policy Entropy [0.0] グループ相対政策最適化(GRPO)のようなアルゴリズムによる強化学習(RL)は、LLM推論を改善する。
本稿では,textbfDynamic Entropy Weightingを用いてこの問題を解決する。
私たちの中核的な考え方は、正しい応答における高エントロピートークンは、より高いパフォーマンスの天井に向かってポリシーを導くことができるということです。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:46:25 GMT)
GRainsaCK: a Comprehensive Software Library for Benchmarking Explanations of Link Prediction Tasks on Knowledge Graphs [0.0] 予測事実を説明する支援知識を同定することにより,この課題に対処する。
我々は,GRainsaCKを提案する。GRainsaCKは再利用可能なソフトウェアリソースであり,ベンチマーク記述に関わるすべてのタスクを完全に合理化する。
GRainsaCKは、簡単に置き換えられる関数としてメインコンポーネントを実装することで、モジュラリティ/拡張性を強化している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:15:58 GMT)
Forecasting Binary Economic Events in Modern Mercantilism: Traditional methodologies coupled with PCA and K-means Quantitative Analysis of Qualitative Sentimental Data [0.0] 本稿では,経済ナショナリズムの高まり,戦略的技術的疎結合,地政学的断片化を特徴とする現代メルカンティリズムを考察する。
768次元のSBERT生成セマンティック埋め込みに主成分分析を適用し、保護主義、技術的主権、ブロック認識に関連する二項事象の結果を識別する潜在因子を抽出する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:07:09 GMT)
Flow Battery Manifold Design with Heterogeneous Inputs Through Generative Adversarial Neural Networks [0.0] 生成モデルに適したトレーニングデータセットを構築するための体系的フレームワークを提案する。
ベイズ最適化と生成モデルを統合することで、許容可能な設計の潜在空間の解釈可能性を高めることができることを示す。
本研究は,システム設計における生成機械学習モデルの適用性を,品質と信頼性の向上により拡張する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:40:09 GMT)
Floquet Theory of lattice electrons coupled to an off-resonant cavity [0.0] 我々は、真空または古典的な光によって駆動されるオフ共振共振器モードに結合された電子に対して有効なハミルトニアンを導出する。
真空場の場合、量子揺らぎの直接の結果、長距離ホッピングと空洞による相互作用が生じることを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:45:17 GMT)
Fermi surface as a quantum critical manifold: gaplessness, order parameter, and scaling in $d$-dimensions [0.0] それらのギャップレス(次元)位相の性質に着目した$d$次元フェルミオンのモデルをいくつか検討する。
これは、分割関数の零点が実際のパラメータの範囲に達するとき、連続遷移として$T = 0$で発生する。
これらの零点は$(d-1)$-manifold of quantum criticality (Fermi surface) を定義する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:26:25 GMT)
Federated Learning: A Survey on Privacy-Preserving Collaborative Intelligence [0.0] フェデレートラーニング(FL)は、分散機械学習の分野における変革的パラダイムとして登場した。
この調査は、フェデレートラーニングの簡潔かつ包括的概要を提供する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:47:22 GMT)
FUTransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation [0.0] 糖尿病性足潰瘍 (DFUs) の自動分節は, 臨床診断, 治療計画, 縦断的創傷モニタリングにおいて重要な役割を担っている。
従来の畳み込みニューラルネットワーク(CNN)は、強力なローカライゼーション機能を提供するが、長距離空間依存のモデル化に苦慮している。
視覚変換器(ViT)のグローバルアテンション機構をU-Netフレームワークに統合するハイブリッドアーキテクチャであるFUTransUNetを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:47:00 GMT)
Explainable Graph Spectral Clustering For Text Embeddings [0.0] 本稿では,文書の類似性を項ベクトル空間におけるコサイン類似性として計算することを考えると,テキスト文書に対するグラフスペクトルクラスタリング結果の説明可能性について紹介する。
本稿では,他の文書の埋め込み,特にGloVe埋め込みの考え方に基づいて,このアイデアを一般化する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:20:27 GMT)
Expanding a 4-qubit Dicke State to a 5-qubit Dicke State with Limited Qubit Access [0.0] 4量子ディック状態を作成するための効率的な方法を提案し、次に4量子ディック状態が5量子ディック状態にどのように拡張できるかを示す。
制限制御下でこの変換を実現する量子回路を提案し,数値解析による解析的導出を支援する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 07:24:18 GMT)
Evasive Ransomware Attacks Using Low-level Behavioral Adversarial Examples [0.0] 本稿では,低レベルの行動逆例の概念と回避型ランサムウェアの脅威モデルを紹介する。
本手法と脅威モデルを定式化し,回避マルウェアの最適なソースコードを生成する。
次に,マイクロビヘイビア制御機能を備えたContiランサムウェアのソースコードをリークした手法について検討する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:45:28 GMT)
Enhancing Wide-Angle Image Using Narrow-Angle View of the Same Scene [0.0] シーンを撮影する際の一般的なジレンマは、より広い角度で撮影するかどうかであり、より多くのシーンをカバーできるが、より細部は少ないか、あるいはより細部を捉えながらシーンの一部を残すような狭い角度でクリックすることができる。
広視野レンズ(FoV)と狭視野レンズ(FoV)の両方を用いて同じシーンを撮影することにより、通常、一次レンズが捉えた画像と関連する、より精細な画質の細かなショットを注入する新しい手法を提案する。
我々はGAN(Generative Adversarial Network)に基づくモデルを用いて、狭い角度から視覚的品質パラメータを抽出することを学ぶ。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 00:42:42 GMT)
Enhancing Deep Hedging of Options with Implied Volatility Surface Feedback Information [0.0] 本稿では,S&P500 オプションに対する動的ヘッジ方式を提案する。
最適なヘッジ戦略は、ディープポリシー勾配型強化学習アルゴリズムによって得られる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:34:19 GMT)
Energy dynamics in a class of local random matrix Hamiltonians [0.0] 近辺のランダム行列項を1乗に二乗した数体および1次元鎖におけるエネルギーの輸送について検討する。
少数だが大きな局所ヒルベルト空間次元の場合、エネルギー力学を単一粒子ホッピング図形にマッピングする。
1D鎖では、小さな局所ヒルベルト空間次元のエネルギー輸送を数値的に研究する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:53:53 GMT)
Emergence: from physics to biology, sociology, and computer science [0.0] 創発は凝縮した物理物質、カオス系、流体力学、核物理学、量子重力、ニューラルネットワーク、タンパク質の折り畳み、社会的分離の中心である。
究極的な目標は創発的特性の設計と制御である。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:24:17 GMT)
Effects of finite trapping on the decay, recoil, and decoherence of dark states of quantum emitter arrays [0.0] 有限トラップ強度と光媒介力が1次元導波路または自由空間における2, 3, 多くの原子の高放射能励起状態に及ぼす影響
量子情報ストレージの場合、これらの発見は幾何学と偏光の最適配列構成を示唆している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:43:51 GMT)
Dynamic Survival Prediction using Longitudinal Images based on Transformer [0.0] 本稿では,SurLonFormerについて紹介する。これはトランスフォーマーをベースとした新しいニューラルネットワークで,縦型医用画像と構造データを組み合わせて生存予測を行う。
本アーキテクチャは,特徴を抽出するビジョン,空間的時間的情報を集約するシーケンス,Cox比例ハザードモデルに基づくサバイバルの3つの重要な構成要素から構成される。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:31:55 GMT)
DriveIndia: An Object Detection Dataset for Diverse Indian Traffic Scenes [0.0] DriveIndiaは、インドの交通環境の複雑さと予測不可能性を捉えるために構築された、大規模なオブジェクト検出データセットである。
データセットには、24のトラフィック関連オブジェクトカテゴリにわたるYOLOフォーマットで注釈付けされた66,986の高解像度イメージが含まれている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:06:27 GMT)
Distributional Sensitivity Analysis: Enabling Differentiability in Sample-Based Inference [0.0] 任意の次元のランダムベクトルの与えられた実現時の感度を推定するための2つの解析式を提案する。
最初の式は、この感度を 1-次元条件分布のベクトルに付随する逆写像の部分微分として解釈する。
第2の式では対角近似を導入し、計算コストをある程度の精度で削減する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:21:45 GMT)
Distilling Reinforcement Learning into Single-Batch Datasets [0.0] 蒸留は、強化学習環境を1バッチの教師付き学習データセットに蒸留することにより、様々なタスクに一般化可能であることを実証する。
このことは、蒸留が強化学習タスクを圧縮する能力だけでなく、ある学習モダリティを別の学習モダリティに変換する能力も示している。
本稿では,メタラーニングのためのポリシ最適化を新たに拡張し,従来のカートポール問題の多次元拡張の蒸留に利用する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:42:45 GMT)
Displaced Janus States: Tunable Non-Gaussianity and Exact Higher-Order Coherences for Quantum Advantage [0.0] 非ガウス状態は、連続可変(CV)情報処理において量子優位を達成するために不可欠である。
2つの圧縮されたコヒーレント状態のコヒーレント重ね合わせとして、変位したJanus状態の正確な解を導入し、提供する。
これにより、状態のチューニング不可能な非ガウス性を完全に評価することができ、量子干渉がその成分の極端光子束を強力な反バンチまたは完全多光子抑制に変換する方法を明らかにすることができる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:03:37 GMT)
Discovery of energy landscapes towards optimized quantum transport: Environmental effects and long-range tunneling [0.0] キャリア輸送を最適化するエネルギープロファイルを持つ準1次元鎖のクラスを同定する。
本研究では,一元的・非単元的(軽蔑的・消散的)な影響下でのシステムの挙動について検討した。
解析の結果,チェーン内のトンネル間結合が短距離か長距離かによって異なる種類のエネルギーランドスケープが輸送を促進することが明らかとなった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:59:42 GMT)
Digital Quantum Simulation of Flat-Band and All-Bands-Flat Dynamics for Tunable Quantum Transport [0.0] デジタル量子コンピュータを用いて、フラットバンド(FB)およびオールバンドフラット(AFB)格子のダイナミクスについて検討する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:27:17 GMT)
Detection of Odor Presence via Deep Neural Networks [0.0] 臭気検出は食品の安全性、環境モニタリング、医療診断、その他多くの分野を支えている。
複雑な混合物と非侵襲的な記録との匂い検出のための現在の人工センサは、信頼できる単一心房細動を欠いている。
本稿では,多チャンネル嗅球LFPから匂いの存在を復号する1次元畳み込みネットワーク(ResCNNとAttentionCNN)のアンサンブルを提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:14:24 GMT)
Designing a Feedback-Driven Decision Support System for Dynamic Student Intervention [0.0] 本稿では,連続モデル改良を実現するクローズドループアーキテクチャを用いたフィードバック駆動決定支援システム(DSS)を提案する。
このシステムはLightGBMベースの回帰器とインクリメンタルリトレーニングを採用しており、教育者は更新された生徒のパフォーマンスデータを入力できる。
その結果、再トレーニング後のRMSEは10.7%減少し、介入を受けた学生の予測スコアは一貫して上向きに調整された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:20:46 GMT)
Demonstration of a photonic time-frequency Fourier transform and temporal double slit using atomic quantum memory [0.0] 2つの確立された量子メモリプロトコルを組み合わせたインメモリフーリエ変換を実演する。
我々の実験は、長い磁気光学トラップでレーザー冷却されるルビジウム原子のアンサンブルを用いて実現された。
時間分離パルス間の干渉は、光のパルス間の相対位相と時間に依存する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:05:03 GMT)
DYNARTmo: A Dynamic Articulatory Model for Visualization of Speech Movement Patterns [0.0] DYNARTMOは,2次元中矢状平面における音声の調音過程を可視化する動的調音モデルである。
このモデルは、UK-DYNAMOフレームワークに基づいて構築され、調音的不特定性、分節的およびジェスチャー的制御、協調の原理を統合している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:56:45 GMT)
Cross-BCI, A Cross-BCI-Paradigm Classifica-tion Model Towards Universal BCI Applications [0.0] 本研究では,クロスBCIパラダイム分類のための軽量で統一化された復号モデルを提案する。
その結果,提案モデルは精度,マクロ精度,マクロロリコール,マクロF1スコアに対して88.39%,82.36%,80.01%,0.8092を達成した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:04:50 GMT)
Correlators in phase-ordering from Schrödinger-invariance [0.0] 位相秩序運動学を経る系は、完全に乱れた初期状態から0TT_c$の順序相へのクエンチ後に位相秩序運動学を行う。
雑音の初期条件によって決定される1時間と2時間の相関子の長時間の挙動は、シュル「オーディンガー不変性」から導かれる。
完全有限系と大域相関系のスケーリングを見つけ、低温の一般化 $lambda = d-2 ヤンセン=シャウブ=シュミットマンスケーリング関係の値が導出される。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:30:26 GMT)
Control of nonlinear Compton scattering in a squeezed vacuum [0.0] 我々は、強いレーザー場における電子の放射を真空状態によって制御するための量子光学的枠組みを導入する。
放射モードの量子揺らぎをエンジニアリングすることにより、非線形コンプトン散乱の確率が著しく向上または抑制できることを実証する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:37:06 GMT)
Closer look at sum uncertainty relations and related relations [0.0] 量子系の状態のヒルベルト空間におけるベクトルのノルムの不等式から続く様々な不確実性関係の弱かつ臨界点を解析する。
ハイゼンベルク・ロバートソンの不確実性関係に現れる標準偏差の積の上界が存在することを示す。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:43:21 GMT)
Classifying Cool Dwarfs: Comprehensive Spectral Typing of Field and Peculiar Dwarfs Using Machine Learning [0.0] 低質量星と茶色の小星の分類。
機械学習(ML)手法の最近の進歩は、スペクトルタイピングのための自動アプローチを提供する。
我々は,M0--T9小星の低分解能近赤外スペクトルに対するスペクトル型分類におけるMLの適用について検討した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:58:55 GMT)
Classification of three-qubit genuine entangled states using concurrence fill [0.0] 我々は、純状態の真の多部絡み合いを定量化する、共起充填(concurrence fill)と呼ばれる幾何測度を用いる。
我々は、3つの三角形が0個のポリトープ上で消えることが知られている状態のGHZクラスとWクラスを分類する。
我々は、対応する混合物の固有状態に対する共起充填を導出し、その上界が零な混合状態に対して得られる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:58:11 GMT)
Chi-Geometry: A Library for Benchmarking Chirality Prediction of GNNs [0.0] Chi-Geometryは、GNNのキラリティを予測する能力のテストとベンチマークのためのグラフデータを生成するライブラリである。
Chi-Geometryは、グラフサンプルのキラリティーを予測するために、GNNのより解釈可能でコンバウンディングの少ないベンチマークを可能にする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 17:24:56 GMT)
Characterization of the optical response from variant InGaN nanowires emitting within the green spectral gap [0.0] InGaNナノワイヤ(NWs)の形態,構造,光学特性を詳細に解析する。
本研究は, インジウム組成不均一性とNWsの発光特性の相関性について検討した。
これらの知見は、成長条件の最適化、色精度の向上、NWの光学効率の向上に寄与し、次世代の高性能LEDや光エレクトロニクスデバイスの可能性を強調している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 14:40:28 GMT)
Characterization and generation of a SQL-beating cat-like state through repetitive measurements [0.0] ハイゼンベルク制限スケーリングは一般化された猫状態によって達成できる。
マクロコヒーレンスを示すインデックス$q$を用いて猫のような状態を特徴付ける。
我々の結果は、絡み合いの強い量子メートル法の実現の道を開く。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:31:39 GMT)
Causal Machine Learning for Patient-Level Intraoperative Opioid Dose Prediction from Electronic Health Records [0.0] OPIAIDは、個別の患者に対してパーソナライズされたオピオイド量を予測するための機械学習アルゴリズムである。
本稿では,アルゴリズムの方法論とアーキテクチャを概説し,重要な仮定と性能評価へのアプローチについて述べる。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:20:04 GMT)
Case Studies: Effective Approaches for Navigating Cross-Border Cloud Data Transfers Amid U.S. Government Privacy and Safety Concerns [0.0] 本研究は,ある国から別の国への情報交換が与える影響と,これらの取引における法的・技術的影響を説明することを目的とする。
クラウド技術の出現により、各国間の自由な情報交換の可能性は急速に高まっている。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 01:35:07 GMT)
Can We Trust AI to Govern AI? Benchmarking LLM Performance on Privacy and AI Governance Exams [0.0] オープンおよびクローズドな大言語モデル(LLM)を10種類評価する。
以上の結果から,複数のフロンティアモデルにおいて,専門家の認定基準を超えるスコアが連続的に達成されることが示唆された。
本稿では,AIの進歩と規制リスクの交差をナビゲートする専門家について概説する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 15:57:22 GMT)
Can AI Keep a Secret? Contextual Integrity Verification: A Provable Security Architecture for LLMs [0.0] 我々は、暗号的に署名されたラベルを全てのトークンにアタッチする、既定のセキュリティアーキテクチャであるContextual Integrity Verification (CIV)を提示する。
CIVは、凍結したモデルに対して、前兆かつトーケン毎の非干渉保証を提供する。
Llama-3-8BとMistral-7Bのドロップイン保護を実証した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 18:47:30 GMT)
Bridging Theory and Practice in Quantum Game Theory: Optimized Implementation of the Battle of the Sexes with Error Mitigation on NISQ Hardware [0.0] 我々は,IBM Quantumのibm シャーブルック超伝導プロセッサ上でのセクシーズの戦いを初めて実験的に実現した例の1つを提示する。
本稿では,実時間トポロジとキャリブレーションデータに基づいて,キュービットペアを動的に選択し,ルーティングを最適化するガイド回路マッピング(GCM)手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:10:05 GMT)
Bose-Einstein condensate sub-wavelength confinement via superoscillations [0.0] サブ波長閉じ込めは青色変調光学格子で達成できる。
スーパーオシレーションは、青色変調光学格子におけるサブ波長BEC閉じ込めへの有効な経路である。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 23:14:52 GMT)
Blink-to-code: real-time Morse code communication via eye blink detection and classification [0.0] 本研究では、随意点滅をモース符号に変換するリアルタイムシステムを提案する。
このシステムは、瞬きを短い(ドット)または長い(ダッシュ)として検出し、分類し、その後、それらを英数字の文字に復号する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:07:28 GMT)
Bhav-Net: Knowledge Transfer for Cross-Lingual Antonym vs Synonym Distinction via Dual-Space Graph Transformers [0.0] 複数の言語にまたがる同義語対同義語は独自の計算課題を呈している。
この研究は、効果的な知識伝達を可能にする新しいデュアルスペースアーキテクチャであるBhav-Netを導入している。
提案手法では,言語固有のBERTエンコーダとグラフトランスフォーマーネットワークを組み合わせることで,セマンティックなプロジェクションを生成する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 20:34:23 GMT)
Beyond Autocomplete: Designing CopilotLens Towards Transparent and Explainable AI Coding Agents [0.0] CopilotLensは、シンプルな提案から透過的で説明可能なインタラクションにコード補完を再構築する、インタラクティブなフレームワークである。
CopilotLensは、動的で2段階のインターフェースを通じてAIエージェントの"思考プロセス"を再構築する説明レイヤとして機能する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:16:16 GMT)
Aryabhata: An exam-focused language model for JEE Math [0.0] インド学術試験(JEE)に最適化されたコンパクトな7Bパラメータ数学推論モデルを提案する。
Aryabhata 1.0は、強力なオープンウェイト推論モデルと、教師付き微調整(SFT)と、検証されたチェーンオブソートトレースのカリキュラムを融合して構築されている。
私たちはAryabhataを、試験中心のオープンソースの小言語モデルを前進させるための基礎モデルとしてリリースします。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 06:20:07 GMT)
Approximating Entanglement Based on Abstract Interpretation [0.0] 絡み合いは量子システムの基本的な性質であり、非自明な量子プログラムに必須である。
本稿では,既存の抽象解釈を拡張して,絡み合いを近似する静的解析手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:15:40 GMT)
An Empirical Inquiry into Surveillance Capitalism: Web Tracking [0.0] 本稿では,Web追跡データのパターンと傾向を分析し,Surveillance Capitalismの抽出メカニズムの実証的証拠を確立する。
われわれの発見によると、GoogleのWeb上の全面的な位置、監視分野の企業間の3層構造、そして検出を回避するための追跡技術の進化を示す証拠が明らかになった。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:52:53 GMT)
Adaptive Informed Deep Neural Networks for Power Flow Analysis [0.0] 本研究では,PF解析のためのエンドツーエンドディープラーニングアーキテクチャであるPINN4PFを紹介する。
このアーキテクチャは、大規模近代電力システムの非線形ダイナミクスを効果的に捉えている。
その結果、PINN4PFは全てのテストシステムで両方のベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 08:00:45 GMT)
Accelerated Volumetric Compression without Hierarchies: A Fourier Feature Based Implicit Neural Representation Approach [0.0] 本稿では,Fourierfeatureエンコーディングと選択的ボキセルサンプリングを組み合わせた構造自由なニューラル圧縮手法を提案する。
我々の動的ボクセル選択は、形態的拡張を用いて活動領域を優先順位付けし、階層的なメタデータを使わずに冗長な計算を減らします。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 13:43:07 GMT)
AME: Aligned Manifold Entropy for Robust Vision-Language Distillation [0.0] ロバストビジョンランゲージ蒸留のための配向マニフォールドエントロピーは、実世界の条件下で堅牢な一般化を達成することを目的としている。
AMEは再構成された共有多様体に対してエントロピー最小化を適用し、マルチモーダルデータは一対の射影関数を通してブリッジされる。
様々な視覚言語による蒸留フレームワークと互換性のあるプラグアンドプレイモジュールとして機能する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:16:00 GMT)
A new dataset and comparison for multi-camera frame synthesis [0.0] 我々は、カスタムに構築された高密度リニアカメラアレイを用いて、新しいマルチカメラデータセットを開発する。
我々は,古典的・深層学習フレーム補間器をビュー・イン・ビュー・イン・ビューニングのためのビュー・シンセサイザー法と比較した。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 16:37:30 GMT)
A Symmetry-Based Taxonomy of Quantum Algorithms [0.0] 本稿では,量子状態空間の連続的および離散的,基礎となる量子状態空間,オーラクル,回路力学といった基本対称性を基礎とした量子アルゴリズムの分類法を提案する。
この対称性中心の分類は、物理学における対称性と保存法則の深い関係を反映するだけでなく、スケーラブルで信頼性の高い量子計算に実用的な利点をもたらす。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:08:43 GMT)
A Stream Pipeline Framework for Digital Payment Programming based on Smart Contracts [0.0] 本稿では, DLT 上での支払いプログラムのための, 斬新で汎用的な手法を提案する。
デジタル通貨をトークンストリームに変換し、スマートコントラクトをパイプライン化し、ソースからターゲットアカウントへ効率的にストリームを承認、集約、ロック、ダイレクト、ディスパッチする。
このアプローチは、支払いプログラムのコストを大幅に削減し、セキュリティ、自己強化、適応性、制御性を高めます。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 03:58:19 GMT)
A Robust Epipolar-Domain Regularization Algorithm for Light Field Depth Estimation [0.0] 本稿では,光場に基づく不均質情報と有向ランダムウォーク補正アルゴリズムを統合する軽量深度推定パイプラインを提案する。
従来のCNNベースの手法とは異なり、我々の手法は広範囲のトレーニングや大規模なデータセットを必要とせず、深度マップの一貫性を向上させる。
実験の結果、制御されていない条件下では性能はわずかに低下するが、アルゴリズムは低い計算複雑性と競争精度を維持している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 12:41:47 GMT)
A Parametric Bi-Directional Curvature-Based Framework for Image Artifact Classification and Quantification [0.0] 本研究は,方向画像の曲率解析に基づく非参照画像品質評価(NR-IQA)のための新しいフレームワークを提案する。
この枠組みでは、2つの可変しきい値を用いて画素レベルで計算されるAnisotropic Texture Richness (ATR) の尺度を定義する。
パラメータが特定のアーティファクトに最適化された場合、ATRスコアは高性能な品質指標として機能する。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 10:29:59 GMT)
A Hardware-oriented Approach for Efficient Active Inference Computation and Deployment [0.0] 本研究は, pymdp の柔軟性と効率性を, ハードウェア効率に最適化された, 疎結合な計算グラフに統合することにより, AIF の展開を促進する手法を提案する。
当社のアプローチでは,2倍以上のレイテンシとメモリを最大35%削減し,リアルタイムおよび組み込みアプリケーションに効率的なAIFエージェントをデプロイする。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 09:39:46 GMT)
A Fast Unsupervised Scheme for Polygonal Approximation [0.0] 本稿では,閉ディジタル曲線の多角形近似のための高速かつ教師なしのスキームを提案する。
近似スキームは最先端の近似よりも高速であり,ロシンの測度や審美的側面と競合することが実証された。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 05:44:15 GMT)
A Deep Learning-Based CCTV System for Automatic Smoking Detection in Fire Exit Zones [0.0] 防火エリアのCCTV監視のためのリアルタイム喫煙検知システムを提案する。
データセットには、20のシナリオから8,124の画像と、低照度領域を示す2,708のサンプルが含まれている。
提案されたモデルは他のモデルよりも優れ、78.90%、mAPは83.70パーセントの50パーセントでリコールされた。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 19:27:17 GMT)
A DNN Biophysics Model with Topological and Electrostatic Features [0.0] このモデルは、タンパク質の構造情報と力場によって生成される多スケールおよび均一なトポロジカルおよび静電気的特徴を使用する。
4000以上のタンパク質構造上の機械学習シミュレーションは、これらの特徴の効率性と忠実さを示している。
このモデルは、生物物理学的性質と幅広い生体分子の機能予測を支援する一般的なツールとしての可能性を示している。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 04:52:10 GMT)
A Complexity-Based Approach to Quantum Observable Equilibration [0.0] 孤立量子系における平衡を割り当てる統計複雑性尺度の役割について検討する。
我々は、量子状態の複雑さがどのように進化するかを研究するために分析を拡張し、初期コヒーレンスから平衡への遷移についての洞察を与える。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 21:10:51 GMT)
A Broadband Squeezed Light Source for Table-Top Interferometry [0.0] 量子宇宙時間(QUEST)実験のために開発された2つのブロードバンド励起光源の1つの特性について報告する。
QUESTは、静止時変動を調査するために設計された1組のテーブルトップ、電力リサイクルミシェルソン干渉計で構成されている。
圧縮光源は, 波長43.6mm, 直線幅138MHzの半石器式OPAをベースとし, 長期動作に適した広帯域デバイスである。
論文参考訳(メタデータ) (Tue, 12 Aug 2025 11:31:27 GMT)