A Closer Look at Conditional Prompt Tuning for Vision-Language Models [157.2] そこで我々は,TCI条件付きプロンプトをベースクラスから学習することで,チューニングされたモデルを新しいクラスに迅速に適応できるクラス適応型プロンプトチューニング(CaPT)を提案する。
CaPTは5つの強い非条件のPTベースラインの性能を、追加の計算コストで一貫して改善する。
また,DeCaPTと呼ばれる新しい条件付きPT手法を考案し,現状の条件付きPT方式のH ACCを3.49%向上させた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:51:20 GMT)
The Singapore Consensus on Global AI Safety Research Priorities [128.6] 2025年シンガポールAI会議(SCAI: International Scientific Exchange on AI Safety)は、この分野での研究を支援することを目的としている。
ヨシュア・ベンジオが議長を務める国際AI安全レポート(AI Safety Report)は、33の政府によって支援されている。
レポートは、AI安全研究ドメインを3つのタイプに分類する。信頼に値するAIシステム(開発)作成の課題、リスク評価の課題(評価)、デプロイメント後の監視と介入の課題(会議)。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:04:58 GMT)
The Illusion of Progress? A Critical Look at Test-Time Adaptation for Vision-Language Models [120.4] TTA-VLMは、視覚言語モデル上でのTTA手法を評価するための総合的なベンチマークである。
筆者らのベンチマークでは, 統合的かつ再現可能なフレームワーク内に8つのエピソードTTAと7つのオンラインTTAメソッドを実装した。
我々は、SigLIP(Sigmoid Lossで訓練されたモデル)の評価を拡張し、一般性を評価するためのCoOp、MaPLe、TeCoAなどの訓練時間チューニング手法を含む。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:05:55 GMT)
Scaling Inference-Time Search with Vision Value Model for Improved Visual Comprehension [95.6] 視覚価値モデル(VisVM)は、VLM推論時間探索をガイドして、より良い視覚的理解で応答を生成する。
本稿では、VLM推論時間探索をガイドし、視覚的理解を向上した応答を生成するVisVMを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:29:34 GMT)
Outlier Weighed Layerwise Sparsity (OWL): A Missing Secret Sauce for Pruning LLMs to High Sparsity [88.6] 大規模言語モデル(LLM)は、様々な領域にわたる顕著なパフォーマンスで有名である。
本研究では,不均一層幅比の調整を施した新しいLCMプルーニング手法について紹介する。
OWL は、最先端の Wanda と SparseGPT を 61.22 で上回り、6.80 パープレキシティを 70% で上回っている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 22:16:39 GMT)
Thinking with Images for Multimodal Reasoning: Foundations, Methods, and Future Frontiers [88.0] 同様の進化がAIで展開され、単にイメージについて考えるモデルから、イメージについて真に考えるモデルへのパラダイムシフトを象徴している。
この新たなパラダイムは、視覚情報を思考過程の中間ステップとして活用するモデルによって特徴づけられ、視覚を受動的に操作可能な認知ワークスペースに変換する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:48:35 GMT)
Federated Learning-Enabled Hybrid Language Models for Communication-Efficient Token Transmission [87.7] ハイブリッド言語モデル(HLM)は、エッジデバイス上でのSLM(Small Language Model)の低レイテンシ効率と、集中型サーバ上でのLLM(Large Language Model)の高精度を組み合わせたものである。
我々は、不確実性を考慮した推論とフェデレートラーニング(FL)を統合する通信効率の高いHLMフレームワークであるFedHLMを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:56:11 GMT)
The Automated LLM Speedrunning Benchmark: Reproducing NanoGPT Improvements [87.6] 科学的進歩への重要な能力は、既存の作品を再現する能力である。
アクティブな研究領域においてAIエージェントが結果を再現する能力を評価するために,自動LLM高速化ベンチマークを導入する。
最近のLSMとSoTAの足場を組み合わせると、ベンチマークですでに知られているイノベーションを再実装するのに苦労していることが分かりました。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:56:29 GMT)
Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.9] 不確実性定量化は機械学習アプリケーションにおいて重要な要素である。
最新のUQベースラインの集合を実装した新しいベンチマークを導入する。
我々は、11タスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も効果的なアプローチを特定した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:15:07 GMT)
Robust Representation Consistency Model via Contrastive Denoising [83.5] ランダムな平滑化は、敵の摂動に対する堅牢性を証明する理論的保証を提供する。
拡散モデルは、ノイズ摂動サンプルを浄化するためにランダムな平滑化に成功している。
我々は,画素空間における拡散軌跡に沿った生成的モデリングタスクを,潜在空間における識別的タスクとして再構成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:02:47 GMT)
A Survey of Quantum Transformers: Architectures, Challenges and Outlooks [82.5] 量子変換器は古典変換器の表現力と量子コンピューティングの計算上の利点を統合する。
2022年以降、この地域の研究は急速に拡大し、様々な技術パラダイムや初期の応用がもたらされた。
本稿では,量子トランスモデルの包括的,体系的,詳細な調査を行う。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:02:23 GMT)
How large language models judge and influence human cooperation [82.1] 我々は、最先端の言語モデルが協調行動をどのように判断するかを評価する。
我々は、善良な相手との協力を評価する際、顕著な合意を守ります。
モデル間の差異が協調の頻度に大きく影響を及ぼすことを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:14:42 GMT)
Generative Intervention Models for Causal Perturbation Modeling [80.7] 多くの応用において、システムのメカニズムが外部の摂動によって変更されるかは未定である。
本稿では、これらの摂動特徴を原子間干渉による分布にマッピングする方法を学習する生成的介入モデル(GIM)を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:38:56 GMT)
From Diffusion to Transformers: A Unified Framework for Neural Message Passing [79.9] メッセージパッシングニューラルネットワーク(MPNN)は、デファクトクラスのモデルソリューションとなっている。
最小化における拡散の誘導バイアスとエネルギーの層次制約を組み合わせたエネルギー制約拡散モデルを提案する。
我々はTransformersと呼ばれる新しいタイプのメッセージパッシングモデルを考案し、そのグローバルアテンション層はエネルギー制約された拡散フレームワークから導かれる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:58:47 GMT)
Can Large Language Models Help Students Prove Software Correctness? An Experimental Study with Dafny [79.6] コンピューティング教育の学生は、ChatGPTのような大きな言語モデル(LLM)をますます利用している。
本稿では,Dafny の形式的検証演習において,学生が LLM とどのように相互作用するかを検討する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:08:05 GMT)
Advancing Textual Prompt Learning with Anchored Attributes [77.5] 本稿では,ATPrompt という名前の視覚言語モデルに対する属性型テキスト・プロンプト学習手法を提案する。
テキストプロンプトをカテゴリ中心の形式から属性-カテゴリハイブリッド形式に変換する。
簡単に使えるプラグイン技術として、ATPromptは既存の基本的なプロンプトフォーマットをシームレスに置き換えることができる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:54:19 GMT)
LineRetriever: Planning-Aware Observation Reduction for Web Agents [76.6] ボトムアップ・トランケーションや埋め込みベースの検索といった現在のアプローチでは、ページの状態やアクション履歴に関する重要な情報が失われている。
textitLineRetrieverは、言語モデルを利用して、将来のナビゲーションステップに最も関係のある観測線を特定し、検索する新しいアプローチである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:24:45 GMT)
Calligrapher: Freestyle Text Image Customization [72.7] Calligrapherは、高度なテキストのカスタマイズと芸術的なタイポグラフィを統合する、新しい拡散ベースのフレームワークである。
高品質で視覚的に一貫したタイポグラフィーを自動化することで、Calligrapherは従来のモデルを上回っている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:59:06 GMT)
Scaling and renormalization in high-dimensional regression [72.6] リッジ回帰に関する最近の結果について統一的な視点を提示する。
我々は、物理とディープラーニングの背景を持つ読者を対象に、ランダム行列理論と自由確率の基本的なツールを使用する。
我々の結果は拡張され、初期のスケーリング法則のモデルについて統一的な視点を提供する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:11:57 GMT)
A Unified Framework for Stealthy Adversarial Generation via Latent Optimization and Transferability Enhancement [72.3] 本稿では,従来の転送可能性向上戦略を画像編集による拡散モデルに基づく逆例生成にシームレスに組み込む統合フレームワークを提案する。
ACM MM25での「ディープフェイク検出者に対する第1次敵攻撃:AI生成メディア時代の挑戦」コンペで優勝した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:59:09 GMT)
DenseWorld-1M: Towards Detailed Dense Grounded Caption in the Real World [68.4] 我々はDenseWorld-1Mを紹介した。
オープンワールド認識,詳細なオブジェクトキャプション生成,高密度キャプションマージを含む3段階ラベリングパイプラインを設計する。
ラベル付けプロセスの高速化とキャプション品質の向上を目的として, 詳細領域キャプションモデルと空間キャプションマージモデルという2つのVLMモデルを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:51:25 GMT)
FALCON: Resolving Visual Redundancy and Fragmentation in High-resolution Multimodal Large Language Models via Visual Registers [67.8] 高解像度視覚入力はマルチモーダル大言語モデル (MLLM) と実世界のタスクに対する視覚知覚能力の強化を兼ね備えている。
既存の高解像度MLLMの多くは、画像を処理するためのトリミングベースのアプローチに依存しており、断片化された視覚符号化と冗長トークンの急激な増加につながっている。
FALCONは、ビジュアルエンコーディングの段階で冗長トークンを同時に除去する新しいビジュアルレジスタ技術を導入した。
FALCONは、視覚トークンの9倍の削減で優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:24:33 GMT)
NavMorph: A Self-Evolving World Model for Vision-and-Language Navigation in Continuous Environments [67.2] VLN-CE(Vision-and-Language Navigation in Continuous Environments)は、自然言語命令によって誘導される複雑な環境において、エージェントがシーケンシャルなナビゲーションアクションを実行する必要がある。
人間の認知にインスパイアされたNavMorphは、VLN-CEタスクにおける環境理解と意思決定を強化する自己進化型世界モデルフレームワークである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:20:00 GMT)
Flash-VStream: Efficient Real-Time Understanding for Long Video Streams [64.3] Flash-VStreamは、非常に長いビデオを処理し、リアルタイムでユーザークエリに応答できるビデオ言語モデルである。
既存のモデルと比較して、Flash-VStreamは推論遅延を大幅に削減する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:17:49 GMT)
D$^2$ST-Adapter: Disentangled-and-Deformable Spatio-Temporal Adapter for Few-shot Action Recognition [64.2] D$2$ST-Adapterは、空間的特徴と時間的特徴の非絡み合いの符号化を可能にする内部のデュアルパスアーキテクチャで構成されている。
本手法は,時間的ダイナミクスが行動認識に不可欠である難易度シナリオに特に適している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:19:35 GMT)
Sparsing Law: Towards Large Language Models with Greater Activation Sparsity [64.2] 活性化空間性は、除去できる活性化出力の中に、かなり弱い分散要素が存在することを表す。
PPL-$p%$ sparsity, a accurate and performance-aware activation sparsity metric。
我々は、SiLUよりも活性化関数としてReLUが効率的であることを示し、より多くのトレーニングデータを利用してアクティベーション空間を改善することができることを示した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:50:52 GMT)
FlatFusion: Delving into Details of Sparse Transformer-based Camera-LiDAR Fusion for Autonomous Driving [64.0] 多様なセンサーのモダリティからのデータの統合は、自律運転のシナリオにおいて一般的な方法論となっている。
効率的な点雲変換器の最近の進歩は、スパースフォーマットにおける情報統合の有効性を裏付けている。
本稿では,Transformer を用いた sparse cameraLiDAR 融合における設計選択を包括的に検討する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:55:41 GMT)
Differentially Private Synthetic Data Release for Topics API Outputs [63.8] 当社では,Google ChromeのPrivacy Sandboxの一部として,1つのPrivacy-Preserving Ads API – Topics APIに注目しています。
実トピックAPIデータの再識別リスク特性と密に一致した、微分プライベートなデータセットを生成する。
これにより、外部の研究者がAPIを詳細に分析し、現実的な大規模データセットの事前および将来の作業の再現が可能になります。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:46:57 GMT)
Generating Physically Stable and Buildable Brick Structures from Text [63.8] BrickGPTは、テキストプロンプトから物理的に安定したアセンブリモデルを生成するための最初のアプローチである。
私たちはデータセットであるStableText2Brickをリリースしました。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:14:58 GMT)
Open-ended Scientific Discovery via Bayesian Surprise [63.3] AutoDSは、ベイジアン・サプライズを用いた科学探査を駆動する、オープンエンドの科学的発見の方法である。
我々はAutoDSを、生物学、経済学、金融学、行動科学といった21の領域にまたがる実世界のデータセットにまたがるデータ駆動ディスカバリの設定で評価する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 22:53:59 GMT)
GeometryZero: Improving Geometry Solving for LLM with Group Contrastive Policy Optimization [63.1] Group Contrastive Policy Optimization(GCPO)は、2つの重要なイノベーションを特徴とする新しい強化学習フレームワークである。
我々はGeometryZeroを開発した。GeometryZeroは、手頃なサイズの幾何学的推論モデルで、補助的な建設をいつ行うべきかを判断する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:36:32 GMT)
Revisiting Audio-Visual Segmentation with Vision-Centric Transformer [60.8] AVS (Audio-Visual) は、オーディオ信号に基づいて、映像フレームに音声を生成するオブジェクトを分割することを目的としている。
本稿では,視覚由来の問合せを利用して,対応する音声や視覚情報を反復的に取得する視覚中心変換フレームワークを提案する。
我々のフレームワークは,AVSBenchデータセットの3つのサブセット上で,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:40:36 GMT)
From Sight to Insight: Unleashing Eye-Tracking in Weakly Supervised Video Salient Object Detection [60.1] 本稿では,弱い監督下での健全な物体の検出を支援するために,固定情報を導入することを目的とする。
特徴学習過程における位置と意味のガイダンスを提供するために,位置と意味の埋め込み (PSE) モジュールを提案する。
Intra-Inter Mixed Contrastive (MCII)モデルは、弱い監督下での時間的モデリング能力を改善する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:01:40 GMT)
CAI: Caption-Sensitive Attention Intervention for Mitigating Object Hallucination in Large Vision-Language Models [60.0] LVLM(Large Vision-Language Models)は、視覚情報から逸脱するコンテンツをしばしば生成し、物体の幻覚を引き起こす。
本稿では,CAI (Caption-sensitive Attention Intervention) を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:52:36 GMT)
Investigating Stochastic Methods for Prosody Modeling in Speech Synthesis [59.7] 生成法は近年急速に進歩しているが, 発話のための表現的韻律を生成することは, 依然として困難な課題である。
本研究では, 正規化フロー, 条件付きフローマッチング, 整流フローなどの手法の有効性について検討する。
本研究の主観的・客観的評価は,人間の発話に固有の変動を捉えることによって,人間の話者と同等に自然な韻律を生成することを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:52:32 GMT)
MMReason: An Open-Ended Multi-Modal Multi-Step Reasoning Benchmark for MLLMs Toward AGI [59.2] マルチモーダル大規模言語モデル(MLLM)の進展における推論の役割
既存のMLLMベンチマークは、しばしば、長鎖推論能力の正確かつ包括的な評価において不足している。
MLLM長鎖推論能力を正確かつ包括的に評価する新しいベンチマークであるMMReasonを紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:14:38 GMT)
Beyond Statistical Learning: Exact Learning Is Essential for General Intelligence [59.1] 音の誘惑的推論は、一般知能の必然的に望ましい側面である。
もっとも先進的なフロンティアシステムでさえ、定期的かつ一貫して容易に解決可能な推論タスクに干渉していることは、よく文書化されている。
彼らの不健全な振る舞いは、彼らの発展を支えている統計的学習のアプローチの結果である、と我々は主張する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:37:50 GMT)
Task Preference Optimization: Improving Multimodal Large Language Models with Vision Task Alignment [58.9] マルチモーダル大言語モデル(MLLM)は、視覚のきめ細やかな理解に苦しむ。
近年の研究では、ツールの使用や視覚的なタスクを自動回帰フレームワークに統一する手法が開発されており、多くの場合、全体的なマルチモーダルパフォーマンスを犠牲にしている。
本稿では,典型的な視覚的タスクから派生した微分可能なタスク選好を利用する新しい手法であるタスク選好最適化(TPO)を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:15:13 GMT)
Proving the Limited Scalability of Centralized Distributed Optimization via a New Lower Bound Construction [57.9] 我々は、すべての労働者が同一の分布にアクセスする均質な(すなわちd.d.)場合であっても、すべての労働者が非バイアス付き境界 LDeltaepsilon2,$$$$$ のポリ対数的により良いポリ対数を求める集中型分散学習環境を考える。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:27:39 GMT)
Detect \& Score: Privacy-Preserving Misbehaviour Detection and Contribution Evaluation in Federated Learning [57.4] セキュアアグリゲーションによるフェデレーション学習は、機密性の高いクライアント情報を漏洩することなく、分散データからプライベートおよびコラボレーティブな学習を可能にする。
コントリビューション評価(CE)と誤行動検出(MD)には,それぞれQIとFedGTが提案された。
我々はQIとFedGTの強みを組み合わせ、ロバストMDと正確なCEを両立させる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:40:18 GMT)
SynMotion: Semantic-Visual Adaptation for Motion Customized Video Generation [56.9] SynMotion(シンモクション)は、セマンティックガイダンスと視覚適応を併用した動画生成モデルである。
意味レベルでは、主観と動きの表現をアンタングルする二項意味理解機構を導入する。
視覚レベルでは、効率的なモーションアダプタをトレーニング済みのビデオ生成モデルに統合し、動きの忠実度と時間的コヒーレンスを高める。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:09:32 GMT)
Graft: Integrating the Domain Knowledge via Efficient Parameter Synergy for MLLMs [56.8] MLLM(Multimodal Large Language Models)は、様々な領域で成功している。
その重要性にもかかわらず、ドメイン固有のMLLM間の知識共有の研究はほとんど未調査のままである。
専門家機能のモジュール構成を可能にする統一パラメータ統合フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:07:41 GMT)
Thought-Augmented Planning for LLM-Powered Interactive Recommender Agent [56.6] 本稿では,蒸留した思考パターンを通じて複雑なユーザ意図に対処する,思考増強型対話型推薦エージェントシステム(TAIRA)を提案する。
具体的には、ユーザニーズを分解し、サブタスクを計画することでレコメンデーションタスクを編成するマネージャエージェントを備えたLLM方式のマルチエージェントシステムとして設計されている。
複数のデータセットにまたがる包括的な実験により、IRAは既存の手法に比べて大幅に性能が向上した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:15:50 GMT)
Interpretable Zero-Shot Learning with Locally-Aligned Vision-Language Model [56.6] 大規模視覚言語モデル(VLM)は、大規模視覚テキストペアデータセットを活用することでゼロショット学習(ZSL)において顕著な成功を収めた。
この問題に対処する1つのアプローチは、言語を統合することで解釈可能なモデルを開発することである。
本稿では,ZSLを解釈可能な言語モデルであるLaZSLを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:14:46 GMT)
ChemMiner: A Large Language Model Agent System for Chemical Literature Data Mining [56.2] ChemMinerは、文学から化学データを抽出するエンドツーエンドのフレームワークである。
ChemMinerには、コア参照マッピングのためのテキスト分析エージェント、非テキスト情報抽出のためのマルチモーダルエージェント、データ生成のための合成分析エージェントの3つの特殊エージェントが組み込まれている。
実験の結果,ヒト化学者に匹敵する反応同定率を示すとともに,高い精度,リコール,F1スコアで処理時間を著しく短縮した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:19:19 GMT)
Generalizing vision-language models to novel domains: A comprehensive survey [56.0] 視覚言語事前学習は、視覚とテキストの両モードの強みを統合する変換技術として登場した。
本調査は, VLM文献における一般化設定, 方法論, ベンチマーク, 結果の総合的な要約を目的とする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:24:22 GMT)
LW2G: Learning Whether to Grow for Prompt-based Continual Learning [55.6] 最近のPromptベースの連続学習は、事前訓練されたモデルで顕著な性能を達成した。
これらのアプローチは、学習中に新しいプロンプトセットを追加してプロンプトプールを拡張し、推論中に正しいセットを選択する。
従来,PCLの性能向上に課題を呈する課題として,タスク指向のプロンプトセットの個別化と選択精度の低さが指摘されてきた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:10:12 GMT)
From Alignment to Advancement: Bootstrapping Audio-Language Alignment with Synthetic Data [55.2] 音声対応の大規模言語モデル(ALLM)は近年,音声入力の理解と処理において大きな進歩を遂げている。
これらのモデルは典型的にはテキストベースの大規模言語モデル(LLM)に適応し、音声関連タスクのさらなるトレーニングを行う。
本研究では、現在と欠落した音を区別するALLMの能力を高めるために、コントラッシブな訓練データを生成するデータ生成フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:48:46 GMT)
PerLDiff: Controllable Street View Synthesis Using Perspective-Layout Diffusion Models [55.1] 本稿では,3次元幾何学的情報を完全に活用したストリートビュー画像生成手法であるPerLDiffを紹介する。
PerLDiffは、ネットワーク学習プロセス内で正確なオブジェクトレベル制御でストリートビュー画像の生成をガイドするために、3次元の幾何学的事前情報を利用する。
PerLDiffはNuScenesとKITTIデータセット上での制御可能な生成の精度を著しく向上させる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:12:38 GMT)
Interactive Reasoning: Visualizing and Controlling Chain-of-Thought Reasoning in Large Language Models [54.9] トピックの階層構造としてチェーンオブ思考出力を可視化するインタラクション設計であるInteractive Reasoningを導入する。
私たちは、不確実なトレードオフに直面したAIによる意思決定のプロトタイプであるHippoで、インタラクティブな推論を実装しています。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:00:43 GMT)
Continual Adaptation: Environment-Conditional Parameter Generation for Object Detection in Dynamic Scenarios [54.6] 環境は時間と空間によって常に変化し、クローズドセットの仮定に基づいて訓練された物体検出器にとって重要な課題となる。
そこで本研究では,微調整過程をパラメータ生成に変換する機構を提案する。
特に,2経路LoRAベースのドメイン認識アダプタを最初に設計し,特徴をドメイン不変およびドメイン固有コンポーネントに分解する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:14:12 GMT)
GaVS: 3D-Grounded Video Stabilization via Temporally-Consistent Local Reconstruction and Rendering [54.5] ビデオの安定化は、元のユーザの動きの意図を保ちながら、望ましくないシャキネスを除去するので、ビデオ処理に欠かせない。
既存のアプローチは、運用するドメインによって、ユーザエクスペリエンスを低下させるいくつかの問題に悩まされます。
ビデオの安定化を時間的に一貫性のある局所的再構成とレンダリングのパラダイムとして再構成する,新しい3Dグラウンドアプローチである textbfGaVS を紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:24:27 GMT)
GViT: Representing Images as Gaussians for Visual Recognition [54.5] GVITは従来のピクセルやパッチグリッドの入力表現を捨て、学習可能な2Dガウスのコンパクトなセットを優先する分類フレームワークである。
比較的標準的なViTアーキテクチャを用いて、2次元ガウス入力表現とGVITガイダンスを組み合わせることで、従来のパッチベースのViTの性能と密に一致していることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:44:14 GMT)
ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.8] ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:11:19 GMT)
Geminet: Learning the Duality-based Iterative Process for Lightweight Traffic Engineering in Changing Topologies [53.4] Geminetは軽量でスケーラブルなMLベースのTEフレームワークで、トポロジの変更を処理できる。
そのニューラルネットワークサイズは、既存のスキームの0.04%から7%に過ぎない。
大規模なトポロジでトレーニングすると、Geminetは10ギB未満のメモリを消費し、HARPが要求する80ギBの8倍以下である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:09:50 GMT)
Towards the Training of Deeper Predictive Coding Neural Networks [53.2] 平衡伝播で訓練された予測符号化ネットワークは、反復エネルギープロセスを通じて推論を行うニューラルネットワークである。
従来の研究では、浅層建築において効果が示されたが、深さが5層から7層を超えると性能が著しく低下した。
この劣化の原因は,重み更新時の層間エラーの指数的不均衡化と,より深い層内の更新を導く上で,前層からの予測が有効でないことにある。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:44:47 GMT)
ViewPoint: Panoramic Video Generation with Pretrained Diffusion Models [52.9] 本研究では,パノラマ映像の生成に事前学習した視点映像モデルを用いた新しいフレームワークを提案する。
具体的には,世界空間の連続性と細かな視覚的詳細を同時に持つビューポイントマップという新しいパノラマ表現を設計する。
提案手法は,パノラマ映像を高度にダイナミックかつ空間的に一貫したパノラマ映像を合成し,最先端の性能を達成し,従来の手法を超越することができる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:33:34 GMT)
Scaling Self-Supervised Representation Learning for Symbolic Piano Performance [52.7] 本研究では,多量のシンボリック・ピアノ転写を訓練した自己回帰型トランスフォーマモデルの能力について検討した。
比較的小型で高品質なサブセットをファインチューンモデルに使い、音楽の継続を生成、シンボリックな分類タスクを実行し、汎用的なコントラストMIDI埋め込みを生成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:00:14 GMT)
From Tokens to Thoughts: How LLMs and Humans Trade Compression for Meaning [52.3] 人間は知識をセマンティック圧縮によってコンパクトなカテゴリに分類する。
大規模言語モデル(LLM)は、顕著な言語能力を示す。
しかし、その内部表現が、圧縮と意味的忠実性の間の人間のようなトレードオフにぶつかるかどうかは不明だ。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:22:39 GMT)
Refine-POI: Reinforcement Fine-Tuned Large Language Models for Next Point-of-Interest Recommendation [51.1] 大規模言語モデル(LLM)は、次のPOI(point-of-interest)レコメンデーションタスクに採用されている。
次回のPOI勧告のための強化微調整フレームワークであるRefine-POIを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:36:12 GMT)
DeOcc-1-to-3: 3D De-Occlusion from a Single Image via Self-Supervised Multi-View Diffusion [50.9] 閉塞型マルチビュー生成のためのエンドツーエンドフレームワークであるDeOcc-1-to-3を提案する。
私たちの自己教師型トレーニングパイプラインは、隠蔽されたイメージペアと擬似地上構造ビューを活用して、モデル構造を意識した補完とビュー整合性を教える。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:14:44 GMT)
Navigating with Annealing Guidance Scale in Diffusion Space [50.5] 誘導尺度の選択は、視覚的に魅力的で即応的なイメージへの収束に重大な影響を与える。
本研究では,時間とともに指導尺度を動的に調整するアニーリング誘導スケジューラを提案する。
実験結果から,指導スケジューラは画像品質とテキストプロンプトとの整合性を著しく向上することが示された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:55:00 GMT)
TaP: A Taxonomy-Guided Framework for Automated and Scalable Preference Data Generation [50.3] 大規模言語モデル(LLM)の教師付き微調整と選好微調整を行うには、高品質なデータセットが必要である。
教師付きおよび好みの微調整のためのほとんどのデータセットは英語で提供されている。
本稿では、アンダーラインtextbfTaxonomy-Guided underlinetextbfPreference Data Generationフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:45:28 GMT)
StereoDiff: Stereo-Diffusion Synergy for Video Depth Estimation [50.1] 我々は,映像深度推定は画像深度推定の単純な拡張ではないと主張している。
ビデオ深度拡散を伴う静的領域のステレオマッチングを相乗化する2段ビデオ深度推定器であるStereoDiffを紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:41:41 GMT)
Efficient Conformance Checking of Rich Data-Aware Declare Specifications (Extended) [49.5] 一般的なデータ型やデータ条件とリッチな設定で,データを考慮した最適アライメントを計算可能であることを示す。
これは、制御フローとデータ依存関係を扱うために、よく知られた2つのアプローチを慎重に組み合わせることで達成される。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:16:21 GMT)
Act-With-Think: Chunk Auto-Regressive Modeling for Generative Recommendation [49.5] ジェネレーティブレコメンデーション(GR)は通常、アイテム情報の振る舞いや意味的な側面を離散トークンにエンコードする。
本稿では,Chunk AutoRegressive Modeling(CAR)について紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:13:54 GMT)
Optimal observables for (non-)equilibrium quantum metrology from the master equation [49.2] オープン量子系の主方程式から, 環境特性に対する最適感度の観測変数を明示的に構築する方法を示す。
これにより、対称対数微分(SLD)は、非平衡系と非平衡系の両方において、大きな利害関係を持つ系に利用可能となる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:06:25 GMT)
RGC-VQA: An Exploration Database for Robotic-Generated Video Quality Assessment [49.1] 本稿では,ロボットの自我中心的な視点から生成された映像を表現するために,ロボット生成コンテンツ(RGC)の概念を提案する。
RGCビデオは、プロが生成したコンテンツとは異なる独特の歪みと視覚的要求を示す。
RGCDには3つのロボットカテゴリーから作成され、多様なプラットフォームからソースされた合計2100本のビデオが含まれている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:44:30 GMT)
Blending Concepts with Text-to-Image Diffusion Models [48.7] 近年の拡散モデルでは、抽象概念を驚くほど容易に高忠実度画像に変換し、テキスト・画像生成が進歩している。
本研究では,具体的対象から無形概念まで,異なる概念を,ゼロショットの枠組みの下で統一された新しい視覚的実体にブレンドできるかどうかを考察する。
現代の拡散モデルでは、さらなる訓練や微調整をすることなく、創造的なブレンディング能力を示すことが示される。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:53:30 GMT)
Post-processing of EEG-based Auditory Attention Decoding Decisions via Hidden Markov Models [48.2] 脳波(EEG)などの脳信号を利用した聴覚注意復号法(AAD)アルゴリズム
注意の時間構造をモデル化した隠れマルコフモデル(HMM)によるAADの拡張を提案する。
HMMは、因果(リアルタイム)と非因果(オフライン)の両方の設定において、既存のAADアルゴリズムを大幅に改善できることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:31:26 GMT)
Table Foundation Models: on knowledge pre-training for tabular learning [47.5] TARTEは、文字列を使ってテーブルを知識に富んだベクトル表現に変換する基礎モデルである。
大規模なリレーショナルデータに基づいて事前トレーニングされたTARTEは、後続の学習を容易にする表現を、ほとんど追加コストなしで提供する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:48:16 GMT)
Advancing Learnable Multi-Agent Pathfinding Solvers with Active Fine-Tuning [46.4] マルチエージェントパスフィンディング(MAPF)は、マルチロボット軌道計画問題の共通の抽象化である。
本稿では,機械学習を活用した分散化サブ最適化MAPFソルバMAPF-GPT-DDGを紹介する。
本実験は,MAPF-GPT-DDGが既存の学習型MAPF解法を超えることを示した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:34:31 GMT)
Intelligent Orchestration of Distributed Large Foundation Model Inference at the Edge [46.1] Large Foundation Models (LFMs)は、次世代のEdge AIアプリケーションの新機能をアンロックすることを約束する。
現在の分割推論戦略では、ノード間でLPM層を分割するが、変動するワークロードに適応するようには設計されていない。
本稿では, LFM層を実行時可変変数に配置し, 分割する, 適応型分割推論オーケストレーションフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:26:30 GMT)
Gym4ReaL: A Suite for Benchmarking Real-World Reinforcement Learning [46.0] 我々は,RLアルゴリズムの開発と評価を支援するために設計された,現実的な環境のスイートであるtextttGym4ReaLを紹介した。
実験の結果,標準RLアルゴリズムはルールベースベンチマークに対する競合性を検証した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:47:50 GMT)
PB-LLMs: Privacy- and Bias-aware NLP Models using Named-Entity Recognition [45.9] 我々は,NER技術を用いて個人識別や地理的位置情報などのテキストデータ中の機密情報を匿名化するフレームワークを提案する。
ユーザのプライバシとシステムパフォーマンスに与える影響を評価するために,提案したプライバシ保護学習フレームワークの評価を行った。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:42:49 GMT)
A Survey on Autonomy-Induced Security Risks in Large Model-Based Agents [45.5] 大規模言語モデル(LLM)の最近の進歩は、自律型AIエージェントの台頭を触媒している。
これらの大きなモデルエージェントは、静的推論システムからインタラクティブなメモリ拡張エンティティへのパラダイムシフトを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:34:34 GMT)
Bridging Physical and Digital Worlds: Embodied Large AI for Future Wireless Systems [45.5] 大規模人工知能(AI)モデルは、将来の無線システムに革命的な可能性を提供する。
現在のパラダイムは、重要な物理的相互作用をほとんど見落としている。
本稿では,無線エンボディ型大型AI(WELAI)へのパラダイムシフトを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:13:55 GMT)
What Challenges Do Developers Face When Using Verification-Aware Programming Languages? [45.4] ソフトウェア開発では、ソフトウェア信頼性の増大はテストを伴うことが多い。
複雑でクリティカルなシステムでは、開発者はDesign by Contract(DbC)メソッドを使って、ソフトウェアコンポーネントが満たさなければならない正確な仕様を定義することができます。
VA(Verification-Aware)プログラミング言語は、DbCとコンパイル時または実行時の形式的検証をサポートし、従来のテストよりも正確性を保証する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:17:39 GMT)
Quantum channel for modeling spin-motion dephasing in Rydberg chains [45.0] 我々は、リドベルク相互作用を持つ中性原子鎖におけるスピンと運動自由度の結合から生じる散逸ダイナミクスをモデル化するための量子チャネルを導入する。
我々は,小システムの正確な対角化に対するアプローチの精度をベンチマークし,その妥当性と摂動的破壊の開始点を同定した。
次に、量子チャネルを適用して、正確に対角化することで、拡張されたリドベルク鎖の単一スピン励起の輸送中の忠実度損失を計算する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:37:38 GMT)
Supervised Diffusion-Model-Based PET Image Reconstruction [44.9] PET画像再構成の前兆として拡散モデル (DM) が導入された。
PET再構成のための教師付きDMベースアルゴリズムを提案する。
本手法はPETのポアソン確率モデルの非負性性を強制し,PET画像の広い範囲に適応する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:39:50 GMT)
Calibrating Graph Neural Networks with Wavelet-Aware Temperature Scaling [43.2] グラフウェーブレットの特徴に基づいてノード固有の温度を割り当てるポストホックキャリブレーションフレームワークであるWavelet-Aware Temperature Scaling (WATS)を提案する。
WATSはグラフウェーブレットのスケーラビリティとトポロジ的感度を利用して信頼性の推定を洗練させる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:23:57 GMT)
HASD: Hierarchical Adaption for pathology Slide-level Domain-shift [41.6] スライドレベルドメインシフト(HASD)のための階層的適応フレームワークを提案する。
HASDはマルチスケールの特徴整合性と計算効率のよいスライドレベルドメイン適応を実現する。
5つのデータセットにまたがる2つのスライドレベルのタスクに対して,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:52:01 GMT)
Ella: Embodied Social Agents with Lifelong Memory [41.3] オープンな3次元世界において,コミュニティ内での生涯学習が可能なエンボディ型ソーシャルエージェントであるEllaを紹介した。
Ellaの機能の中核は、情報を格納し、マルチモーダルし、取得する構造化された長期記憶システムである。
我々は、15人のエージェントが何日も社会活動に従事しているダイナミックな3Dオープンな世界で能力指向の評価を行う。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:22:51 GMT)
AFUNet: Cross-Iterative Alignment-Fusion Synergy for HDR Reconstruction via Deep Unfolding Paradigm [41.1] 既存の学習ベース手法は,マルチ露光LDR入力から動的範囲を拡張してHDR画像を効果的に再構成し,ディテールを向上する。
本稿では,これらの制約に対処するため,横断的アライメントとフュージョン深層展開ネットワーク(AFUNet)を提案する。
本手法は最大A Posteriori (MAP) 推定視点から多露光HDR再構成を定式化する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:03:34 GMT)
NeuralOM: Neural Ocean Model for Subseasonal-to-Seasonal Simulation [40.0] マルチスケール対話型グラフニューラルネットワークを用いたS2S海洋シミュレーションのためのニューラルオーシャンモデル(NeuralOM)を提案する。
複雑な動的振る舞いを捉えるために,マルチスケールの対話型メッセージングモジュールを導入する。
提案するNeuralOMは,S2Sにおける最先端モデルと極端なイベントシミュレーションより優れている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:38:39 GMT)
Self-correcting Reward Shaping via Language Models for Reinforcement Learning Agents in Games [39.4] 本稿では,RLエージェントの報酬関数重みを微調整する自動手法を提案する。
言語モデル(LM)は、ユーザ定義言語に基づく行動目標に基づいて、イテレーション毎に更新された重み付けを提案する。
レースタスクにおける我々のアプローチを評価し、イテレーション間でエージェントのパフォーマンスを継続的に改善することを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:45:04 GMT)
Epona: Autoregressive Diffusion World Model for Autonomous Driving [39.4] 既存のビデオ拡散モデルは、柔軟で長い水平予測と軌道計画の統合に苦慮している。
これは、従来のビデオ拡散モデルは固定長フレーム列のグローバルな共同分布モデルに依存しているためである。
本研究では,局所分布モデリングが可能な自己回帰的世界モデルであるEponaを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:56:35 GMT)
Reinforcement Learning for Synchronised Flow Control in a Dual-Gate Resin Infusion System [39.2] 本稿では,2つのレジン入口と1つの出口を含む注入シナリオにおいて,レジンフローフロントを同期させる強化学習(RL)戦略を提案する。
以上の結果から, 複合材料製造におけるプロセス制御, 製品品質向上に向けたRL法の有効性が示された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:50:18 GMT)
Refine Any Object in Any Scene [39.1] Refine Any Object In Any ScenE (RAISE) は、細粒度オブジェクトの形状と外観を失くしたビューで復元する新しい3D拡張フレームワークである。
RAISEは、各プロキシを7-DOFのポーズで劣化したプロキシにアライメントすることで、幾何やテクスチャを徐々に洗練する。
挑戦的なベンチマーク実験により、RAISEは新しいビュー合成と幾何完成タスクの両方において最先端の手法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:26:21 GMT)
PathDiff: Histopathology Image Synthesis with Unpaired Text and Mask Conditions [38.3] 公開データセットには、同じ病理像に対するペアテキストとマスクデータがない。
マスクテキストデータから効果的に学習する拡散フレームワークPathDiffを提案する。
PathDiffは、構造的特徴と文脈的特徴を正確に制御し、高品質で意味論的に正確な画像を生成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 00:31:03 GMT)
Event-based Tiny Object Detection: A Benchmark Dataset and Baseline [37.6] アンチUAVタスクにおける小さな物体検出(SOD)は、UAVの小さいサイズと複雑な背景のために難しい問題である。
イベントカメラは、マイクロ秒の時間分解能と高いダイナミックレンジを持ち、より効果的なSODソリューションを提供する。
既存のイベントベースのオブジェクト検出データセットは、スケールが制限され、大きなターゲットサイズが特徴であり、バックグラウンドの多様性が欠如しているため、SODベンチマークには適さない。
本稿では,イベントベーススモールオブジェクト検出(EVSOD)データセット(EV-UAV)を紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:28:50 GMT)
How to Move Your Dragon: Text-to-Motion Synthesis for Large-Vocabulary Objects [37.1] 多様なオブジェクトカテゴリのためのモーション合成は、3Dコンテンツ作成に大きな可能性を秘めている。
我々は、広範囲の高品質なモーションやアノテーションを含む包括的なモーションデータセットの欠如に対処する。
本稿では,一貫したダイナミクスを保ちながら,多様な動作データを生成するrig拡張手法を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:56:10 GMT)
How to Design and Train Your Implicit Neural Representation for Video Compression [37.0] ビデオ圧縮のための入射神経表現法(INR)は、近年、従来のパイプラインと競合する視覚的品質と圧縮比を達成している。
サンプルごとのネットワークトレーニングが必要なため、これらの手法の符号化速度は実践的に採用するには遅すぎる。
サイズ品質のトレードオフだけでなく、トレーニング時間にも影響するので、NeRVファミリーのメソッドのコンポーネントをアンハングルしてレビューできるライブラリを開発しています。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:59:57 GMT)
Transition Matching: Scalable and Flexible Generative Modeling [36.6] 本稿では,拡散流モデルと連続AR生成の両方を統一・発展させる離散時間連続状態生成パラダイムであるTransition Matching(TM)を紹介する。
TMは複雑な生成タスクをより単純なマルコフ遷移に分解し、表現的な非決定論的確率遷移カーネルと任意の非連続的な監督プロセスを可能にする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:51:58 GMT)
Spurious-Aware Prototype Refinement for Reliable Out-of-Distribution Detection [36.4] 現実世界のアプリケーションにおける機械学習モデルの信頼性と安全性を確保するためには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
SPRODは,未知の急激な相関関係によって生じる課題に明示的に対処する,プロトタイプベースのOOD検出手法である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:10:51 GMT)
Progressive Binarization with Semi-Structured Pruning for LLMs [36.3] 本稿では,学習後圧縮フレームワークであるPBS$2$Pによるプログレッシブバイナリ化を提案する。
PBS$2$Pは、最先端のバイナリポストトレーニング量子化法を、複雑度と下流の精度の両方で一貫して上回っていることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:16:02 GMT)
Time to Rethink AI for Combinatorial Optimization: Classical Algorithms Remain Tough to Match [36.1] 先進的なAIにインスパイアされた手法は、最先端の古典的解法であるKaMISによって一貫して性能が向上していることを示す。
LTFT(GNetをベースとする)のような非バックトラックAIメソッドは、最も単純な学位ベースの欲求と同様の推論に終わる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:02:59 GMT)
Accelerating Quantum Reinforcement Learning with a Quantum Natural Policy Gradient Based Approach [36.1] 本稿では、古典的なNPG推定器で使用されるランダムサンプリングを決定論的勾配推定手法で置き換える量子自然ポリシー勾配(QNPG)アルゴリズムを提案する。
提案したQNPGアルゴリズムは、量子オラクルへのクエリに対する$tildemathcalO(epsilon-1.5)$のサンプル複雑性を達成し、マルコフ決定プロセス(MDP)へのクエリに対する$tildemathcalO(epsilon-2)$の古典的な下界を大幅に改善する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 23:59:00 GMT)
NatureLM-audio: an Audio-Language Foundation Model for Bioacoustics [35.7] NatureLM-audioはバイオ音響学に特化して設計された最初のオーディオ言語基盤モデルである。
トレーニングデータセットは、バイオアコースティック、スピーチ、音楽にまたがるテキストとオーディオのペアを慎重にキュレートしたものだ。
音楽や音声から生体音響への学習表現の伝達が成功し,本モデルは未知の分類群や課題への有望な一般化を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 00:58:43 GMT)
Prompting as Scientific Inquiry [35.6] 我々は、プロンプトが科学として扱われることは滅多になく、しばしば錬金術として非難されると主張している。
機械的解釈可能性(Mechanistic Interpretability)は、ニューラルネットワークを覗き込み、そのネイティブインターフェースである言語でモデルを探索する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:11:25 GMT)
KAG-Thinker: Interactive Thinking and Deep Reasoning in LLMs via Knowledge-Augmented Generation [35.6] 我々は、KAG-Thinkerを導入し、KAGをマルチターン対話型思考と、専用パラメータライト大言語モデル(LLM)を利用した深い推論フレームワークにアップグレードする。
提案手法は,複雑な問題を解くための構造化思考プロセスを構築し,推論過程の論理的一貫性と文脈的整合性を高める。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:08:21 GMT)
SEUF: Is Unlearning One Expert Enough for Mixture-of-Experts LLMs? [35.2] 我々は,Mixture-of-Experts (MoE) LLMのためのSEUF(Selected-Expert Unlearning Framework)を提案する。
専門家の帰属を通じて、未学習は特定の知識に対する最も活発な専門家に集中する。
SEUFは様々な標準のアンラーニングアルゴリズムと互換性がある。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:45:54 GMT)
Ego-Foresight: Self-supervised Learning of Agent-Aware Representations for Improved RL [35.2] 本研究では,移動と予測に基づくエージェントと環境の自己管理手法であるEgo-Foresightを提案する。
エージェントのビジュモータ予測による自己監督型エージェント認識は,RLアルゴリズムのサンプル効率と性能を向上させる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:16:44 GMT)
Provably Efficient and Agile Randomized Q-Learning [35.1] 我々は、サンプリングベースの探索をアジャイル、ステップワイド、ポリシー更新と統合した新しいQ-ラーニングアルゴリズムをRandomizedQと呼ぶ。
経験的に、RandomizedQは、ボーナスベースとベイズベースで標準ベンチマークを探索する既存のQラーニングモデルと比較して、優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:08:29 GMT)
Unified Multimodal Understanding via Byte-Pair Visual Encoding [35.0] マルチモーダル大言語モデル (MLLM) は視覚言語理解において大きな進歩を遂げている。
視覚トークンにバイトペアエンコーディングを適用することで,マルチモーダル理解を統一するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:08:08 GMT)
Grid: Omni Visual Generation [34.6] 現在のアプローチでは、膨大な計算コストでスクラッチから特別なビデオモデルを構築するか、イメージジェネレータに別のモーションモジュールを追加するかのどちらかである。
現代の画像生成モデルは、暗黙の時間的理解を伴う構造的レイアウトの処理において、未利用の可能性を秘めている。
本稿では,時間的シーケンスをグリッドレイアウトとして再構成し,視覚的シーケンスの全体的処理を可能にするGRIDを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:03:43 GMT)
Visual and Memory Dual Adapter for Multi-Modal Object Tracking [34.4] マルチモーダルトラッキングのためのより堅牢な表現を構築するために,新しいビジュアル・メモリ二重アダプタ(VMDA)を提案する。
我々は,識別的手がかりを補助的モダリティから支配的モダリティへ適応的に伝達する,シンプルだが効果的なビジュアルアダプターを開発した。
また、グローバルな時間的手がかりを記憶し、動的更新および検索操作を行うヒューマンメモリ機構にインスパイアされたメモリアダプタを設計する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:38:26 GMT)
Can LLMs Evaluate Complex Attribution in QA? Automatic Benchmarking using Knowledge Graphs [33.9] Attributed Question Answering (AQA) は注目されているが、その属性を評価するにはいくつかの制限がある。
本稿では,包括的帰属カテゴリを含む大規模ベンチマークであるCAQAを紹介する。
我々はCAQAの有効性を検証するための広範囲な実験を行った。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:28:41 GMT)
TurboVSR: Fantastic Video Upscalers and Where to Find Them [33.8] 拡散に基づく生成モデルは、ビデオ超解像(VSR)タスクにおいて例外的な可能性を証明している。
超高効率拡散ベースビデオ超解像モデルであるTurboVSRを提案する。
TurboVSRは最先端のVSR方式と同等に動作し、100倍以上高速で、2秒の1080pビデオを処理するのにわずか7秒しかかからない。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:24:13 GMT)
ETTA: Elucidating the Design Space of Text-to-Audio Models [33.8] 対象ベンチマークに対するデータ,モデルアーキテクチャ,目標関数のトレーニング,およびサンプリング戦略の効果について検討する。
Eucidated Text-To-Audio (ETTA) と呼ばれる最良のモデルを提案する。
ETTAは、公開データでトレーニングされたベースラインよりも改善され、プロプライエタリデータでトレーニングされたモデルと競合する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 23:24:17 GMT)
ReferDINO: Referring Video Object Segmentation with Visual Grounding Foundations [33.7] ビデオオブジェクトセグメンテーション(RVOS)は、テキスト記述に基づいて、ビデオ全体を通してターゲットオブジェクトをセグメンテーションすることを目的としている。
これは、深い視覚レベルの理解、ピクセルレベルの高密度な予測、時間的推論を含むため、難しい。
基礎的な視覚基盤モデルから領域レベルの視覚テキストアライメントを継承するbfReferDINO RVOSを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:09:19 GMT)
Semiparametric Double Reinforcement Learning with Applications to Long-Term Causal Inference [33.1] 短期的なデータから長期的な因果効果を推定しなければならない。
MDPはこのような長期的ダイナミクスを捉えるための自然なフレームワークを提供する。
非パラメトリックな実装は時間間重なりの強い仮定を必要とする。
アイソトニックベルマンキャリブレーションに基づく新しいプラグイン推定器を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:30:42 GMT)
GL-LowPopArt: A Nearly Instance-Wise Minimax-Optimal Estimator for Generalized Low-Rank Trace Regression [32.4] GL-LowPopArtは、一般化された低ランクトレース回帰のためのカソーニスタイルの新たな推定器である。
我々は、既存の保証を越えながら、最先端の予測誤差境界を確立する。
GL-LowPopArtに基づく探索-then-commitアルゴリズムの解析により,新たな,潜在的に興味深い問題依存量を明らかにした。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:20:14 GMT)
Achieving binary weight and activation for LLMs using Post-Training Quantization [32.2] 大規模言語モデル(LLM)を1ビット精度に量子化することは、計算コストを大幅に削減する。
既存の量子化技術は、4ビット以下の重みとアクティベーション精度を使用する場合(W4A4)、顕著な性能劣化に悩まされる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:32:15 GMT)
Partial Forward Blocking: A Novel Data Pruning Paradigm for Lossless Training Acceleration [32.2] 既存のデータプルーニングアプローチは、これらの重要でないサンプルを取り除き、トレーニングを加速することを目的としている。
本稿では、ロスレストレーニングアクセラレーションのための新しいフレームワークであるPartial Forward Blocking (PFB)を提案する。
PFBは,プルーニング試料の深層フォワードパスとバックプロパゲーションの計算オーバーヘッドを著しく低減する。
ImageNetでは、PFBは0.5%の精度向上と33%のトレーニング時間短縮を実現し、40%のデータをプルーニングした。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:53:26 GMT)
OcRFDet: Object-Centric Radiance Fields for Multi-View 3D Object Detection in Autonomous Driving [32.1] 現在の多視点3Dオブジェクト検出法は、通常、深度推定や3D位置エンコーダを用いて2次元特徴を3次元空間に転送する。
3次元再構成における放射場の成功に触発されて、検出器の3次元幾何推定能力を高めることができると仮定する。
我々は,前景オブジェクトを描画する補助的なタスクを通じて,3次元ボクセル特性を高めるために,OcRF(Object-centric Radiance Fields)を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:18:17 GMT)
Breaking mBad! Supervised Fine-tuning for Cross-Lingual Detoxification [31.8] クロス・リンガル・デトキシフィケーション(Cross-lingual Detoxification)は、大規模言語モデルにおいて毒性を緩和するパラダイムである。
本研究では, クロスディストリビューション設定における毒性低下を解析し, 非有害タスクに対するモデル性能への影響について検討する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 22:55:54 GMT)
Position: Machine Learning Conferences Should Establish a "Refutations and Critiques" Track [31.6] 機械学習のカンファレンスは、専用の"Refutations and Critiques"(R&C)トラックを確立するべきだ、と私たちは主張する。
このR&Cトラックは、先行研究に挑戦する重要な研究を支援するために、注目に値するプラットフォームを提供する。
MLのカンファレンスは、ML研究の自己修正を支援する公式で信頼性の高いメカニズムを作成するべきだ、と私たちは結論付けています。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:41:57 GMT)
AdFair-CLIP: Adversarial Fair Contrastive Language-Image Pre-training for Chest X-rays [31.3] 本稿では,AdFair-CLIPについて紹介する。
我々は胸部X線(CXR)データセットの総合的な実験を行い、AdFair-CLIPは公平性と診断精度の両方を著しく向上させることを示した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:19:22 GMT)
PRVQL: Progressive Knowledge-guided Refinement for Robust Egocentric Visual Query Localization [31.2] エゴセントリックなビジュアルクエリローカライゼーション(EgoVQL)は、空間と時間のターゲットを、一人称ビデオからローカライズすることに焦点を当てている。
EgoVQL用の新しいプログレッシブ知識誘導型リファインメントフレームワークであるPRVQLを紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:36:16 GMT)
Towards Markerless Intraoperative Tracking of Deformable Spine Tissue [30.9] 本稿では,脊椎手術のための臨床用RGB-Dデータセットについて紹介する。
SpineAlignは術前および術中脊椎状態の変形を捉えるシステムである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:32:19 GMT)
Towards Vision-Language-Garment Models for Web Knowledge Garment Understanding and Generation [30.8] テキスト記述と視覚画像から衣服を合成する視覚言語学習モデルであるVLGを紹介する。
予備的な結果は、有望な転送能力を示し、ファッションデザインのような専門分野に効果的に適応するマルチモーダル基盤モデルの可能性を強調している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:16:27 GMT)
Mitigating Knowledge Discrepancies among Multiple Datasets for Task-agnostic Unified Face Alignment [30.5] 既存の顔アライメント手法では、異なるランドマークアノテーションを持つ複数のデータセットから統一的な知識を学習することはできない。
本稿では,複数のデータセットから知識を統一する戦略を提案する。
実験は7つのベンチマークで行われ、その結果は知識の相違による顔のアライメントが著しく改善されたことを示している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:00:00 GMT)
JAM-Flow: Joint Audio-Motion Synthesis with Flow Matching [30.0] JAM-Flowは、顔の動きと音声の両方を同時に合成し、条件付けするための統合されたフレームワークである。
テキスト、参照オーディオ、参照モーションファシリテーションタスクを含む、幅広い条件入力をサポートする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:51:40 GMT)
Epitome: Pioneering an Experimental Platform for AI-Social Science Integration [29.4] 人工知能と社会科学の深い統合に特化した、世界初のオープンな実験プラットフォームであるEpitomeを紹介します。
Epitomeは、実際の展開中の個人、組織、社会に対するAIのインタラクティブな影響に焦点を当てている。
Epitomeはキャンバススタイルのユーザーフレンドリーなインターフェースで、研究者が複雑な実験シナリオを設計し、実行できるようにする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:06:16 GMT)
Visual Position Prompt for MLLM based Visual Grounding [29.3] 本稿では,視覚位置プロンプト(VPP)で強化されたMLLMであるVPP-LLaVAを導入し,グラウンド機能を改善する。
VPP-LLaVAは2つの相補的なメカニズムを統合する: グローバルVPPは学習可能な軸状のテンソルを入力画像上にオーバーレイして構造化空間的手がかりを提供する。
標準的なビジュアルグラウンドベンチマークで最先端の結果を達成し、ゼロショットの強力な一般化を証明し、目に見えないデータセットに挑戦する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:04:49 GMT)
State and Memory is All You Need for Robust and Reliable AI Agents [29.3] 大規模言語モデル(LLM)は、自然言語の理解と生成において強力な進歩を実現している。
しかし、複雑な現実世界の科学への応用は、記憶、計画、ツール統合の課題によって制限されている。
本稿では、LLMベースのエージェントが自律的に計画し、推論し、堅牢で信頼性の高いドメイン固有タスク実行を実現することができるモジュール型エージェントフレームワークであるSciBORGを紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:02:35 GMT)
MoORE: SVD-based Model MoE-ization for Conflict- and Oblivion-Resistant Multi-Task Adaptation [29.2] マルチタスクシナリオにおける大規模な基盤モデルの適用は、多くの場合、タスクの衝突や障害に悩まされる。
本稿では,「モデルMOE-ization」戦略を新たに提案し,コンフリクトとオブリビションに抵抗するマルチタスク適応手法を提案する。
様々なデータセットの実験により、MoOREは既存のマルチタスク適応手法を一貫して上回ることを示した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:22:39 GMT)
VMoBA: Mixture-of-Block Attention for Video Diffusion Models [29.2] 本稿では,ビデオ拡散モデル(VDM)に特化して適応する新しい注意機構,VMoBAについて紹介する。
VMoBAは、事前訓練されたビデオトランスフォーマー内の注意パターンの詳細な分析によって、オリジナルのMoBAフレームワークを3つの重要な修正で強化する。
VMoBAは、長いシーケンスでのVDMのトレーニングを著しく加速し、2.92倍のFLOPと1.48倍のレイテンシ高速化を実現している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:52:31 GMT)
Towards Efficient and Accurate Spiking Neural Networks via Adaptive Bit Allocation [28.9] マルチビットスパイクニューラルネットワーク(SNN)は最近、エネルギー効率と高精度なAIを追求する熱い研究スポットになっている。
本稿では,直接学習したSNNに対して,メモリと計算資源の微粒な層配置を実現するための適応ビット割り当て戦略を提案する。
具体的には、重みとスパイクの時間長とビット幅をパラメータ化し、勾配を通して学習し制御できるようにする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:45:16 GMT)
Faster Diffusion Models via Higher-Order Approximation [28.8] 本稿では,d1+2/K varepsilon-1/K$$のスコア関数評価のみを必要とする,原則付き無トレーニングサンプリングアルゴリズムを提案する。
我々の理論はロバストなvis-a-vis不正確なスコア推定であり、スコア推定誤差が増加するにつれて優雅に劣化する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:49:03 GMT)
MILo: Mesh-In-the-Loop Gaussian Splatting for Detailed and Efficient Surface Reconstruction [28.5] 3次元ガウスからメッシュを微分的に抽出することにより,体積表現と表面表現のギャップを埋める新しいフレームワークMILoを提案する。
提案手法では,従来の手法に比べてメッシュ頂点のオーダーを桁違いに少なくしつつ,背景を含む全シーンを最先端の品質で再構築することができる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:48:54 GMT)
Benefits of Early Stopping in Gradient Descent for Overparameterized Logistic Regression [28.4] ロジスティック回帰では、勾配降下(GD)は最大$ell$-margin解に収束しながらノルムで分岐する。
本研究は,高次元ロジスティック回帰における早期停止による追加正則化効果について検討する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 01:46:22 GMT)
OrderChain: Towards General Instruct-Tuning for Stimulating the Ordinal Understanding Ability of MLLM [28.2] 本稿では,MLLMの規則的理解能力を,特異性と共通性モデリングにより向上させる,新規で汎用的なプロンプトパラダイムであるOrderChainを提案する。
OrderChainを用いたLarge Language and Vision Assistantモデルは,多様なORデータセットに基づいて,ベースラインのLLaVAを大幅に改善することを示す。
私たちの知る限りでは、OrderChainは、ORタスクのMLLMを拡張した最初の作品です。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:40:22 GMT)
An ontological lens on attack trees: Toward adequacy and interoperability [28.0] アタックツリー(AT)は、セキュリティ分析の一般的な形式である。
ATは、セキュリティリスク管理シナリオを表現するための概念モデリング機能を提供する。
しかしAT言語は、存在論的基盤が欠如しているため、制限を課している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:31:34 GMT)
On the Predictive Power of Representation Dispersion in Language Models [27.9] 文脈表現をより広く広めるモデルは、より難易度を低くする傾向にあることを示す。
本稿では,ラベル付きデータを必要とせずに,分散の活用方法を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:53:50 GMT)
PBCAT: Patch-based composite adversarial training against physically realizable attacks on object detection [27.8] 敵の攻撃に対する最も効果的な防御として、敵の訓練が認められている。
本稿では, PBCATを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:36:21 GMT)
RetroInfer: A Vector-Storage Approach for Scalable Long-Context LLM Inference [27.7] RetroInferは、長文推論を加速するために固有の注意空間を利用する新しいシステムである。
KVキャッシュがCPUメモリに拡張された場合、GPUメモリリミット内では4.5倍のスピードアップと、スムーズなアテンションベースライン上で最大10.5倍のスピードアップを示します。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:21:58 GMT)
The Hitchhiker's Guide to Efficient, End-to-End, and Tight DP Auditing [27.6] 我々は,現場での作業のレビューを行うための総合的なフレームワークを導入し,DP監査が対象とする3つのコンテキスト横断デシラタを確立する。
我々は、脅威モデル、攻撃、評価機能を含む最先端のDP監査技術の運用モードを体系化する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:43:10 GMT)
Rethinking Aleatoric and Epistemic Uncertainty [27.4] 本稿では,データにおける不確実性,予測性能,統計的分散という厳密な概念を包含する決定論的視点を提案する。
我々は、人気のある情報理論量についての洞察を提供し、それらがしばしば測定対象とされているものの、評価に乏しいことを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:42:51 GMT)
HyperMono: A Monotonicity-aware Approach to Hyper-Relational Knowledge Representation [27.3] ハイパーリレーショナル・ナレッジグラフ(HKG)では、各事実は属性値の修飾子に関連する主三重からなり、追加の事実知識が表現される。
本稿では,ハイパーリレーショナル知識グラフ補完のためのHyperMonoモデルを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:50:35 GMT)
SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning [27.2] SPIRALは、モデルをマルチターン、ゼロサムゲームで学習し、自身のバージョンを継続的に改善するセルフプレイフレームワークである。
SPIRALを用いることで、ゼロサムゲーム上でのセルフプレイは、広く移動する推論能力を生み出す。
分析により, この伝達は, 系統的分解, 期待値計算, ケース・バイ・ケース分析という3つの認知的パターンを通じて起こることが明らかとなった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:58:13 GMT)
LLM Braces: Straightening Out LLM Predictions with Relevant Sub-Updates [27.0] LLMBRACESは,FFN層内の値ベクトルに関連付けられた関連値を求める手法である。
サブアップデートのコントリビューションを最適化することで、LLMBRACESは予測プロセスを洗練し、より正確で信頼性の高いアウトプットを実現する。
LLMBRACESは感情制御による生成と毒性の低減に優れており、アプリケーション間で柔軟に制御されたテキスト生成の可能性を強調している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:21:26 GMT)
Enhanced Controllability of Diffusion Models via Feature Disentanglement and Realism-Enhanced Sampling Methods [27.0] 拡散モデル(FDiff)の特徴分散のためのトレーニングフレームワークを提案する。
本稿では,拡散モデルの現実性を高め,制御性を高める2つのサンプリング手法を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:44:40 GMT)
Agent4S: The Transformation of Research Paradigms from the Perspective of Large Language Models [26.5] 研究ワークフロー全体を自動化するために,Agent for Science (Agent4S)を提案する。
この枠組みは、科学的発見における次の革命的なステップを定義する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:11:39 GMT)
Time-variant Image Inpainting via Interactive Distribution Transition Estimation [26.5] TAMP(Time-vAriant iMage inPainting)に焦点をあてる。
TAMPの目的は、参照画像からの補完情報を活用することにより、損傷対象画像を復元することである。
特に, 最新技術(SOTA)を参照誘導画像の塗布方法でさえ, 妥当な結果が得られないことが本研究で確認された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 01:45:33 GMT)
A Survey on Vision-Language-Action Models for Autonomous Driving [26.4] VLA(Vision-Language-Action)パラダイムは、視覚知覚、自然言語理解、制御を単一のポリシーに統合する。
自動運転車の研究者たちは、これらの方法を車の領域に積極的に適応させている。
この調査は、VLA for Autonomous Drivingの最初の包括的な概要を提供する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:50:02 GMT)
Towards Automated Self-Supervised Learning for Truly Unsupervised Graph Anomaly Detection [26.1] 自己教師付き学習(SSL)は、データ自体から生成された監視信号を利用する新興パラダイムである。
ほとんどのSSLベースのグラフ異常検出手法は、SSL戦略を任意または選択的に選択することでこれらの問題を回避している。
漏洩は「データマイニングのミスのトップ10の1つ」と批判されている
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:21:00 GMT)
LLM-enhanced Action-aware Multi-modal Prompt Tuning for Image-Text Matching [25.9] 大規模言語モデル(LLM)が生成する行動関連外部知識を組み込むことにより,CLIPをきめ細かな行動レベル理解に役立てる。
本稿では,行動認識に基づく視覚的特徴を集約し,識別的・行動的視覚的表現を確立するための知識を付加する適応的相互作用モジュールを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:49:08 GMT)
Cluster and Predict Latent Patches for Improved Masked Image Modeling [25.6] 我々は,潜在クラスタリングの予測に依存する新しい純粋なMIMフレームワークであるCAPIを紹介する。
このアプローチでは,トレーニングに安定なクラスタリングベースの損失を活用し,有望なスケーリング特性を示す。
我々のVT-LバックボーンであるCAPIは、ImageNetで83.8%、ADE20Kで32.1%のmIoUを単純な線形プローブで達成している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:48:00 GMT)
AI-Generated Lecture Slides for Improving Slide Element Detection and Retrieval [25.5] 本稿では,大規模言語モデル(LLM)を用いた合成講義スライド生成パイプライン,SynLecSlideGenを提案する。
また、実講演スライド1050を手動でアノテートすることで、評価ベンチマーク、すなわちRealSlideを作成します。
実験結果から,合成スライドのプレトレーニングによる数発の転写学習は,実データのみのトレーニングに比べ,性能が有意に向上することがわかった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:11:31 GMT)
VOCAL: Visual Odometry via ContrAstive Learning [25.5] VOCAL (Visual Odometry via ContrAstive Learning) は,ビジュアルオドメトリーをラベルランキングの課題として再定義する新しいフレームワークである。
ベイズ推論と表現学習フレームワークを統合することで、VOCALは視覚的特徴をミラーカメラ状態に整理する。
この戦略的アライメントは、学習した機能の解釈可能性を高め、マルチモーダルデータソースとの互換性を保証する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:26:13 GMT)
OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models [25.5] 動作関連条件をトレーニングフェーズに混合することにより,データをスケールアップする拡散トランスフォーマーベースのフレームワークを提案する。
これらの設計により、OmniHumanはデータ駆動モーション生成を完全に活用し、最終的に非常にリアルな人間のビデオ生成を実現することができる。
既存のエンドツーエンドのオーディオ駆動方式と比較して、OmniHumanはよりリアルなビデオを生成するだけでなく、入力の柔軟性も向上している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:26:56 GMT)
STCLocker: Deadlock Avoidance Testing for Autonomous Driving Systems [25.2] そこで我々は,DeadLockシナリオ(DLS)を生成するための,最初の専用の時空間衝突回避技術STCLockerを提案する。
STCLockerはDeadlock Oracle、Conflict Feedback、Conflict-aware Scenario Generationの3つの主要なコンポーネントで構成されている。
実験結果から,STCLocker は最高性能のベースラインよりも DLS を多く生成することがわかった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:58:10 GMT)
MTADiffusion: Mask Text Alignment Diffusion Model for Object Inpainting [25.0] MTADiffusionは,物体塗布のためのマスクテキスト配向拡散モデルである。
MTAPipelineをベースとして,500万の画像と2500万のマスクテキストペアからなる新しいMTAデータセットを構築した。
スタイル整合性を促進するために,事前学習したVGGネットワークとGram行列を用いた新しいスタイル整合性損失を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:06:54 GMT)
SoK: Semantic Privacy in Large Language Models [24.9] 本稿では,大規模言語モデル(LLM)の入力処理,事前学習,微調整,アライメント段階におけるセマンティックプライバシリスクを分析するライフサイクル中心のフレームワークを提案する。
我々は、鍵攻撃ベクトルを分類し、差分プライバシー、埋め込み暗号化、エッジコンピューティング、未学習などの現在の防御がこれらの脅威にどのように対処しているかを評価する。
セマンティックリークの定量化、マルチモーダル入力の保護、生成品質との非識別性のバランス、プライバシー保護の透明性確保など、オープンな課題の概要をまとめて結論付けます。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:08:15 GMT)
Information Entropy Guided Height-aware Histogram for Quantization-friendly Pillar Feature Encoder [24.8] リアルタイムかつ高性能な3Dオブジェクト検出は、自律走行とロボット工学において重要な役割を果たす。
最近の柱型3次元物体検出器は、そのコンパクトな表現と計算オーバーヘッドの低さから注目されている。
しかし、既存の柱型検出器は、高さ寸法と大きな数値分布差に沿って情報損失を被っている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 23:51:42 GMT)
FreeLong++: Training-Free Long Video Generation via Multi-band SpectralFusion [24.5] FreeLongは、Denoisingプロセス中の長いビデオ機能の頻度分布のバランスをとるために設計された、トレーニング不要のフレームワークである。
FreeLongは、全ビデオの全体的意味をキャプチャするグローバルな低周波特徴と、短い時間窓から抽出された局所的な高周波特徴をブレンドすることで、これを実現している。
FreeLong++はFreeLongを複数の注意枝を持つマルチブランチアーキテクチャに拡張し、それぞれが異なる時間スケールで動作する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:11:21 GMT)
General Signal Model and Capacity Limit for Rydberg Quantum Information System [24.4] Rydberg原子受信機は、高感度、ブロードバンド、無線周波数(RF)受信を実現するための変換アプローチである。
既存のRydberg原子レシーバーの静的信号モデルは、原子量子状態の定常的な仮定に依存している。
本稿では,Rydberg原子受信機の動的信号応答を閉形式で計算する一般モデルを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 01:36:06 GMT)
RefVSR++: Exploiting Reference Inputs for Reference-based Video Super-resolution [24.3] ビデオ超解像(VSR)への革新的アプローチを提案する。
この方法は、高解像度参照(Ref)ビデオを活用することにより、低解像度(LR)ビデオのVSR性能を向上させる。
本稿では,LRとRef画像の時間方向の並列アグリゲーションを行うRefVSR++の改良手法を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:12:57 GMT)
Double Q-learning for Value-based Deep Reinforcement Learning, Revisited [24.2] ダブルQラーニング(Double Q-learning)は、Qラーニングの過大評価に対処するために導入されたアルゴリズムである。
本稿では,この2次Q-ラーニングのコアアイデアを,価値に基づく深層RLに適用するアルゴリズムについて検討する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:32:46 GMT)
FlexRAG: A Flexible and Comprehensive Framework for Retrieval-Augmented Generation [24.0] RAGは現代の大規模言語モデルアプリケーションにおいて重要な役割を担い、多くの既存のフレームワークが幅広い機能を提供している。
アルゴリズムの複製と共有の難しさなど,これらのフレームワークにおけるいくつかの永続的な課題を特定してきた。
これらの制限に対処するために、研究とプロトタイプ用に特別に設計されたオープンソースフレームワークである textbfFlexRAG を紹介します。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:45:43 GMT)
Empirical evidence of Large Language Model's influence on human spoken communication [23.9] 文化パターンが人間の言語に伝達し、究極的には人間の文化を形成するかを研究する。
360,445のYouTube学術講演と71,591の会話ポッドキャストエピソードから、740,249時間の人間談話に因果推論手法を適用した。
本研究は,ChatGPT が優先的に生成する単語,例えば delve , comprehend , boast , swift , meticulous などの測定可能かつ急激な増加を検知する。
これは、文化的な特性が人間と機械の間で双方向に循環する、閉ざされた文化的フィードバックループの始まりである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:43:32 GMT)
Edit360: 2D Image Edits to 3D Assets from Any Angle [23.8] Edit360は、一貫した3D編集に2D修正を拡張する、チューニング不要のフレームワークである。
2D修正のためのアンカービューを選択し、360度範囲全体の編集をプロパゲートする。
結果として編集されたマルチビューシーケンスは、高品質な3Dアセットの再構築を促進する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:13:23 GMT)
Concept-based Adversarial Attack: a Probabilistic Perspective [23.6] 本稿では,単一イメージの摂動を超越した,概念に基づく敵攻撃フレームワークを提案する。
本手法は,1つのイメージを修正するのではなく,様々な逆の例を生成するために,概念全体の操作を行う。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:18:15 GMT)
Pyramidal Patchification Flow for Visual Generation [23.5] 拡散変換器(DiT)はPatchifyを採用し、パッチ表現を線形射影を通してトークン表現にマッピングする。
大規模なパッチサイズは、高雑音時間ステップと低雑音時間ステップのための小さなパッチサイズに使用される。
スクラッチからトレーニングすることで、SiT-B/2よりも1.6タイム(2.0times$)の推論速度を達成し、2レベル(3レベル)のピラミッドのパッチ化を実現している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:29:24 GMT)
Addressing the Inconsistency in Bayesian Deep Learning via Generalized Laplace Approximation [23.2] 一般化されたラプラス近似を導入し、正規化損失のヘシアン計算に簡単な修正しか必要としない。
提案手法を最先端のニューラルネットワークと実世界のデータセットで評価し,一般化されたラプラス近似が予測性能を向上させることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:20:59 GMT)
A system capable of verifiably and privately screening global DNA synthesis [23.0] SecureDNAは、30以上のヌクレオチドの全てのDNA合成順序をスクリーニングできる、自由で、プライバシー保護され、完全に自動化されたシステムである。
SecureDNAは、米国、ヨーロッパ、中国のプロバイダによって合成された6700万個のヌクレオチドに応用できる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:42:39 GMT)
ADReFT: Adaptive Decision Repair for Safe Autonomous Driving via Reinforcement Fine-Tuning [22.8] 自律運転システムに対する適応決定修復(ADreFT)を提案する。
ADReFTは、失敗するテストからのオフライン学習を通じて安全クリティカルな状態を識別し、適切な緩和アクションを生成する。
評価結果から,ADReFTによる補修性能の向上が示唆された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:29:36 GMT)
Brain-inspired and Self-based Artificial Intelligence [22.7] 機械が人間レベルの知性を達成できるかを評価するチューリングテストは、AIのルーツのひとつです。
この論文は、現在のAIが支援している「思考機械」という概念に挑戦する。
現在の人工知能は、一見知的な情報処理であり、自分自身を真に理解したり、自覚したりしない。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 01:37:22 GMT)
Multimodal, Multi-Disease Medical Imaging Foundation Model (MerMED-FM) [22.7] 我々は,自己教師付き学習とメモリモジュールを用いて学習した,最先端のマルチモーダル基盤モデルであるMerMED-FMを開発した。
MerMED-FMは10以上の専門品と7つのモダリティから330万枚の医療画像で訓練された。
AUROCは0.988(皮膚)、0.982(病理)、0.951(US)、0.943(CT)、0.931(CFP)、0.894(CXR)の全てのモードで強い性能が達成された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:50:31 GMT)
Visual Privacy Management with Generative AI for Blind and Low-Vision People [22.4] 本研究は,視力・視力の低い個人に対する現在の実践と今後の設計の嗜好について,インタビュースタディを通じて検討する。
我々の発見は、プライバシ、効率、感情的なエージェンシーのバランスをとるGenAIの現在の実践の幅を明らかにします。
我々は、GenAIを通じてユーザ中心の視覚的プライバシをサポートするための実用的なデザインレコメンデーションで締めくくります。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:55:21 GMT)
Visual Textualization for Image Prompted Object Detection [22.2] VisTex-OVLMは、オブジェクトレベルの視覚言語モデルを強化するために、テキスト機能空間にいくつかの視覚的な例を投影している。
VisTex-OVLMは、テキストプロンプトと共にOVLMを効果的にガイドする視覚トークンを生成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:27:35 GMT)
FADRM: Fast and Accurate Data Residual Matching for Dataset Distillation [21.9] 残余接続は、モデルアーキテクチャレベルで広く研究され、広く応用されている。
データレシダルマッチングの概念を初めて導入し、データレベルのスキップ接続を活用してデータ生成を容易にし、データ情報の消滅を緩和する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:59:34 GMT)
GUNNEL: Guided Mixup Augmentation and Multi-Model Fusion for Aquatic Animal Segmentation [21.9] 我々は「水生動物種」と呼ばれる新しいデータセットを構築した
GUided mixup augmeNtatioN および multi-El fusion for aquatic animal segmentation (GUNNEL) を考案した。
実験により、既存の最先端のインスタンスセグメンテーション手法よりも提案したフレームワークの方が優れていることが示された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:54:42 GMT)
Visual Re-Ranking with Non-Visual Side Information [21.8] 本稿では,他の種類のサイド情報を活用可能なグラフニューラルネットワークを用いたリグレード手法を提案する。
実験では、画像検索の指標だけでなく、下流の視覚的ローカライゼーションタスクにも大きな改善が見られた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:48:14 GMT)
Embedding-based Retrieval in Multimodal Content Moderation [20.9] 従来の分類手法を補完するために, 埋め込み型検索法(EBR)を提案する。
EBRはアクションレートを10.32%引き上げ、運用コストを80%以上削減し、解釈可能性と柔軟性を向上させる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:11:25 GMT)
Sample Margin-Aware Recalibration of Temperature Scaling [20.9] 近年のディープラーニングの進歩は予測精度を大幅に改善した。
現代のニューラルネットワークは体系的に過信され、安全クリティカルなシナリオに展開するリスクを生じさせる。
本稿では,上位2つのロジット間のマージンに基づいて,ロジットを正確にスケールする軽量でデータ効率の高いリカバリ手法を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:35:05 GMT)
MotionGPT3: Human Motion as a Second Modality [20.8] 人間の動きを第2のモーダルとして扱うバイモーダルモーション言語モデルであるMotionGPT3を提案する。
言語知性を維持するために、テキストブランチは、事前訓練された言語モデルの本来の構造とパラメータを保持する。
本手法は,動作理解タスクと生成タスクの両方において,競合性能を実現する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:42:22 GMT)
Flow-Through Tensors: A Unified Computational Graph Architecture for Multi-Layer Transportation Network Optimization [20.7] Flow Throughs (FTT) は、原点のフロー、経路、確率、およびリンク移動時間を相互接続テンソルとして接続する統一的な計算グラフアーキテクチャである。
まず、以前に分離されたモデリング要素間で勾配に基づく最適化を可能にする一貫した数学的構造を確立する。
第2に、システム効率の正確な定量化により、時間、空間、ユーザグループのトラフィックパターンの多次元解析をサポートする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:42:23 GMT)
High-mobility heavy quasiparticles in a van der Waals antiferromagnetic dense Kondo lattice CeTe$_3$ [20.5] 2次元ファンデルワールス(vdW)材料は、高いキャリア移動性とチューニング性を示す。
高いモビリティと強い相関を持つvdW材料を特定することは困難である。
低温におけるCeTe$_3$の有効質量増強効果を観察した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:27:56 GMT)
ECG-Byte: A Tokenizer for End-to-End Generative Electrocardiogram Language Modeling [20.5] 大規模言語モデル(LLMs)は、心電図(ECGs)への応用を含む、ドメイン間での例外的な汎用性を実証している。
本稿では,ECGの自動回帰言語モデリングのための適応バイトペア符号化(BPE)トークン化パイプラインであるECG-Byteを提案する。
従来の2段階法で必要とされるデータの48%しか使用せず,3倍高速なトレーニングをしながら,競争力のあるNLG性能を実現する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:12:19 GMT)
Oneta: Multi-Style Image Enhancement Using Eigentransformation Functions [20.5] マルチスタイル画像強調のための最初のアルゴリズムであるOnetaが提案されている。
変換関数(TF)による強度向上と色補正行列(CCM)による色補正である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:36:11 GMT)
PGOV3D: Open-Vocabulary 3D Semantic Segmentation with Partial-to-Global Curriculum [20.2] PGOV3Dはオープンな3Dセマンティックセマンティックセグメンテーションを改善するための部分言語カリキュラムを導入した新しいフレームワークである。
我々は、密接な意味情報を提供する部分的なシーンでモデルを事前訓練するが、比較的単純な幾何学である。
第2段階では、よりスペーサーで構造的に複雑である、完全なシーンレベルの点雲上でモデルを微調整する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:13:07 GMT)
SGD with Adaptive Preconditioning: Unified Analysis and Momentum Acceleration [19.6] 適応型プレコンディショニングによる勾配降下(SGD)の統一収束解析を開発した。
我々は最近提案された2つのアルゴリズムであるScionとDASGOの基本的な関係を確立する。
AdaGrad型アルゴリズムが対角的前提条件と運動量の両方から同時に恩恵を受けることができるという最初の理論的正当性を得る。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:47:10 GMT)
TabReason: A Reinforcement Learning-Enhanced Reasoning LLM for Explainable Tabular Data Prediction [19.4] 大規模言語モデル(LLM)は、人間のような推論や説明を生成する強力な能力を示している。
本稿では,より正確で説明可能な予測を行うために,強化学習を用いて学習した推論に基づくLLMを活用する新しい手法を提案する。
提案手法では,予測精度の向上だけでなく,予測に対する人間の理解可能な理由をモデルに導くカスタム報酬関数を導入している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:01:55 GMT)
MSF: Efficient Diffusion Model Via Multi-Scale Latent Factorize [18.7] マルチスケールの潜在因数分解を利用した拡散フレームワークを提案する。
我々のフレームワークは、事前訓練された変分オートエンコーダから遅延する特徴を低周波ベース信号に分解する。
提案アーキテクチャは,残差学習段階におけるサンプリングステップの削減を容易にする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:57:33 GMT)
Experimenting, Fast and Slow: Bayesian Optimization of Long-term Outcomes with Online Experiments [18.7] 意思決定者は、システム変更の長期的な治療効果を最適化したいと考えています。
高速な実験(例えば、偏りのある実験は数時間から数日しか実行されない)と長時間の遅い実験を組み合わせた新しいアプローチについて述べる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:42:40 GMT)
FinEval-KR: A Financial Domain Evaluation Framework for Large Language Models' Knowledge and Reasoning [18.7] FinEval-KRは、大規模言語モデルの知識と推論能力の定量化のための新しい評価フレームワークである。
認知科学に触発されて,様々な認知レベルのタスクを推論する能力を分析する認知スコアを提案する。
実験の結果,LLM推論能力と高次認知能力が推論精度に影響を与える中核的な要因であることが判明した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:42:45 GMT)
Pruning by Block Benefit: Exploring the Properties of Vision Transformer Blocks during Domain Adaptation [18.2] Pruning by Block Benefit (P3B) は、ブロックレベルの相対的寄与を利用してパラメータリソースをグローバルに割り当てるプルーニング手法である。
P3Bは高い性能を保ちながら、70%のパラメータ還元率を持つ高疎度な状態でも0.64%の精度しか失わない。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:58:25 GMT)
Riddle Me This! Stealthy Membership Inference for Retrieval-Augmented Generation [18.1] 本稿では,RAGデータストア内の文書を対象としたメンバシップ推論手法であるInterrogation Attack (IA)を提案する。
ステルス性を維持しながら、たった30クエリで推論に成功したことを実証します。
我々は,様々なRAG構成に対する事前推論攻撃に対して,TPR@1%FPRの2倍の改善が観察された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:37:59 GMT)
Performance of LLMs on Stochastic Modeling Operations Research Problems: From Theory to Practice [18.0] 大規模言語モデル(LLM)は、さまざまな領域にまたがる専門家レベルの能力を示している。
しかし、オペレーティング・リサーチ(OR)における問題の解決能力はいまだ未解明のままである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:54:15 GMT)
Proteus-ID: ID-Consistent and Motion-Coherent Video Customization [17.8] ビデオアイデンティティのカスタマイズは、単一の参照画像とテキストプロンプトを与えられた特定の主題の現実的で時間的に整合したビデオを合成しようとする。
この課題は、説明された外観や動作と整合しながらアイデンティティの整合性を維持すること、非現実的な剛性のない自然な流体運動を生成することである。
Proteus-IDは、アイデンティティ一貫性とモーションコヒーレントなビデオカスタマイズのための、新しい拡散ベースのフレームワークである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:05:32 GMT)
AWF: Adaptive Weight Fusion for Enhanced Class Incremental Semantic Segmentation [17.8] 本稿では,アダプティブ・ウェイト・フュージョン (Adaptive Weight Fusion, AWF) と呼ばれる拡張アプローチを提案する。
AWFは、古い知識の保持と新しいクラスの学習とのバランスを改善し、ベンチマークCISSタスクの結果を大幅に改善することで、優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:15:38 GMT)
UltraTwin: Towards Cardiac Anatomical Twin Generation from Multi-view 2D Ultrasound [17.7] 心解剖学的双生児(心解剖学的双生児)をスパース・マルチビュー2D USから得るための新しい生成フレームワークであるUltraTwinを導入する。
まず、厳密にペア化されたマルチビューUSとCTを含む現実的で高品質なデータセットの構築を開拓した。
第二に、階層的再構成最適化を実現するための粗大きめのスキームを提案する。
第三に、トポロジ対応制約に対する暗黙のオートエンコーダを導入する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:27:42 GMT)
Spatio-Temporal Representation Decoupling and Enhancement for Federated Instrument Segmentation in Surgical Videos [17.2] 我々は、パーソナライズされたFLスキーム、時空間表現デカップリングと拡張(FedST)を提案する。
FedSTは、局所サイトトレーニングとグローバルサーバトレーニングの両方において、外科的ドメイン知識を賢く活用し、セグメンテーションを強化する。
我々のモデルは、ローカルサイトトレーニングにおいてRepresentation separation and Cooperation(RSC)メカニズムを採用し、クエリの埋め込み層を個別に分離し、それぞれのバックグラウンドをエンコードする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:08:02 GMT)
Adapt Your Body: Mitigating Proprioception Shifts in Imitation Learning [16.8] 本研究は, プロプレッセプティブ状態の分布が, トレーニングと展開の間に大きく異なるという, プロプレッセプションシフト問題として, 根底にある課題を同定する。
デプロイ中に収集したロールアウトデータを利用してギャップを埋めるドメイン適応フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:09:14 GMT)
RCA: Region Conditioned Adaptation for Visual Abductive Reasoning [16.8] 領域条件適応は、視覚的帰納的推論のためのパラメータ効率の良い微調整法である。
局所的なヒント」と「グローバルな文脈」をCLIPモデルの視覚的プロンプトに細粒度と粗粒度を別々にエンコードする。
我々は、視覚的特徴をリテラル記述と妥当な説明の特徴へ同時に回帰させるために、コントラスト損失を修正した新しいモデルを訓練する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:03:13 GMT)
A unified framework on the universal approximation of transformer-type architectures [16.8] 変換器型アーキテクチャの普遍近似特性(UAP)について検討する。
我々の研究は、トークンの識別性をUAPの基本的な要件として認識している。
各種の注意機構を持つ変圧器のUAPを証明し,本フレームワークの適用性を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:50:39 GMT)
GLS: Geometry-aware 3D Language Gaussian Splatting [16.6] 本稿では3DGSに基づく3次元表面再構成と開語彙分割の統一的な枠組みを提案する。
室内表面の再構成では,表面の正規化を幾何学的キューとして導入し,通常の誤差を用いて描画深度を最適化する。
3次元オープンボキャブラリセグメンテーションでは,2次元CLIP機能を用いてインスタンスの特徴をガイドし,表面の滑らかさを高め,DEVAマスクを用いて視界の整合性を維持する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:48:34 GMT)
Reconciling Attribute and Structural Anomalies for Improved Graph Anomaly Detection [16.6] TripleADは相互蒸留に基づく三チャンネルグラフ異常検出フレームワークである。
属性、構造、混合異常を識別する3つの推定モジュールを含んでいる。
大規模な実験は、強力なベースラインに対して提案されたTripleADモデルの有効性を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:23:32 GMT)
A New Perspective On AI Safety Through Control Theory Methodologies [16.5] AIは新たなレベルの自律性を達成することを約束するが、安全保証の欠如によって妨げられている。
本稿では、基礎となるデータ生成プロセスの学際的解釈に基づいて、AI安全性に関する新たな視点を概説する。
新たな視点は、データコントロールとも呼ばれ、AIエンジニアリングを刺激し、既存の安全分析と保証を活用することを目的としている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:26:59 GMT)
Refined climatologies of future precipitation over High Mountain Asia using probabilistic ensemble learning [16.5] 高山アジアは極域外で最も凍った水が集中しており、19億人以上にとって重要な水源となっている。
13の地域気候モデルから月次降水量を組み合わせた確率論的機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:44:56 GMT)
Mechanistic Interpretability of Emotion Inference in Large Language Models [16.4] 感情表現は大規模言語モデルにおいて特定の領域に機能的に局所化されていることを示す。
我々は,環境刺激の評価から感情が出現することを示すための認知的評価理論を導いた。
この研究は、因果的に介入し、感情的なテキスト生成を正確に形作る新しい方法を強調している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 00:37:41 GMT)
UMA: A Family of Universal Models for Atoms [16.3] 我々は、スピード、精度、一般化のフロンティアを推し進めるために設計されたUniversal Models for Atoms (UMA) のファミリーを提示する。
UMAモデルは、複数の化学ドメインにまたがるデータをコンパイルすることで、5億のユニークな3D原子構造で訓練されている。
複数のドメインにまたがる多様なアプリケーション上でのUMAモデルの評価を行い、驚くほど、微調整のない単一モデルでも、専門モデルと同じような、あるいはより優れた性能を発揮できることを示した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:38:13 GMT)
Fuzzing: Randomness? Reasoning! Efficient Directed Fuzzing via Large Language Models [16.2] ランダム性はファジングの効率を著しく低下させ、バグを暴露するのに数日や数週間かかる。
我々は,大言語モデル (LLM) を提案し, 種子のランダム性を除去し, ミュータのランダム性を低減した。
LLMは、事前に決定された場所をターゲットにしたリーチ可能な種を生成し、特定のバグに適したバグ特異的ミュータを構築するために使用することができる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:33:52 GMT)
StepProof: Step-by-step verification of natural language mathematical proofs [16.2] 本稿では,ステップ・バイ・ステップ検証のための新しい自動形式化手法であるStepProofを提案する。
StepProofは、完全な証明を複数の検証可能なサブプロテクションに分解し、文レベルの検証を可能にする。
StepProofは従来の手法に比べて証明成功率と効率を著しく改善することを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:59:44 GMT)
When Test-Time Adaptation Meets Self-Supervised Models [15.9] テストタイムデータのトレーニングにより、ディープラーニングモデルが動的環境変化に適応することが可能になる。
本稿では,テスト時間適応(TTA)手法が自己教師付き学習(SSL)によってトレーニングされたモデルを継続的に改善できるかどうかを検討する。
本稿では,SSLとTTAモデルを統合した協調学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:36:01 GMT)
AI Risk-Management Standards Profile for General-Purpose AI (GPAI) and Foundation Models [15.9] この文書はGPAI/基礎モデルのリスクを特定し、分析し、緩和するためのリスク管理のプラクティスやコントロールを提供する。
この文書は主に、大規模かつ最先端のGPAI/基礎モデルの開発者を対象としている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:18:18 GMT)
KiseKloset: Comprehensive System For Outfit Retrieval, Recommendation, And Try-On [15.8] そこで我々は,服の検索,レコメンデーション,試着のための新しい総合的なKiseKlosetシステムを提案する。
本稿では,多様なカテゴリから補完的な項目を推薦するトランスフォーマーアーキテクチャを提案する。
我々は、リアルタイム操作、メモリ効率、リアルな出力の維持が可能な軽量で効率的な仮想試行フレームワークを採用している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:25:39 GMT)
Object Retrieval for Visual Question Answering with Outside Knowledge [15.7] 外部知識(OR-OK-VQA)を用いた視覚的質問応答のためのオブジェクト検索タスクを提案する。
このタスクにおける重要な課題は、質問への回答に寄与する多様なオブジェクト関連画像を取得することである。
本稿では,マルチスケールグループ共同埋め込み学習(MS-GCEL)と呼ばれる,教師なしの深層機能埋め込み技術を紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:35:42 GMT)
USP: Unified Self-Supervised Pretraining for Image Generation and Understanding [15.7] Unified Self-supervised Pretraining (USP) は、変分オートエンコーダ(VAE)潜時空間におけるマスク付き潜時モデリングにより拡散モデルを初期化するフレームワークである。
USPは、拡散モデルの収束速度と生成品質を大幅に改善しながら、理解タスクにおいて同等のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:41:53 GMT)
ProSAM: Enhancing the Robustness of SAM-based Visual Reference Segmentation with Probabilistic Prompts [15.6] ProSAMは、既存のSAMベースのビジュアル参照セグメンテーションアプローチにおいて、我々が特定した安定性の課題に対処する、シンプルだが効果的な方法である。
ProSAMは不安定な領域にあるプロンプトの生成を回避し、より堅牢でないプロンプトによって引き起こされる不安定さを克服する。
私たちのアプローチは、Pascal-5$i$とCOCO-20$i$データセットの最先端メソッドを一貫して超越しています。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:55:23 GMT)
Towards Style Alignment in Cross-Cultural Translation [15.3] コミュニケーションの成功は、話者の意図したスタイル(すなわち、話者が伝えようとしているもの)とリスナーの解釈されたスタイル(すなわち、リスナーが知覚するもの)に依存する。
LLMは、中立性に偏り、非西洋言語でより悪い翻訳を行うという、スタイルの翻訳に失敗する。
RASTA(Retrieval-Augmented Staylistic Alignment)は,学習スタイルの概念を活用してLLM翻訳を奨励し,文化的コミュニケーション規範を適切に伝達し,スタイルを整合させる手法である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:37:51 GMT)
Phase-Space Topology in a Single-Atom Synthetic Dimension [15.2] 量子ラビモデルにより記述された単一原子系の合成フォック状態格子の位相的特徴について検討する。
ハミルトニアンを対角化することにより、合成格子のドメイン壁に局在したゼロエネルギー欠陥状態を特定する。
フォック状態格子にバンド位相を適用するという課題に対処するために、位相空間幾何学に基づく位相不変量を導入する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:23:34 GMT)
Interactive Interface For Semantic Segmentation Dataset Synthesis [15.2] 視覚データ合成のためのモジュールプラットフォームであり,ユーザフレンドリなインターフェースであるSynthLabを紹介する。
各モジュールはコンピュータビジョンタスクの異なる側面を処理し、柔軟性と適応性を向上させる。
対話的でユーザフレンドリーなインターフェースにより、ユーザはドラッグ&ドロップアクションを通じて、データパイプラインをすばやくカスタマイズできる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:23:34 GMT)
Bridging Theory and Practice in Link Representation with Graph Neural Networks [15.1] グラフニューラルネットワーク(GNN)は、リンク予測のような下流タスクのためのノードペアの表現を計算するために広く使われている。
既存のメッセージパッシングリンクモデルを仮定する統一フレームワークである$k_phi$-$k_rho$-$m$を導入します。
我々は、リンクの識別の難しさを定量化するグラフ対称性計量を用いて、表現的モデルは標準ベンチマークでは性能が劣るが、対称性が増大するにつれて、より単純なものよりも著しく優れていることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:22:15 GMT)
SP$^2$OT: Semantic-Regularized Progressive Partial Optimal Transport for Imbalanced Clustering [14.9] 本稿では,トランスポートをベースとした新しい擬似ラベル学習フレームワークを提案する。
我々のフレームワークは高品質で不均衡を意識した擬似ラベルを生成する。
CIFAR100を含む様々なデータセットの実験は,本手法の優位性を実証している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:38:20 GMT)
Bridge: A Unified Framework to Knowledge Graph Completion via Language Models and Knowledge Representation [14.8] 我々は、知識グラフ(KG)の構造と意味情報を共同で符号化するブリッジと呼ばれる新しいフレームワークを提案する。
具体的には、PLMのセマンティック知識をよりよく活用するために、PLMによって個別にエンティティと関係を戦略的に符号化する。
我々は、KGとPLMのギャップを埋めるために、BYOLと呼ばれる自己教師付き表現学習法を用いて、3重の異なる2つの視点でPLMを微調整する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 01:26:26 GMT)
InstructionBench: An Instructional Video Understanding Benchmark [14.7] InstructionBenchはインストラクショナルビデオ理解ベンチマークである。
我々は、粗いイベントレベルと細かなオブジェクトレベルの推論の両方を評価するために、オープンエンドおよび複数選択形式のQ&Aペアを定式化する。
このベンチマークには、700本以上のビデオに5Kの質問が含まれている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:41:07 GMT)
What Makes Treatment Effects Identifiable? Characterizations and Estimators Beyond Unconfoundedness [14.7] 平均治療効果の同定を可能にする一般的な条件について検討する。
ATEの同定に十分かつ必要な解釈可能な条件を提供する。
ATEは、事前の作業がキャプチャできないようなレギュレーションで識別可能であることを証明します。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:21:41 GMT)
Mathematical Reasoning for Unmanned Aerial Vehicles: A RAG-Based Approach for Complex Arithmetic Reasoning [14.7] 自律型UAVは、軌道計画や電力管理といったタスクに対して、信頼性の高い数学的推論を必要とする。
本稿では,複数の大規模言語モデルの数学的推論を改善するための検索拡張生成フレームワークであるRAG-UAVを提案する。
実験により, 検索を組み込んだ場合, 解答精度が向上し, 解答精度が最大75%向上し, 不正な定式化選択の事例が減少し, 数値誤差が減少することが確認された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:18:47 GMT)
Dataset Distillation via Vision-Language Category Prototype [14.5] 本稿では,視覚言語を用いて言語情報を抽出し,画像のプロトタイプを用いてデータを協調的に合成する手法を提案する。
このフレームワークは、既存のテキスト記述なしでデータセット全体に適用可能であることを示す。
提案手法は,対象物を含む論理的コヒーレントな画像を生成し,最先端の検証性能を実現し,ロバストな一般化を実証する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:34:33 GMT)
Grounding Creativity in Physics: A Brief Survey of Physical Priors in AIGC [14.5] AI生成コンテンツの最近の進歩は、3Dおよび4D生成のリアリズムを著しく改善した。
既存の手法の多くは、基礎となる物理原理を無視しながら外観整合性を優先している。
本調査では,物理的制約が3次元および4次元生成にどのように組み込まれているかを体系的に解析する物理認識生成法について概説する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:41:19 GMT)
Visual Encoders for Data-Efficient Imitation Learning in Modern Video Games [14.5] 事前学習したビジュアルエンコーダは、トレーニングコストを大幅に削減することで、ビデオゲームにおける意思決定研究をより容易にすることができることを示す。
この結果から,低解像度画像と数分のデモでは,エンドツーエンドのトレーニングが有効であることが示唆された。
実効的な意思決定を可能にすることに加えて,事前学習したエンコーダは,トレーニングコストを大幅に削減することで,ビデオゲームにおける意思決定研究をより容易に行えることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:59:07 GMT)
Parenting: Optimizing Knowledge Selection of Retrieval-Augmented Language Models with Parameter Decoupling and Tailored Tuning [14.4] Retrieval-Augmented Generation (RAG) は、幻覚生成と知識の陳腐化において、Large Language Models (LLM) が直面する問題に対する効果的な解決策を提供する。
本稿では, 親和性と頑健性に関連するパラメータ部分空間を分離し, 識別し, 目的的に最適化する新しいフレームワークであるParentingを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:12:43 GMT)
Vortex Detection from Quantum Data [14.4] 微分方程式に対する量子解は、システムの振る舞いに関する関連する情報を含む量子データを表す。
本稿では,このようなデータから情報を読み取るためのツールボックスを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:41:45 GMT)
FZOO: Fast Zeroth-Order Optimizer for Fine-Tuning Large Language Models towards Adam-Scale Speed [14.4] 我々はAdam-Scale Speedに向けたFast Zeroth-Orderを紹介する。
FZOOは、バッチ化された片側推定を用いて収束に必要な総前方通過を減らす。
また、RademacherランダムベクトルGPUと並列処理を使用することで、バッチ毎の計算を高速化する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:33:12 GMT)
CTISum: A New Benchmark Dataset For Cyber Threat Intelligence Summarization [14.3] サイバー脅威インテリジェンス(CTI)の要約は、Webインテリジェンスデータから簡潔で正確なハイライトを生成する。
CTI要約タスク用に設計された新しいベンチマークデータセットであるCTISumを紹介する。
また、リスク評価、セキュリティギャップの特定、脆弱性の発見などを目的とした、攻撃プロセスの要約という、新たなきめ細かいサブタスクも提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:56:37 GMT)
MadCLIP: Few-shot Medical Anomaly Detection with CLIP [14.0] 医療データに事前訓練されたCLIPモデルを活用する,革新的な数発の異常検出手法を提案する。
学習可能なアダプタを用いて,正常な特徴と異常な特徴を別々に捉えるために,デュアルブランチ設計を提案する。
セマンティックアライメントを改善するために、学習可能なテキストプロンプトを使用して視覚的特徴をリンクする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:56:17 GMT)
Alleviating CoD in Renewable Energy Profile Clustering Using an Optical Quantum Computer [13.9] 本稿ではまず,カーネルベースの量子クラスタリング手法を提案する。
そして、このNPハード問題を準拘束的二項最適化に再構成することができる。
実光量子コンピュータによる実験結果は,提案手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:22:34 GMT)
Semantic-guided Diverse Decoding for Large Language Model [13.8] Semantic-Guided Diverse Decoding (SeemDiD)を紹介する。
SemDiDは3つの相補的なメカニズムによって品質と多様性のバランスをとる。
実験では、SemDiDは既存のメソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:06:49 GMT)
Breaking Out from the TESSERACT: Reassessing ML-based Malware Detection under Spatio-Temporal Drift [13.7] 同時に,学習に基づくマルウェア検出の性能に顕著な違いが認められた。
現実的な評価に影響を与える5つの新しい時間的・空間的バイアス要因を同定する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:01:24 GMT)
User Behavior Prediction as a Generic, Robust, Scalable, and Low-Cost Evaluation Strategy for Estimating Generalization in LLMs [13.7] 我々は、知識検索と推論のタスクは一般化を測るのに理想的ではないと論じる。
我々は、理論的に健全でスケーラブルで堅牢な代替手段として、パーソナライズの重要な側面であるユーザ行動予測を提案する。
本稿では,GPT-4o,GPT-4o-mini,Llama-3.1-8B-Instructの映画および音楽レコメンデーションデータセット上で,このアプローチの新しいフレームワークを紹介した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:14:32 GMT)
Computational Analysis of Character Development in Holocaust Testimonies [13.6] 本研究は,ナラティブ・タイムラインに沿ってキャラクタ開発を分析するための計算手法を提案する。
ホロコーストの生存者証言の書き起こしをテストケースとみなし、それぞれが一人称の言葉で個人の物語を語る。
我々は、生存者の宗教的軌道に焦点をあて、宗教的信念と実践に対する彼らの配置の進化を考察する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:39:21 GMT)
Instant GaussianImage: A Generalizable and Self-Adaptive Image Representation via 2D Gaussian Splatting [13.4] 本稿では,2次元ガウス分割に基づく一般化可能で自己適応的な画像表現フレームワークを提案する。
提案手法では,粗いガウス表現を高速に生成するネットワークを用いて,最小限の微調整を行う。
我々の手法はガウス画像のレンダリング性能と非常に少ないイテレーションと短いトレーニング時間で一致または超えることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:58:52 GMT)
Failure by Interference: Language Models Make Balanced Parentheses Errors When Faulty Mechanisms Overshadow Sound Ones [13.4] 言語モデル(LM)は、バランスの取れた括弧を生成するといった単純な構文的タスクに苦戦している。
本研究により,LMは独立して予測を行う多くのコンポーネントに依存していることが明らかとなった。
本稿では,モデル性能向上のための信頼性の高いコンポーネントの貢献を体系的に同定し,向上するためのステアリング手法であるRASteerを紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 23:35:19 GMT)
MReg: A Novel Regression Model with MoE-based Video Feature Mining for Mitral Regurgitation Diagnosis [13.3] 自動僧帽弁逆流(MReg)診断モデル(MReg)を開発した。
MRegはMRの検出と重症度を評価するための総合的な機能マイニング戦略に従っている。
MRegは、他の弱い教師付きビデオ異常検出法や教師付き分類法と比較して、MRI診断において優れた性能を示した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:22:52 GMT)
A Nonlinear Low-rank Representation Model with Convolutional Neural Network for Imputing Water Quality Data [12.7] 水質データの統合性(WQD)は、科学的意思決定と生態保護のための環境モニタリングにおいて重要である。
従来のデータ計算手法は、潜在的なダイナミクスを描写することは困難であり、深層データの特徴を捉えるのに失敗する。
本稿では,WQDの欠落を補うために,畳み込みニューラルネットワーク(CNN)を用いた低ランク表現モデルを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:48:19 GMT)
Marker Gene Method : Identifying Stable Solutions in a Dynamic Environment [12.6] 競合的共進化アルゴリズム(CCEA)は、しばしば不透過性やレッドクイーン効果のような複雑な力学によって妨げられる。
本稿では,「マーカー遺伝子」を動的ベンチマークとして使用することで安定性を確立するフレームワークであるマーカー遺伝子法(MGM)を紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:13:36 GMT)
Table Understanding and (Multimodal) LLMs: A Cross-Domain Case Study on Scientific vs. Non-Scientific Data [12.6] 表理解タスクにおけるテキストベースLLMとマルチモーダルLLMの両方の有効性について検討する。
我々は, 科学的文脈と非科学的文脈の表上でのパフォーマンスを比較し, 画像として表される表上での頑健さを, テキストで比較した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:04:36 GMT)
Contrastive Learning with Diffusion Features for Weakly Supervised Medical Image Segmentation [12.5] 条件拡散モデル (CDM) は, セグメンテーションマスク生成の代替手段として用いられている。
拡散特徴量を用いたコントラスト学習(CLDF)を導入し,凍結したCDMからセグメンテーションのための低次元埋め込み空間へ拡散特徴量をマッピングするために画素デコーダを訓練する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 01:43:50 GMT)
EfficientXLang: Towards Improving Token Efficiency Through Cross-Lingual Reasoning [12.5] 推論において最もトークン効率のよい言語が英語かどうかを考察する。
非英語言語における推論はトークンの使用量を減少させるだけでなく、正確性も維持する。
改善の程度は、多言語強度のモデルに依存する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:29:52 GMT)
SQUASH: A SWAP-Based Quantum Attack to Sabotage Hybrid Quantum Neural Networks [12.5] 本稿では、分類タスクのためのハイブリッド量子ニューラルネットワーク(HQNN)を妨害する回路レベル攻撃を提案する。
SquaSHは、SWAPゲートを被害者HQNNの変動量子回路に挿入することで実行される。
SQUASHは分類性能を著しく低下させ,未目標のSWAP攻撃は74.08%,目標のSWAP攻撃は79.78%に低下した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:36:31 GMT)
A Joint Topology-Data Fusion Graph Network for Robust Traffic Speed Prediction with Data Anomalism [12.4] 本稿では,ネットワークレベルのトラフィック速度予測のための革新的なフレームワークであるGraph Fusion Enhanced Network (GFEN)を提案する。
GFENは、トレーニング可能な手法を用いて、データ分布とネットワークトポロジの両方から空間時間相関を抽出する。
実験により、GFENは最先端の手法を約6.3%超え、予測精度と収束速度は最近のハイブリッドモデルの約2倍速くなることが示された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:33:47 GMT)
A Survey of LLM-based Automated Program Repair: Taxonomies, Design Paradigms, and Applications [12.4] 大規模言語モデル (LLM) は自動プログラム修復 (APR) を再構築している
我々は2022年1月から2025年6月までに発行された63 LLMベースのAPRシステムを4つのパラダイムに分類した。
微調整は高いトレーニングコストで強力なタスクアライメントを提供する。迅速なデプロイメントを可能にするが、迅速な設計とコンテキストウィンドウによって制限される。
我々は,軽量な人的フィードバック,リポジトリ対応検索,コード解析,コスト対応計画を組み合わせることで,信頼性と効率的なLDMベースのAPRを向上する研究の方向性を概説する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:46:01 GMT)
Spatially Gene Expression Prediction using Dual-Scale Contrastive Learning [12.4] NH2STは、空間的コンテキストと、遺伝子発現予測のための病理と遺伝子モダリティの両方を統合している。
我々のモデルは既存の手法を一貫して上回り、PCCメトリクスの20%以上を達成しています。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:18:39 GMT)
Supercm: Revisiting Clustering for Semi-Supervised Learning [12.3] 本研究では,半教師付き学習(SSL)の基盤となるクラスタリング仮定を明示的に取り入れた新しい手法を提案する。
我々は、アノテートされたデータを利用して、クラスタセントロイドの結果を単純なエンドツーエンドのトレーニング可能なディープSSLアプローチでガイドします。
提案したモデルでは,教師付きベースラインよりもパフォーマンスが向上し,他のSSLメソッドと組み合わせて,パフォーマンスをさらに向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:17:08 GMT)
Linearly Decoding Refused Knowledge in Aligned Language Models [12.2] 本研究では,隠蔽状態に訓練された線形プローブを用いて,ジェイルブレイクプロンプトを介してアクセスされる情報がどのようにデオード可能かを調べた。
驚くべきことに、ベースモデルでトレーニングされたプローブ(拒否しない)が、時々命令調整されたバージョンに転送されることがある。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:13:49 GMT)
Topology-ferrimagnetism intertwining via weak interactions in Lieb lattices [12.1] スピン軌道結合型リーブ格子における磁気トポロジカル状態の研究のための実験的なプラットフォームを提案する。
チャーン数とボット指数で定量化した位相特性の共存を自発対称性を破る順序で観察する。
強相関系における対称性破壊状態とトポロジカル秩序の相互作用を探索する方法を考察した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 22:00:10 GMT)
QLPro: Automated Code Vulnerability Discovery via LLM and Static Code Analysis Integration [12.0] LLMと静的解析ツールを体系的に統合する脆弱性検出フレームワークであるQLProを紹介する。
62の脆弱性が確認されたGitHubから10のオープンソースプロジェクトからなる,新たなデータセットであるJavaTestを構築しました。
最先端の静的分析ツールであるCodeQLは、これらの脆弱性を24つしか検出していないが、QLProは41。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:14:49 GMT)
Error Optimization: Overcoming Exponential Signal Decay in Deep Predictive Coding Networks [12.0] Predictive Coding (PC)は、ニューラルネットワークトレーニングのバックプロパゲーションに生物学的に妥当な代替手段を提供するが、より深いアーキテクチャに苦しむ。
本稿では、勾配が指数関数的に深さに減衰し、数値的精度の制約により計算的に無視できる固有信号減衰問題である根本原因を同定する。
この基本的な制限に対処するため,信号減衰を除去しながらPCの理論特性を保った新しい再パラメータ化であるエラー最適化(EO)を導入する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:02:50 GMT)
Agent.xpu: Efficient Scheduling of Agentic LLM Workloads on Heterogeneous SoC [11.8] 本稿では,メモリ統一ヘテロジニアス SOC 上でのエージェント LLM ワークロードの効率的なサービスシステムである Agent.xpu について紹介する。
Agent.xpuは専用のオフラインプロファイリングにより、アフィニティ誘導弾性加速器マッピングのためにモデルカーネルを融合・チャンクする異種実行グラフを最初に構築した。
実行時に、そのオンラインスケジューラは、粒度の細かいカーネルレベルのプリエンプションを可能にし、リアクティブタスクの応答性を保証する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:50:48 GMT)
Lightweight Temporal Transformer Decomposition for Federated Autonomous Driving [11.8] 本稿では,大規模な注意図を小さな行列に分割することで,時系列画像フレームと時間的ステアリングデータを処理する手法を提案する。
このアプローチはモデルの複雑さを減らし、収束とリアルタイム予測の効率的な重み更新を可能にする。
3つのデータセットの実験により,本手法はリアルタイム性能を達成しつつ,明らかなマージンで近年の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:14:16 GMT)
Fully Parallelized BP Decoding for Quantum LDPC Codes Can Outperform BP-OSD [11.7] 本稿では,信念伝達のみに基づく軽量デコーダを提案する。
提案手法は,BP発振統計を用いて信頼できないビットを識別し,修正されたテストパターンの集合を生成し,低照度BPを用いて並列に復号する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:47:28 GMT)
Imagine for Me: Creative Conceptual Blending of Real Images and Text via Blended Attention [11.7] 人間に対するクロスモーダルな概念ブレンディングは、デザインの固定のような認知バイアスを引き起こす。
本稿では, ブレンディングプロセスの自動化により, 人間の創造性を向上するT2I拡散アダプタ"IT-Blender"を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:41:25 GMT)
VirtualFencer: Generating Fencing Bouts based on Strategies Extracted from In-the-Wild Videos [11.5] 我々は,3Dフェンシング動作と3D動画からの戦略を,監督なしで抽出できるシステムであるVirtualFencerを提案する。
筆者らは,本システムにおいて,(i)自身に対するフェンス(self-play),(ii)オンラインビデオからの実際の剣士の動きに対するフェンス(iii)プロの剣士に対して対話的にフェンスを張ることにより,汎用性を実証した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:55:22 GMT)
AttentionGS: Towards Initialization-Free 3D Gaussian Splatting via Structural Attention [11.4] 3D Gaussian Splatting(3DGS)はNeRF(Neural Radiance Fields)の強力な代替品である
これはStructure-from-Motion(SfM)からの高品質な点雲に依存している。
本稿では,高品質な初期点雲への依存を解消する新しいフレームワークであるAttentionGSを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:16:43 GMT)
Puzzles: Unbounded Video-Depth Augmentation for Scalable End-to-End 3D Reconstruction [11.4] 本稿では,1枚の画像やビデオクリップから高品質な映像深度データを合成するデータ拡張戦略であるPuzzlesを紹介する。
実験によると、Puzzlesを既存のビデオベースの3D再構成パイプラインに統合することは、基盤となるネットワークアーキテクチャを変更することなく、一貫してパフォーマンスを向上させる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:57:24 GMT)
LibVulnWatch: A Deep Assessment Agent System and Leaderboard for Uncovering Hidden Vulnerabilities in Open-Source AI Libraries [11.3] オープンソースのAIライブラリは、現代のAIシステムの基礎となっているが、セキュリティ、ライセンス、メンテナンス、サプライチェーンの整合性、規制コンプライアンスといった、重大な、過小評価されたリスクがある。
LibVulnWatchは,大規模言語モデルとエージェントの最近の進歩を利用して,これらのライブラリの深いエビデンスに基づく評価を行うシステムである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:31:53 GMT)
CPT: Competence-progressive Training Strategy for Few-shot Node Classification [11.2] グラフニューラルネットワーク(GNN)はノード分類に大きな進歩を遂げているが、その成功はトレーニングデータ内のクラス毎の十分なラベル付きノードに依存している。
伝統的なエピソディックなメタラーニングアプローチはこの領域で有望であるが、固有の制限に直面している。
メタラーナーのプログレッシブ・コンピテンスにタスクの難易度を合わせる2段階のカリキュラム学習手法であるCPTを紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:31:11 GMT)
RLCAD: Reinforcement Learning Training Gym for Revolution Involved CAD Command Sequence Generation [11.1] CAD幾何エンジン上に構築した強化学習学習環境(ジャム)を提案する。
我々は、B-Repジオメトリからコマンドシーケンスを生成する際に、最先端のSOTA(State-of-the-art)品質を実現する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:40:00 GMT)
Gumiho: A Hybrid Architecture to Prioritize Early Tokens in Speculative Decoding [11.1] 投機的復号化は、ターゲットの大規模言語モデルの自動回帰トークン生成プロセスを加速することを目的としている。
いくつかのアプローチでは、複数のヘッドを持つドラフトモデルを使用して、各ヘッドがシーケンス内のトークンを処理する将来のトークンのシーケンスを予測する。
本稿では,シリアルヘッドと並列ヘッドを組み合わせたハイブリッドモデルであるGumihoを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:51:00 GMT)
SurgiSR4K: A High-Resolution Endoscopic Video Dataset for Robotic-Assisted Minimally Invasive Procedures [11.0] SurgiSR4Kは、ネイティブ4K解像度で撮影された、初めて公開された外科画像とビデオデータセットである。
このデータセットは、高解像度データから恩恵を受ける可能性のある幅広いコンピュータビジョンタスクの可能性を開く。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:23:57 GMT)
Reward Balancing Revisited: Enhancing Offline Reinforcement Learning for Recommender Systems [11.0] 本稿ではReallocated Reward for Recommender Systems (R3S)と呼ばれる革新的なオフラインRLフレームワークを提案する。
報酬予測における本質的な変動に対処するために本質的なモデルの不確実性を統合することにより、意思決定のための多様性を高め、よりインタラクティブなパラダイムと整合させる。
実験の結果,R3Sは世界モデルの精度を向上し,ユーザの不均一な嗜好を効率的に調和させることがわかった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:57:33 GMT)
Accurate and lightweight dehazing via multi-receptive-field non-local network and novel contrastive regularization [10.9] 本稿では,マルチ受信フィールド非局所ネットワーク(MRFNLN)を提案する。
マルチストリーム機能アテンションブロック(MSFAB)とクロス非ローカルブロック(CNLB)として設計されている。
これは、150万のパラメータ未満の最近の最先端の脱ハージング手法よりも優れています。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:51:31 GMT)
Privacy-Preserving Federated Learning Scheme with Mitigating Model Poisoning Attacks: Vulnerabilities and Countermeasures [10.9] 本稿では,プライバシー保護とビザンチン・ロバスト・フェデレーション・ラーニング・スキームの強化を提案する。
本手法は, モデル中毒に対するプライバシー保護とレジリエンスを保証する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:39:01 GMT)
QPART: Adaptive Model Quantization and Dynamic Workload Balancing for Accuracy-aware Edge Inference [10.6] 要求固有のモデルによる推論パターンをデバイスの計算能力に合わせて計画することは、多様なシナリオに対してよりコスト効率が高く、堅牢である、と我々は主張する。
本稿では,共同モデル量子化と推論分割を統合した,精度の高いワークロードバランス推論システムを提案する。
シミュレーションの結果、全体の時間と消費電力が大幅に減少し、ペイロードは80%以上減少し、精度は1%以下に抑えられた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:03:35 GMT)
Minimax and Bayes Optimal Best-arm Identification: Adaptive Experimental Design for Treatment Choice [10.5] 適応的手順は, 治療-選別相と治療-選別相の順応性を考える。
我々は、最適な治療アームを効率的に識別するために、この設定のための適応的な実験を設計する。
この単一設計は、単純な後悔に対して、同時にミニマックスとベイズが最適であることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:11:44 GMT)
Improving vulnerability type prediction and line-level detection via adversarial training-based data augmentation and multi-task learning [10.4] MTL(Multi-task Learning)とEDAT( Embedding-Layer-Driven Adversarial Training)を統合する統一的なアプローチを提案する。
提案手法は,VTP(Vulnerability Type Prediction)タスクとLVD(Line-level Vulnerability Detection)タスクの両方において,最先端のベースラインよりも優れている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:47:09 GMT)
MedSAM-CA: A CNN-Augmented ViT with Attention-Enhanced Multi-Scale Fusion for Medical Image Segmentation [10.4] アーキテクチャレベルの微調整手法であるMedSAM-CAを提案する。
皮膚内視鏡のデータセットでは、MedSAM-CAは全トレーニングデータのわずか2%で94.43%のDiceを達成し、全データトレーニングパフォーマンスの97.25%に達した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:24:29 GMT)
Minimax Optimal Two-Stage Algorithm For Moment Estimation Under Covariate Shift [10.4] ソースとターゲットの分布が分かっている場合,問題の最小境界について検討する。
具体的には、まず、ソース分布の下で関数の最適推定器を訓練し、その後、モーメント推定器を校正する確率比再重み付け手順を使用する。
この問題を解決するために、二重ロバスト性を確保し、対応する上界を与える推定器の切り離されたバージョンを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 01:32:36 GMT)
RAG-R1 : Incentivize the Search and Reasoning Capabilities of LLMs through Multi-query Parallelism [10.3] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。
静的な内部知識のために、幻覚や時代遅れの応答を発生させる傾向にある。
Retrieval-Augmented Generation(RAG)法の最近の進歩は、モデルの探索と推論能力の向上を探求している。
LLMが内部知識と外部知識を適応的に活用できるように設計された新しいトレーニングフレームワークであるRAG-R1を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:02:45 GMT)
From Tea Leaves to System Maps: Context-awareness in Monitoring Operational Machine Learning Models [10.2] 本稿では,この領域における様々な種類の文脈情報の特徴と構造を体系的に検討する。
本稿では,これらの知見を合成する概念モデルであるC-SAR(Contextual System-Aspect-Representation)フレームワークを紹介する。
また、特定のシステム、アスペクト、表現のパターンを20の繰り返し再利用可能なパターンを特定し、それらがサポートするモニタリングアクティビティにマッピングする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:43:41 GMT)
Uncertainty-aware Diffusion and Reinforcement Learning for Joint Plane Localization and Anomaly Diagnosis in 3D Ultrasound [10.0] 先天性子宮奇形(CUA)は不妊、流産、妊娠前出生、妊娠合併症のリスクの増加につながる。
本稿では,自動航空機位置推定とCUA診断を同時に行うインテリジェントシステムを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:07:41 GMT)
Towards foundational LiDAR world models with efficient latent flow matching [9.9] 既存のLiDARワールドモデルは狭義に訓練されており、それぞれのモデルは構築されたドメインに限られる。
3つの要求シナリオにまたがる最初の体系的ドメイン転送研究を行う。
微調整データの量が異なるため,実験の結果,1つの事前学習モデルで最大11%の絶対的改善が達成できることがわかった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 00:16:55 GMT)
When Small Guides Large: Cross-Model Co-Learning for Test-Time Adaptation [9.8] テスト時間適応(TTA)は、オンラインの教師なし学習を通じて、潜在的なドメインシフトを持つドメインデータをテストするために、所定のモデルを適用する。
主に2つの戦略から構成されるTTAのクロスモデル・コラーニングフレームワークであるCOCAを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:54:50 GMT)
Data Uniformity Improves Training Efficiency and More, with a Convergence Framework Beyond the NTK Regime [9.7] より均一に分散したデータを選択することで、トレーニング効率が向上し、性能が向上することを示す。
具体的には、より均一な(バイアスのない)分布が、データポイント間の最小ペア距離を大きくすることを示す。
理論的には、ニューラルネットワークの近似誤差は、h_min$が増加するにつれて減少する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:58:30 GMT)
EFRame: Deeper Reasoning via Exploration-Filter-Replay Reinforcement Learning Framework [9.7] EFRame(Exploration-Filtering-Replay)は,GRPOを3つの重要な次元で体系的に拡張するフレームワークである。
EFRameは完全な安定した学習サイクルを確立し、探索から収束までの構造化された遷移を通じてモデルを導く。
実験の結果,EFRameはトレーニングの堅牢性や効率性を向上するだけでなく,バニラGRPOの下では実現不可能な深い推論能力にもアクセス可能であることがわかった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:33:48 GMT)
Beyond Low-Rank Tuning: Model Prior-Guided Rank Allocation for Effective Transfer in Low-Data and Large-Gap Regimes [9.5] Low-Rank Adaptation (LoRA) は、完全に微調整された基礎モデルに匹敵する性能を維持しながら、計算コストを削減できることが証明されている。
現在の適応LoRA法は、ランクを動的に拡張または選択的に割り当てることで、この制限を克服しようとする。
本稿では, 既訓練重量行列の安定なランクを, 階層的ランクアロケーションの自然な先行として活用する新しいフレームワークSR-LoRAを紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 23:54:23 GMT)
MamNet: A Novel Hybrid Model for Time-Series Forecasting and Frequency Pattern Analysis in Network Traffic [9.4] 本稿では,新しいネットワークトラフィック予測と異常検出モデルであるMamNetを提案する。
時間領域モデリングと周波数領域の特徴抽出を統合している。
UNSW-NB15とCAIDAデータセットで実施された実験は、MamNetが最近の主流モデルより優れていることを示している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 22:44:07 GMT)
Mamba-FETrack V2: Revisiting State Space Model for Frame-Event based Visual Object Tracking [9.4] 線形複雑ビジョン・マンバネットワークに基づく効率的なRGB-Eventオブジェクト追跡フレームワークを提案する。
ソースコードと事前トレーニングされたモデルはhttps://github.com/Event-AHU/Mamba_FETrack.comで公開される。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:24:01 GMT)
pUniFind: a unified large pre-trained deep learning model pushing the limit of mass spectra interpretation [9.3] pUniFindは、エンド・ツー・エンドのペプチド・スペクトルスコアとオープン・ゼロショット・デ・ノボシークエンシングを統合している。
免疫ペプチドミクスでは、同定されたペプチドの数が42.6%増加する。
pUniFindは、300倍の検索スペースがあるにもかかわらず、既存のde novoメソッドよりも60%多いPSMを識別する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:32:39 GMT)
Training of Spiking Neural Networks with Expectation-Propagation [9.2] スパイキングニューラルネットワーク(SNN)のトレーニングのための統一メッセージパッシングフレームワークを提案する。
本手法は,ネットワークパラメータの辺り分布を学習し,隠れ層の出力などのパラメータの辺縁化を同時に行うことができる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:59:56 GMT)
Are AI-Generated Fixes Secure? Analyzing LLM and Agent Patches on SWE-bench [9.2] 我々は,SWE-benchデータセットから2万以上の問題を用いて,LLM生成パッチの大規模セキュリティ解析を行った。
スタンドアロンのLCM(Llama 3.3)によるパッチを評価し,開発者によるパッチと比較した。
また、データのサブセットに基づいて、トップパフォーマンスのエージェントフレームワーク(OpenHands、AutoCodeRover、HoneyComb)3つによって生成されたパッチのセキュリティを評価します。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:10:19 GMT)
L0: Reinforcement Learning to Become General Agents [9.2] 汎用エージェントのためのスケーラブルでエンドツーエンドのトレーニングパイプラインであるL-Zero(L0)を紹介する。
L0 内のエージェント足場である NB-Agent は Read-Eval-Print-Loop (REPL) を介して "code-as-action" 方式で動作している。
RLVR(Reinforcement Learning with Verifiable Rewards)のみを用いて,ベースモデルによる堅牢な問題解決技術の開発が実証された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:44:32 GMT)
Mesh-Learner: Texturing Mesh with Spherical Harmonics [9.0] Mesh-Learnerは従来のパイプラインと互換性のある3D再構築およびレンダリングフレームワークである。
メッシュと球面調和(SH)テクスチャを学習プロセスに統合し、各メッシュのビュー依存のエンドツーエンドを学習する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:22:18 GMT)
Evaluation of Geolocation Capabilities of Multimodal Large Language Models and Analysis of Associated Privacy Risks [9.0] MLLMは、視覚コンテンツのみに基づいて画像の位置を推測することができる。
これは、doxx、監視、その他のセキュリティ脅威を含む、プライバシー侵害の深刻なリスクを引き起こす。
最も先進的な視覚モデルは、1kmの範囲内で最大49%の精度でストリートレベルの画像の起源をローカライズすることができる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:05:30 GMT)
A Large-Scale Evolvable Dataset for Model Context Protocol Ecosystem and Security Analysis [8.9] 約14KのMPPサーバと300のMPPクライアントを含む大規模データセットであるMCPCorpusを紹介する。
各アーティファクトには、アイデンティティ、インターフェース設定、GitHubアクティビティ、メタデータをキャプチャする20以上の正規化された属性がアノテートされている。
MCPCorpusは、実世界のMCPエコシステムの再現可能なスナップショットを提供し、採用トレンド、エコシステムの健全性、実装の多様性の研究を可能にする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:37:27 GMT)
AEM: Attention Entropy Maximization for Multiple Instance Learning based Whole Slide Image Classification [8.9] MIL(Multiple Instance Learning)は、スライドイメージ全体を効果的に分析するが、注意過集中による過度な適合に直面している。
本稿では, 簡易かつ効果的な正則化手法である注意エントロピー最大化(AEM)を導入する。
この知見に基づいて、過度な注意集中を罰するために、AMM正規化をMILフレームワークに統合する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:58:08 GMT)
Duality and Policy Evaluation in Distributionally Robust Bayesian Diffusion Control [8.9] 予測端末数値ユーティリティの拡散制御問題について考察する。
コントローラは、基礎となる拡散の未知のドリフトに事前分布を課す。
実際には、前者は一般的に誤って指定され、モデルの誤特定の程度は、政策のパフォーマンスに重大な影響を与える可能性がある。
本稿では, ベースラインの分岐近傍で事前選択した相手に対して, コントローラがゲームをする, 分布的に堅牢なベイズ制御(DRBC)の定式化を導入する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 22:38:52 GMT)
Efficient Online Inference of Vision Transformers by Training-Free Tokenization [8.8] 我々は、性能と実行時間を維持しながら、消費電力を削減できるトレーニング不要の方法である、textbfVisual Word Tokenizer$(VWT)を紹介した。
以上の結果から,VWTは効率の良いオンライン推論に適しており,性能に限界があることが明らかとなった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:22:45 GMT)
Control-Optimized Deep Reinforcement Learning for Artificially Intelligent Autonomous Systems [8.8] 深層強化学習(DRL)は、機械学習とAIにおいて、複雑な意思決定のための強力なツールとなっている。
従来の手法では、エージェントが選択したアクションと実際のシステム応答の間の不確実性や逸脱を見越して、完璧なアクション実行を仮定することが多い。
この作業は、アクション実行ミスマッチを明示的にモデル化し補償する、制御最適化DRLフレームワークを開発することで、AIを前進させる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:25:52 GMT)
KAIROS: Scalable Model-Agnostic Data Valuation [8.8] KAIROSはスケーラブルでモデルに依存しない評価フレームワークで、各例に分散影響スコアを割り当てる。
KAIROSは、最先端のモデル-、Shapley-、Wassersteinベースのベースラインを精度とランタイムの両方で一貫して上回っている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:44:28 GMT)
Disentangled Diffusion-Based 3D Human Pose Estimation with Hierarchical Spatial and Temporal Denoiser [8.8] DDHPoseと呼ばれる階層的空間と時間的デノイザを用いた拡散拡散に基づく3次元人物位置推定法を提案する。
拡散モデルの前方過程において, 骨長と骨方向を3Dのポーズで切り離し, 骨長と骨方向を拡散させる。
逆のプロセスでは,各関節の階層的モデリングを改善するために階層的空間デノイザーと時間的デノイザーを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:40:41 GMT)
Towards Initialization-free Calibrated Bundle Adjustment [8.7] 本稿では、既知のカメラキャリブレーションを利用して、近距離距離の解を生成できる手法を提案する。
本手法は,pOSEフレームワークに回転平均化を組み込むことが可能である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:55:44 GMT)
Towards an Automated Multimodal Approach for Video Summarization: Building a Bridge Between Text, Audio and Facial Cue-Based Summarization [8.7] 本稿では,行動認識型マルチモーダルビデオ要約フレームワークを提案する。
テキスト、オーディオ、ビジュアルのキューを統合して、タイムスタンプに沿った要約を生成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:41:33 GMT)
Optimization, Isoperimetric Inequalities, and Sampling via Lyapunov Potentials [8.7] すべての初期化からグラディエントフローを用いた任意の関数 F の最適化性は、低温におけるギブス測度 mu_beta = e-beta F/Z のポアンカーの不等式を意味することを証明している。
特に、mu_beta は、ベータ >= Omega(d) に対して定数 O(C'+1/beta) とポインカーの不等式を満たすことを証明している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:22:16 GMT)
LLM Agents Are the Antidote to Walled Gardens [8.7] インターネットのコアインフラストラクチャはオープンで普遍的に設計されているが、今日のアプリケーション層はクローズドでプロプライエタリなプラットフォームによって支配されている。
LLMをベースとしたエージェントは、この現状を根本的に破壊する。
2つのデジタルサービスがAIベースのアダプタを使ってデータをシームレスに交換する機能です。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:45:17 GMT)
Subjective Camera: Bridging Human Cognition and Visual Reconstruction through Sequence-Aware Sketch-Guided Diffusion [8.5] 本稿では,心的印象から現実のシーンを再構築する,ヒューマン・アズ・イメージ・デバイス・パラダイムである主観カメラを提案する。
このアプローチは、ユーザの描画シーケンスを先行として扱うことにより、言語の曖昧さとスケッチの抽象化の2つの制限を克服する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:36:49 GMT)
Positional Bias in Binary Question Answering: How Uncertainty Shapes Model Preferences [8.4] 回答の不確実性の度合いの異なる5つの大言語モデルにおける位置バイアスの定量化と解析を行う。
低不確実性条件下では位置バイアスがほとんど存在しないが、どの選択肢が正しいか判断しにくいと指数関数的に増加する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:30:23 GMT)
Industrial brain: a human-like autonomous neuro-symbolic cognitive decision-making system [8.4] 産業脳は人間のような自律的な認知的意思決定と計画の枠組みである。
高次のアクティビティ駆動ネットワークとCT-OODAシンボリック推論を、自律的なプランレジリエンスに統合する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:54:52 GMT)
Impact of Fine-Tuning Methods on Memorization in Large Language Models [8.3] 我々は、人気のある微調整アプローチを分類し、MIA(the Lens of Membering Inference attack)による記憶への影響を評価する。
その結果,パラメータベースファインチューニングと比較して,プロンプトベースファインチューニングはMIAの脆弱性を低く保ち,競争性能が向上することがわかった。
これらの結果は、パラメータベースの微調整は個人情報を漏洩する傾向が強く、プロンプトベースの微調整はよりプライバシー保護の選択肢となることを示唆している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:52:15 GMT)
Diffusion Models for Robotic Manipulation: A Survey [8.2] 拡散生成モデルは、画像やビデオ生成のような視覚領域において顕著な成功を収めている。
彼らはまた、ロボット工学、特にロボット操作において有望なアプローチとして登場した。
この調査は、ロボット操作における最先端の拡散モデルに関する総合的なレビューを提供する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:32:22 GMT)
Mitigating Hallucinations in YOLO-based Object Detection Models: A Revisit to Out-of-Distribution Detection [8.2] 本稿では,パフォーマンスボトルネックの原因を考察し,パフォーマンスを根本的に改善する手法を提案する。
検出対象にセマンティックに類似したOoDデータセットを慎重に合成する手法を開発することにより,全体の幻覚誤差を88%削減する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:33:08 GMT)
Poisoning Attacks to Local Differential Privacy for Ranking Estimation [8.1] ローカルディファレンシャルプライバシ(LDP)は、ユーザが入力を摂動させ、データの可視的識別性を提供する。
本稿では,まず,ランキング推定のための新規な毒殺攻撃について紹介する。
我々はkRR, OUE, OLHプロトコルの対応戦略を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:39:02 GMT)
Statistical Mechanics of Support Vector Regression [8.1] 我々は、$varepsilon$-insensitive Support Vector Regression(varepsilon$-SVR)の平均ケース学習曲線について検討する。
本分析では, 許容パラメータ$varepsilon$とニューラルバリアビリティの相互作用を捉えることにより, 臨界負荷下でのトレーニングエラーの位相遷移を明らかにした。
理論的予測は玩具モデルとディープニューラルネットワークの両方で検証される。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:02:59 GMT)
Emergent musical properties of a transformer under contrastive self-supervised learning [8.0] 時間周波数領域の1次元パッチで視覚変換器を訓練する。
ウェイトシェアリングにより、VT-1Dのシーケンストークンに情報的音楽特性が出現する可能性があることを観察する。
本論文は,パフォーマンス向上ではなく,変圧器の音楽解釈の進歩に焦点をあてる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:04:59 GMT)
Statistical Inference for Privatized Data with Unknown Sample Size [7.9] 非有界差分プライバシー(DP)における民生データ分析のための理論とアルゴリズムを開発する。
非有界DPと非有界DPのサンプリング分布間の距離は、サンプルサイズ$nが無限大となるにつれてゼロとなる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:04:25 GMT)
Natural language processing for African languages [7.9] 論文はサハラ以南のアフリカで話される言語に焦点を合わせ、すべての先住民語を低資源と見なすことができる。
単語埋め込みで学習した意味表現の質は、データ量だけでなく、事前学習データの品質にも依存することを示す。
そこで我々は,21のアフリカ言語を対象とした大規模人間アノテーション付きラベル付きデータセットを2つのインパクトのあるNLPタスクで開発する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 22:26:36 GMT)
Iterative approach to reconstructing neural disparity fields from light-field data [7.8] 本研究では,シーンの相違を暗黙的に連続的に表現するニューラル・ディパリティ・フィールド(NDF)を提案する。
NDFは3次元シーンにおける相違点のシームレスかつ高精度な特徴付けを可能にする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:27:07 GMT)
Do Thinking Tokens Help or Trap? Towards More Efficient Large Reasoning Model [7.8] 大きな推論モデル(LRM)は複雑な問題を解決するのに優れているが、過度なジレンマに直面している。
単純なタスクを扱う場合、思考トークンがオーバーロードされた冗長なレスポンスを生成することが多い。
これらのトークンは、リフレクションやバックトラックのような不要な高レベルの推論動作を引き起こし、効率を低下させる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:30:33 GMT)
Exploring Theory-Laden Observations in the Brain Basis of Emotional Experience [7.8] 我々は、個別の脳パターンと34の感情カテゴリーの集団平均評価のマッピングを報告した研究を再分析した。
我々の分析は、データに存在する分散の構造について最小限の仮定を行った。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 23:23:32 GMT)
PAC Bench: Do Foundation Models Understand Prerequisites for Executing Manipulation Policies? [7.7] PAC Benchは、視覚言語モデル(VLM)をコアプロパティ、アフォード、制約(PAC)の理解に基づいて評価するために設計されたベンチマークである。
評価の結果,既存のVLMが基本的な物理概念を把握できる能力には,信頼性の高いロボット操作に適した限界があることが示唆された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:58:36 GMT)
When Will It Fail?: Anomaly to Prompt for Forecasting Future Anomalies in Time Series [7.7] AAF(Anomaly-Aware Forecasting)とSAP(Synthetic Anomaly Prompting)を組み合わせたA2P(Anomaly to Prompt)という新しいフレームワークを提案する。
信号適応型プロンプトを用いた多彩な異常パターンをシミュレートした,学習可能な異常プロンプトプール(APP)を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:00:16 GMT)
StyleDrive: Towards Driving-Style Aware Benchmarking of End-To-End Autonomous Driving [7.5] 多様な運転嗜好を収集するアノテーションを付加した,最初の大規模実世界のデータセットを提示する。
我々の研究は、データ駆動型E2EADシステムに人間の嗜好を統合するための標準化されたプラットフォームを提供することにより、パーソナライズされたE2EADの基礎を築いた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:48:38 GMT)
Attestable Audits: Verifiable AI Safety Benchmarks Using Trusted Execution Environments [7.5] 本稿では,Trusted Execution Environments内で動作するAttestable Auditsを提案する。
私たちの仕事は、モデルプロバイダと監査官がお互いを信頼していない場合でも、機密データを保護します。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:29:42 GMT)
Deep Unlearn: Benchmarking Machine Unlearning for Image Classification [7.5] 機械学習(MU)は、訓練された機械学習モデルの学習可能なパラメータから、特定のデータポイントの影響を取り除くことを目的としている。
本稿では,様々なベンチマークデータセットおよびモデルを対象とした18種類の最先端MU手法について検討する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:46:59 GMT)
Recovering Imbalanced Clusters via Gradient-Based Projection Pursuit [7.1] 本研究では,不均衡クラスタかベルヌーイ・ラデマッハ分布を含む射影を復元する手法を提案する。
我々は、不均衡クラスタがバランスの取れたクラスタよりも容易に回収できることを観察できる、プラントベクター設定におけるアルゴリズムのサンプルの複雑さを分析します。
我々は,FashionMNISTとHuman Activity Recognitionデータセットを用いて,実世界のデータへの適用性を実験的に評価した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:52:00 GMT)
CauSkelNet: Causal Representation Learning for Human Behaviour Analysis [7.1] 本研究では,これらの課題に対処するための因果推論に基づく新しい表現学習フレームワークを提案する。
我々の2段階のアプローチは、Peter-Clark (PC) アルゴリズムとKullback-Leibler (KL) ダイバージェンスを組み合わせて、人間の関節間の因果関係を特定し定量化する。
結合相互作用をキャプチャすることで、提案した因果グラフ畳み込みネットワーク(GCN)は、解釈可能かつ堅牢な表現を生成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 00:05:33 GMT)
A Novel Active Learning Approach to Label One Million Unknown Malware Variants [7.1] 本稿では,100万のマルウェアをラベル付けする2つの新しいアクティブラーニング手法を提案する。
最初のモデルは、Inception-VPCAといくつかのサポートベクターマシン(SVM)アルゴリズムを組み合わせたものである。
第2のモデルはビジョントランスフォーマーベースのベイズニューラルネットワークViT-BNNである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:18:31 GMT)
Understanding and Reducing the Class-Dependent Effects of Data Augmentation with A Two-Player Game Approach [7.1] CLAssに依存した乗算重み付け方式であるCLAMを提案する。
以上の結果から,学習した分類器の性能は,平均精度に限られた影響しか与えず,クラスにかなり分散していることが明らかとなった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:47:49 GMT)
Strain induced topological phase transitions in split and line graphs of bipartite lattices featuring flat bands [7.1] フラットバンドを汎用的に支持する2次元格子のクラスについて検討し,その電子的およびトポロジ的特性に対するひずみの影響に着目した。
ひずみがない場合、スピン軌道結合(SOC)の導入は、平らなバンドを励起準平らなバンドに変換するバルクギャップを誘導する。
注目すべきことに、研究された全ての格子は、自明、半金属、および位相相間の相転移を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:36:33 GMT)
Dual-Perspective Disentangled Multi-Intent Alignment for Enhanced Collaborative Filtering [7.0] 暗黙のフィードバックからユーザ意図を遠ざけることは、レコメンデーションシステムの正確性と解釈可能性を高めるための有望な戦略として現れてきた。
DMICFは、意図のアライメント、構造融合、識別訓練を統一する、二重パースペクティブな協調フィルタリングフレームワークである。
DMICFは、さまざまなインタラクション分布を持つデータセット間で、一貫して堅牢なパフォーマンスを提供します。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:14:12 GMT)
InvisibleInk: High-Utility and Low-Cost Text Generation with Differential Privacy [7.0] InvisibleInkは、厳格な差分プライバシー保証を満たすスケーラブルな長文生成フレームワークである。
モデルログ内の機密情報のみを分離・切断することで、プライバシコストを削減する。
我々は、トップ$kのプライベートトークンの小さなスーパーセットからサンプリングすることで、テキストの品質を向上させる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:00:41 GMT)
VAP-Diffusion: Enriching Descriptions with MLLMs for Enhanced Medical Image Generation [7.0] 生成モデルは、現実的で多様な画像を生成するためにラベルを超える豊富な属性情報を必要とする。
本稿では,医用画像生成の質と多様性を改善するために,事前訓練されたマルチモーダル言語モデル(MLLM)の外部知識を活用するために,視覚属性プロンプト(VAP)拡散を提案する。
4つのデータセットにまたがる3種類の医用画像の実験により、VAP拡散の有効性が検証された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:11:19 GMT)
Optimizing Conversational Product Recommendation via Reinforcement Learning [7.0] 多様な産業を対象とした製品レコメンデーションのための対話戦略を最適化するための強化学習に基づくアプローチを提案する。
概念的なフレームワークの概要、重要なイノベーションのハイライト、エンタープライズ環境におけるスケーラブルでパーソナライズされたレコメンデーションの意味について論じる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 00:59:58 GMT)
Quantum computing and artificial intelligence: status and perspectives [6.9] 量子コンピューティングが革新的なAIソリューションの開発を支援する方法について説明している。
また、量子技術の研究と開発を促進することができる古典的なAIのユースケースについても検討している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:33:19 GMT)
Dehazing Light Microscopy Images with Guided Conditional Flow Matching: finding a sweet spot between fidelity and realism [6.9] 光顕微鏡画像のデハージングのための新しい反復法HazeMatchingを提案する。
我々の目標は、デハジング結果の忠実さと個人の予測の現実性の間にバランスのとれたトレードオフを見つけることであった。
提案手法は, 平均的な忠実度と現実性との間に一貫したバランスを保ちながら, 7つの基準線と比較する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:15:48 GMT)
Emulating Self-attention with Convolution for Efficient Image Super-Resolution [6.8] コンボリューショナルアテンション(ConvAttn)という,畳み込み型自己アテンションモジュールを導入する。
ConvAttnモジュールを利用することで、自己注意と関連するメモリバウンド操作への依存を著しく低減する。
我々は、フラッシュアテンションを軽量SRシステムに統合し、自己注意の固有のメモリボトルネックを効果的に軽減するという課題を克服する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:49:21 GMT)
ForgeLens: Data-Efficient Forgery Focus for Generalizable Forgery Image Detection [6.7] 画像認識のためのデータ効率の良い特徴ガイダンスフレームワークであるForgeLensを提案する。
WSGMはトレーニング中に偽造特有の特徴の抽出をガイドする。
FAFormerはマルチステージ機能にまたがって偽情報を統合する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 00:08:20 GMT)
Avoid Forgetting by Preserving Global Knowledge Gradients in Federated Learning with Non-IID Data [6.7] FedProjは、グローバルな意思決定境界をしっかりと学習し、ローカルトレーニング中に忘れることを避ける、連邦学習フレームワークである。
本稿では,ローカルトレーニングの各段階における勾配更新を規制するために,公開されていないデータセット上での平均アンサンブルロジットのエピソードメモリを活用することを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:20:31 GMT)
PipeOffload: Improving Scalability of Pipeline Parallelism with Memory Optimization [6.6] パイプライン並列 (PP) は大規模言語モデル (LLM) の訓練に広く用いられている。
PPは、飛行中のマイクロバッチの数がPPの程度に増加するにつれて、高活性化メモリ消費によって制約されることが多い。
我々は、PPの未探索メモリオフロード戦略を活用することで、この問題に対処することに注力する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:37:05 GMT)
PWD: Prior-Guided and Wavelet-Enhanced Diffusion Model for Limited-Angle CT [6.5] LACT再構成のための先行情報埋め込みとウェーブレット特徴融合高速サンプリング拡散モデルを提案する。
PWDは、LACTの再構成忠実性を保ちながら効率的なサンプリングを可能にする。
PWDは50ステップしかサンプリングしないため、PSNRの少なくとも1.7dB改善とSSIMの10%向上を実現している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:28:32 GMT)
Engineering spectro-temporal light states with physics-embedded deep learning [6.4] 物理埋め込み型畳み込みニューラルネットワーク(P-CNN)が分光時間相関をどのように埋め込むかを示す。
これにより、スーパーコンチヌム(SC)生成の分光時間特性をオンデマンドで制御できる。
このアプローチは、任意の分光時間状態工学の新しい時代を告げるものである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:39:47 GMT)
Scaling Human Judgment in Community Notes with LLMs [6.4] 本稿では,LLM時代のコミュニティノートの新しいパラダイムを論じる。
それは、人間とLLMの両方がメモを書くことができるオープンなエコシステムを論じ、どのメモが人間の手にあるかを示すのに十分役立つかを判断する。
本稿では,このようなシステムがどのように機能するか,そのメリット,導入する重要な新たなリスクと課題,そしてこれらの課題を解決し,このアプローチの可能性を実現するための研究課題について述べる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:57:32 GMT)
Best Linear Unbiased Estimate from Privatized Contingency Tables [6.2] 差分プライバシー(DP)機構では、異なる民営化値を組み合わせることで、いくつかの量を複数の方法で推定することができる。
アメリカ合衆国国勢調査局が発行したDP 2020の年次国勢調査製品は、このような冗長なノイズ数で構成されている。
最適線形不偏推定法(SEA BLUE)を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:55:44 GMT)
Integrated bright source of polarization-entangled photons using lithium niobate photonic chips [6.2] 本研究では, 薄膜ニオブ酸リチウム集積フォトニクスに連続波ポンピングを応用した, 偏光絡み合うベル状態のコンパクトで明るい光源を実証した。
光子対生成速度は508.5MHz/mWで、シリコンフォトニクスを含む他の統合プラットフォームを上回ります。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:41:23 GMT)
Efficient First-Principles Framework for Overdamped Phonon Dynamics and Anharmonic Electron-Phonon Coupling in Superionic Materials [6.2] 超イオン導体における局所障害、無調波性、電子-フォノン結合を記述するために、ab initio準静電多相構造を導入する。
提案手法は,超イオン結晶における電子構造計算を効率よく行うことで,その高次量化を解明する手法である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:52:34 GMT)
Learning Causally Predictable Outcomes from Psychiatric Longitudinal Data [6.1] 縦断的生医学データの因果推論は依然として中心的な課題である。
本アルゴリズムは, 結果集約のための非負の, 臨床的に解釈可能な重みを学習する。
我々のアルゴリズムは因果関係の回復における最先端の手法より一貫して優れている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 01:26:01 GMT)
Canonical partial ordering from min-cuts and quantum entanglement in random tensor networks [5.9] 我々は、ミンカットの縮退から生じるエントロピーのエンタングルメント R'eny に対する無限補正が、エンファンダー型の数によって与えられることを示した。
また、位数射の数は、自由確率論の特別な場合において自由ベッセル法則を一般化するグラフ依存測度のモーメントに対応することを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:26:40 GMT)
STACK: Adversarial Attacks on LLM Safeguard Pipelines [5.8] Anthropicが最新のClaude 4 Opusモデルを1つの防衛パイプラインを使ってガードする。
Google DeepMindやOpenAIを含む他のフロンティア開発者は、近く同様の防御を展開すると約束している。
このギャップに対処するため、オープンソースのディフェンスパイプラインを開発し、再チーム化する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:21:08 GMT)
Neural Canonical Polyadic Factorization for Traffic Analysis [5.7] ポリadic Factorization (NCPF) モデルは、堅牢なトラフィックデータ計算のためのディープラーニングと低ランクテンソル代数を相乗化する。
NCPFは、高次元のトラフィックデータ計算に対する原則的かつ柔軟なアプローチを提供する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:06:21 GMT)
SelvaBox: A high-resolution dataset for tropical tree crown detection [5.7] SelvaBoxは、高解像度ドローン画像における熱帯樹冠検出のための最大のオープンアクセスデータセットである。
3つの国にまたがり、83,000以上の王冠が手作業で登録されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:23:30 GMT)
Barriers to Digital Mental Health Services among College Students [5.7] 本研究では,大学生におけるデジタルメンタルヘルス・インターベンション(DMHI)の利用障壁について検討した。
DMHI導入における9つの重要な障壁と,メンタルヘルスサービスの利用について検討した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:27:27 GMT)
Adaptive Domain Modeling with Language Models: A Multi-Agent Approach to Task Planning [5.6] TAPASは特殊なLLMベースのエージェントを使用して、協調的にドメインモデルを生成し、適応する。
ReAct(Reason+Act)スタイルの実行エージェントは、自然言語の計画翻訳と組み合わせて、動的に生成された計画と現実世界のロボット能力のギャップを埋める。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:40:24 GMT)
Beyond Sensor Data: Foundation Models of Behavioral Data from Wearables Improve Health Predictions [5.6] 162K人を対象に,2.5B時間以上のウェアラブルデータを用いた行動信号の基礎モデルを構築した。
本モデルでは,個人レベルの分類や時間変化による健康状態の予測など,さまざまな実世界のアプリケーションにまたがる高い性能を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:01:00 GMT)
Farm-Level, In-Season Crop Identification for India [5.6] 本研究では,深層学習を用いた農業レベルのマルチクロップ識別を全国規模(インド)で実現するフレームワークを提案する。
本手法は,全国規模の農地境界データと統合したSentinel-1およびSentinel-2衛星画像の強度を利用する。
本手法は,収穫期と収穫期を推定する自動季節検出アルゴリズムを取り入れたものである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:16:09 GMT)
The Confidence Paradox: Can LLM Know When It's Wrong [5.5] 倫理的に整合したDocVQAのための自己監督型正直校正フレームワークであるHonestVQAを紹介する。
本手法は,知識ギャップを同定するための不確実性を定量化し,重み付き損失関数を用いてモデル信頼度を実際の正しさと整合させ,対照的な学習を通じて倫理的応答行動を実施する。
実証的に、HoestVQAは、SpDocVQA、InfographicsVQA、SROIEデータセットでDocVQAの精度を最大4.3%、F1を4.3%向上させる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:06:54 GMT)
GeoCD: A Differential Local Approximation for Geodesic Chamfer Distance [5.4] Chamfer Distance (CD)は3Dポイントのクラウド学習において広く採用されているメトリクスである。
CDはユークリッド距離のみに依存しており、しばしば3次元形状の内在幾何学を捉えることができない。
三次元ポイントクラウド学習の指標として設計された測地線距離のトポロジ対応近似であるGeoCDを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:53:40 GMT)
Towards Building Private LLMs: Exploring Multi-Node Expert Parallelism on Apple Silicon for Mixture-of-Experts Large Language Model [5.4] 大規模言語モデル(LLM)は、OpenAIのChatGPT、MetaのLlama、DatabricksのDBRXといった進歩とともに、人工知能(AI)に革命をもたらした。
本稿では,個人サービスや小グループサービス用のLLMシステムを構築する際に発生するコストとスケーラビリティの課題について論じる。
AppleのM2 Ultraチップを搭載したMac Studioクラスタは、事前訓練されたDBRXモデルをホストし、高速化するためのコスト効率の高いソリューションとして確立されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:04:25 GMT)
What Makes Local Updates Effective: The Role of Data Heterogeneity and Smoothness [5.4] この論文は、異種環境における局所SGDの分析のための自己完結型ガイドに寄与する。
この論文はオンライン学習にも拡張され、ファーストオーダーとバンディットの両方のフィードバックの下で基本的な境界を提供する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:06:02 GMT)
An Unconditional Representation of the Conditional Score in Infinite-Dimensional Linear Inverse Problems [5.3] 線形逆問題に適した条件付きスコア関数の非条件表現を提案する。
条件付きスコアはアフィン変換を用いて訓練された(条件なし)スコアから正確に導出可能であることを示す。
我々のアプローチは無限次元函数空間で定式化され、本質的に離散化不変である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:12:30 GMT)
KMI: A Dataset of Korean Motivational Interviewing Dialogues for Psychotherapy [5.3] モチベーション・インタヴュー(MI)は,これらのチャットボットの開発における専門知識向上の理論的基盤として注目されている。
本稿では,専門的セラピストの専門知識に富んだMIセッションをシミュレートする新しいフレームワークを提案する。
提案するKMIは、理論上はMIに基礎を置いている最初の合成データセットであり、高品質な韓国のモチベーション・インタビュー対話を1000種類含んでいる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:54:48 GMT)
Chain of Thought in Order: Discovering Learning-Friendly Orders for Arithmetic [5.3] 本研究では,デコーダの入力トークンを変換器が算術的タスクを学習するための学習フレンドリーなシーケンスに再順序付けるという,思考の連鎖を解き放つ新しい課題に対処する。
提案したパイプラインは、まず異なる順序で配列されたターゲットシーケンスの混合でトランスフォーマーを訓練し、その後、ベニグオーダーを早い段階で損失が減少しているものと識別する。
4つの順序に敏感な算術的タスクの実験により,10億の候補の中から学習に優しい順序を同定した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:05:53 GMT)
Bug Fixing with Broader Context: Enhancing LLM-Based Program Repair via Layered Knowledge Injection [5.3] 現実世界のプロジェクトでは、開発者はそのようなバグを解決するために、ローカルコード以外のより広いリポジトリとプロジェクトレベルのコンテキストに依存することが多い。
本稿では,LLMを構造化コンテキストで漸進的に拡張する階層型知識注入フレームワークを提案する。
このフレームワークをBugsInPyの314のバグのデータセットで評価し、6つのバグタイプにわたる修正率を分析した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:19:38 GMT)
WeatherEdit: Controllable Weather Editing with 4D Gaussian Field [5.2] 我々は3Dシーンで現実的な気象効果を生成するための新しい天気編集パイプラインであるWeatherEditを紹介する。
我々のアプローチは、気象背景編集と気象粒子構築という2つの重要な要素で構成されている。
複数の運転データセットの実験により、気象編集は制御可能な条件重大度で多様な気象効果を発生させることができることが示された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:05:39 GMT)
Consistent Time-of-Flight Depth Denoising via Graph-Informed Geometric Attention [5.2] 動き不変グラフ融合を利用した新しいToF深度決定ネットワークを提案する。
フレーム間の深さシフトにもかかわらず、グラフ構造は時間的自己相似性を示し、グラフ融合のためのクロスフレーム幾何学的注意を可能にする。
提案手法は,合成DVToFデータセットの精度と整合性の観点から最先端の性能を実現し,Kinectv2データセットの堅牢な一般化を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:29:24 GMT)
FedEx-LoRA: Exact Aggregation for Federated and Efficient Fine-Tuning of Foundation Models [5.2] Low-Rank Adaptation (LoRA) は基礎モデルの効率的な微調整技術として人気がある。
凍結重量行列に残留誤差項を追加するFederated Exact LoRA(FedEx-LoRA)を提案する。
提案手法は,LoRAの効率を保ちながら,計算と通信のオーバーヘッドを最小限に抑えた正確な更新を実現する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:53:38 GMT)
HalCECE: A Framework for Explainable Hallucination Detection through Conceptual Counterfactuals in Image Captioning [5.1] この研究は、広く使われている画像キャプターが示す幻覚現象の複雑さを掘り下げて、興味深いパターンを明らかにした。
採用された概念的反事実のバックボーンの決定論的かつ効率的な性質は、意味的に最小限の編集を提案することができる。
提案する幻覚検出フレームワークは,スタンドアローン数とは別に意味論的に意味のある編集を提供することにより,高い解釈が可能となる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:26:14 GMT)
Storing overlapping associative memories on latent manifolds in low-rank spiking networks [5.0] 我々はスパイクベースの計算の理解の進歩を踏まえ、連想記憶問題を再考する。
大規模全阻止ネットワークのスパイク活性は,低次元,凸,片方向線形多様体上に位置することを示す。
学習ルールをいくつか提案し, 記憶容量をニューロン数で線形に拡張し, パターン完備化能力を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:14:37 GMT)
Identifying the Truth of Global Model: A Generic Solution to Defend Against Byzantine and Backdoor Attacks in Federated Learning (full version) [5.0] フェデレートラーニング(FL)は、複数のパーティが生のトレーニングデータを共有せずに、機械学習モデルを協調的にトレーニングすることを可能にする。
悪意のあるクライアントは、Byzantineまたはバックドア攻撃を介してエラーモデルのアップデートを注入することで、トレーニングされたモデルに影響を与えることができる。
本稿では,FLにおけるモデル中毒に対する防御策として,FedTruthを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:10:08 GMT)
Knowing You Don't Know: Learning When to Continue Search in Multi-round RAG through Self-Practicing [4.9] Retrieval Augmented Generation (RAG)は、言語モデルの知識を高め、AI生成幻覚を減らす強力な能力を示している。
現在のマルチラウンドRAGシステムは、十分な情報が既に取得されている場合でも検索を続けることができる。
本稿では,RAGシステムの自己認識と多ラウンド検索機能を強化するための新しいフレームワークSIM-RAGを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:46:40 GMT)
Uncertainty-Aware Remaining Lifespan Prediction from Images [4.9] 本稿では,事前学習した視覚トランスフォーマーの基礎モデルを用いて,顔画像と全身画像から残存寿命を推定する手法を提案する。
提案手法は,確立したデータセット上で7.48年間の最先端平均絶対誤差(MAE)を達成し,さらに2つの新しい高品質データセットに対して4.79年と5.07年のMAEを改善する。
臨床展開を意図してはいないが、これらの結果は画像から医療関連信号を抽出する可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:19:47 GMT)
Holistic Artificial Intelligence in Medicine; improved performance and explainability [4.9] xHAIM(Explainable HAIM)は、ジェネレーティブAIを活用して予測と説明可能性の両方を強化する新しいフレームワークである。
xHAIM は平均 AUC を 79.9% から 90.3% に改善する。
AIをブラックボックスの予測装置から説明可能な意思決定支援システムに変換し、臨床医が関連する患者データにインタラクティブに予測を追跡できるようにする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:15:06 GMT)
PriOr-Flow: Enhancing Primitive Panoramic Optical Flow with Orthogonal View [4.9] PriOr-Flowは光フロー推定のための新しいデュアルブランチフレームワークである。
コストボリューム構築時の歪みノイズを軽減する。
公開可能なパノラマ光フローデータセット上での最先端のパフォーマンスを一貫して達成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:30:25 GMT)
Software Engineering for Large Language Models: Research Status, Challenges and the Road Ahead [4.8] 大規模言語モデル(LLM)は人工知能(AI)を再定義している
LLMの開発は、ライフサイクルを通してますます複雑な課題に直面している。
ソフトウェア工学(SE)アプローチの観点から、これらの課題と解決策を体系的に探求する既存の研究はない。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:09:29 GMT)
Consensus-based optimization for closed-box adversarial attacks and a connection to evolution strategies [4.8] 合意に基づく最適化(CBO)は、効率的な勾配のない最適化スキームとして確立されている。
我々の研究はRiedlらによってもたらされ、自然進化戦略(NES)が敵の攻撃に一般的に適用されている。
概念的類似性にもかかわらず、CBOは特定のシナリオにおいてNESや他の進化戦略より優れている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:54:44 GMT)
Evaluating Multi-Agent Defences Against Jailbreaking Attacks on Large Language Models [4.8] 本稿では,脱獄攻撃に対する防御手段として,マルチエージェントLLMシステムを用いた場合について検討する。
我々は、最初のAutoDefense攻撃とDeepleapsの2つのJB(BetterDanとJB)を含む3つのジェイルブレイク戦略を評価した。
以上の結果から,マルチエージェントシステムは脱獄に対する耐性を高めることが示唆された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:29:07 GMT)
Multi-Timescale Hierarchical Reinforcement Learning for Unified Behavior and Control of Autonomous Driving [4.8] 自律運転のための多段階階層型強化学習手法を提案する。
高レベルかつ低レベルなRLポリシーは、長期動作誘導と短時間制御コマンドを生成するために統一的に訓練される。
提案手法はAD性能を大幅に向上させ,運転効率,動作の整合性,安全性を効果的に向上させる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:17:42 GMT)
Is It Safe To Learn And Share? On Psychological Safety and Social Learning in (Agile) Communities of Practice [4.7] コミュニティ・オブ・プラクティス(CoP)は、フォーマルな教育を超えた社会的学習を支援するためにますます採用されている。
心理的安全性は、効果的な学習の前提条件であり、これらの設定では十分に理解されていない。
本研究は,143人の参加者を対象に,アジャイルCoPの心理的安全性を調査した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:06:43 GMT)
A Consequentialist Critique of Binary Classification Evaluation Practices [4.6] ICML、FAccT、CHILといった主要なカンファレンスでは、トップKメトリクスや一定のしきい値が好まれています。
我々は、この決定論的フレームワークを使用して、評価指標を最適なユースケースにマッピングし、Pythonパッケージであるbriertoolsとともに、より広範なBrierスコアの採用を促進する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:15:11 GMT)
PokéAI: A Goal-Generating, Battle-Optimizing Multi-agent System for Pokemon Red [4.6] Pok'eAIは,Pok'emon Redを通じて自律的に再生・進行するように設計された,テキストベースでマルチエージェントな大規模言語モデル(LLM)フレームワークである。
本システムでは,3つの専門エージェント(Planning, Execution, Critique-each)と,独自のメモリバンク,役割,スキルセットで構成されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:09:13 GMT)
FedWSQ: Efficient Federated Learning with Weight Standardization and Distribution-Aware Non-Uniform Quantization [4.5] フェデレートラーニング(FL)は、データ不均一性や通信制約といった重要な課題により、しばしばパフォーマンス劣化に悩まされる。
We present a novel FL framework called FedWSQ, which integrates weight standardization (WS) and the proposed distribution-aware non-uniform Quantization (DANUQ)。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:46:25 GMT)
INP-Former++: Advancing Universal Anomaly Detection via Intrinsic Normal Prototypes and Residual Learning [4.4] 異常検出は産業検査や診断に不可欠である。
既存のメソッドは通常、トレーニングセットからの通常の参照と比較する'テストイメージに依存します。
Intrinsic Normal Prototypes(INP)を直接抽出する新しい手法であるINP-Formerを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:33:45 GMT)
Language Models Might Not Understand You: Evaluating Theory of Mind via Story Prompting [4.4] $textttStorySim$は、ストーリーを合成的に生成するためのプログラム可能なフレームワークである。
これは、非常に制御可能な$textttStoryboard$でアンカーされる、新規で構成的なストーリープロンプトを生成する。
われわれのフレームワークは、記事の以前の出来事に対する信頼度と傾向バイアスの証拠を見つけるのに役立った。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:05:37 GMT)
HQNET: Harnessing Quantum Noise for Effective Training of Quantum Neural Networks in NISQ Era [4.3] ノイズのない理想的な条件と比較して,バレンプラトー (BP) はノイズの多い量子環境において早く現れる。
ノイズの多い量子コンピューティング環境におけるQNN性能を改善するために,観測可能な選択のための戦略的アプローチを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:31:06 GMT)
Zero-Shot Contextual Embeddings via Offline Synthetic Corpus Generation [4.3] ZESTはゼロショットのコンテキスト適応フレームワークである。
実際のコーパスアクセスを、コンパクトプロキシの1回限りのオフライン合成に置き換える。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:38:50 GMT)
Metadata, Wavelet, and Time Aware Diffusion Models for Satellite Image Super Resolution [4.3] MWT-Diffは、衛星画像超解像(SR)のための革新的なフレームワークである
フレームワークの中核は、新しいメタデータ、ウェーブレット、タイムアウェアエンコーダ(MWT-Encoder)である。
埋め込み特徴表現は階層的拡散力学を駆使し、モデルが低解像度入力から高解像度衛星画像を徐々に再構成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:19:50 GMT)
Radioactive Watermarks in Diffusion and Autoregressive Image Generative Models [4.3] 拡散モデル(DM)と画像自己回帰モデル(IAR)により生成された画像中の透かしの放射能を解析する。
IARと放射能を考慮した最初の透かし法を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:08:10 GMT)
Can We Challenge Open-Vocabulary Object Detectors with Generated Content in Street Scenes? [4.3] 塗り絵は、見渡せる物体の観点で、オープン語彙オブジェクト検出器に挑戦することができる。
オープン語彙モデルのオブジェクト位置への強い依存は、オブジェクトのセマンティクスではなく、オブジェクト位置への強い依存である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:48:44 GMT)
Online model learning with data-assimilated reservoir computers [4.3] 非線形時間信号(フィールド)の予測のためのオンライン学習フレームワークを提案する。
ナヴィエ・ストークス方程式が支配するシリンダーを通したウェイクパスの枠組みを実証する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:38:58 GMT)
CooT: Learning to Coordinate In-Context with Coordination Transformers [4.2] CooT(Coordination Transformers)は、最近のインタラクション履歴を利用して、目に見えないパートナーに迅速に適応する、新しいコンテキスト内コーディネートフレームワークである。
多様なエージェントから収集された相互作用軌跡に基づいて訓練されたCooTは、明確な監督や微調整なしに、効果的な協調戦略を素早く学習する。
人間の評価では、CooTが最も効果的なコラボレーティブパートナであることが確認されているが、広範な改善は、マルチエージェントシナリオにおけるコンテキストに対する堅牢性、柔軟性、感度を強調している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:45:39 GMT)
Detection of 2D SPT phases under decoherence [4.2] 部分対称性を用いた2次元格子上に対称性保護トポロジカル不変量(SPT)を抽出するためのバルクオーダーパラメータを提案する。
我々はこれを、$bbZtimesmathbbZ$対称性と$A$対称性を持つCZX型モデルから得られる混合状態のクラスを用いて明示的に示す。
また、ランダム化測定による量子シミュレータにおけるSPT不変量の実用的検出についてもコメントする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:00:03 GMT)
Robustness of Decentralised Learning to Nodes and Data Disruption [4.1] ノードの破壊が集団学習過程に及ぼす影響について検討する。
その結果,分散学習プロセスはネットワーク破壊に対して極めて堅牢であることがわかった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:27:03 GMT)
A general language model for peptide identification [4.0] PDeepPPは、事前訓練されたタンパク質言語モデルとハイブリッドトランスフォーマー-畳み込みアーキテクチャを統合する統合ディープラーニングフレームワークである。
大規模かつ正確なペプチド分析を可能にすることにより、PDeepPPは生物医学研究と疾患治療のための新しい治療標的の発見を支援している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:46:24 GMT)
Adaptive Out-of-Control Point Pattern Detection in Sequential Random Finite Set Observations [4.0] 本稿では,逐次的ランダム有限集合(RFS)観測に特化して設計された適応型異常検出フレームワークを提案する。
提案手法は,プロセスの期待される統計的挙動から逸脱を検出することにより,異常データ(正規データ)と異常データ(異常データ)を効果的に区別する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:45:44 GMT)
Optimization of Low-Latency Spiking Neural Networks Utilizing Historical Dynamics of Refractory Periods [4.0] 屈折周期は、ネットワーク安定性と耐雑音性に不可欠なニューロンスパイク発火速度を制御する。
本研究では,初期耐火期間を推定し,その期間を動的に調整する履歴動的耐火期間(HDRP)モデルを提案する。
提案手法は,SNNの2値特性を保ちながら,耐雑音性と全体的な性能を向上する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:42:19 GMT)
FD-DiT: Frequency Domain-Directed Diffusion Transformer for Low-Dose CT Reconstruction [4.0] 低線量CT(LDCT)は、放射線被曝を減らすが、画像のアーチファクトや、量子および電子ノイズによる詳細の喪失に悩まされる。
FD-DiTは、分布がLDCTデータと統計的に一致するまで、ノイズを徐々に導入する拡散戦略に重点を置いている。
次に、ハイブリッドな復調ネットワークを使用して、全体のデータ再構成プロセスを最適化する。
FD-DiTにより再構成されたLDCT画像は,同じ線量レベルでは,最先端の手法に比べて優れたノイズ抑制とアーチファクト抑制を示すことが示された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:16:38 GMT)
Computer Vision for Objects used in Group Work: Challenges and Opportunities [4.0] FiboSBは、手持ちの小さなキューブと体重計を備えた対話的なタスクを3人のグループが解決する、新しくて挑戦的な6Dポーズビデオデータセットである。
このセットアップは、すべての参加者を捉えるためにグループを遠くからホリスティックに記録するため、6Dのポーズに固有の課題を提起する。
我々は、FiboSB上での4つの最先端6Dポーズ推定手法を評価し、協調グループ作業における現在のアルゴリズムの限界を明らかにする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:51:28 GMT)
When Plants Respond: Electrophysiology and Machine Learning for Green Monitoring Systems [3.9] 生物と人工装置の生理的信号流路を確立する。
我々は最先端と自動化機械学習(AutoML)を用いてデータを解析する。
この研究は、持続可能な環境モニタリングのために、スケーラブルで、自己持続的で、植物が組み込んだ生物ハイブリッドシステムを進める。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:04:31 GMT)
Generative Modeling of Full-Atom Protein Conformations using Latent Diffusion on Graph Embeddings [3.9] 完全な全原子タンパク質構造を構築するフレームワークであるフルタンパク質生成(LD-FPG)の潜在拡散について述べる。
LD-FPGは、チェビシェフグラフニューラルネットワーク(ChebNet)を用いて、タンパク質コンホメーションの低次元潜伏埋め込みを得る。
膜環境におけるヒトドーパミンD2受容体の2マイクロ秒MD軌道であるD2R-MDを用いて、シーケンシャルおよび残基ベースプール戦略は、高い構造的忠実度で参照アンサンブルを再現する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:37:08 GMT)
HMSViT: A Hierarchical Masked Self-Supervised Vision Transformer for Corneal Nerve Segmentation and Diabetic Neuropathy Diagnosis [3.8] 糖尿病末梢神経障害(DPN)は糖尿病患者の約半数に影響を与え、早期発見を必要とする。
我々はHMSViT(HMSViT)を提案する。
HMSViTは、絶対位置符号化によるプーリングに基づく階層的・二重注意機構を採用し、効率的なマルチスケール特徴抽出を実現する。
臨床CCMデータセットの実験では、HMSViTは61.34% mIoUと70.40%の診断精度で最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:40:51 GMT)
When Kids Mode Isn't For Kids: Investigating TikTok's "Under 13 Experience" [3.7] ソーシャルメディアプラットフォームであるTikTokは、TikTokの"Kids Mode"としても知られる米国の若者向けに、より限定的な"Under 13 Experience"を提供する。
以前の研究では、TikTokのレギュラーモードの様々な側面を研究してきたが、TikTokのキッズモードはまだ検討されている。
キッズモードの「For You」ページで観察されたビデオの83%は実際には子供向けではなく、不適切なコンテンツさえも発見されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 22:31:31 GMT)
Harnessing Shared Relations via Multimodal Mixup Contrastive Learning for Multimodal Classification [3.7] マルチモーダルデータに固有のニュアンス付き共有関係を抽出するマルチモーダル混合コントラスト学習手法であるM3CoLを提案する。
我々は,M3CoLが共有マルチモーダル関係を効果的に捉え,ドメイン間の一般化を実証する。
我々の研究は、堅牢なマルチモーダル学習のための共有関係の学習の重要性を強調し、将来の研究に有望な道を開く。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:55:13 GMT)
Strategic Counterfactual Modeling of Deep-Target Airstrike Systems via Intervention-Aware Spatio-Causal Graph Networks [3.6] 本研究では,現在の戦略レベルシミュレーションにおいて,戦術的ストライキ行動と戦略的遅延の間の構造的因果モデリングが欠如していることに対処する。
Invention-Aware Spatio-Temporal Graph Neural Network (IA-STGNN) を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:26:10 GMT)
Examining Reject Relations in Stimulus Equivalence Simulations [3.5] 本研究では,計算モデルを用いた刺激等価性獲得における拒絶関係の役割について検討する。
条件は、トレーニング構造(リニアシリーズ、ワンツーマン、多対ワン)、関係型(セレクトオン、リジェクションオンリー、セレクトリジェクト)、ネガティブ比較選択に変化した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:15:15 GMT)
WAVE: Warp-Based View Guidance for Consistent Novel View Synthesis Using a Single Image [3.4] 本稿では,モジュールを追加せずに拡散モデルを利用するビュー一貫性画像生成手法を提案する。
我々のキーとなる考え方は、適応的な注意操作と雑音の再生を可能にする訓練不要な手法で拡散モデルを強化することである。
本手法は,様々な拡散モデル間での視界の整合性を向上し,その適用性を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:00:47 GMT)
Advancing Facial Stylization through Semantic Preservation Constraint and Pseudo-Paired Supervision [3.4] これらの問題は、スタイリゼーション中にジェネレータのセマンティックシフトを無視することに起因すると我々は主張する。
意味的保存制約と擬似ペア付き監視を統合した顔のスタイリング手法を提案する。
顔のスタイリゼーションを基盤として,より柔軟なマルチモーダルおよび参照誘導型スタイリゼーションを実現する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:02:04 GMT)
Learning for routing: A guided review of recent developments and future directions [3.4] 旅行セールスマン問題(TSP)や車両ルーティング問題(VRP)などのルーティング問題に焦点をあてる。
これらの問題の本質的な複雑さのため、正確なアルゴリズムは最適解を見つけるのに過剰な計算時間を必要とすることが多い。
本稿では,MLに基づく分類体系を構築ベースおよび改良ベースアプローチに適用し,様々な問題特性に適用可能であることを明らかにする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:39:11 GMT)
A Comprehensive Evaluation of Semantic Relation Knowledge of Pretrained Language Models and Humans [3.3] ハイポナミー, ホロナミー, メロニミー, アンソニミー, 同義語という5つの関係を包括的に評価する枠組みを導入する。
この結果から,人間とモデル間の有意な知識ギャップが明らかとなった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:07:49 GMT)
Auto-TA: Towards Scalable Automated Thematic Analysis (TA) via Multi-Agent Large Language Models with Reinforcement Learning [3.3] 先天性心疾患(CHD: Congenital heart disease)は、従来の臨床指標では示されていない、複雑で寿命の長い課題である。
本稿では,臨床物語のエンド・ツー・エンドのセマンティック分析を行う,完全自動大規模言語モデル(LLM)パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:02:28 GMT)
GazeTarget360: Towards Gaze Target Estimation in 360-Degree for Robot Perception [3.3] 画像から360度視線目標推定の問題に対処するシステムを提案する。
GazeTarget360と名付けられたこのシステムは、アイコンタクト検出器、事前訓練された視覚エンコーダ、マルチスケール核融合デコーダの条件推論エンジンを統合している。
クロスバリデーションの結果から、GazeTarget360は、目に見えないシナリオにおいて、正確で信頼性の高い視線目標予測を生成できることが示されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:44:40 GMT)
Aligning Evaluation with Clinical Priorities: Calibration, Label Shift, and Error Costs [3.3] 校正しきい値分類器を選択するための基本的かつ実用的な評価フレームワークを提案する。
臨床的に関連のあるクラスバランスの範囲でコスト重み付け性能を平均化するクロスエントロピー(log score)の調整版を導出する。
その結果得られた評価は、簡単に適用でき、臨床展開条件に敏感であり、キャリブレーションされたモデルと実世界の変動に頑健なモデルの両方を優先順位付けするよう設計されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:59:31 GMT)
Optimal Quantum Algorithm for Estimating Fidelity to a Pure State [3.3] 2つの量子状態の1つが純粋であるときの忠実度推定に最適な量子アルゴリズムを提案する。
我々の知る限りでは、これは混合状態を含む忠実度推定に対する最初のクエリ-最適アプローチである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:24:03 GMT)
Challenging Gradient Boosted Decision Trees with Tabular Transformers for Fraud Detection at Booking.com [3.3] 自己監視学習(SSL)によって強化されたトランスフォーマーベースのニューラルネットワークは、さまざまなドメインで前例のないパフォーマンスを示している。
本稿では,電子商取引における典型的な課題である不正検出において,表型変換器を用いたGBDTに挑戦することを目的とする。
本研究は, 実生活における不正検出システムにおいてしばしば発生する選択バイアスの問題に起因し, トラフィックのサブセットがラベル付けされる生産システムに影響を及ぼす。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:01:46 GMT)
Mono-Modalizing Extremely Heterogeneous Multi-Modal Medical Image Registration [3.2] M2M-Regは、モノモーダル類似性のみを使用してマルチモーダルDIRモデルをトレーニングする新しいフレームワークである。
M2M-RegはPET-MRIとFA-MRIの従来法よりも最大2倍高い値が得られる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:41:55 GMT)
Towards 3D Semantic Image Synthesis for Medical Imaging [3.1] 本研究では,3次元領域で直接動作するメドLSDM(Latent Semantic Diffusion Model)を提案する。
Med-LSDMは2Dスライス生成に重点を置いている既存の方法とは異なり、3Dセマンティック画像合成に特化して設計されている。
提案手法は,Duke Breastデータセットの3D-FIDスコア0.0054を達成し,3Dセマンティックな医用画像合成において高い性能を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:18:06 GMT)
Machine Understanding of Scientific Language [3.1] この論文は、科学言語の機械的理解のためのデータセット、方法、ツールの育成に関するものである。
自然言語処理と機械学習の3分野 – 自動事実チェック,限定データによる学習,科学テキスト処理 – において,いくつかのコントリビューションを提示した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:55:10 GMT)
AI-Governed Agent Architecture for Web-Trustworthy Tokenization of Alternative Assets [3.1] 代替アセットトークン化は、非伝統的な金融商品がWeb上で表現され、取引されるように変化している。
本稿では、インテリジェントエージェントをブロックチェーンに統合し、代替資産のWeb信頼に値するトークン化を実現するAI統治エージェントアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:28:51 GMT)
Teaching Time Series to See and Speak: Forecasting with Aligned Visual and Textual Perspectives [3.1] 時系列の予測は伝統的に単調な数値入力に依存している。
生の時系列を構造化された視覚的・テキスト的視点に変換するマルチモーダルコントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:59:14 GMT)
A General Framework on Conditions for Constraint-based Causal Learning [3.0] ほとんどの制約に基づく因果学習アルゴリズムは、忠実性などの特定の正当性条件下で正しい因果グラフを確実に返却する。
これらのアルゴリズムの正当性条件を取得し,研究するための一般的な枠組みを提供する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:16:49 GMT)
A Clinically-Grounded Two-Stage Framework for Renal CT Report Generation [3.0] 2次元CTスライスから腎X線所見を生成するための2段階の枠組みを提案する。
まず, マルチタスク学習モデルを用いて構造的異常特徴を抽出し, 病変の属性を同定する。
これらの特徴を対応するCT画像と組み合わせ、微調整された視覚言語モデルに入力し、自然言語のレポート文を生成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:45:02 GMT)
A Scalable Approach for Safe and Robust Learning via Lipschitz-Constrained Networks [2.9] ニューラルネットワーク(NN)に対するリプシッツ制約付きグローバルトレーニング制約を提案する。
提案手法により,リプシッツ制約NNの定式化が大幅に改善できることが示唆された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:42:23 GMT)
Leveraging the Potential of Prompt Engineering for Hate Speech Detection in Low-Resource Languages [2.9] 本稿では,低リソースベンガル言語に着目した大規模言語モデル (LLM) の迅速なエンジニアリングにより,その限界を克服する方法について検討する。
我々は、ゼロショットプロンプト、拒絶抑制、分類器のフラット化、マルチショットプロンプト、ロールプロンプト、そして最後に、低リソース言語でヘイトスピーチを効果的に検出する革新的なメタファーの6つのプロンプトについて検討する。
低リソースのベンガル語におけるメタファーの有効性を証明するため、別の低リソースのヒンディー語と2つの高リソースの言語(英語とドイツ語)で評価した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:59:25 GMT)
KnowSafe: Combined Knowledge and Data Driven Hazard Mitigation in Artificial Pancreas Systems [2.9] KnowSafeは、安全を害する悪意のある攻撃や、CPSコントローラを標的とした偶発的な障害による安全性の危険を予測し軽減する。
安全制約のドメイン固有の知識とコンテキスト固有の緩和行動と機械学習(ML)技術を統合する。
KnowSafeは、システム状態の軌跡や潜在的な危険を予測する上で、より高い精度を達成することで、最先端技術よりも優れています。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:22:47 GMT)
Quantum state-transfer and periodicity in discrete-time quantum walk under non-Markovian noise [2.9] 量子通信では、量子ネットワークにおけるある位置から別の位置への量子状態の転送が顕著な役割を果たす。
グラフ上の量子ウォークによって誘導される周期性と状態伝達に対する非マルコフ量子ノイズの影響について検討する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:18:33 GMT)
Pixel super-resolved virtual staining of label-free tissue using diffusion models [2.9] 本研究では,ブラウン橋プロセスを用いた拡散モデルに基づく超解像仮想染色手法を提案する。
提案手法は,新しいサンプリング手法を拡散モデルに基づく画像推論プロセスに統合する。
ラベルのないヒト肺組織サンプルの低分解能自動蛍光画像に盲目的に適用し、拡散に基づく超高分解能仮想染色モデルは、従来の解像度、構造的類似性、知覚精度のアプローチよりも一貫して優れていた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:15:48 GMT)
Density matrix representation of hybrid tensor networks for noisy quantum devices [2.8] シミュレーション量子系の大きさの展開を記述するための拡張演算子を提案する。
観測可能な観測値の期待値は、縮約された量子テンソルの数で指数関数的に消えることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:16:01 GMT)
Rethink 3D Object Detection from Physical World [2.7] 高速・低遅延3D物体検出は自律運転システムに不可欠である。
従来の3次元物体検出の研究では、平均平均精度(mAP)と遅延に基づいて性能を評価することが多かった。
本稿では,遅延対応AP(L-AP)と計画対応AP(P-AP)を新たな指標として導入し,リアルタイム3Dオブジェクト検出のより包括的な評価を行う。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:59:20 GMT)
DABstep: Data Agent Benchmark for Multi-step Reasoning [2.7] DABstepは、現実的なマルチステップデータ分析タスクでAIエージェントを評価するための新しいベンチマークである。
ファイナンシャル・アナリティクス・プラットフォームから派生した450以上の現実世界の課題で構成されている。
Dabstepは、自律的なデータ分析の研究を加速するために、公開のリーダーボードとツールキットと共にリリースされた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:49:21 GMT)
When Servers Meet Species: A Fab-to-Grave Lens on Computing's Biodiversity Impact [2.7] 本稿では,コンピュータシステムによる生物多様性への影響のエンド・ツー・エンド分析について述べる。
生物多様性指数(EBI)とOBI(Operational Biodiversity Index)の2つの新しい指標を導入し,生物多様性への影響をライフサイクル全体で定量化する。
本稿では,計算負荷と生物多様性の影響を結びつけるモデリングフレームワークであるFABRICを紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:08:23 GMT)
Free and Fair Hardware: A Pathway to Copyright Infringement-Free Verilog Generation using LLMs [2.6] 著作権保護されたコードを生成するために, Verilog 学習 LLM のリスクを推定するための評価ベンチマークを提案する。
我々は、連続的な事前学習からなるLLM微調整フレームワークを実行し、その結果、Verilog, FreeV のための微調整 Llama モデルを生成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:58:46 GMT)
Learning World Models With Hierarchical Temporal Abstractions: A Probabilistic Perspective [2.6] 内部世界モデルを開発するためのフォーマリズムの開発は、人工知能と機械学習の分野における重要な研究課題である。
この論文は、状態空間モデルを内部世界モデルとして広く用いられることによるいくつかの制限を識別する。
形式主義におけるモデルの構造は、信念の伝播を用いた正確な確率的推論を促進するとともに、時間を通してのバックプロパゲーションによるエンドツーエンドの学習を促進する。
これらの形式主義は、世界の状態における不確実性の概念を統合し、現実世界の性質をエミュレートし、その予測の信頼性を定量化する能力を向上させる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:01:16 GMT)
Entanglement generation between Unruh-DeWitt detectors in the de Sitter spacetime-analysis with complex scalar fields [2.5] 宇宙空間における2つの同一のアンルー・デウィット検出器間の絡み合いの発生や収穫について検討する。
複素場や非線形結合を含むシナリオにおいて,絡み合い収穫の方がより弾力性が高いことを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:43:06 GMT)
SmileyLlama: Modifying Large Language Models for Directed Chemical Space Exploration [2.5] 汎用大規模言語モデル (LLM) が化学言語モデル (CLM) に変換可能であることを示す。
SmileyLlamaを、大量のChEMBLデータをスクラッチから訓練したCLMと比較し、有効で新規な薬物様分子を生成する能力を評価した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:36:58 GMT)
Tensor Train Quantum State Tomography using Compressed Sensing [2.5] 量子状態トモグラフィ(QST)は、測定データから量子システムの状態を推定するための基礎技術である。
本研究では,低ランクブロックテンソルの列車分解による状態のパラメータ化により,この問題に対処する。
この枠組みは、低ランク分解によってよく近似できる幅広い量子状態のクラスに適用できる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:06:50 GMT)
Green AI in Action: Strategic Model Selection for Ensembles in Production [2.5] 複数のモデルからの予測を1つの予測に組み合わせたアンサンブル学習は、累積エネルギー消費によってこの問題を強化する。
本稿では,AI アンサンブルシステムにおいて,AI モデルの精度とエネルギー消費のバランスをとることの課題に対処する,モデル選択のための新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:17:09 GMT)
Open quantum battery in three-dimensional rotating black hole spacetime [2.4] ブラックホールの回転は、充電性能を有限時間で向上させる。
散逸と回転によって真空変動からエネルギーを抽出し、QBの容量を抑え、このエネルギーを抽出する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:14:41 GMT)
Neural Langevin Machine: a local asymmetric learning rule can be creative [2.3] このような生成モデルであるニューラルランゲヴィンマシンは,解析的な形態の分布から解釈可能であり,訓練も容易である。
ニューラルネットワークで創造的なダイナミクスの連続的なサンプリングを実現し、脳回路の想像力を模倣することができる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:35:43 GMT)
A High-Fidelity Speech Super Resolution Network using a Complex Global Attention Module with Spectro-Temporal Loss [2.2] 音声超解像(SSR)はサンプリング率を高めて低分解能音声を強化する。
近年の研究では、知覚品質向上のための位相再構成の重要性が強調されている。
我々は、複雑なSSRタスクを改善するために、複雑なドメインにおける大きさと位相の両方を再構成する複雑な時間周波数変換ネットワークであるCTFT-Netを紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:53:15 GMT)
Rust vs. C for Python Libraries: Evaluating Rust-Compatible Bindings Toolchains [2.2] 本研究では、Ctypeやcffiに対するRust用のPythonバインディングツールチェーンであるPyO3のパフォーマンスと使いやすさを評価する。
Python用に開発されたRustツールを使うことで、APIの互換性を気にすることなく、最先端のパフォーマンスを達成できます。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:14:20 GMT)
Aim High, Stay Private: Differentially Private Synthetic Data Enables Public Release of Behavioral Health Information with High Utility [2.2] 差別化プライバシ(DP)は、再識別リスクに対する正式な保証を提供する。
我々は、リングスタディ(LEMURS)を用いて測定されたライブ体験の第1相のDP合成データを生成する。
LEMURSデータセットの実際の使用状況から情報を得たフレームワークを用いて,合成データの有用性を評価する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:58:34 GMT)
On the Domain Robustness of Contrastive Vision-Language Models [2.2] Deepbenchは、視覚言語モデルのドメイン固有の堅牢性を評価するために設計されたフレームワークである。
実世界の6つの領域にまたがる、コントラストのある視覚言語アーキテクチャとアーキテクチャのバリエーションを評価した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:39:33 GMT)
Benchmarking Spiking Neural Network Learning Methods with Varying Locality [2.1] スパイキングニューラルネットワーク(SNN)はより現実的な神経力学を提供する。
情報はイベントベースのメカニズムでSNN内のスパイクとして処理される。
スパイキング機構の非分化性のため,SNNのトレーニングは困難であることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:07:25 GMT)
Making a Pipeline Production-Ready: Challenges and Lessons Learned in the Healthcare Domain [2.1] SPIRAはML-Enabled System(MLES)を作成し、音声分析によって呼吸不全を診断するプロジェクトである。
本稿では,MLESのアーキテクチャの概要を述べるとともに,その連続訓練サブシステムの3つのバージョンを比較した。
論文は、学習した課題と教訓を共有し、パイプラインを生産しようとする研究者や実践者に洞察を提供する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:31:52 GMT)
GroundingDINO-US-SAM: Text-Prompted Multi-Organ Segmentation in Ultrasound with LoRA-Tuned Vision-Language Models [2.1] 本研究では,複数の超音波臓器にまたがる物体セグメンテーションを実現するために,Grounding DINOとSAM2を統合したプロンプト駆動視覚言語モデル(VLM)を提案する。
胸, 甲状腺, 肝臓, 前立腺, 腎臓, 脊髄筋を含む18種類の超音波データセットが得られた。
提案手法は,UniverSeg,MedSAM,MedCLIP-SAM,BiomedParse,SAMUSなどの最先端セグメンテーション手法より優れている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:33:44 GMT)
Beyond Distance: Mobility Neural Embeddings Reveal Visible and Invisible Barriers in Urban Space [2.0] 私たちはニューラル埋め込みモデルを使って、人々が都市空間をどう移動するかを学ぶ。
障壁の最も強い予測者は、アメニティ、行政境界、および収入と人種による住宅分離へのアクセスの差異である。
これらの見えない境界線は都市コアに集中しており、都市、空間スケール、期間にわたって持続している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:08:26 GMT)
A Metascience Study of the Low-Code Scientific Field [2.0] ローコード」は、いくつかの人気の高い開発プラットフォームとの結びつきから、モデル分野を嵐で捉えてきた。
本稿では低符号のメタサイエンス研究について述べる。
私たちは、ローコードコミュニティの現在と将来の軌道について議論を起こそうと考えています。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:21:16 GMT)
Observation of many-body coherence in quasi-one-dimensional attractive Bose gases [2.0] マクロコヒーレンス(Macroscopic coherence)は、集合的な振る舞いを示す量子多体系の重要な特徴である。
ここでは, 退化擬似一次元(1D)ボースガスの1次および2次コヒーレンスを, 反発性から変調不安定な相互作用系に焼成した実験的検討を行った。
その結果, 非線形物理学における雑音増幅密度変調と分散衝撃波との相互作用から位相コヒーレント密度波の進化が明らかとなった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:21:21 GMT)
Toward Simple and Robust Contrastive Explanations for Image Classification by Leveraging Instance Similarity and Concept Relevance [2.0] 本研究は, 微調整深層学習モデルで用いられる, インスタンス埋め込みの類似性と人間の理解可能な概念の関連性を活用することにより, 画像分類のための概念に基づくコントラスト的説明を実現する。
提案手法は, 関連性スコアを用いて概念を抽出し, 類似事例のコントラストを計算し, 説明複雑性に基づくコントラスト的説明を評価する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:41:43 GMT)
VR-YOLO: Enhancing PCB Defect Detection with Viewpoint Robustness Based on YOLO [2.0] YOLOv8モデルに基づくVR-YOLOと呼ばれるPCB欠陥検出アルゴリズムを提案する。
本アルゴリズムは,現実的なアプリケーションシナリオにおいて,モデルの一般化性能を改善し,視点の堅牢性を高めることを目的としている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:50:04 GMT)
MammoTracker: Mask-Guided Lesion Tracking in Temporal Mammograms [1.9] MammoTrackerはマスクでガイドされた病変追跡フレームワークで、連続試験で病変の局在を自動化する。
提案手法は,グローバル検索,ローカル検索,スコアリファインメントという3つの重要なモジュールを組み込んだ粗大な戦略に従う。
データセットはhttps://gitlab.oit.duke.edu/railabs/LoGroup/mammotracker.comから入手可能です。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 23:56:24 GMT)
Inherited or produced? Inferring protein production kinetics when protein counts are shaped by a cell's division history [1.9] 分裂細胞に対するタンパク質産生動態の推測は、母細胞からの複雑なタンパク質の継承である。
蛍光測定は、新しく作られたタンパク質だけでなく、連続した細胞分裂によって引き継がれたタンパク質を反映することがある。
グリコーゲン合成に関わる酵母のglc3遺伝子の活性化を調べた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 22:13:16 GMT)
Fault-tolerant protocols through spacetime concatenation [1.8] 安定器符号のシンドローム抽出回路のフォールトトレラントコンパイルのための時空連結方式を提案する。
我々のフレームワークは、論理演算子の測定や時空距離の保存など、動的コードのフォールトトレランスに十分な条件を使用する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:27:17 GMT)
Deep Learning-Based Semantic Segmentation for Real-Time Kidney Imaging and Measurements with Augmented Reality-Assisted Ultrasound [1.8] リアルタイム(RT)自動腎臓容積測定のための,ディープラーニング(DL)に基づくセマンティックセグメンテーションを統合した。
拡張現実(AR)は、臨床医の視野に直接ディスプレイを投影することにより、超音波(US)のユーザビリティを高める。
オープンソースのGitHubパイプラインには、モデル実装、測定アルゴリズム、Wi-Fiベースのストリーミングソリューションが含まれています。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:49:54 GMT)
On Recipe Memorization and Creativity in Large Language Models: Is Your Model a Creative Cook, a Bad Cook, or Merely a Plagiator? [1.8] このワーク・イン・プログレスは、大規模言語モデルから生成された料理レシピにおける記憶、創造性、およびナンセンスを調査する。
LLM-as-judge'パイプラインを設計し、レシピ生成、ナンセンス検出、材料やレシピの構文解析、アノテーションを自動生成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:27:11 GMT)
Single Image Test-Time Adaptation via Multi-View Co-Training [1.7] 単一画像テスト時間適応のためのパッチベースのマルチビュー協調学習手法を提案する。
本手法は,不確実性誘導自己学習による特徴と予測整合性を実現する。
提案手法は,上界教師付きベンチマークに近い性能を実現する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:29:33 GMT)
Bridging the Gap with Retrieval-Augmented Generation: Making Prosthetic Device User Manuals Available in Marginalised Languages [1.7] この研究は、人工装具のユーザーマニュアルなどの医療文書を処理し、翻訳するために設計されたAI駆動のフレームワークを、疎外された言語に提示する。
医療従事者や患者などのユーザーは、英語の医療機器マニュアルをアップロードしたり、母国語で質問をしたり、正確な回答をリアルタイムで受け取ることができる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:25:58 GMT)
Connecting phases of matter to the flatness of the loss landscape in analog variational quantum algorithms [1.7] 変分量子アルゴリズム(VQA)は、短期的な量子優位を約束するが、デジタルゲートベースのアプローチで一般的に構築されるパラメトリズド量子状態は、バレンプラトーのようなスケーラビリティの問題に悩まされることが多い。
いくつかの量子シミュレーションプラットフォームに固有の、乱れたIsing鎖の$M$ quenchesからなるアナログVQA ans'atzeについて検討する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:17:09 GMT)
A Graph-Based Classical and Quantum Approach to Deterministic L-System Inference [1.7] L-系は、植物開発のような多くの生物学的プロセスのシミュレーションをモデル化し、作成することができる。
与えられたプロセスのL-システムを見つけることは、通常、専門家によって、非常に時間を要するプロセスで手作業で解決される。
画像のシーケンスなど、データから自動的に行うことができれば、これは重要なことだ。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:57:15 GMT)
The Trilemma of Truth in Large Language Models [1.6] 大規模言語モデル(LLM)の妥当性を検証するための2つの共通手法について検討する。
sAwMILは, LLMの内部アクティベーションを利用して, 文を真, 偽, 両方に分離する探索手法である。
sAwMILを16のオープンソースLCMの5つの妥当性基準で評価した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:49:28 GMT)
Garbage In, Reasoning Out? Why Benchmark Scores are Unreliable and What to Do About It [1.6] 我々は、SocialIQa、FauxPas-EAI、ToMiの3つの広く使われている推論ベンチマークの体系的な監査を行う。
ベンチマーク項目と評価手法の両方において,広範な欠陥を明らかにする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:57:28 GMT)
ROCK: A variational formulation for occupation kernel methods in Reproducing Kernel Hilbert Spaces [1.6] 弱い定式化問題の大規模なクラスに対してRepresenter Theorem結果を示す。
我々は、従来の機械学習と数値手法の両方に、新しい技術と新しい技術の両方に、私たちの定式化の応用例を提示する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:56:08 GMT)
Sampling and Identity-Testing Without Approximate Tensorization of Entropy [1.6] エントロピーの近似テンソル化を満足しない分布に対するアイデンティティテストとサンプリングの複雑さについて検討する。
修正対数ソボレフの不等式を満たす分布の混合に対して,データに基づく初期化と最適なサンプル複雑性からグラウバー力学の高速混合を示す。
また,Blancaなどのアルゴリズムの単純化や改良も行った。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 01:36:32 GMT)
Bridging Subjective and Objective QoE: Operator-Level Aggregation Using LLM-Based Comment Analysis and Network MOS Comparison [1.6] 本稿では,ネットワーク操作者側品質評価(QoE)のための2層フレームワークを提案する。
目的としては、ITU-T P.1203参照実装を用いて平均世論スコア(MOS)に基づいて学習した機械学習モデルを開発する。
主観的側面では、ユーザコメントをライブストリームから処理し、パフォーマンス関連のフィードバックを抽出するセマンティックフィルタリングとスコアリングパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:21:31 GMT)
Use Sparse Autoencoders to Discover Unknown Concepts, Not to Act on Known Concepts [1.5] 我々は、SAEは既知の概念に作用しないかもしれないが、SAEは未知の概念を発見するための強力なツールであると主張している。
この区別は、既存の負および正の結果をきれいに分離し、SAEアプリケーションのいくつかのクラスを示唆する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:35:56 GMT)
Evaluating K-Fold Cross Validation for Transformer Based Symbolic Regression Models [1.5] トランスフォーマーモデルはシンボリック回帰において有望であるが、パフォーマンスはより小さなデータセットに悩まされている。
我々は, 大幅に削減されたデータセットに基づいて訓練された変圧器に基づく記号回帰モデルに対して, k-foldクロスバリデーションを適用することを提案する。
その結果、このプロセスは、検証損失53.31%の相対的な改善により、モデルの出力整合性と一般化を改善することが示された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:45:26 GMT)
Fundamental thresholds for computational and erasure errors via the coherent information [1.5] ノイズの多いQEC符号に関連する混合状態密度演算子のコヒーレント情報(CI)に基づくフレームワークを提案する。
両種類の誤りが存在する場合, 汎用安定化器QEC符号に対して, 統計力学マッピングの異なるファミリーを厳格に導出する方法を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:37:59 GMT)
Online Human Action Detection during Escorting [1.5] ロボットを護衛することは、主にナビゲーションに焦点を当てた戦略に依存している。
混み合った環境では、個人はペースを維持するのに苦労したり、邪魔したり、気を散らしたり、突然停止する必要が生じる。
本稿では,人物の再識別と行動予測をリアルタイムで実現するニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:25:31 GMT)
Active Inference AI Systems for Scientific Discovery [1.5] AI駆動科学の進歩は、現在、抽象的ギャップ、推論的ギャップ、現実的ギャップという3つの基本的なギャップを閉じることに依存している、と私たちは主張する。
我々は、科学的発見のための能動的推論AIシステムを、因果自己管理基礎モデルに基づく長期研究記憶を維持するものとして定義する。
また、シミュレーションや実験からのフィードバックの本来の曖昧さや、根底にある不確実性が人間の判断を不可欠にしているとも主張されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:37:51 GMT)
Logit-Gap Steering: Efficient Short-Suffix Jailbreaks for Aligned Large Language Models [1.4] 高速なジェイルブレイクフレームワークであるlogit-gap steeringを導入し、RLHF対応言語モデルの拒絶確認ギャップを語彙の単一パスとして表現する。
フォワード計算可能なスコアは、ギャップ低減とKLペナルティと報酬シフトのための軽量プロキシをブレンドする。
同じ接尾辞は目に見えないプロンプトとスケールを0.5Bから70Bのチェックポイントに一般化し、ベースラインレベルから80-100%まで1発の攻撃成功を上げた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:01:18 GMT)
Exploring Privacy and Security as Drivers for Environmental Sustainability in Cloud-Based Office Solutions [1.4] 本稿では,クラウドベースのオフィスソリューションにおけるプライバシ,セキュリティ,環境サステナビリティの交わりについて検討する。
プライバシを重視したサービスは、一般的にデータ収集や広告を通じて得られたものよりもエネルギー効率が高いと仮定する。
当社のフレームワークは,プライバシポリシを反映して選択された3つの主流メールサービスに適用する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:58:22 GMT)
Interpretable AI for Time-Series: Multi-Model Heatmap Fusion with Global Attention and NLP-Generated Explanations [1.3] 本稿では,ResNetが生成するヒートマップと,グローバルに重み付けされた入力サリエンシを備えた再構成された2次元変換器を統合することで,モデル解釈可能性を向上させる新しいフレームワークを提案する。
本手法は、勾配重み付きアクティベーションマップ(ResNet)とトランスフォーマーのアテンションロールアウトを統合可視化にマージし、空間的・時間的アライメントを実現する。
臨床(ECG不整脈検出)および産業データセットに関する実証的評価は,有意な改善を示した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:04:35 GMT)
Introducing Answered with Evidence -- a framework for evaluating whether LLM responses to biomedical questions are founded in evidence [1.3] 生物医学的質問応答のための大規模言語モデル (LLMs) は、それらの応答の正確性と明確なサポートに関する懸念を提起する。
我々は,(1)アレクサンドリア,fka the Atropos Evidence Library,新しい観察研究に基づくRAGシステム,(2)PubMedに基づく検索強化システム(システムとパープレキシティ)を比較パイプラインで分析した。
PubMedをベースとしたシステムでは,約44%の質問に対してエビデンス支援の回答が得られたが,新たなエビデンスソースでは約50%の回答が得られた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:00:52 GMT)
Modular Distributed Nonconvex Learning with Error Feedback [1.3] 圧縮通信を用いた新しい分散学習アルゴリズムを設計する。
より詳しくは、モジュラーアプローチ、ADMM、勾配に基づくアプローチを追求する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:38:21 GMT)
Soft Dice Confidence: A Near-Optimal Confidence Estimator for Selective Prediction in Semantic Segmentation [1.3] そこで本研究では,Dice係数のパラメータと直接一致したチューニング不要な信頼スコア関数を提案する。
6つの公開医用画像ベンチマークと合成データによる実験は、我々の理論的知見を裏付けるものである。
これらの結果から,SDCはセマンティックセグメンテーションにおける選択予測のための信頼性・効率の高い信頼度推定器として位置づけられた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:42:11 GMT)
Non-Clifford diagonalization for measurement shot reduction in quantum expectation value estimation [1.3] 短期量子コンピュータ上での期待値を推定するには、しばしば非常に多くの測定を必要とする。
本稿では,この可換性の制約を緩和する手法を提案する。
我々は、$k$-NoCliDが回路ショットの数を、しばしば非常に大きなマージンで減らし、しばしば$k$が2.2まで小さくなることを示した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 23:04:19 GMT)
Finite Gaussian assistance protocols and a conic metric for extremizing spacelike vacuum entanglement [1.2] この研究は、任意の$AB$ガウスノイズを除去するための$C$の射影的な$C$級数を計算する方法を導入する。
次に、最大(ガウス的援助の絡み合い、GEOA)または最小(ガウス的形成の絡み合い、GEOF)純粋な絡み合いを追求する多モードコニックフレームワークを開発する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:37:08 GMT)
BayesL: Towards a Logical Framework for Bayesian Networks [1.2] ベイズネットワーク(BN)の動作を特定し,クエリし,検証するための新しい論理フレームワークであるBayesLを紹介する。
BayesLはBN上でクエリを作成することができる構造化言語である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:18:00 GMT)
AQUA20: A Benchmark Dataset for Underwater Species Classification under Challenging Conditions [1.2] 本稿では,20種の海面画像8,171点からなる総合的なベンチマークデータセットであるAqua20を紹介する。
13種類の最先端ディープラーニングモデルを評価し, 課題条件下での海洋生物分類における性能評価を行った。
結果、ConvNeXtは98.82%、Top-1は90.69%、F1スコアは88.92%、パラメータサイズは適度に大きい。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:27:51 GMT)
RawMal-TF: Raw Malware Dataset Labeled by Type and Family [1.2] この研究は、マルウェアの種類と家族レベルの両方にラベル付けされた新しいデータセットを開発することによって、機械学習を用いたマルウェア分類の課題に対処する。
データセットには14のマルウェアタイプと17のマルウェアファミリーが含まれており、統合された特徴抽出パイプラインを使用して処理された。
マルウェアと良性サンプルのバイナリ分類において、ランダムフォレストとXGBoostは全データセットに対して高い精度を達成した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:38:01 GMT)
Explainable AI for Comprehensive Risk Assessment for Financial Reports: A Lightweight Hierarchical Transformer Network Approach [1.2] 上場企業はすべて、財務状況とリスクに関する重要な洞察を含む年間10-Kの報告書を提出している。
これらのレポートから企業のリスクを自動的に評価するトランスフォーマーベースのモデルであるTinyXRAを提案する。
TinyXRAは、より包括的なリスク評価のために、歪み、硬変、およびソルティーノ比を取り入れている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:13:35 GMT)
Less Data, More Security: Advancing Cybersecurity LLMs Specialization via Resource-Efficient Domain-Adaptive Continuous Pre-training with Minimal Tokens [1.2] ドメイン適応型継続的事前訓練(Domain-Adaptive Continuous Pretraining, DAP)は、大規模言語モデル(LLM)におけるサイバーセキュリティ理解を強化する手法である。
我々は,1億6百万ワードのサイバーセキュリティコーパスを標準,学術文献,その他さまざまな情報源から活用して,デコーダベースの3つのアーキテクチャを適用した。
Llama-3.3-70B-Ins-DAPモデルは、それぞれ0.718、0.933、0.864の最先端のアキュラティを達成した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:59:29 GMT)
Diffusion Model-based Data Augmentation Method for Fetal Head Ultrasound Segmentation [1.2] 生成AI(GenAI)は現実的な合成画像の作成に有効であることが証明されている。
本研究は, 合成胎児頭部超音波画像を生成するためのマスク誘導型GenAIアプローチを提案する。
その結果,合成データは実画像の特徴を効果的に捉えていることがわかった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:40:12 GMT)
C3VDv2 -- Colonoscopy 3D video dataset with enhanced realism [1.2] 本稿では,高精細3Dビデオデータセットの第2版(v2)であるC3VDv2を紹介する。
192個のビデオシーケンスは60個の特異な高忠実度シリコーン大腸ファントムセグメントで撮影された。
消化器科医が取得した8つのシミュレートされた大腸内視鏡ビデオには、真実のポーズが提供されている。
データセットには、質的評価のための大腸変形を特徴とする15のビデオが含まれている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:29:06 GMT)
Object detection in adverse weather conditions for autonomous vehicles using Instruct Pix2Pix [1.2] 悪天候下での物体検出システムの堅牢性向上は、自律運転技術の進歩に不可欠である。
本研究では,拡散モデル Instruct Pix2Pix を用いた気象モデルによる現実的なデータセット生成手法を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:56:45 GMT)
Explainable Sentiment Analysis with DeepSeek-R1: Performance, Efficiency, and Few-Shot Learning [1.1] DeepSeek-R1はOpenAIのGPT-4oとGPT-4o-miniに対するオープンソース推論モデルである。
実験の結果、DeepSeek-R1は5クラスの感情で91.39%のF1スコア、バイナリタスクで99.31%の精度を5ショットで達成した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:58:45 GMT)
Leveraging a Multi-Agent LLM-Based System to Educate Teachers in Hate Incidents Management [1.1] 本研究では,教師教育における大規模言語モデル(LLM)の可能性について,学校におけるヘイト・インシデント管理の実践例を用いて検討する。
我々は、検索強化プロンプトとペルソナモデリングを組み合わせて、現実的なヘイト状況を模倣するマルチエージェントLLMベースのシステムを構築した。
ヘイトスピーチのパターンを特定し分析し、潜在的なエスカレーションを予測し、効果的な介入戦略を提案するように設計されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:18:13 GMT)
Sanitizing Manufacturing Dataset Labels Using Vision-Language Models [1.1] 本稿では,ラベル・サニタイズ・リファインメントのための視覚言語ベースのフレームワークであるVLSRについて紹介する。
この方法は、CLIPビジョン言語モデルを利用して、画像とその関連するテキストラベルを共有意味空間に埋め込む。
実験の結果、VLSRフレームワークは問題のあるラベルの識別に成功し、ラベルの一貫性を向上させることがわかった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:13:09 GMT)
Multimodal Object Detection using Depth and Image Data for Manufacturing Parts [1.1] 本研究では,赤緑色(RGB)カメラと3Dポイントクラウドセンサを組み合わせたマルチセンサシステムを提案する。
RGBと深度データの両方を処理するために,新しいマルチモーダルオブジェクト検出法を開発した。
その結果、マルチモーダルモデルは、確立されたオブジェクト検出基準に基づいて、深さのみのベースラインとRGBのみのベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:44:53 GMT)
Cryptography from Lossy Reductions: Towards OWFs from ETH, and Beyond [1.1] ワンウェイ関数(OWF)は現代の暗号の基礎を形成するが、その無条件の存在は大きな疑問である。
OWF が存在するか,あるいは任意の保証問題に対して損失の少ない$Pi$ が 2,Omega(logtau_Pi / loglog n)$ で実行されることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:24:50 GMT)
Three-dimensional end-to-end deep learning for brain MRI analysis [1.0] 本研究では,SFCN(Simple Fully Connected Network),DenseNet(DenseNet),Shifted Window(Swin)変換器(Shifted Window(Swin)変換器)の3つの既存3次元アーキテクチャを年齢・性別予測のために評価した。
SFCNは、AUCがUKBで1.00[1.00-1.00]、外部テストセットで0.85-0.91で、より複雑なアーキテクチャよりも一貫して優れていた。
年齢予測タスクでは、SFCNはUKBで2.66(r=0.89)、外部データセットで4.98-5.81(r=0.55-0.70)の平均絶対誤差(MAE)を示した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:44:49 GMT)
Constructing Non-Markovian Decision Process via History Aggregator [1.0] 我々はマルコフ決定過程(MDP)のカテゴリと非マルコフ決定過程(NMDP)のカテゴリを確立する。
我々はHistory Aggregator for State (HAS)を介して意思決定問題設定に非マルコビアン性を導入する。
本分析は,非マルコフ力学を広範囲に表す手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:32:31 GMT)
Value-Compressed Sparse Column (VCSC): Sparse Matrix Storage for Redundant Data [1.0] 非常に冗長なスパースデータは、ゲノミクスのような多くの機械学習アプリケーションで一般的である。
圧縮スパースカラム(CSC)の2つの拡張について述べる。
本稿では,VCSC と IVCSC を圧縮形式で読み取ることができることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:01:35 GMT)
A new machine learning framework for occupational accidents forecasting with safety inspections integration [1.0] 本稿では,安全検査および事故発生をバイナリ時系列としてモデル化した,短期的事故予測のための総合的枠組みを提案する。
提案手法は,日常的な安全検査データを明確な週間リスクスコアに変換し,事故の可能性が最も高い時期を検出する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:28:11 GMT)
Test of partial effects for Frechet regression on Bures-Wasserstein manifolds [1.0] 本稿ではFrechet回帰における部分的効果を評価するための新しいテストを提案する。
この統計は分布に収束し、チ二乗成分の重み付き混合に収束する。
提案手法は名目サイズを達成し,その最悪ケースのパワーが1つに均一に収束することを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:20:05 GMT)
Deblurring in the Wild: A Real-World Dataset from Smartphone High-Speed Videos [0.9] スマートフォンのスローモーションビデオから構築した,世界最大規模の画像デブロアリングデータセットについて紹介する。
240フレームを1秒でキャプチャすることで、フレームの平均化によって現実的な長時間露光のぼかしをシミュレートし、ぼかし画像を生成する。
我々のデータセットには42,000以上の高解像度のぼかしシャープ画像ペアが含まれており、広く使われているデータセットの約10倍の大きさである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:25:56 GMT)
WATCHDOG: an ontology-aWare risk AssessmenT approaCH via object-oriented DisruptiOn Graphs [0.9] 共通オントロジー・オブ・バリュー・アンド・リスク(COVER)は、透明で完全かつ説明可能なリスク評価を実行する上で、オブジェクトとそれらの関係がいかに重要であるかを強調している。
我々は,リスクアセスメントのための新しい枠組みであるWATCHDOGを提示することで,COVERが提案する概念のいくつかを運用する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:52:42 GMT)
Maximum entropy principle for quantum processes [0.9] 一定の平均エネルギーを持つ量子チャネルのエントロピーが最大であることと、その平均エネルギーの一定の出力熱状態と絶対的な熱化チャネルであることは同値である。
これにより、観測可能な宇宙におけるエネルギー制約の下での絶対熱化過程の出現を、別のアプローチで記述することができる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:33:34 GMT)
New aspects of quantum topological data analysis: Betti number estimation, and testing and tracking of homology and cohomology classes [0.9] 我々は,ベッチ数を推定するための改良された量子アルゴリズムを実現するために,追加の位相情報へのアクセスが可能であることを示す。
ホモロジー追跡に基づく新しいアプローチを導入し,ラプラシアンカーネルの計算を回避した。
これはベッチ数が小さい場合でも効率的であり続け、実質的かつ指数的なスピードアップをもたらす。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:08:24 GMT)
Threadbox: Sandboxing for Modular Security [0.9] Threadboxは、モジュール的で独立したサンドボックスを実現するサンドボックス機構である。
本稿では,このアイデアの適用可能性を説明するケーススタディと,その限界について論じる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:04:38 GMT)
Not quite a piece of CHERI-cake: Are new digital security by design architectures usable? [0.9] CHERIはバッファオーバーフローやメモリ安全性のエラーを恐れずにプログラムできる。
私たちは、CHERIの警告とエラーの表示と、さまざまなドキュメントの欠如に、開発者が苦労していることに気付きました。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:04:14 GMT)
Real-World En Call Center Transcripts Dataset with PII Redaction [0.8] CallCenterENは、大規模な(91,706の会話で、10448のオーディオ時間に対応する)実世界の英語コールセンターのトランスクリプトデータセットである。
これは、この種のオープンソースコールセンタの書き起こしデータとしては、これまでで最大のリリースである。
データセットには、インド、フィリピン、米国からのアクセントとともに、エージェントと顧客の間のインバウンドおよびアウトバウンドコールが含まれている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:41:02 GMT)
Evaluating the Impact of Khmer Font Types on Text Recognition [0.8] Khmer, Odor MeanChey, Siemreap, Sithi Manuss, Battambangは高い精度で、iSeth First, Bayon, Dangrekは成績が悪い。
本研究は,Khmerテキスト認識の最適化においてフォント選択が重要であることを明らかにする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:35:51 GMT)
INSIGHT: Bridging the Student-Teacher Gap in Times of Large Language Models [0.7] INSIGHTは、さまざまなAIツールを組み合わせて、エクササイズを解決する過程において、スタッフと学生を教えることを支援する概念実証である。
我々は,学生の質問からFAQを動的に構築するキーワードを抽出することで,学生の質問をLLMに解析する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:30:39 GMT)
BIMgent: Towards Autonomous Building Modeling via Computer-use Agents [0.7] マルチモーダル大言語モデル(LLM)を利用したエージェントフレームワークBIMgentを提案する。
BIMgentを実世界のビルディングモデリングタスクで評価し、テキストベースの概念設計生成と既存ビルディング設計からの再構築を両立させた。
その結果、BIMgentは設計意図を保ちながら手作業の負荷を効果的に削減し、実際のアーキテクチャモデリングシナリオにおける実践的なデプロイの可能性を強調している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:31:07 GMT)
Singular value transformation for unknown quantum channels [0.7] 我々は,$d$次元システム上で作用する量子チャネルの特異値を変換する量子アルゴリズムを開発した。
本手法は,量子チャネルが絡み合っている場合の試験に影響を及ぼす未知の量子チャネルの特異値モーメントを任意の$q>2,qin mathbbR$で学習する問題に対して,実際に適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:56:07 GMT)
LH2Face: Loss function for Hard High-quality Face [0.7] ほとんどの顔認識アルゴリズムは、ソフトマックス分類とコサイン類似性に基づいている。
ハードハイクオリティフェイス(LH2Face)のためのロス関数という新しいロス関数の提案
我々のLH2Faceは、ハードな高品質の顔データセットのスキームよりも優れており、IJB-Bデータセットの49.39%の精度を実現している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:59:02 GMT)
Automated Statistical Testing and Certification of a Reliable Model-Coupling Server for Scientific Computing [0.7] シーケンスベースの仕様と使用法駆動の統計テストは、厳密で費用対効果の高いソフトウェア開発のために設計されている。
我々は厳格な仕様とテスト手法を組み合わせることで、より弾力性のあるWebサービスの品質保証に焦点を合わせます。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:20:34 GMT)
Large Language Models Don't Make Sense of Word Problems. A Scoping Review from a Mathematics Education Perspective [0.7] ChatGPTのような大規模言語モデル(LLM)の進歩は、どのように教育に組み込むことができるのかという疑問を提起する。
LLMは手軽にテキスト入力を処理できるので、数学的な単語問題を解くのに適しているように見える。
しかし、彼らの本当の能力、それが現実世界の文脈を理解できるかどうか、そして教室への影響は、いまだに不明である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:10:42 GMT)
Both Asymptotic and Non-Asymptotic Convergence of Quasi-Hyperbolic Momentum using Increasing Batch Size [0.7] モメンタム法は、もともと凸関数を持つ決定論的設定において、勾配バッチ降下(SGD)に優越する目的で導入された。
収束を達成するには、崩壊する学習率かバッチサイズの増加が必要であることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:31:30 GMT)
Intelligent Routing for Sparse Demand Forecasting: A Comparative Evaluation of Selection Strategies [0.7] サプライチェーンにおける パースと断続的な需要予測は 重大な課題です
本稿では, モデルスパンニングフレームワークを提案し, モデルスパンニングの古典的, ML, DLメソッドを製品毎に選択する。
大規模なFavoritaデータセットの実験では、ディープラーニング(インセプションタイム)ルータが予測精度を最大11.8%向上している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:09:14 GMT)
AutoEvoEval: An Automated Framework for Evolving Close-Ended LLM Evaluation Data [0.6] 大規模言語モデル(LLM)は、様々なタスクにおいて顕著なパフォーマンスを示している。
既存の評価ベンチマークは、しばしば静的で、その堅牢性と一般化を十分に評価するのに不十分である。
本稿では,質問応答などのクローズドなタスクのための進化型評価フレームワークであるAutoEvoEvalを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:18:56 GMT)
Data-Centric Safety and Ethical Measures for Data and AI Governance [0.6] AIとデータセットライフサイクルのさまざまなステージを含む、責任あるデータセット設計フレームワークを提案する。
このフレームワークは、データセットの作成、使用、共有における責任あるプラクティスを促進して、レッドチーム化を促進し、リスクを最小限にし、AIモデルの信頼を高める。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:24:13 GMT)
Robust LLM Unlearning with MUDMAN: Meta-Unlearning with Disruption Masking And Normalization [0.6] 言語モデルは、広範囲の安全性を調整した後でも、危険な知識とスキルを保持することができる。
近年の研究では、特別な未学習の方法であっても容易に逆転できることが示されている。
Disruption Maskingは、ウェイトを更新するだけを可能にするテクニックです。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:37:43 GMT)
CAM-NET: An AI Model for Whole Atmosphere with Thermosphere and Ionosphere Extension [0.5] 我々は,地球表面から電離層への中性大気変数の予測を目的としたAIモデルであるCAM-NETを提案する。
このモデルは、帯状風や乾燥風、温度、圧力の時間といった重要な大気パラメータを効果的に予測する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:10:30 GMT)
Can We Predict the Unpredictable? Leveraging DisasterNet-LLM for Multimodal Disaster Classification [0.5] disasterNet-LLMは、総合的な災害解析のために設計された特殊言語モデル(LLM)である。
高度プレトレーニング,クロスモーダルアテンション機構,適応トランスフォーマーを活用することで,災害分類に優れる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 01:56:05 GMT)
Towards the "Digital Me": A vision of authentic Conversational Agents powered by personal Human Digital Twins [0.4] 本稿では,大規模言語モデルと動的に更新された個人データを統合する新しいHDTシステムアーキテクチャを提案する。
得られたシステムは、話し相手によって個人固有の会話スタイルを再現するだけでなく、動的に捉えられた個人的な経験、意見、記憶によって反応を豊かにする。
これは、真のバーチャルなものを開発するための重要なステップであると同時に、プライバシー、説明責任、永続的なデジタルアイデンティティの長期的な影響に関する批判的な倫理的懸念も提起している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:18:31 GMT)
Demonstration of strong coupling of a subradiant atom array to a cavity vacuum [0.4] 強い集団結合が励起スペクトルの劇的な変化をもたらすことを示す。
強結合真空場により誘導されるラマン散乱によるサブラディアントアレイからの線形散乱において有意な偏光回転を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:48:31 GMT)
Convergence analysis of online algorithms for vector-valued kernel regression [0.4] 回帰関数 $f_mu:, Omega to Y$ from noisy $mu$-distributed vector-valued data。
標準正規化オンライン近似アルゴリズムにより得られた近似値$f(m) in H$のRKHSノルムの2乗誤差を推定する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:42:05 GMT)
Artificial Intelligence-assisted Pixel-level Lung (APL) Scoring for Fast and Accurate Quantification in Ultra-short Echo-time MRI [0.4] Ultrashort echo-time (UTE) を用いた肺磁気共鳴画像(MRI)は,近年の肺組織像のブレークスルーである。
放射線照射がないため、嚢胞性線維症(CF)などの小児疾患ではMRIがCTよりも好まれることが多い。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:08:42 GMT)
Z-REx: Human-Interpretable GNN Explanations for Real Estate Recommendations [0.4] この研究は、異種リンク予測タスク用に明示的に設計されたGNN説明フレームワークであるZ-RExを紹介する。
Z-RExは、構造と属性の摂動を利用して、重要なサブ構造と重要な特徴を識別し、ドメイン固有の知識を活用して検索空間を縮小する。
我々は,Zillow Group, Inc. のリアル・リアル・ステート・データセットを用いて,GNN ベースのレコメンデーションエンジン ZiGNN に対して,文脈的・人間的解釈可能な説明を生成する上で,Z-REx の有効性を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:05:05 GMT)
Learning Constraints Directly from Network Data [0.3] ルール抽出は、合成データの質を改善し、機械学習モデルの脆さを低減し、ネットワーク測定の意味的理解を改善する。
本稿では,生のネットワーク計測から命題論理の制約を直接学習するNetNomosを紹介する。
評価の結果、NetNomosは3時間以内で0.01%のデータポイントに関連するものを含むすべてのベンチマークルールを学習していることがわかった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:36:22 GMT)
Equivalence in delegated quantum computing [0.3] デリゲート量子コンピューティング(DQC)は、限られたクライアントが、量子サーバ上でリモートで能力の外部にある操作を実行できるようにする。
DQCでは、クライアント側で完全に異なる操作を要求する2つのアプローチが従う。
本研究では、プロトコルの等価性に関する新しい厳密な定義を提供し、これらの異なるDQC設定がこの意味では同値であることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:01:33 GMT)
The Jacobian and Hessian of the Kullback-Leibler Divergence between Multivariate Gaussian Distributions (Technical Report) [0.3] この文書は、クルバック・リーブルの発散のヤコビアン行列とヘッセン行列を得る方法を示している。
提案された導出は、citemagnus99 によって提示された理論に基づいている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:58:25 GMT)
Finer Disentanglement of Aleatoric Uncertainty Can Accelerate Chemical Histopathology Imaging [0.3] 本稿では,組織全体の低情報 (LI) 含有量を迅速かつ迅速にスキャンし,高次不確実性 (AU) 領域を同定し,高次情報 (HI) の詳細を捉えるために,より高品質でそれらを選択的に再画像化する適応戦略を提案する。
このことは、動的画像空間(LI-to-HI)における微細なAU歪みに着目した最初の研究であり、新しい病理組織学の合理化への応用である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:16:09 GMT)
From Large-scale Audio Tagging to Real-Time Explainable Emergency Vehicle Sirens Detection [0.3] この研究は、バイナリEVサイレン検出のための軽量畳み込みニューラルネットワークアーキテクチャであるE2PANN(Efficient Emergency Pre trained Audio Neural Networks)を導入している。
複数の参照データセットにまたがってE2PANNを微調整し、評価し、組込みハードウェア上でその生存性をテストする。
その結果、E2PANNは、高い計算効率とエッジベースのオーディオ監視と安全クリティカルなアプリケーションに適した、この研究領域における新しい最先端技術を確立することが示されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 00:21:07 GMT)
Recovery of resources through sequential noisy measurements [0.2] ノイズ測定の逐次的適用は、量子情報処理タスクにおけるノイズの悪影響を軽減することができることを示す。
量子ネットワークにおける選択ノードの絡み合いに集中する場合,量子ビットのアシストによる雑音測定によりこれを実証する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:15:24 GMT)
Improve Underwater Object Detection through YOLOv12 Architecture and Physics-informed Augmentation [0.2] 水中物体検出は、自律航法、環境モニタリング、海洋探査に不可欠である。
現在の手法は精度と計算効率のバランスをとるが、低視認性条件下でのリアルタイムのデプロイには困難がある。
本研究は, YOLOv12アーキテクチャと物理インフォームド・オービメンテーション技術の統合による水中検出を推し進めるものである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:06:50 GMT)
Realization of a functioning dual-type trapped-ion quantum network node [0.2] 本稿では, イオン光子絡み合い発生, クロストークのない量子メモリ, 両型量子ビット間の絡み合いゲートを同時に備えたデュアル型量子ネットワークノードについて報告する。
我々の研究は、デュアルタイプの量子ネットワークノードに必要なコンポーネントを達成し、大規模量子インターネットにおけるその応用への道を開く。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:08:17 GMT)
Unsupervised Sparse Coding-based Spiking Neural Network for Real-time Spike Sorting [0.2] 本研究では、スパイクソートに最適化された2層スパイクニューラルネットワークであるニューロモルフィックスパースソーター(NSS)を紹介する。
NSSは検出されたスパイク波形をオンライン形式でソートすることを学び、完全に教師なしで運用する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:48:49 GMT)
Observing Laughlin's pump using quantized edge states in graphene [0.2] 量子化された電荷ポンプのラウリンの思考実験は、整数量子ホール効果(IQHE)を理解する中心となる。
グラフェン上に超小型でリソグラフィ的に定義された接触体を作製することでこの問題に対処する。
これによりコービノ同値系が生成され、内部状態はよく整合している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:10:37 GMT)
Ultra-sensitive magnetic sensor based on 3-dimensional rotation induced Berry phase [0.2] 本研究では,3次元回転によるベリー位相に基づく直流(DC)磁界測定のための新しい手法を提案する。
約MHzの周波数を持つ3次元回転ダイヤモンド内での14N核スピンの断熱進化を解析した。
この機構を用いて,14N核スピンの静磁場感度が,現在の実験条件下で10(-7) T/Hz(1/2)/N(1/2)に達することを理論的に実証した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:12:25 GMT)
Evaluating the Simulation of Human Personality-Driven Susceptibility to Misinformation with LLMs [0.2] 大規模言語モデル(LLM)により、大規模に合成行動データを生成することができる。
我々は,誤情報に対する個人的影響の変動を再現するために,Big-Fiveプロファイルに規定されたLLMエージェントの能力を評価する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:16:07 GMT)
Assessing workflow impact and clinical utility of AI-assisted brain aneurysm detection: a multi-reader study [0.1] 私たちは、アルゴリズムのトレーニング/検証に360の被験者を使用し、読み出しセッションには見当たらないテストセットとして100を使用します。
その結果,中高生でも中高生でも感度は有意に上昇しないことがわかった。
読者が報告した自信は2つの設定で変化せず、AIアシストが診断の確実性に影響を与えないことを示している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:58:17 GMT)
Unveiling Privacy Policy Complexity: An Exploratory Study Using Graph Mining, Machine Learning, and Natural Language Processing [0.1] 本研究では、ユーザによるプライバシーポリシーの理解を高めるために、インタラクティブなグラフ可視化の可能性について検討する。
ユーザアクティビティやデバイス情報といった重要なテーマを識別するために,グラフマイニングアルゴリズムを採用している。
その結果,グラフベースのクラスタリングにより,ポリシー内容の解釈性が向上することがわかった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:55:57 GMT)
SG-LDM: Semantic-Guided LiDAR Generation via Latent-Aligned Diffusion [0.1] Lidarポイントクラウド合成は、ディープラーニングパイプラインを拡大するための有望なソリューションを提供する。
既存の方法は、非条件のライダーポイントクラウド生成に焦点を合わせ、現実世界のアプリケーションの可能性を見越している。
本研究では,セマンティック誘導ライダー拡散モデルであるSG-LDMを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:13:04 GMT)
Lock Prediction for Zero-Downtime Database Encryption [0.1] 本研究では,ディープラーニングモデルを用いてデータベースロックシーケンスの予測を行う予測手法を提案する。
提案するアプローチは,セキュアで低オーバーヘッドなデータベースシステムへの実践的なパスを提供する,オンライン暗号化へのステップである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:50:06 GMT)
Will it glue? On short-depth designs beyond the unitary group [0.1] システムサイズよりも小さな光円錐を持つ任意の回路アンサンブルにより、ユニタリ設計のアナログが生成できないことを証明した。
また,回路アーキテクチャ上でのサブ線形深度設計は,幅広い種類の回路では実現できないことを示す。
この結果から,浅量子回路におけるランダム性の発生は広範であるが微妙な現象であることが明らかとなった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:54:28 GMT)
Value-Free Policy Optimization via Reward Partitioning [0.1] 単軌道強化学習のための新しい手法であるReward Partitioning Optimization (RPO)を導入する。
RPOは、データから直接推定されるアプローチを使用して、観察された報酬を正規化する。
我々は,Flan-T5エンコーダデコーダモデルを用いて,スカラーフィードバック言語モデリングタスクにおけるRPOの有効性を検証する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:57:40 GMT)
Multi-Target Density Matrix Renormalization Group X algorithm and its application to circuit quantum electrodynamics [0.0] 我々は密度行列再正規化群(DMRG)アルゴリズムの変種であるDMRG-Xを用いて、2次元トランスモンアレイの局所固有状態を効率的に取得する。
また,DMRG-XとマルチターゲットDMRGを組み合わせた新しいアルゴリズムMTDMRG-Xを導入する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:55:20 GMT)
Enhancing Insider Threat Detection Using User-Based Sequencing and Transformer Encoders [0.0] インサイダー脅威検出は、悪意のあるアクターの認定状態のために、ユニークな課題を提示する。
既存の機械学習メソッドは、ユーザアクティビティを独立したイベントとして扱うため、ユーザの振る舞いにおけるシーケンシャルな依存関係を活用できない。
本稿では,ユーザベースシーケンス法(UBS)手法を提案し,CERTインサイダー脅威データセットを深い逐次モデリングに適した構造化時間列に変換する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 00:47:31 GMT)
YOLO-Based Pipeline Monitoring in Challenging Visual Environments [0.0] 低視認性水中環境における海底パイプラインの状況監視は、濁度、光歪み、画像劣化などによる大きな課題を生んでいる。
従来の視覚ベースの検査システムは、そのような状況下でのマッピング、オブジェクト認識、欠陥検出のための信頼性の高いデータの提供に失敗することが多い。
本研究では、画像品質の向上、パイプライン構造の検出、自律的故障診断支援のための高度な人工知能(AI)技術の統合について検討する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:47:30 GMT)
When GNNs Met a Word Equations Solver: Learning to Rank Equations (Extended Technical Report) [0.0] 解法前後の単語方程式のランク付けのためのグラフニューラルネットワーク(GNN)について検討する。
ランク付け方程式問題に多分類タスクを適用するための3つのアプローチを提案する。
GNNのトレーニングは、単語方程式の最小不満足な部分集合(MUS)の助けを借りて行われる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:24:24 GMT)
What to Keep and What to Drop: Adaptive Table Filtering Framework [0.0] ATFは、列記述、クラスタリング、スパースセンスアライメントスコアを使用して、非形式的な列と行をプルーする。
実験によると、ATFはテーブルセルを70%削減し、ドメイン外のTableQAタスクのパフォーマンスを向上する。
結果は、タスク間で情報性と最小主義を適応的にバランスさせるATFの能力を強調している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:03:23 GMT)
Unveiling Decision-Making in LLMs for Text Classification : Extraction of influential and interpretable concepts with Sparse Autoencoders [0.0] 本稿では,テキスト分類に適した新しいSAEアーキテクチャを提案する。
我々はこのアーキテクチャを、ConceptShap、Independent Component Analysis、その他のSAEベースの概念抽出技術といった確立した手法と比較した。
私たちのアーキテクチャは,抽出した特徴の因果性と解釈性の両方を改善している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:18:50 GMT)
Unraveling Open Quantum Dynamics with Time-Dependent Variational Monte Carlo [0.0] 本稿では,時間依存変動モンテカルロ(VMC)と量子軌道法を組み合わせることで,オープン量子多体力学をシミュレートする手法を提案する。
我々のアプローチは、リンドブラッドのマスター方程式を変分アンザッツの方程式のアンサンブルに展開し、密度行列の進化の指数的なコストを回避する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:56:01 GMT)
Unbounded knapsack problem and double partitions [0.0] クナプサック問題(knapsack problem)は、整数係数を持つ2つの線型ディオファント方程式の系に対する多くの非負の整数解を求める。
19世紀半ば、シルヴェスターとケイリーは、スカラー分割の和に二重分割を還元できる変数除去に基づくアプローチを提案した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:44:25 GMT)
Two-Stage Reasoning-Infused Learning: Improving Classification with LLM-Generated Reasoning [0.0] 本稿では,Large Language Model (LLM) を用いた2段階のテキスト分類手法を提案する。
第1段階では、汎用推論データセット上で、Llama-3.2-1B-インストラクトモデル(以下、Llama-R-Gen)を微調整する。
第2段階では、一般的にトレーニングされたこのLlama-R-Genをオフラインで使用して、下流生成モデルのための強化トレーニングデータセットを作成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:34:57 GMT)
Trust & Safety of LLMs and LLMs in Trust & Safety [0.0] 本稿では,大規模言語モデルにおける信頼と安全性に関する現在の研究状況について考察する。
信頼性と安全性が最優先の領域におけるLCMの利用の複雑さを掘り下げる。
このレビューでは、信頼と安全においてLLMを使用するためのベストプラクティスに関する洞察を提供し、迅速な注入や脱獄攻撃といった新たなリスクについて調査する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:50:31 GMT)
Towards transparent and data-driven fault detection in manufacturing: A case study on univariate, discrete time series [0.0] 本稿では,データ駆動型および透過型の両方の産業的故障検出手法を提案する。
このアプローチは、マルチクラスの障害分類のための教師付き機械学習モデル、ポストホック解釈のためのShapley Additive Explanations、do-main-specific visualization techniqueを統合する。
本システムは, 故障検出精度95.9 %を達成し, 定量的選択性解析と定性評価の両方で, 発生した説明の妥当性と解釈性を確認した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:11:48 GMT)
Towards a Science of Developer eXperience (DevX) [0.0] このコラムは、Developer eXperience (DevX) を独立した研究分野として正式に認識することを提唱している。
DevXは重要な開発活動と全体的な生産性に大きな影響を与えます。
我々は、この新たな分野を支える重要な理性、科学的有効性、学際的交差点を識別する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:42:57 GMT)
Topologically noise robust network steering without inputs [0.0] 独立したソースを持つ量子ネットワークは、ネットワークのノード当たりの1つの測定で量子非局所性やステアリングを観測することができる。
最近導入されたスワップステアリングの概念に触発されて、入力のない三角形ネットワークのシナリオを考える。
我々はこのフレームワークを任意の数のノードを持つリングネットワークに拡張し、そのうちの1つを信頼する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:04:44 GMT)
Topological two-body interaction obstructing trivial ground states: an indicator of fractional Chern insulators [0.0] 我々は、トポロジカル有効相互作用とチャーン絶縁体(FCI)の関係について検討する。
支配的な二粒子バンドが単位チャーン数を持つという事実と、充填率$nu = 1/3$でのロバストFCIの実現との間には顕著な相関関係がある。
本研究は, 相互作用自体に固有のトポロジーが, 自明な基底状態を妨げることを示唆している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:23:37 GMT)
Thinking About Thinking: SAGE-nano's Inverse Reasoning for Self-Aware Language Models [0.0] 大規模言語モデル(LLM)は、Chain-of-Thoughtプロンプトで複雑な推論タスクを解く際、顕著な能力を示した。
我々は, LLM を分解し, 自己の推論連鎖をポストホックで説明できる新しいパラダイムであるtextbfinverse reasoning を紹介した。
私たちの研究は、透明なAIシステムのための新たな道を作り、AIの安全性、教育、科学的発見において大きなギャップを埋めます。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:53:41 GMT)
The Quantum Wave Function as a Complex Probability Distribution [0.0] 波動関数とその複素共役は複素確率分布と解釈できることを示す。
量子論におけるプロセスの考え方を受け入れることは、大きな物体に古典的な振る舞いが現れる理由を説明するかもしれないことが示唆されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:54:51 GMT)
The Problem of the Priors, or Posteriors? [0.0] 後頭骨の問題に対処する鍵は、後頭骨を統治する規範を考えることであると私は主張する。
私は、後部クレデンスの真理への収束を重んじる、前向きのベイズ主義への特定のアプローチを開発します。
このアプローチは、統計学と機械学習におけるオッカムのカミソリのベイズ的基盤にとって重要であると主張されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:48:43 GMT)
The Order of Physical Law [0.0] 2階法関係は通常、法的権限を行使する法的アクターの意図的、自発的な行為に関係している。
この記事では、法秩序の概念を適応させ、一階法則と高階法則の理論を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:59:04 GMT)
The Kubernetes Network Driver Model: A Composable Architecture for High-Performance Networking [0.0] 従来のネットワークは、AI/MLと進化中のTelcoインフラストラクチャのエスカレート要求を満たすのに苦労している。
本稿では、現在の命令型プロビジョニングとAPI制限を克服するために設計された、トランスフォーメーション、モジュール、宣言型アーキテクチャであるネットワークドライバ(KND)を紹介する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:45:54 GMT)
The Impact of AI on Educational Assessment: A Framework for Constructive Alignment [0.0] 我々は、AIが異なるブルームレベルの学習目標に異なる方法で影響を及ぼすと主張している。
大学や学部レベルでの構造的ガイドラインを提案し,職員間の整合性を育成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:02:01 GMT)
The Algebraic Structure of Morphosyntax [0.0] 形態-構文界面の数学的モデルを提案する。
この設定では、形態学は、形態学樹のマグマに組織された単語形成に責任を持つ構成的特性を持つ。
分散形態学の特定の操作を変換として再解釈し、構文と形態学の境界をモルフォシンタクティックオブジェクト内で移動させる柔軟性を実現する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:26:32 GMT)
Text-to-Level Diffusion Models With Various Text Encoders for Super Mario Bros [0.0] 既存のレベルデータセットに記述キャプションを自動的に割り当てる戦略を提案する。
我々は、事前訓練されたテキストエンコーダと、スクラッチから訓練された単純なトランスフォーマーモデルの両方を用いて拡散モデルを訓練する。
結果は,非条件拡散モデルと生成逆ネットワークと比較される。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:50:26 GMT)
Teaching Programming in the Age of Generative AI: Insights from Literature, Pedagogical Proposals, and Student Perspectives [0.0] この記事では、プログラミングコンテンツがどのように教えられ、学習され、評価されるべきかについて、最も関連する研究をレビューすることを目的とする。
コードの理解と実行に焦点をあてて、教育と学習の方法論を充実させることを提案する。
プログラミングの教え、学習、評価のための効果的なツールとして、コードの視覚表現と実行の視覚シミュレーションの使用を提唱している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:38:27 GMT)
Surveying optically addressable spin qubits for quantum information and sensing technology [0.0] 量子技術は、特定のタスクをより速く、効率的に、そして、従来のタスクよりも高精度に解決する方法を提供する。
しかし、十分にエラーのないスケーラブルな量子プラットフォームの構築には、大きな課題が残っている。
このレビューは、電子スピンまたは核スピンを用いて量子ビットを具現化するいわゆるスピントロニクス(テクスティ.e.スピン-エレクトロニクス)材料に焦点を当てる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:11:21 GMT)
State Change via One-Dimensional Scattering in Quantum Mechanics [0.0] デルタ関数ポテンシャルを介して一次元的に相互作用する一対の粒子を考える。
自由粒子は特定のエネルギーで左から入射し、左や右に飛ぶ前に閉じ込められた粒子の状態が変化することがある。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:45:37 GMT)
Squeezing Quantum States in Three-Dimensional Twisted Crystals [0.0] 波動力学の基本的な考え方は、周期媒質内の伝播は、保存された結晶モータが離散格子変換の集合に置換されたときにそれらの変換を定義するブロッホ波によって記述できるということである。
不規則な空間周期が競合する順序づけられた材料では、この一般的な原理は効果がなく、しばしば劇的な結果をもたらす。
例えば、電荷またはスピン密度波からの対称性の破れた結晶、結晶学的に禁止された点対称性の回折パターンを生成する準周期格子、層間の相対的な回転(ツイスト)を持つ2次元格子のスタックなどがある。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:00:00 GMT)
Spin squeezing generation in atom-cavity systems: on the effects of adiabatic elimination beyond the leading order [0.0] スピンスクイーズ状態(英: spin-squeezed state)は、構造的絡み合いによって高感度の知覚が可能となる、メトロジー的に有用な量子状態の原型例である。
主な課題はスピンスクイーズ状態の効率的な準備と、プローブ数$N$による推定精度のスケーラビリティである。
数値シミュレーションにより、スピンスクイージングのスケーラビリティ損失は、削減された開系力学によって正しく再現されることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:13:01 GMT)
Spectroscopy of drive-induced unwanted state transitions in superconducting circuits [0.0] マイクロ波駆動は超伝導量子回路における制御および読み出し操作の実装に不可欠である。
9GHz帯のマイクロ波駆動を受ける固定周波数キュービットにおける不要な状態遷移について検討する。
本研究は、これらの遷移を包括的に分類し、駆動周波数の情報選択による緩和戦略と回路設計の改善を提供する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:22:35 GMT)
Shifting Narratives: A Longitudinal Analysis of Media Trends and Public Attitudes on Homelessness [0.0] 本研究は,ホームレスの範囲内でのフレーミング理論を検証するために,関連メディア記事の話題と感情傾向を分析した。
2015年から2023年にかけて、カリフォルニア州、フロリダ州、ワシントン州、オレゴン州、ニューヨーク州の州レベルのトレンドを調査した。
特にホームレス率の高い州では,メディアフレーミングと公的な感情との間に統計的に有意な相関が認められた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 02:32:33 GMT)
Several types of quantum Wasserstein distance based on an optimization over separable states [0.0] 我々は、与えられた限界を持つ一般二部量子状態に対する最適化に基づいて、量子ワッサーシュタイン距離のいくつかの定義を考察する。
我々は、Uhlmann-Jozsa量子忠実度が与えられた限界を持つ分離可能な状態に対する最適化としても記述できることを示した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:55:46 GMT)
Seeding neural network quantum states with tensor network states [0.0] 行列積状態 (MPS) を多項単位からなる制限ボルツマンマシン波動関数に変換する効率的な手法を見出した。
この手法により、多体基底状態計算のための隠れた初期ニューラルネットワーク量子状態を生成することができる。
基底状態波動関数が複素ノルダー構造を持つより一般的な量子多体系への本手法の適用の可能性について論じる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:49:31 GMT)
Scheme for continuous force detection with a single electron at the level of $10^{-27}\ \mathrm{N}$ [0.0] 我々は、そのようなトランスデューサの最終的な例、すなわち1つの閉じ込められた電子について研究する。
ギガヘルツ政権下では, 電荷のゼロ点運動を連続的に監視し, 感度が6~27mrmN/sqrtmathrmHz$以下の力検出器として用いることが可能である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:47:37 GMT)
Ruelle-Pollicott resonances of diffusive U(1)-invariant qubit circuits [0.0] 変換不変磁化保存量子ビット回路のルエル・ポリコット共鳴について検討する。
大きな$k$の場合、リーリール・ポリコット共鳴は輸送とは関係がなく、相関関数の指数的崩壊を支配している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:49:16 GMT)
Room Scene Discovery and Grouping in Unstructured Vacation Rental Image Collections [0.0] 休暇用レンタルプラットフォームが急速に成長し、資産イメージの量が増加し、しばしば階層化せずにアップロードされている。
部屋のシーン発見とグループ化の問題を解決するための効果的なアプローチを導入するとともに,各ベッドグループ内のベッドタイプを特定する。
本稿では,低レイテンシと,サンプル効率の学習で効果的に実行できることを特徴とする,計算効率のよい機械学習パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:11:35 GMT)
Robustness of Misinformation Classification Systems to Adversarial Examples Through BeamAttack [0.0] BeamAttackは、テキスト分類システムの堅牢性を評価するために設計された敵攻撃アルゴリズムである。
私たちの拡張機能には、単語削除のサポートと置換をスキップするオプションが含まれています。
本手法は,原文の意味的および語彙的類似性を保ちながら,99%以上の攻撃成功率を達成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:37:19 GMT)
Robustness Analysis for Quantum Systems Controlled by Continuous-Time Pulses [0.0] パラメータの変動に対する感度の低下は、完全忠実度と一致することが示されている。
パラメータ変動に対する微分感度の程度に関する境界は、単にハミルトニアン系の知識に基づいて導かれる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:47:35 GMT)
Requirements for Active Assistance of Natural Questions in Software Architecture [0.0] 自然の質問のライフサイクル、その重要な要件、課題、難しさをよりよく理解し、それをサポートするための支援環境を構想することを目指しています。
知識管理ツールと人工知能技術をシームレスにソフトウェア開発に統合することで、環境は現実の制約や不確実性に適応し、対応しなければなりません。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:30:42 GMT)
Relativistic quantum Otto heat engine using a three-level Unruh-DeWitt detector [0.0] 我々は, 量子スカラー場と相互作用する作用物質として, クォートを持つ相対論的量子オットー熱エンジンを探索する。
一対のエネルギーレベルが知覚する有効温度の観点から、一般的な正の作業条件を導出する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:15:54 GMT)
Relational entanglement entropies and quantum reference frames in gauge theories [0.0] 量子参照フレーム(QRF)に対する重力エンタングルメントのエントロピーの定義は、本質的にそれらを正規化していることを示す。
我々の研究は、従来のアプローチを統一し、拡張し、エントロピーと局所対称性構造の間の相互作用を明らかにする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 01:43:11 GMT)
Reinforcement Learning for Automated Cybersecurity Penetration Testing [0.0] ツールを選択して優先順位付けし、テストパスを最適化するために強化学習が提案されている。
検証とテストのプロセスは、人間のハッカーが学習によく使う、現実世界の脆弱なWebページ上で実施された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:06:17 GMT)
Reducing Complexity of Shadow Process Tomography with Generalized Measurements [0.0] シャドウプロセストモグラフィ(SPT)は、量子コンピュータ、量子ネットワーク、量子センサーを含む量子技術の進歩に不可欠である。
我々は、ユニタリ演算子を一般化測定(POVM)に置き換えることで、シャドウノルムを最小化する一般化SPTフレームワークを提案する。
PVM-SPTは従来のSPTに比べて影のノルムを大幅に低減し,64ビット入力状態に対する約7倍の改善,64ビット入力状態に対する2180ドル倍の大幅な拡張を実現している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:52:37 GMT)
Reconfiguring Digital Accountability: AI-Powered Innovations and Transnational Governance in a Postnational Accounting Context [0.0] 我々は、説明責任がグローバルな社会技術ネットワーク内で共構築されていると論じる。
我々は、会計分野における責任、合法、そしてグローバルに受け入れられるAIの採用を促進するための2つの戦略を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:56:37 GMT)
Realignment Criterion: A necessary and sufficient condition for two-qubit $X$-states [0.0] 2量子ビットにおける絡み検出に必要かつ十分である条件を導出することにより、配向基準の適用性を向上させる。
X$-statesは、そのスパース構造と絡み合いに関連する量を計算することの容易さから、絡み合いの研究において非常に有用であることが証明されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:03:40 GMT)
Reachability in symmetric VASS [0.0] 状態を持つ対称ベクトル加算系の到達可能性問題について検討する。
極端の場合、自明な群は一般のVASSをもたらす。
別の極端の場合、対称群では、到達性問題はPSPACEで解決できることが示される。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:33:50 GMT)
Rabi transport and the other finite-size effects in one-dimensional discrete-time topological quantum walk [0.0] 一次元量子ウォークにおける位相的に異なる位相の境界における局在状態の出現を示す。
有限格子に対して、トポロジーは局所化および双局在化状態を誘導し、有限サイズ効果による縮退の結果としてラビ様輸送をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:02:07 GMT)
Qwen-GUI-3B: A Lightweight Vision-Language Model for Cross-Resolution GUI Grounding [0.0] Qwen-GUI-3Bは、グラフィカルユーザインタフェースグラウンドタスク用に設計された軽量なビジョンランゲージモデル(VLM)である。
単一のGPUで完全にトレーニング可能でありながら、強力な接地精度を提供する。
標準GUIグラウンドベンチマークの実証評価では、Qwen-GUI-3Bの異常な精度が強調されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:33:02 GMT)
Quantum-enhanced sensing with variable-range interactions [0.0] 本研究では,中程度の横磁場を持つ可変レンジ多体量子スピンチェーンに基づく量子センサを提案する。
本稿では,長距離系を量子センサとして用いることで得られる3倍の利点について報告する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:35:15 GMT)
Quantum annealing in capacitively coupled Kerr parametric oscillators using frequency-chirped drives [0.0] 周波数チャープされた2光および1光子駆動を用いた2つの容量結合Kerrパラメトリック発振器(KPOs)について検討した。
2-KPO系は、初期真空状態から量子アニール法における解状態に対応する振動状態へと漸進的に進化する。
我々は、周波数チャープが解状態を得るための成功確率を増大させ、周波数チャープを伴わずに純粋に再生実験を考慮に入れたシミュレーションを観察する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:15:49 GMT)
Quantifying analogy of concepts via ologs and wiring diagrams [0.0] SpivakとKentによって作成されたログ(ログ)の理論に基づいて構築し、配線図の概念を定義します。
本稿では、配線図は有限有界ラベル付きグラフである。
ラベルは、ologの型に対応しており、自律システムにおけるセンサーの読み取りと解釈することもできる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 22:34:34 GMT)
Quantifying Student Success with Generative AI: A Monte Carlo Simulation Informed by Systematic Review [0.0] 本稿では,系統的な文献レビューとシミュレーションに基づくモデリングを含むハイブリッド手法を用いる。
2023年から2025年にかけて、209件の実証記事が、スコパスデータベースを対象としたPRISMAベースの検索の中から選ばれた。
その結果、ユーザビリティや実世界の有用性に関連する態度因子は、感情的・信頼的要因よりも、肯定的な学習達成の予測因子として優れていることが判明した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:50:38 GMT)
QMetric: Benchmarking Quantum Neural Networks Across Circuits, Features, and Training Dimensions [0.0] 本稿では,量子回路の表現性を評価するための解釈可能なメトリクスセットを提供するPythonパッケージQMetricを紹介する。
QMetricは、回路の忠実度、絡み合いエントロピー、バレンプラトーリスク、トレーニング安定性などの重要な側面を定量化する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:12:01 GMT)
Public Service Algorithm: towards a transparent, explainable, and scalable content curation for news content based on editorial values [0.0] Public Service Algorithm(PSA)は、Public Service Media(PSM)にインスパイアされた価値に基づいた、スケーラブルで透明なコンテンツキュレーションのための新しいフレームワークである。
以上の結果から,人間の編集判断とLarge Language Models (LLMs) の評価との間に有望な整合性があることが示唆された。
この研究は、信頼できるニュースコンテンツの自動キュレーションのためのスケーラブルなフレームワークへの第一歩となる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:16:54 GMT)
Pseudo-Hermiticity, Anti-Pseudo-Hermiticity, and Generalized Parity-Time-Reversal Symmetry at Exceptional Points [0.0] ブロック対角作用素に対する擬ハーミティティーの同値性を証明し、一般化された$PT$対称性を証明した。
2次元と無限次元のヒルベルト空間でそれぞれ作用する擬エルミート作用素のペアに対して、 antlinear operator $tau$ と $X$ の明示的な式を得る。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:11:44 GMT)
Protocol insecurity with finitely many sessions and XOR [0.0] 我々は、Chevalier, Kuesters, Rusinowitch, Turuani (2005) によって解決された XOR の不セキュリティ問題の異なる証明を提示する。
我々の証明は、型付き項と well-typed 証明の概念を使い、[CKRT05] 証明が適用されるプロトコルのクラスに対する制限を取り除く。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:22:57 GMT)
Pressing Intensity: An Intuitive Measure for Pressing in Soccer [0.0] プレッシャー(英: Pressing)は、サッカーにおける基本的な防御戦略であり、ボール保有チームに対して、保持権を取り戻すための圧力を課すことが特徴である。
その重要性にもかかわらず、プレスを測定するための既存の指標は、位置データ、プレイヤーの動き、速度の正確さや包括的考慮を欠いていることが多い。
本研究では,スピアマンのピッチ制御モデルから得られる位置追跡データやコンポーネントの進歩を活用して,押圧強度を定量化するための革新的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:33:47 GMT)
Preparation of cat states in many-body eigenbasis via non-local measurement [0.0] 非局所的な測定により、与えられた多体Fock状態を正確に除去し、周期的に多体進化を中断することを提案する。
状態多様体が除去を生き残ることを示し、系をフィルタリングし、長い時間でこの多様体内でコヒーレントな重ね合わせを生成することができる。
我々の研究は、現在の量子シミュレータで利用可能なツールを用いた非局所的な測定を通して、量子状態の準備に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:08:06 GMT)
Postselection-free approach to monitored quantum dynamics and entanglement phase transitions [0.0] 観測された量子回路における測定誘起絡み合い相転移は、様々な研究コミュニティの活動を刺激している。
我々は、$U(1)$対称回路にスケーラブルなプロトコルを導入することで解決法を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:20:56 GMT)
Polarization-sensitive vector magnetometry using nitrogen-vacancy centers in diamond [0.0] 窒素空孔(NV)中心のアンサンブルを用いて、時間変化(AC)磁場のベクトル成分を位相感度で測定する。
これにより磁場の偏光を決定できる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:07:06 GMT)
Phase amplitude separation of wave function as local gauge transformation [0.0] 量子力学波動関数は複雑であるが、全ての観測は期待値と遷移行列要素を通して表現可能である。
振幅と位相を実量としてアウトセットすることで、複素波動関数に含まれるのと同じ情報を運ぶことができる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:47:42 GMT)
Persistent currents in ultracold gases [0.0] 空間的に閉じた軌道に流れる永久電流は、メソスコピック物理学において最も象徴的な概念の1つを定義する。
これらは超流動、超伝導体、金属などの固体プラットフォームで研究されている。
物質波ジャイロスコープや干渉計などの新しい技術応用の基礎となる持続電流について論じる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:24:56 GMT)
Overparametrized models with posterior drift [0.0] 本稿では,過度にパラメータ化された機械学習モデルにおいて,後方ドリフトがサンプル外予測精度に与える影響について検討する。
平均的な投資家にとって、15年間の持株期間に焦点を合わせると、非常に異質なリターンが得られます。
全体として、当社の調査結果は、株式市場の予測のために大規模な線形モデルを利用する場合、慎重さを推奨する傾向にある。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:31:15 GMT)
Optomechanical Systems with Linear and Quadratic Position Couplings: Dynamics and Optimal Estimation [0.0] 機械振動子に結合した単一モード光場からなる光学系の力学について検討する。
2フォノンコヒーレント状態の定式化を利用して、この量子力学的ハミルトン問題に対する完全な解析解を提案する。
バランスの取れたホモダイン検出は、量子フィッシャー情報を飽和させ、2次結合を推定するための最終的な精度限界に達することを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:53:59 GMT)
Optimal Control by Variational Quantum Algorithms [0.0] 古典的成分と量子的成分の両方の制約を考慮に入れた一般的な制御最適度(英語版)という指標を導入する。
本稿では、量子最適制御問題の解法としてハイブリッド量子アルゴリズムの適用可能性を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:41:25 GMT)
Old Quantum Mechanics by Bohr and Sommerfeld from a Modern Perspective [0.0] ボーアの原子モデルとソマーフェルトによる拡張について、波動力学の数学的観点から検討する。
量子化規則とエネルギー準位の導出は、半古典的手法を用いて再検討される。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:00:32 GMT)
Observable and Unobservable in Quantum Mechanics [0.0] 命題の真理が導出できない状況は、現象連鎖の客観的な崩壊によって説明される。
そのような条件下では、実オブザーバに到達可能な確率は決定可能性によって必然的に条件付けられ、非可換代数に従うことが示されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:23:50 GMT)
Non-classicality of two-qubit quantum collision model: non-Markovian effects [0.0] 顕微鏡衝突モデルによりモデル化された環境に接触する2量子ビット量子系について検討する。
1つのスキームでは、1つのアンシラのストリームが2量子系の1つのキュービットとのみ相互作用する。
一方、どちらのクビットも、同じまたは異なる温度のアンシラの2つの独立した配列と相互作用する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:09:24 GMT)
Non-Abelian entanglement asymmetry in random states [0.0] 任意の対称性群に対して、平均エンタングルメント非対称性は、部分系がその補集合よりも小さいときに熱力学的極限において消滅する。
より大きいサブシステムサイズに対して、絡み合う非対称性は、群の次元によって固定係数で対数スケーリングを表示する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:45:22 GMT)
NEU-ESC: A Comprehensive Vietnamese dataset for Educational Sentiment analysis and topic Classification toward multitask learning [0.0] NEU-ESCは,ベトナムの教育感覚分類とトピック分類のための新しいデータセットである。
NEU-ESCは、より多くのサンプル、より豊かなクラス多様性、より長いテキスト、より広い語彙を提供する大学のフォーラムからキュレーションされている。
さらに、エンコーダのみの言語モデル(BERT)を用いてマルチタスク学習を行い、感情やトピックの分類タスクにおいて、最大83.7%、79.8%の性能を達成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:19:04 GMT)
More Efficient Real-Valued Gray-Box Optimization through Incremental Distribution Estimation in RV-GOMEA [0.0] 本研究では, 逐次分布推定が RV-GOMEA の効率向上に繋がるかどうかを検討した。
RV-GOMEA や VKD-CMA-ES と比較して,人口規模が問題特異的に調整された場合,必要な評価回数を 1.5 まで削減できることがわかった。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:26:50 GMT)
Methodology for an Analysis of Influencing Factors on 3D Object Detection Performance [0.0] 自動走行では、物体検出は環境の知覚に不可欠である。
本稿では,LiDARおよびカメラを用いた3Dオブジェクト検出装置において,オブジェクトおよび環境関連要因がどのように影響するかを解析するための新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:19:35 GMT)
Measuring Software Innovation with Open Source Software Development Data [0.0] 本稿では,GitHub上のオープンソースソフトウェア(OSS)開発活動に基づいた,ソフトウェア革新の新たな尺度を紹介する。
リリース後2年間で、JavaScript、Python、Rubyエコシステムにまたがる33,000のユニークなパッケージから35万のユニークなリリースで、依存関係の成長とリリースの複雑さを調べます。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:52:27 GMT)
Magic-wavelength nanofiber-based two-color dipole trap with sub-$λ/2$ spacing [0.0] セシウム用魔法波長ナノファイバー系2色光双極子トラップの実現とその特性について報告する。
セシウムD2遷移の共振自由空間波長の半分以下の間隔で, トラップ部位の2つの2次元周期的1次元配列を生成した。
マジックトラップ周波数とラムダ/2$スペーシングを併用したナノファイバーベースの光インタフェースの実装は、新しい集団放射効果の探索に向けた重要なステップである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:38:37 GMT)
MGPRL: Distributed Multi-Gaussian Processes for Wi-Fi-based Multi-Robot Relative Localization in Large Indoor Environments [0.0] 相対的ローカライゼーションは,GPSを用いたマルチロボットシステムにおいて重要な機能である。
本稿では,複数のWi-Fiアクセスポイントの凸ホールを用いたマルチボット相対的ローカライズのための分散フレームワークMGPRLを提案する。
ROSシミュレーションにおいて提案したMGPRLの性能を厳格に評価し,実世界の実験で実演した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:35:00 GMT)
Low-latency vision transformers via large-scale multi-head attention [0.0] 学習機構は、シングルヘッド性能を表す単一の行列値を用いて、大規模MHA(LS-MHA)に一般化される。
いくつかの異なる視覚変換器(ViT)アーキテクチャは、同じ精度でLS-MHA構造が異なる。
この学習メカニズムを自然言語処理タスクに拡張することは、ディープラーニングに新たな洞察をもたらす可能性がある。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:23:46 GMT)
Learning robust parameter inference and density reconstruction in flyer plate impact experiments [0.0] 物理パラメータや物質特性を実験観測から推定することは、物理学や材料科学の多くの分野において共通の目的である。
ラジオグラフィーは、密度などのキー状態変数への直接アクセスを提供しない。
本研究では,低速・高衝撃速度実験・シミュレーションによる観測可能データセットを提案する。
得られたEoSおよび破砕モデルパラメータの推算値を用いて, 高精度で物理的に許容できる密度再構成が得られることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:43:33 GMT)
Learning Modular Exponentiation with Transformers [0.0] 4層エンコーダ・デコーダ・トランスモデルをトレーニングし、モジュラー指数化を行う。
相互学習は高い性能向上をもたらし、関連するモジュラーを突如に一般化する。
これらの結果から,変圧器モデルは特殊計算回路を用いてモジュラー演算を学習することが示唆された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:00:44 GMT)
Lazarus Group Targets Crypto-Wallets and Financial Data while employing new Tradecrafts [0.0] 本報告では、悪意のあるソフトウェアサンプルを包括的に分析し、そのアーキテクチャ、行動特性、基礎となる意図を詳述する。
永続メカニズム、コマンド・アンド・コントロール通信、データ流出ルーチンを含むマルウェアの中核機能を識別する。
このマルウェア分析報告は、過去の敵行為を再構築するだけでなく、将来の攻撃を予測し軽減するための堅牢な基盤も確立している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:42:53 GMT)
LLMs are Capable of Misaligned Behavior Under Explicit Prohibition and Surveillance [0.0] LLMは不可能なクイズを完了させ、サンドボックスにいて監視し、これらの対策について話し、不正行為をしないように指示する。
その結果,現在のLCMにおけるゴール指向行動とアライメントの基本的な緊張関係が明らかになった。
コードと評価ログは atbaceolus.com/baceolus/cheating_evals で入手できる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:37:00 GMT)
Kibble-Zurek dynamics across the first-order quantum transitions of quantum Ising chains in the thermodynamic limit [0.0] 逆場における量子イジング鎖の非平衡キブル・ズレークダイナミクスについて検討する。
有限サイズ系において、KZ力学は非平衡有限サイズスケーリング(OFSS)の振る舞いを発達させる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:35:45 GMT)
Intrinsic Dimensionality of Fermi-Pasta-Ulam-Tsingou High-Dimensional Trajectories Through Manifold Learning: A Linear Approach [0.0] フェルミ・パスタ・ウラム・チンゴウ(FPUT)モデルの高次元軌跡の内在次元$mast$を推定するために,データ駆動型手法を提案する。
モデルの非線形性により$mast$が増加することが判明した。
弱い非線形状態において、第1モードを刺激することで軌道が変化する場合、参加比は$mast = 2, 3$と推定される。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:49:26 GMT)
Interferometric and Bipartite OTOC for Non-Markovian Open Quantum Spin-Chains and Lipkin-Meshkov-Glick Model [0.0] 情報スクランブルは、リプキン-メシュコフ-グリック浴に結合したイジングスピン鎖によってモデル化されたオープン量子系で観測される。
リプキン・メシュコフ・グリックモデルにおける異なる位相の存在は、その揺らぎ特性の独立な解析を動機づけた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:40:06 GMT)
Intellectual Property Rights and Entrepreneurship in the NFT Ecosystem: Legal Frameworks, Business Models, and Innovation Opportunities [0.0] NFTを所有することと、基盤となるコンテンツの著作権を所有することの相違については、多くの混乱がある。
この研究は、従来の著作権法とブロックチェーンベースのトランザクションのギャップについて考察する。
我々は、著作権法がNFTの所有権構造とどのように関係しているかを明確に示す新しいIP権利マトリックスを作成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:28:41 GMT)
Indefinite Time Directed Quantum Metrology [0.0] 我々のプロトコルは,標準量子限界(1/sqrtN)を超越して,製品プローブ状態のハイゼンベルクスケーリング(1/N)を実現することができることを示す。
ITDMにおける対称積プローブ状態の最適性は解析的に証明するが、絡み合ったプローブ状態は、スケーリングを向上することなく、最適な積プローブよりも高いQFIを生成する。
本研究は, 製品プローブ状態の最適配向を明らかにするとともに, パラメータからの独立性を強調し, 限界条件で推定されるパラメータの独立性を強調した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:15:19 GMT)
Identifying Systems with Symmetries using Equivariant Autoregressive Reservoir Computers [0.0] 均質な自己回帰型貯水池コンピュータを用いた対称性を持つシステムの同定に焦点をあてる。
構造行列近似理論の結果を示し、二つのアプローチを探求する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:14:09 GMT)
Identifying Anyonic Topological Order in Fractional Quantum Anomalous Hall Systems [0.0] 最近観測された分数量子異常ホール材料(FQAH)は、トポロジカル量子ハードウェアの候補である。
2-cohomotopyでは、脆弱なバンドトポロジーにおけるモノドロミーへの依存が指摘される。
Larmore & Thomas (1980) の代数的位相定理は、運動量空間上の FQAH のアノンを同定する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:00:07 GMT)
IMPACT: Inflectional Morphology Probes Across Complex Typologies [0.0] IMPACTは、屈折形態学に焦点を当てた、合成的に生成された評価フレームワークである。
アラビア語、ロシア語、フィンランド語、トルコ語、ヘブライ語という5つの形態学的に豊かな言語のパフォーマンスを評価するように設計されている。
英語のパフォーマンスが強いにもかかわらず、他の言語と競合する8つの多言語LLMと、一般的でない形態素パターンを評価した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:58:23 GMT)
Hybrid Approach for Electricity Price Forecasting using AlexNet and LSTM [0.0] AlexNetアルゴリズムとLSTMアルゴリズムを組み合わせて、価格予測の精度の高い新しいモデルを導入する。
モデルは過去のデータに基づいて構築されており、需要、温度、日光、雨などの最も重要な要素が供給されている。
精度は97.08だったが, 96.64と96.63の精度で, 残りのRNNとANNよりも高い伴奏率を示した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:06:24 GMT)
High-Precision Quantum Dynamics of He$_2$ b $^3Π_\mathrm{g}$-c $^3Σ_\mathrm{g}^+$ including Non-adiabatic, Relativistic and QED Corrections and Couplings [0.0] 相対論的量子力学は、ヘリウム二量体のb$3Pi_mathrmg$とc$3Sigma_mathrmg+$電子状態に対して計算される。
量子核運動は、b$3Pi_mathrmg$-c$Sigma_mathrmg+$で計算される。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:07:57 GMT)
High-Performance Contraction of Quantum Circuits for Riemannian Optimization [0.0] この研究は、ハミルトニアンによって支配されるユニタリ時間進化を近似するために、与えられた位相で量子回路のゲートを最適化することに焦点を当てる。
我々の重要な技術的貢献は、ヒルベルト空間全体に作用する大きなユニタリ行列の明示的な構成と保存を避ける、行列自由なアルゴリズムフレームワークである。
我々は最大16のサイトを持つFermi-Hubbardモデルの実装をベンチマークし、最大112のCPUスレッドでほぼ線形並列化の高速化を実証した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:18:16 GMT)
Harnessing AI Agents to Advance Research on Refugee Child Mental Health [0.0] この研究は、構造化されていない難民の健康データを処理するための、AIベースの総合的なフレームワークを示唆している。
最先端のAI手法とマイグレーション研究と児童心理学を組み合わせることで、この研究はスケーラブルな戦略を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:55:41 GMT)
Green Metrics Tool: Measuring for fun and profit [0.0] Green Metrics Tool (GMT)は、ソフトウェアのリソース消費を正確に測定するための新しいフレームワークである。
このツールはコンテナ化され、制御され、再現可能なライフサイクルベースのアプローチを提供する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:36:53 GMT)
Graph Neural Networks in Wind Power Forecasting [0.0] 特定のアーキテクチャは、私たちの最高のCNNベースのベンチマークに匹敵するパフォーマンスを実現しています。
この研究は5年間の歴史的データを用いて3つの風力発電施設で実施された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:17:02 GMT)
Gibbs randomness-compression proposition: An efficient deep learning [0.0] 本稿では,ギブズエントロピーによるランダム性圧縮関係を示す,ギブズランダム性圧縮命題を紹介する。
DTCフレームワークは、膨大なエネルギーとリソース効率のディープラーニングトレーニングに有望なアプローチを提供する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:42:09 GMT)
Geometric Interpretation of Sensitivity to Structured Uncertainties in Spintronic Networks [0.0] 我々は、差分感度が不確かさ(エラー)に明示的に依存していることを示す。
閉系の場合, 完全状態伝達という意味での理想的な性能は, 最適ロバスト性に必要かつ十分であることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:32:43 GMT)
Generating and Customizing Robotic Arm Trajectories using Neural Networks [0.0] 本稿では,ロボットアームの軌道を生成し,カスタマイズするためのニューラルネットワークアプローチを提案する。
提案手法は, 形状をカスタマイズし, 異なる設定に適応できる精度の高い軌道を生成する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:02:14 GMT)
Generating Heterogeneous Multi-dimensional Data : A Comparative Study [0.0] ランダムサンプリング,タブラリ変分オートエンコーダ,標準生成逆数ネットワーク,条件付きタブラリ生成逆数ネットワーク,拡散確率モデルなどの手法について検討した。
このギャップに対処するために、消防ドメインに合わせて調整されたドメイン固有のメトリクスの組み合わせを用いて、合成データ品質の評価を行う。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:43:23 GMT)
GLIMPSE: Gradient-Layer Importance Mapping for Prompted Visual Saliency Explanation for Generative LVLMs [0.0] GLIMPSEは、LVLM出力を最も関連性の高い視覚的エビデンスと、オープンエンドVQAをサポートするテキスト信号に属性付けるモデルに依存しないフレームワークである。
GLIMPSEは、勾配重み付けされた注意、適応層伝播、および関連重み付けされたトークン集合を融合させ、クロスモーダル推論を解釈するための全体的応答レベル熱マップを生成する。
GLIMPSEを用いた分析可能なAI(XAI)アプローチを実演し、LVLMのクロスモーダル属性、トレース推論のダイナミクス、系統的な人的意図の不一致の分析、診断、バイアスの露呈、透明性の確保について述べる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:59:56 GMT)
From quantum-enhanced to quantum-inspired Monte Carlo [0.0] 量子化モンテカルロ法 [Nature, 619, 282-287 (2023) の包括的解析を行う。
ハミルトン強度の最適混合を観察し,システムの大きさと総進化時間のスケーリングを解析した。
これにより、大規模な量子ハードウェアが配備される前であっても、量子にインスパイアされたアルゴリズムとして、量子強化されたモンテカルロの有用性が拡張される可能性がある。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:23:34 GMT)
Foundation Models for Zero-Shot Segmentation of Scientific Images without AI-Ready Data [0.0] Zenesisは、科学画像のデータ準備によって生じる障壁を最小限に抑えるために設計された、包括的なノーコードインタラクティブプラットフォームである。
我々は、生の科学データに対するゼロショット操作を可能にする軽量なマルチモーダル適応技術を開発した。
この結果は,特に高品質なアノテートデータセットが利用できない分野において,Zenesisは科学的応用の強力なツールであることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:45:23 GMT)
FedMM-X: A Trustworthy and Interpretable Framework for Federated Multi-Modal Learning in Dynamic Environments [0.0] 本稿では,分散化された動的環境における信頼性を確保するために,多モーダル推論によるフェデレーション学習を統一するフレームワークを提案する。
このアプローチはFedMM-Xと呼ばれ、クロスモーダル整合性チェック、クライアントレベルの解釈可能性メカニズム、動的信頼校正を利用する。
我々の発見は、現実の環境で堅牢で解釈可能で社会的に責任を負うAIシステムを開発するための道を開いた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:04:14 GMT)
Feature Integration Spaces: Joint Training Reveals Dual Encoding in Neural Network Representations [0.0] ニューラルネットワークの解釈可能性に対する現在のオートエンコーダ(SAE)アプローチは、線形重ね合わせによって活性化がスパースで解釈可能な特徴に分解可能であることを前提としている。
ニューラルネットワークは2つの相補的な空間に情報をエンコードし,その情報を同じ基板に圧縮する。
共同トレーニングは41.3%の再建改善と51.6%のKL分岐誤差の低減を実現している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:26:58 GMT)
FAIR-MATCH: A Multi-Objective Framework for Bias Mitigation in Reciprocal Dating Recommendations [0.0] 本研究は,デートアプリレコメンデーションシステムの詳細な分析を行うために,基礎研究と最近の経験的知見を統合する。
提案する数学的フレームワークは,拡張された類似度尺度,多目的最適化,公平性を考慮したアルゴリズムにより,これらの制約に対処する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:36:57 GMT)
Exploring Challenges in Test Mocking: Developer Questions and Insights from StackOverflow [0.0] FLOW技術におけるMockingに関する25,302の質問を分析した。
トピックモデリングにLatent Dirichlet Allocationを使用しました。
我々は,各カテゴリーの年次および相対確率を分析し,モック関連議論の進化を解明した。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:42:48 GMT)
Evaluation of a Foundational Model and Stochastic Models for Forecasting Sporadic or Spiky Production Outages of High-Performance Machine Learning Services [0.0] 我々は、最先端の機械学習サービスの散発的またはスパイクな生産停止を予測するために、最先端の基礎モデルを最適化する。
この分析は、各評価されたモデルが、散発的またはスパイクなイベントに対してどのように機能するかを理解するのに役立ちます。
最適なパラメータを持つモデルを用いて、6%未満の値誤差を持つ特定の根本原因の1年間の障害統計を推定する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 23:59:12 GMT)
Evaluating Deduplication Techniques for Economic Research Paper Titles with a Focus on Semantic Similarity using NLP and LLMs [0.0] 本研究では, 大規模NLPデータセットの効率的な復号化手法について検討した。
以上の結果から,異なる手法で観察された意味的類似性に基づく重複の頻度が低い可能性が示唆された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:26:08 GMT)
Establishing baselines for generative discovery of inorganic crystals [0.0] 生成的人工知能は、材料発見のための有望な道を提供するが、従来の方法に対するその優位性はいまだ不明である。
本研究では、電荷バランスのプロトタイプのランダム列挙と既知の化合物のデータ駆動イオン交換という、2つのベースラインアプローチを導入し、ベンチマークする。
以上の結果から, イオン交換などの確立された手法は, 安定な新規物質を生成できるが, それらの多くはよく知られている化合物とよく似ている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:43:44 GMT)
Enhancing Interpretability in Generative Modeling: Statistically Disentangled Latent Spaces Guided by Generative Factors in Scientific Datasets [0.0] 本稿では,従来の変分オートエンコーダフレームワークにおける新しいアーキテクチャであるAux-VAEを紹介する。
我々は、Aux-VAEの有効性を、天文シミュレーションを含む複数のデータセットで比較評価することで検証する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 22:29:01 GMT)
Empirical and computer-aided robustness analysis of long-step and accelerated methods in smooth convex optimization [0.0] 本研究は, 勾配計算における相対的不完全性を考慮した一階最適化手法のロバスト性を評価する。
相対的不正確性は、少ない情報ビットを用いて勾配を圧縮する際に起こる。
どちらの加速法も予想よりもはるかに頑健であり, 短縮係数が長ステップ法に大きく寄与することが観察された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 22:25:11 GMT)
Elimination of angular dependency in quantum three-body problem made easy [0.0] 非相対論的量子3体系における角依存性を排除するための簡単な手法が提示される。
極小双極性球面調和とウィグナー関数 $mathcalD$ の対応関係を報告する。
得られた半径方程式は任意の角運動量と空間パリティ状態に対するエネルギー固有値の数値計算に適している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:34:49 GMT)
Efficient Detection of Statistical RF Fields at High Magnetic Field with a Quantum Sensor [0.0] 核磁気共鳴分光法(NMR)は、化学、物質科学、神経科学など様々な分野で広く用いられている。
ダイヤモンド中の窒素空孔(NV)中心を用いたナノスケールNMR分光法は、単スピンレベルへの前例のない感度低下により、有望なプラットフォームとして登場した。
統計的発振信号の整合化によるコヒーレント平均化を実現するための2つのプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:48:39 GMT)
Earth's field diamond vector magnetometry with isotropic magnetic flux concentrators [0.0] ダイヤモンド中の窒素空洞中心の光検出磁気共鳴(ODMR)に基づくベクトル磁気センサは、ナビゲーションや地磁気などへの応用のために開発されている。
ここでは、等方的3次元磁束集中器を用いて、方向を変えることなく地球の磁場を増幅する可能性について実験的に検討する。
我々は、磁気センサの安定性を6時間にわたって追跡し、温度のドリフトによって制限された1時間あたり40 nT未満の変動を観測する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:35:06 GMT)
Early-Stage Anomaly Detection: A Study of Model Performance on Complete vs. Partial Flows [0.0] 本研究では,部分フロー情報と完全フロー情報の臨界レンズによるネットワークセキュリティ脅威検出における機械学習モデルの有効性について検討した。
標準ベンチマークモデルであるランダムフォレスト(Random Forest)が、様々なトレーニングおよびテスト条件下でどのように機能するかを評価する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:16:32 GMT)
EFPI: Elastic Formation and Position Identification in Football (Soccer) using Template Matching and Linear Assignment [0.0] 本稿では,サッカー(サッカー)における選手位置の認識と配置のためのフレキシブルな手法を提案する。
提案手法では,一組のテンプレート内でのプレーヤの位置を最適にマッチングするために,線形和代入を用いる。
精度を向上させるため,これらの形成テンプレートの寸法を幅と長さの両方で一致させるために,実際のプレイヤー位置をスケールする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:33:37 GMT)
Discovering the underlying analytic structure within Standard Model constants using artificial intelligence [0.0] 本稿では,記号回帰と遺伝的プログラミングを用いて,標準モデル(SM)の基本パラメータの基盤となる解析構造を探索する。
我々はこれらの定数のペアを結合する最も単純な解析関係を同定し、約1000の式に基づくいくつかの顕著な観測を報告する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 19:51:50 GMT)
Diffusion-Based Image Augmentation for Semantic Segmentation in Outdoor Robotics [0.0] 本稿では,展開環境をより緊密に表現するための拡散に基づく画像拡張手法を提案する。
開語彙セマンティックセマンティクスモデルを用いて、幻覚を含む拡張候補をフィルタリングする。
拡散に基づく画像強調は,雪面以外の多くの環境にも適用できると考えている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:06:27 GMT)
Development of Hybrid Artificial Intelligence Training on Real and Synthetic Data: Benchmark on Two Mixed Training Strategies [0.0] 人工ニューラルネットワーク(ANN)のトレーニングのための実データに代わる費用対効果として合成データが登場した
しかし、合成データと実際のデータの相違はドメインギャップをもたらす。
このギャップを埋めるために、ハイブリッドデータセットを使用した混合トレーニングとして知られる、合成データと実データを組み合わせたいくつかの戦略が開発されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:48:14 GMT)
Developing Lightweight DNN Models With Limited Data For Real-Time Sign Language Recognition [0.0] 限られたデータに基づいて訓練された軽量DNNを用いて,リアルタイム手話認識のための新しいフレームワークを提案する。
本システムは,データ不足,高い計算コスト,トレーニング環境と推論環境のフレームレートの相違など,手話認識における重要な課題に対処する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:34:54 GMT)
Destructive Interference of Inertial Noise in Matter-wave Interferometers [0.0] 本稿では,多方向振動騒音の相互相関を利用して,物質波干渉計の劣化効果を緩和する手法を提案する。
このノイズが試験質量の内在周波数とほぼ一致する場合、位相の標準偏差はノイズのQ因子とほぼ等しい係数で抑制できる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 21:40:20 GMT)
Designing an Adaptive Storytelling Platform to Promote Civic Education in Politically Polarized Learning Environments [0.0] 我々はAIを利用したDigital Civic Storytelling(AI-DCS)プラットフォームを開発した。
プロトタイプでは,顔の感情認識と注意追跡を統合し,ユーザの情緒的,注意的な状態をリアルタイムで評価する。
私たちの研究は、学習者の自律性を維持しながら感情的な偏極に対処する、AIをサポートする感情に敏感な戦略の基礎を提供します。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:11:12 GMT)
Decoherence, entanglement, and information in the electron double-slit experiment with monitoring [0.0] 量子力学的計算は、この有名な思考実験の最近の実験実験に触発されたものである。
その結果,干渉パターンにおける絡み合いとコヒーレンス損失の関係が示唆された。
この計算は、デコヒーレンス、絡み合い、量子情報に関する先進的な学部生に洞察を与えることができる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 01:35:10 GMT)
Decoding Quantum LDPC Codes using Collaborative Check Node Removal [0.0] 協調的な手法を用いて反復デコーダの性能を向上させるための戦略を提案する。
量子ビットに対する情報計測(IM)と隣接する安定化器チェックを統合することで、より優れた結果を得ることができることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 06:15:28 GMT)
Data Augmentation for Cognitive Behavioral Therapy: Leveraging ERNIE Language Models using Artificial Intelligence [0.0] 今日のデジタル時代には、個人はしばしばソーシャルメディアで否定的な感情を表現している。
これらの認知経路を分析するために設計された方法論には大きなギャップがある。
認知行動療法(CBT)フレームワークは、受容、コミットメント、データ拡張を利用して、テキストコンテンツと視覚コンテンツの両方を肯定的または否定的に分類し、対処する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 03:59:00 GMT)
DGSAM: Domain Generalization via Individual Sharpness-Aware Minimization [0.0] ドメインの一般化は、複数のソースドメインでトレーニングすることで、目に見えないターゲットドメインでうまく機能するモデルを学習することを目的としている。
Sharpness-Aware Minimization (SAM) は、一般化を改善するフラットなミニマを見つけることで知られている。
我々は,段階的なドメインの摂動を計算的に効率よく適用し,個々のシャープネスを一貫して低減するtextitDecreased-overhead Gradual SAM (DGSAM)を提案する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:58:42 GMT)
DFReg: A Physics-Inspired Framework for Global Weight Distribution Regularization in Neural Networks [0.0] 我々は、重みのグローバル分布で動作するディープニューラルネットワークの物理に着想を得た正規化手法であるDFRegを紹介する。
ドロップアウトやL2崩壊といった従来の手法とは異なり、DFRegはアーキテクチャの変更や摂動を伴わずに、グローバルな構造規則を課している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:08:53 GMT)
Cybersecurity AI: The Dangerous Gap Between Automation and Autonomy [0.0] サイバーセキュリティ産業は「自動化された」AIと「自律的な」AIを組み合わせている。
複雑な攻撃シーケンスを実行するが、エッジケースと戦略的決定に対する人間によるレビューが必要である。
この道は、正確な用語、透明な能力開示、人間とAIのパートナーシップの置き換えを必要としている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 07:55:24 GMT)
Configurable photonic simulator for quantum field dynamics [0.0] 我々は,オプティカル・タイム・アルゴリズム(OTA)を統一フレームワークとして導入し,自由量子場力学の大規模クラスの効率的なシミュレーションを可能にする。
光学素子のパラメータを変更することで、時間スケール、結合グラフ、時空メトリクス、境界条件を設計することができる。
我々はOTAの構成可能性を利用して空間と時間における量子相関の拡散を連続的に変化するカップリング範囲を持つ理論に対して調査する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:29:31 GMT)
Computational Detection of Intertextual Parallels in Biblical Hebrew: A Benchmark Study Using Transformer-Based Language Models [0.0] 本研究では,ヘブライ語聖書のテキストパラレルを検出するために,E5,AlephBERT,MPNet,LaBSEなどの事前学習言語モデルの有効性を評価する。
E5とAlephBERTは、E5は並列検出に優れ、AlephBERTはより強力な非並列分化を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:57:27 GMT)
Comparative Studies: Cloud-Enabled Adaptive Learning System for Scalable Education in Sub-Saharan [0.0] 本稿では,クラウドコンピューティングと適応学習技術が,さまざまな社会経済・インフラ状況にどのように展開されているかを検討する。
クラウドベースの教育が、グローバルなデジタルと教育の格差を埋めるためにどのように調整されるか、という洞察を提供する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 13:43:28 GMT)
Comparative Analysis of the Code Generated by Popular Large Language Models (LLMs) for MISRA C++ Compliance [0.0] 安全クリティカルなシステムのソフトウェア開発には厳格なエンジニアリングプラクティスとアビオニクスのDO-178Cのような認定基準の遵守が必要です。
DO-178Cは、MISRA C++のようなよく定義されたソフトウェアコーディング標準に準拠する必要があるガイダンス文書である。
MISRA C++に準拠するために、人気のあるLLMが生成するC++コードの比較分析を行った。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 05:53:45 GMT)
ChatGPT produces more "lazy" thinkers: Evidence of cognitive engagement decline [0.0] 本研究では,生成型人工知能(AI)ツールが学術書記作業における学生の認知活動に与える影響について検討した。
その結果,ChatGPT群ではコントロール群に比べて認知エンゲージメントスコアが有意に低かった。
これらの結果は、AI支援が認知的オフロードにつながる可能性があることを示唆している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:41:50 GMT)
Chaotic and quantum dynamics in driven-dissipative bosonic chains [0.0] 量子多体系の熱化は、固有緩和機構によって支配される時間スケールに展開する。
ボース・ハバード鎖の非平衡定常状態 (NESS) におけるこの現象を, 境界におけるコヒーレント駆動と散逸によって検討した。
我々は、同様のメカニズムが、拡張駆動散逸系の幅広いクラスに現れる可能性が高いと論じる。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 16:47:35 GMT)
Causal Machine Learning in IoT-based Engineering Problems: A Tool Comparison in the Case of Household Energy Consumption [0.0] 因果機械学習法に基づく2つの一般的なツールを比較した。
ツールの動作は18のクエリに対する応答を調べることで実証される。
結果は奨励され、容易に他のドメインに拡張される可能性がある。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:10:28 GMT)
CSC-SQL: Corrective Self-Consistency in Text-to-SQL via Reinforcement Learning [0.0] 自己整合性と自己整合性を統合する新しい手法であるCSC-を提案する。
グループ相対ポリシー(GRPO)アルゴリズムを用いて、SQL生成モデルとリビジョンモデルの両方を微調整する。
BIRDのプライベートテストセットでは、我々の7Bモデルは71.72%の精度で実行され、32Bモデルは73.67%である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 11:12:31 GMT)
Broadband optical time-domain reflectometry for quantum key distribution security analysis [0.0] 本稿では,広帯域の実用的なファイバーベース量子鍵分布(QKD)システムに起動するトロイの木馬攻撃(THA)に対するセキュリティ解析手法を提案する。
我々の知る限りでは、我々のOTDRセットアップとそれに対応する結果は、幅広いスペクトル範囲で最初のものである。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:09:58 GMT)
Brain Tumor Detection through Thermal Imaging and MobileNET [0.0] 脳は身体機能や認知過程の制御において重要な役割を担っている。
バイオプシー、MRI、CTスキャンを含む従来の脳腫瘍検出方法は、高価で専門的な専門知識を必要とするため、しばしば課題に直面している。
機械学習(ML)とディープラーニング(DL)の最近の進歩は、脳腫瘍の同定と分類を自動化する強力な能力を示している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:45:28 GMT)
BlackBoxToBlueprint: Extracting Interpretable Logic from Legacy Systems using Reinforcement Learning and Counterfactual Analysis [0.0] 本稿では,ブラックボックスとして扱われるレガシーシステムから,解釈可能な決定論理を自動的に抽出する新しいパイプラインを提案する。
このアプローチでは、Reinforcement Learning (RL)エージェントを使用して、入力空間を探索し、システムの出力に意味のある変化を引き起こすアクションに報酬を与えることで、重要な決定境界を識別する。
決定木はこれらのクラスタ上でトレーニングされ、識別された境界付近でシステムの決定ロジックを近似する人間可読なルールを抽出する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:36:54 GMT)
Autonomy by Design: Preserving Human Autonomy in AI Decision-Support [0.0] 我々は、AI意思決定支援システムがドメイン固有の自律性の2つの重要な構成要素にどのように影響するかを分析する。
我々は自律型AI支援システムの構築フレームワークを開発する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:20:10 GMT)
Authentication of Continuous-Variable Quantum Messages [0.0] 連続変数状態に対する最初の量子認証方式を提案する。
我々のスキームはトラップ状態に基づいており、Broadbentらによる離散変数スキームの適応である。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:39:33 GMT)
Assessing GPTZero's Accuracy in Identifying AI vs. Human-Written Essays [0.0] GPTZeroは最も使われているAI検出器だが、人間によるテキストの識別の信頼性は限られている。
AIが生成した論文の大半が正確に検出され(91-100%のAIが信じていた世代)、一方で人間が生成したエッセイは変動した。
これらの結果は、GPTZeroは純粋にAI生成されたコンテンツを検出するのに有効であるが、人間によるテキストの識別の信頼性は限られていることを示唆している。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 04:53:27 GMT)
Analysis of quasi-planar defects using the Thomas-Fermi-von Weiszacker model [0.0] 我々はThomas-Fermi-von Weiszacker(TFW)モデルにおける熱力学的設定と安定性の推定に関する先行研究を利用する。
完全結晶に対する欠陥結晶の相対エネルギーが有限であることを証明する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 17:17:11 GMT)
An Exact Five-Step Method for Classicalizing N-level Quantum Systems: Application to Quantum Entanglement Dynamics [0.0] 我々は任意の$N$レベルの量子系の力学を古典化する汎用的かつ正確な方法を提案する。
この方法は、古典的ハミルトニアンとポアソン括弧のシンプレクティック構造を導出する5段階のアルゴリズムの手順として表すことができる。
本稿では,量子確率,四元数集団差,共起などの量子可観測物を正確に再現し,相互作用する2つの量子ビットを$mathbbCP3$で古典化する手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 10:06:37 GMT)
All Proof of Work But No Proof of Play [0.0] 確実に スピードランの真正性を検証することは オープンな問題です
素直さとダンニング・クルーガー効果によって動機づけられた我々は、スピードランの真正性を暗号的に証明するシステムを構築しようとする。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 00:19:19 GMT)
Advancing Multi-Step Mathematical Reasoning in Large Language Models through Multi-Layered Self-Reflection with Auto-Prompting [0.0] 大規模言語モデル(LLM)における多段階数学的推論を強化する新しい手法を提案する。
Multi-Layered Self-Reflection with Auto-Prompting (MAPS)フレームワークは、Chain of Thought (CoT)、Self-Reflection、Auto-Promptingといったテクニックを統合している。
実験により、MAPSは標準のCoTよりも大幅に優れ、推論最適化モデルと競合する結果が得られることが示された。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 14:18:35 GMT)
Adding Photonic Entanglement to Superradiance by Using Multilevel Atoms [0.0] マルチレベル原子のアンサンブルによって 放出される光子状態は 極度に自由度が 絡み合っている
ここでは、この集合放出過程が、絡み合った光子の高速で明るく決定論的な源候補であることを示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 08:17:12 GMT)
AI-Hybrid TRNG: Kernel-Based Deep Learning for Near-Uniform Entropy Harvesting from Physical Noise [0.0] AI-Hybrid TRNGは、物理ノイズから直接、ほぼ一様エントロピーを抽出するディープラーニングフレームワークである。
トレーニングには、低コストで親指サイズのRFフロントエンドとCPUを最適化するジッタを使用し、量子化ステップなしで32ビットの高エントロピーストリームを出力する。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:01:40 GMT)
A time operator and the time-of-arrival problem in quantum field theory [0.0] 我々はニュートン・ウィグナー状態と作用素をクライン=ゴードン理論の一粒子状態に置き換える。
我々は、時間的および2つの空間方向の超曲面上に局在する巨大なクライン・ゴルドン理論の1粒子状態を構築する。
ニュートン・ウィグナーの場合と同様に、局在は完璧ではないが、明らかに超光の伝播は指数関数的に抑制される。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 18:54:42 GMT)
A class of representations of the $\mathbb{Z}_2\times\mathbb{Z}_2$-graded special linear Lie superalgebra $\mathfrak{sl}(m_1+1,m_2|n_1,n_2)$ and quantum statistics [0.0] $mathbbZtimesmathbbZ$-graded special linear Lie superalgebra の記述。
基礎となる統計の性質が議論され、パウリの原理が定式化されている。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 15:21:04 GMT)
A Quantum Computational Perspective on Spread Complexity [0.0] 我々は、時間進化と重ね合わせという2つの基本的な操作から構築された回路複雑性フレームワークの制限ケースとして、拡散複雑性が出現することを示すことによって、拡散複雑性と量子回路複雑性の直接的な接続を確立する。
提案手法では,単位ゲートとビーム分割演算がターゲット状態を生成する計算装置を活用し,合成コストの最小化により,無限小時間進化限界における複雑性の拡散に収束する複雑性尺度が得られた。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 09:25:45 GMT)
A Photonic Parameter-shift Rule: Enabling Gradient Computation for Photonic Quantum Computers [0.0] 線形光量子コンピューティングプラットフォーム上に実装された量子計算アルゴリズムにおける勾配計算法を提案する。
提案手法は入力光子数と線形にスケールし,パラメータをシフトした同じパラメータ化フォトニック回路を用いて評価を行う。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 12:12:33 GMT)
A Note on the Second Spectral Gap Incompleteness Theorem [0.0] 第一スペクトルギャップ不完全性定理(英語版)は、スペクトルギャップが系から独立であるハミルトニアンが存在することを証明した。
あなたのフォーマルなシステムでは、ハミルトンが空白であることを証明できないし、空白であることを証明できない。
公式なシステムの中で、スペクトルギャップがそのシステムとは独立であるハミルトニアンの具体的な例を明示的に構築する方法を示す。
論文参考訳(メタデータ) (Mon, 30 Jun 2025 20:37:01 GMT)