Fugu-MT: arxivの論文翻訳(概要)

Pisces: An Auto-regressive Foundation Model for Image Understanding and Generation [81.9]
統一モデルを開発する上で重要な課題は、画像理解に必要な視覚的特徴と生成の相違にある。本稿では,この課題に対処する自動回帰型マルチモーダル基盤モデルであるPiscesを紹介する。微妙なデータキュレーション、事前学習、微調整と組み合わせることで、ピッセは画像理解と画像生成の両方において競合する性能を達成する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:42:24 GMT)
Enhancing Underwater Imaging with 4-D Light Fields: Dataset and Method [77.8]
4次元光場(LF)は、光吸収、散乱、その他の課題に悩まされる水中イメージングを強化する。水中4次元LF画像強調と深度推定のためのプログレッシブフレームワークを提案する。学習手法の定量的評価と教師あり訓練のための,最初の4次元LFに基づく水中画像データセットを構築した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 06:37:27 GMT)
MedGemma Technical Report [75.9]
MedGemmaは、Gemma 3 4Bと27Bをベースとした医療ビジョン言語基盤モデルの集合体である。 MedGemmaは、画像とテキストの高度な医学的理解と推論を実証する。また、SigLIPから派生した医用目視エンコーダであるMedSigLIPを紹介する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 19:13:40 GMT)
CompassJudger-2: Towards Generalist Judge Model via Verifiable Rewards [72.4]
CompassJudger-2は、タスク駆動のマルチドメインデータキュレーション戦略によって制限を克服する新しいジェネラリストジャッジモデルである。 CompassJudger-2は、複数の判定と報奨ベンチマークで優れた結果を得る。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:34:24 GMT)
Detecting and Pruning Prominent but Detrimental Neurons in Large Language Models [68.6]
大規模言語モデル(LLM)は、しばしば特定のデータセットに特化した学習メカニズムを開発する。本稿では,データセット固有のメカニズムに関連するニューロンの同定と解析により,一般化の促進を目的とした微調整手法を提案する。本手法では,各ニューロンの高信頼度予測への影響を定量化するため,データセット固有の性能に不均等に寄与するニューロンを同定する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:10:10 GMT)
RadIR: A Scalable Framework for Multi-Grained Medical Image Retrieval via Radiology Report Mining [64.7]
本稿では,複数の粒度で画像の類似度を決定するために,高密度ラジオロジーレポートを利用した新しい手法を提案する。我々は、胸部X線用MIMIC-IRとCTスキャン用CTRATE-IRの2つの総合的な医用画像検索データセットを構築した。 RadIR-CXR と Model-ChestCT という2つの検索システムを開発し,従来の画像画像検索と画像レポート検索に優れた性能を示す。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:07:11 GMT)
Harnessing Text-to-Image Diffusion Models for Point Cloud Self-Supervised Learning [61.0]
拡散モデルはテキスト・画像生成に広く用いられているが、2次元表現学習に有効であることが証明されている。本稿では,3次元自己教師型学習のためのSDモデルを活用するフレームワークであるPointSDを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:20:07 GMT)
PanoDiff-SR: Synthesizing Dental Panoramic Radiographs using Diffusion and Super-resolution [61.0]
PanoDiff と Super-Resolution (SR) を組み合わせて合成歯科用パノラマ線写真(PR)を作製する手法を提案する。前者は、SRモデルで処理されたPRの低分解能(LR)シードを生成し、1024×512の高分解能(HR)PRを生成する。 SRでは,局所的・言語的関係を学習し,よりシャープなエッジやテクスチャをもたらす最先端のトランスフォーマーを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:52:10 GMT)
Backscatter Device-aided Integrated Sensing and Communication: A Pareto Optimization Framework [59.3]
統合センシング・通信(ISAC)システムは、密集した都市非視線シナリオにおいて大きな性能劣化に遭遇する可能性がある。本稿では,自然環境に分散した受動的BDを利用した後方散乱近似(BD)支援ISACシステムを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 17:11:06 GMT)
Disambiguate First, Parse Later: Generating Interpretations for Ambiguity Resolution in Semantic Parsing [56.8]
本稿では, 自然言語の解釈を論理形式にマッピングする前に, あいまいさを解消するモジュラー手法を提案する。我々のアプローチは解釈のカバレッジを改善し、異なるアノテーションスタイル、データベース構造、あいまいさタイプを持つデータセットをまたいだ一般化を行う。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 13:56:11 GMT)
Uncertainty-Driven Expert Control: Enhancing the Reliability of Medical Vision-Language Models [52.2]
既存の方法は、モデル構造を調整したり、高品質なデータで微調整したり、好みの微調整によって、医療ビジョン言語モデル(MedVLM)の性能を向上させることを目的としている。我々は,MedVLMと臨床専門知識の連携を図るために,Expert-Controlled-Free Guidance (Expert-CFG) という,ループ内のエキスパート・イン・ザ・ループフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:03:30 GMT)
Divide-Then-Rule: A Cluster-Driven Hierarchical Interpolator for Attribute-Missing Graphs [51.1]
ディープグラフクラスタリングは、不完全な属性を持つノードを異なるクラスタに分割することを目的とした教師なしのタスクである。既存の属性欠落グラフの計算法は、ノード近傍で利用可能な情報の量が異なることを説明できないことが多い。この問題に対処するために、DTRGC(Divide-Then-Rule Graph Completion)を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 03:33:19 GMT)
Planted in Pretraining, Swayed by Finetuning: A Case Study on the Origins of Cognitive Biases in LLMs [51.0]
大型言語モデル(LLM)は認知バイアスを示す。これらのバイアスはモデルによって異なり、命令チューニングによって増幅することができる。これらのバイアスの違いが事前学習、微調整、あるいはランダムノイズに起因するかどうかは不明だ。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 10:00:59 GMT)
Towards Two-Stage Counterfactual Learning to Rank [50.5]
ランク付けのためのカウンターファクトラーニングは、ユーザのインタラクションからランク付けポリシーを学ぶことを目的としている。現実のアプリケーションでは、候補文書セットは数百万の順序で行われ、単一のステージのランキングポリシーを非現実的にしている。本稿では,2段階間の相互作用を考慮した2段階CLTR推定器を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:36:33 GMT)
Optimal High-probability Convergence of Nonlinear SGD under Heavy-tailed Noise via Symmetrization [50.5]
雑音対称性に基づく2つの新しい推定器を提案する。よりシャープな分析と改善されたレートを提供します。モーメントと対称雑音を仮定する作業と比較して、よりシャープな解析と改善率を提供する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:31:13 GMT)
Large Language Models as Neurolinguistic Subjects: Discrepancy between Performance and Competence [49.6]
本研究では,大言語モデル(LLM)の記号化(形式)および記号化(意味)に関する言語的理解について検討する。ミニマルペアと診断プローブを組み合わせてモデル層間のアクティベーションパターンを解析する新しい手法を用いて,ニューロ言語学的アプローチを提案する。その結果,(1)心理言語学的・神経言語学的手法では,言語能力と能力が異なっていること,(2)直接確率測定では言語能力が正確に評価されないこと,(3)指導のチューニングでは能力が大きく変化しないが,性能は向上しないことがわかった。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 22:46:18 GMT)
KodCode: A Diverse, Challenging, and Verifiable Synthetic Dataset for Coding [49.6]
KodCodeは、高品質で検証可能なトレーニングデータを取得するという永続的な課題に対処する、合成データセットである。自己検証手順によって体系的に検証される質問解決テスト三つ子を含む。このパイプラインは大規模で堅牢で多様なコーディングデータセットを生成する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 02:08:21 GMT)
Learning Traffic Anomalies from Generative Models on Real-Time Observations [49.2]
トラフィックデータの複雑な空間的および時間的依存関係をキャプチャするために,時空間生成適応ネットワーク(STGAN)フレームワークを用いる。スウェーデンのヨーテボリで2020年に収集された42台の交通カメラから、STGANをリアルタイムで分単位でリアルタイムで観測する。その結果, 精度が高く, 偽陽性率の低い交通異常を効果的に検出できることが示唆された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:03:12 GMT)
Feature Extraction and Steering for Enhanced Chain-of-Thought Reasoning in Language Models [48.4]
大規模言語モデル(LLM)は、Chain-of-Thought(CoT)技術を用いて推論と数学的問題を解く能力を示す。この研究はDeepSeek-R1の深い思考パラダイムにインスパイアされ、外部データセットを使わずにLCMの推論能力を高めるためにステアリング技術を利用している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:42:16 GMT)
Evaluation of Attribution Bias in Generator-Aware Retrieval-Augmented Large Language Models [47.7]
大規模言語モデルにおける著者情報に対する属性感度とバイアスを評価する。文献に著者情報を追加することで, LLMの属性品質を3%から18%大きく変化させることができることを示す。その結果,資料のメタデータがLCMの信頼度や回答の属性に影響を及ぼす可能性が示唆された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 15:07:14 GMT)
Intelligent Orchestration of Distributed Large Foundation Model Inference at the Edge [46.1]
Large Foundation Models (LFMs)は、次世代のEdge AIアプリケーションの新機能をアンロックすることを約束する。現在の分割推論戦略では、ノード間でLPM層を分割するが、変動するワークロードに適応するようには設計されていない。本稿では, LFM層を実行時可変変数に配置し, 分割する, 適応型分割推論オーケストレーションフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 22:37:25 GMT)
Visual Surface Wave Elastography: Revealing Subsurface Physical Properties via Visible Surface Waves [46.0]
本研究では, 構造物表面の波動映像から, 構造物の厚さと硬さを推定する手法を提案する。本手法を実測データとシミュレーションデータの両方で検証し, 両例とも実測値と強い一致を示した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:00:06 GMT)
CoCo: A Coupled Contrastive Framework for Unsupervised Domain Adaptive Graph Classification [45.6]
結合学習分野からトポロジ情報を抽出するCoCo(CoCo)を提案する。 CoCoは、さまざまな設定で競合するベースラインを上回っている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:28:29 GMT)
Stable Score Distillation [45.5]
編集プロセスの安定性とアライメントを高めるための合理化フレームワークであるStable Score Distillation(SSD)を紹介する。提案手法は,NeRFやテキスト駆動型スタイル編集を含む2次元および3次元の編集作業において,より高速な収束と複雑さの低減を実現している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:14:00 GMT)
Learning to Move in Rhythm: Task-Conditioned Motion Policies with Orbital Stability Guarantees [45.1]
我々は,学習した微分型エンコーダと超臨界ホップ分岐を結合したフレームワークであるOrbitally Stable Motion Primitives (OSMPs)を紹介する。提案手法は,多種多様なロボットプラットフォームにまたがる広範囲なシミュレーションと実世界の実験によって検証される。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 17:10:03 GMT)
Generative Latent Kernel Modeling for Blind Motion Deblurring [43.8]
本稿では,深層生成ネットワークジェネレータに基づくカーネルのぼかし推定のための新しいフレームワークを提案する。我々は、挑戦的なベンチマークデータセットで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 13:48:10 GMT)
Continuous Spiking Graph Neural Networks [43.3]
連続グラフニューラルネットワーク(CGNN)は、既存の離散グラフニューラルネットワーク(GNN)を一般化する能力によって注目されている。本稿では,2階ODEを用いたCOS-GNNの高次構造について紹介する。我々は、COS-GNNが爆発や消滅の問題を効果的に軽減し、ノード間の長距離依存関係を捕捉できるという理論的証明を提供する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:43:52 GMT)
ProactiveBench: A Comprehensive Benchmark Evaluating Proactive Interactions in Video Large Language Models [41.4]
ProactiveBenchは,プロアクティブインタラクションに係わるシステムの能力を評価するための,最初の包括的なベンチマークである。モデル応答は様々なタイムスタンプで生成されるので,モデル応答の時間的ダイナミクスを考慮に入れた最初の指標であるPAUCを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 15:11:50 GMT)
Banzhida: Advancing Large Language Models for Tibetan with Curated Data and Continual Pre-Training [40.9]
バンジーダ(Banzhida)は、チベット語で生成するAIを進化させる多言語大言語モデルである。現在までに最大のチベット事前訓練コーパスをキュレートし、様々な情報源からのデータを収集している。我々は、新しい高品質のチベットベンチマークを作成し、それらを既存の公開ベンチマークで補完する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:54:05 GMT)
Bidirectional Prototype-Reward co-Evolution for Test-Time Adaptation of Vision-Language Models [38.6]
テスト時適応(TTA)は,分散シフトに直面した場合の視覚言語モデル(VLM)の性能維持に不可欠である。 BPRE(Underline Bidirectional Prototype-Reward co-Evolution)を提案する。 BPREは、機能品質評価とプロトタイプの進化を相乗的なフィードバックループを通じて統合する。我々のモデルは、他のSOTA法と比較して一貫して優れた性能を達成し、VLMの一般化能力を向上させる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 06:36:58 GMT)
RoHOI: Robustness Benchmark for Human-Object Interaction Detection [38.1]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。 HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:58:04 GMT)
Heterogeneous Graph Prompt Learning via Adaptive Weight Pruning [37.7]
グラフニューラルネットワーク(GNN)は、様々なグラフベースのタスク(ノード分類やリンク予測など)で顕著な成功を収めた。彼らの勝利にもかかわらず、GNNは長いトレーニングや推論時間、複雑な関係を捉えるのが難しいこと、機能の抽出が不十分なことといった課題に直面している。本稿では,グラフプロンプトとウェイトプルーニングを組み合わせた新しいフレームワークGPAWPを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:12:24 GMT)
Making Images Real Again: A Comprehensive Survey on Deep Image Composition [34.1]
画像合成タスクは複数のサブタスクに分解できる。オブジェクト配置は、前景の適切なスケール、位置、形状を見つけることを目的としています。画像ブレンディングは、前景の照明統計を調整することを目的としている。シャドージェネレーションは、フォアグラウンドのためのもっともらしいシャドーを生成することを目的としています。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 05:13:53 GMT)
Supposedly Equivalent Facts That Aren't? Entity Frequency in Pre-training Induces Asymmetry in LLMs [34.1]
非対称性が論理的に等価な事実の認識に存在し、それは対象と対象とに出現する実体の周波数の相違に起因する。実験の結果,高頻度の被写体と低周波の被写体は,その論理的等価性にもかかわらず,逆の被写体よりもよく認識されていることが明らかとなった。これらの知見は, 模擬モデル予測における事前学習データの影響を浮き彫りにした。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 19:55:27 GMT)
Performance Analysis of MDI-QKD in Thermal-Loss and Phase Noise Channels [32.9]
測定デバイスに依存しない量子鍵分布(MDI-QKD)は、検出器側の脆弱性を緩和することで量子暗号を強化する。本研究では, 熱損失・位相ノイズチャネルにおけるMDI-QKD特性を, 脱分極・減圧チャネルとしてモデル化し, 熱・位相ノイズ効果を捉える。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:03:06 GMT)
AlphaVAE: Unified End-to-End RGBA Image Reconstruction and Generation with Alpha-Aware Representation Learning [32.8]
ALPHAは、標準RGBメトリクスを標準背景のアルファブレンディングにより4チャンネル画像に適応する最初の総合RGBAベンチマークである。さらに、専用アルファチャンネルを組み込むことで、事前訓練されたRGB VAEを拡張した、統一されたエンドツーエンドRGBA VAEであるALPHAVAEを紹介する。我々のRGBA VAEは、従来の1Mに比べて8K画像のみに基づいて訓練されており、PSNRでは+4.9dB、再構築時にはLayerDiffuseよりも+3.2%のSSIM向上を実現している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:53:42 GMT)
Causal Discovery-Driven Change Point Detection in Time Series [32.4]
時系列における変化点検出は、時系列の確率分布が変化する瞬間を特定することを目的としている。実践的な応用では、時系列の特定の構成要素にのみ興味を持ち、その分布の急激な変化を探求する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 23:53:10 GMT)
Scaling Laws for Optimal Data Mixtures [31.0]
スケーリング法則を用いて、任意の対象領域に対して最適なデータ混合を決定するための体系的手法を提案する。我々は,これらのスケーリング法則の普遍性を,その予測力を3つの異なる大規模設定で示すことによって検証する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 21:16:08 GMT)
Semi-Supervised Federated Learning via Dual Contrastive Learning and Soft Labeling for Intelligent Fault Diagnosis [30.6]
本稿では,半教師付きフェデレーション学習フレームワークSSFL-DCSLを提案する。デュアルコントラストロスとソフトラベリングを統合して、データに対処し、分散クライアントのラベル不足に対処する。最先端の手法で精度を1.15%から7.85%向上させることができる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 10:54:23 GMT)
SAGE: Segment-Aware Gloss-Free Encoding for Token-Efficient Sign Language Translation [29.8]
本稿では,連続映像を個別のサインインされた視覚トークンに変換するためのセグメント認識型視覚トークン化フレームワークを提案する。これにより、以前の方法と比較して入力シーケンスの長さが最大50%減少し、メモリ使用量が最大2.67倍になる。提案手法はPHOENIX14Tベンチマークにおける最先端手法の性能を上回っている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 12:18:34 GMT)
Continual Reinforcement Learning by Planning with Online World Models [29.7]
連続強化学習(CRL)は、エージェントが連続的に提示される複数のタスクを解決するために、試行錯誤によって無限に進化する必要のある自然主義的な環境を指す。 CRLの最大の障害の1つは、破壊的忘れという新しいタスクを学ぶ際に、エージェントが過去のタスクをどう解決するかを忘れてしまうことである。オンライン世界モデルを用いて計画することでこの問題に対処することを提案する。具体的には、Follow-The-Leaderの浅瀬モデルをオンラインで学習し、世界ダイナミクスを捉え、モデル予測制御を用いて、報酬関数によって指定されたタスクのセットを解決することを計画している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:52:31 GMT)
DeltaSHAP: Explaining Prediction Evolutions in Online Patient Monitoring with Shapley Values [28.1]
本研究では,オンライン患者監視システムに特化して設計された新しい説明可能な人工知能(XAI)アルゴリズムであるDeltaSHAPを提案する。時間的設定にシェープ値を適用することで、我々のアプローチは特徴連立効果を正確に捉えることができる。さらに、実際に観察された特徴の組み合わせのみを用いて予測の変更を属性とし、時間に敏感な臨床応用のために効率的かつ実用的なものである。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:51:21 GMT)
Thinking Beyond Tokens: From Brain-Inspired Intelligence to Cognitive Foundations for Artificial General Intelligence and its Societal Impact [27.7]
本稿では,人工知能,認知神経科学,心理学,生成モデル,エージェントベースシステムの学際的合成について述べる。我々は汎用知能のアーキテクチャと認知の基礎を分析し、モジュラー推論、永続記憶、マルチエージェント協調の役割を強調した。我々は、人工知能への道の鍵となる科学的、技術的、倫理的課題を特定します。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 02:50:17 GMT)
On the Fragility of Multimodal Perception to Temporal Misalignment in Autonomous Driving [26.8]
DejaVuは、ネットワークによって引き起こされる遅延を利用して、センサストリーム間の微妙な時間的ミスアライメントを生成する新しい攻撃である。シングルフレームのLiDAR遅延では、攻撃者は車検出のmAPを最大88.5%削減し、3フレームのカメラ遅延、車滴の多重物体追跡精度(MOTA)を73%削減できる。本研究では,従来の知覚モデルと協調して時間的整合性を監視するパッチであるAIONを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:44:26 GMT)
MAPoRL: Multi-Agent Post-Co-Training for Collaborative Large Language Models with Reinforcement Learning [26.7]
新しいポストトレーニングパラダイムMAPoRL(強化学習を用いた協調LLMのためのマルチエージェントポストトレーニング)を導入する。 MAPoRLでは、複数のLLMが独立して独自の応答を生成し、最終回答を協調的に改善するためのマルチターンディスカッションを行う。 MAPoRL検証器は、回答の正しさを検証するスコアを割り当てることで、回答と議論の両方を評価する。スコアはコトレーニング報酬として機能し、マルチエージェントRLによって最大化される。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:13:27 GMT)
Dynamic Spiking Framework for Graph Neural Networks [26.1]
underlineDynamic underlineSpunderlineiking underlineGraph underlineNeural Networks (method)というフレームワークを提案する。 3つの大規模実世界の動的グラフ実験により, 手法の有効性が検証された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:36:52 GMT)
LLM-enhanced Action-aware Multi-modal Prompt Tuning for Image-Text Matching [25.9]
大規模言語モデル(LLM)が生成する行動関連外部知識を組み込むことにより,CLIPをきめ細かな行動レベル理解に役立てる。本稿では,行動認識に基づく視覚的特徴を集約し,識別的・行動的視覚的表現を確立するための知識を付加する適応的相互作用モジュールを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:48:32 GMT)
Emergence of Hierarchical Emotion Organization in Large Language Models [25.8]
大規模言語モデル(LLM)は自然に人間の心理モデルと一致する階層的な感情木を形成する。また,社会経済的な人格における感情認識の体系的バイアスを明らかにする。以上の結果から,より優れたモデル評価の開発に認知的基礎理論を用いることの可能性が示唆された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 15:12:46 GMT)
Deep Reinforcement Learning with Gradient Eligibility Traces [25.5]
本研究では, 高度強化学習において, 高速かつ安定なオフ政治学習を実現するための勾配に基づく3つの手法を提案する。我々は、経験的再生に適合する前方視定式化と、ストリーミングアルゴリズムと互換性のある後方視定式化を提供する。提案アルゴリズムは, MuJoCo 環境と MinAtar 環境においてPPO と StreamQ の両方より優れていることを示す。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:12:05 GMT)
Self-Supervised Monocular 4D Scene Reconstruction for Egocentric Videos [25.4]
EgoMono4Dは、Egocentric Monocular 4D再構成に必要な複数の変数を統一する新しいモデルである。全てのベースラインと比較して高密度の点雲列再構成において優れた性能を発揮する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:00:25 GMT)
MCA-LLaVA: Manhattan Causal Attention for Reducing Hallucination in Large Vision-Language Models [25.4]
幻覚はLVLM(Large Vision Language Models)において重要な課題となる重要な要因として特定されたマルチモーダル特徴の不一致。 MCA-LLaVAは位置モデリングのための画像トークンの1次元配列順序と2次元空間位置を統合する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:09:35 GMT)
FlexEdit: Marrying Free-Shape Masks to VLLM for Flexible Image Editing [25.2]
本稿では,フレキシブル編集のための自由形状マスクと言語命令の両方を活用する,エンドツーエンドの画像編集手法であるFlexEditを提案する。 LLMに基づく画像編集において,本手法は最先端(SOTA)性能を実現し,簡単なプロンプト技術はその有効性で際立っている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:38:31 GMT)
Fast3D: Accelerating 3D Multi-modal Large Language Models for Efficient 3D Scene Understanding [25.0]
我々は,3D MLLM のためのプラグ&プレイ型ビジュアルトークン解析フレームワークである Fast3D を提案する。グローバルアテンション予測(GAP)は,目標モデルのグローバルアテンション分布を予測し,トークンの効果的な重要度推定を可能にする。 SAPは、注意に基づく複雑性評価を通じて動的トークン予算を導入し、レイヤーワイドプルーニング比率を自動的に調整する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:29:02 GMT)
OPENXRD: A Comprehensive Benchmark and Enhancement Framework for LLM/MLLM XRD Question Answering [24.4]
OPENXRDは、結晶学的質問応答用に設計されたオープンブックパイプラインである。テキストプロンプトとGPT-4.5で生成された簡潔なサポートコンテンツを統合する。 GPT-4.5生成サマリーを用いたモデルでは,精度が大幅に向上した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 06:25:22 GMT)
Multi-Player Zero-Sum Markov Games with Networked Separable Interactions [23.3]
我々は,emphNetworked separable interaction (zero-sum NMGs)を用いた新しいマルコフゲーム,emph(multi-player) 0-sum Markov Gamesの研究を行った。無限水平割引ゼロサムNMGにおける近似マルコフ非定常CCEの発見は、基礎となるネットワークが星のトポロジーを持っていなければ、textttPPAD-hardであることを示す。」
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:06:53 GMT)
No, of Course I Can! Deeper Fine-Tuning Attacks That Bypass Token-Level Safety Mechanisms [22.7]
我々は、まずモデルに応答する前に有害な要求を拒否するよう訓練する新しい微調整攻撃を提案する。この "refuse-then-comply" 戦略は浅い防御をバイパスし、出力フィルタを回避する有害な応答を生成する。われわれの攻撃はOpenAIから2000ドルのバグ報奨金を受け、Anthhropicによって脆弱性として認識された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 21:20:09 GMT)
ZipVoice-Dialog: Non-Autoregressive Spoken Dialogue Generation with Flow Matching [22.5]
本稿では,フローマッチングに基づく非自己回帰音声対話生成モデルZipVoice-Dialogを紹介する。主なデザインは、正確な話者のターンテイクのためのスピーカーターン埋め込みである。我々は6.8khの音声対話データセットであるOpenDialogを、帯域内音声データからキュレートした。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 15:18:47 GMT)
MPG-SAM 2: Adapting SAM 2 with Mask Priors and Global Context for Referring Video Object Segmentation [21.4]
ビデオオブジェクトセグメンテーション(RVOS)の参照は、ビデオ内のオブジェクトをテキスト記述に従ってセグメントすることを目的としている。 Segment Anything Model 2 (SAM2)は、様々なビデオセグメンテーションタスクにおいて大きな効果を示している。本稿では,これらの課題に対処する新しいRVOSフレームワークMPG-SAM 2を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:24:41 GMT)
Balancing Semantic Relevance and Engagement in Related Video Recommendations [21.3]
関連ビデオレコメンデーションでは、協調フィルタリング(CF)をコエンゲージメント信号で駆動するのが一般的である。本稿では,意味的関連性とユーザエンゲージメントのバランスをとるために,新しい多目的検索フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 21:04:25 GMT)
Pinning "Reflection" on the Agenda: Investigating Reflection in Human-LLM Co-Creation for Creative Coding [20.6]
本研究は,創造的符号化における位置的,瞬間的,モーメント的反射を2つのプロンプト戦略の下で検討する。混合法の結果は3つの異なる反射型を示し、T2はより頻度が高く、戦略的で、生成的反射を促進することを示した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:54:14 GMT)
Sharp Trade-Offs in High-Dimensional Inference via 2-Level SLOPE [20.6]
2レベルSLOPEは、LASSOと一般SLOPEの両方に対して、堅牢でスケーラブルな代替手段を提供する。以上の結果から,2レベルSLOPEはLASSOと一般SLOPEの双方に対して,堅牢でスケーラブルな代替手段である可能性が示唆された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:57:10 GMT)
Bongard in Wonderland: Visual Puzzles that Still Make AI Go Mad? [20.6]
VLM(Vision-Language Models)の評価を行った。 VLMは時に差別的な概念を識別することに成功したが、しばしば失敗する。人間の視覚的推論能力とマシン認知の間には、大きなギャップが残っています。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 15:31:04 GMT)
Warm Starts Accelerate Generative Modelling [20.2]
反復生成モデルは、ノイズベクトルをデータに徐々に精製することで、高忠実度サンプルを作成する。より優れた出発点を提供することで条件生成を劇的に加速する,シンプルな決定論的モデルであるウォームスタートモデルを導入する。提案手法は,1000ステップのDDPMベースラインと競合するが,総関数評価は11点のみである。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:07:05 GMT)
TabDPT: Scaling Tabular Foundation Models on Real Data [20.0]
ICLに基づく検索と自己教師付き学習を組み合わせた基礎モデルの学習手法を提案する。事前学習フェーズに実際のデータを組み込むことで、学習が大幅に速くなり、見当たらないデータへの一般化が向上することを示す。得られたモデルであるTabDPTは回帰 (CTR23) と分類 (CC18) のベンチマークで最高の性能を達成する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 18:07:37 GMT)
Many-for-Many: Unify the Training of Multiple Video and Image Generation and Manipulation Tasks [19.6]
拡散モデルは、多くの視覚生成および操作タスクにおいて印象的な性能を示している。我々は、様々な視覚生成と操作タスクから利用可能なトレーニングデータを活用する統一されたフレームワーク、すなわち、many-for-manyを導入する。我々の共同学習は、映像生成性能を改善した統一的な視覚生成と操作モデルをもたらす。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:00:34 GMT)
SnapMoGen: Human Motion Generation from Expressive Texts [19.1]
SnapMoGenは、高精度で表現力のあるテキストアノテーションと組み合わせた高品質なモーションキャプチャーデータを備えた、新しいテキストモーションデータセットである。データセットは、合計44時間の20Kのモーションクリップと、記述毎の48ワードの平均122Kの詳細なテキスト記述で構成されている。私たちのモデルであるMoMask++は、モーションをマルチスケールのトークンシーケンスに変換し、トークンのキャパシティをよりよく活用します。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 02:54:59 GMT)
Digital Twin-Assisted Explainable AI for Robust Beam Prediction in mmWave MIMO Systems [18.5]
本稿では,mmWaveシステムのための頑健で説明可能な深層学習(DL)ベースのビームアライメントエンジンを提案する。このフレームワークは、現実世界のデータ要求を70%減らし、ビームトレーニングのオーバーヘッドを62%減らし、異常検出を最大8.5倍改善する。実験結果から,提案フレームワークは実世界のデータ要求を70%削減し,ビームトレーニングのオーバーヘッドを62%削減し,異常検出を最大8.5倍改善した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:56:20 GMT)
Diffusion Dataset Condensation: Training Your Diffusion Model Faster with Less Data [18.2]
拡散データセットの凝縮を新しい問題設定として研究する。目標は、元のデータセットよりもはるかに少ないサンプルを持つ"合成"サブデータセットを構築することだ。我々のフレームワークは、高い視覚的品質を維持しながら、劇的に少ないデータで非常に高速な拡散モデルトレーニングを可能にします。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:02:47 GMT)
Optimizing Basis Function Selection in Constructive Wavelet Neural Networks and Its Applications [18.0]
本研究では、初期ベースと列車機能を選択する構築型ウェーブレットニューラルネットワーク(WNN)を提案する。未知の非線形関数の周波数を分析し、その一次周波数成分に基づいて適切な初期ウェーブレットを選択する。これにより、周波数推定器とウェーブレット基底増大機構から構成され、高エネルギーベースを優先する新しい構成的枠組みがもたらされる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:09:26 GMT)
DATE-LM: Benchmarking Data Attribution Evaluation for Large Language Models [17.7]
DATE-LMは、言語モデルにおけるデータ属性手法を評価するためのベンチマークである。データ選択のトレーニング、毒性/バイアスフィルタリング、事実帰属という3つの重要なタスクを通じて、属性の品質を測定する。以上の結果から,全てのタスクにおいて単一手法が支配的ではなく,データ属性手法はより単純なベースラインとのトレードオフを持ち,メソッド性能はタスク固有の評価設計に敏感であることがわかった。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 23:29:56 GMT)
S2SRec2: Set-to-Set Recommendation for Basket Completion with Recipe [17.5]
食料品の電子商取引では、顧客は食事の好みによってガイドされる食材バスケットを作るが、完全な食事を作るための専門知識は欠如している。本稿では,S2SRec2について紹介する。S2SRec2は,Set Transformerをベースとし,マルチタスク学習パラダイムで訓練された,セットツーセットの成分推薦フレームワークである。大規模なレシピデータセットと定性的分析の実験により、S2SRec2は単一ターゲットのベースラインを著しく上回ることが示された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:09:30 GMT)
Score Attack: A Lower Bound Technique for Optimal Differentially Private Learning [17.4]
本稿では,パラメータ推定の差分プライバシに制約されたミニマックスリスクを低く抑える,スコアアタックと呼ばれる新しい手法を提案する。様々な統計問題に対する差分プライバシーを確保しながら、未知のモデルパラメータを推定する最小限のリスクを対数係数まで最適に下げることができる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 21:42:34 GMT)
Ophora: A Large-Scale Data-Driven Text-Guided Ophthalmic Surgical Video Generation Model [16.9]
眼科手術では、手術映像を解釈し、その後の手術を予測することができるAIシステムの開発には、高品質なアノテーションを備えた多数の眼科手術ビデオが必要である。我々は,眼科手術映像を自然言語で生成できる先駆的モデルであるOphoraについて紹介する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:58:10 GMT)
LLM-Stackelberg Games: Conjectural Reasoning Equilibria and Their Applications to Spearphishing [15.8]
本稿では,大規模言語モデル(LLM)を戦略的相互作用に統合する逐次意思決定モデルの枠組みを紹介する。 LLM-Stackelbergゲームは,サイバーセキュリティや誤情報,レコメンデーションシステムといった領域において,意思決定をモデル化するための強力なパラダイムを提供する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 21:42:27 GMT)
DuSEGO: Dual Second-order Equivariant Graph Ordinary Differential Equation [15.5]
従来のグラフニューラルネットワーク(GNN)による過度にスムースな問題に対する既存の方法ほとんどのモデルは、実世界がしばしば二階システムで構成されていることを無視して、一階情報で機能する。 textbfDual textbfSecond-order textbfEquivariant textbfGraph textbfOrdinary Differential Equation (method)を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 03:51:37 GMT)
SPICE: An Automated SWE-Bench Labeling Pipeline for Issue Clarity, Test Coverage, and Effort Estimation [15.4]
SWEベンチスタイルのデータセットをラベル付けするためのスケーラブルで自動化されたパイプラインであるSPICEを紹介する。 SPICEは、コンテキスト対応のコードナビゲーション、合理化によるプロンプト、マルチパスコンセンサスを組み合わせて、専門家のアノテーションに近似したラベルを生成する。 SPICEツールとSPICE Benchは、SWE-Gymの291のオープンソースプロジェクトから収集された6,802のSPICEラベル付きインスタンスのデータセットです。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:46:26 GMT)
PPJudge: Towards Human-Aligned Assessment of Artistic Painting Process [15.4]
本研究では,絵画プロセスの人為的アセスメントのための新しい枠組みを提案する。具体的には、実画像と合成画像からなる最初の大規模データセットであるペイントプロセスアセスメントデータセット(PPAD)を紹介する。また、時間的に認識された位置符号化を付加したトランスフォーマーベースモデルPPJudgeを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 10:30:44 GMT)
Psychology-Driven Enhancement of Humour Translation [15.3]
本研究では,人間の思考過程の能力を模倣する心理学的なヒューマー分解機構(HDM)を提案する。提案手法はユーモア翻訳の質を著しく向上させ, 平均利得7.75%, 流布2.81%, 生成したテキストのコヒーレンス6.13%とした。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 11:44:41 GMT)
Logits are All We Need to Adapt Closed Models [15.2]
アプリケーション固有のコンテンツ生成に向けて,ブラックボックス大言語モデルを操るトークンレベルの確率再重み付けフレームワークを提案する。このようなアクセスが利用可能であれば、迅速なエンジニアリングを超えて、より強力な適応技術を可能にするだろう、と私たちは主張する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:19:28 GMT)
WaveNet-SF: A Hybrid Network for Retinal Disease Detection Based on Wavelet Transform in the Spatial-Frequency Domain [15.2]
本稿では,空間領域と周波数領域の学習を統合することで網膜疾患の検出を向上させる新しいフレームワークWaveNet-SFを提案する。このフレームワークはウェーブレット変換を利用して、OCT画像を低周波成分と高周波成分に分解する。提案手法は,OCT-C8データセットとOCT 2017データセットでそれぞれ97.82%,99.58%の最先端(SOTA)分類精度を実現する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:07:20 GMT)
RAMA: Retrieval-Augmented Multi-Agent Framework for Misinformation Detection in Multimodal Fact-Checking [15.2]
RAMAは、マルチメディアの誤情報を検証するために設計された新しい検索拡張マルチエージェントフレームワークである。 RAMAには,(1)マルチモーダルクレームを正確なWeb検索クエリに変換する戦略的クエリの定式化,(2)多様な権威ソースからの相互検証証拠の集約,(3)マルチエージェントアンサンブルアーキテクチャの3つの革新が含まれている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:46:51 GMT)
360-Degree Full-view Image Segmentation by Spherical Convolution compatible with Large-scale Planar Pre-trained Models [15.1]
本研究では,既存の事前学習モデルの直接利用を可能にするパノラマ画像の球面サンプリング手法を提案する。本手法では, 既訓練モデルの重みに基づく球面離散サンプリングを用い, 歪みを効果的に軽減する。提案手法をパノラマ画像分割に適用し,球面モデルから得られた特徴をマスクとして用いた。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:18:30 GMT)
GRAG: Graph Retrieval-Augmented Generation [15.0]
Graph Retrieval-Augmented Generation (GRAG)は、テキストサブグラフを取得する際の根本的な課題に取り組む。本稿では,線形時間で最適な部分グラフ構造を検索する新たな分割・対数戦略を提案する。グラフ推論ベンチマーク実験により, GRAG法が現在のRAG法より大幅に優れていることが示された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 11:09:06 GMT)
Holistic White-light Polyp Classification via Alignment-free Dense Distillation of Auxiliary Optical Chromoendoscopy [14.9]
本稿では,ポリプローカライゼーションを必要とせず,フルイメージの診断を活用できる新しい包括的分類フレームワークを提案する。重要な革新は、細粒なクロスドメイン知識の蒸留を可能にするアライメントフリーデンス蒸留(ADD)モジュールである。提案手法は,AUCにおいて,少なくとも2.5%,16.2%の精度で,最先端性能を達成し,他の手法よりも比較的優れていた。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:17:27 GMT)
Leveraging Segment Anything Model for Source-Free Domain Adaptation via Dual Feature Guided Auto-Prompting [14.6]
セグメンテーションのためのソースフリードメイン適応(SFDA)は、ソースドメインでトレーニングされたモデルを適用して、ターゲットドメインでうまく機能することを目的としている。私たちはSegment Anything Model for SFDAの可能性を初めて探求し、正確なバウンディングボックスプロンプトを自動的に見つけました。ボックスプロンプトを検索するための新しいDual Feature Guided (DFG) 自動プロンプト手法を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 11:00:59 GMT)
Tactile-VLA: Unlocking Vision-Language-Action Model's Physical Knowledge for Tactile Generalization [14.2]
本稿では,視覚,言語,行動,触覚を深く融合させる新しいフレームワークであるTactile-VLAを紹介する。実験では、Tactile-VLAの有効性と一般化性を3つの重要な側面で示している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 06:44:37 GMT)
Enhancing Interpretability in Software Change Management with Chain-of-Thought Reasoning [14.2]
SCELMは、ソフトウェア変更管理のためのエンドツーエンドの自動化フレームワークである。ソフトウェアの変更を効率的かつ正確に管理し、サービス障害と経済的損失を著しく削減することを目指している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 15:13:46 GMT)
Extension OL-MDISF: Online Learning from Mix-Typed, Drifted, and Incomplete Streaming Features [14.0]
本論文は、OL-MDISFのスタンドアロン技術参照として機能する。混合型モデリング、ドリフト適応、弱い監督における関連する研究の文脈的な議論に加えて、2種類のドリフトシナリオの下で14の現実世界データセットにわたる包括的な実験のセットを提供する。この文書は、複雑な、弱教師付きストリーミングデータのオンライン学習のための再現可能なベンチマークを提供することを期待している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 02:44:25 GMT)
ESPFormer: Doubly-Stochastic Attention with Expected Sliced Transport Plans [13.7]
自己注意は、トレーニング中にいくつかのトークンを過度に集中させ、その結果、準最適情報フローをもたらす可能性がある。我々は,スライスされた最適輸送に基づく,新しい並列化可能な二重確率的アテンション機構を提案する。本手法は, 繰り返しシンクホーン正規化を伴わずに二重性を適用し, 効率を著しく向上させる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 19:17:03 GMT)
Don't be so negative! Score-based Generative Modeling with Oracle-assisted Guidance [13.4]
この研究は、神託の形でさらにサイド情報が存在するような環境でのモデル学習に対処する。我々は,この新たな側面情報を活用する拡散確率的モデリング手法であるGen-neGを開発した。我々は、自動運転シミュレータにおける衝突回避や、安全で保護された人間の動き生成などの応用において、Gen-neGの有用性を実証的に確立する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 19:40:25 GMT)
A Survey of Automatic Prompt Optimization with Instruction-focused Heuristic-based Search Algorithm [13.3]
大規模言語モデルは、様々な自然言語処理タスクにおいて顕著な成果をもたらしています。手動の手法は効果的であるが、通常は直感に頼り、時間とともに自動的にプロンプトを洗練しない。検索アルゴリズムを用いた自動プロンプト最適化は、人間の監視を最小限に抑えて、システマティックにプロンプトを探索し改善することができる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:39:40 GMT)
From Bias to Behavior: Learning Bull-Bear Market Dynamics with Contrastive Modeling [13.0]
本稿では、投資家主導の市場ダイナミクスにおけるブル・ベア体制の可能性について考察する。本稿では,時間的価格列と外部コンテキスト信号を共有潜在空間に埋め込む統合フレームワークであるB4(Bias to Behavior from Bull-Bear Dynamics Model)を提案する。我々のモデルは市場のトレンドを予測する上で優れたパフォーマンスを実現し、バイアスや投資家の行動、市場のダイナミクスの相互作用に関する解釈可能な洞察を提供する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 11:36:26 GMT)
Statistical Signal Processing for Quantum Error Mitigation [12.8]
量子誤差緩和(QEM)に対する統計的信号処理手法を提案する。我々のモデルは、回路深度がノイズの偏極化に十分であると仮定し、劣化した観測結果を生成する。提案手法は,ノイズモデルに整合した合成データを用いて,より大規模な量子ビット数にスケールすることを示す。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 22:20:04 GMT)
Back to the Basics: Rethinking Issue-Commit Linking with LLM-Assisted Retrieval [12.2]
問題と修正するコミットを結びつけるイシューコミットリンクは、ソフトウェアのメンテナンスに不可欠である。本稿では,ベクトルデータベースを現代的な情報検索手法として活用したEasyLinkを提案する。我々の評価では、EasyLinkは平均的なPrecision@1の75.91%を達成し、最先端の技術を4回以上改善している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:42:10 GMT)
Learning from Synthetic Labs: Language Models as Auction Participants [12.0]
本稿では, オークションの研究開発を支援するために, 新たな合成データ生成手法を提案する。シミュレーションAIエージェント(大規模言語モデル)は,様々な古典的フォーマットのオークションにおいて,実験文献と一致していることがわかった。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:00:30 GMT)
Continuous-Time Signal Decomposition: An Implicit Neural Generalization of PCA and ICA [12.0]
主成分分析や独立成分分析(PCA,ICA)などの低ランク分解問題を一般化する。この問題を解決するために、暗黙的な神経近似を学習するためのモデルに依存しないフレームワークを提供する。この連続領域への拡張により、そのような分解の応用は雲や不規則にサンプリングされた信号に向けられる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:20:16 GMT)
DLBAcalib: Robust Extrinsic Calibration for Non-Overlapping LiDARs Based on Dual LBA [11.7]
本稿では,マルチLiDARシステムのための新しいターゲットレス外部キャリブレーションフレームワークを提案する。提案手法は,目標LiDARからの連続走査により,正確な基準点クラウドマップを構築する。本フレームワークでは,平均翻訳誤差が5mm,回転誤差が0.2deg,初期誤差が0.4m/30degである。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:48:02 GMT)
Supercharging Floorplan Localization with Semantic Rays [11.7]
本稿では,深度とセマンティック線を共同で推定する意味認識フレームワークを提案する。提案手法は最先端の手法よりも大幅に優れており,従来の手法と比較して,リコール基準の大幅な改善を実現している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:01:54 GMT)
DrugMCTS: a drug repurposing framework combining multi-agent, RAG and Monte Carlo Tree Search [11.6]
DrugMCTSは、RAG、マルチエージェントコラボレーション、薬物再資源のためのMonte Carlo Tree Searchを統合する新しいフレームワークである。 DrugMCTSはQwen2.5-7B-InstructでDeepseek-R1を20%以上上回る性能を発揮する。本結果は,構造化推論,エージェントによる協調,フィードバックによる探索機構の重要性を強調した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:20:44 GMT)
THYME: Temporal Hierarchical-Cyclic Interactivity Modeling for Video Scene Graphs in Aerial Footage [11.6]
時間的階層的周期的シーングラフ(THYME)アプローチを導入し,階層的特徴集約と周期的時間的改善を統合して限界に対処する。 THYMEは、マルチスケールの空間コンテキストを効果的にモデル化し、フレーム間の時間的一貫性を強制し、より正確で一貫性のあるシーングラフを生成する。さらに,既存のデータセットの制約を克服する5種類の対話性を備えた新しい空中ビデオデータセットであるAeroEye-v1.0を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:43:38 GMT)
Mind the Gap: Preserving and Compensating for the Modality Gap in CLIP-Based Continual Learning [11.5]
コントラスト言語-画像事前訓練モデル(CLIP)は、様々な下流タスクに強い能力を示す。視覚言語事前学習モデルの微調整におけるモダリティギャップの変化を分析する。クラス増分学習におけるCLIPの性能を向上する単純なMG-CLIPを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 02:28:42 GMT)
Single Word Change is All You Need: Using LLMs to Create Synthetic Training Examples for Text Classifiers [11.3]
既存の手法によって生成された敵例のかなりの部分は、1つの単語だけを変える。このシングルワード摂動脆弱性は、分類器の重大な弱点である。本研究では,単一単語の摂動脆弱性を利用したSP-Attackを提案する。また、学習にデータ拡張を適用してrhoを改善することを目的としたSP-Defenseを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:35:26 GMT)
If open source is to win, it must go public [11.1]
オープンソースプロジェクトは、透過的で広く使用可能な機械学習モデルとシステムを作成するという、信じられないほどの進歩を遂げています。しかし、オープンソースだけでは、AIへのアクセスを完全に民主化する上で、課題に直面します。この記事では、オープンソースAIはパブリックAIによって補完されなければならない、と論じる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:16:28 GMT)
The BdryMatérn GP: Reliable incorporation of boundary information on irregular domains for Gaussian process modeling [11.0]
本稿では,不規則連結領域上でディリクレ,ノイマン,ロビンの境界を確実に統合できる新しいBdryMat'ern GPモデリングフレームワークを提案する。また,有限要素モデリングと厳密な誤差解析を用いたBdryMat'ernカーネルの効率的な近似手法を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:53:49 GMT)
Stereo-based 3D Anomaly Object Detection for Autonomous Driving: A New Dataset and Baseline [10.9]
3D検出技術は自動運転の分野で広く利用されている。道路上に現れる稀な異常カテゴリーでは、3D検出モデルはしばしば誤検出または異常検出に失敗する。本稿では,ステレオによる3次元異常物体検出(S3AD)アルゴリズムを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:10:29 GMT)
Avoiding Leakage Poisoning: Concept Interventions Under Distribution Shifts [10.8]
本稿では,概念ベースモデル(CM)がアウト・オブ・ディストリビューション(OOD)の入力にどのように反応するかを検討する。我々はMixCEMという新しいCMを紹介した。これは、この情報が流通中である場合に限って、その概念から漏れた漏洩情報を動的に活用することを学ぶ。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 17:34:54 GMT)
Capsule Networks Do Not Need to Model Everything [10.8]
本稿では,構文樹状構造のエントロピーを最小化するREM(Routing Entropy Minimization)を提案する。 REMはプルーニング機構を通じてモデルパラメータ分布を低エントロピー構成に駆動する。これによりカプセルはより安定で簡潔な表現を、より少ないパラメータと無視可能な性能損失で学習することができる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 15:35:47 GMT)
Voice Conversion for Lombard Speaking Style with Implicit and Explicit Acoustic Feature Conditioning [10.5]
Lombard 話し方におけるテキスト音声合成システム(TTS)は、音声の全体的な可聴性を改善し、聴覚障害や雑音に有効である。これらのモデルのトレーニングには大量のデータが必要である。音声変換 (VC) は, ターゲット話者の発話スタイルにおける記録データがない場合に, TTS システムの訓練に有用な拡張手法であることが示されている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:57:04 GMT)
Geo-RepNet: Geometry-Aware Representation Learning for Surgical Phase Recognition in Endoscopic Submucosal Dissection [10.4]
Geo-RepNetは、複雑な手術シーンにおける認識性能を高めるために、RGB画像と深度情報を統合する幾何学的な畳み込みフレームワークである。提案手法の有効性を評価するため,実世界のESDビデオから高密度フレームレベルのアノテーションを付加した9フェーズのESDデータセットを構築した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:07:44 GMT)
EduFlow: Advancing MLLMs' Problem-Solving Proficiency through Multi-Stage, Multi-Perspective Critique [10.3]
教育科学的推論の完全なパイプラインをカバーする最初のエンドツーエンドフレームワークであるEduFlowを紹介します。コアとなるEduPRMは、プロセス認識の報酬モデルで、タグと正当化によって推論ステップを批判する。本稿では,ドメイン適応型検索フレームワークであるEduMCTSを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 18:44:32 GMT)
Understanding Pan-Sharpening via Generalized Inverse [10.2]
パンシャルペン問題を記述するために, 単純な行列式を採用する。空間およびスペクトルのダウンサンプル行列をよりよく取得するためのダウンサンプル拡張法が導入された。グラムシュミット適応(GSA)は、成分置換の一般的な逆行列の定式化に従って証明された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:52:35 GMT)
The NaijaVoices Dataset: Cultivating Large-Scale, High-Quality, Culturally-Rich Speech Data for African Languages [10.2]
5000人以上の話者を持つ1,800時間音声テキストデータセットであるNaijaVoicesデータセットを紹介する。我々は,我々のユニークなデータ収集手法を概説し,その音響的多様性を分析し,微調整実験を通じてその影響を実証する。これらの結果から,ナイジャヴォイセスがアフリカ語における多言語音声処理を進展させる可能性が示唆された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:42:21 GMT)
Consistency in Language Models: Current Landscape, Challenges, and Future Directions [10.2]
State-of-the-art Language Model (LM) はタスクやドメイン固有のアプリケーション間で信頼性の高い一貫性を維持するのに苦労する。我々の発見は、一貫性を確保するための学際的アプローチを計測し、相互に比較するための品質ベンチマークが緊急に必要であることを示している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:20:26 GMT)
HedraRAG: Coordinating LLM Generation and Database Retrieval in Heterogeneous RAG Serving [10.1]
HedraRAGはグラフベースの抽象化に基づいて構築されたランタイムシステムで、ステージレベルの並列性、要求内類似性、要求間歪性といった最適化の機会を公開する。結果として発生する実行計画は、リソース使用率を改善し、レイテンシを低減するために、ハイブリッドCPU-GPUパイプラインにマップされる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:42:43 GMT)
AInsight: Augmenting Expert Decision-Making with On-the-Fly Insights Grounded in Historical Data [10.1]
そこで我々は,医師と患者との対話を事例として,対話型ユーザインタフェースを実装した。本システムは,会話を継続的に聴き,患者問題や医師が提案するソリューションを特定し,組込みデータセットから関連データを検索する。そこで我々は,Health Canadaデータセットをベクトルデータベースに埋め込み,医師と患者との対話のサンプルを用いてシミュレーション研究を行い,その有効性と課題を明らかにした。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:59:41 GMT)
LLMalMorph: On The Feasibility of Generating Variant Malware using Large-Language-Models [10.1]
大規模言語モデル(LLM)は、ソフトウェア開発と自動コード生成を変革した。本稿では,マルウェアのソースコードを改変して変種を生成するLLMの実現可能性について検討する。 LLMalMorphは意味的および構文的コード理解を利用する半自動フレームワークである。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 22:11:10 GMT)
When Small Guides Large: Cross-Model Co-Learning for Test-Time Adaptation [9.8]
テスト時間適応(TTA)は、オンラインの教師なし学習を通じて、潜在的なドメインシフトを持つドメインデータをテストするために、所定のモデルを適用する。主に2つの戦略から構成されるTTAのクロスモデル・コラーニングフレームワークであるCOCAを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:23:39 GMT)
Rethinking the Foundations for Continual Reinforcement Learning [9.8]
まず,従来の強化学習の基礎が連続的な強化学習パラダイムに適しているかを検討する。継続学習の目標に反する従来の強化学習基盤の4つの重要な柱を同定する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:21:37 GMT)
UTF:Undertrained Tokens as Fingerprints A Novel Approach to LLM Identification [9.8]
大型言語モデル(LLM)のフィンガープリントは、モデルのオーナシップの検証、信頼性の確保、誤用防止に不可欠である。本稿では,未学習トークンを利用したLDMのフィンガープリント手法を提案する。提案手法は,モデルの性能に最小限のオーバーヘッドと影響があり,対象モデルのオーナシップ識別にホワイトボックスアクセスを必要としない。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:35:14 GMT)
A Novel Streamline-based diffusion MRI Tractography Registration Method with Probabilistic Keypoint Detection [9.7]
本稿では,ディープラーニングを用いた新しい教師なし手法を提案する。全体的な考え方は、トラクトグラフィーデータセットの空間的アライメントのために、被験者間で対応するキーポイントペアを特定することである。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:19:55 GMT)
Capturing Unseen Spatial Extremes Through Knowledge-Informed Generative Modeling [9.7]
我々は,レアエクストリームの空間構造をよりよく捉えるために,DeepX-GANを開発した。ターゲットに直接ヒットする"チェックメイト"極端と、わずかに見逃す"スタレメイト"極端の2つの型を定義します。これらの不明瞭な極端は、高い脆弱性と低い社会経済的準備力を持つ地域に不均等に影響を及ぼすことが判明した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:06:45 GMT)
Learning from M-Tuple Dominant Positive and Unlabeled Data [9.6]
本稿では,実世界のアプリケーションシナリオに適合する汎用学習フレームワークであるemphMDPUを提案する。経験的リスク最小化 (ERM) 法に基づいて, リスク一貫性を満足する未バイアスリスク推定器を導出する。トレーニング中に必然的に過適合する問題を緩和するため、リスク補正手法を導入し、修正されたリスク推定器の開発に繋がる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:39:33 GMT)
Fair CCA for Fair Representation Learning: An ADNI Study [9.5]
フェア表現学習のための新しいフェアカノニカル相関解析(CCA)手法を提案する。我々はアルツハイマー病神経画像イニシアチブ(ADNI)の合成データと実世界のデータについて検証する。我々の研究は、偏見のない分析が不可欠である神経画像研究において、公正な機械学習を可能にする。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 19:36:10 GMT)
Colorectal Cancer Tumor Grade Segmentation in Digital Histopathology Images: From Giga to Mini Challenge [9.5]
大腸癌(CRC)は、世界で3番目に診断されたがんであり、がん関連死亡の原因としては2番目に多い。 ICIP Grand Challenge on Colorectal Cancer tumor Grading を組織した。データセットは、5つの組織クラスに対して、専門家のピクセルレベルのアノテーションを備えた103枚の全スライド画像で構成されている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:18:54 GMT)
Revisiting Pool-based Prompt Learning for Few-shot Class-incremental Learning [9.4]
FSCIL(Few-Shot Class-Incremental Learning)は、データの不足と漸進的な学習という2つの課題に直面している。本稿では、FSCILタスクにおける現在のプロンプトプール方式に関する最初の研究を行い、インクリメンタルセッションにおける予期せぬ性能劣化を明らかにした。本稿では,プールベースの素早い学習をトークン次元から空間次元に革新的にシフトさせるLGSP-Promptを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:08:34 GMT)
CoVAE: Consistency Training of Variational Autoencoders [9.4]
本稿では,一貫性モデルからVAEアーキテクチャをトレーニングするための手法を取り入れた,新しい単一ステージ生成自動符号化フレームワークを提案する。我々は,CoVAEが学習前の知識を使わずに,高品質なサンプルを1段階ないし数段階で生成できることを実証した。提案手法は,自動エンコーディングと拡散型生成モデルのための統一的なフレームワークを提供し,一段階の高速自動エンコーディングのための実行可能な経路を提供する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:32:08 GMT)
Towards Open-World Generation of Stereo Images and Unsupervised Matching [9.3]
GenStereoはステレオ画像生成と教師なしステレオマッチングタスクの両方で最先端のパフォーマンスを達成する。プロジェクトページはhttps://qjizhi.github.io/genstereo.comで公開されている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 03:07:24 GMT)
An In-depth Evaluation of Large Language Models in Sentence Simplification with Error-based Human Assessment [9.2]
本研究は, 評価の信頼性を確保しつつ, LLMの性能に関する詳細な知見を提供する。我々は、GPT-4、Qwen2.5-72B、Llama-3.2-3Bを含む、クローズドソースとオープンソースの両方のLLMを選択する。その結果, LLM は従来と比べ, 誤った単純化出力が少ないことがわかった。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:30:39 GMT)
SEE: Strategic Exploration and Exploitation for Cohesive In-Context Prompt Optimization [9.0]
大規模言語モデル(LLM)のための新しい結合型インコンテキストプロンプト最適化フレームワークを提案する。 SEEは、メタヒューリスティック最適化の原則を採用し、戦略的に探索と活用を行うスケーラブルで効率的なプロンプト最適化フレームワークである。 SEEは最先端のベースライン法を大幅に上回り、平均性能は13.94、計算コストは58.67である。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:31:55 GMT)
Watermarking Degrades Alignment in Language Models: Analysis and Mitigation [8.9]
本稿では,Gumbel と KGW の2つの一般的な透かし手法が真理性,安全性,有用性にどのように影響するかを体系的に分析する。本稿では,外部報酬モデルを用いてアライメントを復元する推論時間サンプリング手法を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:50:20 GMT)
Unified Linear Parametric Map Modeling and Perception-aware Trajectory Planning for Mobile Robotics [8.8]
本稿では,高次元空間にデータをマッピングする軽量な線形パラメトリックマップを提案する。 UAVでは,Euclidean Signed Distance Field (ESDF) マップを用いた。 UGVでは、モデルは地形を特徴づけ、クローズドフォーム勾配を提供し、オンラインプランニングによって大きな穴を回避できる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:39:19 GMT)
AGFS-Tractometry: A Novel Atlas-Guided Fine-Scale Tractometry Approach for Enhanced Along-Tract Group Statistical Comparison Using Diffusion MRI Tractography [8.8]
拡散MRI(dMRI)は、現在、脳の白質(WM)をin vivoでマッピングする唯一の方法である。トラクトメトリー(Tractometry)は、繊維路に沿った形態と微細構造を調べるために、沿線プロファイリングのための高度なトラクトグラフィー解析技術である。本稿では,Atlas-Guided fine-scale tractometry,すなわちAGFS-Tractometryを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 15:48:02 GMT)
Cross Knowledge Distillation between Artificial and Spiking Neural Networks [8.8]
スパイキングニューラルネットワーク(SNN)は、その高い生物学的妥当性、事象駆動特性、省エネ性により、コンピュータビジョン領域に豊富な可能性を示している。それでも、制限付きイベントベースのデータセットと未成熟なSNNアーキテクチャは、そのパフォーマンスがArtificial Neural Networks(ANN)よりも劣っている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 12:38:39 GMT)
SymRAG: Efficient Neuro-Symbolic Retrieval Through Adaptive Query Routing [8.8]
現在のRetrieval-Augmented Generationシステムは一様処理を使用しており、単純なクエリが複雑なマルチホップタスクに似たリソースを消費するので非効率である。リアルタイム複雑化と負荷評価による適応型クエリルーティングを導入し,シンボル,ニューラル,ハイブリッドの経路を選択するためのフレームワークであるSymRAGを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 05:28:30 GMT)
LLM Agents Are the Antidote to Walled Gardens [8.7]
インターネットのコアインフラストラクチャはオープンで普遍的に設計されているが、今日のアプリケーション層はクローズドでプロプライエタリなプラットフォームによって支配されている。 LLMをベースとしたエージェントは、この現状を根本的に破壊する。 2つのデジタルサービスがAIベースのアダプタを使ってデータをシームレスに交換する機能です。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 15:26:07 GMT)
Butter: Frequency Consistency and Hierarchical Fusion for Autonomous Driving Object Detection [8.4]
階層的特徴表現はコンピュータビジョン、特に自律運転の物体検出において重要な役割を果たす。 YOLOやDETRといった既存のアーキテクチャは、さまざまなスケールで機能の一貫性を維持するのに苦労している。検出堅牢性を改善するために階層的特徴表現を強化するために設計された,新しいオブジェクト検出フレームワークであるButterを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 13:31:01 GMT)
AdRo-FL: Informed and Secure Client Selection for Federated Learning in the Presence of Adversarial Aggregator [8.2]
Federated Learning (FL)は、クライアントのデータを公開することなく、協調学習を可能にする。最近の研究は、敵アグリゲータがクライアントの選択を操作してバイパス保護を行う重大な脆弱性を示している。本稿では,AdRo-FL(Adversarial Robust Federated Learning)を提案する。 AdRo-FLは、安全でないベースラインに比べて、最大で1.85タイム=高速なタイム・トゥ・精度、最大で1.06タイム=高い最終精度を実現している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 06:28:00 GMT)
XiChen: An observation-scalable fully AI-driven global weather forecasting system with 4D variational knowledge [7.9]
XiChenは、観測可能な完全なAI駆動のグローバル気象予報システムである。 XiChenのパイプライン全体(データ同化(DA)から中距離予測まで)は、わずか17秒で実現できる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:46:58 GMT)
Prune 'n Predict: Optimizing LLM Decision-making with Conformal Prediction [7.8]
不正確なアウトプットは、医療や金融といった高リスク領域に重大なリスクをもたらす。そこで本研究では,可能な選択肢を予測セットに限定することで,質問のEmphconformal revision of question (CROQ)を提案する。また,CP-OPTを提案する。CP-OPTは,カバー範囲を維持しつつ,設定サイズを最小化するスコアを学習するための最適化フレームワークである。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 18:07:42 GMT)
An Epistemic and Aleatoric Decomposition of Arbitrariness to Constrain the Set of Good Models [7.6]
最近の研究では、機械学習(ML)モデルがトレーニング手順の微妙な変更に対して非常に敏感であることが示されている。安定性は, てんかん成分と動脈成分に分解され, 予測の一貫性と信頼性を捉える。そこで本研究では,既存の精度と公平性の基準と合わせて,てんかんおよび失読の基準を含むモデル選択手法を提案し,良質なモデルの集合を絞り込むことに成功したことを示す。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:10:35 GMT)
Robust Spatiotemporal Epidemic Modeling with Integrated Adaptive Outlier Detection [7.6]
疫病モデルでは、アウトレーヤはパラメータ推定を歪め、公衆衛生上の判断を誤ったものにすることができる。本稿では、この歪みを軽減するために、ロバストな一般化加法モデル(RST-GAM)を導入する。アメリカ合衆国における郡レベルのCOVID-19感染データを解析し,RTT-GAMの実用性を実証した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 19:23:25 GMT)
Item-centric Exploration for Cold Start Problem [7.1]
我々は、従来の「ユーザーにとって最良のアイテム」を見つけることの焦点は、生来のコンテンツに対する理想的なオーディエンスを故意に曖昧にする可能性があると論じている。項目中心のレコメンデーションの概念を導入し、新しい項目に対して最適なユーザを特定するパラダイムをシフトする。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 23:22:23 GMT)
Cryptis: Cryptographic Reasoning in Separation Logic [7.0]
我々は,Iris分離論理の拡張であるCryptisを導入し,暗号の記号モデルを用いて暗号部品の検証を行う。分離論理と暗号推論の組み合わせにより、プロトコルの正当性を証明し、後にこの結果を再利用して、プロトコルに依存するより大きなシステムを検証することができる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:10:13 GMT)
Dynamic Inter-Class Confusion-Aware Encoder for Audio-Visual Fusion in Human Activity Recognition [6.8]
本稿では,音声映像表現を細かなカテゴリレベルで整列させるエンコーダであるDICCAE(Dynamic Inter-Class Confusion-Aware)を提案する。 DICCAEは、クラス間の混乱度に基づいて、混乱損失を動的に調整することで、カテゴリの混乱に対処する。また、オーディオとビデオの両方のモダリティと融合を取り入れた新しいトレーニングフレームワークも導入する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 15:45:36 GMT)
Real-Time Adaptive Motion Planning via Point Cloud-Guided, Energy-Based Diffusion and Potential Fields [6.8]
追従回避の問題に触発され,エネルギーベース拡散モデルと人工ポテンシャル場を組み合わせた運動計画フレームワークを提案する。提案手法は、点雲から直接障害物情報を処理し、完全な幾何学的表現を必要としない効率的な計画を可能にする。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 19:42:07 GMT)
EECD-Net: Energy-Efficient Crack Detection with Spiking Neural Networks and Gated Attention [6.7]
本稿では,道路亀裂検出のための多段階検出手法であるEECD-Netを提案する。 SRCNN(Super-Resolution Convolutional Neural Network)は、低画質画像に固有の課題に対処するために用いられる。これらの画像をスパースパルスシーケンスに変換するために,CIF(Continuous Integrate-and-Fire)ニューロンを用いたSCU(Spike Convolution Unit)を提案する。 CrackVision12Kベンチマークの実験では、EECD-Netは98.6%の精度で検出された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 11:59:57 GMT)
CLIProv: A Contrastive Log-to-Intelligence Multimodal Approach for Threat Detection and Provenance Analysis [6.7]
本稿では,ホストシステムにおける脅威行動を検出する新しいアプローチであるCLIProvを紹介する。脅威インテリジェンスに攻撃パターン情報を活用することで、CLIProvはTTPを特定し、完全かつ簡潔な攻撃シナリオを生成する。最先端の手法と比較して、CLIProvは精度が高く、検出効率が大幅に向上している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:20:00 GMT)
Ambiguity-Aware and High-Order Relation Learning for Multi-Grained Image-Text Matching [6.6]
本稿では,これらの問題に対処するためのAmbiguity-Aware and High-order Relation Learning framework (AAHR)を提案する。このフレームワークはグローバルかつ局所的な特徴抽出機構と適応集約ネットワークを導入し、完全な意味理解能力を大幅に強化する。実験の結果、AAHRはFlickr30K、MSCOCO、ECCV Captionデータセットの既存の最先端手法よりも優れていることが示された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 11:30:32 GMT)
Impute With Confidence: A Framework for Uncertainty Aware Multivariate Time Series Imputation [6.6]
欠落した値を持つ時系列データは、多くのドメインで一般的である。既存の手法のほとんどは、モデルの不確実性を見落としているか、それを見積もるメカニズムが欠如している。本稿では,不確実性を定量化し,有効活用する汎用フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 17:11:00 GMT)
Bounding the Worst-class Error: A Boosting Approach [6.2]
最悪のクラスエラーは多くのアプリケーションで重要である。本稿では,全てのクラスの平均誤差率ではなく,最悪のクラスエラー率の問題に取り組む。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:13:38 GMT)
A Study of Value-Aware Eigenoptions [6.1]
モデルレス強化学習において,固有オプションが信用割当を促進できるかどうかを検討する。事前特定された固有オプションは、探索だけでなく、クレジットの割り当てにも役立ち、オンライン発見はエージェントの経験を過度にバイアスし、学習を妨げる可能性がある。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 03:29:59 GMT)
On Information Geometry and Iterative Optimization in Model Compression: Operator Factorization [6.0]
我々は、多くのモデル圧縮手法が、この射影に対する情報分岐を暗黙的に近似するものとして理解することができると論じる。ソフトランク制約を受けるニューラルネットワークのトレーニングにおける反復特異値しきい値の収束性を証明する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 23:39:14 GMT)
Retrieval-Augmented Recommendation Explanation Generation with Hierarchical Aggregation [5.7]
Explainable Recommender System (ExRec)は、レコメンデーションプロセスへの透明性を提供し、ユーザの信頼を高め、オンラインサービスの運用を促進する。既存のLLMベースのExRecモデルは、プロファイルの偏りと高い検索オーバーヘッドに悩まされ、デプロイメントを妨げている。階層的集約(REXHA)を用いた検索拡張レコメンデーション記述生成を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:15:05 GMT)
Multi Source COVID-19 Detection via Kernel-Density-based Slice Sampling [5.5]
4つの異なる医療センターから胸部CTスキャンを分類するMulti-Source COVID-19 Detection Challengeの解決策を提案する。我々の前処理パイプラインは肺領域抽出,品質管理,適応スライスサンプリングを組み合わせることで,スキャン毎に8つの代表スライスを選択する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 17:04:09 GMT)
Lower Bounds for Chain-of-Thought Reasoning in Hard-Attention Transformers [5.5]
整合推論とスクラッチパッドは、変換器の計算能力を高める重要なツールとして登場した。本研究では,異なるアルゴリズム問題におけるチェーン・オブ・シント・ステップの数に対する体系的下界の研究を開始する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 18:49:06 GMT)
Controllable Patching for Compute-Adaptive Surrogate Modeling of Partial Differential Equations [5.2]
本稿では,パッチベースモデルにおける動的パッチサイズ制御の推論を可能にする2つの軽量モジュールを提案する。私たちの知る限り、これはパッチベースのPDEサロゲートにおいて、推論時パッチサイズのチューニングを可能にする最初のフレームワークです。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 12:16:04 GMT)
Bayesian Theory of Consciousness as Exchangeable Emotion-Cognition Inference [5.2]
本稿では,意識が周期的かつ感情的に固定された推論プロセスとして現れる統一的な枠組みを提案する。感情を低次元構造的先行として定式化し,認知を特異性確認更新として定式化する。この感情認知サイクルは、感情的に重み付けされた先行と文脈に敏感な認知的評価を一致させることによって、関節の不確実性を最小化する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:50:27 GMT)
Instantiation-based Formalization of Logical Reasoning Tasks using Language Models and Logical Solvers [4.9]
本稿では,SSV(Semantic Self-Verification)を導入し,自然言語から解法の形式言語への推論問題を正確に定式化する手法を提案する。 SSVは一貫性に基づくアプローチを用いて、モデルによって生成され、解決者によって検証される具体的なインスタンス化を用いて、問題の強力な抽象的な形式化を生成する。このような*ほぼ確実な推論*は、多くの場合、手動検証の必要性を減らすための新しいアプローチとして提案され、より信頼性が高く自律的なAI推論システムに近づきます。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 18:39:50 GMT)
ViT-ProtoNet for Few-Shot Image Classification: A Multi-Benchmark Evaluation [4.9]
本稿では,VT-SmallバックボーンをPrototypeal Networkフレームワークに統合したViT-ProtoNetを紹介する。この結果から,ViT-ProtoNetを,数発の分類のための強力で柔軟なアプローチとして確立した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:19:04 GMT)
Domain Adaptation and Multi-view Attention for Learnable Landmark Tracking with Sparse Data [4.9]
本稿では,検出と記述によるランドマーク追跡のための新しい定式化について述べる。我々は,次世代宇宙船のフライトプロセッサ上でのリアルタイム実行のために設計された,軽量で計算効率のよいニューラルネットワークアーキテクチャを利用する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 23:00:52 GMT)
Hide-and-Shill: A Reinforcement Learning Framework for Market Manipulation Detection in Symphony-a Decentralized Multi-Agent System [4.8]
分散金融(DeFi)は、新たな無許可金融革新の時代をもたらしたが、前例のない市場操作につながった。本稿では,マニピュレータと検出器間の相互作用を動的対向ゲームとしてモデル化し,分散操作検出のためのマルチエージェント強化学習フレームワークを提案する。このフレームワークは、遅延トークン価格反応を金融指標として不審なパターンを特定する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:55:40 GMT)
EchoMimicV2: Towards Striking, Simplified, and Semi-Body Human Animation [4.8]
本研究では, 半体細部, 顔の表情, ジェスチャーの表現性を向上し, コンディションの冗長性を低減するため, 半体アニメーション手法であるEchoMimicV2を提案する。特定のフェーズにおけるアニメーションの動作、ディテール、低レベルの品質をガイドするために、フェーズ固有のDenoising Lossを設計する。大規模な実験と分析により、EchoMimicV2は定量評価と定性評価の両方において既存の手法を超越していることが示された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 10:02:14 GMT)
Fast Estimations of Hitting Time of Elitist Evolutionary Algorithms from Fitness Levels [4.6]
フィットネスレベル法は、レベルベースフィットネス関数上でのエリート的進化的アルゴリズムの平均打点時間を推定するために用いられる。この制限に対処するために、新しいサブセットレベルメソッドが導入された。エリートアルゴリズムの平均打点時間に対する下界を計算するために, 明示表現を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:59:57 GMT)
OpenCAMS: An Open-Source Connected and Automated Mobility Co-Simulation Platform for Advanced Transportation Research [4.6]
OpenCAMSはオープンソースで、同期化され、共同シミュレーションフレームワークである。 SUMO、CARLA、OMNeT++の3つの最高のクラスシミュレーションツールを密に結合している。 OpenCAMSは交通安全、モビリティ、サイバーセキュリティに関する高度な研究を支援するように設計されている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:10:37 GMT)
Optimal Differentially Private Ranking from Pairwise Comparisons [4.5]
我々は、エッジ差分プライバシーと個人差分プライバシーという2つのプライバシー概念の下でランキング手法を開発し、分析する。本アルゴリズムは,各プライバシー制約の下で最小収束率を達成する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:09:28 GMT)
Towards Pareto Optimal Throughput in Small Language Model Serving [4.5]
SLM(Small Language Models)は、リソース制約のあるユーザに対して、新たな機会を提供する。本研究では,SLM推論を性能およびエネルギーレベルで評価するための一連の実験について述べる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:55:44 GMT)
CASCADE Your Datasets for Cross-Mode Knowledge Retrieval of Language Models [4.4]
クロスモードな知識検索(クロスモードな知識検索)とは、あるフォーマットで学習した知識を別の形式で検索する能力である。複数のデータソースでトレーニングされたモデルは、元のトレーニングモードとは異なるフォーマットで知識を取得する際に、大幅に精度を低下させることを示した。そこで我々はCASCADEを提案する。CASCADEは、列の長さと計算損失の異なるカスケードデータセットを使用する新しい事前学習アルゴリズムである。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:08:38 GMT)
On Supernet Transfer Learning for Effective Task Adaptation [4.2]
トランスファーラーニングは、より大規模で事前訓練されたモデルの台頭に対する実用的な代替手段である。重みとアーキテクチャの両方をパラメータ化するスーパーネット転送学習を導入し、新しいタスクに効率よくファインチューンする。我々は、超ネット転送学習が最適モデルの発見を劇的に高速化するだけでなく、NASをゼロから実行するよりも優れたモデルを見つけることを実証した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 22:57:05 GMT)
A Generalization Theory for Zero-Shot Prediction [4.2]
ゼロショット予測という,このアプローチをよりよく理解するための理論的枠組みを提案する。ゼロショット予測が目指す目標量と,その一般化能力を実現する重要な条件付き独立関係を同定する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 03:37:57 GMT)
ClaritySpeech: Dementia Obfuscation in Speech [4.0]
認知症は、音声パターンを変更し、コミュニケーション障壁を作成し、プライバシーの懸念を高める。本稿では,音声フレームワークClaritySpeechの認知症難読化について述べる。低データ環境における話者識別を微調整せずに保ちながら、認知症に影響を及ぼした音声を補正する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 13:39:25 GMT)
LLM-Powered Quantum Code Transpilation [3.9]
さまざまな量子コンピューティングプラットフォームに適した、さまざまなソフトウェア開発キット(SDK)が存在する。それらはQuantum SDK(QSDK)として知られている。例にはQiskit、Cirq、PennyLaneに限らない。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 21:16:21 GMT)
A Random Matrix Theory Perspective on the Learning Dynamics of Multi-head Latent Attention [3.8]
本研究では,マルチヘッド潜時注意がプレトレーニング中の変圧器の内部能力に与える影響について検討する。 Marchenko-Pastur(MP)診断の軽量なスイートを用いて、トレーニング中に$W_QW_Ktop$ gram行列のスペクトルを分析する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:31:07 GMT)
DAA*: Deep Angular A Star for Image-based Path Planning [3.7]
提案した経路角自由度(PAF)をA*に組み込むことにより,適応経路の滑らか性を通じて経路類似性を改善することによって,DAA*(Deep angular A*)と呼ばれる新しい学習手法を提案する。我々は,予測経路と参照経路との経路類似性において,神経性A*に対するDAA*の顕著な改善を示す。経路損失と経路確率マップ損失を併用したパスフィンディングを共同学習する場合、DAA*は最先端のTransPathを6.7% SPR、6.5% PSIM、3.7% ASIMで大幅に上回っている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:46:42 GMT)
POIFormer: A Transformer-Based Framework for Accurate and Scalable Point-of-Interest Attribution [3.7]
textsfPOIFormerは、正確で効率的なPOI属性のためのトランスフォーマーベースの新しいフレームワークである。 textsfPOIFormerは、大規模でノイズの多いモビリティデータセットにおいて、正確で効率的な属性を可能にする。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:37:52 GMT)
Position Paper: Programming Language Techniques for Bridging LLM Code Generation Semantic Gaps [3.6]
本稿では,大規模言語モデルにおける意味的ギャップを埋めるのに,プログラミング手法の原則的統合が不可欠であることを論じる。 PL技術は、LLM生成コードを統計的パターンマッチングから真に信頼性と信頼性の高いレベルまで高めることができる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:32:15 GMT)
Towards Interpretable Drug-Drug Interaction Prediction: A Graph-Based Approach with Molecular and Network-Level Explanations [3.6]
薬物と薬物の相互作用(DDI)は、薬理学において重要な課題であり、しばしば患者の安全と医療結果に重大な影響を及ぼす有害な薬物反応を引き起こす。我々は,分子と生物の知識を統合したグラフベースの新しいフレームワークであるMolecBioNetを提案し,ロバストで解釈可能なDDI予測を行う。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:43:19 GMT)
TPP-SD: Accelerating Transformer Point Process Sampling with Speculative Decoding [3.5]
本稿では,Transformer temporal point process (TPP) サンプリングを高速化する新しい手法であるTPP-SDを提案する。 TPPのスライニングアルゴリズムと言語モデルの投機的復号化という構造的類似性を同定することにより,効率的なサンプリングフレームワークを開発する。合成データと実データの両方の実験により,本手法は標準手法と同一の分布からサンプルを生成するが,2-6$times$ speedupで生成することを示した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 11:18:07 GMT)
A Taxonomy of Omnicidal Futures Involving Artificial Intelligence [3.4]
本報告では,AIによる全能事象の分類と例を示す。これらのイベントは避けられないものではなく、避けられる可能性として提示されます。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 18:23:36 GMT)
Practical Principles for AI Cost and Compute Accounting [3.1]
政策立案者は、開発コストと計算を、AI能力とリスクのプロキシとしてますます利用している。我々は,AIコストと計算会計基準を設計するための7つの原則を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:12:40 GMT)
AHCPTQ: Accurate and Hardware-Compatible Post-Training Quantization for Segment Anything Model [3.1]
Segment Anything Model (SAM) は様々な視覚的タスクに対して強力な汎用性を示している。ポストトレーニング量子化(PTQ)は、効率的なデプロイメントのための効果的な戦略として登場した。本稿では,SAM の高精度かつハードウェア効率の高い PTQ 手法である AHCPTQ を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:30:20 GMT)
Adaptive deep learning framework for robust unsupervised underwater image enhancement [3.1]
ディープラーニングベースの水中画像強化における大きな課題の1つは、高品質なトレーニングデータの可用性の制限である。本研究では、条件付き変分オートエンコーダ(cVAE)を用いて、深層学習モデルのトレーニングを行う、新しい教師なし水中画像強調フレームワークを提案する。提案手法は, 定量化と定性化の両面において, 他の最先端手法と比較して, 競争性能が向上することを示す。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:25:09 GMT)
A Practical Approach to Underwater Depth and Surface Normals Estimation [3.1]
本稿では,単眼深度と表面正規化推定(MDSNE)のための新しいディープラーニングモデルを提案する。これは特に、CNNとTransformerを統合するハイブリッドアーキテクチャを使用して、水中環境向けに調整されている。我々のモデルはパラメータを90%削減し、トレーニングコストを80%削減し、リソース制約されたデバイス上でリアルタイムな3D認識を可能にする。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:18:17 GMT)
EgoAnimate: Generating Human Animations from Egocentric top-down Views [3.0]
ControlNetとStable Diffusionのバックボーンを用いて、トップダウン画像からリアルなフロントビューを生成するパイプラインを導入する。これにより、最小限の入力からアバターの動きを生成することができ、よりアクセスしやすく一般化可能なテレプレゼンスシステムへの道を開くことができる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:59:31 GMT)
FieldNet: Efficient Real-Time Shadow Removal for Enhanced Vision in Field Robotics [2.8]
本研究では、リソース制約のあるハードウェアに最適化された、リアルタイムシャドウ除去のための新しいディープラーニングフレームワークであるFieldNetを紹介する。合成シャドウで強化された1万の自然画像のデータセットに基づいてトレーニングされたFieldNetは、ベンチマークデータセットの最先端メソッドよりも優れています。これらの進歩は、フィールドロボティクスなどにおけるリアルタイムビジョンタスクのための堅牢で効率的なソリューションとしてFieldNetを確立している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:27:10 GMT)
BEExformer: A Fast Inferencing Binarized Transformer with Early Exits [2.8]
BAT(Binarized Early Exit Transformer)とEE(Early Exit)を統合した最初の選択型学習ベーストランスであるBEExformerを紹介する。 BATは符号関数に微分可能な二階近似を用い、重みの符号と大きさの両方を捉える勾配を可能にする。 EEメカニズムは、ソフトルーティング損失推定を伴う中間変圧器ブロック間のエントロピーの分数還元に係わる。これにより、FLOPを52.08%削減して推論を加速し、深層ネットワークに固有の「過剰な」問題を解くことで精度を2.89%向上させる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 18:28:38 GMT)
Order-preserving condition for coherence measures of projective measurements with One Example [2.8]
コヒーレンスは量子資源理論の典型的な例として確立されている。このような対策として,新しい条件である秩序保存条件が提案されている。この一般化されたコヒーレンス尺度が順序保存条件を満たすことを検証する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 11:47:33 GMT)
$I^{2}$-World: Intra-Inter Tokenization for Efficient Dynamic 4D Scene Forecasting [2.7]
I2$-Worldは、4D占有率予測のための効率的なフレームワークである。本手法は,シーントークン化をシーン内およびシーン間トークン化剤に分解する。 I2$-Worldは最先端のパフォーマンスを達成し、既存の手法を25.1%のmIoUで、36.9%のIoUで4D占有率予測で上回っている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 05:14:39 GMT)
Geometric Generative Modeling with Noise-Conditioned Graph Networks [2.7]
生成時のノイズレベルに応じてアーキテクチャを動的に変更するグラフニューラルネットワークを導入する。我々の理論的および実証的な分析は、ノイズが増加するにつれて、グラフはますます遠い隣人の情報を必要とすることを明らかにしている。我々は,NCGNの特定のインスタンス化である動的メッセージパッシング(DMP)を開発し,ノイズレベルへのメッセージパッシングの範囲と解像度を両立させる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:19:05 GMT)
PLEX: Perturbation-free Local Explanations for LLM-Based Text Classification [2.6]
大規模言語モデル(LLM)はテキスト分類において優れているが、その複雑さは解釈可能性を妨げる。本稿では,アンダーライン・インダーライン・インダーライン・インダーライン・インダーライン・エクスプランテーション(PLEX)を提案する。このワンオフトレーニングは、後続の摂動の必要性を排除し、新しい文の効率的な説明を可能にする。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 06:31:38 GMT)
RadEyeVideo: Enhancing general-domain Large Vision Language Model for chest X-ray analysis with video representations of eye gaze [2.4]
RadEyeVideoは、放射線学者の眼球固定データをビデオシーケンスとして統合し、視線の時間的・空間的ダイナミクスをキャプチャする。目を見つめるビデオでトリガーすると、レポート生成タスクのモデル性能が24.6%向上する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:45:38 GMT)
Queue up for takeoff: a transferable deep learning framework for flight delay prediction [2.2]
本稿では、キュー理論と簡単な注意モデルを組み合わせた新しいアプローチを紹介し、キュー理論SimAM(QT-SimAM)と呼ぶ。提案モデルでは,異なるネットワーク間の遅延を高精度に予測する能力により,乗客の不安を軽減し,運用上の意思決定を改善することができる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:02:40 GMT)
Learning and Transferring Better with Depth Information in Visual Reinforcement Learning [2.2]
視覚変換器をベースとした視覚バックボーンを提案し,RGBと奥行き変調を融合させて一般化を促進させる。異なるモダリティはまず別々のCNNステムで処理され、組み合わせた畳み込み機能はスケーラブルな視覚変換器に配信される。 sim2real転送では、トレーニングプロセスよりもドメインランダム化をデプロイする柔軟なカリキュラム学習スケジュールが開発されている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:58:02 GMT)
Automatic Contouring of Spinal Vertebrae on X-Ray using a Novel Sandwich U-Net Architecture [2.2]
胸椎をX線画像上から正確に切り離すために設計された新しいU-Net変異体を提案する。サンドイッチ型U-Net構造とデュアルアクティベーション関数を併用した提案手法により,ベースラインのU-Netモデルと比較してDiceスコアが4.1%向上した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 06:40:18 GMT)
Local unitary decomposition of tripartite arbitrary leveled qudit stabilizer states into $p$-level-qudit EPR and GHZ state [2.2]
任意の局所ユニタリの下で, 3部安定化器状態の絡み合い構造を次元$D$の$N$クォーディットで調べ, パーティ間を分散する$A$, $B$, $C$について検討する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 22:51:08 GMT)
Regularization-based Framework for Quantization-, Fault- and Variability-Aware Training [2.1]
正規化に基づく量子化対応トレーニングフレームワークは、CIFAR-10とImageNet上での競合結果を達成する。当社のフレームワークは,フォールトおよび可変性を考慮した微調整,固定重み付きフォールト(固定重み付きビット)の緩和,デバイス抵抗のばらつきを可能にする。本研究は,低消費電力非理想ハードウェアにおいて,量子化とロバスト性を考慮したトレーニングを行うための一般化可能なフレームワークを構築した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 06:32:06 GMT)
Context-Aware Regularization with Markovian Integration for Attention-Based Nucleotide Analysis [2.1]
自己回帰変換器は、固定長のコンテキストウィンドウに頼ってマルコフの振る舞いを示す。 CARMANIAは、NT予測を遷移行列(TM)損失で強化する自己教師型事前学習フレームワークである。 TM損失は、予測トークン遷移を、各入力シーケンスから経験的に導出されたn-gram統計と整合させ、局所的なコンテキストを超えた高次依存関係を捕捉するようモデルに促す。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 19:03:28 GMT)
Survival of the Optimized: An Evolutionary Approach to T-depth Reduction [2.1]
量子エラー補正(Quantum Error Correction, QEC)は、実用的フォールトトレラント量子コンピューティング(FTQC)の基盤である回路ゲートが大きくなると、シーケンシャルなTゲート層("T-deepth")がオーバヘッドを増幅する。最適層マージパターンを近似した数学的定式化を導入する。我々は最先端手法よりもT深度が2.58倍向上した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:35:10 GMT)
A Moment-Based Generalization to Post-Prediction Inference [2.1]
人工知能(AI)と機械学習(ML)は、下流の分析のためのデータを生成するためにますます利用されている。これらの予測を真に観察すると、偏見のある結果と誤った推測につながる可能性がある。 Wangらは、AI/ML予測と観測結果の関係をモデル化して推論を校正する、予測後推論手法を提案した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 02:33:45 GMT)
Quantifying Holistic Review: A Multi-Modal Approach to College Admissions Prediction [1.9]
Comprehensive Applicant Profile Score (CAPS) は、総合的な大学入学評価を定量的にモデル化し解釈するための新しいフレームワークである。 CAPSは応募者のプロフィールを3つの解釈可能な要素に分解する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:58:03 GMT)
Hybrid Quantum Security for IPsec [1.9]
本稿では,IPsec におけるシーケンシャルと並列ハイブリッド QKD-PQC 鍵確立戦略の体系的比較について述べる。 ETSI GS QKD 004 StatefulとETSI GS QKD 014 Stateless API仕様の両方をサポートする。我々のキーとなる洞察は、並列ハイブリッドアプローチはRFC 9370で処理されるシーケンシャルメソッドに固有の乗法的なレイテンシのペナルティを取り除くことである。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 13:54:04 GMT)
PoseLLM: Enhancing Language-Guided Human Pose Estimation with MLP Alignment [1.8]
本稿では,線形プロジェクタを非線形視覚言語コネクタに置き換えた最初の大規模言語モデル(LLM)に基づくポーズ推定フレームワークであるPoseLLMを提案する。本研究は, 単純だが強力な非線形コネクタが一般化を犠牲にすることなく, 局所化精度を大幅に向上させることを示す。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:53:39 GMT)
Deep Neural Network Based Accelerated Failure Time Models using Rank Loss [1.5]
加速故障時間(AFT)モデルは、障害時間と一連の共変量の間の対数線関係を仮定する。ディープニューラルネットワーク(DNN)は過去数十年にわたって注目され、様々な分野で大きな成功を収めてきた。本稿では,Gehan型損失モデルとサブサンプリング手法を組み合わせることで,AFTモデルにDNNを適用することを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:35:15 GMT)
Learning-Based Multiuser Scheduling in MIMO-OFDM Systems with Hybrid Beamforming [1.4]
周波数分割多重化(OFDM)とハイブリッドビームフォーミングを用いたマルチ入力多重出力(MIMO)システムにおけるマルチユーザスケジューリング問題について検討する。スケジューリングを行うために、グリージーやソートアルゴリズムなどのソリューションを提案し、次に機械学習(ML)アプローチを提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 13:42:56 GMT)
Prompt4Trust: A Reinforcement Learning Prompt Augmentation Framework for Clinically-Aligned Confidence Calibration in Multimodal Large Language Models [1.4]
Prompt4Trustは,MLLMにおける信頼度校正をターゲットとした即時強化のための,最初の強化学習フレームワークである。従来のキャリブレーション技術とは異なり、Prompt4Trustは安全で信頼性の高い臨床診断に最も重要なキャリブレーションの側面を特に優先している。実験では,より大きなMLLMに対してゼロショットの一般化が期待できることを示した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 13:21:10 GMT)
Towards Human-level Dexterity via Robot Learning [1.4]
デクスタース・インテリジェンス(Dexterous Intelligence)は、人間の身体的インテリジェンスと高次認知能力の頂点である。何千万年もの間、人間の脳と手の発達に費やされ、触覚が豊かになった。本論文では, 擬似学習技術を導入し, ビジュオ触覚による人体実験をデクスタリティに活用する新たなパラダイムを探求する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 02:22:55 GMT)
Quantum Observers: A NISQ Hardware Demonstration of Chaotic State Prediction Using Quantum Echo-state Networks [1.3]
我々は,現在のIBMハードウェア上でノイズの存在下で動作可能な新しい量子エコー状態ネットワーク(QESN)を提案する。以上の結果から,QESNは,IBM Marrakesh QPUのT1とT2の100倍以上の時間長を持続メモリで予測できることがわかった。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:53:10 GMT)
Meta-autoencoders: An approach to discovery and representation of relationships between dynamically evolving classes [1.3]
本稿では,メタオートエンコーダ(MAE: Meta-autoencoder)の概念を紹介する。ファミリーのMAEは、クラス固有のAEのコンパクト表現と関連するエンコーダとデコーダを学んだニューラルネットワークである。この一般的な概念の1つの応用は自然進化の研究とモデリングである。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 17:50:35 GMT)
The Narrative Construction of Generative AI Efficacy by the Media: A Case Study of the Role of ChatGPT in Higher Education [1.3]
本研究では,米国のニュースメディアが生成型AI(GenAI)の有効性に関する物語をいかに構築するかを検討する。以上の結果から,メディア・談話における6つの重要な話題が明らかとなり,感情分析の結果,ChatGPTの高等教育への統合が概ね肯定的であったことが示唆された。対照的に、メディアの物語は、入学レベルの仕事や大学入学に対する影響について、より否定的な感情を表現している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 10:19:50 GMT)
A Randomized Algorithm for Sparse PCA based on the Basic SDP Relaxation [1.3]
基本的SDP緩和に基づくSPCAのランダム化近似アルゴリズムを提案する。我々のアルゴリズムは、十分な時間で呼ばれる場合、最も高い確率で空間定数の近似比を持つ。実世界のデータセット上での数値計算によるアルゴリズムの有効性を実証する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 05:43:56 GMT)
NeuroHD-RA: Neural-distilled Hyperdimensional Model with Rhythm Alignment [1.2]
心電図(ECG)に基づく疾患検出のための新規かつ解釈可能な枠組みを提案する。本稿では、RR間隔に基づくリズム認識およびトレーニング可能な符号化パイプライン、生理学的信号セグメンテーション戦略を導入する。我々のフレームワークは、エッジ互換のECG分類のための効率的でスケーラブルなソリューションを提供し、解釈可能でパーソナライズされた健康モニタリングの強力な可能性を秘めている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:22:48 GMT)
An Introduction to Flow Matching and Diffusion Models [1.2]
このチュートリアルは、拡散とフローベースの生成モデルについて、第一原理から自己完結した紹介を提供する。常微分方程式および微分方程式において必要となる数学的背景を開発し、フローマッチングとデノナイズ拡散モデルのコアアルゴリズムを導出する。次に、トレーニング方法、ガイダンス、アーキテクチャ設計を含む画像およびビデオジェネレータを構築するためのステップバイステップガイドを提供する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:37:24 GMT)
Exploring Gender Bias Beyond Occupational Titles [1.2]
我々は、文脈バイアスとその関連性バイアスを推定できる新しいデータセット、GenderLexiconとフレームワークを導入する。我々のモデルでは、バイアスをスコアで解釈できるため、性別バイアスの説明可能性を向上させることができる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:26:40 GMT)
Eka-Eval : A Comprehensive Evaluation Framework for Large Language Models in Indian Languages [1.2]
EKA-evalは、9つの主要な評価カテゴリに35以上のベンチマークを統合する統合評価フレームワークである。モジュールアーキテクチャによる11のコア機能、Hugging Faceとプロプライエタリなモデルとのシームレスな統合、プラグインとプレイのユーザビリティを提供する。フレームワークはオープンソースで、https://github.com/lingo-iitgn/eka-eval.comで公開されている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 05:20:11 GMT)
Simplifying Traffic Anomaly Detection with Video Foundation Models [1.1]
エゴ中心交通異常検出(TAD)の最近の手法は、複雑な多段階もしくは多表現融合アーキテクチャに依存していることが多い。近年の視覚知覚の知見は、先進的な事前訓練によって実現された基礎モデルにより、単純で柔軟なアーキテクチャが特殊設計より優れていることを示唆している。ビデオビジョン変換器(Video ViTs)を用いて,アーキテクチャ的にシンプルなエンコーダのみのアプローチについて検討し,事前学習が強力なTAD性能を実現する方法について検討する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:36:49 GMT)
When Developer Aid Becomes Security Debt: A Systematic Analysis of Insecure Behaviors in LLM Coding Agents [1.1]
LLMベースのコーディングエージェントは急速にソフトウェア開発にデプロイされているが、そのセキュリティへの影響はよく分かっていない。我々は,5つの最先端モデルにわたる12,000以上のアクションを解析し,自律型符号化エージェントのシステムセキュリティ評価を行った。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:11:07 GMT)
Shaping Laser Pulses with Reinforcement Learning [1.1]
高出力レーザー(HPL)システムは、人類が作り出した最短の時間スケールであるアト秒体制で運用されている。伝統的に、HPL光学性能を制御するパラメータは、人間の専門家によって手動で調整されている。 Deep Reinforcement Learning (DRL)は、静的でない環境でシーケンシャルな意思決定を可能にする、有望な代替手段を提供する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 10:05:39 GMT)
Smart Routing for Multimodal Video Retrieval: When to Search What [1.1]
マルチモーダルビデオ検索のための最適モードを動的に選択するLLMベースのインテリジェントルーティングシステム。提案手法はGPT-4.1を用いて,ASR(音声),OCR(テキスト),視覚指標のクエリをルーティングする。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 15:45:03 GMT)
Defects and their Time Scales in Quantum and Classical Annealing of the Two-Dimensional Ising Model [1.1]
周期的な$Ltimes L$格子上の2次元横磁場Ising強磁性体の欠陥について検討する。我々は、量子相転移において、期待される臨界キブルズレック(KZ)時間スケール$propto Lz+1/nu$を観察した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 12:59:40 GMT)
An Integrated Blockchain and IPFS Solution for Secure and Efficient Source Code Repository Hosting using Middleman Approach [1.0]
本研究では、ブロックチェーンとInterPlanetary File Systemのセキュリティを組み合わせた、新しいハイブリッドアーキテクチャを提案する。このアーキテクチャは,ソースコードホスティングのためのセキュアで監査可能でレジリエントなプラットフォームを実現することを実証した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 06:27:36 GMT)
PU-Lie: Lightweight Deception Detection in Imbalanced Diplomatic Dialogues via Positive-Unlabeled Learning [0.9]
この研究は、5%未満のメッセージが偽造とラベル付けされている外交データセットにおける偽造検出を再考する。本稿では,凍結したBERT埋め込み,解釈可能な言語的特徴とゲーム固有の特徴を組み合わせた軽量で効果的なモデルと,肯定的非ラベル学習(PU)の目標を提案する。我々のモデルは、トレーニング可能なパラメータを650倍以上減らしながら、0.60の新しい最良のマクロF1を達成する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 06:27:46 GMT)
DTECT: Dynamic Topic Explorer & Context Tracker [0.9]
DTECT(Dynamic Topic Explorer & Context Tracker)は、テキストデータと意味のある時間的洞察のギャップを埋めるエンドツーエンドシステムである。 DTECTは、データ前処理、複数のモデルアーキテクチャ、時間的トピックモデルのトピック品質を分析するための専用の評価メトリクスをサポートする統合ワークフローを提供する。 LLMによる自動トピックラベリング、時間順な単語によるトレンド分析、文書レベルの要約によるインタラクティブな可視化、直感的なデータクエリのための自然言語チャットインターフェースの導入により、解釈可能性を大幅に向上させる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 05:41:16 GMT)
Perspective Dial: Measuring Perspective of Text and Guiding LLM Outputs [0.9]
大型言語モデル(LLM)は様々なミッションクリティカルな役割で使用される。 LLM出力に関連するバイアスと視点の定量的な理解が欠如している。本稿では,汎用テキストの視点や視点のより広範な問題と,大言語モデル(LLM)出力の視点制御について考察する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 17:57:39 GMT)
Classical Combinatorial Optimization Scaling for Random Ising Models on 2D Heavy-Hex Graphs [0.8]
重ヘックスグラフ上のイジングモデルは、経験的時間スケーリングにより古典的な計算硬度について検討する。これらのイジングモデルの空間性のため、古典的アルゴリズムは大規模インスタンスに対しても効率的に最適解を見つけることができる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 03:22:28 GMT)
Explainability as a Compliance Requirement: What Regulated Industries Need from AI Tools for Design Artifact Generation [0.8]
本稿では,AIによるデザインアーティファクト生成における説明可能性のギャップについて,安全クリティカル産業の実践者10人との半構造化インタビューを通して検討する。我々の研究結果によると、説明不能なAI出力は、広範囲な手作業による検証、ステークホルダ信頼の低減、ドメイン固有の用語を扱うのに苦労、チームコラボレーションの破壊、規制コンプライアンスのリスクの導入を必要としている。この研究は、要件エンジニアリングにおけるAIツールの透明性、信頼性、適用性を改善するための実践的なロードマップを概説する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:34:39 GMT)
AGCD-Net: Attention Guided Context Debiasing Network for Emotion Recognition [0.7]
我々は,意図的文脈バイアスモデルである textbfAGCD-Net を提案する。 AGCD-Netの中核には、因果理論、摂動コンテキストの特徴を適用し、刺激的な相関を分離し、顔の特徴によってコンテキストバイアスに導かれる注意駆動補正を行う、注意誘導-因果干渉モジュール(AG-CIM)がある。 CAER-Sデータセットによる実験結果から,AGCD-Netの有効性,最先端性能の実現,複雑な環境下での堅牢な感情認識における因果脱バイアスの重要性が示された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 11:03:55 GMT)
Classification of four-qubit pure codes and five-qubit absolutely maximally entangled states [0.7]
我々は、全ての5量子ビットが絶対極大エンタングルド(AME)状態は、一意((5,2,3))量子誤り符号Cの点への局所的ユニタリ変換によって等価であることを証明した。また、すべての 4-qubit 純コードは、(4,2) の部分空間と等価であることを示し、$ngeq 6$ に対して 3-ユニフォーム n-qubit 状態の無限族を構成する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:28:52 GMT)
Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity [0.6]
広く採用されているにもかかわらず、ソフトウェア開発におけるAIツールの影響はいまだ検討されていない。 2025年2月から6月までのフロンティアにおけるAIツールが、経験豊富なオープンソース開発者の生産性にどのように影響するかを理解するために、ランダム化制御トライアル(RCT)を実施しています。適度なAI経験を持つ16人の開発者が、平均5年間の経験を持つ成熟したプロジェクトで246のタスクを完了した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:16:33 GMT)
Expansion dynamics of strongly correlated lattice bosons [0.5]
強相関状態における2次元ハバード格子上のボソンの凝縮時間ダイナミクスについて検討した。各格子点における系の局所密度行列の時間発展に関する量子マスター方程式を導出する。コンデンサイトの膨張を観測し, 正常なボソンの輸送速度が遅く, 拡散する様子を観察した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:43:10 GMT)
Implementing and Evaluating Post-Quantum DNSSEC in CoreDNS [0.4]
本稿では,量子後暗号(PQC)アルゴリズムをCoreDNSに統合する。 5つのPQCシグネチャアルゴリズムファミリをサポートするCoreDNSを拡張するプラグインを開発した。本実装では,既存のDNS解決フローとの互換性を維持しつつ,量子抵抗シグネチャを用いたオンザフライ署名を実現している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:34:17 GMT)
Advanced Health Misinformation Detection Through Hybrid CNN-LSTM Models Informed by the Elaboration Likelihood Model (ELM) [0.4]
本研究では,ソーシャルメディア上での誤情報検出を促進するために,ELM(Elaboration Likelihood Model)を適用した。本モデルは,EMMに基づく特徴を統合することにより,誤情報分類の検出精度と信頼性を向上させることを目的としている。改良されたモデルは精度97.37%、精度96.88%、リコール98.50%、F1スコア97.41%、ROC-AUC99.50%を達成した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 05:44:06 GMT)
New Statistical and Computational Results for Learning Junta Distributions [0.4]
我々は、$k$-junta分布の学習は、ノイズを伴う$k$-parity関数の学習と等価であることを示す。統計的複雑性が最適であるユンタ分布を学習するためのアルゴリズムを設計する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 21:37:06 GMT)
Secondary Bounded Rationality: A Theory of How Algorithms Reproduce Structural Inequality in AI Hiring [0.2]
論文では、AIシステムは技術的・社会的制約を通じて人間の認知と構造的バイアスを継承し、増幅すると主張している。アルゴリズムのプロセスが、エリート的信用権の特権化やネットワークのホモフィリーといった歴史的不平等を、明らかに有益な官僚的な結果にどのように変えるかを示す。我々は、この自己強化不平等を打破するために、対物公正テスト、資本認識監査、規制介入を含む緩和戦略を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 10:03:20 GMT)
Knowledge Conceptualization Impacts RAG Efficacy [0.1]
本稿では,伝達可能な,解釈可能なニューロシンボリックAIシステムの設計について検討する。具体的には、'Agentic Retrieval-Augmented Generation'システムと呼ばれるシステムのクラスに焦点を当てる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:10:26 GMT)
Investigating the Robustness of Extreme Precipitation Super-Resolution Across Climates [0.1]
格子状気候モデルの粗い空間分解能は極端な降水量のような社会的に関係のある変数を投影する際の使用を制限します対象変数の確率分布のパラメータを解析的に抽出可能な写像を用いて超解法を提案する。本フレームワークは, パラメータ分布が支配する変数に対して広く適用可能であり, 経験的ダウンスケーリングが気候変動や極端に一般化する時期と理由を理解するためのモデルに依存しない診断を提供する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:04:07 GMT)
Uncovering symmetric and asymmetric species associations from community and environmental data [0.0]
本研究では,生物群集と環境データを分析し,双方向の関連関係を検索できる機械学習フレームワークの提案と検証を行う。私たちのフレームワークは直感的で、モジュール的で、様々な分類群に広く適用されています。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 15:18:36 GMT)
WellPINN: Accurate Well Representation for Transient Fluid Pressure Diffusion in Subsurface Reservoirs with Physics-Informed Neural Networks [0.0]
WellPINNは、複数の逐次訓練されたPINNモデルの出力を組み合わせて、ウェルを正確に表現するモデリングワークフローである。以上の結果から,揚水場周辺におけるスーパーインポージングネットワークの逐次トレーニングが,揚水率の正確な推算に焦点をあてた最初のワークフローであることが示唆された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:14:03 GMT)
User-to-PC Authentication Through Confirmation on Mobile Devices: On Usability and Performance [0.0]
我々は,スマートフォンやスマートウォッチの認証要求を確認することによって,ユーザがPCを認証するトークンベースのパスワードレスアプローチを利用する。ボタンタップと生体指紋認証を確認変数として評価し,認証期間,成功率,ユーザビリティを従来のパスワードベースの認証と比較した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:17:59 GMT)
The temporal resolution limit in quantum sensing [0.0]
この研究は、量子状態の区別可能な条件と量子速度制限を組み合わせることで、尋問時間に基づいて低い境界を確立する。この境界以下になると、出力状態は統計的に入力状態と区別できず、必然的にノイズで失われる。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:38:27 GMT)
Swa-bhasha Resource Hub: Romanized Sinhala to Sinhala Transliteration Systems and Data Resources [0.0]
Swa-bhasha Resource Hubは、2020年から2025年にかけて、SinhalaからSinhalaへの翻訳のために開発された、包括的なデータリソースとアルゴリズムのコレクションを提供する。これらの資源は、シンハラ自然言語処理(NLP)の研究の進展に重要な役割を果たしている。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 10:54:30 GMT)
Superinductor-based ultrastrong coupling in a superconducting circuit [0.0]
共振器にガルバニカルに結合したフラックス量子ビットからなる超弦超インダクタによる結合について述べる。その結果,スーパーインダクタは高コヒーレンス回路においてUSC物理を研究する上で有望なツールであることがわかった。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:38:45 GMT)
Spin Squeezing in Electron Microscopy [0.0]
スピンスクイージングは電子顕微鏡における信号-雑音比(SNR)を改善するのに自然に適していることが理論的に示されている。我々の結果は量子力学と電子干渉学の分野を結びつけ、ショットノイズ限界を超えたSNRによる電子顕微鏡への道を開いた。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 10:31:04 GMT)
Scaling and Universality at Noisy Quench Dynamical Quantum Phase Transitions [0.0]
動的量子相転移 (DQPTs) は, 雑音のない, 雑音の多い線形進行場の場合の両方において, 拡張XYモデルで研究されている。ノイズレスランプの場合、単一臨界点を横断するクエンチに対してDQPTが常に発生する横磁場XYモデルとは異なり、DQPTに対応するキンクを完全に除去する臨界スイープ速度が存在する。ノイズ強度とスリープ速度がほぼ同じ桁である場合、臨界モードの数は大幅に増加し、複数の臨界モードを持つ領域に信号を送る。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 18:28:56 GMT)
Quantum Complexity and Chaos in Many-Qudit Doped Clifford Circuits [0.0]
奇素次元$d$のクォーディットに作用するドッピングクリフォード回路における量子複雑性とカオスの出現について検討する。ドッピングされたクリフォード・ウィンガルテン計算とレプリカテンソルネットワーク形式を用いて、正確な結果を導き、大規模シミュレーションを行う。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 10:33:33 GMT)
Optimizing External Sources for Controlled Burning Plasma in Tokamaks with Neural Ordinary Differential Equations [0.0]
本研究は, ニューラル常微分方程式に基づく多次元プラズマ力学モデルを用いた逆モデリング手法を提案する(ニューラルODE)。我々は、プラズマを特定の行動に向けて駆動する中性ビーム注入(NBI)電力などの外部源プロファイルを計算する。このフレームワークは、フォワードシミュレーションツールを制御指向モデルに変換し、現在および将来の融合デバイスで外部ソースプロファイルを計算するための実用的な方法を提供する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 23:56:47 GMT)
Online Long-term Point Tracking in the Foundation Model Era [0.0]
ポイントトラッキングは、ビデオフレーム全体で同じ物理点を識別することを目的としており、動きの幾何学的表現として機能する。この論文は、将来の情報にアクセスせずにフレームを逐次処理するオンライン環境での長期的ポイントトラッキングの問題に対処する。本稿では,各トラックポイントを問合せとして扱い,ビデオフレームを1回ずつ処理するトランスフォーマーベースのモデルであるTrack-Onを紹介する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:24:28 GMT)
MetaClimage: A novel database of visual metaphors related to Climate Change, with costs and benefits analysis [0.0]
気候変化のメタファーデータベース(MetaClimage)について紹介する。それぞれの画像に対して,人間の評価から難易度,有効性,芸術的品質,情緒的覚醒の値を収集した。視覚的なメタファーは理解が難しいが、リテラル画像よりも心地よいと評価された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:49:30 GMT)
Matchgate circuits deeply thermalize [0.0]
本研究では,ランダム整合量子回路の出力を投影的に計測することで生成した状態のアンサンブルについて検討する。大きなシステムサイズに対しては、ガウスのフェルミオン状態の多様体上で一様である普遍アンサンブルに収束する。量子情報の拡散によって設定された時間スケール$t sim L2$の後に局所整合回路が深く熱化することを数値的に見出した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 12:04:36 GMT)
Macroscopic Thermalization for Highly Degenerate Hamiltonians After Slight Perturbation [0.0]
純粋な状態 $psi$ における孤立したマクロ的量子系について、$psi$ がヒルベルト空間の適当な部分空間 $mathcalH_eq$ 内にある場合、それはマクロ的熱平衡 (MATE) にあると言う。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 15:01:41 GMT)
Machine-Learning-Enhanced Entanglement Detection Under Noisy Quantum Measurements [0.0]
雑音耐性の絡み合い分類を実現するための機械学習に基づく手法を提案する。本プロトコルは,従来手法の分類精度を著しく向上させる。この研究は機械学習と量子情報科学を橋渡しし、ノイズロスの量子キャラクタリゼーションのための実用的なツールを提供する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 12:28:16 GMT)
MSVD-Indonesian: A Benchmark for Multimodal Video-Text Tasks in Indonesian [0.0]
インドネシアでは、MSVDデータセットの英語字幕をインドネシア語に翻訳することで、最初のパブリックなインドネシア語ビデオテキストデータセットを導入する。 3つのタスクに基づいて,英語ビデオテキストデータセットのために開発されたニューラルネットワークモデルを評価する。インドネシアのデータセット上で,英語に制限された抽出器と微調整モデルを活用することによって,言語間移動学習手法を適用した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 04:28:35 GMT)
MI CAM: Mutual Information Weighted Activation Mapping for Causal Visual Explanations of Convolutional Neural Networks [0.0]
本稿では, アクティベーションマッピングに基づくMI CAMと呼ばれる, ポストホックな視覚的説明手法を提案する。入力画像との相互情報を通じて各特徴マップを重み付けすることで、サリエンシビジュアライゼーションを生成する。また、反事実分析の助けを借りて検証されるような因果解釈の創出にも固執する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:20:32 GMT)
Lecture Notes on Quantum Many-Body Theory: A Pedagogical Introduction [0.0]
このテキストは、相互作用量子系の研究のための確かな理論基盤を提供するように設計されている。形式的一貫性と教育的構造には特に注意が払われており、その主題の概念的側面と技術的側面の両方を通して読者を導く。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:58:54 GMT)
LLMs' Leaning in European Elections [0.0]
この論文は、複数の欧州諸国におけるいくつかの仮想選挙を考慮して、アメリカ合衆国大統領選挙の以前の分析を延長している。その結果、傾きは国によって均一ではないことが明らかとなった。時折、モデルは仮想選挙における地位を辞退するが、拒否率そのものは国によって一様ではない。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 12:15:19 GMT)
Insuring Uninsurable Risks from AI: Government as Insurer of Last Resort [0.0]
プログラムは、社会的に最適なケアレベルを誘導するために、リスク価格の償還手数料を使用する。リスク見積は、インセンティブ付き開発者を含む専門家の調査によって決定される。収集した費用は、開発者が必要とする安全研究の資金に役立てることが推奨されています。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 22:31:53 GMT)
InsurTech innovation using natural language processing [0.0]
本稿では,非構造化テキストを構造解析や意思決定に適した構造化データに変換することに焦点を当てる。 NLPは単なる補足ツールではなく、現代のデータ駆動型保険分析の基礎的な要素であることを示す。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 23:10:59 GMT)
Impedance-Engineered Josephson Parametric Amplifier with Single-Step Lithography [0.0]
インピーダンス駆動ジョセフソンパラメトリック増幅器 (IEJPA) は単段リソグラフィープロセスで製造された。我々は5.3GHz中心の広帯域400MHzで18dBの量子制限増幅を観測した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 14:18:21 GMT)
Hybrid Autoregressive-Diffusion Model for Real-Time Streaming Sign Language Production [0.0]
本稿では,自己回帰モデルと拡散モデルを組み合わせて手話生成(SLP)モデルを生成するハイブリッドアプローチを提案する。細かな体の動きを捉えるため,異なるアーティストから細かな特徴を別々に抽出するマルチスケール・ポース表現モジュールを設計した。また、連立レベルの信頼スコアを利用してポーズ生成過程を動的にガイドする信頼意識型因果注意機構も導入する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 01:34:50 GMT)
HA-RDet: Hybrid Anchor Rotation Detector for Oriented Object Detection [0.0]
空中画像における物体の向き検出は、大きさや方向の異なるため、大きな課題となる。オブジェクト指向物体検出のためのアンカーベースおよびアンカーフリースキームの利点を組み合わせたハイブリッドアンカー回転検出器(HA-RDet)を提案する。 HA-RDetは、DOTA-v1の75.41 mAP、DIOR-Rの65.3 mAP、HRSC2016の90.2 mAPなど、競争力のある精度を実現している。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 08:58:43 GMT)
GreenCrossingAI: A Camera Trap/Computer Vision Pipeline for Environmental Science Research Groups [0.0]
カメラトラップは、動物行動、個体群動態、生息地利用、種多様性を非侵襲的で効率的な方法で監視し研究するために、野生生物研究者によって長い間使われてきた。フィールドからのデータ収集は、新しいツールや機能によって増加したが、データの開発、処理、管理の方法、特にML/AIツールの採用は、依然として困難なままである。本稿では,限られたリソースと計算能力を持つ小規模研究グループに適したML/AI機能を導入し,低リソースパイプラインによるカメラトラップデータの処理をオンプレミスで行うためのガイドを提供する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 22:02:55 GMT)
Feedback Connections in Quantum Reservoir Computing with Mid-Circuit Measurements [0.0]
フィードバック接続を統合する新しい量子貯水池計算方式について検討する。モデルが過去の入力を記憶できるように,連続処理中にフィードバック接続が効果的に動作可能であることを示す。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:19:25 GMT)
Excessive precision compromises accuracy even with unlimited resources due to the trade-off in quantum metrology [0.0]
隣り合う量子状態の区別の観点から、精度と精度を統一的に定義する。過度な精度を追求する場合,サンプリングの増加に伴い,実際に精度が低下する可能性があることを示す。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 07:17:13 GMT)
Enhancing NeuroEvolution-Based Game Testing: A Branch Coverage Approach for Scratch Programs [0.0]
本稿では,自動ゲームテストにおけるテスト効率を向上させるために,分岐カバレッジに基づくフィットネス機能を提案する。神経進化過程を導いて枝探索の最大化を図り、制御依存の枝を優先する枝適合機能を統合することでNEATESTを拡張した。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 22:36:47 GMT)
Divergence of Empirical Neural Tangent Kernel in Classification Problems [0.0]
分類問題では、完全連結ニューラルネットワーク(FCN)と残留ニューラルネットワーク(ResNet)は、ニューラルタンジェントカーネル(NTK)に基づくカーネルロジスティック回帰によって近似できない。ネットワーク幅が大きくなるにつれて、NTKはトレーニングサンプル上で常にNTKに均一に収束しないことを示す。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 21:59:44 GMT)
Deep learning lattice gauge theories [0.0]
ニューラルネットワーク量子状態を用いて格子ゲージ理論の基底状態を2+1$次元で正確に計算する。この結果から,ニューラルネットワーク量子状態は格子ゲージ理論の高精度な研究方法として有望であることが示唆された。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 21:27:19 GMT)
DS@GT at Touché: Large Language Models for Retrieval-Augmented Debate [0.0]
Retrieval-Augmented Debate and Evaluationの6つの主要な公開モデルを展開します。評価は、Quality、Quantity、Manner、Relationの4つの重要なメトリクスを測定することで行われる。 LLMは関連する議論を行う際にはよく機能するが、評価において一貫性のある応答では冗長である傾向にある。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 00:20:00 GMT)
Credit Card Fraud Detection Using RoFormer Model With Relative Distance Rotating Encoding [0.0]
不正検出は、金融システムが対処しなければならない最も重要な課題の1つだ。 Relative Distance Rotating (ReDRE)は、RoFormerモデル内の時系列データのキャラクタリゼーションを強化する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 20:02:02 GMT)
Counterflow of lattice polarons in harmonically confined optical lattices [0.0]
ボゾン浴と反発的に相互作用する高調波閉じ込め光学格子の移動不純物について検討した。我々は,移動不純物対の解析モデルを用いて,相関した逆流相の出現を明らかにした。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 02:26:56 GMT)
Correcting the LogQ Correction: Revisiting Sampled Softmax for Large-Scale Retrieval [0.0]
2-towerニューラルネットワークは、レコメンデータシステムにおいて、検索段階の一般的なアーキテクチャである。ウェブスケールの設定では、アイテムカタログはしばしば禁止的に大きく、完全なソフトマックスが実現できない。実用的で広く採用されているアプローチの1つは、現在のミニバッチのアイテムから負が引き出される、バッチ内陰性を使うことである。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:16:11 GMT)
Confidential Wrapped Ethereum [0.0]
提案では、アプリケーション層内で完全にラップされた(cWETH)秘密バージョンを作成することを提案している。このソリューションは、機密性を維持するためにElliptic Curve (EC) Twisted ElGamalベースのコミットメントスキームを組み合わせる。コミット、暗号化、復号化の正しい生成を強制するために、zk-SNARKが使用される。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 10:00:50 GMT)
Calibrated and Robust Foundation Models for Vision-Language and Medical Image Tasks Under Distribution Shift [0.0]
CLIPやSAMといったファンデーションモデルは、ローショットトランスファー学習を通じてコンピュータビジョンと医療イメージングを変革した。両課題に対処する統合フレームワークである textitStaRFM を提案する。 texttt+3.5%の精度と、19の視覚データセット上でのECEの28%低下のような一貫したパフォーマンスを示す。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 09:39:07 GMT)
Automated Multi-Class Crop Pathology Classification via Convolutional Neural Networks: A Deep Learning Approach for Real-Time Precision Agriculture [0.0]
本研究では,コンボリューショナルニューラルネットワーク(CNN)を用いた画像分類システムを提案する。このソリューションは、オープンソースでモバイル互換のプラットフォーム上にデプロイされ、リモートエリアの農家に対してリアルタイムの画像ベースの診断を可能にする。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 18:45:50 GMT)
Adversarial Activation Patching: A Framework for Detecting and Mitigating Emergent Deception in Safety-Aligned Transformers [0.0]
大規模言語モデル(LLM)は、安全のために整列し、しばしば突発的な騙し行動を示す。本稿では,新しい機械的解釈可能性フレームワークである逆アクティベーションパッチについて紹介する。のプロンプトからアクティベーションをソーシングすることで、脆弱性をシミュレートし、偽装率を定量化する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 21:29:49 GMT)
A Review of Reward Functions for Reinforcement Learning in the context of Autonomous Driving [0.0]
強化学習は自動運転にとって重要なアプローチである。報酬関数は、強化学習において、学習したスキル目標を確立し、エージェントを最適な政策へ導くために用いられる。自律運転は、目的と異なる優先度の度合いで部分的に矛盾する複雑な領域であるため、適切な報酬関数を開発することは、根本的な課題である。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 13:26:05 GMT)
A Framework for Predictive Directional Trading Based on Volatility and Causal Inference [0.0]
本研究では,金融市場における予測的リードラグ関係の同定と活用のための新しい枠組みを提案する。本稿では,高度な統計手法と機械学習モデルを組み合わせた統合的手法を提案する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 16:53:32 GMT)
A CLuP algorithm to practically achieve $\sim 0.76$ SK--model ground state free energy [0.0]
シェリントン・カークパトリック (SK) スピングラス基底自由エネルギーのアルゴリズムによる決定について検討する。 CLuP-SKモデルに付随するアルゴリズムの典型的成功を解析する。
論文参考訳（メタデータ） (Sat, 12 Jul 2025 10:58:50 GMT)