Pisces: An Auto-regressive Foundation Model for Image Understanding and Generation [81.9] 統一モデルを開発する上で重要な課題は、画像理解に必要な視覚的特徴と生成の相違にある。
本稿では,この課題に対処する自動回帰型マルチモーダル基盤モデルであるPiscesを紹介する。
微妙なデータキュレーション、事前学習、微調整と組み合わせることで、ピッセは画像理解と画像生成の両方において競合する性能を達成する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 20:42:24 GMT)
CompassJudger-2: Towards Generalist Judge Model via Verifiable Rewards [72.4] CompassJudger-2は、タスク駆動のマルチドメインデータキュレーション戦略によって制限を克服する新しいジェネラリストジャッジモデルである。
CompassJudger-2は、複数の判定と報奨ベンチマークで優れた結果を得る。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 01:34:24 GMT)
Detecting and Pruning Prominent but Detrimental Neurons in Large Language Models [68.6] 大規模言語モデル(LLM)は、しばしば特定のデータセットに特化した学習メカニズムを開発する。
本稿では,データセット固有のメカニズムに関連するニューロンの同定と解析により,一般化の促進を目的とした微調整手法を提案する。
本手法では,各ニューロンの高信頼度予測への影響を定量化するため,データセット固有の性能に不均等に寄与するニューロンを同定する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 08:10:10 GMT)
RadIR: A Scalable Framework for Multi-Grained Medical Image Retrieval via Radiology Report Mining [64.7] 本稿では,複数の粒度で画像の類似度を決定するために,高密度ラジオロジーレポートを利用した新しい手法を提案する。
我々は、胸部X線用MIMIC-IRとCTスキャン用CTRATE-IRの2つの総合的な医用画像検索データセットを構築した。
RadIR-CXR と Model-ChestCT という2つの検索システムを開発し,従来の画像画像検索と画像レポート検索に優れた性能を示す。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 04:07:11 GMT)
Harnessing Text-to-Image Diffusion Models for Point Cloud Self-Supervised Learning [61.0] 拡散モデルはテキスト・画像生成に広く用いられているが、2次元表現学習に有効であることが証明されている。
本稿では,3次元自己教師型学習のためのSDモデルを活用するフレームワークであるPointSDを提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 01:20:07 GMT)
Planted in Pretraining, Swayed by Finetuning: A Case Study on the Origins of Cognitive Biases in LLMs [51.0] 大型言語モデル(LLM)は認知バイアスを示す。
これらのバイアスはモデルによって異なり、命令チューニングによって増幅することができる。
これらのバイアスの違いが事前学習、微調整、あるいはランダムノイズに起因するかどうかは不明だ。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 10:00:59 GMT)
Towards Two-Stage Counterfactual Learning to Rank [50.5] ランク付けのためのカウンターファクトラーニングは、ユーザのインタラクションからランク付けポリシーを学ぶことを目的としている。
現実のアプリケーションでは、候補文書セットは数百万の順序で行われ、単一のステージのランキングポリシーを非現実的にしている。
本稿では,2段階間の相互作用を考慮した2段階CLTR推定器を提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 14:36:33 GMT)
Optimal High-probability Convergence of Nonlinear SGD under Heavy-tailed Noise via Symmetrization [50.5] 雑音対称性に基づく2つの新しい推定器を提案する。
よりシャープな分析と改善されたレートを提供します。
モーメントと対称雑音を仮定する作業と比較して、よりシャープな解析と改善率を提供する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 00:31:13 GMT)
Large Language Models as Neurolinguistic Subjects: Discrepancy between Performance and Competence [49.6] 本研究では,大言語モデル(LLM)の記号化(形式)および記号化(意味)に関する言語的理解について検討する。
ミニマルペアと診断プローブを組み合わせてモデル層間のアクティベーションパターンを解析する新しい手法を用いて,ニューロ言語学的アプローチを提案する。
その結果,(1)心理言語学的・神経言語学的手法では,言語能力と能力が異なっていること,(2)直接確率測定では言語能力が正確に評価されないこと,(3)指導のチューニングでは能力が大きく変化しないが,性能は向上しないことがわかった。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 22:46:18 GMT)
KodCode: A Diverse, Challenging, and Verifiable Synthetic Dataset for Coding [49.6] KodCodeは、高品質で検証可能なトレーニングデータを取得するという永続的な課題に対処する、合成データセットである。
自己検証手順によって体系的に検証される質問解決テスト三つ子を含む。
このパイプラインは大規模で堅牢で多様なコーディングデータセットを生成する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 02:08:21 GMT)
Feature Extraction and Steering for Enhanced Chain-of-Thought Reasoning in Language Models [48.4] 大規模言語モデル(LLM)は、Chain-of-Thought(CoT)技術を用いて推論と数学的問題を解く能力を示す。
この研究はDeepSeek-R1の深い思考パラダイムにインスパイアされ、外部データセットを使わずにLCMの推論能力を高めるためにステアリング技術を利用している。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 09:42:16 GMT)
Evaluation of Attribution Bias in Generator-Aware Retrieval-Augmented Large Language Models [47.7] 大規模言語モデルにおける著者情報に対する属性感度とバイアスを評価する。
文献に著者情報を追加することで, LLMの属性品質を3%から18%大きく変化させることができることを示す。
その結果,資料のメタデータがLCMの信頼度や回答の属性に影響を及ぼす可能性が示唆された。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 15:07:14 GMT)
Intelligent Orchestration of Distributed Large Foundation Model Inference at the Edge [46.1] Large Foundation Models (LFMs)は、次世代のEdge AIアプリケーションの新機能をアンロックすることを約束する。
現在の分割推論戦略では、ノード間でLPM層を分割するが、変動するワークロードに適応するようには設計されていない。
本稿では, LFM層を実行時可変変数に配置し, 分割する, 適応型分割推論オーケストレーションフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 22:37:25 GMT)
ProactiveBench: A Comprehensive Benchmark Evaluating Proactive Interactions in Video Large Language Models [41.4] ProactiveBenchは,プロアクティブインタラクションに係わるシステムの能力を評価するための,最初の包括的なベンチマークである。
モデル応答は様々なタイムスタンプで生成されるので,モデル応答の時間的ダイナミクスを考慮に入れた最初の指標であるPAUCを提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 15:11:50 GMT)
Banzhida: Advancing Large Language Models for Tibetan with Curated Data and Continual Pre-Training [40.9] バンジーダ(Banzhida)は、チベット語で生成するAIを進化させる多言語大言語モデルである。
現在までに最大のチベット事前訓練コーパスをキュレートし、様々な情報源からのデータを収集している。
我々は、新しい高品質のチベットベンチマークを作成し、それらを既存の公開ベンチマークで補完する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 08:54:05 GMT)
Making Images Real Again: A Comprehensive Survey on Deep Image Composition [34.1] 画像合成タスクは複数のサブタスクに分解できる。
オブジェクト配置は、前景の適切なスケール、位置、形状を見つけることを目的としています。
画像ブレンディングは、前景の照明統計を調整することを目的としている。
シャドージェネレーションは、フォアグラウンドのためのもっともらしいシャドーを生成することを目的としています。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 05:13:53 GMT)
Supposedly Equivalent Facts That Aren't? Entity Frequency in Pre-training Induces Asymmetry in LLMs [34.1] 非対称性が論理的に等価な事実の認識に存在し、それは対象と対象とに出現する実体の周波数の相違に起因する。
実験の結果,高頻度の被写体と低周波の被写体は,その論理的等価性にもかかわらず,逆の被写体よりもよく認識されていることが明らかとなった。
これらの知見は, 模擬モデル予測における事前学習データの影響を浮き彫りにした。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 19:55:27 GMT)
Performance Analysis of MDI-QKD in Thermal-Loss and Phase Noise Channels [32.9] 測定デバイスに依存しない量子鍵分布(MDI-QKD)は、検出器側の脆弱性を緩和することで量子暗号を強化する。
本研究では, 熱損失・位相ノイズチャネルにおけるMDI-QKD特性を, 脱分極・減圧チャネルとしてモデル化し, 熱・位相ノイズ効果を捉える。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 14:03:06 GMT)
Causal Discovery-Driven Change Point Detection in Time Series [32.4] 時系列における変化点検出は、時系列の確率分布が変化する瞬間を特定することを目的としている。
実践的な応用では、時系列の特定の構成要素にのみ興味を持ち、その分布の急激な変化を探求する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 23:53:10 GMT)
Scaling Laws for Optimal Data Mixtures [31.0] スケーリング法則を用いて、任意の対象領域に対して最適なデータ混合を決定するための体系的手法を提案する。
我々は,これらのスケーリング法則の普遍性を,その予測力を3つの異なる大規模設定で示すことによって検証する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 21:16:08 GMT)
Semi-Supervised Federated Learning via Dual Contrastive Learning and Soft Labeling for Intelligent Fault Diagnosis [30.6] 本稿では,半教師付きフェデレーション学習フレームワークSSFL-DCSLを提案する。
デュアルコントラストロスとソフトラベリングを統合して、データに対処し、分散クライアントのラベル不足に対処する。
最先端の手法で精度を1.15%から7.85%向上させることができる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 10:54:23 GMT)
SAGE: Segment-Aware Gloss-Free Encoding for Token-Efficient Sign Language Translation [29.8] 本稿では,連続映像を個別のサインインされた視覚トークンに変換するためのセグメント認識型視覚トークン化フレームワークを提案する。
これにより、以前の方法と比較して入力シーケンスの長さが最大50%減少し、メモリ使用量が最大2.67倍になる。
提案手法はPHOENIX14Tベンチマークにおける最先端手法の性能を上回っている。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 12:18:34 GMT)
Continual Reinforcement Learning by Planning with Online World Models [29.7] 連続強化学習(CRL)は、エージェントが連続的に提示される複数のタスクを解決するために、試行錯誤によって無限に進化する必要のある自然主義的な環境を指す。
CRLの最大の障害の1つは、破壊的忘れという新しいタスクを学ぶ際に、エージェントが過去のタスクをどう解決するかを忘れてしまうことである。
オンライン世界モデルを用いて計画することでこの問題に対処することを提案する。具体的には、Follow-The-Leaderの浅瀬モデルをオンラインで学習し、世界ダイナミクスを捉え、モデル予測制御を用いて、報酬関数によって指定されたタスクのセットを解決することを計画している。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 07:52:31 GMT)
Thinking Beyond Tokens: From Brain-Inspired Intelligence to Cognitive Foundations for Artificial General Intelligence and its Societal Impact [27.7] 本稿では,人工知能,認知神経科学,心理学,生成モデル,エージェントベースシステムの学際的合成について述べる。
我々は汎用知能のアーキテクチャと認知の基礎を分析し、モジュラー推論、永続記憶、マルチエージェント協調の役割を強調した。
我々は、人工知能への道の鍵となる科学的、技術的、倫理的課題を特定します。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 02:50:17 GMT)
On the Fragility of Multimodal Perception to Temporal Misalignment in Autonomous Driving [26.8] DejaVuは、ネットワークによって引き起こされる遅延を利用して、センサストリーム間の微妙な時間的ミスアライメントを生成する新しい攻撃である。
シングルフレームのLiDAR遅延では、攻撃者は車検出のmAPを最大88.5%削減し、3フレームのカメラ遅延、車滴の多重物体追跡精度(MOTA)を73%削減できる。
本研究では,従来の知覚モデルと協調して時間的整合性を監視するパッチであるAIONを提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 00:44:26 GMT)
MAPoRL: Multi-Agent Post-Co-Training for Collaborative Large Language Models with Reinforcement Learning [26.7] 新しいポストトレーニングパラダイムMAPoRL(強化学習を用いた協調LLMのためのマルチエージェントポストトレーニング)を導入する。
MAPoRLでは、複数のLLMが独立して独自の応答を生成し、最終回答を協調的に改善するためのマルチターンディスカッションを行う。
MAPoRL検証器は、回答の正しさを検証するスコアを割り当てることで、回答と議論の両方を評価する。
スコアはコトレーニング報酬として機能し、マルチエージェントRLによって最大化される。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 20:13:27 GMT)
Emergence of Hierarchical Emotion Organization in Large Language Models [25.8] 大規模言語モデル(LLM)は自然に人間の心理モデルと一致する階層的な感情木を形成する。
また,社会経済的な人格における感情認識の体系的バイアスを明らかにする。
以上の結果から,より優れたモデル評価の開発に認知的基礎理論を用いることの可能性が示唆された。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 15:12:46 GMT)
Self-Supervised Monocular 4D Scene Reconstruction for Egocentric Videos [25.4] EgoMono4Dは、Egocentric Monocular 4D再構成に必要な複数の変数を統一する新しいモデルである。
全てのベースラインと比較して高密度の点雲列再構成において優れた性能を発揮する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 07:00:25 GMT)
MCA-LLaVA: Manhattan Causal Attention for Reducing Hallucination in Large Vision-Language Models [25.4] 幻覚はLVLM(Large Vision Language Models)において重要な課題となる
重要な要因として特定されたマルチモーダル特徴の不一致。
MCA-LLaVAは位置モデリングのための画像トークンの1次元配列順序と2次元空間位置を統合する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 08:09:35 GMT)
FlexEdit: Marrying Free-Shape Masks to VLLM for Flexible Image Editing [25.2] 本稿では,フレキシブル編集のための自由形状マスクと言語命令の両方を活用する,エンドツーエンドの画像編集手法であるFlexEditを提案する。
LLMに基づく画像編集において,本手法は最先端(SOTA)性能を実現し,簡単なプロンプト技術はその有効性で際立っている。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 14:38:31 GMT)
Fast3D: Accelerating 3D Multi-modal Large Language Models for Efficient 3D Scene Understanding [25.0] 我々は,3D MLLM のためのプラグ&プレイ型ビジュアルトークン解析フレームワークである Fast3D を提案する。
グローバルアテンション予測(GAP)は,目標モデルのグローバルアテンション分布を予測し,トークンの効果的な重要度推定を可能にする。
SAPは、注意に基づく複雑性評価を通じて動的トークン予算を導入し、レイヤーワイドプルーニング比率を自動的に調整する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 16:29:02 GMT)
OPENXRD: A Comprehensive Benchmark and Enhancement Framework for LLM/MLLM XRD Question Answering [24.4] OPENXRDは、結晶学的質問応答用に設計されたオープンブックパイプラインである。
テキストプロンプトとGPT-4.5で生成された簡潔なサポートコンテンツを統合する。
GPT-4.5生成サマリーを用いたモデルでは,精度が大幅に向上した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 06:25:22 GMT)
MPG-SAM 2: Adapting SAM 2 with Mask Priors and Global Context for Referring Video Object Segmentation [21.4] ビデオオブジェクトセグメンテーション(RVOS)の参照は、ビデオ内のオブジェクトをテキスト記述に従ってセグメントすることを目的としている。
Segment Anything Model 2 (SAM2)は、様々なビデオセグメンテーションタスクにおいて大きな効果を示している。
本稿では,これらの課題に対処する新しいRVOSフレームワークMPG-SAM 2を提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 16:24:41 GMT)
Balancing Semantic Relevance and Engagement in Related Video Recommendations [21.3] 関連ビデオレコメンデーションでは、協調フィルタリング(CF)をコエンゲージメント信号で駆動するのが一般的である。
本稿では,意味的関連性とユーザエンゲージメントのバランスをとるために,新しい多目的検索フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 21:04:25 GMT)
Pinning "Reflection" on the Agenda: Investigating Reflection in Human-LLM Co-Creation for Creative Coding [20.6] 本研究は,創造的符号化における位置的,瞬間的,モーメント的反射を2つのプロンプト戦略の下で検討する。
混合法の結果は3つの異なる反射型を示し、T2はより頻度が高く、戦略的で、生成的反射を促進することを示した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 00:54:14 GMT)
Sharp Trade-Offs in High-Dimensional Inference via 2-Level SLOPE [20.6] 2レベルSLOPEは、LASSOと一般SLOPEの両方に対して、堅牢でスケーラブルな代替手段を提供する。
以上の結果から,2レベルSLOPEはLASSOと一般SLOPEの双方に対して,堅牢でスケーラブルな代替手段である可能性が示唆された。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 01:57:10 GMT)
Bongard in Wonderland: Visual Puzzles that Still Make AI Go Mad? [20.6] VLM(Vision-Language Models)の評価を行った。
VLMは時に差別的な概念を識別することに成功したが、しばしば失敗する。
人間の視覚的推論能力とマシン認知の間には、大きなギャップが残っています。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 15:31:04 GMT)
TabDPT: Scaling Tabular Foundation Models on Real Data [20.0] ICLに基づく検索と自己教師付き学習を組み合わせた基礎モデルの学習手法を提案する。
事前学習フェーズに実際のデータを組み込むことで、学習が大幅に速くなり、見当たらないデータへの一般化が向上することを示す。
得られたモデルであるTabDPTは回帰 (CTR23) と分類 (CC18) のベンチマークで最高の性能を達成する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 18:07:37 GMT)
Many-for-Many: Unify the Training of Multiple Video and Image Generation and Manipulation Tasks [19.6] 拡散モデルは、多くの視覚生成および操作タスクにおいて印象的な性能を示している。
我々は、様々な視覚生成と操作タスクから利用可能なトレーニングデータを活用する統一されたフレームワーク、すなわち、many-for-manyを導入する。
我々の共同学習は、映像生成性能を改善した統一的な視覚生成と操作モデルをもたらす。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 09:00:34 GMT)
SnapMoGen: Human Motion Generation from Expressive Texts [19.1] SnapMoGenは、高精度で表現力のあるテキストアノテーションと組み合わせた高品質なモーションキャプチャーデータを備えた、新しいテキストモーションデータセットである。
データセットは、合計44時間の20Kのモーションクリップと、記述毎の48ワードの平均122Kの詳細なテキスト記述で構成されている。
私たちのモデルであるMoMask++は、モーションをマルチスケールのトークンシーケンスに変換し、トークンのキャパシティをよりよく活用します。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 02:54:59 GMT)
Digital Twin-Assisted Explainable AI for Robust Beam Prediction in mmWave MIMO Systems [18.5] 本稿では,mmWaveシステムのための頑健で説明可能な深層学習(DL)ベースのビームアライメントエンジンを提案する。
このフレームワークは、現実世界のデータ要求を70%減らし、ビームトレーニングのオーバーヘッドを62%減らし、異常検出を最大8.5倍改善する。
実験結果から,提案フレームワークは実世界のデータ要求を70%削減し,ビームトレーニングのオーバーヘッドを62%削減し,異常検出を最大8.5倍改善した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 09:56:20 GMT)
Diffusion Dataset Condensation: Training Your Diffusion Model Faster with Less Data [18.2] 拡散データセットの凝縮を新しい問題設定として研究する。
目標は、元のデータセットよりもはるかに少ないサンプルを持つ"合成"サブデータセットを構築することだ。
我々のフレームワークは、高い視覚的品質を維持しながら、劇的に少ないデータで非常に高速な拡散モデルトレーニングを可能にします。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 09:02:47 GMT)
Optimizing Basis Function Selection in Constructive Wavelet Neural Networks and Its Applications [18.0] 本研究では、初期ベースと列車機能を選択する構築型ウェーブレットニューラルネットワーク(WNN)を提案する。
未知の非線形関数の周波数を分析し、その一次周波数成分に基づいて適切な初期ウェーブレットを選択する。
これにより、周波数推定器とウェーブレット基底増大機構から構成され、高エネルギーベースを優先する新しい構成的枠組みがもたらされる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 09:09:26 GMT)
DATE-LM: Benchmarking Data Attribution Evaluation for Large Language Models [17.7] DATE-LMは、言語モデルにおけるデータ属性手法を評価するためのベンチマークである。
データ選択のトレーニング、毒性/バイアスフィルタリング、事実帰属という3つの重要なタスクを通じて、属性の品質を測定する。
以上の結果から,全てのタスクにおいて単一手法が支配的ではなく,データ属性手法はより単純なベースラインとのトレードオフを持ち,メソッド性能はタスク固有の評価設計に敏感であることがわかった。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 23:29:56 GMT)
S2SRec2: Set-to-Set Recommendation for Basket Completion with Recipe [17.5] 食料品の電子商取引では、顧客は食事の好みによってガイドされる食材バスケットを作るが、完全な食事を作るための専門知識は欠如している。
本稿では,S2SRec2について紹介する。S2SRec2は,Set Transformerをベースとし,マルチタスク学習パラダイムで訓練された,セットツーセットの成分推薦フレームワークである。
大規模なレシピデータセットと定性的分析の実験により、S2SRec2は単一ターゲットのベースラインを著しく上回ることが示された。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 01:09:30 GMT)
Logits are All We Need to Adapt Closed Models [15.2] アプリケーション固有のコンテンツ生成に向けて,ブラックボックス大言語モデルを操るトークンレベルの確率再重み付けフレームワークを提案する。
このようなアクセスが利用可能であれば、迅速なエンジニアリングを超えて、より強力な適応技術を可能にするだろう、と私たちは主張する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 07:19:28 GMT)
WaveNet-SF: A Hybrid Network for Retinal Disease Detection Based on Wavelet Transform in the Spatial-Frequency Domain [15.2] 本稿では,空間領域と周波数領域の学習を統合することで網膜疾患の検出を向上させる新しいフレームワークWaveNet-SFを提案する。
このフレームワークはウェーブレット変換を利用して、OCT画像を低周波成分と高周波成分に分解する。
提案手法は,OCT-C8データセットとOCT 2017データセットでそれぞれ97.82%,99.58%の最先端(SOTA)分類精度を実現する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 14:07:20 GMT)
RAMA: Retrieval-Augmented Multi-Agent Framework for Misinformation Detection in Multimodal Fact-Checking [15.2] RAMAは、マルチメディアの誤情報を検証するために設計された新しい検索拡張マルチエージェントフレームワークである。
RAMAには,(1)マルチモーダルクレームを正確なWeb検索クエリに変換する戦略的クエリの定式化,(2)多様な権威ソースからの相互検証証拠の集約,(3)マルチエージェントアンサンブルアーキテクチャの3つの革新が含まれている。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 07:46:51 GMT)
DrugMCTS: a drug repurposing framework combining multi-agent, RAG and Monte Carlo Tree Search [11.6] DrugMCTSは、RAG、マルチエージェントコラボレーション、薬物再資源のためのMonte Carlo Tree Searchを統合する新しいフレームワークである。
DrugMCTSはQwen2.5-7B-InstructでDeepseek-R1を20%以上上回る性能を発揮する。
本結果は,構造化推論,エージェントによる協調,フィードバックによる探索機構の重要性を強調した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 08:20:44 GMT)
THYME: Temporal Hierarchical-Cyclic Interactivity Modeling for Video Scene Graphs in Aerial Footage [11.6] 時間的階層的周期的シーングラフ(THYME)アプローチを導入し,階層的特徴集約と周期的時間的改善を統合して限界に対処する。
THYMEは、マルチスケールの空間コンテキストを効果的にモデル化し、フレーム間の時間的一貫性を強制し、より正確で一貫性のあるシーングラフを生成する。
さらに,既存のデータセットの制約を克服する5種類の対話性を備えた新しい空中ビデオデータセットであるAeroEye-v1.0を提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 08:43:38 GMT)
Mind the Gap: Preserving and Compensating for the Modality Gap in CLIP-Based Continual Learning [11.5] コントラスト言語-画像事前訓練モデル(CLIP)は、様々な下流タスクに強い能力を示す。
視覚言語事前学習モデルの微調整におけるモダリティギャップの変化を分析する。
クラス増分学習におけるCLIPの性能を向上する単純なMG-CLIPを提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 02:28:42 GMT)
Single Word Change is All You Need: Using LLMs to Create Synthetic Training Examples for Text Classifiers [11.3] 既存の手法によって生成された敵例のかなりの部分は、1つの単語だけを変える。
このシングルワード摂動脆弱性は、分類器の重大な弱点である。
本研究では,単一単語の摂動脆弱性を利用したSP-Attackを提案する。
また、学習にデータ拡張を適用してrhoを改善することを目的としたSP-Defenseを提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 20:35:26 GMT)
If open source is to win, it must go public [11.1] オープンソースプロジェクトは、透過的で広く使用可能な機械学習モデルとシステムを作成するという、信じられないほどの進歩を遂げています。
しかし、オープンソースだけでは、AIへのアクセスを完全に民主化する上で、課題に直面します。
この記事では、オープンソースAIはパブリックAIによって補完されなければならない、と論じる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 14:16:28 GMT)
The BdryMatérn GP: Reliable incorporation of boundary information on irregular domains for Gaussian process modeling [11.0] 本稿では,不規則連結領域上でディリクレ,ノイマン,ロビンの境界を確実に統合できる新しいBdryMat'ern GPモデリングフレームワークを提案する。
また,有限要素モデリングと厳密な誤差解析を用いたBdryMat'ernカーネルの効率的な近似手法を提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 07:53:49 GMT)
Stereo-based 3D Anomaly Object Detection for Autonomous Driving: A New Dataset and Baseline [10.9] 3D検出技術は自動運転の分野で広く利用されている。
道路上に現れる稀な異常カテゴリーでは、3D検出モデルはしばしば誤検出または異常検出に失敗する。
本稿では,ステレオによる3次元異常物体検出(S3AD)アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 09:10:29 GMT)
Avoiding Leakage Poisoning: Concept Interventions Under Distribution Shifts [10.8] 本稿では,概念ベースモデル(CM)がアウト・オブ・ディストリビューション(OOD)の入力にどのように反応するかを検討する。
我々はMixCEMという新しいCMを紹介した。これは、この情報が流通中である場合に限って、その概念から漏れた漏洩情報を動的に活用することを学ぶ。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 17:34:54 GMT)
Capsule Networks Do Not Need to Model Everything [10.8] 本稿では,構文樹状構造のエントロピーを最小化するREM(Routing Entropy Minimization)を提案する。
REMはプルーニング機構を通じてモデルパラメータ分布を低エントロピー構成に駆動する。
これによりカプセルはより安定で簡潔な表現を、より少ないパラメータと無視可能な性能損失で学習することができる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 15:35:47 GMT)
Voice Conversion for Lombard Speaking Style with Implicit and Explicit Acoustic Feature Conditioning [10.5] Lombard 話し方におけるテキスト音声合成システム(TTS)は、音声の全体的な可聴性を改善し、聴覚障害や雑音に有効である。
これらのモデルのトレーニングには大量のデータが必要である。
音声変換 (VC) は, ターゲット話者の発話スタイルにおける記録データがない場合に, TTS システムの訓練に有用な拡張手法であることが示されている。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 14:57:04 GMT)
The NaijaVoices Dataset: Cultivating Large-Scale, High-Quality, Culturally-Rich Speech Data for African Languages [10.2] 5000人以上の話者を持つ1,800時間音声テキストデータセットであるNaijaVoicesデータセットを紹介する。
我々は,我々のユニークなデータ収集手法を概説し,その音響的多様性を分析し,微調整実験を通じてその影響を実証する。
これらの結果から,ナイジャヴォイセスがアフリカ語における多言語音声処理を進展させる可能性が示唆された。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 04:42:21 GMT)
Consistency in Language Models: Current Landscape, Challenges, and Future Directions [10.2] State-of-the-art Language Model (LM) はタスクやドメイン固有のアプリケーション間で信頼性の高い一貫性を維持するのに苦労する。
我々の発見は、一貫性を確保するための学際的アプローチを計測し、相互に比較するための品質ベンチマークが緊急に必要であることを示している。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 01:20:26 GMT)
Learning from M-Tuple Dominant Positive and Unlabeled Data [9.6] 本稿では,実世界のアプリケーションシナリオに適合する汎用学習フレームワークであるemphMDPUを提案する。
経験的リスク最小化 (ERM) 法に基づいて, リスク一貫性を満足する未バイアスリスク推定器を導出する。
トレーニング中に必然的に過適合する問題を緩和するため、リスク補正手法を導入し、修正されたリスク推定器の開発に繋がる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 08:39:33 GMT)
Fair CCA for Fair Representation Learning: An ADNI Study [9.5] フェア表現学習のための新しいフェアカノニカル相関解析(CCA)手法を提案する。
我々はアルツハイマー病神経画像イニシアチブ(ADNI)の合成データと実世界のデータについて検証する。
我々の研究は、偏見のない分析が不可欠である神経画像研究において、公正な機械学習を可能にする。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 19:36:10 GMT)
Colorectal Cancer Tumor Grade Segmentation in Digital Histopathology Images: From Giga to Mini Challenge [9.5] 大腸癌(CRC)は、世界で3番目に診断されたがんであり、がん関連死亡の原因としては2番目に多い。
ICIP Grand Challenge on Colorectal Cancer tumor Grading を組織した。
データセットは、5つの組織クラスに対して、専門家のピクセルレベルのアノテーションを備えた103枚の全スライド画像で構成されている。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 07:18:54 GMT)
CoVAE: Consistency Training of Variational Autoencoders [9.4] 本稿では,一貫性モデルからVAEアーキテクチャをトレーニングするための手法を取り入れた,新しい単一ステージ生成自動符号化フレームワークを提案する。
我々は,CoVAEが学習前の知識を使わずに,高品質なサンプルを1段階ないし数段階で生成できることを実証した。
提案手法は,自動エンコーディングと拡散型生成モデルのための統一的なフレームワークを提供し,一段階の高速自動エンコーディングのための実行可能な経路を提供する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 01:32:08 GMT)
Towards Open-World Generation of Stereo Images and Unsupervised Matching [9.3] GenStereoはステレオ画像生成と教師なしステレオマッチングタスクの両方で最先端のパフォーマンスを達成する。
プロジェクトページはhttps://qjizhi.github.io/genstereo.comで公開されている。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 03:07:24 GMT)
An In-depth Evaluation of Large Language Models in Sentence Simplification with Error-based Human Assessment [9.2] 本研究は, 評価の信頼性を確保しつつ, LLMの性能に関する詳細な知見を提供する。
我々は、GPT-4、Qwen2.5-72B、Llama-3.2-3Bを含む、クローズドソースとオープンソースの両方のLLMを選択する。
その結果, LLM は従来と比べ, 誤った単純化出力が少ないことがわかった。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 08:30:39 GMT)
Watermarking Degrades Alignment in Language Models: Analysis and Mitigation [8.9] 本稿では,Gumbel と KGW の2つの一般的な透かし手法が真理性,安全性,有用性にどのように影響するかを体系的に分析する。
本稿では,外部報酬モデルを用いてアライメントを復元する推論時間サンプリング手法を提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 16:50:20 GMT)
Unified Linear Parametric Map Modeling and Perception-aware Trajectory Planning for Mobile Robotics [8.8] 本稿では,高次元空間にデータをマッピングする軽量な線形パラメトリックマップを提案する。
UAVでは,Euclidean Signed Distance Field (ESDF) マップを用いた。
UGVでは、モデルは地形を特徴づけ、クローズドフォーム勾配を提供し、オンラインプランニングによって大きな穴を回避できる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 16:39:19 GMT)
AGFS-Tractometry: A Novel Atlas-Guided Fine-Scale Tractometry Approach for Enhanced Along-Tract Group Statistical Comparison Using Diffusion MRI Tractography [8.8] 拡散MRI(dMRI)は、現在、脳の白質(WM)をin vivoでマッピングする唯一の方法である。
トラクトメトリー(Tractometry)は、繊維路に沿った形態と微細構造を調べるために、沿線プロファイリングのための高度なトラクトグラフィー解析技術である。
本稿では,Atlas-Guided fine-scale tractometry,すなわちAGFS-Tractometryを提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 15:48:02 GMT)
LLM Agents Are the Antidote to Walled Gardens [8.7] インターネットのコアインフラストラクチャはオープンで普遍的に設計されているが、今日のアプリケーション層はクローズドでプロプライエタリなプラットフォームによって支配されている。
LLMをベースとしたエージェントは、この現状を根本的に破壊する。
2つのデジタルサービスがAIベースのアダプタを使ってデータをシームレスに交換する機能です。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 15:26:07 GMT)
Butter: Frequency Consistency and Hierarchical Fusion for Autonomous Driving Object Detection [8.4] 階層的特徴表現はコンピュータビジョン、特に自律運転の物体検出において重要な役割を果たす。
YOLOやDETRといった既存のアーキテクチャは、さまざまなスケールで機能の一貫性を維持するのに苦労している。
検出堅牢性を改善するために階層的特徴表現を強化するために設計された,新しいオブジェクト検出フレームワークであるButterを提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 13:31:01 GMT)
AdRo-FL: Informed and Secure Client Selection for Federated Learning in the Presence of Adversarial Aggregator [8.2] Federated Learning (FL)は、クライアントのデータを公開することなく、協調学習を可能にする。
最近の研究は、敵アグリゲータがクライアントの選択を操作してバイパス保護を行う重大な脆弱性を示している。
本稿では,AdRo-FL(Adversarial Robust Federated Learning)を提案する。
AdRo-FLは、安全でないベースラインに比べて、最大で1.85タイム=高速なタイム・トゥ・精度、最大で1.06タイム=高い最終精度を実現している。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 06:28:00 GMT)
XiChen: An observation-scalable fully AI-driven global weather forecasting system with 4D variational knowledge [7.9] XiChenは、観測可能な完全なAI駆動のグローバル気象予報システムである。
XiChenのパイプライン全体(データ同化(DA)から中距離予測まで)は、わずか17秒で実現できる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 08:46:58 GMT)
Prune 'n Predict: Optimizing LLM Decision-making with Conformal Prediction [7.8] 不正確なアウトプットは、医療や金融といった高リスク領域に重大なリスクをもたらす。
そこで本研究では,可能な選択肢を予測セットに限定することで,質問のEmphconformal revision of question (CROQ)を提案する。
また,CP-OPTを提案する。CP-OPTは,カバー範囲を維持しつつ,設定サイズを最小化するスコアを学習するための最適化フレームワークである。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 18:07:42 GMT)
An Epistemic and Aleatoric Decomposition of Arbitrariness to Constrain the Set of Good Models [7.6] 最近の研究では、機械学習(ML)モデルがトレーニング手順の微妙な変更に対して非常に敏感であることが示されている。
安定性は, てんかん成分と動脈成分に分解され, 予測の一貫性と信頼性を捉える。
そこで本研究では,既存の精度と公平性の基準と合わせて,てんかんおよび失読の基準を含むモデル選択手法を提案し,良質なモデルの集合を絞り込むことに成功したことを示す。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 07:10:35 GMT)
CLIProv: A Contrastive Log-to-Intelligence Multimodal Approach for Threat Detection and Provenance Analysis [6.7] 本稿では,ホストシステムにおける脅威行動を検出する新しいアプローチであるCLIProvを紹介する。
脅威インテリジェンスに攻撃パターン情報を活用することで、CLIProvはTTPを特定し、完全かつ簡潔な攻撃シナリオを生成する。
最先端の手法と比較して、CLIProvは精度が高く、検出効率が大幅に向上している。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 04:20:00 GMT)
Ambiguity-Aware and High-Order Relation Learning for Multi-Grained Image-Text Matching [6.6] 本稿では,これらの問題に対処するためのAmbiguity-Aware and High-order Relation Learning framework (AAHR)を提案する。
このフレームワークはグローバルかつ局所的な特徴抽出機構と適応集約ネットワークを導入し、完全な意味理解能力を大幅に強化する。
実験の結果、AAHRはFlickr30K、MSCOCO、ECCV Captionデータセットの既存の最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 11:30:32 GMT)
Impute With Confidence: A Framework for Uncertainty Aware Multivariate Time Series Imputation [6.6] 欠落した値を持つ時系列データは、多くのドメインで一般的である。
既存の手法のほとんどは、モデルの不確実性を見落としているか、それを見積もるメカニズムが欠如している。
本稿では,不確実性を定量化し,有効活用する汎用フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 17:11:00 GMT)
Bounding the Worst-class Error: A Boosting Approach [6.2] 最悪のクラスエラーは多くのアプリケーションで重要である。
本稿では,全てのクラスの平均誤差率ではなく,最悪のクラスエラー率の問題に取り組む。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 00:13:38 GMT)
A Study of Value-Aware Eigenoptions [6.1] モデルレス強化学習において,固有オプションが信用割当を促進できるかどうかを検討する。
事前特定された固有オプションは、探索だけでなく、クレジットの割り当てにも役立ち、オンライン発見はエージェントの経験を過度にバイアスし、学習を妨げる可能性がある。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 03:29:59 GMT)
On Information Geometry and Iterative Optimization in Model Compression: Operator Factorization [6.0] 我々は、多くのモデル圧縮手法が、この射影に対する情報分岐を暗黙的に近似するものとして理解することができると論じる。
ソフトランク制約を受けるニューラルネットワークのトレーニングにおける反復特異値しきい値の収束性を証明する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 23:39:14 GMT)
Lower Bounds for Chain-of-Thought Reasoning in Hard-Attention Transformers [5.5] 整合推論とスクラッチパッドは、変換器の計算能力を高める重要なツールとして登場した。
本研究では,異なるアルゴリズム問題におけるチェーン・オブ・シント・ステップの数に対する体系的下界の研究を開始する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 18:49:06 GMT)
Controllable Patching for Compute-Adaptive Surrogate Modeling of Partial Differential Equations [5.2] 本稿では,パッチベースモデルにおける動的パッチサイズ制御の推論を可能にする2つの軽量モジュールを提案する。
私たちの知る限り、これはパッチベースのPDEサロゲートにおいて、推論時パッチサイズのチューニングを可能にする最初のフレームワークです。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 12:16:04 GMT)
Bayesian Theory of Consciousness as Exchangeable Emotion-Cognition Inference [5.2] 本稿では,意識が周期的かつ感情的に固定された推論プロセスとして現れる統一的な枠組みを提案する。
感情を低次元構造的先行として定式化し,認知を特異性確認更新として定式化する。
この感情認知サイクルは、感情的に重み付けされた先行と文脈に敏感な認知的評価を一致させることによって、関節の不確実性を最小化する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 20:50:27 GMT)
Instantiation-based Formalization of Logical Reasoning Tasks using Language Models and Logical Solvers [4.9] 本稿では,SSV(Semantic Self-Verification)を導入し,自然言語から解法の形式言語への推論問題を正確に定式化する手法を提案する。
SSVは一貫性に基づくアプローチを用いて、モデルによって生成され、解決者によって検証される具体的なインスタンス化を用いて、問題の強力な抽象的な形式化を生成する。
このような*ほぼ確実な推論*は、多くの場合、手動検証の必要性を減らすための新しいアプローチとして提案され、より信頼性が高く自律的なAI推論システムに近づきます。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 18:39:50 GMT)
ViT-ProtoNet for Few-Shot Image Classification: A Multi-Benchmark Evaluation [4.9] 本稿では,VT-SmallバックボーンをPrototypeal Networkフレームワークに統合したViT-ProtoNetを紹介する。
この結果から,ViT-ProtoNetを,数発の分類のための強力で柔軟なアプローチとして確立した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 14:19:04 GMT)
Domain Adaptation and Multi-view Attention for Learnable Landmark Tracking with Sparse Data [4.9] 本稿では,検出と記述によるランドマーク追跡のための新しい定式化について述べる。
我々は,次世代宇宙船のフライトプロセッサ上でのリアルタイム実行のために設計された,軽量で計算効率のよいニューラルネットワークアーキテクチャを利用する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 23:00:52 GMT)
Hide-and-Shill: A Reinforcement Learning Framework for Market Manipulation Detection in Symphony-a Decentralized Multi-Agent System [4.8] 分散金融(DeFi)は、新たな無許可金融革新の時代をもたらしたが、前例のない市場操作につながった。
本稿では,マニピュレータと検出器間の相互作用を動的対向ゲームとしてモデル化し,分散操作検出のためのマルチエージェント強化学習フレームワークを提案する。
このフレームワークは、遅延トークン価格反応を金融指標として不審なパターンを特定する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 07:55:40 GMT)
EchoMimicV2: Towards Striking, Simplified, and Semi-Body Human Animation [4.8] 本研究では, 半体細部, 顔の表情, ジェスチャーの表現性を向上し, コンディションの冗長性を低減するため, 半体アニメーション手法であるEchoMimicV2を提案する。
特定のフェーズにおけるアニメーションの動作、ディテール、低レベルの品質をガイドするために、フェーズ固有のDenoising Lossを設計する。
大規模な実験と分析により、EchoMimicV2は定量評価と定性評価の両方において既存の手法を超越していることが示された。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 10:02:14 GMT)
Fast Estimations of Hitting Time of Elitist Evolutionary Algorithms from Fitness Levels [4.6] フィットネスレベル法は、レベルベースフィットネス関数上でのエリート的進化的アルゴリズムの平均打点時間を推定するために用いられる。
この制限に対処するために、新しいサブセットレベルメソッドが導入された。
エリートアルゴリズムの平均打点時間に対する下界を計算するために, 明示表現を提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 20:59:57 GMT)
OpenCAMS: An Open-Source Connected and Automated Mobility Co-Simulation Platform for Advanced Transportation Research [4.6] OpenCAMSはオープンソースで、同期化され、共同シミュレーションフレームワークである。
SUMO、CARLA、OMNeT++の3つの最高のクラスシミュレーションツールを密に結合している。
OpenCAMSは交通安全、モビリティ、サイバーセキュリティに関する高度な研究を支援するように設計されている。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 08:10:37 GMT)
Towards Pareto Optimal Throughput in Small Language Model Serving [4.5] SLM(Small Language Models)は、リソース制約のあるユーザに対して、新たな機会を提供する。
本研究では,SLM推論を性能およびエネルギーレベルで評価するための一連の実験について述べる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 09:55:44 GMT)
CASCADE Your Datasets for Cross-Mode Knowledge Retrieval of Language Models [4.4] クロスモードな知識検索(クロスモードな知識検索)とは、あるフォーマットで学習した知識を別の形式で検索する能力である。
複数のデータソースでトレーニングされたモデルは、元のトレーニングモードとは異なるフォーマットで知識を取得する際に、大幅に精度を低下させることを示した。
そこで我々はCASCADEを提案する。CASCADEは、列の長さと計算損失の異なるカスケードデータセットを使用する新しい事前学習アルゴリズムである。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 08:08:38 GMT)
On Supernet Transfer Learning for Effective Task Adaptation [4.2] トランスファーラーニングは、より大規模で事前訓練されたモデルの台頭に対する実用的な代替手段である。
重みとアーキテクチャの両方をパラメータ化するスーパーネット転送学習を導入し、新しいタスクに効率よくファインチューンする。
我々は、超ネット転送学習が最適モデルの発見を劇的に高速化するだけでなく、NASをゼロから実行するよりも優れたモデルを見つけることを実証した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 22:57:05 GMT)
A Generalization Theory for Zero-Shot Prediction [4.2] ゼロショット予測という,このアプローチをよりよく理解するための理論的枠組みを提案する。
ゼロショット予測が目指す目標量と,その一般化能力を実現する重要な条件付き独立関係を同定する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 03:37:57 GMT)
A Random Matrix Theory Perspective on the Learning Dynamics of Multi-head Latent Attention [3.8] 本研究では,マルチヘッド潜時注意がプレトレーニング中の変圧器の内部能力に与える影響について検討する。
Marchenko-Pastur(MP)診断の軽量なスイートを用いて、トレーニング中に$W_QW_Ktop$ gram行列のスペクトルを分析する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 20:31:07 GMT)
DAA*: Deep Angular A Star for Image-based Path Planning [3.7] 提案した経路角自由度(PAF)をA*に組み込むことにより,適応経路の滑らか性を通じて経路類似性を改善することによって,DAA*(Deep angular A*)と呼ばれる新しい学習手法を提案する。
我々は,予測経路と参照経路との経路類似性において,神経性A*に対するDAA*の顕著な改善を示す。
経路損失と経路確率マップ損失を併用したパスフィンディングを共同学習する場合、DAA*は最先端のTransPathを6.7% SPR、6.5% PSIM、3.7% ASIMで大幅に上回っている。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 14:46:42 GMT)
POIFormer: A Transformer-Based Framework for Accurate and Scalable Point-of-Interest Attribution [3.7] textsfPOIFormerは、正確で効率的なPOI属性のためのトランスフォーマーベースの新しいフレームワークである。
textsfPOIFormerは、大規模でノイズの多いモビリティデータセットにおいて、正確で効率的な属性を可能にする。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 04:37:52 GMT)
Position Paper: Programming Language Techniques for Bridging LLM Code Generation Semantic Gaps [3.6] 本稿では,大規模言語モデルにおける意味的ギャップを埋めるのに,プログラミング手法の原則的統合が不可欠であることを論じる。
PL技術は、LLM生成コードを統計的パターンマッチングから真に信頼性と信頼性の高いレベルまで高めることができる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 04:32:15 GMT)
Towards Interpretable Drug-Drug Interaction Prediction: A Graph-Based Approach with Molecular and Network-Level Explanations [3.6] 薬物と薬物の相互作用(DDI)は、薬理学において重要な課題であり、しばしば患者の安全と医療結果に重大な影響を及ぼす有害な薬物反応を引き起こす。
我々は,分子と生物の知識を統合したグラフベースの新しいフレームワークであるMolecBioNetを提案し,ロバストで解釈可能なDDI予測を行う。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 07:43:19 GMT)
TPP-SD: Accelerating Transformer Point Process Sampling with Speculative Decoding [3.5] 本稿では,Transformer temporal point process (TPP) サンプリングを高速化する新しい手法であるTPP-SDを提案する。
TPPのスライニングアルゴリズムと言語モデルの投機的復号化という構造的類似性を同定することにより,効率的なサンプリングフレームワークを開発する。
合成データと実データの両方の実験により,本手法は標準手法と同一の分布からサンプルを生成するが,2-6$times$ speedupで生成することを示した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 11:18:07 GMT)
A Taxonomy of Omnicidal Futures Involving Artificial Intelligence [3.4] 本報告では,AIによる全能事象の分類と例を示す。
これらのイベントは避けられないものではなく、避けられる可能性として提示されます。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 18:23:36 GMT)
Practical Principles for AI Cost and Compute Accounting [3.1] 政策立案者は、開発コストと計算を、AI能力とリスクのプロキシとしてますます利用している。
我々は,AIコストと計算会計基準を設計するための7つの原則を提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 00:12:40 GMT)
AHCPTQ: Accurate and Hardware-Compatible Post-Training Quantization for Segment Anything Model [3.1] Segment Anything Model (SAM) は様々な視覚的タスクに対して強力な汎用性を示している。
ポストトレーニング量子化(PTQ)は、効率的なデプロイメントのための効果的な戦略として登場した。
本稿では,SAM の高精度かつハードウェア効率の高い PTQ 手法である AHCPTQ を提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 01:30:20 GMT)
A Practical Approach to Underwater Depth and Surface Normals Estimation [3.1] 本稿では,単眼深度と表面正規化推定(MDSNE)のための新しいディープラーニングモデルを提案する。
これは特に、CNNとTransformerを統合するハイブリッドアーキテクチャを使用して、水中環境向けに調整されている。
我々のモデルはパラメータを90%削減し、トレーニングコストを80%削減し、リソース制約されたデバイス上でリアルタイムな3D認識を可能にする。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 01:18:17 GMT)
EgoAnimate: Generating Human Animations from Egocentric top-down Views [3.0] ControlNetとStable Diffusionのバックボーンを用いて、トップダウン画像からリアルなフロントビューを生成するパイプラインを導入する。
これにより、最小限の入力からアバターの動きを生成することができ、よりアクセスしやすく一般化可能なテレプレゼンスシステムへの道を開くことができる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 09:59:31 GMT)
FieldNet: Efficient Real-Time Shadow Removal for Enhanced Vision in Field Robotics [2.8] 本研究では、リソース制約のあるハードウェアに最適化された、リアルタイムシャドウ除去のための新しいディープラーニングフレームワークであるFieldNetを紹介する。
合成シャドウで強化された1万の自然画像のデータセットに基づいてトレーニングされたFieldNetは、ベンチマークデータセットの最先端メソッドよりも優れています。
これらの進歩は、フィールドロボティクスなどにおけるリアルタイムビジョンタスクのための堅牢で効率的なソリューションとしてFieldNetを確立している。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 01:27:10 GMT)
BEExformer: A Fast Inferencing Binarized Transformer with Early Exits [2.8] BAT(Binarized Early Exit Transformer)とEE(Early Exit)を統合した最初の選択型学習ベーストランスであるBEExformerを紹介する。
BATは符号関数に微分可能な二階近似を用い、重みの符号と大きさの両方を捉える勾配を可能にする。
EEメカニズムは、ソフトルーティング損失推定を伴う中間変圧器ブロック間のエントロピーの分数還元に係わる。
これにより、FLOPを52.08%削減して推論を加速し、深層ネットワークに固有の「過剰な」問題を解くことで精度を2.89%向上させる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 18:28:38 GMT)
Order-preserving condition for coherence measures of projective measurements with One Example [2.8] コヒーレンスは量子資源理論の典型的な例として確立されている。
このような対策として,新しい条件である秩序保存条件が提案されている。
この一般化されたコヒーレンス尺度が順序保存条件を満たすことを検証する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 11:47:33 GMT)
$I^{2}$-World: Intra-Inter Tokenization for Efficient Dynamic 4D Scene Forecasting [2.7] I2$-Worldは、4D占有率予測のための効率的なフレームワークである。
本手法は,シーントークン化をシーン内およびシーン間トークン化剤に分解する。
I2$-Worldは最先端のパフォーマンスを達成し、既存の手法を25.1%のmIoUで、36.9%のIoUで4D占有率予測で上回っている。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 05:14:39 GMT)
PLEX: Perturbation-free Local Explanations for LLM-Based Text Classification [2.6] 大規模言語モデル(LLM)はテキスト分類において優れているが、その複雑さは解釈可能性を妨げる。
本稿では,アンダーライン・インダーライン・インダーライン・インダーライン・インダーライン・エクスプランテーション(PLEX)を提案する。
このワンオフトレーニングは、後続の摂動の必要性を排除し、新しい文の効率的な説明を可能にする。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 06:31:38 GMT)
RadEyeVideo: Enhancing general-domain Large Vision Language Model for chest X-ray analysis with video representations of eye gaze [2.4] RadEyeVideoは、放射線学者の眼球固定データをビデオシーケンスとして統合し、視線の時間的・空間的ダイナミクスをキャプチャする。
目を見つめるビデオでトリガーすると、レポート生成タスクのモデル性能が24.6%向上する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 00:45:38 GMT)
Queue up for takeoff: a transferable deep learning framework for flight delay prediction [2.2] 本稿では、キュー理論と簡単な注意モデルを組み合わせた新しいアプローチを紹介し、キュー理論SimAM(QT-SimAM)と呼ぶ。
提案モデルでは,異なるネットワーク間の遅延を高精度に予測する能力により,乗客の不安を軽減し,運用上の意思決定を改善することができる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 00:02:40 GMT)
Learning and Transferring Better with Depth Information in Visual Reinforcement Learning [2.2] 視覚変換器をベースとした視覚バックボーンを提案し,RGBと奥行き変調を融合させて一般化を促進させる。
異なるモダリティはまず別々のCNNステムで処理され、組み合わせた畳み込み機能はスケーラブルな視覚変換器に配信される。
sim2real転送では、トレーニングプロセスよりもドメインランダム化をデプロイする柔軟なカリキュラム学習スケジュールが開発されている。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 07:58:02 GMT)
Automatic Contouring of Spinal Vertebrae on X-Ray using a Novel Sandwich U-Net Architecture [2.2] 胸椎をX線画像上から正確に切り離すために設計された新しいU-Net変異体を提案する。
サンドイッチ型U-Net構造とデュアルアクティベーション関数を併用した提案手法により,ベースラインのU-Netモデルと比較してDiceスコアが4.1%向上した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 06:40:18 GMT)
Local unitary decomposition of tripartite arbitrary leveled qudit stabilizer states into $p$-level-qudit EPR and GHZ state [2.2] 任意の局所ユニタリの下で, 3部安定化器状態の絡み合い構造を次元$D$の$N$クォーディットで調べ, パーティ間を分散する$A$, $B$, $C$について検討する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 22:51:08 GMT)
Regularization-based Framework for Quantization-, Fault- and Variability-Aware Training [2.1] 正規化に基づく量子化対応トレーニングフレームワークは、CIFAR-10とImageNet上での競合結果を達成する。
当社のフレームワークは,フォールトおよび可変性を考慮した微調整,固定重み付きフォールト(固定重み付きビット)の緩和,デバイス抵抗のばらつきを可能にする。
本研究は,低消費電力非理想ハードウェアにおいて,量子化とロバスト性を考慮したトレーニングを行うための一般化可能なフレームワークを構築した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 06:32:06 GMT)
Context-Aware Regularization with Markovian Integration for Attention-Based Nucleotide Analysis [2.1] 自己回帰変換器は、固定長のコンテキストウィンドウに頼ってマルコフの振る舞いを示す。
CARMANIAは、NT予測を遷移行列(TM)損失で強化する自己教師型事前学習フレームワークである。
TM損失は、予測トークン遷移を、各入力シーケンスから経験的に導出されたn-gram統計と整合させ、局所的なコンテキストを超えた高次依存関係を捕捉するようモデルに促す。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 19:03:28 GMT)
Survival of the Optimized: An Evolutionary Approach to T-depth Reduction [2.1] 量子エラー補正(Quantum Error Correction, QEC)は、実用的フォールトトレラント量子コンピューティング(FTQC)の基盤である
回路ゲートが大きくなると、シーケンシャルなTゲート層("T-deepth")がオーバヘッドを増幅する。
最適層マージパターンを近似した数学的定式化を導入する。
我々は最先端手法よりもT深度が2.58倍向上した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 20:35:10 GMT)
A Moment-Based Generalization to Post-Prediction Inference [2.1] 人工知能(AI)と機械学習(ML)は、下流の分析のためのデータを生成するためにますます利用されている。
これらの予測を真に観察すると、偏見のある結果と誤った推測につながる可能性がある。
Wangらは、AI/ML予測と観測結果の関係をモデル化して推論を校正する、予測後推論手法を提案した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 02:33:45 GMT)
Quantifying Holistic Review: A Multi-Modal Approach to College Admissions Prediction [1.9] Comprehensive Applicant Profile Score (CAPS) は、総合的な大学入学評価を定量的にモデル化し解釈するための新しいフレームワークである。
CAPSは応募者のプロフィールを3つの解釈可能な要素に分解する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 16:58:03 GMT)
Deep Neural Network Based Accelerated Failure Time Models using Rank Loss [1.5] 加速故障時間(AFT)モデルは、障害時間と一連の共変量の間の対数線関係を仮定する。
ディープニューラルネットワーク(DNN)は過去数十年にわたって注目され、様々な分野で大きな成功を収めてきた。
本稿では,Gehan型損失モデルとサブサンプリング手法を組み合わせることで,AFTモデルにDNNを適用することを提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 01:35:15 GMT)
Learning-Based Multiuser Scheduling in MIMO-OFDM Systems with Hybrid Beamforming [1.4] 周波数分割多重化(OFDM)とハイブリッドビームフォーミングを用いたマルチ入力多重出力(MIMO)システムにおけるマルチユーザスケジューリング問題について検討する。
スケジューリングを行うために、グリージーやソートアルゴリズムなどのソリューションを提案し、次に機械学習(ML)アプローチを提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 13:42:56 GMT)
Prompt4Trust: A Reinforcement Learning Prompt Augmentation Framework for Clinically-Aligned Confidence Calibration in Multimodal Large Language Models [1.4] Prompt4Trustは,MLLMにおける信頼度校正をターゲットとした即時強化のための,最初の強化学習フレームワークである。
従来のキャリブレーション技術とは異なり、Prompt4Trustは安全で信頼性の高い臨床診断に最も重要なキャリブレーションの側面を特に優先している。
実験では,より大きなMLLMに対してゼロショットの一般化が期待できることを示した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 13:21:10 GMT)
Towards Human-level Dexterity via Robot Learning [1.4] デクスタース・インテリジェンス(Dexterous Intelligence)は、人間の身体的インテリジェンスと高次認知能力の頂点である。
何千万年もの間、人間の脳と手の発達に費やされ、触覚が豊かになった。
本論文では, 擬似学習技術を導入し, ビジュオ触覚による人体実験をデクスタリティに活用する新たなパラダイムを探求する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 02:22:55 GMT)
Quantum Observers: A NISQ Hardware Demonstration of Chaotic State Prediction Using Quantum Echo-state Networks [1.3] 我々は,現在のIBMハードウェア上でノイズの存在下で動作可能な新しい量子エコー状態ネットワーク(QESN)を提案する。
以上の結果から,QESNは,IBM Marrakesh QPUのT1とT2の100倍以上の時間長を持続メモリで予測できることがわかった。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 00:53:10 GMT)
Meta-autoencoders: An approach to discovery and representation of relationships between dynamically evolving classes [1.3] 本稿では,メタオートエンコーダ(MAE: Meta-autoencoder)の概念を紹介する。
ファミリーのMAEは、クラス固有のAEのコンパクト表現と関連するエンコーダとデコーダを学んだニューラルネットワークである。
この一般的な概念の1つの応用は自然進化の研究とモデリングである。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 17:50:35 GMT)
The Narrative Construction of Generative AI Efficacy by the Media: A Case Study of the Role of ChatGPT in Higher Education [1.3] 本研究では,米国のニュースメディアが生成型AI(GenAI)の有効性に関する物語をいかに構築するかを検討する。
以上の結果から,メディア・談話における6つの重要な話題が明らかとなり,感情分析の結果,ChatGPTの高等教育への統合が概ね肯定的であったことが示唆された。
対照的に、メディアの物語は、入学レベルの仕事や大学入学に対する影響について、より否定的な感情を表現している。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 10:19:50 GMT)
A Randomized Algorithm for Sparse PCA based on the Basic SDP Relaxation [1.3] 基本的SDP緩和に基づくSPCAのランダム化近似アルゴリズムを提案する。
我々のアルゴリズムは、十分な時間で呼ばれる場合、最も高い確率で空間定数の近似比を持つ。
実世界のデータセット上での数値計算によるアルゴリズムの有効性を実証する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 05:43:56 GMT)
NeuroHD-RA: Neural-distilled Hyperdimensional Model with Rhythm Alignment [1.2] 心電図(ECG)に基づく疾患検出のための新規かつ解釈可能な枠組みを提案する。
本稿では、RR間隔に基づくリズム認識およびトレーニング可能な符号化パイプライン、生理学的信号セグメンテーション戦略を導入する。
我々のフレームワークは、エッジ互換のECG分類のための効率的でスケーラブルなソリューションを提供し、解釈可能でパーソナライズされた健康モニタリングの強力な可能性を秘めている。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 20:22:48 GMT)
An Introduction to Flow Matching and Diffusion Models [1.2] このチュートリアルは、拡散とフローベースの生成モデルについて、第一原理から自己完結した紹介を提供する。
常微分方程式および微分方程式において必要となる数学的背景を開発し、フローマッチングとデノナイズ拡散モデルのコアアルゴリズムを導出する。
次に、トレーニング方法、ガイダンス、アーキテクチャ設計を含む画像およびビデオジェネレータを構築するためのステップバイステップガイドを提供する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 16:37:24 GMT)
Eka-Eval : A Comprehensive Evaluation Framework for Large Language Models in Indian Languages [1.2] EKA-evalは、9つの主要な評価カテゴリに35以上のベンチマークを統合する統合評価フレームワークである。
モジュールアーキテクチャによる11のコア機能、Hugging Faceとプロプライエタリなモデルとのシームレスな統合、プラグインとプレイのユーザビリティを提供する。
フレームワークはオープンソースで、https://github.com/lingo-iitgn/eka-eval.comで公開されている。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 05:20:11 GMT)
Simplifying Traffic Anomaly Detection with Video Foundation Models [1.1] エゴ中心交通異常検出(TAD)の最近の手法は、複雑な多段階もしくは多表現融合アーキテクチャに依存していることが多い。
近年の視覚知覚の知見は、先進的な事前訓練によって実現された基礎モデルにより、単純で柔軟なアーキテクチャが特殊設計より優れていることを示唆している。
ビデオビジョン変換器(Video ViTs)を用いて,アーキテクチャ的にシンプルなエンコーダのみのアプローチについて検討し,事前学習が強力なTAD性能を実現する方法について検討する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 16:36:49 GMT)
When Developer Aid Becomes Security Debt: A Systematic Analysis of Insecure Behaviors in LLM Coding Agents [1.1] LLMベースのコーディングエージェントは急速にソフトウェア開発にデプロイされているが、そのセキュリティへの影響はよく分かっていない。
我々は,5つの最先端モデルにわたる12,000以上のアクションを解析し,自律型符号化エージェントのシステムセキュリティ評価を行った。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 16:11:07 GMT)
Shaping Laser Pulses with Reinforcement Learning [1.1] 高出力レーザー(HPL)システムは、人類が作り出した最短の時間スケールであるアト秒体制で運用されている。
伝統的に、HPL光学性能を制御するパラメータは、人間の専門家によって手動で調整されている。
Deep Reinforcement Learning (DRL)は、静的でない環境でシーケンシャルな意思決定を可能にする、有望な代替手段を提供する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 10:05:39 GMT)
Smart Routing for Multimodal Video Retrieval: When to Search What [1.1] マルチモーダルビデオ検索のための最適モードを動的に選択するLLMベースのインテリジェントルーティングシステム。
提案手法はGPT-4.1を用いて,ASR(音声),OCR(テキスト),視覚指標のクエリをルーティングする。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 15:45:03 GMT)
Defects and their Time Scales in Quantum and Classical Annealing of the Two-Dimensional Ising Model [1.1] 周期的な$Ltimes L$格子上の2次元横磁場Ising強磁性体の欠陥について検討する。
我々は、量子相転移において、期待される臨界キブルズレック(KZ)時間スケール$propto Lz+1/nu$を観察した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 12:59:40 GMT)
An Integrated Blockchain and IPFS Solution for Secure and Efficient Source Code Repository Hosting using Middleman Approach [1.0] 本研究では、ブロックチェーンとInterPlanetary File Systemのセキュリティを組み合わせた、新しいハイブリッドアーキテクチャを提案する。
このアーキテクチャは,ソースコードホスティングのためのセキュアで監査可能でレジリエントなプラットフォームを実現することを実証した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 06:27:36 GMT)
Perspective Dial: Measuring Perspective of Text and Guiding LLM Outputs [0.9] 大型言語モデル(LLM)は様々なミッションクリティカルな役割で使用される。
LLM出力に関連するバイアスと視点の定量的な理解が欠如している。
本稿では,汎用テキストの視点や視点のより広範な問題と,大言語モデル(LLM)出力の視点制御について考察する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 17:57:39 GMT)
Classical Combinatorial Optimization Scaling for Random Ising Models on 2D Heavy-Hex Graphs [0.8] 重ヘックスグラフ上のイジングモデルは、経験的時間スケーリングにより古典的な計算硬度について検討する。
これらのイジングモデルの空間性のため、古典的アルゴリズムは大規模インスタンスに対しても効率的に最適解を見つけることができる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 03:22:28 GMT)
Explainability as a Compliance Requirement: What Regulated Industries Need from AI Tools for Design Artifact Generation [0.8] 本稿では,AIによるデザインアーティファクト生成における説明可能性のギャップについて,安全クリティカル産業の実践者10人との半構造化インタビューを通して検討する。
我々の研究結果によると、説明不能なAI出力は、広範囲な手作業による検証、ステークホルダ信頼の低減、ドメイン固有の用語を扱うのに苦労、チームコラボレーションの破壊、規制コンプライアンスのリスクの導入を必要としている。
この研究は、要件エンジニアリングにおけるAIツールの透明性、信頼性、適用性を改善するための実践的なロードマップを概説する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 09:34:39 GMT)
Implementing and Evaluating Post-Quantum DNSSEC in CoreDNS [0.4] 本稿では,量子後暗号(PQC)アルゴリズムをCoreDNSに統合する。
5つのPQCシグネチャアルゴリズムファミリをサポートするCoreDNSを拡張するプラグインを開発した。
本実装では,既存のDNS解決フローとの互換性を維持しつつ,量子抵抗シグネチャを用いたオンザフライ署名を実現している。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 14:34:17 GMT)
Advanced Health Misinformation Detection Through Hybrid CNN-LSTM Models Informed by the Elaboration Likelihood Model (ELM) [0.4] 本研究では,ソーシャルメディア上での誤情報検出を促進するために,ELM(Elaboration Likelihood Model)を適用した。
本モデルは,EMMに基づく特徴を統合することにより,誤情報分類の検出精度と信頼性を向上させることを目的としている。
改良されたモデルは精度97.37%、精度96.88%、リコール98.50%、F1スコア97.41%、ROC-AUC99.50%を達成した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 05:44:06 GMT)
New Statistical and Computational Results for Learning Junta Distributions [0.4] 我々は、$k$-junta分布の学習は、ノイズを伴う$k$-parity関数の学習と等価であることを示す。
統計的複雑性が最適であるユンタ分布を学習するためのアルゴリズムを設計する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 21:37:06 GMT)
Secondary Bounded Rationality: A Theory of How Algorithms Reproduce Structural Inequality in AI Hiring [0.2] 論文では、AIシステムは技術的・社会的制約を通じて人間の認知と構造的バイアスを継承し、増幅すると主張している。
アルゴリズムのプロセスが、エリート的信用権の特権化やネットワークのホモフィリーといった歴史的不平等を、明らかに有益な官僚的な結果にどのように変えるかを示す。
我々は、この自己強化不平等を打破するために、対物公正テスト、資本認識監査、規制介入を含む緩和戦略を提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 10:03:20 GMT)
Investigating the Robustness of Extreme Precipitation Super-Resolution Across Climates [0.1] 格子状気候モデルの粗い空間分解能は 極端な降水量のような社会的に関係のある変数を 投影する際の使用を制限します
対象変数の確率分布のパラメータを解析的に抽出可能な写像を用いて超解法を提案する。
本フレームワークは, パラメータ分布が支配する変数に対して広く適用可能であり, 経験的ダウンスケーリングが気候変動や極端に一般化する時期と理由を理解するためのモデルに依存しない診断を提供する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 07:04:07 GMT)
Uncovering symmetric and asymmetric species associations from community and environmental data [0.0] 本研究では,生物群集と環境データを分析し,双方向の関連関係を検索できる機械学習フレームワークの提案と検証を行う。
私たちのフレームワークは直感的で、モジュール的で、様々な分類群に広く適用されています。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 15:18:36 GMT)
WellPINN: Accurate Well Representation for Transient Fluid Pressure Diffusion in Subsurface Reservoirs with Physics-Informed Neural Networks [0.0] WellPINNは、複数の逐次訓練されたPINNモデルの出力を組み合わせて、ウェルを正確に表現するモデリングワークフローである。
以上の結果から,揚水場周辺におけるスーパーインポージングネットワークの逐次トレーニングが,揚水率の正確な推算に焦点をあてた最初のワークフローであることが示唆された。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 16:14:03 GMT)
User-to-PC Authentication Through Confirmation on Mobile Devices: On Usability and Performance [0.0] 我々は,スマートフォンやスマートウォッチの認証要求を確認することによって,ユーザがPCを認証するトークンベースのパスワードレスアプローチを利用する。
ボタンタップと生体指紋認証を確認変数として評価し,認証期間,成功率,ユーザビリティを従来のパスワードベースの認証と比較した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 08:17:59 GMT)
The temporal resolution limit in quantum sensing [0.0] この研究は、量子状態の区別可能な条件と量子速度制限を組み合わせることで、尋問時間に基づいて低い境界を確立する。
この境界以下になると、出力状態は統計的に入力状態と区別できず、必然的にノイズで失われる。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 07:38:27 GMT)
Swa-bhasha Resource Hub: Romanized Sinhala to Sinhala Transliteration Systems and Data Resources [0.0] Swa-bhasha Resource Hubは、2020年から2025年にかけて、SinhalaからSinhalaへの翻訳のために開発された、包括的なデータリソースとアルゴリズムのコレクションを提供する。
これらの資源は、シンハラ自然言語処理(NLP)の研究の進展に重要な役割を果たしている。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 10:54:30 GMT)
Superinductor-based ultrastrong coupling in a superconducting circuit [0.0] 共振器にガルバニカルに結合したフラックス量子ビットからなる超弦超インダクタによる結合について述べる。
その結果,スーパーインダクタは高コヒーレンス回路においてUSC物理を研究する上で有望なツールであることがわかった。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 16:38:45 GMT)
Spin Squeezing in Electron Microscopy [0.0] スピンスクイージングは電子顕微鏡における信号-雑音比(SNR)を改善するのに自然に適していることが理論的に示されている。
我々の結果は量子力学と電子干渉学の分野を結びつけ、ショットノイズ限界を超えたSNRによる電子顕微鏡への道を開いた。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 10:31:04 GMT)
Quantum Complexity and Chaos in Many-Qudit Doped Clifford Circuits [0.0] 奇素次元$d$のクォーディットに作用するドッピングクリフォード回路における量子複雑性とカオスの出現について検討する。
ドッピングされたクリフォード・ウィンガルテン計算とレプリカテンソルネットワーク形式を用いて、正確な結果を導き、大規模シミュレーションを行う。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 10:33:33 GMT)
Optimizing External Sources for Controlled Burning Plasma in Tokamaks with Neural Ordinary Differential Equations [0.0] 本研究は, ニューラル常微分方程式に基づく多次元プラズマ力学モデルを用いた逆モデリング手法を提案する(ニューラルODE)。
我々は、プラズマを特定の行動に向けて駆動する中性ビーム注入(NBI)電力などの外部源プロファイルを計算する。
このフレームワークは、フォワードシミュレーションツールを制御指向モデルに変換し、現在および将来の融合デバイスで外部ソースプロファイルを計算するための実用的な方法を提供する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 23:56:47 GMT)
Online Long-term Point Tracking in the Foundation Model Era [0.0] ポイントトラッキングは、ビデオフレーム全体で同じ物理点を識別することを目的としており、動きの幾何学的表現として機能する。
この論文は、将来の情報にアクセスせずにフレームを逐次処理するオンライン環境での長期的ポイントトラッキングの問題に対処する。
本稿では,各トラックポイントを問合せとして扱い,ビデオフレームを1回ずつ処理するトランスフォーマーベースのモデルであるTrack-Onを紹介する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 09:24:28 GMT)
MetaClimage: A novel database of visual metaphors related to Climate Change, with costs and benefits analysis [0.0] 気候変化のメタファーデータベース(MetaClimage)について紹介する。
それぞれの画像に対して,人間の評価から難易度,有効性,芸術的品質,情緒的覚醒の値を収集した。
視覚的なメタファーは理解が難しいが、リテラル画像よりも心地よいと評価された。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 09:49:30 GMT)
MSVD-Indonesian: A Benchmark for Multimodal Video-Text Tasks in Indonesian [0.0] インドネシアでは、MSVDデータセットの英語字幕をインドネシア語に翻訳することで、最初のパブリックなインドネシア語ビデオテキストデータセットを導入する。
3つのタスクに基づいて,英語ビデオテキストデータセットのために開発されたニューラルネットワークモデルを評価する。
インドネシアのデータセット上で,英語に制限された抽出器と微調整モデルを活用することによって,言語間移動学習手法を適用した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 04:28:35 GMT)
MI CAM: Mutual Information Weighted Activation Mapping for Causal Visual Explanations of Convolutional Neural Networks [0.0] 本稿では, アクティベーションマッピングに基づくMI CAMと呼ばれる, ポストホックな視覚的説明手法を提案する。
入力画像との相互情報を通じて各特徴マップを重み付けすることで、サリエンシビジュアライゼーションを生成する。
また、反事実分析の助けを借りて検証されるような因果解釈の創出にも固執する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 00:20:32 GMT)
Lecture Notes on Quantum Many-Body Theory: A Pedagogical Introduction [0.0] このテキストは、相互作用量子系の研究のための確かな理論基盤を提供するように設計されている。
形式的一貫性と教育的構造には特に注意が払われており、その主題の概念的側面と技術的側面の両方を通して読者を導く。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 09:58:54 GMT)
LLMs' Leaning in European Elections [0.0] この論文は、複数の欧州諸国におけるいくつかの仮想選挙を考慮して、アメリカ合衆国大統領選挙の以前の分析を延長している。
その結果、傾きは国によって均一ではないことが明らかとなった。
時折、モデルは仮想選挙における地位を辞退するが、拒否率そのものは国によって一様ではない。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 12:15:19 GMT)
Insuring Uninsurable Risks from AI: Government as Insurer of Last Resort [0.0] プログラムは、社会的に最適なケアレベルを誘導するために、リスク価格の償還手数料を使用する。
リスク見積は、インセンティブ付き開発者を含む専門家の調査によって決定される。
収集した費用は、開発者が必要とする安全研究の資金に役立てることが推奨されています。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 22:31:53 GMT)
InsurTech innovation using natural language processing [0.0] 本稿では,非構造化テキストを構造解析や意思決定に適した構造化データに変換することに焦点を当てる。
NLPは単なる補足ツールではなく、現代のデータ駆動型保険分析の基礎的な要素であることを示す。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 23:10:59 GMT)
Hybrid Autoregressive-Diffusion Model for Real-Time Streaming Sign Language Production [0.0] 本稿では,自己回帰モデルと拡散モデルを組み合わせて手話生成(SLP)モデルを生成するハイブリッドアプローチを提案する。
細かな体の動きを捉えるため,異なるアーティストから細かな特徴を別々に抽出するマルチスケール・ポース表現モジュールを設計した。
また、連立レベルの信頼スコアを利用してポーズ生成過程を動的にガイドする信頼意識型因果注意機構も導入する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 01:34:50 GMT)
GreenCrossingAI: A Camera Trap/Computer Vision Pipeline for Environmental Science Research Groups [0.0] カメラトラップは、動物行動、個体群動態、生息地利用、種多様性を非侵襲的で効率的な方法で監視し研究するために、野生生物研究者によって長い間使われてきた。
フィールドからのデータ収集は、新しいツールや機能によって増加したが、データの開発、処理、管理の方法、特にML/AIツールの採用は、依然として困難なままである。
本稿では,限られたリソースと計算能力を持つ小規模研究グループに適したML/AI機能を導入し,低リソースパイプラインによるカメラトラップデータの処理をオンプレミスで行うためのガイドを提供する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 22:02:55 GMT)
Feedback Connections in Quantum Reservoir Computing with Mid-Circuit Measurements [0.0] フィードバック接続を統合する新しい量子貯水池計算方式について検討する。
モデルが過去の入力を記憶できるように,連続処理中にフィードバック接続が効果的に動作可能であることを示す。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 16:19:25 GMT)
Excessive precision compromises accuracy even with unlimited resources due to the trade-off in quantum metrology [0.0] 隣り合う量子状態の区別の観点から、精度と精度を統一的に定義する。
過度な精度を追求する場合,サンプリングの増加に伴い,実際に精度が低下する可能性があることを示す。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 07:17:13 GMT)
Enhancing NeuroEvolution-Based Game Testing: A Branch Coverage Approach for Scratch Programs [0.0] 本稿では,自動ゲームテストにおけるテスト効率を向上させるために,分岐カバレッジに基づくフィットネス機能を提案する。
神経進化過程を導いて枝探索の最大化を図り、制御依存の枝を優先する枝適合機能を統合することでNEATESTを拡張した。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 22:36:47 GMT)
Divergence of Empirical Neural Tangent Kernel in Classification Problems [0.0] 分類問題では、完全連結ニューラルネットワーク(FCN)と残留ニューラルネットワーク(ResNet)は、ニューラルタンジェントカーネル(NTK)に基づくカーネルロジスティック回帰によって近似できない。
ネットワーク幅が大きくなるにつれて、NTKはトレーニングサンプル上で常にNTKに均一に収束しないことを示す。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 21:59:44 GMT)
DS@GT at Touché: Large Language Models for Retrieval-Augmented Debate [0.0] Retrieval-Augmented Debate and Evaluationの6つの主要な公開モデルを展開します。
評価は、Quality、Quantity、Manner、Relationの4つの重要なメトリクスを測定することで行われる。
LLMは関連する議論を行う際にはよく機能するが、評価において一貫性のある応答では冗長である傾向にある。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 00:20:00 GMT)
Credit Card Fraud Detection Using RoFormer Model With Relative Distance Rotating Encoding [0.0] 不正検出は、金融システムが対処しなければならない最も重要な課題の1つだ。
Relative Distance Rotating (ReDRE)は、RoFormerモデル内の時系列データのキャラクタリゼーションを強化する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 20:02:02 GMT)
Counterflow of lattice polarons in harmonically confined optical lattices [0.0] ボゾン浴と反発的に相互作用する高調波閉じ込め光学格子の移動不純物について検討した。
我々は,移動不純物対の解析モデルを用いて,相関した逆流相の出現を明らかにした。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 02:26:56 GMT)
Calibrated and Robust Foundation Models for Vision-Language and Medical Image Tasks Under Distribution Shift [0.0] CLIPやSAMといったファンデーションモデルは、ローショットトランスファー学習を通じてコンピュータビジョンと医療イメージングを変革した。
両課題に対処する統合フレームワークである textitStaRFM を提案する。
texttt+3.5%の精度と、19の視覚データセット上でのECEの28%低下のような一貫したパフォーマンスを示す。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 09:39:07 GMT)
Automated Multi-Class Crop Pathology Classification via Convolutional Neural Networks: A Deep Learning Approach for Real-Time Precision Agriculture [0.0] 本研究では,コンボリューショナルニューラルネットワーク(CNN)を用いた画像分類システムを提案する。
このソリューションは、オープンソースでモバイル互換のプラットフォーム上にデプロイされ、リモートエリアの農家に対してリアルタイムの画像ベースの診断を可能にする。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 18:45:50 GMT)
Adversarial Activation Patching: A Framework for Detecting and Mitigating Emergent Deception in Safety-Aligned Transformers [0.0] 大規模言語モデル(LLM)は、安全のために整列し、しばしば突発的な騙し行動を示す。
本稿では,新しい機械的解釈可能性フレームワークである逆アクティベーションパッチについて紹介する。
のプロンプトからアクティベーションをソーシングすることで、脆弱性をシミュレートし、偽装率を定量化する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 21:29:49 GMT)
A Review of Reward Functions for Reinforcement Learning in the context of Autonomous Driving [0.0] 強化学習は自動運転にとって重要なアプローチである。
報酬関数は、強化学習において、学習したスキル目標を確立し、エージェントを最適な政策へ導くために用いられる。
自律運転は、目的と異なる優先度の度合いで部分的に矛盾する複雑な領域であるため、適切な報酬関数を開発することは、根本的な課題である。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 13:26:05 GMT)
A Framework for Predictive Directional Trading Based on Volatility and Causal Inference [0.0] 本研究では,金融市場における予測的リードラグ関係の同定と活用のための新しい枠組みを提案する。
本稿では,高度な統計手法と機械学習モデルを組み合わせた統合的手法を提案する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 16:53:32 GMT)
A CLuP algorithm to practically achieve $\sim 0.76$ SK--model ground state free energy [0.0] シェリントン・カークパトリック (SK) スピングラス基底自由エネルギーのアルゴリズムによる決定について検討する。
CLuP-SKモデルに付随するアルゴリズムの典型的成功を解析する。
論文参考訳(メタデータ) (Sat, 12 Jul 2025 10:58:50 GMT)