Infini-gram mini: Exact n-gram Search at the Internet Scale with FM-Index [124.7] Infini-gram miniはペタバイトレベルのテキストコーパスを検索可能にするスケーラブルなシステムである。
私たちは128コアのCPUノードで、50日間で46TBのインターネットテキストをインデックスします。
Infini-gram miniのベンチマーク汚染の大規模解析における重要な利用例を示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:13:57 GMT)
TAViS: Text-bridged Audio-Visual Segmentation with Foundation Models [123.2] 本稿では,マルチモーダル基盤モデルの知識をテキスト化するための新しいフレームワークTAViSを提案する。
これらのモデルを効果的に組み合わせることによって、SAM2とImageBind間の知識伝達の困難さと、監督のためにセグメンテーション損失のみを使用することの不十分さの2つの大きな課題が生じる。
提案手法は,シングルソース,マルチソース,セマンティックデータセットにおいて優れた性能を示し,ゼロショット設定で優れる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:19:47 GMT)
Does Thinking More always Help? Understanding Test-Time Scaling in Reasoning Models [103.0] Wait"や"Let me rethink"といったプロンプトを使って思考トレースを拡張することで、パフォーマンスが向上します。
テスト時にもっと考えることは、本当により良い推論につながるのでしょうか?
過度に考える”という理由から,新たな思考による初期パフォーマンス改善の一貫したパターンと,それに続く低下を示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:29:27 GMT)
Efficient Visual State Space Model for Image Deblurring [99.5] 畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
提案したEVSSMは、ベンチマークデータセットや実世界の画像に対する最先端の手法に対して好意的に機能する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:41:03 GMT)
BitNet v2: Native 4-bit Activations with Hadamard Transformation for 1-bit LLMs [95.7] BitNet v2は、1ビットの大規模言語モデルに対してネイティブな4ビットアクティベーション量子化を可能にするフレームワークである。
H-BitLinearは、アクティベーション量子化の前にオンラインアダマール変換を適用するモジュールである。
実験では、BitNet v2がゼロからトレーニングされ、8ビットアクティベーションはBitNet b1.58のパフォーマンスと一致している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:55:26 GMT)
Improving Large Language Model Safety with Contrastive Representation Learning [92.8] 大規模言語モデル(LLM)は、社会に深い影響を与える強力なツールである。
多様な制御されていない入力に対する応答を生成する能力は、敵の攻撃に対して脆弱である。
対照的な表現学習問題としてモデルディフェンスを定式化するディフェンスフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:42:09 GMT)
LiveCodeBench Pro: How Do Olympiad Medalists Judge LLMs in Competitive Programming? [88.3] 大規模言語モデル(LLM)は、競争力のあるプログラミングにおいてエリート人間より優れています。
我々はこの主張を再考し、LLMが人間の専門家とどのように異なるのか、そしてまだ限界が残っているのかを考察する。
私たちは、Codeforces、ICPC、IOIの問題からなるベンチマークであるLiveCodeBench Proを紹介します。
オリンピアードのメダリストのチームはアルゴリズムカテゴリーのあらゆる問題に注釈を付け、失敗したモデル生成の提出をライン・バイ・ラインで分析する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:29:09 GMT)
Structural Similarity-Inspired Unfolding for Lightweight Image Super-Resolution [88.2] 効率的な画像SRのための構造類似インスパイアド・アンフォールディング(SSIU)法を提案する。
この方法は、構造的類似性に制約されたSR最適化関数の展開によって設計される。
我々のモデルは現在の最先端モデルより優れており、パラメータ数が低く、メモリ消費が減少している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:29:40 GMT)
Step-Audio-AQAA: a Fully End-to-End Expressive Large Audio Language Model [85.7] 本稿では,AQAA(Audio-Audio Answer)タスク用に設計された完全エンドツーエンドのLALMであるStep-Audio-AQAAを紹介する。
このモデルは、言語的特徴抽出と意味的特徴抽出のためのデュアルコードブックオーディオトークンーザを統合している。
我々のポストトレーニングアプローチでは、意味的コヒーレンスを高めるために、テキストとオーディオのインターリーブドトークンアウトプットを用いる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:07:42 GMT)
Transferable Post-training via Inverse Value Learning [83.8] 別個のニューラルネットワーク(すなわち値ネットワーク)を用いた後学習におけるロジットレベルのモデリング変更を提案する。
このネットワークをデモを使って小さなベースモデルでトレーニングした後、推論中に他のトレーニング済みモデルとシームレスに統合することができる。
得られた値ネットワークは、パラメータサイズの異なる事前学習されたモデル間で広い転送性を有することを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:54:32 GMT)
A correlation-permutation approach for speech-music encoders model merging [80.8] 本稿では,音楽エンコーダの内部層を音声エンコーダと整合させる相関置換手法を提案する。
この方法は、モデルの特徴的相互相関層を層単位で最大化する置換行列を計算する。
この作業により、独立に訓練されたエンコーダから統一されたオーディオモデルを作成することができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:04:33 GMT)
R-KV: Redundancy-aware KV Cache Compression for Reasoning Models [77.8] 共振モデル(R-KV)のための冗長性を考慮したKVキャッシュ圧縮を提案する。
R-KVはKVキャッシュの10%しか使用せず、完全なKVキャッシュ性能のほぼ100%を保っている。
驚くべきことに、R-KVは完全なKVキャッシュ性能の105%を達成し、KVキャッシュの16%を達成している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:01:43 GMT)
Towards Efficient Speech-Text Jointly Decoding within One Speech Language Model [76.1] 音声言語モデル(Speech LMs)は、単一のモデル内でエンドツーエンドの音声テキストモデリングを可能にする。
音声テキストの共同復号パラダイムの選択は、性能、効率、アライメント品質において重要な役割を担っている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:55:18 GMT)
A Survey on Deep Learning based Time Series Analysis with Frequency Transformation [75.6] 周波数変換(FT)は、時系列解析における最先端の精度と効率を高めるために、ディープラーニングモデルにますます取り入れられている。
この新興分野における注目の高まりと研究の高まりにもかかわらず、現在、FTを用いたディープラーニングベースの時系列モデルの体系的レビューと詳細な分析が欠如している。
本稿では,FTを用いた深層学習に基づく時系列解析における最近の研究成果を体系的に研究し,要約する総合的なレビューを紹介する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:48:19 GMT)
Personalized Wireless Federated Learning for Large Language Models [75.2] 大規模言語モデル(LLM)は、無線ネットワークにおいて大きな変革をもたらしている。
無線環境では、LLMのトレーニングはセキュリティとプライバシに関する重大な課題に直面している。
本稿では,無線ネットワークにおけるLLMのトレーニング段階の体系的解析を行い,事前学習,命令チューニング,アライメントチューニングを行う。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 23:38:13 GMT)
AegisLLM: Scaling Agentic Systems for Self-Reflective Defense in LLM Security [74.2] AegisLLMは、敵の攻撃や情報漏洩に対する協調的なマルチエージェント防御である。
テスト時のエージェント推論システムのスケーリングは,モデルの有用性を損なうことなく,ロバスト性を大幅に向上させることを示す。
アンラーニングやジェイルブレイクを含む主要な脅威シナリオに対する総合的な評価は、AegisLLMの有効性を示している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 22:43:06 GMT)
Clustering is back: Reaching state-of-the-art LiDAR instance segmentation without training [69.3] 本研究は, セマンティックラベルのみを用いて, 競合するパノプティクスのセグメンテーションを実現できることを示す。
提案手法は,標準ベンチマークにおける最先端の教師付き手法よりも優れている。
完全に説明可能で、学習やパラメータチューニングを必要としない。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:51:10 GMT)
From Efficiency Gains to Rebound Effects: The Problem of Jevons' Paradox in AI's Polarized Environmental Debate [69.1] これらの2次の影響を理解するには、ライフサイクルアセスメントと社会経済分析を組み合わせた学際的アプローチが必要であると論じる。
AIの真の気候フットプリントを誤って表現し、意味のある介入の範囲を制限している、と我々は主張する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:59:59 GMT)
FCA2: Frame Compression-Aware Autoencoder for Modular and Fast Compressed Video Super-Resolution [68.8] 最先端(SOTA)圧縮ビデオ超解像(CVSR)モデルは、長期の推論時間、複雑なトレーニングパイプライン、補助情報への依存など、永続的な課題に直面している。
ハイパースペクトル画像(HSI)とビデオデータの構造的および統計的類似性から着想を得た,効率的でスケーラブルなソリューションを提案する。
提案手法では,計算複雑性を低減し,推論を高速化し,フレーム間の時間情報の抽出を促進する圧縮駆動型次元減少戦略を導入する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:59:52 GMT)
EyeSim-VQA: A Free-Energy-Guided Eye Simulation Framework for Video Quality Assessment [68.8] EyeSimVQAは、自由エネルギーベースの自己修復を取り入れた新しいVQAフレームワークである。
現状の手法と比較して,EyeSimVQAは競争力や性能に優れることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:00:54 GMT)
LoRA-Gen: Specializing Large Language Model via Online LoRA Generation [68.0] タスク記述に基づくエッジサイドモデルのLoRAパラメータを生成するためのLoRA-Genフレームワークを提案する。
フレキシブルな特殊化を実現するために,LoRAパラメータをエッジ側モデルにマージする。
本手法は,モデル間の知識伝達を容易にするとともに,特殊モデルの推論効率を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:11:01 GMT)
Intra-Trajectory Consistency for Reward Modeling [67.8] 軌道内整合性正則化を開発し、より高い次トーケン生成確率を持つプロセスがより一貫した報酬を維持することを強制する。
提案した正規化でトレーニングした報酬モデルにより、より優れたDPO整合ポリシーが導出され、より優れたベスト・オブ・N(BON)検証結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:11:52 GMT)
MAGNET: A Multi-agent Framework for Finding Audio-Visual Needles by Reasoning over Multi-Video Haystacks [67.3] AV-HaystacksQAという新しいタスクを導入し、クエリに応答して、異なるビデオにまたがる有能なセグメントを識別し、それらをリンクして最も有意義な回答を生成する。
AVHaystacksは、マルチビデオ検索および時間的グラウンドタスクにおけるLMMの能力を評価するために設計された3100の注釈付きQAペアからなるオーディオビジュアルベンチマークである。
提案するAVHaystackのQAタスクにおけるBLEU@4およびGPT評価スコアの基準値よりも89%と65%の相対的な改善を実現し、モデルに依存しないマルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:05:47 GMT)
Evaluating Implicit Bias in Large Language Models by Attacking From a Psychometric Perspective [66.3] 我々は、ある人口層に対する大きな言語モデルの暗黙の偏見を厳格に評価する。
心理測定の原則にインスパイアされた我々は,3つの攻撃的アプローチ,すなわち,軽視,軽視,指導を提案する。
提案手法は,LLMの内部バイアスを競合ベースラインよりも効果的に引き出すことができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:04:19 GMT)
Voxel-Level Brain States Prediction Using Swin Transformer [65.9] 本稿では, 4D Shifted Window (Swin) Transformer をエンコーダとして用い, 時間的情報を効率よく学習し, 畳み込みデコーダを用いて入力fMRIデータと同じ空間的, 時間的解像度で脳状態の予測を可能にするアーキテクチャを提案する。
前回の23.04s fMRI時系列に基づいて7.2sの安静時脳活動を予測すると,高い精度が得られた。
これは、人間の脳の時間的構造が高解像度でSwin Transformerモデルによって学習できることを示す有望な証拠である。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:14:38 GMT)
Aligned Novel View Image and Geometry Synthesis via Cross-modal Attention Instillation [62.9] ワーピング・アンド・インペインティング手法を用いて,新しいビューイメージと幾何学生成の整合性を実現する拡散型フレームワークを提案する。
手法は、既製の幾何学予測器を利用して、参照画像から見る部分的な幾何学を予測する。
生成した画像と幾何の正確なアライメントを確保するために, クロスモーダルアテンション蒸留法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:19:00 GMT)
Visual Pre-Training on Unlabeled Images using Reinforcement Learning [62.7] 強化学習(RL)において、価値に基づくアルゴリズムは、それぞれの観察と状態とそれから到達しそうな報酬を関連付けることを学習する。
この定式化に類似した自己教師付き画像事前学習法が多数存在することが観察された。
RL問題として,Webクロールやビデオフレームなどのラベル付けされていない画像データに事前学習を直接キャストする手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:25:27 GMT)
Manager: Aggregating Insights from Unimodal Experts in Two-Tower VLMs and MLLMs [61.9] 2tower Vision-Language Models (VLM) は、様々な下流VLタスクに強い性能を示す。
我々は,訓練済みの未学習専門家のさまざまなレベルからの洞察を適応的に集約する,軽量で効率的で効果的なプラグインであるManageerを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:16:41 GMT)
Spectra-to-Structure and Structure-to-Spectra Inference Across the Periodic Table [60.8] XAStructは結晶構造からXASスペクトルを予測し、XAS入力から局所構造記述子を推測できる学習フレームワークである。
XAStructは、周期表全体にわたって70以上の要素にまたがる大規模なデータセットでトレーニングされている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:58:05 GMT)
Imagine, Verify, Execute: Memory-Guided Agentic Exploration with Vision-Language Models [60.7] 本稿では,人間の好奇心に触発されたエージェント探索フレームワークIVEを紹介する。
シミュレーションおよび実世界のテーブルトップ環境におけるIVEの評価を行った。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 22:39:23 GMT)
Maximally-Informative Retrieval for State Space Model Generation [60.0] テスト時に特定のクエリに対するモデル不確実性を最小化するために、Retrieval In-Context Optimization (RICO)を導入する。
文書検索に外部に依存した従来の検索強化生成(RAG)とは異なり,本手法はモデルから直接のフィードバックを利用する。
モデル勾配を用いた標準のトップ$kの検索は、最適化手順を近似し、残余損失への接続を提供することを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:08:54 GMT)
Scientists' First Exam: Probing Cognitive Abilities of MLLM via Perception, Understanding, and Reasoning [59.5] 我々は,Multimodal Large Language Models (MLLM) の科学的認知能力を評価するために設計された,Scientists' First Exam (SFE) ベンチマークを提示する。
SFEは3つの質問タイプにまたがる830のエキスパート検証VQAペアで構成され、5つの高価値分野にまたがる66のマルチモーダルタスクにまたがる。
実験の結果、現在最先端のGPT-o3とInternVL-3はSFEでわずか34.08%と26.52%しか達成できず、MLLMが科学領域で改善する余地があることが明らかになった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:32:48 GMT)
DAVID-XR1: Detecting AI-Generated Videos with Explainable Reasoning [58.7] DAVID-Xは、AI生成ビデオに詳細な欠陥レベル、時間空間アノテーションと有理書を組み合わせた最初のデータセットである。
DAVID-XR1は、視覚的推論の解釈可能な連鎖を提供するために設計されたビデオ言語モデルである。
以上の結果から,AI生成ビデオコンテンツの信頼性確認のための説明可能な検出手法が期待できることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:39:53 GMT)
Mitigating Hallucination Through Theory-Consistent Symmetric Multimodal Preference Optimization [58.6] マルチモーダル大言語モデル(MLLM)における幻覚を緩和するための効果的なアプローチとして、直接選好最適化(DPO)が登場している。
我々は、直接選好監督(応答対)を伴う対称選好学習を行うシンメトリ・マルチモーダル選好最適化(SymMPO)を提案する。
従来の順序的嗜好学習に加えて、SymMPOは、左右の選好ペア間の選好ギャップを定量的に調節する、選好マージン整合性損失を導入している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:29:15 GMT)
Can Mixture-of-Experts Surpass Dense LLMs Under Strictly Equal Resources? [58.6] Mixture-of-Experts (MoE)言語モデルは、モデルキャパシティを劇的に拡張し、トーケン毎の計算量を増やすことなく優れたパフォーマンスを達成する。
MoEsは厳密なリソース制約の下で密集したアーキテクチャを超えることができるか?
最適領域における活性化率を持つMoEモデルは,同じパラメータ,トレーニング計算,およびデータ資源の下で,その密度の高いモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:59:05 GMT)
Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning [57.9] 医療知識の豊富なマルチモーダルデータセットを構築した。
次に医学専門のMLLMであるLingshuを紹介します。
Lingshuは、医療専門知識の組み込みとタスク解決能力の向上のために、マルチステージトレーニングを行っている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:22:02 GMT)
Taming Rectified Flow for Inversion and Editing [57.4] FLUXやOpenSoraのような定流拡散変換器は、画像生成やビデオ生成の分野で優れた性能を発揮している。
その堅牢な生成能力にもかかわらず、これらのモデルは不正確さに悩まされることが多い。
本研究では,修正流の逆流過程における誤差を軽減し,インバージョン精度を効果的に向上する訓練自由サンプリング器RF-rを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:29:47 GMT)
Neural Network Reprogrammability: A Unified Theme on Model Reprogramming, Prompt Tuning, and Prompt Instruction [55.9] モデル適応のための統一フレームワークとして,ニューラルネットワークの再プログラム可能性を導入する。
本稿では,4つの重要な側面にまたがる情報操作アプローチを分類する分類法を提案する。
残る技術的課題や倫理的考察も分析する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:10:26 GMT)
Improving Large Language Models with Concept-Aware Fine-Tuning [55.6] 概念認識ファインチューニング(CAFT)は,大規模言語モデル(LLM)のための新しいマルチトークン学習手法である
CAFTは複数のトークンにまたがるシーケンスの学習を可能にし、より強力な概念認識学習を促進する。
実験は、従来の次世代ファインタニング法と比較して大幅に改善された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:24:38 GMT)
Towards a Cascaded LLM Framework for Cost-effective Human-AI Decision-Making [55.2] 複数の専門分野にまたがってタスクを適応的に委譲するLLM決定フレームワークを提案する。
まず、deferral Policyは、ベースモデルの回答を受け入れるか、あるいは大きなモデルでそれを再生するかを決定する。
第2に、禁忌ポリシーは、カスケードモデル応答が十分に確実であるか、または人間の介入を必要とするかを判定する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:36:22 GMT)
FIMA-Q: Post-Training Quantization for Vision Transformers by Fisher Information Matrix Approximation [55.1] ポストトレーニング量子化(PTQ)は近年,費用対効果と有望なモデル圧縮パラダイムとして注目されている。
ビジョン変換器(ViT)の現在のPTQ法は、特に低ビット量子化において、精度が著しく低下している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:57:38 GMT)
CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [54.9] 異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:30:15 GMT)
Manipulating Feature Visualizations with Gradient Slingshots [53.9] 特徴可視化(FV)は、ディープニューラルネットワーク(DNN)で学んだ概念を解釈するための広く使われている手法である。
本稿では,モデルアーキテクチャを変更したり,性能を著しく劣化させたりすることなくFVの操作を可能にする新しい手法,Gradient Slingshotsを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:13:55 GMT)
FreshStack: Building Realistic Benchmarks for Evaluating Retrieval on Technical Documents [53.6] 情報検索(IR)評価ベンチマークを自動構築するための総合的なフレームワークであるFreshStackを紹介する。
FreshStackでは、コードと技術ドキュメントからの自動コーパス収集、コミュニティに質問された質問と回答からのナゲット生成、ナゲットレベルのサポートが実施されている。
FreshStackを使って、急速に成長する、最近の、ニッチなトピックに関する5つのデータセットを構築し、タスクが十分に困難であることを保証しています。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 00:25:54 GMT)
Tell Me What You Don't Know: Enhancing Refusal Capabilities of Role-Playing Agents via Representation Space Analysis and Editing [53.4] 我々は,文脈知識の競合要求,パラメトリック知識の競合要求,非競合要求を含む評価ベンチマークを開発する。
ほとんどのRPAは、異なる競合要求に対して、大幅なパフォーマンスギャップを動作します。
本稿では、競合する要求を拒否領域に都合よくシフトさせる軽量な表現編集手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:59:49 GMT)
T1: Advancing Language Model Reasoning through Reinforcement Learning and Inference Scaling [52.3] 大規模言語モデル(LLM)は複雑な推論タスクにおいて顕著な能力を示した。
既存のアプローチは主に、効果的なテストタイムスケーリングを達成するために、模倣学習と苦労に依存しています。
我々は、探索を奨励し、推論スケーリングを理解することで、強化学習をスケールするためにT1を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:15:45 GMT)
The Sharpness Disparity Principle in Transformers for Accelerating Language Model Pre-Training [51.8] 本稿では、各ブロックのシャープネスに合わせてLRを調整する戦略であるブロックワイズ学習率(LR)を提案する。
モデルサイズは0.12Bから2Bの範囲である。
最近提案されたメモリ効率のAdam-miniにBlockwise LRを組み込むことで、2倍のスピードアップと2倍のメモリ節約を実現しています。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:42:25 GMT)
Robust Molecular Property Prediction via Densifying Scarce Labeled Data [51.6] 薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。
本稿では,未ラベルデータを利用したメタラーニングに基づく新しい手法を提案する。
実世界のデータセットに挑戦する上で、最先端の手法よりも顕著なパフォーマンス向上を示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:27:40 GMT)
Practical Improvements of A/B Testing with Off-Policy Estimation [51.3] 従来の手法よりも分散度を低くする非バイアスのオフ・ポリティクス推定器のファミリーを導入する。
提案手法の有効性と実用性を理論的に検証した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:11:04 GMT)
Compute Optimal Scaling of Skills: Knowledge vs Reasoning [50.8] 計算-最適スケーリングの振る舞いがスキルに依存しているかどうかを問う。
特に,知識に基づくQAやコード生成といった知識と推論に基づくスキルについて検討する。
本研究は,検証セットを用いた標準的な計算-最適スケーリングとの関連性について分析した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:16:23 GMT)
A Watermark for Auto-Regressive Image Generation Models [50.6] 画像生成モデル用に明示的に設計された歪みのない透かし法であるC-reweightを提案する。
C-reweightは画像の忠実性を維持しながら再起動ミスマッチを緩和する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 00:15:54 GMT)
Collaborative LLM Inference via Planning for Efficient Reasoning [50.0] 本稿では,プランナーモデルがまず,その問題の蒸留および高レベルの抽象化として定義されたプランを生成するテストタイム協調フレームワークを提案する。
小型と大型のモデルは、プランナーと理性士として交代で働き、複雑なタスクを協調的に解決するために、多ラウンドのカスケードでプランを交換する。
提案手法は,強力なプロプライエタリモデルに匹敵する精度を実現し,有償推論への依存を著しく低減する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:35:50 GMT)
Addressing Bias in LLMs: Strategies and Application to Fair AI-based Recruitment [49.8] この研究は、トランスフォーマーベースのシステムの能力を分析して、データに存在する人口統計バイアスを学習する。
最終ツールにおける偏りを緩和する手段として,学習パイプラインからの性別情報を削減するためのプライバシー向上フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:29:43 GMT)
New Dataset and Methods for Fine-Grained Compositional Referring Expression Comprehension via Specialist-MLLM Collaboration [49.2] Referring Expression (REC) は、言語理解、画像理解、言語と画像の接点の相互作用を評価するためのクロスモーダルなタスクである。
MLLM(Multimodal Large Language Models)の試験場として機能する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:17:20 GMT)
MindFlayer SGD: Efficient Parallel SGD in the Presence of Heterogeneous and Random Worker Compute Times [49.2] 最適勾配を計算できる複数の並列作業者の設定において、滑らかな非関数の期待を最小化する問題について検討する。
この文脈における課題は、任意に不均一で分散された計算時間の存在である。
本稿では,このギャップに対処する新しい並列SGD法であるMindFlayer SGDを紹介する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:24:41 GMT)
Differential Privacy in Machine Learning: From Symbolic AI to LLMs [49.2] 差別化プライバシは、プライバシーリスクを軽減するための正式なフレームワークを提供する。
単一のデータポイントの包含や除外がアルゴリズムの出力を著しく変更しないことを保証する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:30:35 GMT)
e3: Learning to Explore Enables Extrapolation of Test-Time Compute for LLMs [49.0] 既存の推論モデルでは外挿がうまく行われていないことが示される。
レシピ e3 は AIME'25 と HMMT'25 のスコアに基づいて最もよく知られた 1.7B モデルを生成する。
e3-1.7Bモデルは、高いpass@1スコアを得るだけでなく、ベースモデルよりもpass@kを改善する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:44:03 GMT)
WorldAPIs: The World Is Worth How Many APIs? A Thought Experiment [49.0] 本稿では, wikiHow 命令をエージェントの配置ポリシーに基礎付けることで, 新たな API を創出するフレームワークを提案する。
大規模言語モデル (LLM) の具体化計画における近年の成功に触発されて, GPT-4 のステアリングを目的とした数発のプロンプトを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 23:07:51 GMT)
Benchmarking Multimodal LLMs on Recognition and Understanding over Chemical Tables [48.4] ChemTable(チェムタブル、英: ChemTable)は、実験的な論文から得られた実世界の化学表の大規模なベンチマークである。
ChemTableには、専門家によるアノテートされたセルポリゴン、論理レイアウト、試薬、触媒、収率、グラフィカルコンポーネントを含むドメイン固有のラベルが含まれている。
我々は、ChemTable上で、オープンソースモデルとクローズドソースモデルの両方を含む様々な代表的マルチモーダルモデルを評価し、実践的および概念的洞察を伴う一連の知見を報告した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 00:45:41 GMT)
Semantic Scheduling for LLM Inference [48.2] 大規模言語モデル(LLM)からの要求のスケジューリングにおける意味的スケジューリングの概念を導入する。
LLMベースのプロンプトスケジューリングにおいて、全体の待ち時間を最小化するために、最適な時間複雑性を持つ新しいスケジューリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:15:58 GMT)
Spectral Estimation with Free Decompression [47.8] 非常に大きな(可逆な)行列のスペクトルを推定する「自由減圧」の新たな手法を提案する。
提案手法は, 極大(非可逆)行列の固有スペクトルを推定するために, 小型サブマトリクスの実験的スペクトル密度から外挿することができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:49:25 GMT)
The Landscape of Causal Discovery Data: Grounding Causal Discovery in Real-World Applications [47.6] 因果発見は、データから因果関係を自動的に発見することを目的としている。
現在の手法は非現実的な仮定に頼り、単純な合成玩具のデータセットでのみ評価される。
生物学、神経科学、地球科学に応用する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:25:06 GMT)
Transformers for Learning on Noisy and Task-Level Manifolds: Approximation and Generalization Insights [47.6] この研究は、多様体上のノイズの多い入力データを含む回帰タスクにおける変換器の性能を分析することによって理論的基礎を確立する。
我々は、多様体の内在次元に決定的に依存する近似と一般化誤差を証明した。
この結果から,入力データに高次元ノイズが伴う場合においても,学習課題における低複雑さ構造を活用できることが示唆された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:05:13 GMT)
The Darkfield Approach to Measuring Vacuum Birefringence and Light-by-Light Couplings -- A Proof-of-Principle Experiment [47.3] 非線形真空応答は、XFEL放射による強集束高強度レーザー場を探索しても非常に小さい。
欧州X線自由電子レーザーの高エネルギー密度科学機器を用いて,本手法の実証実験を行った。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:23:55 GMT)
PFDial: A Structured Dialogue Instruction Fine-tuning Method Based on UML Flowcharts [47.2] このデータセットは、5,055のプロセスノードを含む440のフローチャートから派生した12,705の高品質な中国語対話命令を含む。
PlantUML仕様に基づいて、各フローチャートはアトミックな対話ユニット、すなわち構造化された5タプルに変換される。
実験結果から, たった800サンプルでトレーニングした7Bモデルと, 全データでトレーニングした0.5Bモデルが90%以上の精度を達成できた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:21:17 GMT)
FlashBack:Efficient Retrieval-Augmented Language Modeling for Long Context Inference [47.0] 大規模言語モデル(LLM)を外部コーパスから関連文書と統合した検索言語モデリング(RALM)は,情報生成の実証手法である。
検索したコンテンツを利用する以前の作業は、単に入力にプリプロンプトするだけで実行時の問題が発生する。
我々は、付加コンテキストパターンを用いて、ALMの推論効率を改善するために設計されたモジュラーALMであるFlashBackを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:32:26 GMT)
Spatiotemporal Field Generation Based on Hybrid Mamba-Transformer with Physics-informed Fine-tuning [46.7] この研究は、訓練されたモデルによる物理場の生成における物理方程式の相当な相違に直面する。
HMT-PFという名称の物理場生成モデルは、ハイブリッドのMamba-Transformerアーキテクチャに基づいて開発されている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:02:43 GMT)
Generative Representational Learning of Foundation Models for Recommendation [45.9] RecFoundは、レコメンデーションファウンデーションモデルのための生成的表現型学習フレームワークである。
生成タスクと埋め込みタスクの両方をカバーするレコメンデーションファンデーションモデルのための、最初の包括的なデータセットを構築した。
RecFoundはさまざまなレコメンデーションタスクで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:54:12 GMT)
Rethinking Multilingual Vision-Language Translation: Dataset, Evaluation, and Adaptation [45.6] 視覚言語翻訳は、画像に埋め込まれた多言語テキストを正確に認識する必要がある課題である。
本稿では,データ品質,モデルアーキテクチャ,評価指標の3つの重要な視点からVLTを総合的に検討する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:23:38 GMT)
Dynamic Mixture of Curriculum LoRA Experts for Continual Multimodal Instruction Tuning [45.0] マルチモーダル大規模言語モデル(MLLM)を進化タスクに適用するには,連続的マルチモーダル命令チューニングが不可欠である。
そこで本稿では,MLLMのアーキテクチャをパラメータ予算で自動的に進化させ,新しいタスクに継続的に適応する新しいD-MoLE法を提案する。
具体的には、動的レイヤワイド・エキスパート・アロケータを提案し、アーキテクチャの衝突を解決するために、レイヤ間でLoRA専門家を自動的に割り当てる。
そこで我々は,MLLMにおける各モジュールの更新率を,各モジュールの難易度に基づいて調整する,勾配に基づくモーダル間連続カリキュラムを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:03:46 GMT)
Local and global approaches to the thermodynamics of pure decoherence processes in open quantum systems [45.0] オープン量子系における純脱コヒーレンス過程の非平衡熱力学を熱貯水池に結合して研究する。
局所的なアプローチでは熱力学量(英語版)は開系の自由度のみを指すが、大域的なアプローチでは、ある量は明確に自由度(英語版)を参照することによって定義される。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:03:21 GMT)
EgoPrivacy: What Your First-Person Camera Says About You? [43.7] EgoPrivacyは、エゴセントリックなビジョンにおけるプライバシーリスクの包括的な評価のための、最初の大規模なベンチマークである。
本研究では,エゴ・ツー・エクソ検索を外部中心の動画プールから活用し,人口プライバシー攻撃の有効性を高める新たな攻撃戦略であるRetrieval-Augmented Attackを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 22:19:54 GMT)
Artemis: Efficient Commit-and-Prove SNARKs for zkML [42.2] 本稿では、zkMLにおけるコミットメント検証の課題を効果的に解決する新しいコミット・アンド・プロブSNARK構築であるArtemisを紹介する。
提案手法は既存手法よりも大幅に改善され, 証明コストの大幅な削減, 大規模モデルにおいても効率の維持が図られた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:03:21 GMT)
How Well Do Large Language Models Serve as End-to-End Secure Code Agents for Python? [42.1] GPT-3.5 と GPT-4 の 4 つの LLM で生成されたコードの脆弱性を識別し,修復する能力について検討した。
4900のコードを手動または自動でレビューすることで、大きな言語モデルにはシナリオ関連セキュリティリスクの認識が欠けていることが判明した。
修復の1ラウンドの制限に対処するため,LLMにより安全なソースコード構築を促す軽量ツールを開発した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:51:06 GMT)
Thermal state preparation by repeated interactions at and beyond the Lindblad limit [41.9] 本研究は, 繰り返し相互作用プロトコルによる熱流動特性と関連する準備(シミュレーション)時間について検討する。
我々は,Mpemba様の効果を観察する:最大混合状態から中間温度状態への熱化は,低温状態よりも長い時間を要する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:34:49 GMT)
Affogato: Learning Open-Vocabulary Affordance Grounding with Automated Data Generation at Scale [41.7] 我々は、事前学習された部分認識型ビジョンバックボーンとテキスト条件のヒートマップデコーダを利用するビジョン言語モデルを開発した。
我々のモデルは既存の2Dおよび3Dベンチマークにおいて有望な性能を達成し、特にオープン語彙のクロスドメイン一般化において有効であることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:57:18 GMT)
Conformal Linguistic Calibration: Trading-off between Factuality and Specificity [41.5] 本稿では,言語プラグマティクスのレンズを通して,抑止と言語キャリブレーションを結合する枠組みを提案する。
以上の結果から,本手法は実精度に適合した精度で校正出力を生成する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:49:28 GMT)
SignAligner: Harmonizing Complementary Pose Modalities for Coherent Sign Language Generation [41.2] 我々は、広く使われているRWTH-ENIXPHO-Weather 2014Tデータセットの拡張版であるENIX14T+を紹介し、Pose、Hamer、Smplerxの3つの新しいサイン表現を特徴とする。
また,テキスト駆動のポーズ・モダリティ・コジェネレーション,マルチモーダルのオンライン協調補正,現実的な手話合成の3段階からなる手話生成のための手話生成手法であるSignAlignerを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:44:42 GMT)
Fast-DataShapley: Neural Modeling for Training Data Valuation [40.6] 実時間推論速度で再利用可能な説明器モデルをトレーニングするためのワンパス学習手法であるFast-DataShapleyを提案する。
新しいテストサンプルが与えられた場合、トレーニングデータのShapley値を計算するために再トレーニングは必要ない。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:29:20 GMT)
IQE-CLIP: Instance-aware Query Embedding for Zero-/Few-shot Anomaly Detection in Medical Domain [40.6] IQE-CLIPは医療領域における異常検出タスクのための革新的なフレームワークである。
医学領域へのCLIPの適応性を高めるために,クラスベースのプロンプトトークンと学習可能なプロンプトトークンを導入する。
我々のフレームワークはゼロショットタスクと少数ショットタスクの両方で最先端の処理を実現している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:32:12 GMT)
Knapsack and Shortest Path Problems Generalizations From A Quantum-Inspired Tensor Network Perspective [40.6] 我々は、knapsackと最短経路問題を解くために、2つの量子インスピレーション付きアルゴリズムを提案する。
この方法は問題の最適解を返す正確な方程式を与える。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:27:34 GMT)
Long-context Non-factoid Question Answering in Indic Languages [39.7] 質問回答タスクは、与えられたコンテキストから回答を抽出する。
長期のコンテキストは、自己認識機構の複雑さのために課題を引き起こす。
Indic言語におけるQA性能向上のための文脈ショートニング手法について検討した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:09:26 GMT)
Foundation Neural-Network Quantum States [39.5] Foundation Neural-Network Quantum States (FNQS)は、量子多体システムを研究するための統合パラダイムである。
FNQSは基礎モデルの鍵となる原理を活用し、単一の汎用アーキテクチャに基づいて変動波動関数を定義する。
FNQSは、訓練中に遭遇した以上の物理ハミルトニアンに一般化することができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:50:31 GMT)
Scaling Prompt Instructed Zero Shot Composed Image Retrieval with Image-Only Data [39.2] Composed Image Retrieval (CIR)は、テキストに付加された参照画像と一致する画像を取得するタスクである。
画像とテキストのモダリティを効果的に組み合わせた埋め込み型再構成アーキテクチャを提案する。
InstructCIRというモデルでは、CIRRおよびFashionIQデータセット上のゼロショット合成画像検索において、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:31:34 GMT)
Tracing LLM Reasoning Processes with Strategic Games: A Framework for Planning, Revision, and Resource-Constrained Decision Making [38.8] 大規模言語モデル(LLM)は、複雑な推論を必要とするタスクにますます使われている。
モデル動作の理解と信頼性向上には,内部プロセスの測定が不可欠である,と我々は主張する。
計画,修正,資源制約のある意思決定という3つの中核的な側面に沿ってLCMを評価する枠組みを導入する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:59:10 GMT)
Ming-Lite-Uni: Advancements in Unified Architecture for Natural Multimodal Interaction [38.4] Ming-Lite-Uniは、統一されたビジュアルジェネレータとマルチモーダル自動回帰モデルを備えたオープンソースのフレームワークである。
Ming-Lite-Uniはアルファ段階にあり、間もなく改良される。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:49:59 GMT)
DART: Distilling Autoregressive Reasoning to Silent Thought [38.2] CoT(Chain-of-Thought)推論は、複雑なタスクの解決において、LLM(Large Language Models)が大幅に進歩している。
自己回帰的 CoT を非自己回帰的 Silent Thought (ST) に置き換えるための textbfDART (textbf Autoregressive textbfReasoning to Silent textbfThought) を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:05:41 GMT)
Building Interpretable Climate Emulators for Economics [38.2] 我々は、気候変動の経済モデルのための効率的かつ解釈可能な気候エミュレータ(CE)を開発するための枠組みを導入する。
CCEの3つのバージョンについて検討し、簡単な代表者経済モデルで評価する。
地域ベースライン気候,非一様温暖化,およびそれに伴う不確実性が経済被害にどのように伝播するかを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:35:33 GMT)
LLMEval-Med: A Real-world Clinical Benchmark for Medical LLMs with Physician Validation [38.0] 医学における大規模言語モデル (LLMs) の評価は, 医療応用には精度が高く, 誤差の少ないため重要である。
LLMEval-Medは、5つの中核医療領域をカバーする新しいベンチマークであり、現実の電子健康記録から得られた2,996の質問と専門家が設計した臨床シナリオを含む。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:27:57 GMT)
Adiabatic echo protocols for robust quantum many-body state preparation [37.7] 静的摂動の影響を抑制するために設計された状態準備に対する一般的なアプローチである断熱エコープロトコルを導入する。
このようなプロトコルは、制御フィールドの形式に関する仮定を必要とせず、様々な設定で自然に現れることを示す。
このプロトコルの広範な適用性を強調し,現代の量子プラットフォームにおける信頼性の高い多体状態準備のための実践的枠組みを提供する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:01:08 GMT)
Towards Understanding Fine-Tuning Mechanisms of LLMs via Circuit Analysis [37.4] 本稿では,回路解析による微調整プロセスの深い解釈を実現することを目的とする。
我々は、細調整中の様々なチェックポイントの回路を同定し、回路解析、細調整方法、タスク複雑度の間の相互作用を調べる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:32:19 GMT)
Learning Class Prototypes for Unified Sparse Supervised 3D Object Detection [36.9] 本研究では,屋内および屋外の両方のシーンを対象としたスパース制御3次元物体検出手法を提案する。
ScanNet V2, SUN RGB-D, KITTIの完全監視検出器と比較して, 約78%, 90%, 96%の性能が得られた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:15:04 GMT)
Learn to Preserve Personality: Federated Foundation Models in Recommendations [36.9] フェデレーション・ファンデーション・モデル(FFM)は、共有知識を個々の特定の適応から切り離す構造的手段を提供する。
我々は、パーソナライズされたFMを利用して、コンテンツのユーザー決定を導く未来のパーソナルエージェントを構想する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:17:07 GMT)
Topological Phase Transitions and Mixed State Order in a Hubbard Quantum Simulator [36.6] トポロジカル位相遷移は、多体物理学における従来のパラダイムに挑戦する。
このような一次元対称性保護位相間の遷移を観察する。
以上の結果から、トポロジと情報がどのように量子相転移に影響を及ぼすかが示されている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:45:57 GMT)
Byzantine Outside, Curious Inside: Reconstructing Data Through Malicious Updates [36.3] フェデレートラーニング(FL)は、生データを共有せずに分散機械学習を可能にする。
一般に採用されているFLプロトコルでは、プライバシリークが可能である。
FLに新たな脅威モデルを導入し、悪意ある好奇心をそそるクライアントと名づけた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:23:41 GMT)
TreeRL: LLM Reinforcement Learning with On-Policy Tree Search [36.1] 木探索による強化学習(RL)は,従来の推論タスクにおいて優れた性能を示した。
本稿では、RL学習のためのオンラインツリー検索を直接組み込んだ強化学習フレームワークであるTreeRLを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:52:37 GMT)
AbsenceBench: Language Models Can't Tell What's Missing [35.4] 我々はAbsenceBenchを導入し、大きな言語モデルの能力を評価し、不足した情報を検出する。
実験の結果,最先端モデルでもF1スコアは69.6%であり,平均コンテキスト長は5Kであることがわかった。
トランスフォーマーのアテンションメカニズムは、文書の「ギャップ」に簡単には対応できない。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:38:29 GMT)
High-speed and high-connectivity two-qubit gates in long chains of trapped ions [35.4] インパルススピン依存励起は、最大40イオンの準均一鎖において高忠実な非局所エンタングリング演算を行うために用いられる。
我々は、鎖内の任意のイオン対間のフォノンによる絡み合いの機構を特定し、鎖内の2つのイオン対は、およそ1.3-2中心の振動周期で絡み合うことができる。
これらの結果は、インパルススピン依存励起に基づくエンタングリングゲートが、短期イオントラップ装置における大規模計算の新たな可能性を示していることを示唆している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:09:06 GMT)
VFaith: Do Large Multimodal Models Really Reason on Seen Images Rather than Previous Memories? [34.8] 本稿では,MLLMの視覚的推論能力を評価する最初のベンチマークであるVFaith-Benchを紹介する。
VFaith-Benchは755のエントリを5つの異なるサブセットに分割し、追加の人間ラベルの知覚タスクを含む。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:27:45 GMT)
Wi-CBR: WiFi-based Cross-domain Behavior Recognition via Multimodal Collaborative Awareness [34.3] WiFiに基づく人間の行動認識は、無線信号のバリエーションを分析することによって、ジェスチャーや活動を認識することを目的としている。
動的経路長の変化を反映した位相データと、ジェスチャー動作の速度に関連する周波数変化に対応するドップラーシフト(DFS)データを活用することにより、これらの特徴の効率的な相互作用と融合を可能にし、認識精度を向上させる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:38:57 GMT)
Cartridges: Lightweight and general-purpose long context representations via self-study [34.0] 大規模な言語モデルは、大きなテキストコーパスに埋もれたクエリに答えるためにしばしば使用される。
本研究では,コーパスに関する合成会話を生成し,文脈蒸留目的のカートリッジを訓練する学習レシピを提案する。
自己学習で訓練したCartridgesは、ICLの機能を複製するが、提供コストはかなり安い。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:58:55 GMT)
Impact of Frame Rates on Speech Tokenizer: A Case Study on Mandarin and English [33.7] マンダリンと英語を調べた結果,フレームレートの変動が音声のトークン化に与える影響について検討した。
我々は、異なるフレームレートで音声を符号化し、音声認識タスクにおける結果のセマンティックトークンを評価する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:21:25 GMT)
MambaVSR: Content-Aware Scanning State Space Model for Video Super-Resolution [33.5] 超高解像度ビデオのための最初の状態空間モデルフレームワークであるMambaVSRを提案する。
MambaVSRは共有コンパス構築(SCC)とコンテンツ認識シーケンス化(CAS)を通じて動的相互作用を可能にする
CASモジュールは、学習された空間秩序に沿って時間的特徴をインターリーブすることにより、複数のフレームにまたがる非局所的な類似コンテンツを効果的に調整し集約する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:22:28 GMT)
DRIFT: Dynamic Rule-Based Defense with Injection Isolation for Securing LLM Agents [33.4] 大規模言語モデル(LLM)は、強力な推論と計画能力のため、エージェントシステムの中心となってきています。
この相互作用は、外部ソースからの悪意のある入力がエージェントの振る舞いを誤解させる可能性がある、インジェクション攻撃のリスクも引き起こす。
本稿では,信頼に値するエージェントシステムのための動的ルールベースの分離フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:01:09 GMT)
Vision Transformer with Adversarial Indicator Token against Adversarial Attacks in Radio Signal Classifications [33.2] 本稿では,新たな視覚変換器(ViT)アーキテクチャを提案する。
提案したAdvIトークンは,ViT内の重要な要素として機能し,注意重みに影響を及ぼし,不審または異常な可能性のある入力データ内の領域や特徴を強調する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:21:54 GMT)
Efficient Multi-Camera Tokenization with Triplanes for End-to-End Driving [33.2] 自動回帰トランスフォーマーは、エンド・ツー・エンドのロボットと自律走行車(AV)ポリシーアーキテクチャとしてますます普及している。
本稿では,3次元ニューラル再構成とレンダリングの最近の進歩を生かした,効率的な三面体ベースのマルチカメラトークン化戦略を提案する。
大規模AVデータセットと最先端のニューラルシミュレータの実験は、我々のアプローチが現在の画像パッチベースのトークン化戦略よりも大幅に節約できることを示した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:56:52 GMT)
SemanticSplat: Feed-Forward 3D Scene Understanding with Language-Aware Gaussian Fields [33.1] ホロスティックな3Dシーン理解は、拡張現実やロボットインタラクションといったアプリケーションには不可欠だ。
既存のフィードフォワード3Dシーン理解手法(例えば、LSM)は、シーンから言語ベースのセマンティクスを抽出することに限定されている。
フィードフォワード型セマンティック3D再構成手法であるSemanticSplatを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:30:38 GMT)
Correcting for finite statistics effects in a quantum steering experiment [33.0] 本稿では,実験的な確率分布における信号効果を補正する一方的なデバイス非依存プロトコルを提案する。
以上の結果から, 既往の最先端不平等よりも, 違反の可能性が著しく高いことが明らかとなった。
この研究は、絡み合い検証のための半定値プログラミングのパワーを示し、量子ネットワークを実用的な応用に近づける。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:09:16 GMT)
Large Language Model Inference Acceleration: A Comprehensive Hardware Perspective [32.8] 大規模言語モデル(LLM)は、様々な分野において顕著な能力を示している。
GPTシリーズやLlamaシリーズのようなLLMは、アルゴリズム性能が優れているため、現在主要な焦点となっている。
様々なハードウェアプラットフォームは異なるハードウェア特性を示しており、LLM推論性能を向上させるのに役立つ。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:20:54 GMT)
Long-Short Alignment for Effective Long-Context Modeling in LLMs [32.1] 大きな言語モデル(LLM)は、驚くべきパフォーマンスと驚くべき創発的な特性を示しています。
長さの一般化 -- トレーニング中に見られるものよりも長いシーケンスに一般化する能力 -- は、古典的で基本的な問題である。
textbflong-shortアライメント -- 長さの異なるシーケンス間の出力分布の一貫性 -- の重要な役割を強調します。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:25:39 GMT)
Vision-Language Models for Edge Networks: A Comprehensive Survey [32.1] Vision Large Language Models (VLM)は、視覚的理解と自然言語処理を組み合わせることで、画像キャプション、視覚的質問応答、ビデオ分析などのタスクを可能にする。
VLMは、自動運転車、スマート監視、ヘルスケアといった分野にまたがる印象的な機能を示している。
リソース制約のあるエッジデバイスへのデプロイメントは、処理能力、メモリ、エネルギー制限のため、依然として困難である。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:20:30 GMT)
Prohibited Items Segmentation via Occlusion-aware Bilayer Modeling [31.8] セキュリティX線画像における禁止アイテムのインスタンスセグメンテーションは、非常に重要な課題である。
これは主に、X線画像における禁止アイテムと自然物との間の顕著な外見ギャップによって引き起こされる。
本稿では,X線画像中の禁止項目を識別するオクルージョン対応のインスタンスセグメンテーションパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:48:55 GMT)
Motion-R1: Chain-of-Thought Reasoning and Reinforcement Learning for Human Motion Generation [31.5] Motion-R1は、Chain-of-Thoughtメカニズムを統合したモーション言語モデリングフレームワークである。
複雑なテキスト命令を論理的に構造化されたアクションパスに明示的に分解することで、モーションR1はモーション生成のための高レベルなセマンティックガイダンスを提供する。
複数のベンチマークデータセットに対する実験では、Motion-R1は最先端の手法と比較して、競争力や優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:28:20 GMT)
A Benchmark for Generalizing Across Diverse Team Strategies in Competitive Pokémon [31.0] Pok'emon Video Game Championships (VGC) は、チーム構成が極端に広い領域である。
重要なインフラストラクチャを提供し、評価プロトコルを標準化し、ヒューマンプレイデータセットを提供するベンチマークであるVGC-Benchを紹介します。
エージェントが単一チーム構成でトレーニングされ評価される制限された環境では、我々のメソッドはプロのVGC競合相手に勝つことができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:31:07 GMT)
TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes [30.9] 複雑なビジュアルテキスト生成(CVTG)は、視覚画像内の様々な領域に分散した複雑なテキストコンテンツを生成することに焦点を当てている。
InGでは、画像生成モデルはしばしば歪んだ、ぼやけたビジュアルテキストをレンダリングするか、あるいは視覚的なテキストを欠いている。
我々は,新しいマルチビジュアルテキストレンダリング手法であるTextCrafterを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:41:41 GMT)
DeepResearch Bench: A Comprehensive Benchmark for Deep Research Agents [30.8] DeepResearch Benchは100のPhDレベルの研究タスクからなるベンチマークである。
ディープリサーチエージェントの評価は本質的に複雑で、労働集約的である。
本稿では,人間の判断に強く適合する2つの新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:17:32 GMT)
Tensor-Var: Efficient Four-Dimensional Variational Data Assimilation [30.6] 4次元変分同化(4D-Var)は複雑な非線形系において高い計算コストに直面し、不完全な状態-観測写像に依存する。
深層学習(DL)は、より表現力のある近似器を提供する一方、DLモデルを4D-Varに統合することは、それらの非線形性と同化結果における理論的保証の欠如により困難である。
本稿では,カーネル条件付き平均埋め込み(CME)を4D-Varと統合して非線形力学を線形化し,学習した特徴空間における凸最適化を実現する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 00:46:38 GMT)
Conformal Risk Control [30.5] 我々はコンフォメーション予測を拡張して,任意の単調損失関数の期待値を制御する。
また, 分散シフト, 量子リスク制御, 複数対逆リスク制御, およびU統計学の期待に対する考え方の拡張についても紹介する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:38:23 GMT)
Combining Deep Reinforcement Learning and Search with Generative Models for Game-Theoretic Opponent Modeling [30.5] 深層ゲーム理論強化学習を用いた対戦型モデリングのためのスケーラブルで汎用的なマルチエージェントトレーニングシステムを提案する。
まず,モンテカルロ木探索(MCTS)に基づく最適応答アルゴリズムGenBRを提案する。
我々は,政策空間対応オラクル (PSRO) の枠組みの下で,この新たな手法を用いて,エホフライン反対モデルの自動生成を行う。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:38:03 GMT)
Preserving Clusters in Prompt Learning for Unsupervised Domain Adaptation [29.8] この研究は、ベース擬似ラベルを強化し、ターゲット・プロンプト学習を促進する新しいソリューションを導入している。
まず、ソースとターゲットの視覚的埋め込みの関係に基づき、参照予測を活用することを提案する。
その後、事前学習したマルチモーダルモデルにおいて、視覚とテキストの埋め込みの間に強いクラスタリングの挙動が観察されていることを示した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:33:27 GMT)
Quantitative Analysis of Performance Drop in DeepSeek Model Quantization [29.7] DeepSeek-R1とV3のパフォーマンスは、量子化後にどうなるのかは不明だ。
本技術報告では,DeepSeekモデルスペクトル全体にわたるマルチビット幅量子化の定量的評価を行った。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:25:10 GMT)
DTHA: A Digital Twin-Assisted Handover Authentication Scheme for 5G and Beyond [28.9] ディジタルツインを利用したセキュアかつ効率的なハンドオーバ認証手法を提案する。
デジタルツインは、セキュアな相互認証とキーネゴシエーションを行う際に、計算処理と対応するMDの支援を行うことができる。
性能評価の結果,提案手法は信号処理,計算,通信オーバーヘッドの面で,最も優れた手法であることがわかった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:59:14 GMT)
Attention-based Adversarial Robust Distillation in Radio Signal Classifications for Low-Power IoT Devices [28.9] 変換器をベースとした無線信号の分類は、敵の例と呼ばれる、知覚不能で慎重に構築された攻撃に対して脆弱であることを示す。
本稿では,変圧器を用いた変調分類における逆例に対する防御システムを提案する。
新しい手法は、頑健に訓練された大型変圧器からコンパクトな変圧器へ対向的な注意マップを転送することを目的としている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:39:01 GMT)
BOUQuET: dataset, Benchmark and Open initiative for Universal Quality Evaluation in Translation [28.5] BOUQuETはマルチウェイ、マルチ中心、マルチレジストリ/ドメインのデータセットとベンチマークである。
このデータセットは8つの非英語言語で手作りされている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:08:13 GMT)
ProVox: Personalization and Proactive Planning for Situated Human-Robot Collaboration [28.3] 協調型ロボットは、パートナーの意図や好みに迅速に適応し、積極的に有用な行動を特定する必要がある。
ProVoxは、ロボットが個人の協力者に効率よくパーソナライズし、適応できる新しいフレームワークである。
分析の結果,メタプロンプトとプロアクティブの両方が重要であり,タスク完了時間が38.7%,ユーザ負担が31.9%減少した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:50:10 GMT)
VulStamp: Vulnerability Assessment using Large Language Model [28.3] VulStampは、記述不要の脆弱性評価を容易にする、意図誘導型フレームワークである。
意図的な情報に基づいて、VulStampは脆弱性評価にプロンプトチューニングされたモデルを使用する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:14:56 GMT)
Structure-Aware Automatic Channel Pruning by Searching with Graph Embedding [28.0] チャネルプルーニングはディープニューラルネットワークの計算オーバーヘッドを低減するための強力な技術である。
ネットワークトポロジをモデル化し,各チャネルのグローバルな重要性を学習するための,構造対応自動チャネルプルーニング(SACP)フレームワークを提案する。
SACPは圧縮効率と精度保持の競争力において最先端のプルーニング法より優れている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:05:35 GMT)
A Fast, Reliable, and Secure Programming Language for LLM Agents with Code Actions [28.0] 我々はQuasarと呼ばれるコードアクションのためのプログラミング言語を提案する。
LLMはPythonのサブセットでコードを書くことができ、自動的にQuasarに変換される。
Quasarアクションを持つLLMは高いパフォーマンスを維持し、可能な限り実行時間を42%削減する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:11:22 GMT)
On the Effectiveness of Integration Methods for Multimodal Dialogue Response Retrieval [27.8] 本研究は,対話システムがテキストや画像などの様々なモードで応答を出力する方法を考察する。
本稿では,2段階のアプローチとエンドツーエンドのアプローチに基づく3つの統合手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:50:02 GMT)
AtlasD: Automatic Local Symmetry Discovery [27.8] 本稿では、局所対称性の概念をアトラス同値として定式化する。
提案するパイプライン,自動局所対称性探索(AtlasD)は,局所予測ネットワークを訓練することにより関数の局所対称性を回復する。
検出された局所対称性は、気候セグメンテーションや視覚タスクにおける下流タスクのパフォーマンスを向上させる有用な帰納バイアスであることが示されている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:26:18 GMT)
Towards Robust Recommendation: A Review and an Adversarial Robustness Evaluation Library [27.5] 本稿では,レコメンデータシステムの堅牢性について概観する。
本研究では,レコメンダシステムのロバスト性を,対角的ロバストネスと非対角的ロバストネスに分類する。
本稿では,レコメンデータシステムの堅牢性と今後の研究方向性について論じる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:36:23 GMT)
Efficient Long-Context LLM Inference via KV Cache Clustering [26.0] 既存のアプローチは、将来の世代に必要な潜在的に重要な情報を破棄するか、高い計算オーバーヘッドのために限られた効率向上を提供するかのいずれかである。
我々はオンラインKVキャッシュクラスタリングのためのシンプルだが効果的なフレームワークであるChelseaを紹介した。
Chelseaは、同等のモデル性能を維持しながら、最大80%のKVキャッシュメモリ使用率の削減を実現している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:36:15 GMT)
Investigating Vulnerabilities and Defenses Against Audio-Visual Attacks: A Comprehensive Survey Emphasizing Multimodal Models [25.2] マルチモーダル・大規模言語モデル(MLLM)は、音声・視覚処理と自然言語処理のギャップを埋める。
MLLMの優れた性能にもかかわらず、高品質なオーディオ視覚訓練データと計算資源の不足は、サードパーティのデータとオープンソースのMLLMの利用を必要とする。
実証的研究は、最新のMLLMを操作して悪意のある、または有害なコンテンツを生成できることを実証している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:22:36 GMT)
An overview of domain-specific foundation model: key technologies, applications and challenges [25.1] ドメイン固有基盤モデル(FM)のカスタマイズは、汎用モデルの制限に対処する。
この記事では、ドメイン固有のFMをカスタマイズするための方法論について、タイムリーかつ網羅的に概説する。
基本的な概念を導入し、一般的なアーキテクチャの概要を説明し、ドメイン固有のモデルを構築するための重要な方法を調査します。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:03:31 GMT)
Post Persona Alignment for Multi-Session Dialogue Generation [25.1] Post Persona Alignment (PPA)はパーソナライズされた対話生成のための新しい2段階のフレームワークである。
まず、対話コンテキストのみに基づく一般的な応答を生成し、その応答をクエリとして使用して関連するペルソナ記憶を検索し、最後に話者のペルソナと整合する応答を洗練する。
マルチセッションLPM生成対話データを用いた実験により、PPAは、一貫性、多様性、ペルソナ関連性において、従来のアプローチよりも顕著に優れていることが示された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:04:01 GMT)
Accelerating Diffusion Large Language Models with SlowFast Sampling: The Three Golden Principles [25.1] 拡散に基づく言語モデル (dLLMs) は従来の自己回帰型LLMに代わる有望な代替品として登場した。
信頼ベースや半自己回帰復号のような既存のdLLMのサンプリング戦略は、しばしば静的な振る舞いに悩まされる。
探索段階と高速化段階を交互に行う新しい動的サンプリング手法であるSlowFast Smplingを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:28:47 GMT)
KCES: Training-Free Defense for Robust Graph Neural Networks via Kernel Complexity [24.9] グラフニューラルネットワーク(GNN)は、小さくて知覚できない摂動や敵の攻撃に対して非常に脆弱である。
本稿では,KCES(Kernel Complexity-Based Edge Sanitization)を提案する。
KCESは一貫してGNNの堅牢性を高め、最先端のベースラインを上回り、既存の防御効果を増幅する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:33:41 GMT)
MAGPIE: Multi-Task Media-Bias Analysis Generalization for Pre-Trained Identification of Expressions [24.6] MAGPIEは、メディアバイアス検出用に明示的に調整された、最初の大規模マルチタスク事前学習アプローチである。
Bias By Expertsデータセットでは、メディアバイアス検出のこれまでのアプローチよりも優れています。
シングルタスクアプローチと比較して、微調整ステップの15%しか必要ありません。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:03:21 GMT)
Causal Effect Identification in Heterogeneous Environments from Higher-Order Moments [24.5] 本研究では, 治療変数の因果効果が, 潜伏した共同創設者の存在下での結果に与える影響について検討した。
本研究では,データ生成機構のパラメータが環境によって異なる限り,因果効果を推定するためのモーメントに基づくアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:11:37 GMT)
JBBQ: Japanese Bias Benchmark for Analyzing Social Biases in Large Language Models [24.4] 本稿では,英語バイアスベンチマークBBQに基づいて,質問回答のための日本語バイアスベンチマークデータセット(JBBQ)を構築した。
JBBQの精度が向上した現在の日本語LLMでは,そのバイアススコアが増大していることが示されている。
社会的バイアスと思考の連鎖について警告を発し、モデル出力におけるバイアスの効果を減少させる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:44:56 GMT)
E2MPL:An Enduring and Efficient Meta Prompt Learning Framework for Few-shot Unsupervised Domain Adaptation [24.3] Few-shot unsupervised domain adaptation (FS-UDA) は、ソースドメインからのラベル付きデータの限られた量を利用して、ラベルなしのターゲットドメインの正確な分類を可能にする。
本稿では,FS-UDAのためのEnduring and Efficient Meta-Prompt Learning (E2MPL) という新しいフレームワークを提案する。
このフレームワークでは,事前学習したCLIPモデルを特徴学習のバックボーンとして利用する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:30:08 GMT)
Deep Sparse Latent Feature Models for Knowledge Graph Completion [24.3] 本稿では,深部変分オートエンコーダ(VAE)により最適化されたスパース潜時特徴モデルを用いた新しい確率的KGCフレームワークを提案する。
提案手法は, 局所的なテキスト特徴を持つ動的クラスタリング情報を用いて, 欠落した三重項を効果的に完遂すると同時に, 基礎となる潜在構造を解釈しやすくする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:01:26 GMT)
Prioritizing Alignment Paradigms over Task-Specific Model Customization in Time-Series LLMs [24.3] 本稿では,Large Language Models (LLMs) を用いた時系列推論への移行を提唱する。
これは、しばしばコストがかかり、柔軟性がなく、非効率である現在の時系列推論アプローチの中核的な制限に対処する。
提案するアライメントパラダイムは,インジェクティブアライメント,ブリッジングアライメント,インテリアアライメントの3つである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:13:05 GMT)
A Neural Rejection System Against Universal Adversarial Perturbations in Radio Signal Classification [24.0] 普遍的対向的摂動に対する防御システムであるニューラルリジェクションシステムを提案する。
提案するニューラルリジェクションシステムは,未定義のディープニューラルネットワークよりもはるかに高い精度で,普遍的対向摂動を防御できることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:52:07 GMT)
Environmental Change Detection: Toward a Practical Task of Scene Change Detection [23.8] 本研究では,空間環境を協調的に理解し,変化を検出する新しい枠組みを提案する。
我々は、複数の参照候補を活用し、変更検出のために意味的にリッチな表現を集約することで、この制限に対処する。
ECDのために再構成された3つの標準ベンチマークセットに対して,本フレームワークの評価を行い,最先端手法の簡単な組み合わせを著しく上回った。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:09:43 GMT)
EMLoC: Emulator-based Memory-efficient Fine-tuning with LoRA Correction [23.7] オープンソースファウンデーションモデルは急速に採用され開発され、多様なドメインにまたがる強力な汎用機能を実現している。
しかし、ドメイン固有のタスクやパーソナライズされたタスクのための微調整された大規模な基礎モデルは、推論以上のメモリオーバーヘッドのため、ほとんどのユーザにとって高価である。
我々は,LoRA補正を用いたエミュレータベースのメモリ効率の高い微調整フレームワークであるoCを導入し,推論に要する同じメモリ予算内でモデル微調整を可能にする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:59:58 GMT)
Smart Buildings Energy Consumption Forecasting using Adaptive Evolutionary Ensemble Learning Models [23.7] 本稿では,Baging,Stacking,Vottingの3つのハイブリッドアンサンブル予測モデルと,高速かつ効果的な進化的ハイパーパラメータチューナを組み合わせることを提案する。
ベルギーのモンス州スタンブロークに18個のセンサを設置し, 気象パラメータ, 家電エネルギー使用量, 温度, 湿度, 照明エネルギー消費のハイブリッドデータセットを用いて, 提案したエネルギー予測モデルの性能を評価した。
予測結果は,適応的進化的バッグングモデルが,精度と学習誤差の両方で他の予測モデルを上回ったことを示している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:13:15 GMT)
From Emergence to Control: Probing and Modulating Self-Reflection in Language Models [23.2] 自己回帰は、検証可能な報酬を伴う強化学習によって実現される強力な行動である。
自己回帰は微調整モデルに限らないことを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:40:13 GMT)
Foundation Models in Medical Imaging -- A Review and Outlook [23.1] 基礎モデル(FM)は、未ラベルデータの大規模な収集から学んだ医療画像の分析方法を変えつつある。
本稿では,FMの病態,放射線学,眼科領域への応用について検討する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:07:06 GMT)
TongSearch-QR: Reinforced Query Reasoning for Retrieval [22.8] TongSearch QRは、クエリ推論と推論集約検索における書き換えのための、小規模言語モデルのファミリーである。
半ルールに基づく新たな報酬関数により、より小さな言語モデルを実現する強化学習アプローチを採用する。
BRIGHTベンチマークの実験結果によると、BM25をリトリーバーとして、TongSearch QR-7BとTongSearch QR-1.5Bモデルの両方が既存のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:17:36 GMT)
Understanding the Emergence of Multimodal Representation Alignment [22.8] 最近の研究のラインでは、スケールとパフォーマンスが増大する独立に訓練されたユニモーダルモデル同士が暗黙的に一致していることが判明している。
本研究では、アライメントの出現とタスクパフォーマンスとの関係が、いくつかの重要なデータ特性に依存することを示す。
我々の研究結果は、アライメントは普遍的に有益ではなく、データセットやタスクによってパフォーマンスへの影響が変わることを示唆している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:11:45 GMT)
Because we have LLMs, we Can and Should Pursue Agentic Interpretability [22.1] 大規模言語モデル(LLM)は、ユーザのメンタルモデルの開発と活用によって、人間の理解を積極的に支援する。
エージェント的解釈性は、特に評価において、私たちが「ループの絡み合い」と呼ぶ性質のために、課題をもたらす。
エージェントの解釈可能性の約束は、人間がLLMの潜在的な欺く概念を学ぶのを助けることである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:13:58 GMT)
LLaVA-CMoE: Towards Continual Mixture of Experts for Large Vision-Language Models [21.9] LLaVA-CMoEは、大規模言語モデルの継続的な学習フレームワークである。
Probe-Guided Knowledge Extensionメカニズムは、いつ、どこで新しいエキスパートを追加するべきかを決定する。
Probabilistic Task Locatorは各タスクを専用軽量ルータに割り当てる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:04:13 GMT)
Where is the Truth? The Risk of Getting Confounded in a Continual World [21.9] データセットは、新たなデータへの一般化に失敗する急激な相関によって、最も容易に解決される場合、構築される。
共同創設者がタスク間で時間的に異なるような継続的な学習環境では、共同創設者の効果を緩和するという課題は、標準的な忘れる問題よりもはるかに多い。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:54:03 GMT)
Med-PRM: Medical Reasoning Models with Stepwise, Guideline-verified Process Rewards [21.8] Med-PRMは、確立した医療知識ベースに対する各推論ステップを検証するためのプロセス報酬モデリングフレームワークである。
Med-PRMは最先端のパフォーマンスを実現し、ベースモデルの性能を最大13.50%向上させた。
我々は、Med-PRMの汎用性を、Meerkatのような強力なポリシーモデルとプラグイン・アンド・プレイ方式で統合することで示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:36:30 GMT)
SoK: Automated Vulnerability Repair: Methods, Tools, and Assessments [21.8] 手動による脆弱性の修復は、人間の専門家に依存しているため、労働集約的で時間を要する。
本稿では,脆弱性分析,パッチ生成,パッチ検証という3段階のワークフローを通じて,メソッドの体系化について述べる。
Vul4Cを使ってC/C++プログラムの7つのツールを評価し、サードパーティのVul4Jデータセットを使ってJavaプログラムの2つのツールを評価します。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:59:04 GMT)
Self-supervised Learning of Echocardiographic Video Representations via Online Cluster Distillation [21.7] 心エコービデオ表現学習のための自己教師型デュアルブランチフレームワークであるdisCOVRについて述べる。
DISCOVRは、時間的ダイナミクスをモデル化するクラスタリングベースのビデオエンコーダと、きめ細かい空間意味論を抽出するオンライン画像エンコーダを組み合わせる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:36:33 GMT)
Distribution free M-estimation [21.2] 本稿では,このような仮定のない環境で凸M推定や最適化が解ける場合に特徴付ける。
我々は、おそらく意外なことに、最小化される損失のリプシッツ連続性が分布自由化には必要ないことを示した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 22:07:28 GMT)
LLM-Assisted Relevance Assessments: When Should We Ask LLMs for Help? [21.0] テストコレクションは、研究者が素早く簡単にランキングアルゴリズムを評価することができる情報検索ツールである。
より安価な代替手段として、近年の研究では、人間のアセスメントを完全に置き換えるために大きな言語モデル(LLM)が提案されている。
LARAは、手動アノテーションとLLMアノテーションのバランスをとる効果的な方法であり、低予算でもリッチで信頼性の高いテストコレクションを構築するのに役立つ。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:52:31 GMT)
Feedback Friction: LLMs Struggle to Fully Incorporate External Feedback [21.0] LLMは外部からのフィードバックを受けると応答を改善する能力を持っている。
これらのモデルが外部からのフィードバックをいかに効果的かつ徹底的に組み込むことができるかは、まだ不明である。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:31:51 GMT)
Unsafe LLM-Based Search: Quantitative Analysis and Mitigation of Safety Risks in AI Web Search [20.8] 7 つの生産 AIPSE の安全リスク定量化を行う。
その結果,AIPSEは悪質なURLを含む有害なコンテンツを頻繁に生成することがわかった。
GPT-4.1ベースのコンテンツリファインメントツールとURL検出機能を備えたエージェントベースディフェンスを開発した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:49:36 GMT)
3D-WAG: Hierarchical Wavelet-Guided Autoregressive Generation for High-Fidelity 3D Shapes [20.7] 本研究では,非条件形状生成が可能な3次元暗黙距離場のためのARモデルである3D-WAGを紹介する。
3次元AR生成タスクを次のスケールの予測として再定義することにより、生成の計算コストを削減できる。
以上の結果から,3D-WAGはCoverageやMDといった重要な指標において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:57:15 GMT)
MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning [20.4] 我々は、MMMG(Massive Multi-Discipline Multi-Tier Knowledge- Image Generation Benchmark)とともに、知識画像生成を新しいタスクとして導入する。
MMMGは10の分野、6の教育レベル、チャート、図、マインドマップといった多様な知識形式にまたがる4,456のエキスパート公認(知識)イメージプロンプトペアを提供している。
そこで本稿では,KG間のグラフ編集距離と視覚的明瞭度とを組み合わせ,実感的忠実度を評価するためのMMMGスコアを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:39:54 GMT)
Improving the Calibration of Confidence Scores in Text Generation Using the Output Distribution's Characteristics [20.3] よく校正されたモデル信頼スコアは、テキスト生成モデルの有用性を向上させることができる。
生成に適したタスク非依存の信頼性指標を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:30:44 GMT)
Taming Stable Diffusion for Computed Tomography Blind Super-Resolution [20.2] 高分解能CTは診断に必須であるが,放射線曝露の増大が必要である。
深層学習法はCTの超解像において有望であるが、複雑な劣化と限られた医療訓練データに関する課題に直面している。
我々は,CTブラインド超解像に安定拡散を適応させる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:45:05 GMT)
PLeak: Prompt Leaking Attacks against Large Language Model Applications [20.1] プロンプトリークと呼ばれる自然な攻撃は、LLMアプリケーションからシステムプロンプトを盗むことである。
本稿では, PLeak と呼ばれる新しいクローズドボックス・プロンプト・リーク・アタック・フレームワークを設計し, 対向クエリを最適化する。
この結果から,PLeakはシステムプロンプトを効果的にリークし,手動でクエリをキュレートするベースラインだけでなく,性能も著しく向上することが示された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:24:21 GMT)
Multiverse: Your Language Models Secretly Decide How to Parallelize and Merge Generation [20.1] 並列生成が可能な新しい生成モデルであるMultiverseを導入する。
次に,データ,アルゴリズム,システムの共設計キュレーションを用いた実世界のマルチバース推論モデルを構築した。
データ作成のために,自動LLM支援パイプラインであるMultiverse Curatorを開発した。
また、並列推論をサポートするために、Multiverse Engineを実装しています。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:39:20 GMT)
Geometry-Aware Edge Pooling for Graph Neural Networks [20.1] グラフニューラルネットワーク(GNN)は、グラフベースのタスクで大きな成功を収めている。
現実世界のアプリケーションにおける大規模なデータセットの普及により、プール層はGNNの重要なコンポーネントである。
本稿では,エッジ崩壊による構造を考慮した新しいグラフプーリング層を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:01:46 GMT)
Foundation Models for Anomaly Detection: Vision and Challenges [20.0] ファンデーションモデル(FM)は、異常検出を前進させる強力なツールとして登場した。
本調査では,FMによる異常検出の最近の進歩を概観する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:54:07 GMT)
DiffTORI: Differentiable Trajectory Optimization for Deep Reinforcement and Imitation Learning [19.8] 本稿では、微分軌道最適化をポリシー表現として活用し、深層強化と模倣学習のためのアクションを生成するDiffTORIを提案する。
15のモデルベースRLタスクと35の模倣学習タスクに高次元画像と点クラウド入力があり、DiffTORIはどちらのドメインでも最先端の手法よりも優れている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:41:59 GMT)
crossMoDA Challenge: Evolution of Cross-Modality Domain Adaptation Techniques for Vestibular Schwannoma and Cochlea Segmentation from 2021 to 2023 [19.8] クロスモダリティドメイン適応 (cross-Modality Domain Adaptation,crossMoDA) シリーズの2022年版と2023年版について報告する。
2023年版での勝利は、2021年版と2022年の試験データにおけるアウトレーヤの数を減らした。
臨床的に許容されるVSセグメンテーションにはまだ進歩が必要だが、高評価は、より困難なクロスモーダルタスクが将来のベンチマークに役立つことを示唆している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:56:39 GMT)
Fast Point Cloud Geometry Compression with Context-based Residual Coding and INR-based Refinement [19.6] 我々は、KNN法を用いて、原表面点の近傍を決定する。
条件付き確率モデルは局所幾何学に適応し、大きな速度減少をもたらす。
暗黙のニューラル表現を精製層に組み込むことで、デコーダは任意の密度で下面の点をサンプリングすることができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:23:56 GMT)
A Self-supervised Motion Representation for Portrait Video Generation [19.6] 本稿では,コンパクトかつ表現力のある動き表現であるセマンティックラテントモーション(SeMo)を提案する。
提案手法は,高品質な視覚的結果と効率的な推論を両立させる。
我々のアプローチは、現実主義の81%の勝利率を持つ最先端モデルを上回る。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:15:20 GMT)
MergeBench: A Benchmark for Merging Domain-Specialized LLMs [19.5] MergeBenchは、スケールでのモデルマージを評価するために設計された評価スイートである。
2Bから9BスケールのLlamaやGemmaファミリなど、最先端のオープンソース言語モデルの上に構築されている。
マルチタスク性能, 忘れられたこと, 実行効率にまたがる8つの代表的なマージ手法を評価した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:37:57 GMT)
VulScribeR: Exploring RAG-based Vulnerability Augmentation with LLMs [19.5] VulScribeRは、慎重にキュレートされたプロンプトテンプレートを利用して脆弱なデータセットを拡張する新しいソリューションである。
我々のアプローチでは、VulgenとVGXの2つのSOTAメソッドを破り、Random Oversampling(ROS)は27.48%、27.93%、f1スコアで15.41%の脆弱性サンプルを生成する。
提案手法は,1Kサンプルを188ドル程度の安価で生成することで,大規模データ拡張の実現可能性を示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:39:00 GMT)
Foundation Models in Autonomous Driving: A Survey on Scenario Generation and Scenario Analysis [19.2] シミュレーションおよびシナリオベースのテストは、自律運転システムの開発と検証のための重要なアプローチとして現れている。
ファンデーションモデルは、事前訓練された汎用AIモデルの新たな世代を表している。
本調査では,大規模言語モデル,視覚言語モデル,多モーダル大規模言語モデル,拡散モデル,自律走行シナリオの生成と解析のための世界モデルを含む統合分類法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:25:59 GMT)
Measurement-aligned Flow for Inverse Problem [19.2] 測定アラインドサンプリング(MAS)は線形逆問題解決のための新しいフレームワークである。
我々は,MASが一連のタスクにおいて,最先端のメソッドよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:39:54 GMT)
Joint Learning of Energy-based Models and their Partition Function [19.2] エネルギーベースモデル(EBM)は、ニューラルネットワークを用いて確率分布をパラメータ化するための柔軟なフレームワークを提供する。
本研究では,ESMを大規模に学習するための新しい定式化法を提案する。
当社のアプローチは,Fenchel-Young損失の広範な家族に自然に及んでいることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:20:42 GMT)
Effectiveness of Counter-Speech against Abusive Content: A Multidimensional Annotation and Classification Study [18.4] 本稿では,社会科学の概念に基づくCSの有効性分類のための新しい計算フレームワークを提案する。
我々のフレームワークは、明瞭さ、エビデンス、感情的魅力、反感、オーディエンス適応、フェアネスの6つの中核的な次元を定義しています。
さらに,マルチタスクと依存性ベースの2つの分類戦略を提案し,高い結果を得た。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:11:04 GMT)
Discovering Hidden Visual Concepts Beyond Linguistic Input in Infant Learning [18.4] コンピュータビジョンが人間の視覚システムを再現しようとすると、幼児の視覚発達を理解することは貴重な洞察を与えるかもしれない。
本稿では,この問題を探求する学際的研究について述べる。
Vongらによる最近発表されたScienceのモデルを分析する。
これらのニューロンは、モデルの本来の語彙を超えた物体を認識できることを実証する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:41:06 GMT)
Right on Time: Revising Time Series Models by Constraining their Explanations [18.3] ディープ時系列モデルは、しばしば急激な相関に依存する傾向があるため、信頼性の問題に悩まされる。
このようなショートカットを緩和し、時系列モデルにおける"Clever-Hans"モーメントを防止するために、Right on Time(RioT)を導入する。
RioTはモデルを制約し、注釈付きスプリアス相関から遠ざけている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:53:35 GMT)
Proxy-informed Bayesian transfer learning with unknown sources [18.3] トレーニングデータの範囲外の一般化には、転送の影響に関する事前知識を活用する必要がある。
負の転送は、ソースデータの非伝達可能な原因に関する誤った事前情報に由来する可能性がある。
提案手法は,PROMPT (probabilistic transfer learning) のためのプロキシインフォームド・ロバストな手法であり,ソースデータの事前の知識を必要としない。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:54:15 GMT)
OV-MAP : Open-Vocabulary Zero-Shot 3D Instance Segmentation Map for Robots [18.2] OV-MAPは、オブジェクト認識機能を高めるために、オープンな特徴を3Dマップに統合することで、移動ロボットのためのオープンワールド3Dマッピングの新しいアプローチである。
我々は2次元マスクを3次元空間に投影するクラス非依存セグメンテーションモデルと、点雲から生の深度と合成の深度をマージして作成した補足深度画像を組み合わせた。
このアプローチは、3Dマスク投票機構とともに、3D教師付きセグメンテーションモデルに頼ることなく、正確なゼロショット3Dインスタンスセグメンテーションを可能にする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:49:23 GMT)
Non-intrusive Speech Quality Assessment with Diffusion Models Trained on Clean Speech [18.1] クリーン音声のみを訓練した無条件拡散モデルを用いて音声品質の評価を行う。
ガウス分布の終端における対応するサンプルの確率を推定することにより、発話の質を評価することができることを示す。
提案手法は, 音声品質指標と有意な相関を示すとともに, 聴取実験におけるヒトの得点との相関が良好であることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:00:46 GMT)
RollingQ: Reviving the Cooperation Dynamics in Multimodal Transformer [18.0] 本稿では,クエリを回転させてアテンションアロケーションのバランスをとることで,自己強化サイクルを破り,キー配布ギャップを緩和する手法を提案する。
様々なマルチモーダルシナリオの実験は、広くデプロイされたマルチモーダル変圧器の広範な機能向上のために、RollingQの有効性と協調力学の回復を検証している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:39:58 GMT)
CheXGenBench: A Unified Benchmark For Fidelity, Privacy and Utility of Synthetic Chest Radiographs [18.0] CheXGenBenchは人工胸部X線撮影のための厳密で多面的な評価フレームワークである。
それは、最先端のテキスト・ツー・イメージ生成モデル間で、忠実さ、プライバシーリスク、臨床ユーティリティを同時に評価する。
トップパフォーマンスモデルにより生成された75Kのラジオグラフからなる高品質な合成データセットSynthCheX-75Kをリリースする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:39:53 GMT)
MEDDxAgent: A Unified Modular Agent Framework for Explainable Automatic Differential Diagnosis [17.9] 鑑別診断(DDx)は、臨床的意思決定の基本的な側面であるが複雑な側面である。
大規模言語モデル(LLM)の最近の進歩は、DDxをサポートすることを約束している。
本稿では,対話型DDx用に設計された Modular Explainable DDx Agent (MEDDxAgent) フレームワークを紹介する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:50:34 GMT)
Evidential Spectrum-Aware Contrastive Learning for OOD Detection in Dynamic Graphs [17.8] 動的グラフにおけるアウト・オブ・ディストリビューション(OOD)検出は、受信したデータがイン・ディストリビューション(ID)トレーニングセットの分布から逸脱するかどうかを特定することを目的としている。
我々は、Evidential Spectrum-awarE Contrastive Learningを用いた、革新的で効果的なOOD検出器であるEviSECを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:08:22 GMT)
Bias Amplification in RAG: Poisoning Knowledge Retrieval to Steer LLMs [17.4] 大規模言語モデルでは、検索拡張生成(RAG)システムは、外部知識を統合することで、大規模言語モデルの性能を大幅に向上させることができる。
既存の研究は主に、RAGシステムにおける中毒攻撃が、モデルバイアスを増幅する可能性を見越して、モデル出力品質にどのように影響するかに焦点を当てている。
本稿では,言語モデルのバイアスを増幅する攻撃経路を体系的に調査するBias Retrieval and Reward Attack(BRRA)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:28:46 GMT)
Aligning MLLM Benchmark With Human Preferences via Structural Equation Modeling [17.1] マルチモーダルな大規模言語モデル (MLLM) の評価は、構造化され、解釈可能で、理論的に基礎付けられたベンチマーク設計の欠如により、依然として根本的な課題である。
本研究では、内部の妥当性、次元分離性、およびベンチマークコンポーネントの寄与を分析するために、構造方程式モデリング(SEM)に基づくMLLMベンチマークの整合性を示す新しいフレームワークを提案する。
実験結果から,提案ベンチマークは,従来の手法に比べて高い解釈可能性,指標冗長性の低減,認知的整合性の明確化を示すことが示された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:04:56 GMT)
Interaction, Process, Infrastructure: A Unified Architecture for Human-Agent Collaboration [16.8] インタラクション,プロセス,インフラストラクチャを統合したヒューマンエージェントシステムのための階層化フレームワークを提案する。
このモデルは、現在のツールの限界を明確にし、新しいシステム設計アプローチを統一し、研究者やAIシステムビルダーにとっての新しい機会を明らかにする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:34:15 GMT)
Leveraging Reference Documents for Zero-Shot Ranking via Large Language Models [16.7] RefRankは、固定参照文書に基づく単純で効果的な比較ランク付け手法である。
RefRankはポイントワイドのベースラインをはるかに上回り、少なくともペアワイドのアプローチと同等のパフォーマンスを達成できることを示した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:03:09 GMT)
InfoFlood: Jailbreaking Large Language Models with Information Overload [16.6] 過度の言語的複雑さが組込み安全性メカニズムを阻害する新たな脆弱性を同定する。
我々は、悪意のあるクエリを複雑な情報過剰なクエリに変換するジェイルブレイク攻撃であるInfoFloodを提案する。
広く使用されている4つのLLM-GPT-4o, GPT-3.5-turbo, Gemini 2.0, LLaMA 3.1に対するInfoFloodの有効性を実証的に検証した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 23:03:11 GMT)
Fine-tune Smarter, Not Harder: Parameter-Efficient Fine-Tuning for Geospatial Foundation Models [16.5] 地球観測は、環境変化の監視、災害への対応、天然資源の管理に不可欠である。
基礎モデルにより、リモートセンシング画像解析により、関係する地理情報を正確かつ効率的に取得することができる。
これらのモデルのサイズが大きくなるにつれて、関連する計算資源とコストのために微調整がますます困難になる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:18:58 GMT)
Merging Smarter, Generalizing Better: Enhancing Model Merging on OOD Data [16.5] マルチタスク学習(MTL)は、さまざまなタスクデータセットのモデルを同時にトレーニングして、共通の機能を利用する。
近年の研究では、複数の独立モデルパラメータをMTLの統一モデルにマージする努力が続けられている。
LwPTV (Layer-wise Pruning Task Vector) を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:02:50 GMT)
MTabVQA: Evaluating Multi-Tabular Reasoning of Language Models in Visual Space [16.4] MTabVQAは,多変数の視覚的質問応答に特化して設計された新しいベンチマークである。
MTabVQAは3,745組の複雑な質問応答対で構成されており、複数の視覚的に描画されたテーブルイメージに対してマルチホップ推論を必要とする。
MTabVQA-Instructを用いた微調整VLMでは,視覚的マルチタブラル推論の性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:21:00 GMT)
Growing with Experience: Growing Neural Networks in Deep Reinforcement Learning [16.2] ネットワークトレーサビリティを維持しつつ,ネットワーク能力の向上を図るため,GrowNNを提案する。
私たちは、初期ポリシーを学ぶために小さなネットワークをトレーニングし始めます。次に、エンコードされた関数を変更することなくレイヤーを追加します。
その後のアップデートでは、追加のレイヤを使用して、より表現力のあるポリシを学ぶことができ、ポリシの複雑さが増大するにつれて、キャパシティを追加することができる。
MiniHack と Mujoco の実験ではエージェント性能が向上し,GrownNN-deeper ネットワークは MiniHack Room で最大48%,Ant で72% に向上した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:20:16 GMT)
Time to Spike? Understanding the Representational Power of Spiking Neural Networks in Discrete Time [15.8] スパイキングニューラルネットワーク(SNN)は、従来の人工ニューラルネットワーク(ANN)によって引き起こされるエネルギー問題に対する潜在的な解決策である
本研究では,漏洩型統合火災(LIF)ニューロンに基づくSNNの離散時間モデルについて検討した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:43:13 GMT)
PPDiff: Diffusing in Hybrid Sequence-Structure Space for Protein-Protein Complex Design [15.8] PPDiffは、任意のタンパク質標的に対するバインダーの配列と構造を共同で設計する拡散モデルである。
このモデルは、一般的なタンパク質-タンパク質複合体データセットであるPPBenchで訓練されている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:39:14 GMT)
InceptionMamba: Efficient Multi-Stage Feature Enhancement with Selective State Space Model for Microscopic Medical Image Segmentation [15.7] InceptionMambaという,多段階のリッチな機能をエンコードするセグメンテーションタスクのための効率的なフレームワークを提案する。
我々は,低周波領域と高周波領域の両方を捕捉し,多段特徴を豊かにするためにセマンティック・キューを利用する。
本モデルでは,2つの挑戦的微視的セグメンテーションデータセットに対して,最先端の性能を実現する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:25:12 GMT)
Dynamic Sparse Training of Diagonally Sparse Networks [15.1] 構造のない空間は しばしば 現代のハードウェアの 実用的なスピードアップに 変換できない
本研究では,非構造空間と同等に機能する新規なスパース・ツー・スパース法であるDynaDiagを提案する。
ViTの90%の線形層で、我々はモデル性能を犠牲にすることなく、オンライン推論の3.13倍のスピードアップを観測する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:01:34 GMT)
DualX-VSR: Dual Axial Spatial$\times$Temporal Transformer for Real-World Video Super-Resolution without Motion Compensation [15.1] ViTやTimeSformerのようなトランスフォーマーベースのモデルは、時間的依存関係を効果的にモデル化することで、高度なビデオ理解を実現する。
これらのモデルは、実世界の超解像(VSR)に直接適用される
VSRは高いレベルの精度を必要としており、トークン化とシーケンシャルな注意機構によって妥協することができる。
実世界ビデオ解像度(DualX-VSR)のためのAxial Dual Spatial$times$ Transformerを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:20:44 GMT)
Self-supervised training of deep denoisers in multi-coil MRI considering noise correlations [15.1] 深層学習に基づく denoising 法は,MR画像の信号-雑音比を改善するために強力な結果を示した。
しかし、クリーングラウンドの真実画像の取得は高価で時間を要することが多い。
我々は,Coil2Coilと呼ばれるマルチコイルMRIにおけるディープデノイザの自己教師型トレーニング手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 00:19:30 GMT)
Composite Data Augmentations for Synthetic Image Detection Against Real-World Perturbations [15.0] 合成画像検出(SID)ソリューションは、圧縮やその他の操作によってしばしば変更されるため、インターネットから生成された画像に苦労する。
本研究は,データ拡張組み合わせを探索し,遺伝的アルゴリズムを最適な拡張選択に活用し,二重基準最適化アプローチを導入することにより,SIDを向上させる。
本研究は,様々な品質・変換の合成画像の同定が可能な検出モデルの開発に有用な知見を提供する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:28:05 GMT)
Dynamic Policy Fusion for User Alignment Without Re-Interaction [14.9] 深い強化学習政策は、人間の個人の好みと一致しないかもしれない。
我々は、より実践的なアプローチを提案し、人間のフィードバックの助けを借りて、すでに訓練済みのポリシーをユーザ固有のニーズに適応させる。
提案した動的ポリシー融合アプローチが意図したタスクを一貫して達成していることを実証的に実証する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:54:04 GMT)
Hatevolution: What Static Benchmarks Don't Tell Us [14.9] 我々は、2つの進化するヘイトスピーチ実験における20言語モデルの頑健さを実証的に評価した。
本研究は,ヘイトスピーチ領域における言語モデルの正確かつ確実な評価のために,時間感受性言語ベンチマークを求めるものである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:08:19 GMT)
CLEAN-MI: A Scalable and Efficient Pipeline for Constructing High-Quality Neurodata in Motor Imagery Paradigm [14.8] CLEAN-MIは、MIパラダイムで大規模で効率的で正確なニューロデータを構築するためのスケーラブルで体系的なデータ構築パイプラインである。
複数の公開MIデータセットに対するCLEAN-MIの有効性を示し、データ品質と分類性能を一貫した改善を実現した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:34:29 GMT)
Taxonomy of reduction matrices for Graph Coarsening [14.7] グラフ粗化は、グラフのサイズを小さくし、メモリフットプリントを軽量化することを目的としている。
ほとんどの粗いフレームワークは、リダクションとリフトマトリクスの間に固定的な関係を課している。
固定昇降行列で表される固定粗化の場合、還元行列を変更するだけでRSAをさらに小さくすることができることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:55:03 GMT)
LearnAlign: Reasoning Data Selection for Reinforcement Learning in Large Language Models Based on Improved Gradient Alignment [14.7] 強化学習(Reinforcement Learning, RL)は、LLMの推論能力を高めるための重要な技術となっているが、そのデータ非効率性は依然として大きなボトルネックとなっている。
本稿では、RL後学習のための学習可能および代表的トレーニング推論データを知的に選択するLearnerAlignを提案する。
3つの数学的推論ベンチマークによる実験により,本手法はトレーニングデータ要求を大幅に低減することが示された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:05:58 GMT)
Resa: Transparent Reasoning Models via SAEs [14.6] SAE-Tuningは、新規で効率的なスパースオートエンコーダチューニング手順によって訓練された1.5B推論モデルのファミリーである。
SAE-Tuningは、RL訓練後の特定のベースモデルに適用される前に、RL訓練後の推論性能の97%以上を維持している。
AIME24では43.33%のPass@1、AMC23では90%のPass@1などの推論性能を約1ドルで実現している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:01:49 GMT)
Improving Acoustic Scene Classification with City Features [14.6] City2Sceneは、都市の特徴を活用して音響シーンの分類を改善する新しいフレームワークである。
都市固有の知識を蒸留することで、City2Sceneは様々な軽量CNNバックボーンの精度を効果的に向上させる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:00:40 GMT)
Brain Network Analysis Based on Fine-tuned Self-supervised Model for Brain Disease Diagnosis [14.5] 脳疾患診断のための微調整脳ネットワークモデルを提案する。
元の脳ネットワークモデルに基づいて、複数の次元にまたがる脳領域の表現を拡張する。
本実験は,脳疾患の診断において,提案モデルが優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:03:11 GMT)
EconGym: A Scalable AI Testbed with Diverse Economic Tasks [14.4] EconGymは、多様な経済タスクとAIアルゴリズムを結びつけるスケーラブルなテストベッドです。
ユーザは多様なエージェントアルゴリズムで経済的役割を柔軟に構成し、リッチなマルチエージェントトラジェクトリをシミュレートすることができる。
その結果、よりリッチなタスク構成とアルゴリズムの多様性がポリシー空間を広げていることが示唆された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:35:04 GMT)
Composite Indicator-Guided Infilling Sampling for Expensive Multi-Objective Optimization [14.4] 高価な多目的最適化のための複合指標ベース進化アルゴリズム(CI-EMO)を提案する。
我々は,適合度評価のための候補の選択を誘導する新しい複合性能指標を設計する。
提案アルゴリズムは5つの最先端の高コスト多目的最適化アルゴリズムより優れている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:46:52 GMT)
Gradients of unitary optical neural networks using parameter-shift rule [14.4] 本稿では、ユニタリ光ニューラルネットワーク(UONN)におけるパラメータシフト則(PSR)の勾配計算への応用について検討する。
シフトパラメータ値で関数を評価することによって勾配を計算するPSRは,マッハ・ツェンダー干渉計メッシュから構築したUONNのトレーニングに効果的に適用できることを示す。
本稿では,光ニューラルネットワークにおける位相パラメータの最適化にPSRを適用するための理論的枠組みと実践的手法について述べる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:21:06 GMT)
Improving Multimodal Learning Balance and Sufficiency through Data Remixing [14.3] 弱いモダリティを強制する方法は、単調な充足性とマルチモーダルなバランスを達成できない。
マルチモーダルデータのデカップリングや,各モーダルに対するハードサンプルのフィルタリングなど,モダリティの不均衡を軽減するマルチモーダルデータリミックスを提案する。
提案手法は既存の手法とシームレスに統合され,CREMADでは約6.50%$uparrow$,Kineetic-Soundsでは3.41%$uparrow$の精度が向上する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:01:29 GMT)
AB-UPT: Scaling Neural CFD Surrogates for High-Fidelity Automotive Aerodynamics Simulations via Anchored-Branched Universal Physics Transformers [14.3] CFDシミュレーションのためのニューラルサロゲート構築のための新しいモデリング手法としてAB-UPTを導入する。
AB-UPTは,3万3千万から1億5000万のメッシュセルからなる自動車CFDシミュレーションにおいて,表面および体積場の最先端予測精度が得られることを示す。
特に、提案されたモデルは1日以内で1つのGPUでトレーニングでき、業界標準のサーフェスとボリュームフィールドを数秒で予測できる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:49:13 GMT)
FAA Framework: A Large Language Model-Based Approach for Credit Card Fraud Investigations [14.1] 本稿では、クレジットカード不正捜査を自動化するための詐欺分析アシスタント(FAA)フレームワークを提案する。
連邦航空局(FAA)は、クレジットカード詐欺捜査の自動化と説明レポート作成のために、マルチモーダルな大規模言語モデル(LLM)を採用している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:05:43 GMT)
A Rescaling-Invariant Lipschitz Bound Based on Path-Metrics for Modern ReLU Network Parameterizations [13.9] 重みの $ell1$-path-metric で表される新しいリプシッツの不等式を証明した。
これはどんなReLU-DAGアーキテクチャにも適用され、畳み込み、接続のスキップ、プーリング、フリーズ(リアルタイム)バッチ正規化が組み合わさっている。
ネットワークの自然な対称性を尊重することにより、新しい境界はパラメータ空間境界を厳格にシャープし、2つの前方通過で計算できる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:43:26 GMT)
PIPO: Pipelined Offloading for Efficient Inference on Consumer Devices [13.8] 我々は、消費者デバイス上で効率的な推論を行うための、パイプラインオフロード(PIPO)と呼ばれる新しいフレームワークを提案する。
PIPOは、推論のための高効率なスケジューリングを実現するために、最適化されたデータ転送と計算を補完するきめ細かいオフロードパイプラインを設計する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:54:42 GMT)
RAG+: Enhancing Retrieval-Augmented Generation with Application-Aware Reasoning [13.8] RAGパイプラインにアプリケーション認識推論を明示的に組み込んだ原則付きモジュール拡張であるRAG+を紹介します。
RAG+は、知識とアライメントされたアプリケーションの例からなる二重コーパスを構築し、手動または自動で作成し、推論中に共同で両方のコーパスを取得する。
複数のモデルで実施された数学、法学、医学の分野での実験では、RAG+は標準的なRAGの変種を一貫して上回り、3.5%の平均的な改善を達成し、複雑なシナリオではピークが7.5%まで上昇することを示した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:06:49 GMT)
Auto-Connect: Connectivity-Preserving RigFormer with Direct Preference Optimization [13.7] Auto-Connectは骨格接続を明示的に保存する自動リグのための新しいアプローチである。
我々は、それぞれの関節の子供と各階層層のエンドポイントを定義するために、特別なトークンを使用します。
また,潜伏した上顎骨の選抜に暗黙の測地学的特徴を取り入れ,皮膚の質を著しく改善した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:06:52 GMT)
Reviving DSP for Advanced Theorem Proving in the Era of Reasoning Models [13.5] 本稿では,Draft,Sketch,Proveフレームワークの改良版であるtextbfDSP+を紹介する。
相ごとに微細で統合されたニューロシンボリックエンハンスメントを特徴とする。
DSP+は、MiniF2F、ProofNet、PatnamBenchから80.7%、32.8%、24の644の問題を解決する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:25:59 GMT)
A Survey of Datasets for Information Diffusion Tasks [13.5] 情報拡散タスクとデータセットの系統分類を「5Wモデル」フレームワークに基づいて調査する。
まず、情報拡散タスクを定義とデータセット分析により10のサブタスクに分類する。
また、情報拡散タスクの公開データセットリポジトリと利用可能なリンクを収集し、比較する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:47:04 GMT)
In Defense of Defensive Forecasting [13.2] このチュートリアルでは、予測は予測ではなく、過去の誤りを修正することによって導き出される。
我々は、オンライン学習、校正、専門家のアドバイスによる予測、オンラインコンフォーマル予測のための単純でほぼ最適アルゴリズムを導出する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:57:19 GMT)
Simple Radiology VLLM Test-time Scaling with Thought Graph Traversal [13.2] テストタイムスケーリングは、追加のトレーニングなしで視覚言語による大規模モデル(VLLM)の推論性能を改善するための有望な方法を提供する。
医学的に整合した順序で臓器特異的な発見を通してモデルを推論するための軽量なThought Graph Traversalフレームワークを導入する。
このフレームワークは、構造化された医学的前提をプロンプトに統合し、基礎となるモデルを変更することなく、より深くより論理的な分析を可能にする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:46:14 GMT)
Graph Semi-Supervised Learning for Point Classification on Data Manifolds [13.0] データ多様体上の分類タスクのためのグラフ半教師付き学習フレームワークを提案する。
多様体仮説により、低次元 $mathcalM 部分集合 mathbbRF$ からサンプリングされた点としてデータをモデル化する。
我々は、$mathcalM$から一様サンプリングを行うと、半教師付きタスクの一般化ギャップはグラフサイズの増加とともに減少することを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:52:54 GMT)
A$^2$LC: Active and Automated Label Correction for Semantic Segmentation [13.0] セマンティックセグメンテーションのための能動・自動ラベル補正(A$2$LC)を提案する。
A$2$LCは、従来のパイプラインに自動修正段階を統合する。
Cityscapes と PASCAL VOC 2012 の実験では、A$2$LC が従来の最先端の手法を大きく上回っている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:07:47 GMT)
Mixup Regularization: A Probabilistic Perspective [12.8] 本稿では,確率的融合に基づく混合正規化のための新しいフレームワークを提案する。
指数族にしたがって分布するデータに対して、可能性関数は解析的に融合可能であることを示す。
本稿では,ニューラルネットワークの任意の中間層における入力の融合を可能にする確率的ミックスアップの拡張を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:12:48 GMT)
Towards Personalized Conversational Sales Agents: Contextual User Profiling for Strategic Action [12.6] 本稿では,一貫した会話の枠組みの中で,嗜好の誘惑,推薦,説得を統合する新しいタスクである会話販売(CSALES)について紹介する。
また,文脈的ユーザプロファイルを積極的に推測し,会話を通じて戦略的に行動を選択する対話販売エージェントであるCSIを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:19:12 GMT)
Data-driven approaches to inverse problems [12.6] 逆問題(inverse problem)は、肉眼で見えるもの以外の内部構造を可視化するための重要なツールである。
より最近のパラダイムでは、データ駆動方式で逆問題に対するソリューションの導出について検討している。
これらのノートは、逆問題に対するこのデータ駆動パラダイムの紹介を提供する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:44:32 GMT)
We Care Each Pixel: Calibrating on Medical Segmentation Model [12.6] pixel-wise expected Error (pECE) は、画素レベルでの誤校正を測定する新しい指標である。
また, キャリブレーション損失の計算に先立って, 地中トラスマスクに形態的操作を適用する形態的適応戦略を導入する。
本手法はセグメンテーション性能を向上するだけでなく,キャリブレーション品質も向上し,信頼性の高い推定値が得られる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:33:20 GMT)
VM14K: First Vietnamese Medical Benchmark [12.4] 最初のベトナムの医療質問ベンチマークでは、34の医療専門分野に14,000の多重選択質問が提供されている。
本ベンチマークは,精査試験や臨床記録など,様々な検証可能な資料を用いて構築した。
この設計により、対象言語における言語モデルの医学的理解の幅と深さを評価することができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:40:58 GMT)
Regression-adjusted Monte Carlo Estimators for Shapley Values and Probabilistic Values [12.4] 確率的価値は、説明可能なAIの中心的なツールとして現れている。
モンテカルロサンプリングと線形回帰定式化を組み合わせた新しい手法を提案する。
8つのデータセットにまたがる実験から、我々の手法が最先端のパフォーマンスをもたらすことがわかった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:57:38 GMT)
Solving Inverse Problems in Stochastic Self-Organising Systems through Invariant Representations [12.4] 自己組織化システムは、いかに単純なローカルルールが複雑なパターンを生成するかを示す。
多くの自然系はそのような力学に依存しており、自己組織は自然の複雑さを理解する中心となる。
このようなシステムのモデル化における根本的な課題は、マクロ的な観察から未知の因果パラメータを見つけるという逆問題の解決である。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:01:39 GMT)
Critical Influence of Overparameterization on Sharpness-aware Minimization [12.3] シャープネス・アウェアの最小化(SAM)は、ディープニューラルネットワークトレーニングにおける一般化を改善する効果において、かなりの注目を集めている。
この研究は、SAMの有効性に重要な影響を示す経験的および理論的知見の両方を提示する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:18:23 GMT)
Graph of Attacks with Pruning: Optimizing Stealthy Jailbreak Prompt Generation for Enhanced LLM Content Moderation [12.3] 本稿では,ステルスなジェイルブレイクプロンプトを生成するためのGAP(Graph of Attacks with Pruning)フレームワークを紹介する。
GAPは、相互接続グラフ構造を実装することで、既存のツリーベースのLLMジェイルブレイク手法の制限に対処する。
自動シード生成のためのGAP-Autoや、マルチモーダル攻撃のためのGAP-VLMなど、特殊なバリエーションを提示する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:44:43 GMT)
DiffFuSR: Super-Resolution of all Sentinel-2 Multispectral Bands using Diffusion Models [12.2] 本稿では,Sentinel-2 Level-2A画像の12のスペクトル帯域を超解像するモジュールパイプラインDiffFuSRを提案する。
パイプラインは、(i)拡散ベース超解像(SR)モデルで、NAIPとWorldStratデータセットから高分解能RGB画像に基づいてトレーニングされ、Sentinel-2特性をシミュレートするために調和し、(ii)超解像RGB画像を用いて残りのマルチスペクトルバンドを空間的にスケールアップする学習融合ネットワークである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:18:09 GMT)
Bayesian Optimization with Inexact Acquisition: Is Random Grid Search Sufficient? [12.2] 我々は,不正確なBOアルゴリズムがいまだにサブ線形累積後悔を達成可能であることを示す。
このような知見により,ランダムグリッド探索の理論的正当化と数値検証の両立を図った。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:35:39 GMT)
SAP-Bench: Benchmarking Multimodal Large Language Models in Surgical Action Planning [12.1] SAP-Benchは,多モーダル大言語モデル(MLLM)が解釈可能な手術行動計画を実行可能にするために設計された高品質なデータセットである。
我々のデータセットは、戦略的にサンプリングされた1,152個の電流フレームを提供し、それぞれが対応する次のアクションをマルチモーダル解析アンカーとしてペアリングする。
本稿では,MLLMを利用したMLLM-SAPフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:23:25 GMT)
The Automated but Risky Game: Modeling Agent-to-Agent Negotiations and Transactions in Consumer Markets [12.1] 消費者と商店双方がAIエージェントを承認し、交渉と取引を完全に自動化する将来のシナリオについて検討する。
我々の発見によると、AIによる取引は本質的に不均衡なゲームであり、異なるエージェントがユーザーに対して著しく異なる結果をもたらす。
ユーザーはAIエージェントにビジネス上の決定を委譲する際に注意を払わなければならない。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:02:02 GMT)
LoRA Users Beware: A Few Spurious Tokens Can Manipulate Your Finetuned Model [12.1] PEFT(Efficient FineTuning)は、学習済みの大規模言語モデル(LLM)と特定の下流タスクをリソース効率のよい方法で整列させる。
PEFTは,その微調整タスクを解くために,ショートカットソリューションを探索するモデルを奨励する。
不正なデータクリーニングから誤ってスプリアストークンが出現することもあるが、悪意ある参加者がモデルの振る舞いを制御できる機会も開ける。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:02:57 GMT)
SEC-bench: Automated Benchmarking of LLM Agents on Real-World Software Security Tasks [12.0] SEC-benchは、大規模言語モデル(LLM)エージェントを評価するための、最初の完全に自動化されたベンチマークフレームワークである。
当社のフレームワークは,再現可能なアーティファクトを備えた高品質なソフトウェア脆弱性データセットを,インスタンス当たり0.87ドルで自動生成します。
最先端のLLMコードエージェントの包括的な評価では、大きなパフォーマンスギャップが明らかになっている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:54:30 GMT)
Upgrade or Switch: Do We Need a New Registry Architecture for the Internet of AI Agents? [12.0] 新興のAIエージェントは、人間のスケールでリアクティブなインタラクション用に設計された既存のWebインフラストラクチャに挑戦する。
本稿では,既存のインフラをアップグレードするか,あるいは自律エージェント用の汎用レジストリアーキテクチャを実装するかを分析する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:55:38 GMT)
Quantum Learning and Estimation for Distribution Networks and Energy Communities Coordination [11.9] 本稿では,DNとECの協調性を高めるための量子学習と推定手法を提案する。
我々は、ECの応答とDNの価格インセンティブのエンドツーエンドマッピングを確立するために、ハイブリッド量子時間畳み込みネットワーク長短期記憶(Q-TCN-LSTM)モデルを開発した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:43:24 GMT)
Taming OOD Actions for Offline Reinforcement Learning: An Advantage-Based Approach [11.8] オフライン強化学習(RL)は、オンラインインタラクションなしで、固定データセットから意思決定ポリシーを学ぶことを目的としている。
本稿では, OOD アクションを体系的に評価する新しい手法として, アドバンテージベースの拡散アクター・クリティカル (ADAC) を提案する。
ADACはD4RLベンチマークのほとんど全てのタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:46:35 GMT)
Safer or Luckier? LLMs as Safety Evaluators Are Not Robust to Artifacts [11.8] 大規模言語モデル(LLM)は、生成されるコンテンツの安全性を評価するための自動評価器として、ますます採用されている。
本研究は、臨界安全領域にまたがる11のLCM判定モデルの多種多様なセットを評価する。
以上の結果から,LLM審査員のバイアスは,どのコンテンツソースがより安全かという最終判断を著しく歪めることができることがわかった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:07:08 GMT)
Cross-Modal Clustering-Guided Negative Sampling for Self-Supervised Joint Learning from Medical Images and Reports [11.7] 本稿では,2次元のアイデアを用いたCross-Modal Cluster-Guided Negative Smpling (CM-CGNS)法を提案する。
まず、シングルモーダルドメインのローカルテキスト機能に使用されるk-meansクラスタリングを、クロスモーダルアテンションを通じてマルチモーダルドメインに拡張する。
第2に、マスクされた局所画像領域を再構成するために、クロスモーダルアテンションによって得られたローカルテキストと画像の特徴を利用する、CM-MIR(Cross-Modal Masked Image Reconstruction)モジュールを導入する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:08:16 GMT)
KEENHash: Hashing Programs into Function-Aware Embeddings for Large-Scale Binary Code Similarity Analysis [11.5] KEENHashは、バイナリを1つのコンパクトで固定長のプログラム埋め込みに凝縮するハッシュ方式である。
KEENHashは最先端の関数マッチングツールよりも少なくとも215倍高速であることを示す。
5.3億の類似性評価を持つ大規模シナリオでは、KEENHashは395.83秒しかかかりませんが、これらのツールは56日以上かかります。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:33:58 GMT)
Women, Infamous, and Exotic Beings: What Honorific Usages in Wikipedia Reflect on the Cross-Cultural Sociolinguistic Norms? [11.5] 名誉は社会的階層、礼儀正しい規範、文化的価値観を包含する。
ウィキペディアの編集ガイドラインは、そのような形式が文法的に、社会的に普及している言語での使用に関する明確な基準を欠いている。
本稿では,ヒンディー語およびベンガル語ウィキペディアの3人称代名詞と動詞の大規模分析を通じて,このギャップに対処する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:42:41 GMT)
ICME 2025 Grand Challenge on Video Super-Resolution for Video Conferencing [11.5] 超解像(SR)はコンピュータビジョンにおいて重要な課題であり、低分解能(LR)入力から高分解能(HR)画像を再構成することに焦点を当てている。
Video Super-Resolution (VSR) は、局所的、一方向、双方向の伝搬、あるいは従来のアップスケーリングといった手法を用いて、ビデオ品質を向上させることを目的として、これを時間領域に拡張する。
この課題は、LRビデオが固定QPでH.265でエンコードされる会議のためのVSRに対処する。
目標は、特定の要因によってビデオをアップスケールすることであり、因果関係を用いた低遅延シナリオ下での知覚的品質の向上によるHR出力を提供することである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 22:46:27 GMT)
GPLQ: A General, Practical, and Lightning QAT Method for Vision Transformers [11.5] ビジョントランスフォーマー(ViT)はコンピュータビジョンに必須だが、計算集約性もある。
モデル量子化は、この難しさを軽減することを目的としているが、既存のPTQ(Post-Training Quantization)法とQAT(Quantization-Aware Training)法は、大きな制限を呈している。
本稿では,効率的なVT量子化のための新しいフレームワークであるGPLQ(General, Practical, and Quantization)を紹介する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:45:17 GMT)
From Persona to Person: Enhancing the Naturalness with Multiple Discourse Relations Graph Learning in Personalized Dialogue Generation [11.4] パーソナライズされた対話生成のためのMUDI(textbfMu$ltiple $textbfDi$scourse Relations Graph Learning)を提案する。
本研究では,対話関係のアノテートを支援し,対話データを構造化された対話グラフに変換するために,大規模言語モデルを利用する。
本実験は,人間に似た対話交換に類似した,パーソナライズされた応答の質の向上を示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:12:52 GMT)
Can LLMs Generate High-Quality Test Cases for Algorithm Problems? TestCase-Eval: A Systematic Evaluation of Fault Coverage and Exposure [11.4] TestCase-Evalには,500のアルゴリズム問題と,Codeforcesプラットフォームから10,000人の人為的なソリューションが含まれている。
それは2つの重要なタスクに焦点を当てている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 23:56:17 GMT)
FocalAD: Local Motion Planning for End-to-End Autonomous Driving [11.4] エンドツーエンドの自動運転では、運動予測は自走車計画において重要な役割を果たす。
既存の手法はしばしばグローバルに集約された動作特徴に依存しており、計画決定は主に少数の局所的相互作用エージェントの影響を受けているという事実を無視している。
本稿では,FocalADを提案する。FocalADは,局所的な動きの表現の強化によって,重要な地域住民とプランニングに焦点をあてた新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:39:01 GMT)
Fed-HeLLo: Efficient Federated Foundation Model Fine-Tuning with Heterogeneous LoRA Allocation [11.1] フェデレートラーニング(Federated Learning)は、最近、複数のクライアントにまたがるファウンデーションモデルの微調整に活用されている。
既存の手法の多くは、クライアントの不均一なリソースを考慮に入れたり、効果的なローカルトレーニング戦略を欠いている。
我々は,Fed-HeLLoを提案する。フェデレートされたLoRAベースのファインチューニングフレームワークで,クライアントがFMと異なるローカルトレーニング可能なLoRA層を協調的に微調整できる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:31:17 GMT)
HF-VTON: High-Fidelity Virtual Try-On via Consistent Geometric and Semantic Alignment [11.0] HF-VTONは,多種多様なポーズにおける高忠実度仮想トライオン性能を保証する新しいフレームワークである。
HF-VTONは3つの主要なモジュールで構成されている: 外観保存型ワープアライメントモジュール、セマンティック表現モジュール、およびマルチモーダル事前誘導型外観生成モジュール。
実験の結果,HF-VTONはVITON-HDとSAMP-VTONSの両方で最先端の手法より優れていた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:22:59 GMT)
Auditing Data Provenance in Real-world Text-to-Image Diffusion Models for Privacy and Copyright Protection [10.9] 我々はFSCA(Feature Semantic Consistency-based Auditing)と呼ばれる完全にブラックボックスの監査フレームワークを提案する。
テキストと画像の拡散モデル内の2種類のセマンティック接続を監査に利用し、内部知識へのアクセスを不要にする。
FSCAは、様々なメトリクスと異なるデータ分布にまたがる、以前のベースラインアプローチを超越していることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:16:16 GMT)
TrajAgent: An LLM-based Agent Framework for Automated Trajectory Modeling via Collaboration of Large and Small Models [10.9] 軌道モデリングは、生活サービス、都市交通、行政などの分野で広く応用されている。
自動化モデリングによるロバストかつ効率的な軌道モデリングを支援するフレームワークである textitTrajAgent を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:02:21 GMT)
SIMSHIFT: A Benchmark for Adapting Neural Surrogates to Distribution Shifts [10.8] ドメイン適応(DA)技術は、視覚や言語処理において、目に見えない構成に関する限られた情報から一般化するために広く使われている。
SIMSHIFTは,4つの産業シミュレーションタスクからなる新しいベンチマークデータセットと評価スイートである。
目的は、地上の真理シミュレーションデータにアクセスすることなく、ターゲットシミュレーションを正確に予測することである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:56:49 GMT)
MRI-CORE: A Foundation Model for Magnetic Resonance Imaging [10.7] 我々は、MRI-COREを紹介した。MRI-COREは、メインの18箇所で110,000以上のMRIボリュームから600万スライス以上を使用して、事前訓練された視覚基盤モデルである。
MRIにおける5つの多様なオブジェクトセグメンテーションタスクの実験により、MRI-COREはラベル付きデータ可用性に制限のある現実的なシナリオにおけるセグメンテーション性能を大幅に改善できることを示した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:26:56 GMT)
pLSTM: parallelizable Linear Source Transition Mark networks [10.6] 我々は、ソース、トランジション、マークゲートを用いた並列化可能な線形ソース遷移マークネットワーク(pLSTM)を導入する。
pLSTMは、DAGの長距離における2つの異なるモードによる消滅/爆発的アクティベーション/段階的な問題に対処する。
我々は,pLSTMが画像サイズを大きくするのに対して,Transformerは外挿に苦慮していることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:51:37 GMT)
Detecting High-Stakes Interactions with Activation Probes [10.4] そこで本論文では,対話が大きな害をもたらす可能性を示唆する「ハイテイク」相互作用を検出するためのアクティベーションプローブについて検討する。
我々は、合成データに基づいて訓練された複数のプローブアーキテクチャを評価し、それらが多種多様な分布外の実世界のデータに対して堅牢な一般化を示すことを発見した。
また,資源を意識した階層型モニタリングシステムの構築の可能性についても検討した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:04:48 GMT)
Understanding the Repeat Curse in Large Language Models from a Feature Perspective [10.4] 大規模言語モデル(LLM)は、しばしば反復的なテキスト生成に悩まされる。
本稿では,Repeat Curse を誘導・解析するための新しい手法 "Duplicatus Charm" を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:57:36 GMT)
Enabling automatic transcription of child-centered audio recordings from real-world environments [10.4] 本稿では,現代のASRシステムで確実に書き起こせる長音素音声における発話を自動的に検出する手法を提案する。
その結果,データセット中の全音声の13%を翻訳すると,平均単語誤り率0%,平均単語誤り率18%が得られることがわかった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:00:57 GMT)
On the Natural Robustness of Vision-Language Models Against Visual Perception Attacks in Autonomous Driving [10.3] 車両ビジョン言語モデル(V2LM)は、敵の訓練を必要とせず、目に見えない攻撃に対して優れた堅牢性を示す。
V2LMは平均8%未満の減少率で敵の精度を維持している。
以上の結果から,V2LMはより安全でレジリエントなAV知覚システムを実現する上で有望な道筋であることが示唆された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:22:12 GMT)
The Hardness of Achieving Impact in AI for Social Impact Research: A Ground-Level View of Challenges & Opportunities [10.3] 本稿では、社会的に影響力のあるAIソリューションの開発と展開において直面する日々の困難を理解することを試みる。
私たちは、構造的、組織的、コミュニケーション、コラボレーション、運用上の課題を、デプロイメントの重要な障壁として認識しています。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:48:47 GMT)
Dynamic and Adaptive Feature Generation with LLM [10.1] 本稿では,特徴生成プロセスの解釈可能性を高める動的かつ適応的な特徴生成手法を提案する。
弊社のアプローチは、さまざまなデータタイプやタスクにまたがって適用性を広げ、戦略的柔軟性よりもアドバンテージを提供する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:11:20 GMT)
Epistemic Artificial Intelligence is Essential for Machine Learning Models to Truly `Know When They Do Not Know' [10.1] AIの素晴らしい成果にもかかわらず、不確実性を扱うAIシステムの能力には大きなギャップがある。
従来の機械学習アプローチは、データ適合性の過大評価のため、この問題に対処するのに苦労している。
このポジションペーパーは、認識論的人工知能へのパラダイムシフトを示し、モデルが知っていることから学ぶ必要性を強調している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:48:03 GMT)
SAIL: Faster-than-Demonstration Execution of Imitation Learning Policies [9.9] オフライン・イミテーション・ラーニング(IL)法は複雑なロボット操作技術を得るのに効果的である。
既存のILトレーニングされたポリシーは、デモデータに示すように、タスクを同じ速度で実行することに限定される。
本稿では,ビジュモータポリシーの高速化を実現するための新しい問題を紹介し,定式化する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:58:20 GMT)
How Visual Representations Map to Language Feature Space in Multimodal LLMs [9.9] 凍結型大言語モデル (LLM) と凍結型視覚変換器 (ViT) を意図的に維持する方法論的枠組みを導入する。
視覚表現が言語特徴表現と徐々に整合し、中から後期の層に収束する階層的進行を明らかにする。
このことは、ViT出力と初期のLCMレイヤーの根本的な相違を示唆し、現在のアダプタベースのアーキテクチャが、モダル間の表現学習を最適に行うかどうかという重要な疑問を提起している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:34:05 GMT)
BalanceBenchmark: A Survey for Multimodal Imbalance Learning [9.9] マルチモーダル学習は、異なるモーダルからの情報を統合する能力に注目されている。
これは、あるモダリティが支配的であり、他のモダリティが未利用のままであるマルチモーダル不均衡問題によってしばしば妨げられる。
我々は,主要な多モード不均衡アルゴリズムを,不均衡を緩和するための戦略に基づいて4つのグループに体系的に分類する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:32:24 GMT)
Eliciting Reasoning in Language Models with Cognitive Tools [9.7] 我々は認知心理学と認知アーキテクチャにおける長年の文献に基づいて構築する。
特定の推論操作をカプセル化した「認知ツール」の小さなセットをLCMに組み込んだ。
驚くべきことに、この単純な戦略は標準的な数学的推論ベンチマークの性能を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:56:52 GMT)
SSLAM: Enhancing Self-Supervised Models with Audio Mixtures for Polyphonic Soundscapes [9.6] Self-Supervised Learning from Audio Mixtures (SSLAM) は、ポリフォニックデータから学習するモデルの能力を改善するために設計された。
SSLAMはAudioSet-2M(AS-2M)を最大3.9%改善し、平均精度(mAP)は50.2である。
ポリフォニックデータセットでは、SSLAMは新しいSOTAを線形評価と微調整の両方で設定し、パフォーマンスは最大9.1%向上した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:48:46 GMT)
Mind Your Step (by Step): Chain-of-Thought can Reduce Performance on Tasks where Thinking Makes Humans Worse [9.5] CoT(Chain-of- Thought)プロンプトは,大規模言語やマルチモーダルモデルの性能向上に広く利用されている。
本稿では,人間のパフォーマンスを損なう心理学文献からの6つの代表的課題に焦点を当てた。
これら3つのタスクにおいて、最先端モデルはCoTによる大幅な性能低下を示す。
モデルと人間が完全に平行な認知過程を示すわけではないが、人間の思考がネガティブな結果をもたらす場合を考えると、それがモデルに悪影響を及ぼすような設定を特定するのに役立つ。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:10:02 GMT)
Can AI Master Econometrics? Evidence from Econometrics AI Agent on Expert-Level Tasks [9.5] オープンソースのMetaGPTフレームワーク上に構築された「計量AIエージェント」を開発した。
本発明のエージェントは,(1)エコノメトリタスクを戦略的に計画し,(2)コードの生成と実行,(3)堅牢性向上のためのエラーベースのリフレクション,(4)多ラウンド会話による反復的洗練,といった優れた性能を示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:28:21 GMT)
PPTNet: A Hybrid Periodic Pattern-Transformer Architecture for Traffic Flow Prediction and Congestion Identification [9.5] 本稿では,交通流予測のための周期パターン変換ネットワーク(PPTNet)を提案する。
高精度のトラフィックフローデータセットはドローンの航空画像データに基づいて構築される。
Transformer Decoderは時間的依存関係を動的にモデル化し、トラフィック密度と速度の正確な予測を可能にする。
予測結果を用いて,混雑確率をリアルタイムで算出する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:12:56 GMT)
FAME: A Lightweight Spatio-Temporal Network for Model Attribution of Face-Swap Deepfakes [9.5] フェイスフェイクのDeepfakeビデオは、デジタルセキュリティ、プライバシー、メディアの整合性へのリスクが高まる。
FAMEは、異なる顔生成モデルに特有の微妙なアーティファクトをキャプチャするために設計されたフレームワークである。
結果は、FAMEが既存のメソッドを精度と実行時の両方で一貫して上回っていることを示している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:47:09 GMT)
GaussMarker: Robust Dual-Domain Watermark for Diffusion Models [9.4] GaussMarkerは8つの画像歪みと3つのバージョンにわたる4つの高度な攻撃の下で、最先端のパフォーマンスを効率的に達成する。
本稿では,パイプライン型インジェクタを用いて空間領域と周波数領域の両方に透かしを連続的に埋め込む方式として,最初のデュアルドメインDM透かし手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:45:15 GMT)
A Few Large Shifts: Layer-Inconsistency Based Minimal Overhead Adversarial Example Detection [9.3] 我々は、ターゲットモデル自体の内部の階層的不整合を利用して、軽量なプラグイン検出フレームワークを導入する。
本手法は, 計算オーバーヘッドを無視し, 正確さを損なうことなく, 最先端検出性能を実現する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:43:47 GMT)
GNSS-inertial state initialization by distance residuals [9.2] 本稿では,フレーム間の変換を正確に推定するために十分な情報が得られるまで,グローバルな計測方法の使用を遅らせるための新しい戦略を提案する。
EuRoCデータセットとGVINSデータセットの実験から、私たちのアプローチは、最初からグローバルデータを使用するというナイーブな戦略を一貫して上回ります。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:37:25 GMT)
Malicious LLM-Based Conversational AI Makes Users Reveal Personal Information [9.2] LLMベースの会話型AI(Conversational AI, CAI)は、さまざまなドメインで使用されているが、プライバシのリスクが生じる。
近年の研究では、LSMベースのCAIが悪意のある目的に使用できることが示されている。
この研究は、この新しいタイプのLSMベースのCAIによって引き起こされるプライバシーの脅威を浮き彫りにする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:19:21 GMT)
SceneGram: Conceptualizing and Describing Tangrams in Scene Context [8.9] 本稿では,異なるシーン環境に配置されたタングラム形状に対する人間の参照のデータセットであるSceneGramについて述べる。
これらのモデルは、人間の参照に見られる概念化の豊かさと多様性を考慮に入れていないことを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:02:39 GMT)
Batch-Adaptive Annotations for Causal Inference with Complex-Embedded Outcomes [8.8] 結果に対する介入の因果効果を推定することは、政策と意思決定に不可欠である。
例えば、データアノテーションやフォローアップを通じて、地道的な結果情報をコストで明らかにすることができる。
本稿では,専門家のラベルとノイズが混ざり合ったラベルを2重に頑健な因果推定器に効果的に組み合わせる方法について述べる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:12:08 GMT)
A Variational Approach for Mitigating Entity Bias in Relation Extraction [8.8] 本手法は,タスク関連機能を保持しながら,エンティティ固有情報を圧縮する。
一般、財務、バイオメディカル領域にわたる関係抽出データセットの最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:03:42 GMT)
An Explainable AI Framework for Dynamic Resource Management in Vehicular Network Slicing [8.7] 本稿では、車載ネットワークにおける動的ネットワークスライシングとリソース割り当てのための説明可能なDeep Reinforcement Learningフレームワークを提案する。
Shapley値とアテンションメカニズムを活用する機能ベースのアプローチを統合することで、強化学習エージェントの判断を解釈し、洗練する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:32:52 GMT)
The Behavior Gap: Evaluating Zero-shot LLM Agents in Complex Task-Oriented Dialogs [8.6] 本研究では,AIエージェントと人間専門家の行動ギャップを定量化する包括的評価フレームワークを提案する。
以上の結果から,この行動ギャップはLLM剤の性能に悪影響を及ぼす重要な要因であることが明らかとなった。
我々の研究で最も複雑な課題は、GPT-4oをベースとしたエージェントでさえ、人間の行動との整合性が低いことである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 22:36:41 GMT)
TruncQuant: Truncation-Ready Quantization for DNNs with Flexible Weight Bit Precision [8.5] トランケーションは、低ビット精度マッピングを実現するための効果的なアプローチである。
現在の量子化対応トレーニングスキームは、トランケーションプロセスのために設計されていない。
そこで我々はTruncQuantを提案する。TruncQuantは、実行時のビットシフトによるフレキシブルビット精度を実現する新しいトランケーション対応トレーニングスキームである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:08:18 GMT)
Bi-directional Mapping of Morphology Metrics and 3D City Blocks for Enhanced Characterization and Generation of Urban Form [8.5] 都市の空間構成を調べる都市形態学は、都市デザインと持続可能性を結びつける。
性能評価と複雑な都市形態生成の間には, 形態指標と都市形態の切り離しが原因で, 重要なギャップが残っている。
本稿では,形態指標と複雑な都市形態の双方向マッピングを確立することの重要性を強調した。
本研究では,1) 都市形態を特徴付けるための形態指標を定式化し, 逆に, 多様な類似した3次元都市形態を検索し, 2) ブロックの3次元都市形態特性を表現するための形態指標の有効性を比較検討する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:30:17 GMT)
Personalized LLM Decoding via Contrasting Personal Preference [8.5] 本研究では,パラメータ効率のよい微細チューニング(PEFT)をユーザ固有のデータに適用した新しいデコード時間手法CoPeを提案する。
私たちの中核となる考え方は、各ユーザの暗黙の報酬信号の最大化によって、特にパーソナライズのために報酬誘導復号を利用することです。
実験の結果,CoPeは高い性能を示し,ROUGE-Lでは平均10.57%のパーソナライゼーションが向上した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:12:44 GMT)
Agent-RLVR: Training Software Engineering Agents via Guidance and Environment Rewards [8.4] 本稿では,エージェント設定に挑戦する上で,RLVRを効果的にするためのフレームワークであるAgent-RLVRを紹介する。
エージェント-RLVRは、人間の教育にインスパイアされ、エージェント誘導(エージェント誘導)を導入している。
ガイダンスを付加したRLVRデータは、テストタイム報酬モデルトレーニングにも役立ち、さらにpass@1を27.8%に向上させることで示されています。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:46:53 GMT)
Lag-Relative Sparse Attention In Long Context Training [8.4] 本稿では,LagKV圧縮法で固定されたLag-Relative Sparse Attention(LRSA)を長期学習後に提案する。
本手法はチャンク・バイ・チャンク・プリフィルを行い, 固定サイズのラグウィンドウにおいて, 最上位のキー値ペアを選択する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:49:53 GMT)
Can reasoning models comprehend mathematical problems in Chinese ancient texts? An empirical study based on data from Suanjing Shishu [8.3] 愚事_MATH(ぐじ_MATH)は、スージー詩集に基づく古典的テキスト評価のベンチマークである。
古典中国語の独特な言語的制約の下で、主流推論モデルの数学的問題解決能力を評価する。
その結果、推論モデルはこれらの問題を部分的に理解し解決することができるが、その全体的な性能は現代の数学的なタスクのベンチマークよりも劣っていることが示唆された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:57:16 GMT)
Vision-based Lifting of 2D Object Detections for Automated Driving [8.3] 本稿では,既存のビジョンベース2Dアルゴリズムの結果を,カメラのみを用いた3次元検出に引き上げるパイプラインを提案する。
我々の知る限りでは、我々は初めて2D CNNを使用して、2D検出毎にポイントクラウドを処理し、計算労力を可能な限り低くする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:40:12 GMT)
Proximal Inference on Population Intervention Indirect Effect [8.3] 人口介入間接効果(英: Population intervention indirect effect、PIIE)は、人口介入効果の間接成分を表す新しい媒介効果である。
本稿では,未測定の共同創設者が被曝・被曝・被曝・被曝・被曝・被曝関係に影響を及ぼすような環境下でのPIIE識別フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:22:19 GMT)
Cloud Infrastructure Management in the Age of AI Agents [8.2] クラウドインフラストラクチャ管理タスクを自動化するために,大規模言語モデル(LLM)を利用したAIエージェントの開発を事例とする。
予備研究では、AIエージェントが異なるクラウド/ユーザインターフェースを使用する可能性について検討する。
本報告では, 異なる管理課題におけるそれらの有効性について報告し, 研究課題と潜在的な解決策を同定する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 22:50:12 GMT)
Curriculum-Guided Layer Scaling for Language Model Pretraining [8.2] 計算効率向上のためのフレームワークであるCGLS(Curriculum-Guided Layer Scaling)を提案する。
CGLSは、データの増大とモデルの成長を同期させる。
モデル深度の増加は、様々なダウンストリームベンチマークにおいて、より良い一般化とゼロショット性能をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:22:16 GMT)
Enhance Multimodal Consistency and Coherence for Text-Image Plan Generation [8.1] テキスト画像プランの提供における大規模モデルの可能性はまだ検討されていない。
そこで本研究では,テキスト・イメージ・プランを段階的に作成・改善する新しいフレームワークを提案する。
このアプローチは、様々なバックボーンモデルにプラグアンドプレイの改善を提供します。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:03:29 GMT)
Collaborative Interest-aware Graph Learning for Group Identification [8.1] オンラインソーシャルプラットフォーム上でグループ活動に参加するユーザが増えています。
グループ識別のための協調的関心認識モデルCI4GIを提案する。
3つの実世界のデータセットに対する実験の結果、CI4GIは最先端のモデルを大幅に上回っている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:15:43 GMT)
A Step-by-Step Guide to Creating a Robust Autonomous Drone Testing Pipeline [7.9] 本稿では,ロバストな自律型ドローンテストパイプラインを構築するためのステップバイステップガイドを提案する。
Software-in-the-Loop (SIL) Simulation Testing, Hardware-in-Loop (HIL) Testing, Controlled Real-World Testing, In-Field Testing。
我々は、ニューロシンボリックとLLMの統合を含む、ドローンテストの未来を形作る新しいトレンドを強調した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:55:23 GMT)
Dr. GPT Will See You Now, but Should It? Exploring the Benefits and Harms of Large Language Models in Medical Diagnosis using Crowdsourced Clinical Cases [7.9] 大規模言語モデル(LLMs)は、医学(自己診断)や予備的トリアージなどの高度な応用に用いられている。
本稿では, LLMの有効性を評価するために, クラウドソーシングによる新たなアプローチを活用した大学レベルのコンペから得られた知見について述べる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:12:47 GMT)
Gaussian Process Regression for Inverse Problems in Linear PDEs [7.8] 本稿では,線形偏微分方程式(PDE)に支配される逆問題に対するシステム理論における計算効率のよいアルゴリズムを提案する。
例えば、物理学で広く使われている古典波動方程式のノイズデータから波速を識別する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:49:18 GMT)
Expressivity of Quadratic Neural ODEs [7.7] この研究は、力学において最も二次的な非線形性を持つニューラル常微分方程式に対する定量的近似誤差境界の導出に焦点を当てている。
このモデル形式の単純な力学は、多くの基本的操作を反復的に構成することによって、表現性がどのように導出されるかを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:13:53 GMT)
Fast Bayesian Optimization of Function Networks with Partial Evaluations [7.7] 本稿では,クエリ効率をわずかに損なうことなく計算オーバーヘッドを削減する,高速化されたp-KGFNアルゴリズムを提案する。
我々のアプローチの鍵は、1つの安価なグローバルモンテカルロシミュレーションによってネットワークの各ノードに対してノード固有の候補入力を生成することである。
数値実験により,元のp-KGFNアルゴリズムの16倍の高速化を達成しつつ,競合クエリ効率を維持する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:20:36 GMT)
Teleoperated Driving: a New Challenge for 3D Object Detection in Compressed Point Clouds [7.5] 我々は、安全なTD操作を可能にするために、ポイントクラウドデータから車や歩行者の存在を検出する問題に取り組む。
我々は、自動運転のためのマルチモーダル、オープンソース、合成データセットであるSELMAデータセットを利用する。
本研究では, 最先端圧縮アルゴリズムとオブジェクト検出器の性能を, いくつかの測定基準の下で解析する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:07:00 GMT)
DMAF-Net: An Effective Modality Rebalancing Framework for Incomplete Multi-Modal Medical Image Segmentation [7.4] DMAF-Net(Dynamic Modality-Aware Fusion Network)と呼ばれる新しいモデルを提案する。
まず、欠落したモダリティ干渉を抑制するために、動的モダリティ・アウェア・フュージョン(DMAF)モジュールを導入する。
第二に、グローバルな特徴アライメントを強制するために、相乗的関係蒸留とプロトタイプ蒸留のフレームワークを設計する。
第3に、不均衡な損失率で最適化を安定化するための動的トレーニングモニタリング(DTM)戦略を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:38:18 GMT)
Scale-Invariance Drives Convergence in AI and Brain Representations [7.3] 近年の研究では、大規模なAIモデルは、神経活動と一致する同様の内部表現に収束することがしばしば示されている。
AI表現におけるスケール不変性の2つの中核的側面:次元安定性とスケール間の構造的類似性。
解析の結果,fMRIデータと一致し,より一貫した次元と構造的類似性が得られた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:36:04 GMT)
Disentangling the Complex Multiplexed DIA Spectra in De Novo Peptide Sequencing [7.2] Data-Independent Acquisition (DIA) が導入された。
デノボペプチドシークエンシングにおけるDIAデータの有用性は明らかになっていない。
本稿では,新しいディープラーニング手法であるDIANovoを提案し,従来のシステムであるDeepNovo-DIAを34%から108%改善する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 00:56:44 GMT)
Entanglement and entropy uncertainty in black hole quantum atmosphere [7.1] 量子絡み合いの力学を研究し、その特性が事象の地平線を超えたホーキング量子放射と密接な相関があることを見出した。
我々の観測は、ブラックホール情報パラドックスとブラックホール熱力学を理解するための新しい視点を与えることができると考えられている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:59:55 GMT)
General-Purpose $f$-DP Estimation and Auditing in a Black-Box Setting [7.1] 統計的に$f$-Differential Privacy(f$-DP)を評価する新しい手法を提案する。
異なるプライベートメカニズムをデプロイする際の課題は、DPが検証しにくいことである。
我々は,このプライバシー概念に対する既存のアプローチとは異なり,研究対象アルゴリズムの事前知識を必要としない,$f$-DPのための新しいブラックボックス手法を導入する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:22:39 GMT)
Dual-View Disentangled Multi-Intent Learning for Enhanced Collaborative Filtering [7.0] 暗黙のフィードバックからユーザ意図を遠ざけることは、推奨精度と解釈可能性を高めるための有望な戦略となっている。
DMICFは相互作用レベルのインテントアライメントを明示的にモデル化する統合フレームワークである。
DMICFはデュアルビューアーキテクチャを採用しており、両者のインタラクショングラフを共同でエンコードしている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:44:42 GMT)
Node Splitting SVMs for Survival Trees Based on an L2-Regularized Dipole Splitting Criteria [7.0] 本稿では,サバイバルツリー作成のための新しいパラメトリック分割支援ベクトルマシン(SVM)を提案する。
連続した右検閲結果を含む生存データを非線形に分割することができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:31:29 GMT)
ReVeal: Self-Evolving Code Agents via Iterative Generation-Verification [7.0] ReVealは、明示的な自己検証とツールベースの評価でコード生成をインターリーブするマルチターン強化学習フレームワークである。
モデルの生成と検証機能の共進化をRLトレーニングを通じて促進し、ベースモデルの推論境界を広げる。
また、より深い推論規則へのテストタイムスケーリングを可能にし、推論中にターン数が増加するにつれて、コードは一貫して進化する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:41:04 GMT)
PRO-V: An Efficient Program Generation Multi-Agent System for Automatic RTL Verification [7.0] Pro-Vは、堅牢なRTL検証のためのプログラム生成マルチエージェントシステムである。
生成したテストベンチの正しさを高めるため、効率的なn個の反復サンプリング戦略が組み込まれている。
Pro-Vは、黄金のRTL実装では87.17%、RTL変異では76.28%の精度で検証されている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:06:34 GMT)
Recent Advances in Multi-Agent Human Trajectory Prediction: A Comprehensive Review [7.0] 本調査は,ディープラーニングに基づくマルチエージェント軌道予測の最近の進歩を概観する。
アーキテクチャ設計、入力表現、および全体的な予測戦略に基づいて、既存の手法を分類する。
我々は,マルチエージェントHTP分野における重要な課題と今後の研究方向性を強調した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 23:03:43 GMT)
SPLATART: Articulated Gaussian Splatting with Estimated Object Structure [6.9] SPLATARTは、ポーズ画像から明瞭なオブジェクトの表現を学習するためのパイプラインである。
合成パリのデータセットオブジェクトに適用したパイプライン上のデータを示す。
さらに,より深いキネマティックツリー構造における使用例を示すために,直交鎖マニピュレータについて述べる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:20:07 GMT)
YOLO advances to its genesis: a decadal and comprehensive review of the You Only Look Once (YOLO) series [6.8] 本稿では,YOLOv1からYOLOv12へのオブジェクト検出アルゴリズムの進歩を体系的に検討する。
この研究は、自動運転車と交通安全、ヘルスケアと医療画像、工業生産、監視とセキュリティ、農業の5つの重要な分野にわたるYOLOモデルの変革的な影響を強調している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:27:50 GMT)
Are Multimodal Large Language Models Pragmatically Competent Listeners in Simple Reference Resolution Tasks? [6.7] 単純な視覚刺激を特徴とする参照解像度タスクにおける多モーダル大言語モデルの言語能力について検討する。
結果と分析から,色記述の文脈依存的な解釈などの基本的な実用的能力が,最先端のMLLMにおいて依然として大きな課題となっていることが示唆された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:09:48 GMT)
Real-Time AIoT for UAV Antenna Interference Detection via Edge-Cloud Collaboration [6.7] 第5世代(5G)では,通信干渉源の除去がネットワーク性能の維持に不可欠である。
本稿では,UAVのアンテナ干渉源を検出するコンピュータビジョンに基づくモノのAIを提案する。
システムは、我々のカスタムアンテナ干渉源データセットの平均平均精度(mAP)42.1%で、最先端(SOTA)性能を達成する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:09:37 GMT)
A Survey of Foundation Models for IoT: Taxonomy and Criteria-Based Analysis [6.7] ファウンデーションモデルは、ラベル付きデータへの依存度が低いため、IoT領域への関心が高まっている。
既存の基盤モデルベースのメソッドのほとんどは、特定のIoTタスク用に開発されている。
この調査は、現在の方法論を包括的に概観することで、このギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 22:28:55 GMT)
Efficient Visual Representation Learning with Heat Conduction Equation [6.6] 本稿では,ニューラルネットワークのアーキテクチャ設計全体を熱伝導理論の枠組みに統合することを目的とする。
私たちのHeat Conduction Network(HcNet)は依然として競合性能を示しており、例えば、HcNet-TはImageNet-1K上で83.0%、パラメータは28M、MACは4.1Gである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:27:00 GMT)
Decomposability-Guaranteed Cooperative Coevolution for Large-Scale Itinerary Planning [6.6] 大規模反復計画は、旅行セールスマン問題の変種である。
本稿では,大規模反復計画の分解可能性について分析する。
本稿では,大規模反復計画のための新しい多目的協調進化アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:59:48 GMT)
Multiple Object Tracking in Video SAR: A Benchmark and Tracking Baseline [6.5] マルチオブジェクトトラッキングにはビデオ合成開口レーダ(Video SAR)が使用される。
標的運動によって誘発されるドップラーシフトは、容易に影と間違えられる人工物をもたらす。
この分野での大きな制限は、標準化されたアルゴリズム評価のための公開ベンチマークデータセットの欠如である。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:12:25 GMT)
Fish feeding behavior recognition and intensity quantification methods in aquaculture: From single modality analysis to multimodality fusion [6.4] 魚の摂食行動の認識と強度定量化は、魚の健康のモニタリング、バイティング作業の指導、養殖効率の向上に重要な役割を果たしている。
本稿では,まず,魚の摂食行動認識と強度定量化手法の研究の進歩について,既存のレビューを分析し,比較する。
魚の摂食行動認識および強度定量化法における現生マルチモーダル核融合の応用を概説する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:02:48 GMT)
Bel Esprit: Multi-Agent Framework for Building AI Model Pipelines [6.4] 本稿では,ユーザ定義要求に基づいてAIモデルパイプラインを構築するための対話エージェントであるBel Espritを紹介する。
あいまいなユーザクエリからパイプラインを生成する上で,このフレームワークの有効性を示す。
詳細なエラー解析では、パイプライン構築における進行中の課題を強調している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:30:53 GMT)
Sheet Music Benchmark: Standardized Optical Music Recognition Evaluation [6.3] Sheet Music Benchmark (SMB) は、光学音楽認識(OMR)研究のベンチマーク用に特別に設計された600ページと805ページのデータセットである。
OMR正規化編集距離(OMR-NED)は、OMRの性能を評価するために明示的に調整された新しい指標である。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:32:56 GMT)
ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning [6.1] ReinFlowは、継続的ロボット制御のためのオンライン強化学習フレームワークである。
学習可能なノイズをフローポリシーの決定論的パスに注入し、フローを離散時間マルコフプロセスに変換する。
代表的な移動と操作タスクでReinFlowをベンチマークします。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:27:09 GMT)
Learning Encodings by Maximizing State Distinguishability: Variational Quantum Error Correction [6.0] 特定の雑音構造に対して誤り訂正符号を調整するための新しい目的関数を提案する。
我々はこの概念を、機械学習の目的として、識別可能性損失関数で定式化する。
この手法は変分量子誤り補正(VarQEC)と呼ばれる変分手法を用いて実装する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:02:37 GMT)
Learning from Litigation: Graphs and LLMs for Retrieval and Reasoning in eDiscovery [6.0] 文書のランク付けと分類を強化するために知識グラフを統合する新システムであるDISCOGを導入する。
DISCOGは、F1スコア、精度、リコールにおいて、バランスの取れたデータセットと不均衡なデータセットの両方において、強力なベースラインを上回っている。
現実世界のデプロイメントでは、訴訟関連のドキュメントレビューコストを約98%削減し、ビジネス上の大きな影響を示している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:26:31 GMT)
Today's Cat Is Tomorrow's Dog: Accounting for Time-Based Changes in the Labels of ML Vulnerability Detection Approaches [6.0] MLテストに使用される脆弱性データセットには、レトロスペクティブ情報が暗黙的に含まれている。
脆弱性はカレンダー時間を通じて発見されるため、ラベルの変更と過去のパフォーマンスは、必ずしも将来のパフォーマンスと一致しない。
学習ラベルとテストラベルの両方が変化し、その時点で利用可能な知識を考慮に入れたデータセットを再構築する手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:42:21 GMT)
Consistent Video Editing as Flow-Driven Image-to-Video Generation [6.0] FlowV2Vはパイプライン全体を1フレームの編集と条件付きI2V生成に分解し、変形した形状に整合した擬似フローシーケンスをシミュレートする。
DAVIS-EDITによるDOVERの13.67%と50.66%の改善とワープエラーによる実験の結果は、既存の最先端のものと比較して、FlowV2Vの時間的一貫性とサンプル品質が優れていることを示している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:10:58 GMT)
Framework of a multiscale data-driven digital twin of the muscle-skeletal system [6.0] 筋骨格障害(英: Musculoskeletal disorders、MSD)は、世界中の障害の主要な原因である。
本稿では,マルチスケールバイオメカニカルデータと計算モデルを統合する新しいフレームワークであるMusculoskeletal Digital Twin (MS-DT)を紹介する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:26:09 GMT)
Towards Understanding the Cognitive Habits of Large Reasoning Models [5.9] 大規模推論モデル(LRM)は、最終的な応答を生成する前に、自律的に思考の連鎖(CoT)を生成する。
特定のCoTパターンがタスク全体にわたって一貫して現れるという観察に触発された私たちは、LRMが人間のような認知習慣を示すかどうかを探求する。
我々は、LRMの認知的習慣を評価するために設計された、原則付きベンチマークであるCogTestを紹介する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:40:56 GMT)
RSCF: Relation-Semantics Consistent Filter for Entity Embedding of Knowledge Graph [5.9] 我々は、プラグインKGE法、Relation-Semantics Consistent Filter (RSCF)を導入する。
エンティティ変換にはセマンティック一貫性を強化する3つの機能がある。
RSCFは最先端のKGE法を大幅に上回っている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:33:26 GMT)
Machine Unlearning for Robust DNNs: Attribution-Guided Partitioning and Neuron Pruning in Noisy Environments [5.8] ディープニューラルネットワーク(DNN)は、さまざまなドメインで顕著な成功を収めているが、ノイズやトレーニングデータによってそのパフォーマンスが著しく低下する可能性がある。
本稿では,帰属誘導型データパーティショニング,識別的ニューロンプルーニング,およびノイズのあるサンプルの影響を軽減するための微調整を目的とした新しいフレームワークを提案する。
CIFAR-10の標準リトレーニングよりも約10%の絶対精度向上を実現し,ラベルノイズを注入した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:37:11 GMT)
On the Performance of LLMs for Real Estate Appraisal [5.8] 本研究では,Large Language Models (LLMs) が,競争力と解釈可能な住宅価格推定を生成することによって,不動産情報へのアクセスを民主化する方法について検討する。
我々は,多種多様な国際住宅データを用いて,ゼロショット,少数ショット,市場レポート強化,ハイブリッドプロンプト技術の比較を行った。
この結果から, LLMは, 特性サイズやアメニティなどのヘドニック変数を有効利用し, 有意義な推定値が得られることがわかった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:14:40 GMT)
ViSTA: Visual Storytelling using Multi-modal Adapters for Text-to-Image Diffusion Models [5.8] テキストから画像への拡散モデルである textbfViSTA に対するマルチモーダルヒストリーアダプタを提案する。
1) 関連する履歴特徴を抽出するマルチモーダル履歴融合モジュールと,(2) 抽出した関連する特徴について生成を条件付けるヒストリアダプタとから構成される。
提案するViSTAモデルは,異なるフレーム間での整合性だけでなく,物語のテキスト記述と整合性も備えている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:57:40 GMT)
Optimal Neural Network Approximation for High-Dimensional Continuous Functions [5.7] 我々は、その近似において任意の精度を達成するために、少なくとも幅$d$、従って少なくとも$d$のニューロンやパラメータを必要とする連続関数の族を示す。
これは、パラメータが$d$で指数関数的に成長するいくつかの近似方法とは異なり、入力次元$d$で線形に成長するという意味では、非ゼロパラメータの数が最適であることを示している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:27:49 GMT)
Reimagining Dance: Real-time Music Co-creation between Dancers and AI [5.7] 本研究では,ダンサーが動きによって動的に音楽環境を形成できるシステムを提案する。
我々のマルチモーダルアーキテクチャは、ダンスの動きに応じて、事前に録音された音楽クリップをインテリジェントに組み合わせることで、コヒーレントな音楽構成を生成する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:56:53 GMT)
Black-Box Adversarial Attacks on LLM-Based Code Completion [5.6] 本研究では,最先端のブラックボックスLCMベースのコード補完エンジンが敵にひそかに偏っていることを実証する。
私たちはこの目標を達成する最初の攻撃、INSECを紹介します。
さまざまな最先端のオープンソースモデルやブラックボックスの商用サービスで評価することで、INSECの幅広い適用性と有効性を実証する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:36:41 GMT)
Learning Overspecified Gaussian Mixtures Exponentially Fast with the EM Algorithm [5.6] 過特定ガウス混合モデルに適用した場合のEMアルゴリズムの収束特性について検討する。
集団EMアルゴリズムはクルバック・リーブラー距離(KL)において指数関数的に高速に収束することを示した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:57:57 GMT)
Modelling Mosquito Population Dynamics using PINN-derived Empirical Parameters [5.6] 我々は、逆パラメータを決定するためにPINNを用いた力学モデルにおける生物学的プロセスのパラメータ化の改善に焦点をあてる。
PINNは、物理法則、生物学的法則、化学法則を、観測または測定データに基づいて訓練されたニューラルネットワークに組み込む。
PINNモデルの性能についてより深く理解するために、PINNアーキテクチャの変更がフレームワークの性能に与える影響を調査するために、最終的な検証が使用された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:48:12 GMT)
Self-Regulating Cars: Automating Traffic Control in Free Flow Road Networks [5.6] 本稿では,車両の速度を動的に調整し,スループットを最適化し,混雑を防止することを目的とした,強化学習に基づく交通制御プロトコルである自己規制車を紹介する。
提案手法は,古典的交通流理論,ギャップ受容モデル,微視的シミュレーションを物理インフォームドRLフレームワークに統合する。
また、さまざまなトラフィックパターンをまたいで一般化しながら、スムーズで渋滞に強いフローを実現し、スケーラブルでML駆動のトラフィック管理の可能性を示している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:31:23 GMT)
DeePoly: A High-Order Accuracy Scientific Machine Learning Framework for Function Approximation and Solving PDEs [5.5] この研究は、Deeソリューションを2段階のアプローチに変換する新しいフレームワークを紹介します。
戦略的な組み合わせは、両方の方法の強みを利用する。
このアプローチはオープンソースプロジェクトとしても機能し、論文としても機能します。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:43:02 GMT)
Jointly modelling the evolution of social structure and language in online communities [5.4] グループ間相互作用は、特定の社会的・時間的文脈内で起こる。
本稿では,コミュニティ構造と言語を時間とともに共同でモデル化する手法を提案する。
擬似的過激主義集団の文脈において,本手法を適用し,評価する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:26:26 GMT)
code_transformed: The Influence of Large Language Models on Code [5.4] 本稿では,大規模言語モデルがコードスタイルに与える影響を調査する先駆的な研究について述べる。
2020年から2025年の間に発行されたarXivの論文にリンクされた19,000以上のGitHubリポジトリからコードを分析します。
実験の結果,LLMが実世界のプログラミングスタイルに影響を及ぼすという,最初の大規模な実証的証拠が得られた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:59:39 GMT)
Time-Varying Home Field Advantage in Football: Learning from a Non-Stationary Causal Process [5.3] 本稿では,DYnamic Non-stonary Local M-estimatOrs (DYNAMO)を提案する。
本稿では,2020-2021年と2021-2022年のイングランド・プレミアリーグシーズンの高解像度イベントデータに適用する。
この結果から,観衆の偏見に影響される,興味深く,時間的に異なる,チーム固有のフィールドアドバンテージが明らかとなった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:49:17 GMT)
Lower Bound on Howard Policy Iteration for Deterministic Markov Decision Processes [5.3] 我々は、古典的な平均支払い(すなわち上限平均)の目的を考え、それは基本的で基本的な目的である。
Howardのポリシー反復アルゴリズムは、平均支払目的のDMDPを解く一般的な方法である。
入力サイズが$I$の場合、アルゴリズムは$tildeOmega(sqrtI)$ iterationsを必要とする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 22:00:36 GMT)
Roll in the Tanks! Measuring Left-wing Extremism on Reddit at Scale [5.2] 我々はRedditで、53Kの著者による1300万件の投稿を分析した。
戦車は明らかに大きな極左共同体の周辺にある。
戦車は社会問題よりも国家レベルの政治イベントに重点を置いている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:39:21 GMT)
Why Do Class-Dependent Evaluation Effects Occur with Time Series Feature Attributions? A Synthetic Data Investigation [5.1] 「クラス依存評価効果」は、摂動解析が帰属品質を確実に測定するかどうかという疑問を提起する。
複数の帰属法を用いて,摂動に基づく劣化スコアと地中真理に基づく精度評価値を比較した。
最も重要な点として、摂動に基づく実測値と基底的実測値が、クラスごとの帰属品質の矛盾した評価をしばしば得ることが挙げられる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:52:32 GMT)
Understanding Input Selectivity in Mamba: Impact on Approximation Power, Memorization, and Associative Recall Capacity [5.1] State-Space Models (SSM) は Transformer に代わる有望な代替手段として最近登場した。
MambaはSSM層に入力選択性を導入し(S6)、畳み込みとゲーティングをブロック定義に組み込む。
我々は,マンバにおける入力選択性の役割を軽視し,機能近似能力,長期記憶,連想記憶能力に与える影響を考察した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:38:41 GMT)
Leveraging Satellite Image Time Series for Accurate Extreme Event Detection [5.1] 気候変動により、極端な気象現象が増加し、大きな環境被害と生命の喪失を引き起こしている。
SITS-Extremeは、衛星画像時系列を利用して複数の事前観測を組み込むことで、極端な事象を検出する新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:58:20 GMT)
DaMO: A Data-Efficient Multimodal Orchestrator for Temporal Reasoning with Video LLMs [5.1] 大規模言語モデル(LLM)が最近ビデオドメインに拡張され、洗練されたビデオ言語理解が可能になった。
本稿では,正確な時間的推論とマルチモーダル理解を目的とした,データ効率のよいビデオLLMであるDaMOを紹介する。
構造化された4段階のプログレッシブトレーニングパラダイムを通じてDaMOをトレーニングし、マルチモーダルアライメント、セマンティックグラウンド、時間的推論機能を備えたモデルを段階的に装備する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:13:05 GMT)
Exact multiple anomalous mobility edges in a flat band geometry [5.0] 異常なモビリティエッジは、準周期系における新たな局在化遷移の形式を表す。
平面バンドモデルの幾何学的構造を利用して正確なAMEを構築する。
本研究は,準周期系におけるAMEの存在と特性に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:29:32 GMT)
Hilbert subspace imprint: a new mechanism for non-thermalization [5.0] 我々はHilbert subspace imprint(HSI)を導入する。
HSIは、初期状態が固有状態のスケーリング(システムサイズ)セットと排他的に重なり合うときに現れる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:13:49 GMT)
FAD-Net: Frequency-Domain Attention-Guided Diffusion Network for Coronary Artery Segmentation using Invasive Coronary Angiography [5.0] 冠状動脈分節の精度を高めるために,周波数領域解析に基づく新しいディープラーニングモデルを提案する。
FAD-Netは、冠動脈セグメンテーションにおいて平均Dice係数0.8717を達成し、既存の最先端法よりも優れている。
真の陽性率は0.6140であり、狭窄検出における正の予測値は0.6398であり、臨床応用性を示している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:10:48 GMT)
Guiding Time-Varying Generative Models with Natural Gradients on Exponential Family Manifold [5.0] 時間変化生成モデルの進化は指数族多様体に射影できることを示す。
次に、自然な勾配降下スキームに従って、多様体上の射影を移動させることで生成モデルを訓練する。
指数族内の任意のパラメトリックモデルのクローズドフォーム更新ルールを特徴とするアルゴリズムの粒子バージョンを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:17:34 GMT)
Delayformer: spatiotemporal transformation for predicting high-dimensional dynamics [5.0] Delayformerは、すべての変数の動的を同時に予測するためのフレームワークである。
動的システムの観点から、Delayformerは個々の変数ではなくシステム状態を予測する。
Delayformerは、合成データセットと実世界のデータセットの両方でのタスクの予測において、現在の最先端メソッドよりも優れています。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:30:12 GMT)
A Collaborative Process Parameter Recommender System for Fleets of Networked Manufacturing Machines -- with Application to 3D Printing [4.9] 3Dプリンティングファームは、複数のネットワーク化された3Dプリンタが並列に動作している。
同じタイプのマシンであっても、製造マシン群間でプロセスパラメータを最適化することは、マシンからマシンへの可変性のために依然として課題である。
逐次行列補完タスクとして問題をモデル化することにより,各マシンのプロセスパラメータを最適化する,機械学習による協調推薦システムを導入する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:56:53 GMT)
Scalable unsupervised feature selection via weight stability [4.8] アンサンプの特徴選択は、高次元データのクラスタリング性能向上に不可欠である。
我々は、ミンコフスキー重み付き$k$-means++という、ミンコフスキー重み付き$k$-means++の新しい初期化戦略を紹介した。
提案する2つの新機能選択アルゴリズム,FS-MWK++は,ミンコフスキー指数の範囲で特徴量を集約する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:11:37 GMT)
Privacy Reasoning in Ambiguous Contexts [4.8] 適切な情報開示を推論する言語モデルの能力について検討する。
我々は、プライバシーアセスメントにおいて、コンテキストあいまいさをハイパフォーマンスの重要な障壁とみなす。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:42:22 GMT)
Nuclear Electric Quadrupole Moment-Induced Parity Doubling in Molecules for Symmetry-Violation Searches [4.7] 核磁気四極子モーメント(MQM)と核シフモーメント(NSM)の探索は、標準モデルを超えて、時間(T$)とパリティ(P$)の逆対称性に違反する発見可能性が高い。
EQMsはパリティ・ダブルト状態間のエネルギー分割を著しく変更し、必要な分極電場を変化させることができることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:37:06 GMT)
Variational Neural Stochastic Differential Equations with Change Points [4.7] ニューラル微分方程式(ニューラルSDE)を用いた時系列データにおける変化点のモデル化について検討する。
本稿では,時系列をニューラルSDEとしてモデル化するための変分オートエンコーダ(VAE)フレームワークに基づく,新しいモデル定式化とトレーニング手法を提案する。
本稿では,従来のパラメトリックSDEと分散シフトを伴う実データセットの両方を効果的にモデル化できることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:59:20 GMT)
Bias and Identifiability in the Bounded Confidence Model [4.7] 有界信頼モデル(bounded confidence model)は、集団がコンセンサス、断片化、分極に達する方法を記述している。
モデルパラメータの推定は重要な側面であり、最大推定はそれに取り組むための原則的な方法を提供する。
この結果から, 確率関数の解析は, 仮説力学モデルのパラメータを推定する際の落とし穴や可能性をよりよく理解するための実りある手法であることが示唆された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:04:29 GMT)
Simplicity is Key: An Unsupervised Pretraining Approach for Sparse Radio Channels [4.6] SpaRTranは、無線チャネルの圧縮センシングに基づく教師なし表現学習手法である。
SpaRTranは、無線信号の微調整時に最先端の手法と比較してエラーを最大85%削減する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:21:01 GMT)
CGVQM+D: Computer Graphics Video Quality Metric and Dataset [4.6] 本稿では,高度なレンダリング技術によって導入された歪みに着目した映像品質データセットを提案する。
評価の結果,既存の全参照品質指標はこれらの歪みに準最適に作用することがわかった。
本稿では,CGVQMを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:59:55 GMT)
Convergence Analysis of Natural Gradient Descent for Over-parameterized Physics-Informed Neural Networks [4.6] 2層$textReLU3$ Physics-Informed Neural Networks (PINNs) のトレーニングにおいて、学習率は $mathcalO(lambda_0)$から $mathcalO (1/|bmHinfty|_2)$に改善可能であることを示す。
このような改善にもかかわらず、収束速度は依然としてグラム行列の最小固有値と結び付けられ、収束が遅くなる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:46:16 GMT)
Dynamic Double Space Tower [4.6] 本研究は,モデルの推論能力を高めるために,注目機構を置き換える新しい手法を提案する。
具体的には,人間のジェスチャー視覚の原理に従って画像の観察を行うために,動的双方向空間タワーを4層に分割して提案する。
これは自然界において、エンティティ間の空間的構造に強力な構造的事前を与えるため、もはやピクセル間の関係を盲目的に検索することができない。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:27:45 GMT)
Breaking Habits: On the Role of the Advantage Function in Learning Causal State Representations [4.5] 政策勾配法でよく用いられる利点関数は、勾配推定のばらつきを減少させる。
分析的および経験的証拠の両方で、有利な関数によるトレーニングが軌道外性能の向上につながることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:06:47 GMT)
Generative or Discriminative? Revisiting Text Classification in the Era of Transformers [4.5] 本稿では,近代的な生成的・差別的アーキテクチャの包括的評価について紹介する。
様々なシナリオにおいて,サンプル効率,校正,騒音の頑健性,規則性を解析した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:03:58 GMT)
Machine Learning Fairness in House Price Prediction: A Case Study of America's Expanding Metropolises [4.5] 本稿では,構造的属性と近傍属性を組み合わせた機械学習モデルについて述べる。
特権群の様々な定義の下で、MLモデルの公正性に関する包括的な評価を行う。
異なるバイアス緩和ソリューションの性能について検討する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:22:12 GMT)
Compression Aware Certified Training [4.5] 既存の方法は圧縮と証明された堅牢性を別々の目標として扱い、効率性または安全性を損なう。
我々は、これらの目標を訓練中に統一するための一般的なフレームワークであるCACTUSを提案する。
我々は, CACTUS をプルーニングと量子化の両方に適用し, 効率的に圧縮可能なモデルを効果的に訓練することを示した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:48:50 GMT)
CIRO7.2: A Material Network with Circularity of -7.2 and Reinforcement-Learning-Controlled Robotic Disassembler [4.4] 本研究では, 臨界係数0.1および0.95の2つの固形材料のバッチを処理する熱力学材料ネットワークを開発した。
次に、最先端のRLアルゴリズムを用いてロボット分解器コンパートメントの設計とアルゴリズム性能の評価に焦点をあてる。
最も高い円度は1kgの2つの部分を分解した場合-2.1であり、また1kgの4つの部分を分解する場合は7.2に減少する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:01:01 GMT)
LLM-based Property-based Test Generation for Guardrailing Cyber-Physical Systems [4.4] サイバー物理システム(サイバー物理システム、CPS)は、物理、計算、通信サブシステムを統合する複雑なシステムである。
本稿では,Large Language Models (LLMs) が生成するプロパティベーステスト (PBTs) を用いたCPSの自動ガードレール手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:56:36 GMT)
Fast Inference with Kronecker-Sparse Matrices [4.4] KS行列乗算のための既存のGPUカーネルは、高いデータ移動コストに悩まされている。
本稿では、これらのオーバーヘッドを解消する、融合した出力定常GPUカーネルを提案する。
FP32では,VT-S/16では最大22%,GPT-2媒体では16%のレイテンシ低下を示した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:00:28 GMT)
Preempting Text Sanitization Utility in Resource-Constrained Privacy-Preserving LLM Interactions [4.4] このような衛生的なプロンプト上でのLCMの性能を予測することは困難であることを示す。
粗悪なパフォーマンスは、パーユースモデルで課金されるLCMサービスに対して明らかな金銭的結果をもたらす。
本稿では,LLMに送信される前に,与えられた衛生的プロンプトの有用性を予測するために,小言語モデルを利用したアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:11:46 GMT)
How Much is Enough? The Diminishing Returns of Tokenization Training Data [4.3] 1GBから900GBまでの英語学習データを用いて,BPE,UnigramLM,WordPieceのトークンをさまざまな語彙サイズで訓練する。
トレーニングデータのサイズが約150GBを超えると、リターンは低下する。
ロシア語のテキストでは、200GBのデータからトークンライザをトレーニングした後のリターンの低下が観察され、英語のトレーニングよりも約33%高い。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:24:27 GMT)
Scalable Generalized Bayesian Online Neural Network Training for Sequential Decision Making [4.3] オンライン学習のためのスケーラブルなアルゴリズムを導入し,ニューラルネットワークパラメータのベイズ推論を一般化した。
私たちのメソッドは、バッファを再生したりオフラインでリトレーニングしたりすることなく、すべてのネットワークパラメータをオンラインで更新します。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:44:14 GMT)
Mapping Neural Theories of Consciousness onto the Common Model of Cognition [4.3] 意識の4つの神経理論をコモン・モデル・オブ・コグニション(Common Model of Cognition)にマッピングする。
このことは、4つの組み合わせがリカレントなローカルモジュールと、複雑な状態を持つグローバルなワーキングメモリで動作する認知サイクルにどのように依存しているかを強調している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:51:06 GMT)
HandS3C: 3D Hand Mesh Reconstruction with State Space Spatial Channel Attention from RGB images [4.3] 簡単な3次元手メッシュ再構成ネットワーク(HandS3C)を提案する。
ネットワーク上では,有効受容場を拡張可能な空間空間アテンションモジュールを設計する。
提案するHandS3Cは,最小限のパラメータを維持しながら最先端の性能を実現する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:07:47 GMT)
Accelerating Delta Debugging through Probabilistic Monotonicity Assessment [4.2] 本稿では,確率的単調性評価(PMA)を紹介する。
PMAは、効率を犠牲にすることなくDDMINスタイルのアルゴリズムの効率を高める。
PMAを2つの主要なDDMIN式ツールであるCHISELとProbDDと比較した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:35:09 GMT)
Improving Causal Interventions in Amnesic Probing with Mean Projection or LEACE [4.2] アムネシック・プローブ(アムネシック・プローブ)は、特定の言語情報がモデルに与える影響を調べるために用いられる技法である。
関連する情報を特定して取り除き、主要なタスクにおけるモデルのパフォーマンスが変化したかどうかを評価する。
イテレーティブ・ヌルスペース・プロジェクション(INLP, Iterative Nullspace Projection)は,対象情報を削除する際に,表現にランダムな修正を導入する手法である。
提案する2つの代替手段である平均射影(MP)とLEACEは、より標的的な方法で情報を除去し、行動説明を得る可能性を高めることを実証する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:07:14 GMT)
Explainability of Large Language Models using SMILE: Statistical Model-agnostic Interpretability with Local Explanations [4.1] GPT、LLAMA、Claudeといった大規模な言語モデルは、テキストを生成するのに驚くほど強力になっています。
しかし、彼らはまだブラックボックスなので、何を言うべきかをどう判断するかを理解するのは難しい。
SMILEは、これらのモデルがプロンプトの異なる部分にどのように反応するかを説明する新しい方法である。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:43:15 GMT)
Applying Cognitive Design Patterns to General LLM Agents [4.1] 本稿では, 様々な事前変換型AIアーキテクチャに現れる, 繰り返し発生する認知設計パターンについて概説する。
次に、大規模言語モデル(LLM)を用いたシステムにおいて、これらのパターンがどのように明らかであるかを考察する。
これらの繰り返しパターンを調べて適用することで、今日のエージェントLLMシステムにおけるギャップや欠陥の予測が可能になる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:53:31 GMT)
CnC-PRAC: Coalesce, not Cache, Per Row Activation Counts for an Efficient in-DRAM Rowhammer Mitigation [4.0] JEDECは、DDR5と将来のDRAMのためのPer Row Activation Counting (PRAC)フレームワークを導入した。
性能とエネルギーのオーバーヘッドに対処するPRAC実装であるCnC-PRACを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:28:38 GMT)
Automated Treatment Planning for Interstitial HDR Brachytherapy for Locally Advanced Cervical Cancer using Deep Reinforcement Learning [4.0] 本研究の目的は、完全に自動化されたHDRブラキセラピー計画フレームワークを開発することである。
階層的な2段階自動計画フレームワークを提案する。
未確認の患者では、RLベースの自動計画法が平均93.89%を達成し、平均91.86%の臨床計画を上回りました。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:07:30 GMT)
Fast and High Excitation Transport in Waveguide Quantum Electrodynamics [3.9] 2つのよく分離された冷間結合原子配列を用いることにより、高速で高い原子励起輸送を示す。
この増強された導波管による励起の輸送は、スペクトル的に単離され、右局在化された右固有状態の優位性によって出現する。
本研究は,wQEDプラットフォームに適用可能性を示し,量子工学および量子情報アプリケーションに対する洞察を提供する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:34:13 GMT)
"It's not a representation of me": Examining Accent Bias and Digital Exclusion in Synthetic AI Voice Services [3.9] 本研究では、混合手法を用いて2つの合成AI音声サービス(SpeechifyとElevenLabs)を評価する。
以上の結果から,5つの地域,英語のアクセントにおける技術的特徴の相違が判明した。
現在の音声生成技術は、言語特権とアクセントに基づく差別を不注意に強化することができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:08:50 GMT)
Abstract Sound Fusion with Unconditioned Inversion Model [3.8] 抽象音は、リスナーに特定可能な実世界の音のイベントを開示しない。
音融合は、原音と基準音を合成して、音成分の単なる付加的な重ね合わせ以上の聴覚的特徴を示す新しい音を生成することを目的としている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:13:45 GMT)
A Survey of Generative Categories and Techniques in Multimodal Large Language Models [3.8] MLLM(Multimodal Large Language Models)はテキスト生成を超えて急速に進化してきた。
本調査では,6つの主要な生成モダリティを分類し,基礎技術がクロスモーダル機能を実現する方法について検討する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:56:42 GMT)
ST-MTM: Masked Time Series Modeling with Seasonal-Trend Decomposition for Time Series Forecasting [3.7] 予測のための時間依存性をモデル化するために,仮設時系列モデリングが提案されている。
季節差分解を考慮したマスク付き時系列モデリングフレームワークST-MTMを提案する。
ST-MTMは、既存のマスキングモデリング、コントラスト学習、教師付き予測手法と比較して、一貫して優れた予測性能を達成する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:06:47 GMT)
TCN-DPD: Parameter-Efficient Temporal Convolutional Networks for Wideband Digital Predistortion [3.7] TCN-DPDは時間畳み込みネットワークに基づくパラメータ効率の高いアーキテクチャである。
シミュレーションされたACPRは-51.58/-49.26 dBc (L/R)、EVMは-47.52 dB、NMSEは-44.61 dB、パラメータは500である。
従来のモデルよりも200パラメータまで優れた線形化を維持しており、効率的な広帯域PA線形化を約束している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:30:32 GMT)
Factual Knowledge in Language Models: Robustness and Anomalies under Simple Temporal Context Variations [3.7] 本稿では,事実知識における時間的文脈の変化に対する言語モデルの堅牢性について考察する。
LMが時間的文脈と特定の期間に有効な過去の事実を正しく関連付けることができるかどうかを検討する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:58:26 GMT)
Uncertainty Awareness Enables Efficient Labeling for Cancer Subtyping in Digital Pathology [3.7] 本研究では,不確実性認識の概念を自己指導型コントラスト学習モデルに導入する。
ベンチマークデータセットを用いた癌サブタイピングにおける最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:37:57 GMT)
Schema-R1: A reasoning training approach for schema linking in Text-to-SQL Task [3.7] スキーマリンクモデルに対する現在の微調整アプローチは、ロートラーニングパラダイムを採用している。
強化学習を用いて学習した推論スキーマリンクモデルである-R1を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:46:02 GMT)
A Comparative Analysis of Influence Signals for Data Debugging [3.6] 影響に基づく信号は、潜在的にノイズの多いトレーニングセットから、誤ラベルされたサンプルと異常なサンプルの両方を識別することができる。
自己影響のような信号は、誤ラベルされたサンプルを効果的に検出するが、既存の信号は異常を検出できない。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:47:04 GMT)
Banded Square Root Matrix Factorization for Differentially Private Model Training [3.6] 本稿では,この計算ボトルネックを克服する新しい行列分解手法であるBSRを提案する。
標準行列平方根の特性を利用することにより、BSRは大規模問題も効率的に扱うことができる。
我々の数値実験により、BSRを用いて訓練されたモデルは、その計算オーバーヘッドを完全に回避しつつ、最良の既存手法と同等に機能することを示した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:00:00 GMT)
Large Language Model-Powered Conversational Agent Delivering Problem-Solving Therapy (PST) for Family Caregivers: Enhancing Empathy and Therapeutic Alliance Using In-Context Learning [3.6] 家族介護者はしばしば深刻な精神疾患に悩まされる。
本研究では,大規模言語モデル(LLM)を用いた会話エージェントが,エビデンスに基づくメンタルヘルス支援を実現する可能性について検討した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 00:47:57 GMT)
Converting Annotated Clinical Cases into Structured Case Report Forms [3.6] ケースレポートフォーム(CRF)は、臨床研究における結果の正確性、信頼性、妥当性を保証するため、主に医学研究で使用される。
本稿では,2言語でE3Cデータセットに適用した半自動変換手法を提案する。
我々は,スロットフィリングがイタリア語で59.7%,英語で67.3%に達することを報告している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:53:50 GMT)
Expert Insight-Based Modeling of Non-Kinetic Strategic Deterrence of Rare Earth Supply Disruption:A Simulation-Driven Systematic Framework [3.6] 本研究では,レアアース供給破壊シナリオにおける非運動論的戦略抑止経路をシミュレートするための定量的モデリングフレームワークを構築した。
データは、ISR、電子戦、レアアースコントロールにおける米国と中国のダイナミクスを中心とした専門家のインタビューとシナリオ分析に由来する。
その結果, 組織的な信号は強いテンポと経路結合効果を有し, 戦略的能力の急速な劣化を引き起こす可能性が示唆された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:18:59 GMT)
Entropy Controllable Direct Preference Optimization [3.5] 提案するDPOは,提案するポリシのエントロピーを制御可能なH-DPOである。
実験の結果,H-DPO は様々なタスクにおいて DPO よりも優れており,数理タスクに対するpass@$k$ 評価において優れた結果が得られた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:47:42 GMT)
Two heads are better than one: simulating large transformers with small ones [3.5] 長い入力シーケンスを持つ変換器は、短い入力シーケンスしか持たない変換器で効率的にシミュレートできることを示す。
次に、平均ケース入力、スライディングウインドウマスキング、アテンションシンクを含む様々な自然シナリオにおいて、最適数$O(N/M)$の小さな変圧器が十分であることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:47:12 GMT)
Beyond the Visible: Multispectral Vision-Language Learning for Earth Observation [3.5] Llama3-MS-CLIPは、大規模なマルチスペクトルデータセット上で、コントラスト学習で事前訓練された最初の視覚言語モデルである。
我々は,100万個のSentinel-2サンプルからなるマルチスペクトルデータに対して,これまでで最大の画像キャプチャーデータセットを提案する。
Llama3-MS-CLIPを多スペクトルゼロショット画像分類と3つの複雑さのデータセットを用いた検索で評価した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:24:09 GMT)
Towards Undistillable Models by Minimizing Conditional Mutual Information [3.4] 深層ニューラルネットワーク(DNN)は、ブラックボックス入力出力教師として使用される場合、知識蒸留(KD)によって蒸留できない場合、蒸留不可能とされる。
従来のクロスエントロピー(CE)損失を最小化してDNNを訓練するCMIM法を提案する。
CMIMモデルは、広範囲な実験により、文献に存在する全ての試験されたKD法で不溶性であることが示されている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 00:56:29 GMT)
Temporal cross-validation impacts multivariate time series subsequence anomaly detection evaluation [3.4] 時系列クロスバリデーション (TSCV) 技術は, モデル評価中の時間秩序を維持することを目的としている。
本研究は,MTSデータセットの故障様異常を検出する訓練を行った分類器の精度・リコール特性に及ぼすTSCV戦略の影響を系統的に検討する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:14:44 GMT)
MapQaTor: An Extensible Framework for Efficient Annotation of Map-Based QA Datasets [3.4] 我々は、トレース可能なマップベースのQAデータセットの作成を合理化する、オープンソースのフレームワークであるMapQaTorを紹介した。
MapQaTorは任意のMap APIとのシームレスな統合を可能にし、ユーザはさまざまなソースからデータを収集して視覚化することができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:04:46 GMT)
Further Evidence on a Controversial Topic about Human-Based Experiments: Professionals vs. Students [3.4] 同じJavaプログラムのバグ修正タスクについて、62人の学生と42人のソフトウェア専門家を比較した。
参加者の2つのグループの違いを考慮すると、学生はバグ修正のプロフェッショナルよりも優れていた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:05:36 GMT)
Predicting Patient Survival with Airway Biomarkers using nn-Unet/Radiomics [3.3] AIIB 2023コンペティションの主な目的は、肺線維症患者の生存率を決定するために、気道画像バイオマーカーの予測的意義を評価することである。
本研究は総合的な3段階アプローチを導入する。
気管を中心とする放射能画像と、気道を囲む囲む箱から、重要な特徴を抽出する。
このステップは、気道の構造と寸法に符号化された関連する情報と同様に、気管領域内での致命的な生存関連洞察の存在の可能性によって動機付けられている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:16:23 GMT)
TrustGLM: Evaluating the Robustness of GraphLLMs Against Prompt, Text, and Structure Attacks [3.3] テキスト,グラフ構造,即時操作の3次元にわたる敵攻撃に対するGraphLLMの脆弱性を評価する総合的研究であるTrustGLMを紹介する。
この結果から,GraphLLMsは,ノードのテキスト属性に含まれる意味論的に類似した単語を置き換えるだけで,テキスト攻撃に非常に敏感であることが判明した。
また、標準グラフ構造攻撃手法はモデル性能を著しく低下させるが、プロンプトテンプレートで候補ラベルセットをランダムにシャッフルすると性能が大幅に低下する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:48:01 GMT)
Requirements for Recognition and Rapid Response to Unfamiliar Events Outside of Agent Design Scope [3.3] オープンな世界のエージェントは、以前の経験や既存のモデル、ポリシー以外では馴染みのない出来事に直面します。
ドメイン一般メタ知識(人間の認知に触発された)とメタ推論を組み合わせた新しいアプローチを提案する。
このアプローチは、不慣れな状況に対する高速で適応的な応答を可能にし、オープンワールドの一般エージェントに必要なパフォーマンス特性をより完全に満たす。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:38:02 GMT)
Mind the XAI Gap: A Human-Centered LLM Framework for Democratizing Explainable AI [3.3] 我々は,専門家や非専門家のニーズに合わせて,透明性と人間中心の説明を保証する枠組みを導入する。
本フレームワークは,専門家以外の専門家が理解可能な1つの応答説明と専門家への技術的情報にカプセル化されている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:41:07 GMT)
Position Paper: Rethinking AI/ML for Air Interface in Wireless Networks [3.2] 無線通信におけるAI/MLの可能性を完全に実現するには、両方の分野の深い学際的理解が必要である。
オープンな研究課題と、学術および産業コミュニティがAI対応無線システムの未来形成に貢献する機会を概説する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:41:51 GMT)
SemanticST: Spatially Informed Semantic Graph Learning for1 Clustering, Integration, and Scalable Analysis of Spatial2 Transcriptomics [3.1] 本稿では,空間転写学解析のためのグラフベースのディープラーニングフレームワークSemanticSTを提案する。
ミニバッチトレーニングをサポートしており、Xenium(50,000セル)のような大規模データセットにスケーラブルなグラフニューラルネットワークとしては初めてのものだ。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:30:48 GMT)
AgentSense: Virtual Sensor Data Generation Using LLM Agent in Simulated Home Environments [3.1] 堅牢で一般化可能なスマートホームベースのヒューマンアクティビティ認識(HAR)システムを開発する上での大きな障害は、大規模で多様なラベル付きデータセットの欠如である。
本稿では,大規模言語モデルを利用して多様なペルソナを生成する仮想データ生成パイプラインであるAgentSenseを紹介する。
仮想センサデータを活用することで,特に実データに制限がある場合,性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:31:08 GMT)
DPUV4E: High-Throughput DPU Architecture Design for CNN on Versal ACAP [3.0] AIアプリケーション用に設計されたAMDのVersal ACAPアーキテクチャには、AIエンジン(AIE)が組み込まれ、高い計算能力を提供する。
2PE(32.6ドルTOPS)から8PE(131.0ドルTOPS)までの構成を提供するVersalアーキテクチャ用のDPUV4Eを提案する。
我々の設計では、従来のFPGAベースのDPU設計のTOPS/Wを8.6タイムで提供し、DSP使用率を95.8%、LUT使用率を44.7%、レイテンシを6.8.5%に削減しています。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:39:05 GMT)
Weisfeiler and Leman Follow the Arrow of Time: Expressive Power of Message Passing in Temporal Event Graphs [3.0] 時間的グラフにおける時間的参照パスの時間的展開表現を利用する一貫したイベントグラフ同型の概念を導入する。
本稿では,時間グラフのイベントグラフ表現に基づく時間グラフニューラルネットワークのための新しいメッセージパッシング方式を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:29:04 GMT)
Holstein-Friesian Re-Identification using Multiple Cameras and Self-Supervision on a Working Farm [2.9] 複数のカメラで撮影されたMultiCamCows2024は、ホルシュタイン・フリース種牛の生体認証のための大規模画像データセットである。
データセットは、90頭の牛の101,329枚の画像と、基盤となるCCTVの映像で構成されている。
本研究では,データセットから画像の識別精度を96%以上上回る性能を報告し,学習中の複数のカメラからのデータを組み合わせることで,自己教師付き識別が促進されることを示した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:48:02 GMT)
Evaluating Sensitivity Parameters in Smartphone-Based Gaze Estimation: A Comparative Study of Appearance-Based and Infrared Eye Trackers [2.9] 本研究では,スマートフォンを用いた深層学習眼球追跡アルゴリズムの評価を行い,その性能を市販の赤外線眼球追跡装置と比較した。
本研究の目的は,現実的なモバイル利用条件下での外観に基づく視線推定の実現可能性を検討することである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:33:54 GMT)
VEIGAR: View-consistent Explicit Inpainting and Geometry Alignment for 3D object Removal [2.9] 新しいビュー合成(NVS)と3D生成は編集タスクを大幅に改善した。
生成プロセス全体を通して横断的な一貫性を維持するために、メソッドは通常、デュアルストラテジーフレームワークを使用してこの問題に対処する。
VEIGARは,初期再構成フェーズに依存することなく,既存の手法より優れた計算効率の高いフレームワークである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:31:44 GMT)
ImmunoFOMO: Are Language Models missing what oncologists see? [2.9] 各種言語モデルの臨床医に対する医療概念的根拠について検討し,乳がん要約における免疫療法の目印の同定について検討した。
その結果、事前学習された言語モデルは、非常に具体的な(低レベルな)概念を特定する上で、大きな言語モデルよりも優れている可能性が示唆された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:00:03 GMT)
Automatic Construction of Multiple Classification Dimensions for Managing Approaches in Scientific Papers [2.8] 本稿では、トップダウン方式を用いてアプローチパターンを特定し、4つの異なる言語レベルを通してパターンを精査する。
科学的論文のアプローチは、アプローチパターンに基づいて抽出される。
これらのパターンを用いて、アプローチを分類する5つの次元を同定する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:00:02 GMT)
Private Continuous-Time Synthetic Trajectory Generation via Mean-Field Langevin Dynamics [2.7] トラジェクトリ推論と連続時間合成データ生成の接続を利用する。
我々は手書きMNISTデータの合成変動に基づいて現実的な軌跡を生成する実験を行った。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:13:37 GMT)
Topological Signatures of Magnetic Phase Transitions with Majorana Fermions through Local Observables and Quantum Information [2.7] 1次元の(1D)$J_1-J$量子スピンモデルはシュリーファー=スー=ヘーガーモデルの強いカップリング類似体と見なすことができる。
このモデルは、低エネルギーマヨラナフェルミオンの出現に伴う位相相転移を示すp波超伝導線にもマッピングされる。
このシステムは材料で実現され、量子回路、光学格子で設計される。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:43:34 GMT)
MBSR at Work: Perspectives from an Instructor and Software Developers [2.7] MBSR(Mindfulness-Based Stress Reduction)プログラムは、多国籍企業のソフトウェア開発者によって認識されている。
MBSRは様々な作業環境で実験されてきたが、ソフトウェア開発(SD)の作業環境では研究されていない。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:51:07 GMT)
Brewing Knowledge in Context: Distillation Perspectives on In-Context Learning [2.6] In-context Learning (ICL) は、大きな言語モデルでウェイトアップなしで新しいタスクを解くことができる。
実証的な成功にもかかわらず、ICLのメカニズムはいまだに理解されていない。
本稿では,ICLを知識蒸留の暗黙の形式として解釈する新たな理論的視点を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:17:41 GMT)
Optimization of bi-directional gated loop cell based on multi-head attention mechanism for SSD health state classification model [2.6] 本研究では,ストレージデバイスの健康分類の精度と安定性を高めるために,マルチヘッドアテンション機構を組み込んだハイブリッドBiGRU-MHAモデルを提案する。
実験結果から,本モデルではトレーニングセットが92.70%,テストセットが92.44%,最小性能差が0.26%であった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 22:01:57 GMT)
Approximating the total variation distance between spin systems [2.5] 本研究では,差分距離$d_TV(mu,nu)$を$epsilon$-relativeエラーで近似する問題について検討する。
そこで本研究では,テレビ距離の近似問題と,サンプリングと近似カウントとを関連付ける新しい削減法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:22:09 GMT)
Beating Transformers using Synthetic Cognition [2.5] 認知アーキテクチャを開発するための新しいアプローチ、Synthetic Cognitionが提案され、即時反応の振る舞いを開発するために実装されている。
そこで本研究では,最近実施されているSynthetic Cognitionの配列に対処する機構を提案し,DNA配列分類タスクにおけるDNA基盤モデルと比較した。
シーケンスに対処するためにSynthetic Cognitionを拡張することと、シーケンス分類のためのTransformerアーキテクチャを破ることの2つの目標を達成する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:55:58 GMT)
Enhancing Privacy: The Utility of Stand-Alone Synthetic CT and MRI for Tumor and Bone Segmentation [2.4] 頭頸部癌CTと脳グリオーマMRIを2つの大きなデータセットから用いた。
生成逆数ネットワークと拡散モデルを用いて合成データを生成する。
MAE, MS-SSIM, Radiomics and a Visual Turing Test (VTT) を用いて合成データの質を評価する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:17:48 GMT)
PermRust: A Token-based Permission System for Rust [2.4] システムリソースへのアクセスを制限するパーミッションシステムは、オペレーティングシステム、特にスマートフォンにおいて確立された技術である。
PermRustはRustプログラミング言語のトークンベースのパーミッションシステムである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:06:56 GMT)
Revisiting Stochastic Approximation and Stochastic Gradient Descent [2.4] 本稿では,近似 (SA) アルゴリズムと勾配 Descent (SGD) アルゴリズムの収束性を証明する新しい手法を提案する。
新しいアプローチはGSLLN(Generalized Strong Law of Large Numbers)と呼ばれる概念に基づいており、従来のSLLNを拡張している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:45:52 GMT)
Few-MHz bandwidth tunable optical filter based on a fiber-ring resonator [2.4] 超狭帯域・高出力・低損失・波長可変光フィルタを実現するファイバリング共振器を提案する。
これは、フィルタ帯域とオン共鳴伝送の正確な調整を可能にする、一対の商用可変比指向結合器で構成されている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:04:31 GMT)
GraphGSOcc: Semantic and Geometric Graph Transformer for 3D Gaussian Splating-based Occupancy Prediction [2.3] 本稿では,3次元ガウススプレイティングに基づく占領予測のための意味グラフと幾何学グラフを組み合わせた新しいフレームワークを提案する。
GraphGSOccモデルは24.10%のmIoUを実現し、GPUメモリを6.1GBに削減し、1.97%のmIoU改善と13.7%のメモリ削減を示した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:09:57 GMT)
Revealing Political Bias in LLMs through Structured Multi-Agent Debate [2.3] ニュートラル・エージェントは一貫して民主党と一致し、共和党はニュートラル・エージェントに近づいた。
ジェンダーはエージェントの態度に影響を与え、エージェントは他のエージェントの性別に気付くと彼らの意見に適応する。
共有された政治的関連を持つエージェントは、議論が進むにつれて、期待される態度の強化を示すエコーチャンバーを形成することができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:30:37 GMT)
Decadal sink-source shifts of forest aboveground carbon since 1988 [2.3] 我々は,1988年から2021年までの地球規模の森林において,高空間分解能で信頼性・調和したAGC指数とフラックスを導出する。
2001年から2010年の間に、湿潤な熱帯林が実質的なAGC源に移行したことが判明した。
ブラジルのアマゾンでは、AGC損失に対する森林伐採地の貢献は1989-2000年の60%から2011-2021年の13%に減少した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:29:10 GMT)
DISCO: Mitigating Bias in Deep Learning with Conditional Distance Correlation [2.3] 予測タスクの間、モデルは受信した任意の信号を使って最終回答を導き出すことができる。
実際のオブジェクト固有の詳細ではなく、照明条件を使用する予測器は、明らかに望ましくない。
本稿では,我々の予測に影響を及ぼす情報経路を解析するための因果的枠組みを構築するための標準的な反因果予測モデル(SAM)を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:29:03 GMT)
Chemical Language Model Linker: blending text and molecules with modular adapters [2.3] 我々は、ChemLML(ChemLML)という、軽量なアダプタベースの戦略を提案する。
ChemLMLは2つの単一ドメインモデルをブレンドし、テキスト記述から条件付き分子生成を得る。
SMILESとSELFIESのChemLMLにおける分子表現の選択は,条件付き分子生成性能に強い影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:39:54 GMT)
Efficient Excited-State Calculations for Molecules Based on Contextual Subspace Method and Symmetry Optimizations [2.2] 励起状態計算の量子計算法は、NISQ(Noisy Intermediate-Scale Quantum)ハードウェアでまだ探索されていない。
本稿では,文脈部分空間(CS)法と変分量子デフレレーション(VQD)アルゴリズムを統合する資源効率のよいフレームワークを提案する。
我々は、この組み合わせを励起状態の計算に利用して量子ビットを減らすことは不可能であることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:55:36 GMT)
AgriPotential: A Novel Multi-Spectral and Multi-Temporal Remote Sensing Dataset for Agricultural Potentials [2.2] 本稿では,数ヶ月にわたるSentinel-2衛星画像からなる新しいベンチマークデータセットであるAgriPotentialを紹介する。
このデータセットは、3種類の主要作物に対して、農業ポテンシャルのピクセルレベルのアノテーションを提供する。
データは南フランスの様々な地域をカバーし、豊富なスペクトル情報を提供している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:52:46 GMT)
Explaining Recovery Trajectories of Older Adults Post Lower-Limb Fracture Using Modality-wise Multiview Clustering and Large Language Models [2.2] 本稿では,高齢者の下肢骨折から回復した高齢者から収集したクラスター型センサデータの解釈の問題に対処する。
加速度、歩数、周囲の動き、GPS位置、心拍数、睡眠を含む560日間のマルチモーダルセンサーデータを在宅患者から遠隔で収集した。
それぞれのモダリティから派生したクラスタに対して意味のあるクラスタラベルを推論するために,大規模な言語モデルが採用された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:19:28 GMT)
ViTaSCOPE: Visuo-tactile Implicit Representation for In-hand Pose and Extrinsic Contact Estimation [2.1] 豪華な接触リッチオブジェクト操作は、オブジェクトのポーズと外部の接触位置の両方を要求する。
ViTaSCOPE: VisuoTac 同時接触と物体推定について述べる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:35:58 GMT)
DURA-CPS: A Multi-Role Orchestrator for Dependability Assurance in LLM-Enabled Cyber-Physical Systems [2.1] CPS(Cyber-Physical Systems)は、重要なアプリケーションで運用する高度なAI技術に依存している。
従来の検証と検証方法は、AIコンポーネントの予測不可能でダイナミックな性質を扱うのに苦労することが多い。
我々は,AIによるCPSの反復保証プロセスを自動化するために,マルチロールオーケストレーションを利用する新しいフレームワークであるDURA-CPSを紹介する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:57:22 GMT)
TUMLU: A Unified and Native Language Understanding Benchmark for Turkic Languages [2.1] 本稿では,テュルク語MMLUのTUMLUとTUMLU-miniの2つのベンチマークを提案する。
TUMLU-miniは、アゼルバイジャン語、クリミア・タタール語、カラカルパック語、カザフ語、タタール語、トルコ語、ウイグル語、ウズベク語で11人の学者からなる中・高校レベルの質問からなる。
また、より簡潔でバランスの取れた、手作業によるデータセットのサブセットであるTUMLU-miniも提示します。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:12:23 GMT)
Learning Causality for Modern Machine Learning [2.1] 過去数十年間、経験的リスク最小化による機械学習は、学習において大きな能力を示してきた。
ERMは、変更の理解と処理方法の因果関係のモデリングを避けます。
本稿では,現代の機械学習において,より広範なタスクの因果性を取り入れ,実現する方法を検討する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:03:49 GMT)
Predicting Early-Onset Colorectal Cancer with Large Language Models [2.1] 早期発症大腸癌(EoCRC)の予測に10種類の機械学習モデルを適用した。
CRC患者1,953例を米国全土で調査した。
その結果, 微調整LDMは感度が73%, 特異性が91%であった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:15:43 GMT)
Understanding the Issue Types in Open Source Blockchain-based Software Projects with the Transformer-based BERTopic [2.1] 本稿では,GitHubにホストされている1,209のオープンソースブロックチェーンプロジェクトから抽出した497,742件について,大規模な実証研究を行った。
私たちの分析によると、一般的なソフトウェア開発の問題とブロックチェーン特有の懸念の両方が、ほぼ同じように表現されている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:02:13 GMT)
Diffusion-Based Electrocardiography Noise Quantification via Anomaly Detection [2.0] 本研究では、再構成に基づく異常検出によるECGノイズ定量化のための拡散型フレームワークを提案する。
提案手法は, 臨床診断, 診断精度, リアルタイム心電図モニタリング機能を向上させる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:19:04 GMT)
Deep Learning Model Acceleration and Optimization Strategies for Real-Time Recommendation Systems [1.9] リアルタイムレコメンデーションシステムの主な課題は、レコメンデーション品質を犠牲にすることなく、推論遅延を減らし、システムのスループットを向上する方法である。
本稿では,モデリングとシステムレベルのアクセラレーションと最適化を併用した手法を提案する。
実験の結果、元の推奨精度を維持しながら、我々の手法は、レイテンシをベースラインの30%未満に削減し、システムのスループットを2倍以上に削減した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:39:21 GMT)
Improving Surgical Risk Prediction Through Integrating Automated Body Composition Analysis: a Retrospective Trial on Colectomy Surgery [1.9] 大腸全摘術後1年で死亡率の予測が得られた。
術後合併症,非計画的寛解,輸血,重症感染症が続発した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:51:14 GMT)
An Empirical study on LLM-based Log Retrieval for Software Engineering Metadata Management [1.9] 本稿では,信号ログデータとテストドライブからの映像記録を組み合わせたLarge Language Model (LLM) を用いたアプローチを提案する。
クエリ結果の信頼性を評価するために定量的なメトリクスを提供する。
オープンな産業データセットの評価は、シナリオ検索における効率性と信頼性の向上を示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:40:23 GMT)
Geospatial Artificial Intelligence for Satellite-Based Flood Extent Mapping: Concepts, Advances, and Future Perspectives [1.8] 衛星ベースの洪水範囲マッピングのためのGeoAIは、人工知能技術と衛星データを統合し、洪水イベントを特定し、その影響を評価する。
一次出力は、しばしば洪水範囲の地図を含み、影響地域を詳細に表し、不確実性推定や変化検出などの分析出力も含む。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:45:51 GMT)
A new multivariate primitive from CCZ equivalence [1.8] 多変量暗号はポスト量子暗号の候補の1つである。
本稿では,CCZを考慮した多変量モデルの構築方法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:19:18 GMT)
Persona-driven Simulation of Voting Behavior in the European Parliament with Large Language Models [1.8] 限られた情報によるゼロショットペルソナが、個別の投票決定を正確に予測できるかどうかを解析する。
欧州議会議員の投票行動は、重み付けされたF1スコアが約0.793で合理的にシミュレートできることがわかった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:02:21 GMT)
An Efficient Compression of Deep Neural Network Checkpoints Based on Prediction and Context Modeling [1.7] 本稿では,予め保存したチェックポイントの値を用いて,予測に基づく圧縮手法を提案する。
実験の結果,本手法は,復元されたチェックポイントからほぼロスレスなトレーニングリカバリを実現するとともに,ビットサイズの大幅な削減を実現していることがわかった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:54:42 GMT)
MiniMaxAD: A Lightweight Autoencoder for Feature-Rich Anomaly Detection [1.7] MiniMaxADは、通常の画像から広範囲の情報を効率よく圧縮し記憶するように設計された効率的なオートエンコーダである。
このモデルでは,特徴量の多様性を向上し,ネットワークの有効容量を増大させる手法を採用している。
我々の手法では、どんなデータセットも機能豊富な異常検出の枠組みの下で統一することができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:22:03 GMT)
Real-Time Feedback and Benchmark Dataset for Isometric Pose Evaluation [1.6] ポーズ評価のためのリアルタイムフィードバックシステムを提案する。
私たちのコントリビューションには、これまでで最大のマルチクラスの等尺運動ビデオデータセットのリリースが含まれています。
その結果、ホームワークアウトのための知的かつパーソナライズされた運動訓練システムの実現可能性が高まった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:33:59 GMT)
Causality in the human niche: lessons for machine learning [1.6] 機械学習システムに人間のような因果能力を構築することは、効果的で解釈可能なAIの構築を促進する可能性がある。
このような因果的能力が人間のニッチにどのように適応し、動機付けされているかを探る。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:13:52 GMT)
CoBRA: A Universal Strategyproof Confirmation Protocol for Quorum-based Proof-of-Stake Blockchains [1.6] 本稿では, 正当性, ビザンチン性, 有理性バリデータからなるハイブリッド脅威モデルの下で, 量子ベースステートマシンレプリケーション(SMR)プロトコルの形式的解析を行う。
従来の量子ベースのプロトコルの分析では,(1)部分同期ネットワークでは,有意な参加者が1/3ドル以上である場合,(2)有意な参加者が2/3ドル以上ある場合,Byzantine Validatorが2/3ドル以上である場合,SMRは不可能である。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:46:31 GMT)
Uncovering Bias Paths with LLM-guided Causal Discovery: An Active Learning and Dynamic Scoring Approach [1.5] 大規模言語モデル(LLM)は、統計的因果発見(CD)アプローチを有望に補完する。
機械学習における公平性を保証するには、センシティブな属性が結果に因果的にどのように影響するかを理解する必要がある。
本稿では,BFS(Broadth-first Search)戦略を拡張し,アクティブラーニングと動的スコアリングを併用したCD用LLMベースのハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:04:03 GMT)
LLMs on support of privacy and security of mobile apps: state of the art and research directions [1.5] セキュリティとプライバシーのリスクは依然としてモバイルアプリのユーザーを脅かす。
セキュリティリスクとプライバシ違反を特定するために,大規模言語モデルの適用について検討する。
ユーザが画像をオンラインで共有する場合に,機密データ漏洩を検出する手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:17:15 GMT)
Policy Optimization and Multi-agent Reinforcement Learning for Mean-variance Team Stochastic Games [1.4] 長期平均分散チームゲーム(MV-TSG)について検討する。
MV-TSGの主な課題は2つある。第一に、分散計量は動的条件下では加法的でもマルコフ的でもない。
逐次更新方式を用いた平均分散マルチエージェントポリシー反復 (MV-MAPI) アルゴリズムを提案する。
定常点の特定の条件をナッシュ平衡とし、さらに厳密な局所最適条件を導出する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:55:50 GMT)
From Idea to Implementation: Evaluating the Influence of Large Language Models in Software Development -- An Opinion Paper [1.4] トランスアーキテクチャの導入は自然言語処理(NLP)の転換点となった。
ChatGPT や Bard などの大規模言語モデル (LLM) が一般向けに公開されており、これらのモデルの膨大な可能性を示している。
専門家の全体的な意見は肯定的であり、生産性の向上やコーディング時間の短縮といったメリットを専門家が特定している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:27:46 GMT)
Low-overhead magic state distillation with color codes [1.4] 非クリフォードゲートのフォールトトレラント実装は、普遍的なフォールトトレラント量子コンピューティングを実現する上で大きな課題である。
本研究では,15-to-1蒸留回路と格子手術に基づく2つの蒸留方式を提案する。
与えられた目標不確実性に到達するためには、我々のスキームは、カラーコードに対する以前の最高のマジック状態蒸留スキームよりも、およそ2桁少ないリソースを必要とする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:10:10 GMT)
Enhancing multimodal analogical reasoning with Logic Augmented Generation [1.4] 本稿では,意味知識グラフを通じてテキストの明示的表現を利用する論理拡張生成(LAG)フレームワークを適用する。
本手法では,暗黙的な意味を表す拡張知識グラフを3つ生成し,ドメインに関わらず,ラベルのないマルチモーダルデータを推論する。
その結果、この統合されたアプローチは現在のベースラインを超え、視覚的メタファーを理解する上で人間よりも優れた性能を示し、より説明可能な推論プロセスを可能にした。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:49:35 GMT)
Are LLMs Good Text Diacritizers? An Arabic and Yorùbá Case Study [1.3] アラビア語とヨルバ語の2言語において,大言語モデル(LLMs)によるテキストのダイアクリタイズの有効性について検討した。
サイズ,アクセシビリティ,言語カバレッジの異なる14のLSMを評価し,これらを6つの専門診断モデルと比較した。
以上の結果から, アラビア語とヨルバ語の両方において, 多くの既成のLLMが, 専門的な発音モデルよりも優れていたが, より小さなモデルでは幻覚に悩まされていることが示唆された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:17:08 GMT)
Convergent Linear Representations of Emergent Misalignment [1.3] 微調整された大きな言語モデルは、広範に不整合な振る舞いを発達させる可能性がある。
9個のランク1アダプターでQwen2.5-14B-インストラクタを異常に除去するミニマルモデル生物について検討した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:39:54 GMT)
Real-World Deployment of a Lane Change Prediction Architecture Based on Knowledge Graph Embeddings and Bayesian Inference [1.3] この研究は、実際のハードウェア上で、知識グラフ埋め込み(KGE)とベイズ推定に基づくレーン変更予測システムを示す。
エゴ車両は、自身と周囲の車両の両方の安全を確保するために、縦方向のブレーキ動作を採用している。
実世界のハードウェア実験による検証により,我々の予測システムは,目標車両の車線変化を3~4秒前に予測することを示した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:24:28 GMT)
Model Organisms for Emergent Misalignment [1.3] 最近の研究で、Emergent Misalignment (EM)が発見されました。
私たちは、99%のコヒーレンスを達成する改良されたモデル生物のセットを作成します。
EMは,モデルサイズ,モデルファミリの3種類,教師付き微調整を含む多数のトレーニングプロトコルに対して頑健に発生することを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:34:25 GMT)
Single-photon emission modeling with statistical estimators for the exponential distribution [1.2] 単一光子源は、センシングやイメージングから通信まで、多くの量子技術で使用されている。
単一光子放出過程を記述するための統計的枠組みを提案し,この現象を定量化するための指数分布推定器を実装した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:00:03 GMT)
Graph-Based Floor Separation Using Node Embeddings and Clustering of WiFi Trajectories [1.2] 本研究では,Wi-Fi指紋トラジェクトリを用いた新しい床分離手法を提案する。
ノードがWi-Fi指紋を表すグラフを構築し、エッジは信号の類似性とコンテキスト遷移によって重み付けされる。
提案手法は,フロアレベルローカライゼーションのためのスケーラブルなソリューションを提供することにより,信号ノイズやアーキテクチャの複雑さに対するロバスト性を示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:48:03 GMT)
Resolve Highway Conflict in Multi-Autonomous Vehicle Controls with Local State Attention [1.1] 混合交通環境では、自動運転車は人間が制御する車両や他の異常な運転状況に適応する必要がある。
入力状態表現を支援するローカル状態アテンションモジュールを提案する。
我々のアプローチでは、マージプロセスを管理するために他の車両の情報に優先順位をつけることができます。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:48:54 GMT)
On Differential and Boomerang Properties of a Class of Binomials over Finite Fields of Odd Characteristic [1.1] F_r,pm1$は、pn equiv 3 pmod8$のとき、ブーメラン均一度が0$の局所PNであることを示す。
また、F_r,pm1$の微分スペクトルとブーメランスペクトルの完全な分類も提供する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:23:32 GMT)
Machine Intelligence on Wireless Edge Networks [1.1] 電力制約のあるエッジデバイス上でのディープニューラルネットワーク(DNN)推論は、コストのかかるストレージとデータ移動によってボトルネックとなる。
我々は、無線で重みをストリーミングすることでメモリを分解する無線周波数(RF)アナログアーキテクチャMIWENを紹介する。
我々は、熱雑音下での無線周波数アナログ計算の有効ビット数を導出し、エネルギー-精度トレードオフを定量化し、MNISTのディジタル比較精度を高次低エネルギーで示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:26:30 GMT)
SG2VID: Scene Graphs Enable Fine-Grained Control for Video Synthesis [1.1] SG2VIDは,Scene Graphsを利用した拡散型ビデオモデルである。
白内障と胆嚢摘出術を併用した3つの公開データセットでSG2VIDの能力を実証した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:00:16 GMT)
Scaling Human Activity Recognition: A Comparative Evaluation of Synthetic Data Generation and Augmentation Techniques [1.1] HAR(Human Activity Recognition)は、ラベル付きデータセットの不足によってしばしば制限される。
近年, 仮想慣性測定ユニット(IMU)データの生成について, クロスモーダル転送による検討が行われている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:43:21 GMT)
The Cambrian Explosion of Mixed-Precision Matrix Multiplication for Quantized Deep Learning Inference [1.0] ディープラーニング(DL)は、従来の64ビット浮動小数点(FP64)計算から、縮小精度のフォーマットへと変化した。
本稿では,従来のハイパフォーマンスなgemを改訂し,それを混合精度整数算術に適用するための戦略について述べる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:40:16 GMT)
A Rigorous Evaluation of LLM Data Generation Strategies for Low-Resource Languages [1.0] 大規模言語モデル(LLM)は、より小さな専門的なモデルを訓練するための合成テキストデータを生成するために、ますます使われている。
本稿では,11言語にまたがる生成戦略とその組み合わせの性能を評価する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:24:25 GMT)
Classification of Quality Characteristics in Online User Feedback using Linguistic Analysis, Crowdsourcing and LLMs [1.0] オンラインユーザからのフィードバックは、ソフトウェア製品に対する品質関連のフィードバックの貴重な情報源です。
オンラインユーザからのフィードバックが多ければ多いほど、品質特性の自動識別が保証される。
低データ設定に有効な3つのアプローチの有効性について検討する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:37:07 GMT)
Enhancing Clinical Decision Support and EHR Insights through LLMs and the Model Context Protocol: An Open-Source MCP-FHIR Framework [0.9] 本稿では,Large Language Models (LLM) と HL7 FHIR データをモデルコンテキストプロトコル (MCP) を介して統合するオープンソースフレームワークを提案する。
提案手法は、スケーラブルで説明可能な、相互運用可能なAIベースのEHRアプリケーションを提供する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:07:19 GMT)
Structured State Space Model Dynamics and Parametrization for Spiking Neural Networks [0.8] 多状態スパイクニューロンは、従来のディープラーニングモデルに代わる魅力的な代替手段を提供する。
状態空間モデル(SSM)は、スパイキングニューロンのサブスレッショルド状態に類似した線形状態-内在的再発を用いた長いシーケンス処理において優れている。
そこで我々は,SSMと2次スパイキングニューロンモデルの間に数学的ブリッジを確立する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:35:46 GMT)
KoGEC : Korean Grammatical Error Correction with Pre-trained Translation Models [0.8] 本研究では,韓国の文法的誤り訂正システムKoGECを紹介する。
韓国のGECに対してNLLB(No Language Left Behind)モデルを微調整し,GPT-4やHCX-3のような大規模言語モデルと比較した。
その結果, 微調整NLLB (KoGEC) モデルは韓国のGECタスクにおいて GPT-4o と HCX-3 より優れていた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:10:15 GMT)
The Thermodynamic Costs of Pure Dephasing in Quantum Heat Engines: Quasistatic Efficiency at Finite Power [0.8] 外部制御スキームや適切なデフォーカスノイズを用いて量子熱エンジンのパワーを高めることができる。
数値解析手法と解析手法の両方を用いて, 減音化に伴う熱力学的コストについて検討した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:38:32 GMT)
Methods for evaluating the resolution of 3D data derived from satellite images [0.8] 我々は,点雲,デジタル表面モデル,および3次元メッシュモデルの分解能を評価する方法を検討する。
本稿では,高分解能基準ライダーに基づく自動評価を可能にする3次元計測ツールについて述べる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:27:29 GMT)
Inference for an Algorithmic Fairness-Accuracy Frontier [0.8] フェアネス・精度フロンティアのためのバイアス付き機械学習推定器を提案する。
本研究では,その分布を導出し,フェアネス文学における重要な仮説を検証するための推論手法を提案する。
提案手法は,両次元に改良を加えたフェアネス・正確性フロンティア上の代替アルゴリズムを導出することを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:49:26 GMT)
Convergence of Momentum-Based Optimization Algorithms with Time-Varying Parameters [0.8] モーメント項を用いた最適化のための統一アルゴリズムを提案する。
勾配は、対象関数の現在の真の勾配だけでなく、前の反復における真の勾配にも依存する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:53:17 GMT)
On the performance of multi-fidelity and reduced-dimensional neural emulators for inference of physiologic boundary conditions [0.7] ベイジアンパラメータ推定に焦点をあて, 後方分布からのサンプリングの計算コストを削減するために, 異なる手法を探索する。
一般的なアプローチは、高忠実度シミュレーション自体のための代理モデルを構築することである。
第3のアプローチは、高忠実度モデルと代理モデルの相違をランダムノイズとして扱い、正規化フローを用いて分布を推定することである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:20:49 GMT)
Bandwidth enhanced current noise suppression with a SERF magnetometer [0.7] 本研究では, 閉ループ制御回路に組み込まれたスピン交換緩和フリー(SERF)磁気センサの動作について検討する。
提案方式は,直流電流オフセットに依存しない広帯域帯域での3nA/sqrt(Hz)以下の電流雑音を効果的に低減する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:16:36 GMT)
Persistent Topological Features in Large Language Models [0.7] トポロジカルな特徴である$p$次元の穴が層全体に持続し、進化していくかを測定するトポロジカル記述子を導入する。
このことは、プロンプトがどのように再配置され、それらの相対的な位置が表現空間で変化するかという統計的視点を与える。
ショーケースアプリケーションとして、レイヤプルーニングの基準を確立するためにzigzag Persistenceを使用し、最先端の手法に匹敵する結果を得る。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:27:46 GMT)
Leveraging GPT-4 for Vulnerability-Witnessing Unit Test Generation [0.7] 本稿では,最も広く使用されている大規模言語モデルであるGPT-4の自動単体テスト生成機能について検討する。
実際の脆弱性とそれに対応する修正を含むVUL4Jデータセットのサブセットについて検討する。
我々は,コードコンテキストの影響,GPT-4の自己補正能力の有効性,生成したテストケースの主観的使用性に着目した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:13:07 GMT)
Feedback-Based Quantum Strategies for Constrained Combinatorial Optimization Problems [0.7] 我々は、フィードバックベースの量子アルゴリズムフレームワークを拡張し、無効な設定(IC)制約と呼ばれるより広範な制約のクラスに対処する。
本稿では、スラック変数を必要とせずに直接IC制約に対処する、フィードバックベースの量子アルゴリズムに適した代替手法を提案する。
これらの方法はスラック変数の必要性を排除し、量子回路の深さと必要な量子ビットの数を大幅に削減する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:06:50 GMT)
Configurable Preference Tuning with Rubric-Guided Synthetic Data [0.7] 本稿では,言語モデルに明示的,人間解釈可能な指示に基づく行動調整機能を持たせるための新しい枠組みを提案する。
トレーニングコード、生成されたデータセット、微調整されたモデルなど、いくつかの実験的な成果物がhttps://github.com/vicgalle/configurable-preference-tuningでリリースされている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:17:38 GMT)
Hamiltonian Lattice Formulation of Compact Maxwell-Chern-Simons Theory [0.6] この理論を解析的に解き、連続極限の質量ギャップがよく知られた連続式と一致することを示す。
この研究は、古典的および量子コンピュータにおけるマクスウェル・シェン・サイモンズ理論の将来のハミルトンに基づくシミュレーションの基礎となる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:34:41 GMT)
Interpretable representation learning of quantum data enabled by probabilistic variational autoencoders [0.6] 変分オートエンコーダ(VAE)は、いくつかの入力データの隠れた物理的特徴を抽出する際の約束を示す。
VAEは、量子データを扱う際に固有のランダム性や複雑な相関を考慮しなければならない。
ここでは,2つの重要な修正により,VAEが物理的に意味のある潜在表現を学習できることを実証する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:39:41 GMT)
CLIP the Landscape: Automated Tagging of Crowdsourced Landscape Images [0.6] ランドスケープ写真から地理的コンテキストタグを予測するためのCLIPベースのマルチモーダルマルチラベル分類器を提案する。
位置埋め込みとタイトル埋め込みを画像特徴と組み合わせることで,画像埋め込みを単独で使用するよりも精度が向上することを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:32:58 GMT)
MindGrab for BrainChop: Fast and Accurate Skull Stripping for Command Line and Browser [0.6] 我々はパラメータとメモリ効率の深い完全畳み込みモデルであるMindGrabを開発した。
MindGrabはSynthStripデータセットから得られた606個のマルチモーダル成人脳スキャン(T1, T2, DWI, MRA, PDw MRI, EPI, CT, PET)を用いて評価した。
MindGrabは標準偏差(SD)1.6で95.9のDiceスコアを達成し、古典的手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:09:15 GMT)
Four-qubit critical states [0.6] 文献に現れる高絡み合いや有用な4ビット状態は,そのような絡み合い対策の静止点であることを示す。
我々は(ケンプ=ネッス定理の意味で)臨界点の概念をヴィンバーグ理論と共に使用し、問題の複雑さを著しく減少させる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:49:48 GMT)
Quizzard@INOVA Challenge 2025 -- Track A: Plug-and-Play Technique in Interleaved Multi-Image Model [0.5] LLaVA-NeXTインターリーブの3つの異なるタスクにわたる22のデータセットに対する印象的な性能を実演する。
LLaVA-NeXT-InterleaveにDense Channel Integration (DCI)コネクタを追加し、その性能を標準モデルと比較する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:48:39 GMT)
Discrimination of metric theories [0.5] パラメタライズされたポストニュートン形式論における計量理論の区別の可能性について検討する。
我々は、最小誤差やあいまいな状態判別のような量子状態判別戦略に頼っている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:45:53 GMT)
Identifying Helpful Context for LLM-based Vulnerability Repair: A Preliminary Study [0.5] 本稿では,広く使用されているデータセット(Vul4J)からJava脆弱性を修復する際のGPT-4oの性能について検討する。
我々は,最新のGPT-4oの性能と,同じプロンプトを用いたGPT-4Oの性能を比較した。
textscTop-3を併用すると、GPT-4oは26(62%)の脆弱性を少なくとも1回修復し、元のベースライン(40%)と再現(45%)を上回りました。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:15:45 GMT)
Recursive Cartan decompositions for unitary synthesis [0.5] 再帰的カルタン分解(CD)は、量子回路をより小さな成分に分解する方法を提供する。
本稿では,CDの詳細な概要を述べるとともに,その数学的構造を解明し,アルゴリズムの有用性を実証し,大規模に数値的に実装する。
アプリケーションとして、高速フォワード可能なハミルトン時間進化を固定深度回路に効率よくコンパイルし、横フィールドXYモデルを103ドルキュービットで22秒で2時間106ドルゲートにコンパイルする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:12:34 GMT)
SkillFormer: Unified Multi-View Video Understanding for Proficiency Estimation [0.5] SkillFormerは、統合されたマルチビューの熟練度推定のためのパラメータ効率の高いアーキテクチャである。
マルチヘッド・クロスアテンション、学習可能なゲーティング、適応的な自己校正を使って、ビュー特有の特徴を融合する。
マルチビュー設定で最先端の精度を実現し、計算効率を著しく向上させる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:46:04 GMT)
PATS: Proficiency-Aware Temporal Sampling for Multi-View Sports Skill Assessment [0.5] 時間サンプリング(PATS)は、多視点スキルアセスメントのための連続時間セグメント内の完全な基本動作を保存する。
PATSは動画を適応的に分割し、分析された各部分が重要なパフォーマンスコンポーネントの完全な実行を含むことを保証する。
PATSはすべての表示構成で最先端の精度を上回っている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:48:32 GMT)
GraphRAG-Causal: A novel graph-augmented framework for causal reasoning and annotation in news [0.5] GraphRAG-Causalは、グラフベースの検索と大きな言語モデルを組み合わせることで、ニュース分析における因果推論を強化する。
因果分類のF1スコアは82.1%で、わずか20の例で達成されている。
このアプローチは精度と一貫性を大幅に向上させ、ニュース信頼性評価、誤情報検出、ポリシー分析におけるリアルタイムアプリケーションに非常に適している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:09:08 GMT)
Accurate and Uncertainty-Aware Multi-Task Prediction of HEA Properties Using Prior-Guided Deep Gaussian Processes [0.5] 本研究では、従来のガウス過程(cGP)、ディープガウス過程(DGP)、マルチ出力回帰のためのエンコーダデコーダニューラルネットワーク、およびAlCoCrCuFeMnNiV HEAシステムの実験および計算特性のハイブリッドデータセットに適用したXGBoostの適合性能を系統的に評価した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:40:21 GMT)
Universal cooling of quantum systems via randomized measurements [0.5] 量子系は、システムの詳細を事前に知ることなく冷却可能であることを示す。
このことは、複雑な量子システムの堅牢でスケーラブルな冷却は、汎用的で構造に依存しないプロトコルによって達成できることを示している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:20:01 GMT)
Exact requirements for battery-assisted qubit gates [0.5] 我々は,大域的なエネルギー保存操作を通じて,キュービット系S上のユニタリゲートの実装を検討する。
電池状態の物理的制約の下でのユニタリ欠陥の最小化は、数学的にラグランジアン最適化問題と等価であることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:01:34 GMT)
DeepGDel: Deep Learning-based Gene Deletion Prediction Framework for Growth-Coupled Production in Genome-Scale Metabolic Models [0.5] 本稿では,ゲノム規模メタボリックモデルを用いた遺伝子欠失予測手法を提案する。
提案フレームワークは、ディープラーニングアルゴリズムを利用して、シーケンシャルな遺伝子を学習、統合し、データ表現を代謝する。
実験により,提案手法の有効性を実証し,ベースライン法よりも大幅に改善した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:21:23 GMT)
Using Deep Operators to Create Spatio-temporal Surrogates for Dynamical Systems under Uncertainty [0.4] 本研究では,Deep演算子ネットワーク(DeepONets)の新たな変種としてフルフィールド拡張DeepONet(FExD)を提案する。
提案したFExDはより優れた精度と計算効率を達成でき、構造力学応用のための演算子学習の大幅な進歩を示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:16:09 GMT)
Agnostic Tomography of Stabilizer Product States [0.4] クラス $mathcalC$ of $n$-qubit 安定化器状態に対する効率的な非依存トモグラフィーアルゴリズムを提案する。
我々は少なくとも$mathcalC$の任意の状態と近似する状態の簡潔な記述を出力する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:26:49 GMT)
Subjective Experience in AI Systems: What Do AI Researchers and the Public Believe? [0.4] 582人のAI研究者と838人の米国代表者を対象に、主観的経験を持つAIシステムの潜在的な発展に関する見解を調査した。
特定の日にそのようなシステムが存在する確率を見積もると、中央値の回答は、2024年までに1%(AI研究者)、5%(パブリック)となった。
一般市民の中央値のメンバーは、主観的経験を持つAIシステムが、中央値のAI研究者(10%)よりも(25%)存在しない可能性が高いと考えた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:53:28 GMT)
Continuously trapped matter-wave interferometry in magic Floquet-Bloch band structures [0.4] 我々は、コンパクトで連続的に閉じ込められた原子干渉計のための新しいフロケエンジニアリングプラットフォームを記述し、実証する。
非接触縮退型量子ガスは振幅変調光学格子を介して位置空間ブロッホ振動を行う。
我々は、光学格子時計で用いられる魔法の波長に類似したマジックバンド構造を同定し、実現し、実験的に特徴づける。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:30:55 GMT)
AutoGen Driven Multi Agent Framework for Iterative Crime Data Analysis and Prediction [0.4] LUCID-MA(Learning and Crime through Dialogue of Multiple Agents)は、複数のAIエージェントが犯罪データを共同で分析し理解する革新的なAI駆動フレームワークである。
本システムでは,犯罪パターンをハイライトする分析アシスタント,分析結果をレビュー・精査するフィードバックコンポーネント,将来的な犯罪傾向を予測する予測コンポーネントの3つで構成されている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:39:28 GMT)
O2Former:Direction-Aware and Multi-Scale Query Enhancement for SAR Ship Instance Segmentation [0.4] 合成開口レーダ(SAR)画像における船舶の船体セグメンテーションは、海上監視、環境分析、国家安全保障などの用途において重要である。
SAR船体画像は、スケール変動、物体密度、ファジィターゲット境界などの課題を示す。
我々は,SAR画像の構造的特徴を十分に活用して,Mask2Formerを拡張したカスタマイズされたインスタンスセグメンテーションフレームワークであるO2Formerを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:06:51 GMT)
HypRL: Reinforcement Learning of Control Policies for Hyperproperties [0.3] 仕様誘導型強化学習フレームワークHYPRLを提案する。
我々はSkolemizationを適用して量化器の変質を管理し、報酬を形作る定量的関数を定義する。
次に、適切なRLアルゴリズムを用いて、期待される報酬を最大化するポリシーを学ぶ。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:47:19 GMT)
Approximating Fixpoints of Approximated Functions [0.3] 正確には知られていないが、それらに収束する近似関数列で表される関数の最小固定点を近似する方法を示す。
この結果は,確率的誤差境界で関心関数を近似できるシステムに対して,最小の固定点にほぼ確実に反復することができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:11:34 GMT)
Evaluating Fairness and Mitigating Bias in Machine Learning: A Novel Technique using Tensor Data and Bayesian Regression [0.3] 皮膚の色を扱う際に,機械学習(ML)とモデル予測の性能に着目した。
コンピュータビジョンでは、肌の色は分類値や単一の数値ポイントではなくテンソルデータとして表現される。
本稿では,画像分類タスクにおいて,アノテーションを使わずにMLの公平性を評価する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:54:01 GMT)
EDN: A Novel Edge-Dependent Noise Model for Graph Data [0.3] エッジ依存ノイズ(EDN)はノードラベルノイズモデルの制限に対処する。
EDNは、実世界のシナリオでは、ラベルノイズはノード間の接続に影響される可能性があると仮定している。
EDNの2つの変種は、グラフニューラルネットワーク(GNN)と既存のノイズロバストアルゴリズムの両方において、より優れた性能低下をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 00:05:00 GMT)
Understanding API Usage and Testing: An Empirical Study of C Libraries [0.3] この研究は、C/C++エコシステムの規模でAPI使用率とAPIテストを比較する最初のものである。
我々はLibProbeを開発した。LibProbeはライブラリの大規模なコーパスを分析できるフレームワークだ。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:07:16 GMT)
GeistBERT: Breathing Life into German NLP [0.2] GeistBERTは、多種多様なコーパスで漸進的にトレーニングすることで、ドイツ語処理の改善を目指している。
モデルは強力なパフォーマンスを達成し、すべてのタスクをベースモデルでリードし、新しい最先端(SOTA)を設定する。
ドイツのNLP研究コミュニティをサポートするため、私たちはGeistBERTをMITライセンス下でリリースします。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:53:17 GMT)
A purely geometrical Aharonov-Bohm effect [0.1] 本稿では,アフィン共変積分量子化(ACIQ)の量子力学への応用について述べる。
句読面のトポロジーのため、我々の量子化手順はアフィンベクトルポテンシャルを生じさせる。
このポテンシャルは無限ソレノイドによって生成されるアハロノフ・ボームゲージ場(AB)と解釈できる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:38:52 GMT)
FeNN: A RISC-V vector processor for Spiking Neural Network acceleration [0.1] スパイキングニューラルネットワーク(SNN)は、AIシステムのエネルギー要求を大幅に削減する可能性がある。
本稿では,FPGA 上でシミュレーションを行う SNN に適した RISC-V-based soft vector processor (FeNN) を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:13:54 GMT)
PiPViT: Patch-based Visual Interpretable Prototypes for Retinal Image Analysis [0.1] Patch-based Visual Interpretable Prototypes は,画像認識のための本質的に解釈可能な原型モデルである。
PiPViTは、パッチ間の長距離依存関係をキャプチャして、堅牢で人間の解釈可能なプロトタイプを学ぶ。
網膜 OCT 画像分類における PiPViT の評価を行った。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:57:35 GMT)
Instruction Tuning and CoT Prompting for Contextual Medical QA with LLMs [0.1] 大規模言語モデル(LLM)は医学的質問応答(MedQA)において大きな可能性を秘めている
PubMedQA 上でのオープンソース LLM の高速設計と軽量微調整が性能に与える影響について検討する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:05:18 GMT)
Stop learning it all to mitigate visual hallucination, Focus on the hallucination target [0.1] MLLM(Multimodal Large Language Models)はしばしば幻覚に悩まされる。
幻覚は、実用的な応用においてモデルの信頼性を損なう。
Mymethodは、目標とする領域にフォーカスすることで幻覚を緩和する嗜好学習アプローチである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:35:03 GMT)
Word Sense Detection Leveraging Maximum Mean Discrepancy [0.0] 本稿では,MMD(Maximum Mean Discrepancy)を利用して意味論的に意味のある変数を選択する手法であるMDD-Sense-Analysisを提案する。
この方法は、感覚変化中の単語の識別と、複数の歴史的期間にわたるその進化の説明を可能にする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:11:43 GMT)
VLM@school -- Evaluation of AI image understanding on German middle school knowledge [0.0] 本稿では、視覚言語モデル(VLM)の能力を評価するために設計された新しいベンチマークデータセットを提案する。
このデータセットは、数学、歴史、生物学、宗教を含む9つの領域にまたがる実際の中学カリキュラムから導かれる。
我々は,複数の次元にわたる最先端のオープンウェイトVLM13種の評価を行った。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:20:41 GMT)
V-Max: A Reinforcement Learning Framework for Autonomous Driving [0.0] V-Maxは、自動運転のためにReinforcement Learningを実践するために必要なツールをすべて提供するオープンリサーチフレームワークである。
V-Maxは大規模実験用に設計されたハードウェアアクセラレーションADシミュレータであるWaymax上に構築されている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:38:12 GMT)
Unsupervised Document and Template Clustering using Multimodal Embeddings [0.0] 本稿では,マルチモーダル埋め込みを入力として活用し,教師なし文書クラスタリングへの新たなアプローチについて検討する。
本手法は,文書を型レベルでグループ化し,異なるテンプレートを区別することで,より詳細な文書理解を実現することを目的としている。
提案手法の有効性を,いくつかの最先端事前学習型マルチモーダルモデルによって生成された埋め込みを用いて評価した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:07:44 GMT)
Universal gates for a metastable qubit in strontium-88 [0.0] ボソニックストロンチウム88の準安定微細構造量子ビットの普遍ゲートセットを特徴付ける。
我々は損失を補正した後、0.993のシングルキュービットゲートフィデリティと0.9945(6)の2キュービットゲートフィデリティを求める。
この結果から, ストロンチウム微細構造量子ビットが, 短期的誤差補正量子コンピュータの候補となる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:24:37 GMT)
Universal Spreading of Nonstabilizerness and Quantum Transport [0.0] 我々は、純粋状態のコヒーレンス理論に根ざした測度である参加エントロピー(PE)を用いて波動関数の非局在化を定量化し、安定化器R'enyi entropy(SRE)による非安定化性の評価を行う。
この結果は量子資源と輸送の固い関係を確立し、対称性に制約された量子システムにおける複雑性のダイナミクスに関する洞察を提供する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:00:02 GMT)
Universal Relation between Spectral and Wavefunction Properties at Criticality [0.0] 量子カオス系は、エネルギースペクトルのレベル反発から波動関数の非局在化まで、いくつかの普遍的性質を示す。
我々は、それが幅広い臨界モデルのクラスにおける普遍性を表すと推測する。
普遍関数 $D_1(r)$ を導出し、$r$ は平均レベル間隔比である。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:11:47 GMT)
Uncertainty-Aware Trajectory Prediction via Rule-Regularized Heteroscedastic Deep Classification [0.0] ShiFT (Spectral Heteroscedastic Informed Forecasting for Trajectories) は、よく校正された不確実性モデリングと情報前処理を組み合わせた新しいフレームワークである。
我々のモデルは、本質的に不確実性が高い交差点のような複雑なシナリオで優れている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:35:34 GMT)
Ultrafast dynamics of quantum matter driven by time-energy entangled photons [0.0] 我々は、時間エネルギーの絡み合った光子と相互作用する量子物質の力学を研究する。
エンタングルメントは透過現象と吸収現象の遅延を強く抑制する。
絡み合った駆動により、パルスの時間幅よりも短い時間スケールで物質励起が生成できることが示される。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:29:49 GMT)
Two Types of Temporal Symmetry in the Laws of Nature [0.0] この研究は、時間対称性を仮定し、ランダム成分を持つ自然の決定論的法則に橋梁型時間対称境界条件を適用することの意味を考察する。
時間の方向特性はマルコフ橋の数学的構造から生じ、時間方向を優先する仮定を必要としない。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:40:24 GMT)
Training RL Agents for Multi-Objective Network Defense Tasks [0.0] オープンエンドラーニング(OEL)は、狭義の能力よりも幅広い能力を達成する訓練エージェントを強調している。
我々は,OELにインスパイアされた自律型ネットワークディフェンダー開発のためのトレーニング手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:59:23 GMT)
The Effect of Stochasticity in Score-Based Diffusion Sampling: a KL Divergence Analysis [0.0] 本研究は,KL(Kulback-Leibler)の発散における生成過程への影響について検討する。
この結果は、加算雑音とリプシッツ連続スコア関数を持つ一般前方SDEに適用できる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:01:07 GMT)
The Best Soules Basis for the Estimation of a Spectral Barycentre Network [0.0] 我々は、ラプラシアンスペクトルの擬似距離に基づいて、一組のネットワークのバリセントを計算する。
ネットワークがブロックモデルのランダムな実現である場合、我々のアルゴリズムは集団平均隣接行列を再構成する。
この研究は、理論的な保証を持つ新しいスペクトルベースのネットワーク合成の設計への扉を開くために重要である。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:57:01 GMT)
Technical Evaluation of a Disruptive Approach in Homomorphic AI [0.0] 我々は、HbHAIとして知られる新しい破壊的な暗号手法を、データセキュリティに提示する。
HbHAIは、ほとんどの類似性特性を自然に保存する、キー依存のハッシュ関数の新しいクラスに基づいている。
主要な主張として、HbHAIは暗号化的にセキュアな形式でデータを分析および処理できるようになった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:06:34 GMT)
Suppressing excitations in the nonlinear Landau-Zener model [0.0] 一般化されたランダウ・ツェナーモデルでは、非線形力学を利用して対応する線形シナリオの励起とコヒーレンスを抑えることができる。
進化方程式の非線形項は、線形ランダウ・ツェナー問題に対する断熱に対する効果的なショートカットとして振る舞うことを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:13:09 GMT)
Supernova Event Dataset: Interpreting Large Language Model's Personality through Critical Event Analysis [0.0] テキストからキーイベントを抽出し、ランキング付けするために、新しいデータセットを使用して、大きな言語モデル(LLM)をベンチマークする。
我々はPhi-4、Orca 2、Qwen 2.5のような小型モデルとClaude 3.7、Gemini 2.5、OpenAI o3のような大型で強力なモデルを評価した。
例えば、Orca 2は対人的ダイナミクスに焦点を当てた感情的推論を示し、Qwen 2.5はより戦略的で分析的なスタイルを示します。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:31:52 GMT)
Statistical Machine Learning for Astronomy -- A Textbook [0.0] この本は天文学研究のための統計機械学習の体系的な扱いを提供する。
現代のデータ分析技術と従来の統計手法とのつながりを明らかにする統一的なフレームワークを開発する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:17:50 GMT)
Stationary distribution of node2vec random walks on household models [0.0] node2vecランダムウォークを地域構成の世帯モデルグラフ上で検討する。
歩行パラメータを調整することにより、静止分布は、均一、サイズ偏り、あるいは単純なランダムな歩行定常分布の間で補間可能であることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:27:48 GMT)
Specification and Evaluation of Multi-Agent LLM Systems -- Prototype and Cybersecurity Applications [0.0] 本稿では,マルチエージェントシステムによるアスペクトの特定と評価を目的とした探索的研究の結果を報告する。
システムアーキテクチャとプロトタイプは、以前の研究から拡張され、マルチエージェントシステムのための仕様が導入された。
サイバーセキュリティタスクを含むテストケースは、アーキテクチャと評価アプローチの実現可能性を示している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:32:42 GMT)
Spacetime games subsume causal contextuality scenarios [0.0] サイクルのない因果的文脈性シナリオのカテゴリ、ユニークな因果的ブリッジ、因果的に保護されたカバーは、以前公表された時空ゲームのサブクラスを含むカテゴリと等価であることを示す。
この洞察は、時空ゲームフレームワークで表現された場合、特定の構成や証明がより短く、よりシンプルで、直感的なものになる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:19:52 GMT)
Shared randomness allows violation of macroscopic realism using a single measurement [0.0] 共有ランダム性にアクセスできる場合、単一の測定値を用いてマクロ的リアリズムの違反を観測できることが示される。
我々はさらに、マクロなno-signallingの違反を観察する証人を構築した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:45:50 GMT)
Semantic Preprocessing for LLM-based Malware Analysis [0.0] 本稿では,Portable Executable ファイルのレポートを生成する新しい前処理手法を提案する。
この前処理の目的は、マルウェアアナリストが理解できるバイナリファイルの意味表現を集めることである。
この前処理を用いて、複雑なデータセット上で平均0.94の重み付きF1スコアを達成する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:39:00 GMT)
SecONNds: Secure Outsourced Neural Network Inference on ImageNet [0.0] 我々は、大規模な画像ネットワーク規模の畳み込みニューラルネットワークに最適化された、侵入的でないセキュアな推論フレームワークSecONNdsを紹介する。
我々の新しいプロトコルは、最先端のソリューションと比較して、非線形操作で17$times$のオンライン高速化を実現している。
SecONNds-Pも提案する。これはビットエクサクサプリタで、検証された完全精度を保証し、セキュアな計算を行う。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:49:39 GMT)
Searching for ribbons with machine learning [0.0] 我々のプログラムは、最大70回の交差範囲で多くのリボン結び目を検出することができる。
また,プログラムが最大70回の交差範囲で多くのリボン結び目を検出することに成功していることを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:49:03 GMT)
Search-Based Adversarial Estimates for Improving Sample Efficiency in Off-Policy Reinforcement Learning [0.0] 本稿では,この問題を緩和するための新しい,シンプルかつ効率的なアプローチとして,Adversarial Estimatesを提案する。
我々のアプローチは、学習を促進するために、小さな人間の軌道の集合からの潜在類似性探索を活用する。
本研究の結果から,適応推定を用いた学習アルゴリズムは,元のバージョンよりも高速に収束することがわかった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:53:33 GMT)
SWE-Bench-CL: Continual Learning for Coding Agents [0.0] SWE-Bench-CLは、人間検証されたSWE-Bench検証データセット上に構築された、新しい連続学習ベンチマークである。
GitHubのイシューを、自然リポジトリの進化を反映した時系列順序に整理することで、SWE-Bench-CLは、エージェントのエクスペリエンスを蓄積する能力を直接評価できる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:11:14 GMT)
SSPINNpose: A Self-Supervised PINN for Inertial Pose and Dynamics Estimation [0.0] 慣性測定ユニット(IMU)は、モーションデータをキャプチャするための最小限の侵入性ソリューションを提供する。
現在のリアルタイム手法は教師あり学習に依存しており、そこでは実験室計測システムを用いて基底真理データセットを計測する必要がある。
IMUデータから直接関節運動学と運動学を推定する自己教師型物理インフォームニューラルネットワークであるSSPINNposeを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:47:27 GMT)
Robust Filtering -- Novel Statistical Learning and Inference Algorithms with Applications [0.0] 状態推定は、自動運転車、ロボット工学、医療監視、スマートグリッド、インテリジェントトランスポート、予測保守などのアプリケーションにおけるインテリジェントな意思決定を可能にするための基本的なタスクである。
標準フィルタリングはノイズ統計の事前知識を前提としてノイズセンサデータから潜時状態の抽出を行う。
現実のシナリオは、外れ値、偏見、漂流、未知あるいは部分的に知られている統計の欠如といった異常を伴い、従来のアプローチを制限している。
この論文は、これらの課題を軽減するために、新しい頑健な非線形フィルタリング法を示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:30:35 GMT)
Robot Context Protocol (RCP): A Runtime-Agnostic Interface for Agent-Aware Robot Control [0.0] Robot Context Protocol(RCP)は、ロボットシステムの複雑さを単純化し、ロボット、ユーザ、自律エージェント間のシームレスな相互作用を可能にするように設計されている。
RCPは、クライアントが直面する操作をバックエンドの実装から切り離す統一的で意味のあるインターフェイスを提供する。
RCPは、複雑なマルチエージェントエコシステムにおけるインテリジェントでレジリエントで安全なロボット操作を可能にする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:24:44 GMT)
Reversing the Paradigm: Building AI-First Systems with Human Guidance [0.0] 人間と人工知能の関係はもはやSFではない。
人間を置き換えるのではなく、AIはタスクを強化し、データによる意思決定を強化する。
仕事の未来は、AIエージェントがタスクを自律的に処理することにある。
本稿では,AIファーストシステムの導入に責任を負うために必要な技術的・組織的な変化について検討する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:48:44 GMT)
Relational Schemata in BERT Are Inducible, Not Emergent: A Study of Performance vs. Competence in Language Models [0.0] BERTは, 概念対の内部表現を分類学的, メレオジカル, 機能的関係にわたって調べることで, 抽象的関係スキーマを符号化するかどうかを考察する。
その結果,事前学習したBERTは,潜在関係信号の分類精度が向上することがわかった。
これらの結果は, モデルが適切な学習を通じて, 基底的関係抽象化のための帰納的バイアスを得ることができるにもかかわらず, 行動性能が必ずしも概念的理解を構造化するものではないことを示唆している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:20:03 GMT)
Relational GNNs Cannot Learn $C_2$ Features for Planning [0.0] グラフニューラルネットワーク(英: Graph Neural Networks、R-GNN)は、ある計画領域の未確認問題に一般化できる価値関数を学習するためのアプローチである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:35:56 GMT)
Recursive KalmanNet: Deep Learning-Augmented Kalman Filtering for State Estimation with Consistent Uncertainty Quantification [0.0] 本稿では,正確な状態推定を目的としたKalman-filter-informed Recurrent Neural NetworkであるRecursive KalmanNetを紹介する。
非ガウス的ホワイトノイズを用いた実験では,従来のカルマンフィルタと既存の最先端ディープラーニングに基づく推定器の両方で性能が向上することが示された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:11:32 GMT)
Real-time Seafloor Segmentation and Mapping [0.0] ポシドニア・オーシャンカ・メドウ(Posidonia Oceanica meadows)は、サバイバルと保全のために岩に大きく依存する海草の一種である。
ディープラーニングベースのセマンティックセグメンテーションと視覚自動監視システムは、さまざまなアプリケーションで有望であることを示している。
本稿では,自律型水中車両(AUV)がポシドニア大洋の牧草地の境界を自律的に調査できるようにするために,機械学習とコンピュータビジョン技術を組み合わせたフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:34:36 GMT)
Quasi Inverse of Qubit Channels for Mixed States [0.0] キュービットチャネルの準逆をユニタリ写像として、$mathcalEi$とする。
トレース距離に基づく定義は、擬似逆入力状態から混合入力状態への容易に一般化を可能にした。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:24:27 GMT)
Quantum-Inspired Differentiable Integral Neural Networks (QIDINNs): A Feynman-Based Architecture for Continuous Learning Over Streaming Data [0.0] ストリーミングデータによるリアルタイムの継続的学習は、ディープラーニングとAIシステムにおいて依然として中心的な課題である。
量子インスパイアされた微分可能なニューラル積分ネットワーク(QIDINN)を新たに導入する。
QIDINNは、歴史的データ上の積分として神経更新を定式化するために、積分記号の下でファインマンの微分技術を利用する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:00:31 GMT)
Quantum quenches with long range interactions [0.0] 量子クエンチの理論を、長距離相互作用を持つ$d$次元同質系の場合まで拡張する。
順序パラメータなどの局所可観測物の後処理状態と一点関数を解析的に決定する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:39:30 GMT)
Quantum Resource Complementarity in Finite-Dimensional Systems [0.0] 3つの中核業務を統括する統一的な制約を提案する。
強不等式$q_2 + q2 + q_32 leq 1$ すべての物理的に達成可能な資源を単位球の正の値に示す。
この研究は、量子情報、幾何学、対称性の基本的な関係を確立する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:53:40 GMT)
Quantum Entanglement with Geometric Measures [0.0] この論文は、幾何学的エンタングルメント測度(GME)を拡張して、様々な量子コンテキストに適したモノトンエンタングルメントのスイートを導入し、研究する。
これらのモノトーンは二部構成系と多部構成系の両方に適用でき、様々なシナリオにまたがる絡みを特徴付ける統一的な枠組みを提供する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:05:03 GMT)
Quantum Circuits for the Metropolis-Hastings Algorithm [0.0] 量子コンピュータはメトロポリス・ハスティング(MH)シミュレーションの高速化を期待されている。
本稿では,古典的提案受容論理に従う量子ウォーク構成を提案する。
MHシミュレーションでは、エンドツーエンドの2次高速化が期待できる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:31:33 GMT)
Probabilistic Coherence Transformation Under Strictly Incoherent Operation [0.0] 厳密な不整合演算の下での確率的コヒーレンス変換について検討する。
その結果,大きなコヒーレンスゲインを成功確率損失の価格で実現できることが判明した。
応用として、コヒーレンスから絡み合いへの変換は確率的コヒーレンス変換の恩恵を受けることが示されている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:07:55 GMT)
Pose Matters: Evaluating Vision Transformers and CNNs for Human Action Recognition on Small COCO Subsets [0.0] 本研究では,COCO画像コーパスの3クラスサブセットを用いた人間の認識について検討する。
バイナリビジョン変換器(ViT)は90%の平均テスト精度を達成した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:16:50 GMT)
Physics-inspired neural networks as quasi inverse of quantum channels [0.0] この研究は、チャネルパラメータの任意の値に対する量子ビットチャネルの準逆を求めるニューラルネットワークの可能性を探るものである。
修正トレース距離(MSMTD)の2乗平均に基づく物理インスパイアされた損失関数を導入する。
スケールされたトレース距離は、ニューラルネットワークが量子状態のブロッホベクトルの長さを増大させないように使用される。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:32:34 GMT)
Physics-Informed Latent Neural Operator for Real-time Predictions of Complex Physical Systems [0.0] 本稿では,制御物理を直接学習プロセスに統合する物理インフォームトニューラルネットワークフレームワークPI-Latent-NOを提案する。
私たちのアーキテクチャでは、ソリューションの低次元表現を学習するLatent-DeepONetと、この遅延表現を物理空間にマッピングするRestruction-DeepONetという、2つの結合したDeepONetsトレーニングのエンドツーエンドが特徴です。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:08:41 GMT)
Physically-informed change-point kernels for structural dynamics [0.0] 本稿では,ガウス過程のための新しい,物理的にインフォームドされた,変化点カーネルを開発する。
ユーザに対して高いレベルのコントロールが与えられ、現象が発生するべき条件の定義が可能になる。
また、物理現象に基づいてモデル化された雑音のバラツキも実施し、予測とともに不確実性をより顕著に捉えた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:52:49 GMT)
Physical Observers and Quantum Reconstructions [0.0] 観測者は観測システムに関する予測情報のみを保持する。
エネルギー散逸の限界を低くすることで、この原理は直接的にコンパクトな予測モデルに導かれる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:54:45 GMT)
PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications [0.0] PhysNav-DGは、古典的なセンサー融合と視覚言語モデルのセマンティックパワーを統合する新しいフレームワークである。
我々のデュアルブランチアーキテクチャは、マルチセンサー入力からナビゲーション動作を予測し、同時に詳細なチェーン・オブ・シークレットの説明を生成する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:36:19 GMT)
PerFormer: A Permutation Based Vision Transformer for Remaining Useful Life Prediction [0.0] 本稿では,多変量時系列データをパーミュレートするパーフォーメーション・ベース・ビジョン・トランスフォーマー手法PerFormerを紹介する。
NASAのC-MAPSSデータセットに関する実験は、PerFormerのRUL予測における優れた性能を実証している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 23:12:32 GMT)
On the exact solutions of a two-dimensional hydrogen atom in a constant magnetic field [0.0] 定磁場下での2次元水素原子の正確な解について議論する。
レイリー・リッツ法による数値結果と比較した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:42:08 GMT)
On a dynamic ontic wave model of quantum collapse and measurement [0.0] この研究は、物理的に空間的に拡張された波動場として量子実体の新しいモデルを導入する。
これは量子測定と崩壊のための現実主義の枠組みの基礎を形成する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:03:48 GMT)
OSI Stack Redesign for Quantum Networks: Requirements, Technologies, Challenges, and Future Directions [0.0] 量子通信は次世代ネットワークの基礎となる。
古典的なOSIモデルは、決定論的およびエラー耐性システムのために設計されており、量子固有現象をサポートしない。
本稿では,7Gの文脈における量子ネットワークのためのOSIモデルのアーキテクチャ的再設計を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:48:18 GMT)
Nanoscale Magnetic Resonance Imaging and Control of a Strongly Interacting Dipolar System [0.0] ダイヤモンドの原子状欠陥にホストされた高密度電子スピンのコヒーレント制御と、時間依存性の強い局所磁場勾配を組み合わせることで、ナノスケールMRIを実証する。
本研究は, 気象学的に有用な絡み合いの頑健な制御と, 環境条件下での材料・生物系のナノスケールイメージングのための扉を開く。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:11:12 GMT)
Multimode and Random-Access Optical Quantum Memory via Adiabatic Phase Imprinting [0.0] 複数の量子ビットを同時に保存し、その後にランダムに選択された量子ビットのサブセットをリコールできるフォトニック量子メモリは、大規模量子ネットワークとコンピューティングにとって必須である。
量子メモリを実現するために,Rapid Adiabatic Passage (RAP) を用いた代替プロトコルを提案する。
複数の複雑な分光時間フォトニックモードの記憶と検索を実証し、8つの異なるスペクトルモードにわたる光ランダムアクセスメモリを実現する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 20:49:09 GMT)
Modelado y gemelos digitales en el contexto fotovoltaico [0.0] デジタル双生児は革新的なソリューションを提供しており、太陽の設置の挙動をリアルタイムで再現する仮想モデルだ。
この技術は、障害を予測し、運用効率を改善し、データ駆動による意思決定を容易にする。
本報告は、太陽光発電分野におけるその応用を分析し、その利点と変革の可能性を明らかにする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:19:55 GMT)
Measurement-based quantum computation with variable-range interacting systems [0.0] 本研究では,Isingスピン系による重み付きグラフ状態 (WGS) が単一および2量子ゲートの実装に成功していることを示す。
上記の相互作用のしきい値降下速度は、普遍的な単一ビットゲートと2ビットゲートの両方の忠実度が90%以上の精度で決定される。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:59:26 GMT)
Markets for Models [0.0] 我々は、企業が予測を改善するためにモデルを消費者に販売する市場を調査する。
競争相手の参入を抑えるために、非効率に偏ったモデルや非効率にコストがかかるモデルを選択できることを示します。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:55:16 GMT)
Manifestation of quantum entanglement between harmonic oscillators in de Sitter [0.0] 膨張する宇宙に存在する2つの調和振動子間の絡み合いを決定する。
振動子がハッブル地平線内にあり、その周波数が宇宙の膨張速度に匹敵するならば、絡み合いはゼロではなく重要なものである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:39:35 GMT)
Machine Learning-Based Quantification of Vesicoureteral Reflux with Enhancing Accuracy and Efficiency [0.0] VUR(Vesicoureteral reflux)は、伝統的に主観評価システムを用いて評価される。
本研究では,VCUG(Volting cystourethrogram)画像の解析により,機械学習による診断整合性の向上について検討した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:09:12 GMT)
MELABenchv1: Benchmarking Large Language Models against Smaller Fine-Tuned Models for Low-Resource Maltese NLP [0.0] 低リソース言語であるMalteseにおける55の公開言語モデル(LLM)の性能を評価する。
我々の実験は、多くのモデルが、特に生成タスクにおいて、性能が良くないことを強調している。
本研究は, 事前訓練および指導訓練におけるマルタへの事前曝露が最も重要な要因であると結論付けている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:45:16 GMT)
LiLAC: A Lightweight Latent ControlNet for Musical Audio Generation [0.0] ControlNetは、新しいコンディショニングにエンコーダをクローンして微調整することで、事前訓練された生成モデルに外部コントロールをアタッチできる。
そこで本研究では,ControlNetとオーディオ品質とコンディションの整合性を両立させながら,パラメータ数を著しく削減する軽量なモジュールアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 05:39:50 GMT)
Learning Before Filtering: Real-Time Hardware Learning at the Detector Level [0.0] 本稿では,リアルタイムニューラルネットワークトレーニングのためのディジタルハードウェアアーキテクチャを提案する。
アーキテクチャはスケーラブルで適応性があり、検出器システムに直接学習を統合するための大きな進歩を示している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:38:16 GMT)
Learnable Activation Functions in Physics-Informed Neural Networks for Solving Partial Differential Equations [0.0] 偏微分方程式(PDE)の解法として物理情報ニューラルネットワーク(PINN)が誕生した。
これらの制限は、急激な振動、鋭い勾配、複雑な境界挙動を含む問題の精度に影響を与える。
これらの課題に対する解決策として,学習可能なアクティベーション関数について検討する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:52:33 GMT)
Large Language Models for Toxic Language Detection in Low-Resource Balkan Languages [0.0] 本研究では,セルビア語,クロアチア語,ボスニア語における有毒なコメントをラベル付きデータで処理する大規模言語モデルについて検討した。
YouTubeとTikTokのコメントのデータセットを、さまざまなカテゴリーのビデオから作成し、手動でラベル付けしました。
4つのモデル(GPT-3.5 Turbo, GPT-4.1, Gemini 1.5 Pro, Claude 3 Opus)がゼロショットとコンテキスト拡張の2つのモードで試験された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:01:28 GMT)
Large Language Models for History, Philosophy, and Sociology of Science: Interpretive Uses, Methodological Challenges, and Critical Perspectives [0.0] 本稿では,科学史・哲学・社会学研究ツールとしての大規模言語モデル(LLM)の利用について検討する。
LLMは、構造化されていないテキストを処理し、文脈から意味を推測するのに非常に効果的である。
このことは、解釈的方法論を強調し、文脈に依存し、曖昧で、歴史的に位置する意味を理解するHPSSの機会と課題を提起する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:44:13 GMT)
LLMs for Sentence Simplification: A Hybrid Multi-Agent prompting Approach [0.0] 本稿では,高度プロンプトとマルチエージェントアーキテクチャを組み合わせるハイブリッド手法を提案する。
実験結果から,本手法はゲームデザインアプリケーションで書かれた複雑な文の70%を単純化することができた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:19:27 GMT)
Investigating the Potential of Large Language Model-Based Router Multi-Agent Architectures for Foundation Design Automation: A Task Classification and Expert Selection Study [0.0] シングルエージェント処理、マルチエージェントデザイナ-チェッカーアーキテクチャ、ルータベースのエキスパートセレクションの3つのアプローチが評価された。
性能評価はDeepSeek R1、ChatGPT 4 Turbo、Grok 3、Gemini 2.5 Proといったベースラインモデルを利用した。
その結果、ルータベースのマルチエージェントシステムは、プロのドキュメント標準を維持しつつ、基礎設計の自動化に最適なものとなった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 23:45:24 GMT)
Instruction and Solution Probabilities as Heuristics for Inductive Programming [0.0] 命令サブセット(IS)は、インダクティブプログラミング(IP)検索空間のサイズを数十桁縮小することができる。
我々は、さらなる確率として命令と解決策を導入することで、ISアプローチを拡張します。
いずれの変種も、解サイズに応じて、最大数桁のIP検索空間サイズを大幅に削減できることが示される。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:24:31 GMT)
Instanton-Induced Supersymmetry Breaking in Topological Semimetals [0.0] 超対称性(SUSY)は、標準モデルを超えた物理学の基本対称性として提案され、高エネルギー物理学以外の様々な分野で重要な応用が発見されている。
ここでは,超対称性量子力学を幅広いトポロジカル半金属に体系的に実装する。
SUSY電位バレーに対するインスタント効果による動的SUSY破壊がギャップ開口の基礎機構として機能することを示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:35:52 GMT)
Insightful Approach to Quantum Noise Suppression Below the Standard Quantum Limit Using a Single Mirror and Beam Splitter [0.0] BS出力におけるコヒーレント状態の真空揺らぎに影響を与える鏡近傍に定常波がどのように形成されるかを示す。
我々は、BSによって分割された光の真空揺らぎは、量子ノイズ限界以下で容易に低減できることを示した。
これらの知見は、電磁ノイズの操作に関する重要な洞察を与え、量子ノイズ制御に関する全ての実験に広く影響を及ぼす。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:05:34 GMT)
Improved Ground State Estimation in Quantum Field Theories via Normalising Flow-Assisted Neural Quantum States [0.0] ニューラル量子状態(NQS)を正規化フローベースサンプリング器で拡張するハイブリッド変分フレームワークを提案する。
提案手法は,ヒルベルト空間の離散化された振幅支持部分空間を対象とする連続流れモデルを学習することにより,サンプルタスクを変分アンサッツから分離する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:00:01 GMT)
Impact of Shared E-scooter Introduction on Public Transport Demand: A Case Study in Santiago, Chile [0.0] 本研究では,チリのサンティアゴにおける電動スクーターの普及が公共交通機関の需要に与える影響について検討した。
我々は,サンティアゴ統合公共交通システムから得られたスマートカードデータと,初期配備期間中のe-scooterトリップからのGPSトレースを用いた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:10:39 GMT)
How do Probabilistic Graphical Models and Graph Neural Networks Look at Network Data? [0.0] 確率的グラフモデル(PGM)とグラフニューラルネットワーク(GNN)を比較した。
グラフのヘテロフィリエが増加すると、PGMはGNNよりも頑丈であることが分かる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:19:28 GMT)
Graphon Quantum Filtering Systems [0.0] 我々は,密度グラフのクラスにおける連続的な測定の対象として,平均場型相互作用と量子粒子を相互作用する非交換性システムを考える。
我々は、方程式のグラファイトに基づく量子フィルタリング系を導出し、その正当性を研究し、ブロックワイド相互作用を持つ複数のボソニック系に対するカオス結果の伝播を確立する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:56:02 GMT)
GeoPandas-AI: A Smart Class Bringing LLM as Stateful AI Code Assistant [0.0] 本稿では,このようなスマートクラスの設計を形式化し,PyPIパッケージマネージャにGeoPandas-AIのオープンソース実装を提供する。
コード生成とデータ解析のための会話インターフェースとLLMのステートフルな利用という革新的な組み合わせを通じて、GeoPandas-AIは、コードコパイロットのための新しいパラダイムを導入し、地理空間開発のためにインスタンス化する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:42:17 GMT)
Gauge-invariant Wigner equation for electromagnetic fields: Strong and weak formulation [0.0] ゲージ不変ウィグナー理論は、位相空間における電磁場の存在下での荷電粒子の量子力学的進化を記述している。
この研究は、既存の定式化を単純化する微分作用素のみに基づく一般電磁場における単一電子の新しい定式化を示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:20:12 GMT)
Fully Collective Superradiant Lasing with Vanishing Sensitivity to Cavity Length Vibrations [0.0] 連続波のアクティブ原子時計は、原子を応答させながら自発放出による寄生的加熱により発散している。
本稿では, 共振器と共振器との結合に代えて, 共振を全集合的に行う方法を提案する。
このシステムは,直線幅連続波超放射光レーザを$mathcalO$(100$mu$Hz)で生成可能である。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 22:40:27 GMT)
Forgetful by Design? A Critical Audit of YouTube's Search API for Academic Research [0.0] 本稿では、学術研究の共通ツールであるYouTubeのData API(v3)の検索エンドポイントを批判的に監査する。
完全性、代表性、一貫性、バイアスに関する大きな制限を特定します。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:39:59 GMT)
Fidelity of entanglement and quantum entropies: unveiling their relationship in quantum states and channels [0.0] 絡み合いは様々な量子情報処理タスクの基本的なリソースとなる。
一般2量子状態に対する絡み合いと様々な量子エントロピーの関係について検討する。
R'enyi 2-entropy, Conditional R'enyi 2-entropy, Tsallis 2-entropy, Conditional Tsallis 2-entropy 上の上界を、エンタングルメントの忠実度の観点から導出する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:08:03 GMT)
Fidelity Isn't Accuracy: When Linearly Decodable Functions Fail to Match the Ground Truth [0.0] 線形モデルにより回帰ネットワークの出力がどの程度うまく模倣できるかを定量化する,単純かつ解釈可能な診断法である,線形性スコア $lambda(f)$ を提案する。
我々は、このフレームワークを合成(y = x sin(x) + epsilon$)と実世界のデータセットの両方で評価する。
以上の結果から,高い$lambda(f)$スコアは強い線形アライメントを示すが,基礎的真理に関して必ずしも予測精度を示唆するものではないことが示唆された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:55:37 GMT)
Feedforward Ordering in Neural Connectomes via Feedback Arc Minimization [0.0] 大規模重み付き有向グラフのフィードバック弧を最小化するためのスケーラブルなアルゴリズム群を提案する。
本手法では, 強結合成分に基づくグリーディーズ, ゲイン・アウェア・ローカル・リファインメント, 大域的構造解析を統合した。
すべてのアルゴリズムはPythonで効率的に実装され、Google Colab Pro+上でクラウドベースの実行を使用して検証される。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 03:03:55 GMT)
Extremal Magic States from Symmetric Lattices [0.0] 高次元対称格子と量子魔法状態の間の顕著な接続を示す。
我々は,2量子,3量子,1量子系の安定化器と最大マジック状態を構築し,分類する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:39:40 GMT)
Exploring the Effectiveness of Deep Features from Domain-Specific Foundation Models in Retinal Image Synthesis [0.0] 医療画像におけるニューラルネットワークモデルの採用は、厳格なプライバシー規制、データ可用性の制限、高い取得コスト、人口統計バイアスによって制限されている。
本研究では,大規模なドメインデータ,カラー・ファンド・イメージングに基づいて訓練された大規模基盤モデルの深部活性化層に基づく距離ベース損失関数が,知覚的損失とエッジ検出に基づく損失関数よりも有利であるかどうかを実験的に検討した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:09:11 GMT)
Evaluation of derivatives using approximate generalized parameter shift rule [0.0] 任意のデバイスハミルトニアンを扱える近似一般化パラメータ規則(aGPSR)を提案する。
3から6キュービットの変動量子固有解法テストケースにaGPSRを適用すると、期待呼び出しの数は7から504の係数で減少する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:08:20 GMT)
Enter: Graduated Realism: A Pedagogical Framework for AI-Powered Avatars in Virtual Reality Teacher Training [0.0] 高忠実度アバターは初心者に過剰な認知負荷を課すことができるので、超現実主義は必ずしも最適ではないと我々は主張する。
光リアリズムの技術的推進力と足場学習の教育的ニーズの間には大きなギャップがある。
我々は,低忠実度アバターで研修生を育成するための枠組みである大学院リアリズムを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:37:36 GMT)
Entanglement and Bell nonlocality with bottom-quark pairs at hadron colliders [0.0] 量子力学において重要な概念である絡み合いとベル非局所性は高エネルギー衝突器で探究可能であることが示されている。
いくつかのコライダー実験において, エンタングルメントとベル非局所性の観測の可能性について検討した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 18:00:07 GMT)
EasyARC: Evaluating Vision Language Models on True Visual Reasoning [0.0] 本稿では,マルチイメージ,マルチステップ推論,自己補正を必要とする視覚言語ベンチマークであるEasyARCを紹介する。
EasyARCは手続き的に生成され、完全に検証可能で、スケーラブルであり、強化学習パイプラインに最適である。
我々は最先端のビジョン言語モデルをベンチマークし、その失敗モードを分析する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:03:33 GMT)
Diabetes Prediction and Management Using Machine Learning Approaches [0.0] 本研究は,糖尿病リスク分類に対する統計的および非統計的機械学習手法の予測能力を強調した。
この実験は、糖尿病予測に関する精度と有効性の観点から、さまざまな種類の機械学習アルゴリズムを評価する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:58:19 GMT)
Development of a Smart Autonomous Irrigation System Using Iot and AI [0.0] 管理不能な管理は、農業生産性を低下させながら、水の無駄につながる可能性がある。
ドリップ灌水システムは1970年代以来、最も効率的な方法の1つである。
システムの目的は、労働生産性を高め、水資源の保全に貢献することである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:37:34 GMT)
Designing Effective LLM-Assisted Interfaces for Curriculum Development [0.0] 大きな言語モデル(LLM)は、動的カリキュラムの提供方法を変える可能性がある。
本稿では、2つの新しいUIデザイン、UI PredefinedとUI Openを紹介する。
複雑なプロンプトエンジニアリングへの依存を減らすことで、これらのUIはユーザビリティ、スムーズなインタラクション、より低いワークロードを改善します。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 13:21:53 GMT)
Deep Symmetric Autoencoders from the Eckart-Young-Schmidt Perspective [0.0] 本稿では,対称型オートエンコーダのクラス間の形式的な区別を導入し,その強度と限界を数学的観点から分析する。
例えば、正則性制約を持つ対称自己エンコーダの再構成誤差は、よく知られたEckart-Young-Schmidt(EYS)定理を利用して理解することができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:12:34 GMT)
Data-Driven Soil Organic Carbon Sampling: Integrating Spectral Clustering with Conditioned Latin Hypercube Optimization [0.0] 土壌有機炭素(SOC)モニタリングは、しばしば代表的なフィールドサンプリング場所の選択に依存する。
スペクトルクラスタリングと条件付きラテンハイパーキューブサンプリングを統合した新しいハイブリッド手法を提案する。
この改良されたサンプリング設計はより正確なSOC予測をもたらす可能性がある。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:56:49 GMT)
Control Architecture and Design for a Multi-robotic Visual Servoing System in Automated Manufacturing Environment [0.0] 人間は、特に精密ロボットマニピュレータを必要とするマイクロスケール製造において、依然として機械よりも優れています。
本研究は, 高速化・非高速化のための位置決め過程をシミュレートするマルチロボット制御システムにより, 様々な不確実性を低減できることを示す。
本稿では,カメラの作業空間を探索し,画像ノイズレベルが最小となる最適な位置を探索するための,カメラの移動ポリシーのための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 01:09:44 GMT)
Context-Augmented Code Generation Using Programming Knowledge Graphs [0.0] 大きな言語モデル(LLM)とコード-LLM(CLLM)は、困難で複雑な問題に対処する際にしばしば困難に直面します。
本稿では,プログラミング知識グラフ(PKG)を利用して,コードの意味的表現と検索を行う新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:35:13 GMT)
Computational Attestations of Polynomial Integrity Towards Verifiable Machine-Learning [0.0] 我々は,1台のマシン上で5万サンプルのデータセットに対して,線形回帰の正しいトレーニングを6分以内で行うことを証明した。
この結果は、このサイズのデータセットよりも証明可能なDPの文献で知られている最速の事例である。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:28:31 GMT)
Computational Analysis of Climate Policy [0.0] この論文は、気候非常事態運動が地方政府の気候政策に与える影響を探求するものである。
私はまずOpenAIモデルGPT-4を使ってPALLMというシステムを構築しました。
私は地方政府の政策立案者の助けを借りて、この制度の実績を検証した。
ビクトリア州の地方自治体から現在の政策文書を大規模に分析するために使用しました。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 00:13:30 GMT)
Completeness Stability of Quantum Measurements [0.0] 我々は、量子測定の品質を定量化するために、リソースモノトーン、完全性安定性を導入する。
量子測定をフレームとして見ることにより、フレーム演算子の最小固有値が重要なモノトーンとして現れる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:44:53 GMT)
Complementary polynomials in quantum signal processing [0.0] 与えられた$P$を実装するには、まず対応する補完的な$Q$を構築しなければならない。
この問題に対する既存のアプローチでは、明示的な誤り解析には適さない数値的手法が採用されている。
複素解析を用いた補体系に対する新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 16:52:35 GMT)
Comparison of schemes for highly loss tolerant photonic fusion based quantum computing [0.0] 本稿では,最近提案されたフォールトトレラント核融合に基づく量子計算の性能について概説する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:32:41 GMT)
Collectively enhanced ground-state cooling in subwavelength atomic arrays [0.0] サブ波長アレイに閉じ込められた原子のサイドバンド冷却方式を提案する。
我々は、原子の内的自由度を断熱的に除去することで、原子運動に対する効果的なマスター方程式を導出する。
このアプローチは、エミッターの密集に基づく将来の量子技術に利用することができる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 22:53:02 GMT)
Coefficient Shape Transfer Learning for Functional Linear Regression [0.0] 本研究では,関数型線形モデルにおけるデータ不足問題に対処するために,新しい伝達学習手法を開発する。
対象モデル(ターゲットドメイン)のサンプルと補助モデル(ソースドメイン)のサンプルを用いて、ソースドメインからターゲットドメインへの係数形状の知識を伝達する。
提案した推定器の収束速度を厳密に解析し,最小値の最適性について検討する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 00:00:43 GMT)
CoNNect: Connectivity-Based Regularization for Structural Pruning [0.0] CoNNectは、スパースNNトレーニングのための新しい差別化可能なレギュレータである。
CoNNectは、レイヤ崩壊などの問題を回避しながら、最大接続されたネットワーク構造を保証する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:18:12 GMT)
Chunk Twice, Embed Once: A Systematic Study of Segmentation and Representation Trade-offs in Chemistry-Aware Retrieval-Augmented Generation [0.0] Retrieval-Augmented Generationシステムは、科学文献の絶え間なく拡大する身体をナビゲートするためにますます重要になっている。
本研究は,化学に特化したRAGシステムに適したチャンキング戦略と埋め込みモデルの大規模かつ体系的な評価を行った最初の事例である。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:44:53 GMT)
ChemRxivQuest: A Curated Chemistry Question-Answer Database Extracted from ChemRxiv Preprints [0.0] ChemRxivQuestは、17のサブフィールドにわたる155のChemRxivプリプリントから、高品質なQA(QA)ペア970のキュレートされたデータセットである。
各QAペアは、トレーサビリティとコンテキスト精度を確保するために、ソーステキストセグメントに明示的にリンクされている。
ChemRxivQuestは光学文字認識(OCR)、GPT-4oベースのQA生成とファジィマッチング技術を組み合わせた自動パイプラインを用いて構築された。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:53:45 GMT)
CheMixHub: Datasets and Benchmarks for Chemical Mixture Property Prediction [0.0] CheMixHubは分子混合物の総合的なベンチマークである。
11種類の化学物質の混合特性予測タスクのコーパスをカバーしており、ドラッグデリバリーの定式化から電池の電解質まで。
CheMixHubは、コンテキスト固有の一般化とモデルロバスト性を評価するために、さまざまなデータ分割技術を導入している。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 21:19:27 GMT)
Camera-based method for the detection of lifted truck axles using convolutional neural networks [0.0] コンボリューショナルニューラルネットワーク(CNN)は、交通方向に垂直に配置されたカメラで捉えたトラックのイメージから、リフトトラックの軸索を検出するために提案された。
提案手法の性能評価を行った結果,精度87%,リコール91.7%,推定時間1.4msであった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:29:52 GMT)
BreastDCEDL: Curating a Comprehensive DCE-MRI Dataset and developing a Transformer Implementation for Breast Cancer Treatment Response Prediction [0.0] 乳がん患者2,070例の3D Dynamic Contrast-Enhanced MRI(DCE-MRI)を前処理した深層学習データセットであるBreastDCEDLについて報告する。
生のDICOM画像データは、厳密に3D NIfTIボリュームに変換され、信号の整合性が保たれた。
BreastDCEDLには、事前に定義されたベンチマーク分割が含まれており、再現可能な研究のためのフレームワークを提供し、乳がん画像における臨床的に意味のあるモデリングを可能にする。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:31:57 GMT)
Bounding Large-Scale Bell Inequalities [0.0] ベルの不等式は非局所性を研究するための重要なツールであるが、システムのサイズが大きくなるにつれてすぐに計算的に難解になる。
本研究では,NPA階層,投影の交互化法,メモリ効率のアルゴリズムL-BFGSを組み合わせることで,そのような不等式に対する量子的違反の上限を求める新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 10:23:18 GMT)
Bhatt Conjectures: On Necessary-But-Not-Sufficient Benchmark Tautology for Human Like Reasoning [0.0] 推論モデル(LLMs/LRMs)が真の理由なのか、単にパターンマッチがゴールポストのシフトに悩まされているのか、議論する。
私の個人的な意見では、2つの分析的な「タウトロジー」が、私の精神モデルでその霧を切り抜けた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 02:41:18 GMT)
Augmenting the Generality and Performance of Large Language Models for Software Engineering [0.0] 大規模言語モデル(LLM)は、コード生成と分析に特に重点を置いて、ソフトウェア工学(SE)に革命をもたらしている。
本研究の目的は、異なる特徴を持つLLMが様々な非コードタスクでどのように機能するかを理解することによって、SEのためのLLMの汎用性と性能を高めることである。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:00:38 GMT)
Artificial Intelligence and Machine Learning in the Development of Vaccines and Immunotherapeutics Yesterday, Today, and Tomorrow [0.0] 過去には、ワクチンと免疫療法の開発は、試行錯誤実験と広範囲な生体内試験に大きく依存していた。
AIとディープラーニングの未来は、動物による前臨床検査、ワクチン、免疫療法をコンピュータベースのモデルに置き換えることに向けられている。
これは、感染性病原体やがんに対する個人ワクチンや免疫療法の開発において、迅速かつ変革的な変化をもたらす可能性がある。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:20:43 GMT)
Arnoldi Singular Vector perturbations for machine learning weather prediction [0.0] 本稿では,Huaweiの24時間パング気象モデルを用いて,機械学習天気予報(MLWP)の感度について検討する。
A-SVは、24時間パング気象モデルにおいて、動的に有意な摂動パターンを見出す。
これらの摂動は局所的な不安定なモードを記述しており、MLWPアンサンブルの基礎となる可能性がある。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:52:20 GMT)
Analysis and Optimization of Probabilities of Beneficial Mutation and Crossover Recombination in a Hamming Space [0.0] 任意の有限アルファベットを持つハミング空間において、有益な突然変異の確率と弦の交叉組換えを解析する。
我々は、突然変異と組換えの最適条件を導出し、突然変異と交叉の確率を最大化する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 22:24:41 GMT)
An exact analytical solution for Dicke superradiance [0.0] 我々はDicke超放射能問題を再考し、N の同一二層系のアンサンブルが集団自然崩壊する。
コンパクトで閉形式な解で、残基上の有限和として力学を表現するか、あるいは同値な複素輪郭積分(英語版)(complex contour integral)を示す。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 12:30:30 GMT)
Agent Semantics, Semantic Spacetime, and Graphical Reasoning [0.0] 有限$gamma (3,4)$表現は、任意の意味複雑性にスケール可能な閉じた演算の集合を形成するために定義される。
セマンティック時空モデル(およびその公約理論)の起源は、そのような吸収状態が境界情報とどのように関連しているかを明らかにするのに役立つ。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 14:51:05 GMT)
AI-based modular warning machine for risk identification in proximity healthcare [0.0] DHEAL-COMフレームワーク内での活動により、科学者は大量のマルチモーダルデータを収集できる。
本研究は,そのようなデータを取り込み,予測結果を提供し,モデル解釈を容易にする,多数の教師なしおよび教師なしの手法で構成された汎用的な自動パイプラインについて述べる。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 11:41:52 GMT)
A new look at Perturbation Theory in QFT and Resolvent Series [0.0] これらのノートは、タラグランドの著書 guillemotleftWhat is Quantum Field Theory, A First Introduction for Mathematiciansguillemotright でリヨンの読書グループによって動機付けられた。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 08:27:49 GMT)
A Short Survey on Formalising Software Requirements using Large Language Models [0.0] 本稿では,大規模言語モデル(LLM)を用いたソフトウェア仕様書作成支援に関する文献調査を行う。
Dafny、C、Javaで書かれたプログラムを指定する例を含む、305のキーペーパーの要約が紹介されている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 15:26:58 GMT)
A Reference Model and Patterns for Production Event Data Enrichment [0.0] プロダクションイベントデータを豊かにするために設計された参照モデルとパターンのコレクションを導入します。
リファレンスモデルは、プロダクションイベントデータを保存し、抽出する標準的な方法を提供する。
これらのパターンは、製造プロセスから発生したイベントデータセットからの経験的観察に基づいて開発される。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 06:58:25 GMT)
A Random Matrix Theory of Pauli Tomography [0.0] QST再構成における Deltahatrho = hatrho-hatrhoprime$ の誤差の詳細な特徴は、量子論と実験において明らかに重要である。
我々は、情報完全ベースにおける状態トモグラフィーの完全ランダム行列理論(RMT)を考案した。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 17:58:14 GMT)
A Procedural Framework for Assessing the Desirability of Process Deviations [0.0] 本稿では,プロセスアナリストによる逸脱の回避性を体系的に評価する手続き的枠組みを提案する。
偏差を互いに排他的な望ましさのカテゴリに分類する方法について、どの入力要因を考慮すべきかを特定するためのステップバイステップのアプローチを提供する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 07:24:57 GMT)
A Lightweight IDS for Early APT Detection Using a Novel Feature Selection Method [0.0] 先進的永続脅威(Advanced Persistent Threat、APT)は、サイバー脅威の多段階的で高度で隠蔽的な形態である。
本稿では,軽量な侵入検知システムを開発するための特徴選択手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:07:56 GMT)
A Gamified Evaluation and Recruitment Platform for Low Resource Language Machine Translation Systems [0.0] 本稿では,採用・ゲーミフィケーション評価プラットフォームの設計を目的とし,既存の評価手順のレビューを行う。
その結果、Machine Translation (MT) システムの開発者のためのリクルートとゲーミフィケーション評価プラットフォームの設計が得られた。
また、このプラットフォームの評価や、自然言語処理(NLP)研究の幅広い領域における応用の可能性についても論じられている。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 04:42:16 GMT)
A Century of Bose-Einstein Condensation [0.0] ボース=アインシュタイン凝縮(Bose-Einstein Condensation)は、過去1世紀で最も興味深く基本的な現象の核心にある現象である。
物質の基本相と集合量子力学の理解に革命をもたらした。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 19:20:26 GMT)
(SimPhon Speech Test): A Data-Driven Method for In Silico Design and Validation of a Phonetically Balanced Speech Test [0.0] そこで本研究では,Simmatic Phoneme Speech Test (SimPhon Speech Test) 手法について紹介する。
制御された音響劣化下での音声刺激の処理により、まず最も一般的な音素混和パターンを同定する。
これらのパターンは、候補語対の大きな集合の、データ駆動型キュレーションを導く。
SimPhon Speech Test-25テスト項目の診断性能は,標準音声明瞭度指数の予測値と有意な相関は示さなかった。
論文参考訳(メタデータ) (Fri, 13 Jun 2025 09:43:27 GMT)