DreamGen: Unlocking Generalization in Robot Learning through Video World Models [120.3] DreamGenは、ニューラルトラジェクトリを通じて行動や環境を一般化するロボットポリシーをトレーニングするためのパイプラインだ。
私たちの研究は、手作業によるデータ収集を超えて、ロボット学習をスケールするための、有望な新たな軸を確立します。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:33:35 GMT)
Reasoning with Exploration: An Entropy Perspective [112.4] 強化学習(RL)の中心的目標としてのバランシング探索と活用
本研究では、RLにおける探査信号であるエントロピーを再検討し、LMにおける探索的推論との関係について検討する。
エントロピーに基づく項による優位関数の増大という,1行のコードのみによる標準RLへの最小限の修正を導入する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:54:03 GMT)
The California Report on Frontier AI Policy [110.4] フロンティアAIの継続的な進歩は、科学的発見、経済生産性、より広範な社会福祉における大きな進歩の可能性を秘めている。
グローバルAIイノベーションの中心として、カリフォルニアには、フロンティアAIの開発を継続するユニークな機会がある。
報告書は、カリフォルニアがフロンティアAIの使用、評価、ガバナンスにどのようにアプローチするかを知らせる政策原則を導出する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:33:21 GMT)
SeePhys: Does Seeing Help Thinking? -- Benchmarking Vision-Based Physics Reasoning [89.5] 物理問題に基づく推論のための大規模マルチモーダルベンチマークである SeePhys を提示する。
このベンチマークは、物理学の分野にまたがる7つの基本的な領域をカバーし、21のカテゴリの非常に異質なダイアグラムを取り入れている。
最も先進的な視覚推論モデル(例えばGemini-2.5-proやo4-mini)でさえ、ベンチマークで60%未満の精度を実現している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:31:36 GMT)
Rigor in AI: Doing Rigorous AI Work Requires a Broader, Responsible AI-Informed Conception of Rigor [84.0] 我々は、厳格なAI研究と実践が持つべきものに対するより広範な概念が必要とされると論じている。
我々は,AIコミュニティの作業に関する対話に有用な言語とフレームワークを提供することを目標としている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:44:41 GMT)
Sampling from Your Language Model One Byte at a Time [82.7] トークン化はモデルの世代に歪みをもたらす可能性がある。
トークンライザのミスマッチは、しばしばモデル構成と相互運用性を妨げる。
本稿では,BPEトークン化器を用いた自己回帰型LMを文字レベルあるいはバイトレベルのLMに変換する推論時間を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:37:04 GMT)
AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning [82.4] AgentCPM-GUIは、堅牢で効率的なオンデバイスGUIインタラクションのために構築されている。
私たちのトレーニングパイプラインには、知覚を高めるためのグラウンドアウェア事前トレーニングが含まれています。
AgentCPM-GUIは5つの公開ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:57:04 GMT)
Revisiting Reinforcement Learning for LLM Reasoning from A Cross-Domain Perspective [82.2] 強化学習(RL)は,大規模言語モデル(LLM)推論を改善するための有望なアプローチとして登場した。
重要な課題は、様々な推論領域にまたがる信頼性とスケーラブルなRL報酬信号の欠如である。
我々は,6つの推論領域にまたがる92Kの検証可能な例をキュレートしたRL推論コーパスであるGuruを紹介する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:24:00 GMT)
Exploring Non-contrastive Self-supervised Representation Learning for Image-based Profiling [80.1] SSLProfilerは、セルプロファイリング用に特別に設計された非コントラストSSLフレームワークである。
本稿では,セル画像に適したデータ拡張と表現後処理手法を提案する。
これらの改善により、SSLProfilerはCVPR 2025でCell Line Transferabilityで優勝した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:25:57 GMT)
FigCaps-HF: A Figure-to-Caption Generative Framework and Benchmark with Human Feedback [69.5] FigCaps-HFは、新しいフィギュアキャプション生成フレームワークである。
本フレームワークは,1) 図形選択ペアの品質を評価するための自動手法,2) 人物フィードバックを用いた新しい強化学習(RLHF) により,読取者の好みに応じて生成図形選択モデルを最適化する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:07:14 GMT)
EXGRA-MED: Extended Context Graph Alignment for Medical Vision- Language Models [69.4] 医療用AIにおける視覚言語統合のための新しいフレームワークであるEXGRA-MEDを紹介する。
画像、命令応答、拡張キャプションを共同で調整し、セマンティックグラウンドとクロスモーダルコヒーレンスを前進させる。
LLAVA-MEDのパフォーマンスを10%の事前トレーニングデータで比較し、VQA-RADで20.13%向上し、フルデータパフォーマンスに近づいた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:50:07 GMT)
T2V-OptJail: Discrete Prompt Optimization for Text-to-Video Jailbreak Attacks [67.9] 我々は、T2Vジェイルブレイク攻撃を離散最適化問題として定式化し、T2V-OptJailと呼ばれる共同目的ベース最適化フレームワークを提案する。
いくつかのT2Vモデルに対して大規模な実験を行い、オープンソースモデルと実際の商用クローズドソースモデルの両方をカバーする。
提案手法は,攻撃成功率の観点から既存手法よりも11.4%,10.0%向上する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:44:28 GMT)
A Multi-Expert Structural-Semantic Hybrid Framework for Unveiling Historical Patterns in Temporal Knowledge Graphs [67.0] 時間的知識グラフ推論は、既存の事実の知識で将来の事象を予測することを目的としており、下流の様々なタスクにおいて重要な役割を果たす。
従来の手法では、グラフ構造学習や意味推論に重点を置いていたが、二重推論の視点を統合できなかった。
構造情報と意味情報の両方を統合するために3種類の専門家モジュールを利用する多機能構造意味ハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:49:13 GMT)
Align Your Flow: Scaling Continuous-Time Flow Map Distillation [63.9] フローマップは、任意の2つのノイズレベルを1ステップで接続し、すべてのステップカウントで有効に保ちます。
画像生成ベンチマークにおいて、Align Your Flowと呼ばれるフローマップモデルを広範囲に検証する。
テキスト条件付き合成において、既存の非横断的訓練された数ステップのサンプルよりも優れたテキスト間フローマップモデルを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:06:07 GMT)
MMedAgent-RL: Optimizing Multi-Agent Collaboration for Multimodal Medical Reasoning [63.6] 医療エージェント間の動的に最適化された協調を可能にする強化学習に基づくマルチエージェントフレームワークMMedAgent-RLを提案する。
具体的には、Qwen2.5-VLに基づく2つのGPエージェントをRLを介して訓練する: トリアージ医師は患者を適切な専門分野に割り当てることを学ぶ一方、主治医はマルチスペシャリストの判断を統合する。
5つのVQAベンチマークの実験では、MMedAgent-RLはオープンソースおよびプロプライエタリなMed-LVLMよりも優れており、人間のような推論パターンも示している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:59:45 GMT)
LongLLaDA: Unlocking Long Context Capabilities in Diffusion LLMs [63.6] 拡散LDMと従来の自己回帰LDMの長文性能を比較検討する。
LLaDAとNTKベースのRoPE外挿法を統合したLongLLaDAを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:45:37 GMT)
RadFabric: Agentic AI System with Reasoning Capability for Radiology [61.3] RadFabricは、総合的なCXR解釈のための視覚的およびテキスト分析を統合するマルチエージェント、マルチモーダル推論フレームワークである。
システムは、病理診断に特殊なCXRエージェント、正確な解剖学的構造に視覚所見をマッピングする解剖学的解釈エージェント、および視覚的、解剖学的、臨床データを透明かつ証拠に基づく診断に合成する大規模なマルチモーダル推論モデルを利用した推論エージェントを使用する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:10:33 GMT)
AgentSynth: Scalable Task Generation for Generalist Computer-Use Agents [60.9] Agent Synthはスケーラブルで費用効率のよいパイプラインで、高品質なタスクとトラジェクトリデータセットを自動的に合成する。
我々のパイプラインは1軌道あたりの平均コストが0.60ドルで、人間のアノテーションよりも桁違いに安い。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:46:52 GMT)
Adaptive Accompaniment with ReaLchords [60.7] ユーザのメロディに合わせてコード伴奏を即興するオンライン生成モデルであるReaLchordsを提案する。
まず、最大で事前訓練されたオンラインモデルから始め、強化学習を使用して、オンライン使用のためのモデルを微調整します。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:59:05 GMT)
ROSE: Toward Reality-Oriented Safety Evaluation of Large Language Models [60.3] 大規模言語モデル(LLM)は、現実世界のアプリケーションにおいてブラックボックスコンポーネントとしてますます多くデプロイされている。
我々は,多目的強化学習を用いて敵のLDMを微調整する新しいフレームワークであるReal-Oriented Safety Evaluation (ROSE)を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:55:17 GMT)
On the Emergence of Position Bias in Transformers [59.9] 本稿では,多層構造における位置バイアスを解析するためのグラフ理論フレームワークを提案する。
我々のフレームワークは、トランスにおける位置的相互作用を理解するための原則的な基盤を提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:54:53 GMT)
Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis [59.8] グラフィカルユーザインタフェース(GUI)の基盤は、コンピュータ利用エージェント開発において依然として重要なボトルネックとなっている。
多様なタスクタイプにまたがる564の細かな注釈付きサンプルからなる総合ベンチマークであるOSWorld-Gを紹介する。
我々は、400万のサンプルを含む、最大のコンピュータ利用基盤データセットであるJediを合成してリリースする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:33:35 GMT)
SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.6] SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:50:44 GMT)
Mercury: Ultra-Fast Language Models Based on Diffusion [58.5] 拡散に基づく新しい商用大規模言語モデル(LLM)であるMercuryを提示する。
Mercury CoderにはMiniとSmallの2つのサイズがある。
独立した評価に基づいて、マーキュリー・コーダ・ミニとマーキュリー・コーダ・スモールは、それぞれ1109トークン/秒と737トークン/秒の最先端のスループットを達成した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:06:18 GMT)
Transformers Learn Faster with Semantic Focus [58.0] 学習性と一般化の観点からスパース変圧器について検討する。
入力依存のスパースアテンションモデルは、標準アテンションモデルよりも早く収束し、より一般化しているように見える。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:19:28 GMT)
No-Regret Learning Under Adversarial Resource Constraints: A Spending Plan Is All You Need! [56.8] アクション選択の前に報酬とコストが観測される$(i)$オンラインリソース割当と、アクション選択後、完全なフィードバックや盗賊フィードバックの下で、リソース制限付きオンライン学習である$(ii)$オンラインリソース割当に焦点を当てた。
報酬とコスト分布が時間とともに任意に変化する場合、これらの設定でサブ線形後悔を達成することは不可能であることが知られている。
我々は、支出計画に従う基準線に対する半線形後悔を実現する一般的な(基本的)二重的手法を設計し、また、支出計画が予算のバランスの取れた配分を保証すると、アルゴリズムの性能が向上する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:48:28 GMT)
Reinforcement Learning with Segment Feedback [56.5] 状態ごとの反応フィードバックと軌道フィードバックのギャップを埋める一般的なパラダイムを提供するRLというモデルを考える。
バイナリフィードバックの下では、$m$のセグメント数の増加は指数率で後悔を減少させるが、驚くべきことに、和フィードバックの下では、$m$の増加は後悔を著しく減少させるものではない。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:54:41 GMT)
Multi-Scale Finetuning for Encoder-based Time Series Foundation Models [56.5] 時系列基礎モデル (TSFM) は, 時系列予測において印象的なゼロショット性能を示す。
我々は、TSFMの能力を十分に活用するに足りず、しばしば過度な適合と準最適性能をもたらすと論じている。
マルチスケールモデリングをファインタニングプロセスに明示的に統合するシンプルなフレームワークであるtextbftextscfinetextbftextsctuning (textbfMSFT)を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:06:01 GMT)
Reparameterized LLM Training via Orthogonal Equivalence Transformation [54.8] 直交同値変換を用いてニューロンを最適化する新しいトレーニングアルゴリズムPOETを提案する。
POETは、目的関数を安定して最適化し、一般化を改善する。
我々は、大規模ニューラルネットワークのトレーニングにおいて、POETを柔軟かつスケーラブルにするための効率的な近似を開発する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:44:36 GMT)
A Survey on Personalized Content Synthesis with Diffusion Models [53.8] 本稿では,テストタイム微調整(TTF)と事前学習適応(PTA)に分類できるPCS研究の一般的な枠組みを紹介する。
対象、顔、スタイルのパーソナライゼーションといった分野における専門的なタスクを探求し、独自の課題とイノベーションを強調します。
有望な進展にもかかわらず、我々は、オーバーフィッティングや、主題の忠実さとテキストアライメントのトレードオフなど、現在進行中の課題についても議論する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:08:05 GMT)
SIRI-Bench: Challenging VLMs' Spatial Intelligence through Complex Reasoning Tasks [53.6] SIRI-Benchは、映像ベースの推論タスクを通して視覚言語モデルの空間知性を評価するために設計されたベンチマークである。
SIRI-Benchは1K近いビデオクエスト・アンサー・トリプルで構成されており、各問題はリアルな3Dシーンに埋め込まれ、ビデオによってキャプチャされる。
大規模データ合成を容易にするために,自動シーン生成エンジンを開発した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:40:00 GMT)
PLAME: Leveraging Pretrained Language Models to Generate Enhanced Protein Multiple Sequence Alignments [53.6] タンパク質構造予測は、薬物の発見と生物学的機能の理解に不可欠である。
ほとんどの折り畳みモデルは予測性能を高めるために多重シーケンスアライメント(MSA)に大きく依存している。
我々は、事前学習されたタンパク質言語モデルからの進化的埋め込みを利用する新しいMSA設計モデルPLAMEを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:11:30 GMT)
On-the-Fly Adaptive Distillation of Transformer to Dual-State Linear Attention [53.2] 大規模言語モデル(LLM)は、自己アテンションを通じてグローバルトークンの依存関係をキャプチャするが、長い入力に対する計算とメモリコストに直面する。
まず,二状態線形注意(Dual-state linear attention, A)を提案する。これは2つの隠れ状態を保持する設計であり,その1つは,リニアアテンションアーキテクチャの典型的な短距離バイアスを緩和し,リニアアテンションを追尾するものである。
本稿では,DSLA層を段階的に置き換えるオンライン適応蒸留フレームワークであるDSLA-Serveを紹介する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:56:46 GMT)
A Variational Framework for Improving Naturalness in Generative Spoken Language Models [52.7] 本稿では,連続した音声属性をエンコードして意味的トークンを拡張できるエンドツーエンドの変分手法を提案する。
提案手法は,手動によるパラ言語的特徴の抽出と選択の必要性を排除している。
ヒトの発声者に応じて、好意的な発話継続を生産する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:58:17 GMT)
Insights Informed Generative AI for Design: Incorporating Real-world Data for Text-to-Image Output [51.9] 本稿では,DALL-E 3を材料データセットと統合して,サステナビリティ指標と材料利用の洞察を備えたAI設計を充実させるパイプラインを提案する。
我々は,(1) 生成AIによるプロンプトプロセスに先立ってユーザに対してサステナビリティの言及がなく,(2) プロンプト前にユーザと通信するサステナビリティの目標,(3) 生成AI出力に含まれる量的CO2eデータとともに通信するサステナビリティの目標である,という3つのユーザテストを通じてシステムを評価する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:33:11 GMT)
DMM: Distributed Matrix Mechanism for Differentially-Private Federated Learning Based on Constant-Overhead Linear Secret Resharing [51.3] 本稿では,ベスト・オブ・ボス・ワールドを実現するための分散行列機構,分散DPのプライバシ向上,行列機構の実用性向上について紹介する。
我々は、異なるトレーニングイテレーションのクライアント委員会間で、一定の通信オーバーヘッドで機密値をセキュアに転送する、新しい暗号プロトコルを用いてこれを実現する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:08:51 GMT)
Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs [51.2] Ring-liteは、強化学習(RL)により最適化されたMixture-of-Experts(MoE)ベースの大規模言語モデルである
我々のアプローチは、挑戦的なベンチマーク上でのSOTA(State-of-the-art)の小規模推論モデルの性能と一致する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:12:34 GMT)
Extending Spike-Timing Dependent Plasticity to Learning Synaptic Delays [50.5] シナプス接続強度と遅延を同時に学習するための新しい学習規則を導入する。
我々は、教師なし学習で訓練された分類のための広く使われているSNNモデルを拡張して、我々のアプローチを検証する。
その結果,提案手法は様々なテストシナリオにおいて常に優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:24:58 GMT)
PeRL: Permutation-Enhanced Reinforcement Learning for Interleaved Vision-Language Reasoning [50.2] 本稿では,マルチモーダルタスクのインターリーブに適した汎用強化学習手法PeRLを提案する。
空間的および位置的多様性を探索するために、様々な位置関係をシミュレートするために、画像列の置換を導入する。
実験の結果,PeRLのトレーニングモデルは,VLMベースラインを大きなマージンで,R1関連およびインターリーブしたVLMベースラインを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:25:56 GMT)
Casper: Inferring Diverse Intents for Assistive Teleoperation with Vision Language Models [50.2] 現実の遠隔操作における中心的な課題は、ロボットがユーザー制御入力から幅広い人間の意図を推測し、正しい行動でユーザーを支援することである。
本稿では,事前学習された視覚言語モデル(VLM)に埋め込まれたコモンセンス知識をリアルタイムな意図推論と柔軟なスキル実行に活用する,支援型遠隔操作システムであるCasperを紹介する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:06:43 GMT)
Re-Initialization Token Learning for Tool-Augmented Large Language Models [49.9] 大規模言語モデルは例外的な性能を示してきたが、数値推論や計画生成といった複雑なタスクに苦戦している。
本稿では,ツールトークンを既存の単語埋め込み空間と整合させる新しいトークン学習手法を提案する。
本稿では,GSM8K-XL,FuncQA,KAMEL,VirtualHomeのデータセットを用いて,数値推論,知識に基づく質問応答,具体化計画生成などのタスクについて評価する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:11:00 GMT)
ImpliRet: Benchmarking the Implicit Fact Retrieval Challenge [49.7] ImpliRetは、推論の課題をドキュメントサイド処理にシフトするベンチマークである。
我々は,この環境下で苦戦している,疎水・密集したレトリバーの幅を評価した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:08:29 GMT)
Controllable Dance Generation with Style-Guided Motion Diffusion [49.4] ダンスは人間の文化において芸術的な形式や表現として重要な役割を担っているが、ダンスの創造は依然として困難な課題である。
ほとんどのダンス生成法は音楽のみに依存しており、音楽スタイルやジャンルといった本質的な特質を考慮することは滅多にない。
本研究では,ダンス生成の多様なタスクに適した拡散型フレームワークであるDGSDP(Flexible Dance Generation with Style Description Prompts)を紹介する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:46:02 GMT)
From Bytes to Ideas: Language Modeling with Autoregressive U-Nets [49.2] トークン化は入力テキストに一定の粒度を課す。
オートレグレッシブなU-Netを導入し、トレーニング中に独自のトークンを埋め込むことを学びます。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:55:11 GMT)
Annihilating and breaking Lorentz cone entanglement [49.2] 円錐によって誘導される順序を持つ有限次元順序ベクトル空間の間の線型写像は絡み目破れと呼ばれる。
我々は、K$が任意の次元のローレンツに制限されたローレンツ絡みのより大きなクラスについて研究する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:58:14 GMT)
Verification Learning: Make Unsupervised Neuro-Symbolic System Feasible [49.1] 本稿では,Nesyにおけるラベルに基づく推論プロセスをラベルのない検証プロセスに変換する,新しい学習パラダイムであるVerification Learning(VL)を紹介する。
VLは、ラベルのないデータと、現在の予測が規則に準拠しているかどうかを検証する関数にのみ依存することにより、優れた学習結果を得る。
我々の理論的分析は、Nesyシステム内のどのタスクがラベルなしで完了できるかを指摘し、なぜルールが無限ラベルを置き換えられるのかを説明している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:48:16 GMT)
DisProtEdit: Exploring Disentangled Representations for Multi-Attribute Protein Editing [48.8] DisProtEditは、デュアルチャネル自然言語管理を利用する制御可能なタンパク質編集フレームワークである。
DisProtEditは、明示的にセマンティックファクタを分離し、モジュールと解釈可能なコントロールを可能にする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:12:18 GMT)
GRAM: A Generative Foundation Reward Model for Reward Generalization [48.6] まず,大規模教師なし学習を用いて学習し,教師付き学習により微調整を行う生成報酬モデルを開発した。
このモデルは、応答ランキング、人間のフィードバックからの強化学習、微調整によるタスク適応など、様々なタスクをうまく一般化する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:34:27 GMT)
Can Large Language Models Improve Spectral Graph Neural Networks? [48.1] スペクトルグラフネットワーク(SGNN)は、任意のフィルタを近似できるため、大きな注目を集めている。
それらは一般的に、適切なフィルタを適応的に学習するために、下流タスクからの監督に依存します。
大規模言語モデル(LLM)は、GNNドメイン内での可能性を探究することへの関心が高まっている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:17:19 GMT)
AlphaDecay:Module-wise Weight Decay for Heavy-Tailed Balancing in LLMs [47.7] 重崩壊は、大規模言語モデル(LLM)を訓練するための標準正規化手法である
本稿では,LLMの各モジュールに異なる重み付け強度を適応的に割り当てる,単純で効果的な方法であるAlphaDecayを紹介する。
提案手法は, スペクトル特性のモジュールワイド差のバランスをとるために, 調整した重み付き崩壊割当を利用するため, 性能が向上する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:21:10 GMT)
Reward Shaping to Mitigate Reward Hacking in RLHF [47.7] Preference As Reward (PAR) は、報酬モデルに埋め込まれた潜在的嗜好を強化学習の信号として活用する新しいアプローチである。
AlpacaEval 2.0ベンチマークでは、PARは競合するアプローチよりも少なくとも5パーセント高い勝利率を達成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:05:12 GMT)
Geometric Signatures of Compositionality Across a Language Model's Lifetime [47.3] 現代言語モデルは、構成性によって実現された言語の本質的な単純さを反映しているかどうかを考察する。
構成性と幾何学的複雑性の関係は,学習した言語的特徴から生じる。
本分析では, 言語構成の意味的側面と表面的側面をそれぞれ符号化し, 非線形次元と線形次元の顕著な対比を示した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:34:44 GMT)
CooPre: Cooperative Pretraining for V2X Cooperative Perception [47.0] CooPreは、V2X協調知覚のための自己教師型学習フラムワークである。
異種V2Xエージェント間の3D特徴に効果的に注意を向けることのできる,V2Xバードアイビュー(BEV)ガイドマスキング戦略を開発した。
CooPreはV2X-Realデータセットで4%のmAP改善を実現し、トレーニングデータの50%しか使用せず、ベースラインのパフォーマンスを上回っている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:39:16 GMT)
Flat Channels to Infinity in Neural Loss Landscapes [46.8] ニューラルネットワークのロスランドスケープには、平坦な地域で接続されたり、孤立して現れる可能性があるミニマとサドルポイントが含まれている。
ロスランドスケープ(損失ランドスケープ)の特別な構造を識別し,特徴付けする。
チャネルの終端におけるゲート線形ユニットの出現は、完全に連結された層の計算能力の驚くべき側面を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:04:15 GMT)
MOL: Joint Estimation of Micro-Expression, Optical Flow, and Landmark via Transformer-Graph-Style Convolution [46.6] 顔のマイクロ圧縮認識(MER)は、過渡的かつ微妙なマイクロ圧縮(ME)作用のために難しい問題である。
本稿では、トランスフォーマー、グラフ畳み込み、バニラ畳み込みの利点を生かしたエンドツーエンドのマイクロアクション対応ディープラーニングフレームワークを提案する。
我々のフレームワークはCASME II, SAMM, SMICベンチマークにおける最先端のMER手法よりも優れています。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:35:06 GMT)
OAgents: An Empirical Study of Building Effective Agents [46.5] キーエージェントコンポーネントにおける一般的な設計選択の影響を,公平かつ厳密な方法で検討する。
この結果に基づいて,新たな基盤エージェントフレームワークであるOAgentsをオープンソースとして開発しています。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:59:02 GMT)
Achieving Unbiased Multi-Instance Learning via Balanced Fine-Grained Positive-Unlabeled Learning [46.4] 現実世界のアプリケーションでは、それらに含まれる情報が極めて限られている場合、異常なサンプルを検出することはしばしば困難である。
そこで本研究では,MIL問題を,より微細な正極無ラベル学習問題(PU)に変換できることを考察した。
この変換により、マイクロレベルのバランス機構を用いて、不均衡問題にバイアスのない方法で対処できる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:34:01 GMT)
Adaptive Reinforcement Learning for Unobservable Random Delays [46.0] 本稿では,エージェントが観測不能かつ時間変化の遅れを適応的に処理できる汎用フレームワークを提案する。
具体的には、エージェントは予測不可能な遅延とネットワーク越しに送信される失われたアクションパケットの両方を処理するために、将来のアクションのマトリックスを生成する。
提案手法は,幅広いベンチマーク環境において,最先端の手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:11:37 GMT)
Can LLMs Ask Good Questions? [45.5] 大規模言語モデル(LLM)が生成する質問を文脈から評価する。
質問タイプ,質問長,コンテキストカバレッジ,回答可能性,不共通性,必要な回答長の6つの次元にわたる人間による質問と比較した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:44:37 GMT)
Niagara: Normal-Integrated Geometric Affine Field for Scene Reconstruction from a Single View [45.4] Niagaraは、単一入力画像から挑戦的な屋外シーンを忠実に再構築することのできる、新しいワンビュー3Dシーン再構築フレームワークである。
幾何的アフィン場(GAF)と3次元自己アテンションを幾何学制約として導入し、明示的幾何学の構造的性質と暗黙的特徴場の適応性を組み合わせた。
そこでは,3次元ガウスパラメータを予測するために,奥行きに基づく3次元ガウスデコーダを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:47:02 GMT)
Quality-aware Masked Diffusion Transformer for Enhanced Music Generation [45.0] 本稿では,大規模・品質不均衡なデータセットから高品質・高音質音楽を生成するための新しい品質意識学習パラダイムを提案する。
低品質キャプションの問題に対処する3段階キャプション改善手法を提案する。
実験では、客観的メトリクスと主観的メトリクスの両方で、ベンチマークデータセット上での最先端(SOTA)パフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:38:59 GMT)
Evaluating Rank-N-Contrast: Continuous and Robust Representations for Regression [45.0] この文書は2023年に出版された『Rank-N-Contrast』(arXiv:2210.01189v2)の複製である。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:42:46 GMT)
LongSpec: Long-Context Lossless Speculative Decoding with Efficient Drafting and Verification [42.5] LongSpecは、長いコンテキストに対する効率的な推論の課題に対処するフレームワークである。
LongSpecは、強力なFlash Attentionベースライン上で最大3.26倍のスピードアップを達成する。
コードはhttps://github.com/sail-sg/LongSpecで公開されている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:58:01 GMT)
DreamLight: Towards Harmonious and Consistent Image Relighting [41.9] ユニバーサル・イメージ・リライティングのためのDreamLightというモデルを導入する。
照明や色調の美的均一性を保ちつつ、被験者をシームレスに新しい背景に合成することができる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:05:24 GMT)
Batch-Max: Higher LLM Throughput using Larger Batch Sizes and KV Cache Compression [41.0] いくつかの研究が、より効率的な推論のためにKVキャッシュからキーと値のペアを除去するための消去ポリシーを開発した。
入力処理フェーズ中にKVキャッシュを圧縮することにより、より大きなバッチサイズを使用でき、スループットが大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:24:51 GMT)
What's in the Box? Reasoning about Unseen Objects from Multimodal Cues [40.6] 本稿では,ニューラルネットワークを用いてオープンなマルチモーダル入力を解析するニューロシンボリックモデルを提案する。
本研究では,本モデルが人間の判断と強く相関していることを示し,一方,不定形アブレーションモデルと大規模マルチモーダルニューラルモデルベースラインは相関性に乏しいことを示した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:03:44 GMT)
Now More Than Ever, Foundational AI Research and Infrastructure Depends on the Federal Government [40.5] 財団法人AI研究への連邦政府の投資は、この分野における米国のリーダーシップにとって不可欠である。
今こそ、米国のハイテク産業への投資を補完し、推進する連邦政府の支援を強化する時だ。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:09:53 GMT)
3D Hand Mesh-Guided AI-Generated Malformed Hand Refinement with Hand Pose Transformation via Diffusion Model [40.2] 本稿では,拡散パイプラインを用いた3次元メッシュ誘導精製フレームワークを提案する。
トレーニングのために、RGB画像と3Dハンドメッシュからなるデータセットを収集し、再注釈する。
次に,3次元ハンドメッシュで導かれる洗練された出力を生成する拡散塗装モデルを設計する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:48:47 GMT)
StorySage: Conversational Autobiography Writing Powered by a Multi-Agent Framework [40.1] StorySageはユーザ主導のソフトウェアシステムで、多様なユーザのニーズを満たすように設計されている。
本システムでは,ユーザの記憶を反復的に収集し,自伝を更新し,今後の会話の計画を立てる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:44:47 GMT)
Automatic Qiskit Code Refactoring Using Large Language Models [39.7] 大規模言語モデル(LLM)を用いたQiskit符号の新しい手法を提案する。
まず、公式のQiskitドキュメントのさまざまなソースから、マイグレーションシナリオの分類を抽出することから始めます。
この分類法は、元のPythonソースコードとともに、LLMへの入力として提供され、コード内の移行シナリオのインスタンスを識別する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:00:48 GMT)
Q2SAR: A Quantum Multiple Kernel Learning Approach for Drug Discovery [39.6] 本研究は、QSAR分類を強化するために、量子多重カーネル学習フレームワークを成功させたことを実証する。
本手法をDYRK1Aキナーゼ阻害剤を同定するためのデータセットに適用する。
古典的なグラディエントブースティングモデルに対してQMKL-SVMをベンチマークすることにより、量子化アプローチがより優れたAUCスコアを達成することを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:00:47 GMT)
TaskCraft: Automated Generation of Agentic Tasks [39.3] エージェントタスクは、自律性、ツールの使用、適応推論による多段階的な問題解決を必要とする。
textscCraftTaskは、難易度、マルチツール、検証可能なエージェントタスクを生成する自動化ワークフローである。
本稿では,エージェントチューニングと評価に関する今後の研究を支援するために,約36,000のタスクからなる大規模合成データセットを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:19:26 GMT)
Exploring Speaker Diarization with Mixture of Experts [39.0] 本稿では,シーケンス・ツー・シーケンスアーキテクチャを組み込んだメモリ対応マルチスピーカを用いたニューラルスピーカダイアリゼーションシステムを提案する。
提案手法は,現実のシナリオに挑戦する上での有効性を示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:42:54 GMT)
S$^4$C: Speculative Sampling with Syntactic and Semantic Coherence for Efficient Inference of Large Language Models [38.8] 大規模言語モデル(LLM)は、様々な下流タスクにまたがる顕著な推論能力を示す。
その自己回帰的な性質は、相当なレイテンシ推論をもたらし、リアルタイムアプリケーションに課題を提起する。
マルチヘッドドラフトを利用して投機的サンプリングを拡張するSyntactic and Semantic Coherenceフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:38:19 GMT)
ELI-Why: Evaluating the Pedagogical Utility of Language Model Explanations [38.7] 言語モデルの教育的能力を評価するために,13.4Kの"Why"質問のベンチマークであるELI-Whyを紹介する。
第1回研究では、モデル説明が異なる教育課程に適合するかどうかを評価する「教育者」の役割を担っている。
GPT-4による説明は、意図した教育的背景に合致するが、通常の人間による説明では79%であった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:36:39 GMT)
3DGS-IEval-15K: A Large-scale Image Quality Evaluation Database for 3D Gaussian-Splatting [38.7] 3DGSは、視覚的忠実度の高いリアルタイムレンダリングを提供する、新しいビュー合成のための有望なアプローチとして登場した。
圧縮された3DGS表現に特化して設計された最初の大規模画像品質評価(IQA)データセットである3DGS-IEval-15Kを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:39:34 GMT)
Quantum-enabled Rydberg atomic polarimetry of radio-frequency fields [37.7] ライドバーグ原子は、高周波(RF)と光ドメインの間で効率的に光子を結合する。
原子状態の角運動量量子化による分光シグネチャについて検討する。
本研究は,量子気象電場評価のためのRydberg原子ガスの展望に関する重要な知見を付加するものである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:31:55 GMT)
Precision bounds for multiple currents in open quantum systems [37.7] 我々はマルコフ力学を施した開量子系における複数の観測可能な量子 TUR と KUR を導出する。
我々の境界は、1つの観測可能量に対して以前に導かれた量子 TUR や KUR よりも厳密である。
また、フィッシャー情報行列の対角線外要素が捉えた相関関係の興味深い量子的シグネチャも見出す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:30:58 GMT)
Rectifying Belief Space via Unlearning to Harness LLMs' Reasoning [36.7] 本研究では,真の信念を同時に拡張しつつ,素早い信念を抑えることによって信念空間を是正する手法を提案する。
提案手法はまず, モデルに文章の説明文を生成するように促すことにより, 誤った解答につながる信念を同定する。
次に、未学習を適用して、同定された刺激的な信念を抑え、真の信念を強化することにより、モデルの信念空間を効果的に修正する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:26:49 GMT)
MoTE: Mixture of Ternary Experts for Memory-efficient Large Multimodal Models [36.7] MoTEは、密なチェックポイントからMixture-of-Ternary-Expertsモデルをトレーニングするためのスケーラブルでメモリ効率のよいアプローチである。
MoTEはメモリフットプリントを低くしながら、完全精度のベースラインであるMoE-LLaVAに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:53:49 GMT)
Infinity: Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis [35.8] Infinity(インフィニティ)は、高解像度のフォトリアリスティック画像を生成することができるビットワイズビジュアルオートレグレッシブ・モデリングである。
我々は、無限語彙トークン化器と分類器とビットワイズ自己補正機構を用いて、ビットワイズトークン予測フレームワークの下で視覚自己回帰モデルを再定義する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:32:20 GMT)
CDP: Towards Robust Autoregressive Visuomotor Policy Learning via Causal Diffusion [35.8] 拡散政策(DP)は、ロボットが行動拡散を通じて専門家のデモンストレーションを模倣することで複雑な行動を学ぶことを可能にする。
本稿では, 過去の行動系列を条件付け, 行動予測を強化するトランスフォーマーに基づく新しい拡散モデルであるCausal Diffusion Policy (CDP)を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:59:12 GMT)
Uncovering Overfitting in Large Language Model Editing [35.6] 編集対象に不均等に高い確率を割り当てる編集オーバーフィット現象を同定し,検討する。
本稿では,多段階推論制約モジュールを導入し,新しい知識をリコールする際のモデルをガイドするLearning the Inference (LTI)を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:41:46 GMT)
AgentDistill: Training-Free Agent Distillation with Generalizable MCP Boxes [35.5] MCP(Model-Context-Protocols)を直接再利用することで,スケーラブルな知識伝達を可能にする,新しいフリーエージェント蒸留フレームワークを提案する。
MCPは教師エージェントによって自律的に生成される再利用可能なタスク解決モジュールである。
バイオメディカルおよび数学的なベンチマーク実験により、我々の蒸留された学生エージェントは、小さな言語モデルで構築され、先進的なシステムに匹敵する性能を達成できることを示した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:08:32 GMT)
Semantic uncertainty in advanced decoding methods for LLM generation [35.3] 本研究では,大規模言語モデル(LLM)における意味的不確実性について検討した。
モデル出力の多様性と信頼性の両方に異なる復号戦略がどう影響するかを分析する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:09:29 GMT)
GAF: Gaussian Action Field as a Dvnamic World Model for Robotic Mlanipulation [35.3] 行動推論は視覚に基づくロボット操作において重要である。
動作認識型4D表現から直接の動作推論を可能にするV-4D-Aフレームワークを提案する。
実験では、+11.5385 dB PSNRと-0.5574 LPIPSの改善が達成された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:55:20 GMT)
Unsupervised Imaging Inverse Problems with Diffusion Distribution Matching [35.0] この研究は、未ペアデータセットを用いた逆問題レンズによる画像復元タスクに対処する。
提案手法は最小限の仮定の下で動作し、小さな未ペアデータセットにのみ依存する。
これは、フォワードモデルがしばしば未知あるいは不特定である実世界のシナリオに特に適している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:06:43 GMT)
Target Speaker Extraction through Comparing Noisy Positive and Negative Audio Enrollments [34.7] 従来,雑音による話者特性の抽出について検討されてきた。
そこで本研究では,雑音によるターゲット話者情報を符号化する新しい学習戦略について検討する。
実験により,従来よりも2.1dB以上のSI-SNRiを実現するモデルアーキテクチャの有効性が示された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:10:07 GMT)
GUI-Robust: A Comprehensive Dataset for Testing GUI Agent Robustness in Real-World Anomalies [34.6] 本稿ではGUIエージェント評価のための新しいデータセットであるGUI-Robustを紹介する。
また、RPAツールを介して自然なインタラクションからユーザアクションシーケンスを収集する半自動データセット構築パラダイムを提案する。
このパラダイムは、アノテーションの時間コストを19倍以上削減します。
GUI-Robustデータセットを用いて最先端のGUIエージェントを評価し,異常なシナリオにおける性能劣化を明らかにした。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:50:35 GMT)
OS-Harm: A Benchmark for Measuring Safety of Computer Use Agents [34.4] コンピュータ使用エージェントの安全性を計測する新しいベンチマークであるOS-Harmを紹介する。
OS-HarmはOSWorld環境上に構築されており、故意のユーザ誤用、インジェクション攻撃、モデル誤動作の3つのカテゴリでモデルをテストすることを目指している。
我々は、フロンティアモデルに基づいてコンピュータ利用エージェントを評価し、その安全性に関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:59:31 GMT)
IP Leakage Attacks Targeting LLM-Based Multi-Agent Systems [34.2] マルチエージェントシステム(MAS)から機密情報を抽出する新しい攻撃フレームワークMASLEAKを紹介する。
MASLEAKは実用的でブラックボックスの設定を目標としており、敵はMASアーキテクチャやエージェント設定について事前の知識を持っていない。
810個のアプリケーションを用いたMASアプリケーションの最初の合成データセットを構築し、CozeやCrewAIを含む実世界のMASアプリケーションに対してMASLEAKを評価する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:37:58 GMT)
Hanfu-Bench: A Multimodal Benchmark on Cross-Temporal Cultural Understanding and Transcreation [34.2] Hanfu-Benchは、専門家による新しいマルチモーダルデータセットである。
文化的な視覚的理解と文化的なイメージの再現という2つの中心的な課題から構成される。
我々の評価では, 閉鎖型VLMは視覚的カットラル理解の非専門家と同等に機能するが, 人間の専門家では10%弱に低下する。
トランスクリエーション作業では,多面的評価により,最高の性能モデルがわずか42%の成功率を達成したことが示唆された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:37:58 GMT)
Thinking in Directivity: Speech Large Language Model for Multi-Talker Directional Speech Recognition [34.1] 指向性SpeechLlamaは、指向性音声認識を実現するために、スマートグラスのマイクロホンアレイを活用する新しいアプローチである。
実験結果から,提案した指向性SpeechLlamaはテキストキューと空間音声の関係を効果的に捉えることができることがわかった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:49:41 GMT)
GrFormer: A Novel Transformer on Grassmann Manifold for Infrared and Visible Image Fusion [33.9] 赤外線および可視光融合のためのグラスマン多様体に基づく新しいアテンション機構を提案する。
提案手法はグラスマン多様体上の射影制約を通した低ランク部分空間写像を構成する。
これにより、特徴を高周波詳細(局所低ランク)と低周波数意味論(グローバル低ランク)に分離せざるを得ない。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:32:05 GMT)
VideoMAR: Autoregressive Video Generatio with Continuous Tokens [33.9] マスケベースの自己回帰モデルでは、連続空間における有望な画像生成能力が実証されている。
連続トークンを用いたデコーダのみの自己回帰画像-ビデオモデルである textbfVideoMAR を提案する。
VideoMARは以前の最先端(Cosmos I2V)よりはるかに少ないパラメータを必要とする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:08:18 GMT)
SynGraph: A Dynamic Graph-LLM Synthesis Framework for Sparse Streaming User Sentiment Modeling [33.7] eコマースプラットフォームのユーザレビューは、時間的および文脈的要因によって引き起こされる動的な感情パターンを示す。
従来の感情分析手法は、ユーザの感情評価とテキストコンテンツの間の時間的関係を捉えるのに失敗する。
本稿では,ストリーミングレビューにおける感情分析におけるデータの空間性に対処する新しいフレームワークであるSynGraphを紹介する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:22:43 GMT)
Improving Practical Aspects of End-to-End Multi-Talker Speech Recognition for Online and Offline Scenarios [33.3] Serialized Output Training (SOT)は、ストリーミングおよびオフライン自動音声認識(ASR)アプリケーションの両方の実用的なニーズに対処する。
我々のアプローチは、レイテンシと精度のバランス、リアルタイムキャプションと要約要求への対応に焦点を当てている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:46:38 GMT)
Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs [33.0] RLVR(Reinforcement Learning with Verifiable Rewards)は,Large Language Models(LLM)の推論能力向上のための,有望なパラダイムとして登場した。
しかしながら、RLVRで調整されたモデルは、ソリューションフィリングのための$Pass@K$メトリックでベースモデルよりもパフォーマンスが低いことが多い。
より正確な評価基準である$CoT$-$Pass@K$を導入する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:06:56 GMT)
Supporting the development of Machine Learning for fundamental science in a federated Cloud with the AI_INFN platform [32.7] 機械学習(ML)は、科学者がデータ集約型ソフトウェアを設計、開発、デプロイする方法に革命をもたらしている。
MLの採用は、特に開発、テスト、運用のためのハードウェアアクセラレータへのアクセスのプロビジョニングとオーケストレーションに関して、コンピューティングインフラストラクチャに対する新たな課題を提示している。
INFNが出資するプロジェクトであるAI_INFN("Artificial Intelligence at INFN")は、AIネイティブコンピューティングリソースの提供を含む複数の側面のサポートを提供することで、INFNユースケースにおけるMLテクニックの採用を促進することを目的としている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:23:33 GMT)
Correlation-Aware Graph Convolutional Networks for Multi-Label Node Classification [32.5] マルチラベルノード分類のための相関対応グラフ畳み込みネットワーク(CorGCN)を提案する。
CorGCNは新しい相関対応グラフ分解モジュールを導入することで、ラベルごとにリッチなラベル関連情報を含むグラフを学習できる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:43:42 GMT)
Can Vision Language Models Understand Mimed Actions? [32.3] 我々は、視覚言語モデルにとって、緩和行動のしっかりとした理解が重要な前提であると論じている。
そこで本研究では,86件の緩和行動からなるビデオベースの質問応答ベンチマークを提案する。
オープンウェイトモデルとAPIベースのビジョン言語モデルの両方が、MIME上で人間よりも大幅にパフォーマンスが低下していることが分かりました。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:37:42 GMT)
Generalizing to New Dynamical Systems via Frequency Domain Adaptation [30.9] パラメータ効率のよいFNSDA(Fourier Neural Simulator for Dynamical Adaptation)を定式化した。
FNSDAは、Fourierモードの自動パーティションを使用して、既知の環境に基づいて共有可能なダイナミクスを特定する。
本研究は,動的システムの4つの代表的なファミリーに対するアプローチを評価した結果,FNSDAがより優れた,あるいは競争的な一般化性能を達成できることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:11:34 GMT)
FocalClick-XL: Towards Unified and High-quality Interactive Segmentation [30.8] 本稿では,FocalClickの古典的粗大な設計を再考する。
マルチステージ戦略にヒントを得て,新しいパイプラインFocalClick-XLを提案する。
微細な詳細でアルファマットを予測することができ、インタラクティブなセグメンテーションのための汎用的で強力なツールとなる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:21:32 GMT)
AgentOrchestra: A Hierarchical Multi-Agent Framework for General-Purpose Task Solving [30.5] Projectnameは汎用タスク解決のための階層的なマルチエージェントフレームワークである。
Projectnameは、複雑な目的を分解し、サブタスクを専門エージェントのチームに委譲する中央計画エージェントを特徴とする。
各サブエージェントは、汎用プログラミングおよび分析ツールと、幅広い現実世界固有のタスクに取り組む能力を備えている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:08:27 GMT)
MAGELLAN: Metacognitive predictions of learning progress guide autotelic LLM agents in large goal spaces [30.2] オープンエンド学習エージェントは、広大な可能性空間における目標を効率的に優先順位付けする必要がある。
従来のアプローチでは、広範なサンプリングを必要とするか、不安定な専門家定義の目標グループ化に依存している。
LLMエージェントがオンライン上で能力とLPを予測することを学習するメタ認知フレームワークであるMAGELLANを紹介した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:23:02 GMT)
ONEBench to Test Them All: Sample-Level Benchmarking Over Open-Ended Capabilities [30.1] 従来の固定テストセットは、ファンデーションモデルのオープンな機能を評価するのに不足しています。
ONEBenchは、個々の評価データセットを統一し、拡張し続けるサンプルプールに統合する新しいテストパラダイムである。
ONEBenchは、テストセットにまたがってサンプルを集約することにより、オリジナルのテストセットでカバーされたもの以上の多様な機能の評価を可能にする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:57:52 GMT)
Prefix-Tuning+: Modernizing Prefix-Tuning by Decoupling the Prefix from Attention [29.8] 本稿では,Prefix-Tuningの原理を一般化した新しいアーキテクチャであるPrefix-Tuning+を紹介し,その欠点に対処する。
我々の実験は、様々なベンチマークでPrefix-Tuning+が既存のPrefix-Tuningメソッドより一貫して優れていることを示した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:25:25 GMT)
AMPLIFY: Actionless Motion Priors for Robot Learning from Videos [29.8] AMPLIFYは,大規模ビデオデータを活用する新しいフレームワークである。
我々は、豊富なアクションフリービデオでフォワードダイナミクスモデルを訓練し、限られたアクションラベル付き例で逆ダイナミクスモデルを訓練する。
下流の政策学習において、我々のダイナミクス予測は、低データのレシエーションにおいて1.2-2.2倍の改善を実現し、アクションフリーなヒューマンビデオから学ぶことで平均1.4倍の改善を実現し、非配布アクションデータからLIBEROタスクへの第1次一般化を可能にした。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:31:42 GMT)
A 2x2 quantum dot array in silicon with fully tuneable pairwise interdot coupling [29.5] 本報告では, 隣接するすべての点間の相互結合が可変な2次元シリコン金属酸化物半導体(MOS)量子ドットについて述べる。
この装置は4.2Kで特徴付けられ、二重ドットと三重ドットの構成の形成と分離を実証する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:16:07 GMT)
MoORE: SVD-based Model MoE-ization for Conflict- and Oblivion-Resistant Multi-Task Adaptation [29.2] マルチタスクシナリオにおける大規模な基盤モデルの適用は、多くの場合、タスクの衝突や障害に悩まされる。
本稿では,「モデルMOE-ization」戦略を新たに提案し,コンフリクトとオブリビションに抵抗するマルチタスク適応手法を提案する。
様々なデータセットの実験により、MoOREは既存のマルチタスク適応手法を一貫して上回ることを示した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:55:08 GMT)
Knowledge Bridger: Towards Training-free Missing Modality Completion [29.1] 「知識ブリッジ」はモダリティに依存しないものであり、欠落したモダリティの生成とランキングを統合している。
一般領域と医療領域をまたいだ実験結果から,本手法は競合する手法よりも一貫して優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:56:41 GMT)
Heavy-Tailed Diffusion with Denoising Lévy Probabilistic Models [28.9] 近年の研究では、$alpha$-stableのような重み付きノイズ分布がモード崩壊に対処する可能性が示唆されている。
本稿では,ガウス雑音を$alpha$stable雑音に置き換えることで拡散確率モデル(DDPM)を拡張する。
実験により,データ分散テールのカバレッジの向上,非バランスなデータセットに対する堅牢性の向上,計算時間の改善が示された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:21:55 GMT)
Less is More: Undertraining Experts Improves Model Upcycling [28.8] 専門的な微調整がモデルアップサイクルにどのように影響するかを示す。
この劣化は、いくつかの難しい例の記憶にさかのぼる。
タスク依存型アグレッシブ・アーリー・ストップ・ストラテジーは,アップサイクリング性能を著しく向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:42:10 GMT)
Exploring Linear Attention Alternative for Single Image Super-Resolution [28.3] ディープラーニングベースのシングルイメージ超解像(SISR)技術は、低解像度(LR)画像を高解像度(HR)画像に拡張することに焦点を当てている。
本稿では,Receptance Weighted Key Value (RWKV) アーキテクチャと特徴抽出技術を組み合わせた新しい手法を提案する。
MambaIRモデルと比較すると,PSNRでは0.26%,SSIMでは0.16%の平均的な改善が得られた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:27:17 GMT)
A Survey of Mamba [27.9] 近年,基礎モデル構築の代替手段として,Mambaという新しいアーキテクチャが登場している。
本研究では,マンバモデルの発展,多様なデータにマンバを適応させる技術,およびマンバが優れている応用について検討する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:27:55 GMT)
Agent Laboratory: Using LLM Agents as Research Assistants [27.9] Agent Laboratoryは、研究プロセス全体を完了できる自律的なフレームワークである。
人間が提案する研究アイデアを受け入れ、文学的レビュー、実験、レポート作成という3つの段階を進む。
エージェント・ラボラトリーは研究費を大幅に削減し、従来の自律的な研究方法に比べて84%の削減を実現している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:19:14 GMT)
Tile Classification Based Viewport Prediction with Multi-modal Fusion Transformer [27.9] ビューポート予測はタイルベースの360度ビデオストリーミングシステムにおいて重要な側面である。
マルチモーダルフュージョン変換器(MFTR)を用いたタイル分類に基づくビューポート予測手法を提案する。
提案したMFTRを評価するために,広く利用されている2つのPVS-HMとXu-Gazeデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:46:08 GMT)
Recognition through Reasoning: Reinforcing Image Geo-localization with Large Vision-Language Models [27.8] 新しいパイプラインは、さまざまなソーシャルメディアイメージを使用して推論指向のジオローカライゼーションデータセットMP16-Reasonを構築する。
そこで我々はGLOBE, グループ関連ポリシー最適化, 可視性評価, ビジュアル・キュー推論の最適化について紹介する。
その結果,GLOBEはジオローカライゼーションタスクにおいて,最先端のオープンソースLVLMよりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:07:58 GMT)
MEAL: A Benchmark for Continual Multi-Agent Reinforcement Learning [27.7] 連続型マルチエージェント強化学習(CMARL)に適した最初のベンチマークであるMEALを紹介する。
既存のCLベンチマークはCPU上で環境を実行するため、計算上のボトルネックが発生し、タスクシーケンスの長さが制限される。
MEALは、JAXをGPUアクセラレーションに利用し、標準デスクトップPC上の100タスクのシーケンスを数時間で連続的に学習することを可能にする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:50:04 GMT)
Automated Decision-Making on Networks with LLMs through Knowledge-Guided Evolution [27.2] 大規模言語モデルを用いてグラフニューラルネットワーク(GNN)を自動設計する方法を示す。
本システムでは,グラフ関連ノウベースを構築し,検索・拡張生成を利用するエージェントの集合を開発する。
これらのエージェントは専門知識ベースを備えており、知識ベースと対話することでタスクやグラフ構造に関する洞察を抽出する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:53:48 GMT)
Image Corruption-Inspired Membership Inference Attacks against Large Vision-Language Models [27.0] 大規模視覚言語モデル(LVLM)は多くの下流タスクにおいて優れた性能を示した。
画像がLVLMのトレーニングに使用されるかどうかを検出することが重要である。
最近の研究は、LVLMに対するMIA(メンバシップ推論攻撃)について研究している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:52:16 GMT)
VIDEE: Visual and Interactive Decomposition, Execution, and Evaluation of Text Analytics with Intelligent Agents [27.0] VIDEEは、インテリジェントエージェントによる高度なテキスト分析を行うための、エントリーレベルのデータアナリストをサポートするシステムである。
VIDEEの有効性を評価するための2つの定量的実験を行い、一般的なエージェントエラーを分析した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:24:58 GMT)
OpsEval: A Comprehensive IT Operations Benchmark Suite for Large Language Models [26.6] 大規模言語モデル(LLM)用に設計された総合的なタスク指向のOpsベンチマークであるOpsEvalを提示する。
このベンチマークには、英語と中国語で7184の質問と1736の質問回答(QA)形式が含まれている。
評価の信頼性を確保するため、何十人ものドメインエキスパートを招待して、質問を手動でレビューします。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:53:20 GMT)
ShortcutProbe: Probing Prediction Shortcuts for Learning Robust Models [26.5] ディープラーニングモデルは、必然的にターゲットと非本質的な特徴の間の急激な相関を学習する。
本稿では,グループラベルを必要とせず,新たなポストホックスプリアスバイアス緩和フレームワークを提案する。
我々のフレームワークであるShortcutProbeは、与えられたモデルの潜在空間における予測の非破壊性を反映した予測ショートカットを識別する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:14:20 GMT)
Improving Group Robustness on Spurious Correlation via Evidential Alignment [26.5] ディープニューラルネットワークは、しばしば急激な相関、すなわち非因果的特徴と標的の間の表面的関連を学習し、依存する。
既存のメソッドは通常、外部のグループアノテーションや補助的な決定論的モデルを使用することでこの問題を軽減する。
偏りのあるモデルの振る舞いを理解するために不確実性定量化を利用する新しいフレームワークであるエビデンシャルアライメントを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:55:20 GMT)
Excessive Reasoning Attack on Reasoning LLMs [26.5] 本研究では,過度な推論行動を活用するために,敵対的入力を作成できるという,新たな脅威を明らかにする。
提案手法は,実用性能に匹敵する推理長を3倍から9倍に向上することを示した。
提案手法は,o3-mini,o1-mini,DeepSeek-R1,QWQモデルで計算オーバーヘッドを誘導するトランスファービリティを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:16:52 GMT)
The Cell Ontology in the age of single-cell omics [26.5] 単細胞オミクス技術は、個々の細胞の高分解能なプロファイリングを可能にすることによって、細胞多様性の理解を変えてきた。
Cell Ontology (CL)は、FAIR(Findable, Accessible, Interoperable, Reusable)データ原則を達成するための重要なリソースとして登場した。
プラットフォームやツールにおけるCLの多種多様な利用について述べ、CLコンテンツの改善と拡張に向けた進行中の作業について詳述する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:13:31 GMT)
From What to Respond to When to Respond: Timely Response Generation for Open-domain Dialogue Agents [26.4] TimelyChatベンチマークは、適切な時間間隔を予測し、時間条件の応答を生成する言語モデルの能力を評価する。
我々は,時間的コモンセンス知識グラフからラベルのないイベント知識を活用することで,大規模トレーニングデータセットを構築した。
次に、タイムインターバルを積極的に予測し、それらのインターバルに合わせてタイムリーなレスポンスを生成するために設計された対話エージェントであるTimerを訓練する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:56:32 GMT)
Incentivizing Reasoning for Advanced Instruction-Following of Large Language Models [26.4] CoT(Chain-of- Thought)は、大規模言語モデル(LLM)の能力を普遍的に改善することが期待される。
テスト時間計算のスケーリングに対する推論をインセンティブ化することで,複雑な命令処理におけるLLMの強化手法を提案する。
我々は,ルール中心の報酬信号が検証可能な強化学習を利用して,特に指示に従うための推論を育成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:52:06 GMT)
ImmerseGen: Agent-Guided Immersive World Generation with Alpha-Textured Proxies [26.0] 本稿では,VRシーンのコンパクト・ワールドコンディションのためのエージェント誘導フレームワークWeImmerseGenについて述べる。
I.A.A.と。
A.A.はi.A.のV.L.LM.LM.M.L.M.L.M.L.M.L.M.L.M.L.M.L.L.M.L.L.M.L.L.M.L.L.M.L.L.M.L.M.L.M.L.L.M.L.M.L.M.L.L.M.L.M.L. L.M.M.L.L.M.L.M.M.M.L.L.M.M.L.M.M.M.L.M.M.L.M.M.M.M.L.M.M.M.M.M.M.L.L.L.M.M.M.L.L.L.L.L.M.M.M.L.M.M. L.M.L.L.M.L.L.M.L.M.L.M.L.M.L.L.M.M.L.M.L.M.L.L.M.M.L.L.L.M.L.M.L.M.L.L
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:50:05 GMT)
HRGS: Hierarchical Gaussian Splatting for Memory-Efficient High-Resolution 3D Reconstruction [26.0] 3D Gaussian Splatting (3DGS)はリアルタイムの3Dシーン再構成において大きな進歩を遂げているが、高解像度シナリオではメモリスケーラビリティの問題に直面している。
本稿では,階層ブロックレベルの最適化を行うメモリ効率の高いフレームワークである階層ガウススティング(HRGS)を提案する。
メモリ制約下であっても,高品質で高解像度な3Dシーン再構成が可能となる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:35:38 GMT)
Chaining Event Spans for Temporal Relation Grounding [25.7] 本稿では,2段階の帰納的推論プロセスで動作するタイムライン推論ネットワーク(TRN)について紹介する。
最初のステップモデルでは、まず各質問に意味情報と統語的情報で答える。
次のステップでは、同じイベント上で複数の質問をチェーンしてタイムラインを予測する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:06:01 GMT)
H$^3$DP: Triply-Hierarchical Diffusion Policy for Visuomotor Learning [25.7] 我々は,視覚的特徴と行動生成の統合を強化するために,階層構造を明示的に組み込んだ新しいビジュモータ学習フレームワークである$textbfTriply-Hierarchical Diffusion Policy(textbfH$mathbf3$DP)を紹介した。
大規模な実験では、H$3$DPは$mathbf+27.5%の平均相対的な改善を$mathbf44$のシミュレーションタスクで達成し、$mathbf4$の挑戦的な実世界の操作タスクで優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:36:51 GMT)
I Speak and You Find: Robust 3D Visual Grounding with Noisy and Ambiguous Speech Inputs [25.6] SpeechReferは、3DVGフレームワークで、ノイズや曖昧な音声からテキストへの書き起こしの存在下での性能を高めるように設計されている。
まず,音声関連語間の音響的類似性を抽出する。
第二に、Contrastive Complementary Moduleは、間違ったテキスト特徴と対応する音声特徴とを一致させるために、対照的な学習を採用する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:17:31 GMT)
Optimal Convergence Rates of Deep Neural Network Classifiers [25.6] Tsybakovノイズ条件下での2値分類問題を$[0,1]d$で検討する。
分類器の過大な0-1リスクに対する最適収束率は$$ left ( frac1n right)fracbetacdot (1wedgebeta)qfracd_*s+1+ (1+frac1s+1)cdotbetacdot (1wedgebeta)q;
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:13:09 GMT)
SyncTalk++: High-Fidelity and Efficient Synchronized Talking Heads Synthesis Using Gaussian Splatting [25.5] ライフライクな話しの頭は、主題のアイデンティティ、唇の動き、表情、頭ポーズを同期的に調整する必要がある。
そこで我々はSyncTalk++を導入し,現実的な発話ヘッド生成において,'devil'として認識される同期の重要な問題に対処する。
提案手法は、フレーム間の視覚的詳細性の一貫性と連続性を維持し、レンダリング速度と品質を大幅に改善し、毎秒101フレームを実現している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:22:12 GMT)
Evaluation Should Not Ignore Variation: On the Impact of Reference Set Choice on Summarization Metrics [25.4] 本研究は,参照セットの選択に関して,広く使用されている参照ベースメトリクスの感度について検討する。
多くの一般的な指標が大きな不安定性を示していることを実証する。
この不安定性は、参照セットによってモデルランキングが異なるROUGEのようなn-gramベースのメトリクスに特に関係している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:17:41 GMT)
Delving into Instance-Dependent Label Noise in Graph Data: A Comprehensive Study and Benchmark [25.4] グラフニューラルネットワーク(GNN)はノード分類タスクでは最先端のパフォーマンスを達成したが、実世界のデータではラベルノイズに悩まされている。
BeGINは、様々なノイズタイプでリアルなグラフデータセットを提供する新しいベンチマークである。
ノイズ処理戦略を包括的に評価することにより、BeGINは、その効果、効率、および重要なパフォーマンス要因に関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:17:11 GMT)
Compressed Video Super-Resolution based on Hierarchical Encoding [24.9] VSR-HEは低解像度ビデオを180pから720p、または270pから1080pの比でアップスケールする。
提案されたVSR-HEは、ビデオ会議のためのVSRに関するICME 2025グランドチャレンジに公式に提出された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:26:07 GMT)
Dense360: Dense Understanding from Omnidirectional Panoramas [24.9] 信頼性に配慮したアノテーションを網羅した全方位パノラマデータセットを提案する。
具体的には,160Kパノラマと5Mのエンティティレベルキャプション,1Mのユニークな参照表現,100Kのエンティティグラウンドのパノラマシーン記述を含む。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:35:23 GMT)
SKOLR: Structured Koopman Operator Linear RNN for Time-Series Forecasting [24.7] 我々は、クープマン演算子近似と線形リカレントニューラルネットワーク(RNN)の接続を確立する。
本稿では、入力信号の学習可能なスペクトル分解を計測関数として多層パーセプトロン(MLP)と統合するSKOLRを提案する。
様々な予測ベンチマークと力学系に関する数値実験により、この合理化されたクープマン理論に基づく設計は例外的な性能をもたらすことが示された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:11:06 GMT)
Counterfactual-Consistency Prompting for Relative Temporal Understanding in Large Language Models [24.6] 本稿では, 大規模言語モデル(LLM)における時間的不整合の問題に対処し, 新たな対実的プロンプト手法を提案する。
提案手法は, 対実的な質問を生成し, 集合的制約を強制し, モデルの一貫性を高める。
提案手法を複数のデータセット上で評価し、明示的で暗黙的なイベントのイベント順序付けと時間的コモンセンス理解の大幅な改善を実証した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:34:15 GMT)
LexiMark: Robust Watermarking via Lexical Substitutions to Enhance Membership Verification of an LLM's Textual Training Data [24.3] LexiMarkは、テキストとドキュメント用に設計された新しい透かし技術である。
慎重に選択された高エントロピー語に対する同義語置換を組み込む。
微妙で、文脈的に適切な置換のために除去に抵抗する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:41:53 GMT)
ImpReSS: Implicit Recommender System for Support Conversations [24.3] ImpReSSは、顧客サポート会話用に設計された暗黙のレコメンデーションシステムである。
従来のCRSとは異なり、ImpReSSは完全に暗黙的に機能し、ユーザの購入意図の仮定に依存しない。
ImpReSSのSPC推奨能力に関する実証的評価は有望な結果である。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:38:46 GMT)
Modality-Aware Neuron Pruning for Unlearning in Multimodal Large Language Models [24.3] 大規模なデータセットでトレーニングされたLarge Language Models(LLM)やMultimodal Large Language Models(MLLM)のような生成モデルは、機密情報を記憶し、不注意に明らかにし、倫理的およびプライバシー上の懸念を提起する。
本研究では,MLLM のための新しい学習フレームワークである Modality Aware Neuron Unlearning (MANU) を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:29:03 GMT)
Scaling-Up the Pretraining of the Earth Observation Foundation Model PhilEO to the MajorTOM Dataset [24.2] 最近提案したEOファンデーションモデルであるPhilEO Geo-Aware U-Netのスケールアップについて,ラベルなし23TBデータセットMajorTOMで紹介する。
道路密度推定, 画素単位の回帰, 土地被覆セマンティックセマンティックセグメンテーションのためのPhilEO Benchのモデルを微調整する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:58:08 GMT)
Which Humans? Inclusivity and Representation in Human-Centered AI [24.2] AIシステムが社会の多くの側面に浸透し、統合されていくにつれ、「人間中心型AI」という概念が有名になってきている。
このことは、人間がどのAIシステムに集中すべきかという批判的な疑問を提起する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:12:43 GMT)
Expectation Confirmation Preference Optimization for Multi-Turn Conversational Recommendation Agent [24.1] 本稿では,新しいマルチターン優先最適化パラダイムECPOを提案する。
我々は,ECPOがCRAの相互作用能力を大幅に向上させ,既存のMTPO法よりも効率と有効性を両立させることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:29:04 GMT)
Meta-SurDiff: Classification Diffusion Model Optimized by Meta Learning is Reliable for Online Surgical Phase Recognition [24.1] オンライン外科的位相認識のためのメタラーニング最適化分類拡散モデル(Meta-SurDiff)を提案する。
不均衡な位相分布に起因する粗い認識のために、メタラーニングに基づく目的を用いて拡散モデルを学習する。
広く使用されている5つのデータセットに対する広範囲な実験を通じて,オンライン外科的位相認識におけるMeta-SurDiffの有効性を確立した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:48:59 GMT)
BS-LDM: Effective Bone Suppression in High-Resolution Chest X-Ray Images with Conditional Latent Diffusion Models [23.8] 肺疾患は、Chest X-Ray(CXR)が重要な診断ツールであると共に、重要な世界的な健康上の課題である。
肺病変の検出は、しばしばCXR画像の重なり合う骨構造によって妨げられ、潜在的な誤診につながる。
我々は,高解像度CXR画像の骨を効果的に抑制するために,BS-LDMと呼ばれるエンドツーエンドのフレームワークを開発した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:26:03 GMT)
Discrete JEPA: Learning Discrete Token Representations without Reconstruction [23.6] 認知知性の象徴的な基礎は、観測から隠れたパターンを抽出することにある。
本稿では,意味的トークン化による潜在予測符号化フレームワークであるDisdisrete-JEPAを提案する。
我々のアプローチは、人工知能システムにおける世界モデリングと計画能力の進歩に大きな影響を与えることを約束する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:15:17 GMT)
YOLOv11-RGBT: Towards a Comprehensive Single-Stage Multispectral Object Detection Framework [23.6] YOLOv11-RGBTは,新しい総合的マルチモーダルオブジェクト検出フレームワークである。
我々は6つのマルチスペクトル融合モードを設計し、YOLOv3からYOLOv12、RT-DETRのモデルに適用した。
実験により,LLVIPやFLIRのような3つの主要なオープンソースマルチスペクトルオブジェクト検出データセットに優れたフレームワークが得られた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:37:00 GMT)
CLGNN: A Contrastive Learning-based GNN Model for Betweenness Centrality Prediction on Temporal Graphs [23.4] 時間的相互中心性(TBC)は、最適な時間的経路にノードが出現する頻度を測定する。
本稿では,スケーラブルでインダクティブな学習型グラフニューラルネットワーク(CLGNN)を提案する。
CLGNNは最先端の正確なTBC計算手法と比較して最大663.7$times$の高速化を実現している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:34:09 GMT)
Hard Contacts with Soft Gradients: Refining Differentiable Simulators for Learning and Control [23.1] 接触力は、ロボット力学の勾配に基づく最適化において大きな課題となる。
ペナルティに基づくシミュレータの接触計算を解析し,勾配誤差の原因を特定する。
本稿では,MuJoCo XLAとアダプティブ統合を組み合わせたDiffMJXを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:58:08 GMT)
Assessing the Reasoning Capabilities of LLMs in the context of Evidence-based Claim Verification [22.9] 証拠と組み合わせた主張を原子推論タイプに分解するフレームワークを提案する。
私たちはこのフレームワークを使用して、現実世界のクレームを取り入れた最初のクレーム検証ベンチマークであるRECVを作成します。
我々は、複数のプロンプト設定の下で、最先端のLLMを3つ評価する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:05:26 GMT)
Foundation Model Insights and a Multi-Model Approach for Superior Fine-Grained One-shot Subset Selection [22.7] ワンショットサブセットの選択は、ディープラーニングトレーニングコストを削減する効果的なツールとして機能する。
FMベースのサブセット選択は、多様なデータセットで従来のIEベースのメソッドより優れているか?
提案手法は,Oxford-IIIT Pet,Food-101,Caltech-UCSD Birds-200-2011などの細粒度データセットの最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:37:24 GMT)
GuideBench: Benchmarking Domain-Oriented Guideline Following for LLM Agents [22.4] 大規模言語モデル(LLM)は、ユーザ指示に従うことができ、現実世界のアプリケーションで決定を下すことができる自律エージェントとして広くデプロイされている。
GuideBench は LLM のパフォーマンスに対するガイドラインを評価するために設計されたベンチマークである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:55:16 GMT)
Mind the Inconspicuous: Revealing the Hidden Weakness in Aligned LLMs' Refusal Boundaries [22.2] 複数のシーケンス(eos)トークンを単に追加するだけで、コンテキストセグメンテーションと呼ばれる現象が発生します。
本稿では, eos トークンを付加することにより, BOOST ジェイルブレイク攻撃の簡単な方法を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:03:45 GMT)
Reimagining Target-Aware Molecular Generation through Retrieval-Enhanced Aligned Diffusion [22.2] Retrieval-Augmented GenerationとSE(3)-同変拡散モデルとを融合した最初のREADが導入された。
CBGBenchでは非常に競争力があり、最先端のジェネレーティブモデルやネイティブな足場を超越している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:09:11 GMT)
HiLight: A Hierarchical Reinforcement Learning Framework with Global Adversarial Guidance for Large-Scale Traffic Signal Control [22.2] HiLightは大規模信号制御のためのグローバルな逆方向誘導を備えた階層型強化学習フレームワークである。
合成および実世界のベンチマークでHiLightを評価し,交通条件の異なる大規模マンハッタンネットワークを構築した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:39:42 GMT)
Fabrication of airbridges with gradient exposure [22.2] 超伝導量子回路では、エアブリッジはコプラナー導波路回路の寄生スロットラインモードを除去するために重要である。
本稿では, 単層フォトレジストを用いた超電導エアブリッジの製作技術について述べる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:23:54 GMT)
Risk Estimation of Knee Osteoarthritis Progression via Predictive Multi-task Modelling from Efficient Diffusion Model using X-ray Images [22.1] 医療画像は早期発見と疾患モニタリングを可能にして膝関節症(OA)リスクを評価する上で重要な役割を担っている。
近年の機械学習手法は、医療画像を用いたリスク推定(病気の進行可能性予測)と予測モデル(現在のデータに基づく将来の成果予測)を改善している。
リスク推定のための将来の画像を生成する既存のアプローチは複雑で実用的ではない。
マルチタスク予測モデルを用いて膝OA進行のリスクを推定する新しい解釈可能な機械学習手法により,これらのギャップに対処する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:15:39 GMT)
LingoLoop Attack: Trapping MLLMs via Linguistic Context and State Entrapment into Endless Loops [22.0] 我々はLingoLoopを提案する。これはMLLMに過剰に冗長なシーケンスを生成するよう誘導する攻撃である。
トークンのPOSタグがEOSトークンを生成する可能性に強く影響していることが判明した。
隠れ状態の規模を制限し、永続的なループを生成するようモデルに促すジェネレーティブ・パス・プルーニング機構を導入する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:14:55 GMT)
M2BeamLLM: Multimodal Sensing-empowered mmWave Beam Prediction with Large Language Models [22.0] M2BeamLLMは、画像、レーダー、LiDAR、GPSを含むマルチモーダルセンサーデータを統合している。
その予測性能は、知覚モダリティの多様性の向上とともに一貫して改善される。
本研究は車両間通信(V2I)mmWaveにおける効率よくインテリジェントなビーム予測ソリューションを提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:58:36 GMT)
The Alternative Annotator Test for LLM-as-a-Judge: How to Statistically Justify Replacing Human Annotators with LLMs [22.0] LLM-as-an-judge」パラダイムは、人間が伝統的に行ってきたタスクにおいて、アノテータ、審査員、評価役としてLarge Language Models(LLM)を用いる。
研究結果や洞察を形成する上での役割にもかかわらず、LLMがヒトのアノテーターを置き換えることができるかどうかを判断するための標準的あるいは厳格な手順は存在しない。
LLMアノテーションの使用を正当化するために、アノテーション付きサンプルの控えめなサブセットだけを必要とする新しい統計手法である代替アノテーションテスト(alt-test)を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:38:16 GMT)
Intended Target Identification for Anomia Patients with Gradient-based Selective Augmentation [21.9] 言語モデル(LM)の有用性について検討した。
対象項目を患者の割礼から特定するには,長期的障害と誤診の2つの課題がある。
本稿では,意味的パラファシックな誤りからモデルをロバスト化し,勾配に基づく選択的拡張を伴う不明瞭な用語でモデルを強化することを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:44:55 GMT)
mFabric: An Efficient and Scalable Fabric for Mixture-of-Experts Training [21.5] Mixture-of-Expert (MoE) モデルは、Emphexperts という名前の異なるモデルをtoken ベースで選択的に活性化することで、従来のモデルより優れている。
このゲート計算は、事前に決められない動的通信を生成し、分散トレーニングプロセスの間、静電的な既存のGPUインターコネクトに挑戦する。
我々は,分散MoEトレーニングを取り入れたトポロジ再構成をアンロックする,mFabricと呼ばれる第一種システムを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:02:34 GMT)
Strategic Client Selection to Address Non-IIDness in HAPS-enabled FL Networks [21.4] 非IIDデータの悪影響を軽減するために,属性に基づく新たなクライアント選択手法を提案する。
シミュレーション結果は、FLモデルの精度と収束率を高めるために提案したクライアント選択戦略の有効性を裏付けるものである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:04:58 GMT)
On the Hardness of Bandit Learning [21.3] ベストアーム識別としても知られるバンディット学習の課題について検討する。
我々は、分類のためのPACフレームワークと同様に、包帯学習可能性の一般的な理論を模索する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:35:25 GMT)
New Paradigm for Integrated Sensing and Communication with Rydberg Atomic Receiver [21.3] RYDAR(RYDAR)は理論上、-174dBm/Hz以下の未認識の電気信号を検出できる。
RYDARをベースとしたISACの今後の応用は計画されており、民間と軍事の両方の目的において大きな可能性を示唆している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:42:09 GMT)
Distribution free M-estimation [21.2] 本稿では,このような仮定のない環境で凸M推定や最適化が解ける場合に特徴付ける。
我々は、おそらく意外なことに、最小化される損失のリプシッツ連続性が分布自由化には必要ないことを示した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:41:41 GMT)
Benchmarking Vision, Language, & Action Models in Procedurally Generated, Open Ended Action Environments [20.9] 視覚言語アクション(VLA)モデルは汎用ロボットシステムに向けた重要なステップである。
我々は,最先端VLMとVLAの一般化性能の評価と解析を目的としたベンチマークであるMultiNet v0.2を紹介する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:16:46 GMT)
Privacy Intelligence: A Survey on Image Privacy in Online Social Networks [20.8] 人気のOSNサービスによる最近の画像リークと個人写真の乱用は、OSN画像共有における個人のプライバシーの必要性を再考するきっかけとなった。
プライバシーに配慮したOSNイメージ共有のための、よりインテリジェントな環境が求められている。
我々はOSN画像のプライバシーの定義と分類、OSN画像共有のライフサイクルに基づいた高レベルのプライバシー分析フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:19:33 GMT)
Revisiting Chain-of-Thought Prompting: Zero-shot Can Be Stronger than Few-shot [20.6] In-Context Learning(ICL)は、大規模言語モデル(LLM)の重要な創発的能力である
近年の研究では、特に数学タスクにおける推論能力を高めるために、ICLを例に、Chain-of-Thought (CoT)を導入している。
Qwen2.5シリーズのような最近の強力なモデルでは、従来のCoTの例を付加してもZero-Shot CoTに比べて推論性能は向上しない。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:39:33 GMT)
Causally Steered Diffusion for Automated Video Counterfactual Generation [20.4] 視覚言語モデル(VLM)により導かれる対実映像生成のための因果的忠実な枠組みを提案する。
本手法は,基礎となる映像編集システムに非依存であり,内部機構や微調整モデルへのアクセスは不要である。
この結果から,LDMの学習分布において,因果的忠実な映像反事実を効果的に生成できることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:06:22 GMT)
Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents [20.1] 環境を視覚的に完全に認識し,GUI上でピクセルレベルの操作を直接実行する,GUIエージェントのためのヒューマンライクなエボディメントを提唱する。
これまでに10MのGUI要素と参照式を1.3Mのスクリーンショット上に収めた、GUIの視覚的接地のための最大のデータセットを収集しました。
ウェブベースの合成データとLLaVAアーキテクチャの若干の適応を含む簡単なレシピは、このような視覚的接地モデルのトレーニングに驚くほど効果的であることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:06:02 GMT)
Mini-Game Lifetime Value Prediction in WeChat [20.0] ライフタイムバリュー(LTV)予測は、特定のアイテムに対するユーザの累積購入コントリビューションを予測するための取り組みである。
登録ユーザーの購入率は0.1%と極めて低く、その結果、大多数のユーザーがわずか数回しか購入できないデータセットが作られる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:42:40 GMT)
Leader360V: The Large-scale, Real-world 360 Video Dataset for Multi-task Learning in Diverse Environment [19.7] Leader360Vは、インスタンスのセグメンテーションとトラッキングのための、最初の大規模なラベル付き実世界の360ビデオデータセットである。
私たちのデータセットは、屋内や都市環境から自然や動的な屋外のシーンまで、高いシーンの多様性を享受しています。
実験によると、Lead360Vは360度ビデオセグメンテーションとトラッキングのモデル性能を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:37:08 GMT)
Improved Convex Decomposition with Ensembling and Boolean Primitives [19.6] LAION画像のプリミティブ予測について検討した。
本稿では,(a)負のプリミティブを組み込んで,(b)正のプリミティブと負のプリミティブの総数を選択する方法を示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:49:59 GMT)
Vul-RAG: Enhancing LLM-based Vulnerability Detection via Knowledge-level RAG [19.4] Vul-RAGによって生成された脆弱性知識は、手動検出精度を向上させるための高品質な説明として機能する。
Vul-RAGはまた、最近のLinuxカーネルリリースで既知の10のバグを6つのアサインされたCVEで検出できる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:07:17 GMT)
Toward Safety-First Human-Like Decision Making for Autonomous Vehicles in Time-Varying Traffic Flow [19.4] このフレームワークは、他の道路利用者の意図推論のための空間的注意(S-TA)機構、行動規制のための社会的コンプライアンス推定モジュール、Deep Evolutionary Reinforcement Learning(DERL)モデルを統合する。
SF-HLDMフレームワークは、自律運転AIエージェントが決定パラメータを動的に調整し、安全マージンを維持し、文脈的に適切な運転行動に固執することを可能にする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:28:19 GMT)
Markov Regime-Switching Intelligent Driver Model for Interpretable Car-Following Behavior [19.2] 我々は、運転動作を異なるIDMパラメータセットで制御できるレギュラースイッチングフレームワークを導入する。
IDM力学を用いたファクショナル隠れマルコフモデルを用いてフレームワークをインスタンス化する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:55:42 GMT)
Exploring news intent and its application: A theory-driven approach [19.1] 本稿では、意図的行動に関する学際的研究をレビューし、概念的デコンストラクションに基づくニュース意図理解フレームワーク(NINT)を紹介する。
NINTはインテントのコンポーネントを特定し、ニュースインテントとそのアプリケーションの構造的表現を促進する。
我々は、新たな意図認識データセットを提供し、ニュース関連タスクにおける意図支援の可能性について検討する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:06:03 GMT)
Tunable Hybrid-Mode Coupler Enabling Strong Interactions between Transmons at Centimeter-Scale Distance [18.7] 2つの低周波モードを同時に設計するために共振器-トランモンハイブリッド化を利用したハイブリッドモードカプラを導入する。
1cmのカップラの場合、このフレームワークはフラックス調整可能な$XX$と$ZZ$の結合強度を23MHzと100MHzに予測する。
この研究は、短距離相互作用によって課される固有の接続制約を緩和する効率的な経路を提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:45:16 GMT)
From Street Views to Urban Science: Discovering Road Safety Factors with Multimodal Large Language Models [18.7] 都市・交通研究は長い間、重要な変数と道路安全のような社会的結果の間の統計的に意味のある関係を明らかにすることを模索してきた。
解釈可能な仮説推論のためのマルチモーダル大言語モデル(MLLM)に基づくアプローチを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:05:02 GMT)
Unified Representation Space for 3D Visual Grounding [18.7] 3Dビジュアルグラウンドは、テキスト記述に基づいて3Dシーン内のオブジェクトを識別することを目的としている。
既存の方法は、個別に訓練された視覚とテキストエンコーダに依存しており、2つのモードの間に大きなギャップがある。
本稿では,3DVGの統一表現空間を革新的に導入するUniSpace-3Dを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:53:15 GMT)
Cost-Aware Routing for Efficient Text-To-Image Generation [18.6] 本稿では,その複雑さに応じて,各プロンプト毎に計算量を変動させるフレームワークを提案する。
私たちは、COCOとDiffusionDBで、すでに訓練された9つのテキスト・ツー・イメージモデルへのルートを学ぶことで、これらのモデルだけで達成可能な平均品質を提供することができることを実証的に示しています。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:48:50 GMT)
How Far Can LLMs Improve from Experience? Measuring Test-Time Learning Ability in LLMs with Human Comparison [18.6] 我々は、テスト時間における経験に基づく、推論集約的なタスクのパフォーマンス向上能力であるテストタイム学習の評価を提唱する。
モデル性能を限定的および累積的な経験条件下で比較し、4種類の経験表現を含む客観的評価フレームワークを提案する。
以上の結果から,LSMは測定可能なテスト時間学習能力を示すが,累積的な経験下では改善は安定せず,人間よりも進行が遅いことが示唆された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:13:56 GMT)
ClearDepth: Enhanced Stereo Perception of Transparent Objects for Robotic Manipulation [18.1] 我々は透明物体の立体深度回復のための視覚変換器に基づくアルゴリズムを開発した。
提案手法は,効率的なデータ生成のためのパラメータ整合,ドメイン適応,物理的に現実的なSim2Realシミュレーションを含む。
実世界のシナリオにおけるSim2Realの例外的な一般化性を示す実験結果を得た。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:03:01 GMT)
Situational-Constrained Sequential Resources Allocation via Reinforcement Learning [17.8] 状況制約を伴う逐次資源配分は、現実世界のアプリケーションにおいて大きな課題となる。
本稿では,この問題に対処するための新しいフレームワークであるSCRLを紹介する。
我々は制約違反を動的に罰する新しいアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:40:49 GMT)
EVA02-AT: Egocentric Video-Language Understanding with Spatial-Temporal Rotary Positional Embeddings and Symmetric Optimization [17.6] EVA02-ATは、エゴセントリックなビデオ理解タスクに適した、EVA02ベースのビデオ言語基盤モデルのスイートである。
EVA02-ATは、画像ベースのCLIPモデルをシングルステージプレトレーニングを介して、統一ビデオエンコーダに効率的に転送する。
我々は,Symmetric Multi-Similarity(SMS)損失と,正と負のペアに対してすべてのソフトラベルを前進させる新しいトレーニングフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:51:51 GMT)
Decoupled Classifier-Free Guidance for Counterfactual Diffusion Models [17.4] Decoupled-Free Guidance(DCFG)は、グループワイドコンディショニング制御を導入したフレキシブルでモデルに依存しないフレームワークである。
DCFGは、セマンティックインプットをアンタングルする属性分割埋め込み戦略に基づいて構築されており、ユーザ定義の属性グループに対する選択的ガイダンスを可能にする。
CelebA-HQ、MIMIC-CXR、EMBEDの実験では、DCFGは介入の忠実度を改善し、意図しない変化を緩和し、可逆性を高める。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:56:09 GMT)
From Black Boxes to Transparent Minds: Evaluating and Enhancing the Theory of Mind in Multimodal Large Language Models [17.2] 本研究では,大言語モデル(MLLM)における心の理論(ToM)の解釈可能性に基づく評価を実現するための内部メカニズムに基づくアプローチを採用する。
まず,マルチモーダルなToMテストデータセットであるGridToMを構築した。
次に,マルチモーダル大モデルにおける注目の頭脳は,視点によって認知情報を識別し,ToM能力の証拠となることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:27:42 GMT)
LoRA-Mixer: Coordinate Modular LoRA Experts Through Serial Attention Routing [17.2] LoRA-Mixerはモジュール式で軽量なMoEフレームワークであり、LoRAの専門家を統合している。
私たちの中心となるイノベーションは、アテンションモジュールの入出力線形レイヤのプロジェクション行列をタスク固有のLoRA専門家に置き換えることです。
LoRA-Mixerは、GSM8K、HumanEval、MedQAといったデータセットの大幅な改善を実現している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:58:54 GMT)
Checkmating One, by Using Many: Combining Mixture of Experts with MCTS to Improve in Chess [17.1] ゲームフェーズに基づいて戦略を動的に適応するモジュール型フレームワークであるM2CTSを紹介する。
各フェーズでトレーニングされた特殊なニューラルネットワークを通じて決定をルーティングすることで、M2CTSは計算効率と演奏強度の両方を改善する。
チェスの実験では、M2CTSは標準の単一モデルベースラインよりも最大+122 Eloを達成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:05:12 GMT)
DepthSeg: Depth prompting in remote sensing semantic segmentation [16.9] 本稿では,2次元リモートセマンティックセマンティックセグメンテーションフレームワーク(DepthSeg)について述べる。
2Dリモートセンシング画像から深度や高度を自動的にモデル化し、セマンティックセグメンテーションフレームワークに統合する。
LiuZhouデータセットの実験は、土地被覆マッピングタスクにおけるDepthSegフレームワークの利点を検証する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:27:59 GMT)
Double Machine Learning for Conditional Moment Restrictions: IV regression, Proximal Causal Learning and Beyond [16.8] 条件モーメント制限(CMR)は統計学、因果推論、計量学において重要な問題である。
ほとんどのCMR推定器は2段階の手法を用いており、第1段階の推定は第2段階に直接差し込んで関心の関数を推定する。
DML-CMRは、2段階のCMR推定器であり、高速収束率を保証する不偏推定を提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:00:34 GMT)
Refining music sample identification with a self-supervised graph neural network [16.7] 本稿では,グラフニューラルネットワークを用いた軽量でスケーラブルな符号化アーキテクチャを提案する。
我々のモデルは、現在の最先端システムと比較してトレーニング可能なパラメータの9%しか使用せず、平均平均精度(mAP)は44.2%に達している。
さらに,実世界のアプリケーションにおけるクエリは時間的に短い場合が多いため,Sample100データセットに対する新たな詳細なアノテーションを用いて,短いクエリをベンチマークする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:19:21 GMT)
Knowledge Adaptation as Posterior Correction [16.7] これらの適応法は全て、近似後部を補正する異なる方法と見なせることを示す。
より正確な後部修正は、より小さな修正につながり、その結果、より高速な適応がもたらされる。
機械が迅速に適応することを学ぶための自然なメカニズムとして,後部矯正の使用を実証する例を多数提示する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:22:32 GMT)
Accurate and scalable exchange-correlation with deep learning [16.7] Skalaは最新のディープラーニングベースのXC関数で、データから直接表現を学習することで、高価な手設計の機能をバイパスする。
スカラは半局所DFTの計算効率を保ちながら、小さな分子の原子化エネルギーの化学的精度を達成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:56:56 GMT)
Solving Satisfiability Modulo Counting Exactly with Probabilistic Circuits [16.6] SMC問題とは、ブール変数の真理値が確率的推論によって決定される問題である。
我々は,確率的推論プロセスにおいて,下界と上界を効率的に追跡する正確なSMC解法であるKOCO-SMCを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:56:03 GMT)
SCISSOR: Mitigating Semantic Bias through Cluster-Aware Siamese Networks for Robust Classification [16.6] ショートカット学習は、モデル一般化をアウト・オブ・ディストリビューションデータに損なう。
本稿では,SCISSOR(Semantic Cluster Intervention for Suppressing ShORtcut)を提案する。
コンピュータビジョンではChest-XRay,Not-MNIST,NLPタスクではGYAFC,Yelpの4つのベンチマークでSCISSORを評価した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:49:29 GMT)
Toward Rich Video Human-Motion2D Generation [16.6] 本稿では,15万本のビデオシーケンスからなる大規模リッチビデオモーション2Dデータセット(Motion2D-Video-150K)を紹介する。
Motion2D-Video-150Kは多様な単一文字のバランスの取れた分布を特徴としている。
拡散型リッチビデオモーション2D生成モデル(RVHM2D)を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:45:33 GMT)
AssistantX: An LLM-Powered Proactive Assistant in Collaborative Human-Populated Environment [16.4] AssistantXは、現実世界のシナリオにおける自律的な操作のために、高精度に設計されたプロアクティブアシスタントである。
AssistantXは4つの特殊なLLMエージェントからなるマルチエージェントフレームワークを採用しており、それぞれが知覚、計画、意思決定、反射的レビューに特化している。
実験では、AssistantXはユーザーの指示に反応し、緊急対応戦略を積極的に調整し、積極的に人間からの援助を求める。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:46:50 GMT)
Don't Make It Up: Preserving Ignorance Awareness in LLM Fine-Tuning [16.4] 大規模言語モデル(LLM)の微調整における破滅的な忘れを緩和する作業は、主に特定のデータやタスクの保存に重点を置いている。
この能力は, 従来の微調整で著しく劣化し, 幻覚などの望ましくない行動に繋がることを示した。
本手法は, 微調整性能とモデル固有の無知認識能力の両方を保存し, 簡便かつ効果的な微調整手法であるSEATを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:33:23 GMT)
BiggerGait: Unlocking Gait Recognition with Layer-wise Representations from Large Vision Models [16.2] 本研究は,下流認識タスクにおけるレイヤワイド表現の影響について検討する。
We propose a simple and universal baseline for LVM based gait recognition, called BiggerGait。
CCPG, CAISA-B*, SUSTech1K, CCGR_MINIの総合評価は, 内部およびクロスドメインタスクにおけるBiggerGaitの優位性を検証した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:32:43 GMT)
Does DQN Learn? [16.0] 数値的に、DQN(Deep Q-Network)は、初期よりも悪い性能を示すポリシーを返すことが多い。
我々はこの現象を線形DQNで理論的に説明する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:02:59 GMT)
Leveraging Predictive Equivalence in Decision Trees [16.0] 決定木は解釈可能な機械学習に広く使われている。
本稿では,予測等価性を示さない決定木の表現について述べる。
決定木は、機能値のテスト時間不足に対して驚くほど堅牢であることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:11:30 GMT)
Towards Desiderata-Driven Design of Visual Counterfactual Explainers [15.8] 既存の視覚的反事実的説明者は、忠実さ、理解可能性、満足度などの説明のために、より包括的なデシダータを考えることができない。
本稿では,これらのメカニズムを,合成データおよび実データに対する体系的評価を通じて,新しい「非現実的逆探索法」アルゴリズムと組み合わせ,その効果を実証する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:38:15 GMT)
Dataset distillation for memorized data: Soft labels can leak held-out teacher knowledge [15.8] 本研究では,教師からソフトラベルを訓練した学生が,保持された記憶データに対して,非自明な精度を達成できることを示す。
これらの現象は,ロジットの平滑化温度に強く依存していることが示される。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:18:37 GMT)
Leveraging External Factors in Household-Level Electrical Consumption Forecasting using Hypernetworks [15.8] ハイパーネットワークアーキテクチャは,グローバルな電力消費予測モデルの精度を高めるために外部要因を活用することができることを示す。
約2年間にわたる包括的データセットを収集し,6000戸以上のルクセンブルク人世帯の消費データを収集した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:35:24 GMT)
Optimizing Length Compression in Large Reasoning Models [15.7] 大規模な推論モデル(LRM)は、しばしば不要で冗長な推論連鎖を生成する。
冗長性の排除を提唱するBrevityと、批判的推論ステップの保存を保証するSufficiencyという、2つの新しいきめ細かい原則を提案する。
LC-R1は、全体的な簡潔さのためにリワード長(Reward Length)と、思考プロセスの無効部分を取り除くために特別に設計された圧縮リワード(Compress Reward)を組み合わせている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:50:16 GMT)
FRIDU: Functional Map Refinement with Guided Image Diffusion [15.7] 関数写像の空間内で直接画像拡散モデルを訓練する。
拡散過程において、現在の関数写像に対応する点対応写像をガイダンスとして用いる。
提案手法は,最先端の地図精錬手法と競合することを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:02:46 GMT)
CrEst: Credibility Estimation for Contexts in LLMs via Weak Supervision [15.6] CrEstは、推論中のコンテキスト文書の信頼性を評価する弱教師付きフレームワークである。
3つのモデルアーキテクチャと5つのデータセットにわたる実験は、CrEstが強いベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:44:21 GMT)
Entropy-based Exploration Conduction for Multi-step Reasoning [15.6] 大規模言語モデル(LLM)による多段階プロセスは、複雑な推論タスクを解くのに有効であることが証明されている。
深度を自動的に決定する既存の手法は、しばしば高コストと柔軟性の欠如につながる。
本研究では,探索深度を動的に調整する新しい手法であるエントロピーに基づく探索深度伝導法を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:37:38 GMT)
Market Making without Regret [15.6] 市場メーカが入札価格のB_t$と要求価格のA_t$を、入ってくるトレーダーに提示する、シーケンシャルな意思決定設定について検討する。
トレーダーのバリュエーションが入札価格よりも低い場合、または要求価格より高い場合は、取引(販売または購入)が発生する。
我々は、入札とペアの最良の選択に関して、メーカの後悔を特徴づける。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:56:29 GMT)
OWLViz: An Open-World Benchmark for Visual Question Answering [15.6] 本稿では, Open WorLd VISual Question answering (OWLViz) タスクに対する挑戦的なベンチマークを示す。
我々は、最先端のVLMでさえ、最高のモデルであるGemini 2.0と競合し、26.6%の精度しか達成していないことを示した。
このパフォーマンスギャップは、適切なツールを選択するマルチモーダルシステムの能力に重大な制限が生じる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:34:55 GMT)
HydroChronos: Forecasting Decades of Surface Water Change [15.6] 我々は,大規模でマルチ標準のDigital Water DynamicsデータセットであるHydroronを紹介した。
このデータセットには30年以上にわたるランドサット5号とセンチネル2号の画像、気候、アライメント、ヨーロッパ、北アメリカ、南アメリカにまたがる多様な湖や川のための標高モデルが含まれている。
我々はまた、表面の水の変化に影響を与える主要な気候変数を特定するために説明可能なAI分析を行い、将来のモデリング活動に洞察を与え、ガイドする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:02:48 GMT)
Similarity = Value? Consultation Value Assessment and Alignment for Personalized Search [15.5] 検索サービスのパーソナライズへの活用はトレンドだ。
既存のメソッドは通常、過去のコンサルテーションを現在のクエリと整合させるために意味的類似性に依存する。
歴史的コンサルテーションを3つの新しい視点から評価するコンサルテーション価値評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:56:11 GMT)
ArrayDPS: Unsupervised Blind Speech Separation with a Diffusion Prior [15.5] ブラインド音声分離(ブラインド音声分離、BSS)は、マイクロフォンアレイによって記録された音声の混合から複数の音声ソースを分離することを目的としている。
本稿では,非教師付き,配列に依存しない,生成的な方法でBSS問題を解決するためのArrayDPSを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:01:39 GMT)
Flat Posterior Does Matter For Bayesian Model Averaging [15.4] 後部平坦性がBMA一般化にどのように影響するかを示す。
FP-BMA(Flat Posterior-aware Bayesian Model Averaging)を提案する。
その結果,FP-BMAは平坦な後部を捕捉し,一般化性能が向上した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:57:49 GMT)
HPC-AI Coupling Methodology for Scientific Applications [15.3] 本稿では,3つの結合パターン(代理,指示,座標)を包含する新しい手法を提案する。
この研究は、技術的な課題、パフォーマンス改善、実装の詳細を強調し、HPC-AI結合の有望な観点に関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:09:03 GMT)
GuiLoMo: Allocating Expert Number and Rank for LoRA-MoE via Bilevel Optimization with GuidedSelection Vectors [15.3] Low-Rank Adaptation (LoRA) は、計算コストを削減した大規模言語モデルを適応するための効率的な方法である。
GuiLoMoはきめ細かなレイヤーの専門家数とランク割り当て戦略である。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:41:33 GMT)
Universal Rates of ERM for Agnostic Learning [15.0] 実証的リスク最小化原理はPAC理論の基本であり、実践的な機械学習においてユビキタスである。
我々は、agnostic universal rateの可能性を探求し、$e-n$、$o(n-1/2)$、または任意に遅くする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:02:11 GMT)
Vela: Scalable Embeddings with Voice Large Language Models for Multimodal Retrieval [14.9] Velaは、ユニバーサルマルチモーダル埋め込みの生成にMLLMを適用するように設計されたフレームワークである。
そこで本研究では,テキストペアにのみモデルをトレーニングする単一モダリティトレーニング手法を提案する。
実験の結果,Velaは標準音声検索タスクにおいて従来のCLAPモデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:10:19 GMT)
Distraction is All You Need for Multimodal Large Language Model Jailbreaking [14.8] マルチレベル・トラクション戦略によりMLLMのアライメントを阻害する手法として,CS-DJ(Contrasting Subimage Distraction Jailbreaking)を提案する。
CS-DJは平均成功率52.40%、アンサンブル攻撃成功率74.10%を達成している。
これらの結果から,MLLMの防御を活用・回避するための散逸に基づくアプローチの可能性を明らかにした。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:28:34 GMT)
Egocentric Human-Object Interaction Detection: A New Benchmark and Method [14.8] Ego-HOIBenchは、Ego-HOI検出のベンチマークと開発を促進する新しいデータセットである。
本手法は軽量かつ効果的であり,プラグイン・アンド・プレイ方式で容易にHOIベースラインに適用できる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:03:42 GMT)
SDTrack: A Baseline for Event-based Tracking via Spiking Neural Networks [14.8] スパイクニューラルネットワーク(SNN)は、離散的なスパイク信号を通じてイベントデータを自然に補完し、イベントベースのトラッキングに最適である。
本稿では,Transformerベースのスパイク駆動型トラッキングパイプラインを提案する。
我々のGTP(Global Trajectory Prompt)法は,グローバルなトラジェクトリ情報を効果的にキャプチャし,イベントストリームをイベントイメージに集約する。
次に,SDTrackを紹介する。SDTrackは,Spyking MetaFormerのバックボーンと,スパイク信号を用いた正規化座標を直接予測するシンプルなトラッキングヘッドを備えるトランスフォーマーベースのスパイク駆動トラッカーである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:08:36 GMT)
Zeroth-Order Optimization is Secretly Single-Step Policy Optimization [14.7] Zeroth-Order Optimization (ZOO)は、明示的な勾配が利用できない、あるいは計算に費用がかかる関数を最適化するための強力なツールを提供する。
有限差分を持つZOOは、単一ステップポリシー最適化(PO)の具体例と等価である。
本稿では,PO-インスパイアされた分散低減手法を取り入れた新しいZOOアルゴリズムZoARを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:20:04 GMT)
Unified Software Engineering agent as AI Software Engineer [14.7] 大規模言語モデル(LLM)技術は、自動コーディングに対する期待を高めた。
本稿では,統一ソフトウェア工学エージェントやUSEagentを開発することによって,この問題を理解することを目的とする。
私たちはUSEagentを、AIと人間の両方を含む将来のソフトウェア開発チームのチームメンバーになる、将来のAIソフトウェアエンジニアの最初のドラフトとして考えています。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:19:13 GMT)
VeriLeaky: Navigating IP Protection vs Utility in Fine-Tuning for LLM-Driven Verilog Coding [14.7] 大規模言語モデル(LLMs)は、コーディングにおいて大きな可能性を秘めているが、Verilogのようなニッチな言語には、キュレートされたデータによる微調整(FT)が不可欠である。
FTの知的財産権(IP)を使用すると、LLM推論によってFTデータがリークされるため、深刻なリスクが生じる。
本研究は,FTに対して有効かつ最小限に破壊的な新しい戦略の必要性を示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:35:13 GMT)
Enhancing Goal-oriented Proactive Dialogue Systems via Consistency Reflection and Correction [14.5] モデルに依存しない2段階の一貫性反射・補正フレームワークを提案する。
整合性反射の段階では、モデルが生成した応答と対話コンテキストの相違を反映するように促される。
整合性補正の段階では、モデルは対話コンテキストとより整合性のある応答を生成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:34:00 GMT)
A Simple Baseline with Single-encoder for Referring Image Segmentation [14.5] 本稿では,単一エンコーダ(BEiT-3)を用いたRIS法を提案する。
単一エンコーダによる単純なベースラインは、RISベンチマークデータセット上で優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:34:15 GMT)
Probabilistic Aggregation and Targeted Embedding Optimization for Collective Moral Reasoning in Large Language Models [14.4] 本稿では,複数の LLM の道徳的判断を集合的に定式化した道徳的判断に合成する枠組みを提案する。
我々の集約メカニズムは、連続的な道徳的受容可能性スコア(バイナリラベルの他に)を集合的確率に融合させる。
大規模社会道徳ジレンマデータセットの実験は、我々のアプローチが堅牢なコンセンサスを構築し、個々のモデル忠実性を改善することを示している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:22:21 GMT)
PerturBench: Benchmarking Machine Learning Models for Cellular Perturbation Analysis [14.3] 単一細胞における摂動応答モデリングのための包括的フレームワークを提案する。
私たちのアプローチには、モジュラーでユーザフレンドリなモデル開発と評価プラットフォームが含まれています。
モード崩壊など、広く使われているモデルの限界を強調します。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 00:37:47 GMT)
GraphAU-Pain: Graph-based Action Unit Representation for Pain Intensity Estimation [14.3] 既存の表情から痛みを検出するデータ駆動手法は、解釈可能性と重大さによって制限される。
グラフニューラルネットワークを利用することで、我々のフレームワークは解釈可能性の向上と大幅な性能向上を提供する。
一般公開されたUNBCデータセットで実施された実験は、GraphAU-Painの有効性を実証している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:43:24 GMT)
Unifying Streaming and Non-streaming Zipformer-based ASR [14.2] 本稿では,ストリーミングアプリケーションと非ストリーミングアプリケーションの両方に対して,単一エンドツーエンドのASRモデルをトレーニングする統合フレームワークを提案する。
本稿では,zipformer を用いた ASR モデルのトレーニングにおいて,チャンクされた注目マスキングによる動的右コンテキストの利用を提案する。
ストリーミングASRモデルの精度と待ち時間に及ぼす右コンテキストフレーム数の変化の影響を解析する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:52:41 GMT)
ConsistencyChecker: Tree-based Evaluation of LLM Generalization Capabilities [14.1] 大きな言語モデル(LLM)の一貫性を評価することは、信頼性を確保するために不可欠である。
従来の自己整合性メソッドは、自然言語の微妙な意味的変化や、コードや方程式の関数的シフトを見逃すことが多い。
可逆変換のシーケンスによる一貫性の測定を目的とした木に基づく評価フレームワークであるConsistencyCheckerを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:11:59 GMT)
Learning Invariant Causal Mechanism from Vision-Language Models [14.0] 学習環境における不変要因と変動要因の因果関係は,試験環境と異なることを示す。
CLIP(CLIP-ICM)フレームワークの不変因果機構を提案する。
提案手法は,CLIPの信頼性を高めるため,シンプルだが強力な拡張を提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:43:46 GMT)
SENIOR: Efficient Query Selection and Preference-Guided Exploration in Preference-based Reinforcement Learning [14.0] 本稿では,SENIORと呼ばれる,効率的なクエリ選択と優先誘導探索手法を提案する。
SENIORは、人間のフィードバック効率を改善し、ポリシー学習を加速するために、意味があり、簡単に比較できる行動セグメントペアを選択することができる。
実験の結果,SENIORは人間のフィードバック効率と政策収束速度の両面で,他の5つの既存手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:42:19 GMT)
CellCLIP -- Learning Perturbation Effects in Cell Painting via Text-Guided Contrastive Learning [13.9] 本稿では,HCSデータのためのクロスモーダルコントラスト学習フレームワークであるCellCLIPを紹介する。
我々のフレームワークは、現在のオープンソースモデルよりも優れており、クロスモーダル検索と生物学的に意味のある下流タスクの両方において、最高のパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:58:45 GMT)
Essential-Web v1.0: 24T tokens of organized web data [13.9] Essential-Web v1.0は24トリルのデータセットで、すべてのドキュメントにトピック、フォーマット、コンテントの複雑さ、品質をカバーした12カテゴリの分類をアノテートする。
競争力のあるWebキュレートデータセット(SOTAと比較して8.0%)、Webコード(+14.3%)、STEM(+24.5%)、医学的データを得る。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:03:36 GMT)
A General Framework for Off-Policy Learning with Partially-Observed Reward [13.9] 文脈的包帯におけるオフ政治学習(OPL)は、期待される目標報酬を最大化する政策を学ぶことを目的としている。
報酬が部分的にしか観察されない場合、OPLの有効性は著しく低下する。
部分観測リワード(HyPeR)のためのハイブリッドポリシ最適化法を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:58:11 GMT)
Towards Robust Learning to Optimize with Theoretical Guarantees [13.8] 学習を最適化する学習(L2O)は、学習に基づく手法で数学的最適化問題を解決する新しい手法である。
提案手法は,InDシナリオとOODシナリオの両方において,最先端のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:25:07 GMT)
Model Context Protocol (MCP) at First Glance: Studying the Security and Maintainability of MCP Servers [13.7] Anthropicは2024年後半にこのツールエコシステムを標準化するためにModel Context Protocol (MCP)を導入した。
採用にもかかわらず、MPPのAI駆動の非決定論的制御フローは、持続可能性、セキュリティ、保守性に対する新たなリスクをもたらす。
我々は1,899のオープンソースMPPサーバを評価し,その健全性,セキュリティ,保守性を評価した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:11:24 GMT)
Do Large Language Models Exhibit Cognitive Dissonance? Studying the Difference Between Revealed Beliefs and Stated Answers [13.6] Revealed Beliefは,不確実性を考慮した推論を必要とするタスクに対して,Large Language Models (LLMs)を評価する評価フレームワークである。
以上の結果から,LSMは正しい回答をしばしば述べるが,Revealed Beliefは確率質量を不整合に割り当てることが多く,体系的な偏見を示し,新しい証拠が提示された時にその信念を適切に更新することができないことが示唆された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:36:53 GMT)
African Data Ethics: A Discursive Framework for Black Decolonial Data Science [13.6] 本稿では,50の文書からなる学際コーパスをテーマ分析し,アフリカにおけるデータ倫理の枠組みについて述べる。
1) パワー・アシンメトリ、2) アサートデータ自己決定、3) ローカルデータ機関とインフラへの投資、4) コミュニティの活用、5) マージンのセンターコミュニティ、6) 共通グッズ。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:05:14 GMT)
Between Regulation and Accessibility: How Chinese University Students Navigate Global and Domestic Generative AI [13.6] 本研究では、中国の大学生が学習過程において、グローバルおよび国内両方の生成AIとどのように相互作用するかを検討する。
発見によると、エンゲージメントはアクセシビリティ、言語習熟度、文化的な関連性によって形成されている。
平等で包括的なデジタル学習環境を確保するために、人間中心、多言語、家庭内コンテキスト依存のAI統合を提唱している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:24:12 GMT)
Efficient multi-view training for 3D Gaussian Splatting [13.5] 3D Gaussianting (3DGS) は、より高速な逆レンダリングにおいて、Neural Radiance Fields (NeRF) と共に好まれる選択として現れている。
現在、3DGSの一般的なアプローチは、イテレーション毎に1つのイメージしか処理されない「単一ビュー」のミニバッチトレーニングを利用することである。
我々は,このような単一視点学習が,ミニバッチ勾配のばらつきの増加による最適部分最適化につながることを観察し,マルチビュー学習の必要性を強調した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:12:36 GMT)
DDS-NAS: Dynamic Data Selection within Neural Architecture Search via On-line Hard Example Mining applied to Image Classification [13.4] カリキュラム学習フレームワーク内の動的ハードサンプルマイニングを通じて、ニューラルネットワーク検索(NAS)トレーニングを高速化します。
トレーニング中の各画像サンプルの寄与を最大化することにより、NASトレーニングサイクルの持続時間と収束に必要なイテレーション数を削減する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:58:10 GMT)
DCRM: A Heuristic to Measure Response Pair Quality in Preference Optimization [13.4] 本研究は,2つの軸に沿って分類された3種類の嗜好データセットについて検討する。
トレーニングセットの高次距離校正リワードマージンと学習結果の総合的相関性を確立する。
提案手法は,AlpacaEval,MT-Bench,Arena-Hardなどのモデルの性能を向上させるためのトレーニングデータセットを生成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:37:41 GMT)
ProbRadarM3F: mmWave Radar based Human Skeletal Pose Estimation with Probability Map Guided Multi-Format Feature Fusion [13.3] 本稿では,確率マップによるマルチフォーマット特徴融合モデルProbRadarM3Fを提案する。
ProbRadarM3Fは従来のヒートマップの特徴と位置特徴を融合させ、効果的に14個の人体のキーポイントを推定する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:15:45 GMT)
WHALES: A Multi-agent Scheduling Dataset for Enhanced Cooperation in Autonomous Driving [13.3] We present WHALES, a first large-scale V2X dataset designed for benchmark communication-aware agent scheduling and scalable collaborative perception。
WHALESは、シーン当たり平均8.4の協調エージェントと、さまざまなトラフィックシナリオにまたがる2.01百万の注釈付き3Dオブジェクトを備えた、最先端のSOTA(State-of-the-art)標準を確立している。
そこで本研究では,歴史的視点に基づくエージェントの優先順位付けを行う新しいスケジューリングベースラインであるCoverage-Aware Historical Scheduler(CAHS)を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:01:23 GMT)
Analyzing Effects of Mixed Sample Data Augmentation on Model Interpretability [13.2] 深層ニューラルネットワーク(DNN)のトレーニングにおいて、混合サンプルデータ拡張戦略が積極的に使用される
近年の研究では,様々なタスクにおいて有効であることが示唆されているが,混合サンプルデータ拡張がモデル解釈性に与える影響は広く研究されていない。
本稿では,モデルの堅牢性の影響を最小限に抑えつつ,モデル解釈可能性の比較を可能にする新しい指標を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:21:26 GMT)
A Scalable Hybrid Training Approach for Recurrent Spiking Neural Networks [13.2] 本稿では、並列化の効率と近似オンライン前方学習を組み合わせたHYPR(HYbrid PRopagation)を提案する。
HYPRは、ほぼ任意の非線形スパイキングニューロンモデルからなるRSNNのサブシーケンスに対するパラメータ更新の並列化を可能にする。
このタイプのニューロンモデルは、HYPRにより特に訓練可能であり、前向き勾配学習とBPTTの間には、前例のない低いタスク性能のギャップが生じることが判明した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:27:25 GMT)
MALSIGHT: Exploring Malicious Source Code and Benign Pseudocode for Iterative Binary Malware Summarization [13.2] バイナリマルウェアの記述を生成できる新しいコード要約フレームワークMALSIGHTを提案する。
具体的には,最初のマルウェア要約データセットであるMalSとMalPを構築した。
トレーニング段階では、MalSと良質な擬似コードデータセットに基づいて、新しいLLMベースのコードモデルであるMalT5をチューニングします。
テスト段階では、疑似コード関数をMalT5に繰り返し送り、要約を得る。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:06:25 GMT)
Equivariance Everywhere All At Once: A Recipe for Graph Foundation Models [13.1] ノードレベルのタスクのためのグラフ基盤モデルを第一原理から設計するためのレシピを提案する。
本研究の基盤となる重要な要素は,グラフ基盤モデルが尊重すべき対称性を体系的に調査することである。
我々は29の実世界のノード分類データセットに関する広範な実験を通して、我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:05:08 GMT)
FSL-SAGE: Accelerating Federated Split Learning via Smashed Activation Gradient Estimation [13.0] フェデレートラーニング(FL)やスプリットラーニング(SL)のような協調学習手法は、生データを共有せずに分散機械学習を可能にする。
補助モデルを用いてサーバ側勾配フィードバックを推定する新しいフェデレーション分割学習アルゴリズムであるFSL-SAGEを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 00:36:43 GMT)
Testing the quantum nature of gravity through interferometry [13.0] このプロトコルの特徴は、SN自己重力によって誘導される2つのインターフェロメトリアームの非対称性を利用して、試験質量の共通運動と微分運動の間のクロストークを生成することである。
以上の結果から,10dB圧縮入力状態の補助を行うと,1ケルビン環境下でSN理論を確定的に検証するのに十分な信号-雑音比が得られた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:42:09 GMT)
Representations Shape Weak-to-Strong Generalization: Theoretical Insights and Empirical Predictions [13.0] W2SG(Wak-to-Strong Generalization)は、人間が将来超人的な知性をどう導くかを理解するための重要なアナロジーである。
We show that W2SG can be characterized using kernels from the principal component of weak and strong model' internal representations。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:06:53 GMT)
MIST: Towards Multi-dimensional Implicit Bias and Stereotype Evaluation of LLMs via Theory of Mind [12.9] 大規模言語モデル(LLM)における心の理論 (ToM) とは、精神状態の推論能力を指す。
本稿では,Streotype Content Model (SCM) を応用して,能力,社会性,モラルの多次元的障害としてバイアスを再認識する評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:50:57 GMT)
Optimal Embedding Learning Rate in LLMs: The Effect of Vocabulary Size [12.9] 本稿では,語彙サイズが学習力学に及ぼす影響を理論的に分析する。
語彙のサイズが大きくなるにつれて、トレーニングのダイナミクスは、$mu$Pレギュレーションと他のレギュレーションとの間にあることを示します。
解析の結果、LV系では、隠蔽LR比に対する最適埋め込みLRは、大まかに$Theta(sqrtwidth)$とスケールすべきであることが判明した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:57:30 GMT)
Abacus: A Cost-Based Optimizer for Semantic Operator Systems [12.8] 本稿では,セマンティック演算子の最適実装を探索するコストベースシステムであるAbacusを紹介する。
Abacusは、最小限の検証例と、もし可能であれば、オペレータのパフォーマンスに関する事前の信念を活用することで、オペレータのパフォーマンスを見積もる。
Abacusによって最適化されたシステムは、19.2%-39.2%の優れた品質、23.6倍の低コスト、4.2倍のレイテンシを実現している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:45:12 GMT)
Xray2Xray: World Model from Chest X-rays with Volumetric Context [12.5] 本研究では,胸部X線から3次元構造情報をコードする潜在表現を学習する新しい世界モデルであるXray2Xrayを紹介する。
Xray2Xrayは、X線投影の遷移ダイナミクスをモデル化することにより、胸部体積の潜在的な表現をキャプチャする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:17:07 GMT)
REAL-Prover: Retrieval Augmented Lean Prover for Mathematical Reasoning [12.3] 私たちはREAL-Proverという,Lean 4.0用の新たなオープンソースステップワイドな定理証明ツールを紹介します。
我々の証明者は、特に大学レベルの数学問題の解法における性能を高める。
実験では、教師付き微チューン定理のみを用いた証明器は23.7%の成功率で競合する結果が得られる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:25:43 GMT)
Efficient Online Decision Tree Learning with Active Feature Acquisition [12.2] 医学診断では、医師は患者に対してどの検査を行うかを選択する必要がある。
私たちのフレームワークは、オンライン学習スキームに埋め込まれたアクティブプランニングオラクルで構成されています。
適応的部分モジュラリティに基づく代理情報取得関数を用いて,最小コストで特徴値の探索を行う。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:11:05 GMT)
SmartWay: Enhanced Waypoint Prediction and Backtracking for Zero-Shot Vision-and-Language Navigation [12.2] 連続環境におけるVLN(Vision-and-Language Navigation)は、制約のない3D空間をナビゲートしながら自然言語命令を解釈するエージェントを必要とする。
既存のVLN-CEフレームワークは、2段階のアプローチに依存している。
マルチモーダル大言語モデル(MLLM)に基づくナビゲータと拡張されたウェイポイント予測器を統合したゼロショットVLN-CEフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:47:59 GMT)
GAdaBoost: An Efficient and Robust AdaBoost Algorithm Based on Granular-Ball Structure [12.1] 本稿では,データグラニュレーション段階とアダプティブ・ブースティング段階からなる新しい2段階のフレームワークであるGAdaBoostを提案する。
まず, 多様性を保ち, ラベルノイズを軽減しつつ, データを圧縮するグラニュラーボール生成法を考案した。
第二に、グラニュラーボールに基づくSAMMEアルゴリズムは、個々のサンプルではなく、グラニュラーボールに焦点を当て、効率を改善し、ノイズに対する感度を低下させる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:21:52 GMT)
ASCD: Attention-Steerable Contrastive Decoding for Reducing Hallucination in MLLM [12.1] MLLM(Multimodal Large Language Model)はしばしば幻覚に悩まされる。
彼らは部分的な手がかりを過度に評価し、誤った反応を生成する。
近年,視覚コントラスト復号法 (VCD) や命令コントラスト復号法 (ICD) などの手法が提案されている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:58:11 GMT)
Combining Constrained and Unconstrained Decoding via Boosting: BoostCD and Its Application to Information Extraction [12.0] Boosted Constrained Decodingは制約付きと制約なしのデコーディングを2つのフェーズで組み合わせる。
閉鎖情報抽出に適用することで,BoostCDのパワーを実証する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:16:17 GMT)
Private Continual Counting of Unbounded Streams [11.9] 入力サイズ$n$が予め分かっていないような非有界な環境では、差分プライベートな連続数え上げの問題について検討する。
一般的な2倍のトリックを使用すると、$n$の知識は避けられるが、最適でないエラーと非滑らかなエラーにつながる。
先行研究で研究された関数 $frac1sqrt1-z$ の対数摂動に基づく新しい行列分解を導入する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:09:53 GMT)
Common Benchmarks Undervalue the Generalization Power of Programmatic Policies [11.9] 一般的に使用されるベンチマークは、プログラム表現の一般化能力に過小評価されていると論じる。
これは、ニューラルネットワークトレーニングパイプラインの簡単な変更によって実現される。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:53:18 GMT)
SFT-GO: Supervised Fine-Tuning with Group Optimization for Large Language Models [11.9] Supervised Fine-tuning (SFT) は、人間の期待や特定の下流タスクに合わせて大きな言語モデル(LLM)を調整するための重要なステップとなっている。
既存のSFTメソッドは、各トレーニングインスタンスを一様シーケンスとして扱い、それらの関連性に関係なく、すべてのトークンに等しく重要である。
我々は,グループ最適化によるスーパービジョンファインチューニング(SFT-GO)を導入し,その重要性に基づいてトークンのグループを別々に扱う新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:12:28 GMT)
MalGuard: Towards Real-Time, Accurate, and Actionable Detection of Malicious Packages in PyPI Ecosystem [11.8] PyPIの安全性と安定性を確保する上で、悪意あるパッケージ検出が重要な課題となっている。
既存の検出アプローチは、従来の機械学習(ML)モデルから大規模言語モデル(LLM)へと進化する、モデル選択の進歩に重点を置いている。
グラフ中心性解析とLIME(Local Interpretable Model-Agnostic Explanations)アルゴリズムに基づくMalGuard手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:30:56 GMT)
Winter Soldier: Backdooring Language Models at Pre-Training with Indirect Data Poisoning [11.7] 間接的なデータ中毒はデータセットを効果的に保護し、その使用を追跡できることを示す。
モデルに任意のシークレットシーケンスを学習させる: トレーニングコーパスにないシークレットプロンプトに対するシークレット応答。
我々は、スクラッチから事前訓練された言語モデルに対する我々のアプローチを検証するとともに、毒性トークンの0.005%未満は、LMに秘密を隠蔽するのに十分であることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:46:45 GMT)
Adaptive Action Duration with Contextual Bandits for Deep Reinforcement Learning in Dynamic Environments [11.7] 文脈的包帯を深層強化学習(DRL)と統合する新しいパラダイムを提案する。
我々のアプローチは、状態コンテキストに基づいて最適な行動反復率を選択することを学習するコンテキスト的バンディットモジュールでDeep Q-Network(DQN)を強化する。
Atari 2600ゲームの実験では、静的持続時間ベースラインよりも大幅にパフォーマンスが向上した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:04:53 GMT)
From Permissioned to Proof-of-Stake Consensus [11.6] 本稿では、任意の許可されたコンセンサスプロトコルを証明可能な無許可コンセンサスプロトコルに変換する最初のジェネリックコンパイラを提案する。
以下のプロパティのそれぞれについて、初期許可されたプロトコルが部分的に同期された設定でプロパティを満たす場合、そのプロパティを部分的に同期的で準パーミッションな設定で満足する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:37:40 GMT)
Diverse Topology Optimization using Modulated Neural Fields [11.6] トポロジー最適化(英: Topology Optimization、TO)は、公式な問題記述から準最適ジオメトリを導出する計算手法のファミリーである。
我々は、構造に適合した形状を生成するためにニューラルネットワークを訓練するデータフリーな手法であるModulated Neural Fields (TOM)を紹介する。
TOMは、データセットに頼ることなく、ほぼ最適性を維持しながら、これまでのどの方法よりも多様なソリューションを生成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:47:28 GMT)
HKD4VLM: A Progressive Hybrid Knowledge Distillation Framework for Robust Multimodal Hallucination and Factuality Detection in VLMs [11.4] 本稿では、Responsible AIチャレンジの2つのトラックに対するソリューションを提案する。
本稿では,HKD4VLMと呼ばれる,先進的なハイブリッド知識蒸留フレームワークを提案する。
具体的には、このフレームワークをピラミッド様のプログレッシブオンライン蒸留と3次結合精製蒸留に分解することができる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:31:50 GMT)
Treasure Hunt: Real-time Targeting of the Long Tail using Training-Time Markers [11.3] 大規模な汎用モデルは、多くのタスクのために訓練されるが、高周波のユースケースでベストに機能する。
我々は,ロングテール性能を改善するために,トレーニングと推論技術の違いを再考する。
ベースモデルを微調整して自動的にマーカーを推測するので、推論時にオプションになります。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:40:42 GMT)
Experimental Design for Semiparametric Bandits [11.2] 両腕の報酬が線形成分と未知の、潜在的に敵対的なシフトを組み合わせた有限腕半パラメトリックバンドについて検討する。
我々は,シャープな後悔境界,PAC境界,ベストアーム識別保証を同時に提供する最初の実験設計手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:20:19 GMT)
Convert Language Model into a Value-based Strategic Planner [11.1] 感情支援会話(ESC)は、効果的な会話を通じて個人の感情的苦痛を軽減することを目的としている。
状態モデルの観点からダイアグラムを定義するために,straQ* というフレームワークを提案する。
当社のフレームワークでは,ESC中にLCMをブートストラップし,長期的リターンに基づいて最適な戦略を決定し,最終的にLSMの応答を誘導する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:43:40 GMT)
Understanding Verbatim Memorization in LLMs Through Circuit Discovery [11.0] LLMにおける記憶機構の解明はいまだに不十分である。
我々は、モデル内の特定の機能を実行する最小の計算部分グラフである変換回路を使用する。
メモリ化を開始する回路は一度開始しても維持でき、メモリ化のみを維持できる回路は開始を誘導できない。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:14:56 GMT)
Massive Supervised Fine-tuning Experiments Reveal How Data, Layer, and Training Factors Shape LLM Alignment Quality [10.7] Supervised Fine-tuning (SFT) は、大きな言語モデルを人間の指示や値に合わせるための重要なステップである。
コード生成、数学的推論、汎用ドメインタスクなど、さまざまなデータセットに基づいて、幅広いベースモデルをトレーニングしました。
我々は、これらの1000以上のSFTモデルとベンチマーク結果をリリースし、さらなる研究を加速する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:13:15 GMT)
MSVIT: Improving Spiking Vision Transformer Using Multi-scale Attention Fusion [10.7] ビジョントランスフォーマーアーキテクチャを用いたスパイキングニューラルネットワーク(SNN)は、エネルギー効率と高性能コンピューティングの可能性から大きな注目を集めている。
SNNベースのトランスフォーマーアーキテクチャとANNベースのトランスフォーマーアーキテクチャの間には、依然として大きなパフォーマンスギャップがある。
本稿では,マルチスケールスパイキングアテンション(MSSA)を用いたスパイク駆動トランスフォーマーアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:48:33 GMT)
Semantic Mapping in Indoor Embodied AI -- A Survey on Advances, Challenges, and Future Directions [10.7] セマンティックマップは、環境に関する情報を構造化された方法でキャプチャし、エージェントが高度な推論のためにそれを参照できるようにする。
本稿では,組み込みAIにおけるセマンティックマップ構築アプローチ,特に屋内ナビゲーションについて概説する。
フィールドはオープン語彙、クエリ可能、タスクに依存しないマップ表現の開発に向かっている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:57:50 GMT)
Peering into the Unknown: Active View Selection with Neural Uncertainty Maps for 3D Reconstruction [10.5] 3次元再構成のためのアクティブビューセレクション(AVS)は、コンピュータビジョンの基本的な課題である。
我々は、UPNetと呼ばれる軽量フィードフォワードディープニューラルネットワークによって予測される神経不確実性マップによって導かれる新しいAVSアプローチを導入する。
我々は3Dレンダリングモデルを訓練し、他の競争力のあるAVS手法と比較して、新しいビューの品質を評価する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:15:52 GMT)
Expressive Score-Based Priors for Distribution Matching with Geometry-Preserving Regularization [10.4] 勾配に基づくDMトレーニングは、その密度ではなく、前のスコア関数のみを必要とする。
このアプローチは固定された事前からのバイアスを排除し、幾何保存正規化をより効果的に利用できるようにする。
提案手法は,他の拡散法よりも安定性と計算効率がよいことを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:08:16 GMT)
Automated Muscle and Fat Segmentation in Computed Tomography for Comprehensive Body Composition Analysis [10.2] 我々は,CTの身体組成分析に特化して,一般にアクセス可能なエンドツーエンドのセグメンテーションと特徴計算モデルを提案する。
本モデルでは, 胸部, 腹部, 骨盤領域における骨格筋, 皮下脂肪組織 (SAT) , 内臓脂肪組織 (VAT) の分画を行う。
また、筋肉密度、内臓-皮下脂肪比(SAT/SAT)、筋肉面積/体積、骨格筋指数(SMI)など、様々な身体組成指標も提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:19:39 GMT)
ROSAQ: Rotation-based Saliency-Aware Weight Quantization for Efficiently Compressing Large Language Models [10.1] 回転型サリエンシ対応重み量子化(ROSAQ)を提案する。
ROSAQは、プロジェクション特徴空間において、元の特徴空間ではなく、健全なチャネルを特定する。
カーネルの融合により、ROSAQはFP16の実装よりも約2.3倍スピードアップし、バッチサイズ64の256トークンを生成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:13:54 GMT)
ClusterRCA: Network Failure Diagnosis in HPC Systems Using Multimodal Data [10.1] 本稿では,マルチモーダルデータを活用することにより,原因ノードをローカライズし,障害タイプを決定する新しいフレームワークであるClusterRCAを提案する。
原因ノードを正確にローカライズし、障害タイプを決定するために、ClusterRCAは分類器ベースのアプローチとグラフベースのアプローチを組み合わせる。
上位階層のグローバルHPCデバイスベンダーが収集したデータセットの実験によると、ClusterRCAはHPCシステムのネットワーク障害の診断において高い精度を達成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:52:09 GMT)
Leveraging Large Language Models to Measure Gender Representation Bias in Gendered Language Corpora [10.0] 大規模言語モデル(LLM)は、しばしば、トレーニングデータに埋め込まれた社会的バイアスを継承し、増幅する。
性バイアスとは、特定の役割や特性と特定の性別の関連性である。
ジェンダー表現バイアスは、性別の異なる個人への参照の不平等な頻度である。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:06:35 GMT)
Hardware-Friendly Static Quantization Method for Video Diffusion Transformers [9.9] ビデオ生成用拡散変換器は,SORAの高性能化以来,大きな研究関心を集めている。
リソース制約のあるデバイスは動的量子化をサポートできず、AIプロセッサへの効率的なデプロイにはモデルの静的量子化が必要である。
本稿では,動的量子化技術に頼ることなく,ビデオ拡散変換器OpenSoraciteopensoraの学習後量子化手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:03:10 GMT)
Towards Reliable WMH Segmentation under Domain Shift: An Application Study using Maximum Entropy Regularization to Improve Uncertainty Estimation [9.9] ホワイトマター高強度(WMH)の正確なセグメンテーションは臨床的意思決定に不可欠である。
MRIマシンタイプや取得パラメータのバリエーションなどのドメインシフトは、キャリブレーションと不確実性推定をモデル化するための課題を提起する。
本研究では,モデルキャリブレーションと不確実性推定を向上させるために,最大エントロピー正規化手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:21:29 GMT)
CALM: Contextual Analog Logic with Multimodality [9.8] マルチモーダル付き文脈アナログ論理(CALM)を導入する。
CALMは、シンボリック推論とニューラルジェネレーションを結合する。
これにより、システムは実世界のマルチモーダルデータに基づいてコンテキストに敏感な決定を下すことができる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:40:32 GMT)
The Ethics of Generative AI in Anonymous Spaces: A Case Study of 4chan's /pol/ Board [9.7] 私たちは2024年4月から7月にかけて4chanの/pol/ (Politally Uncorrect)ボードから900枚の画像を集め、66個のユニークなAI生成画像を特定しました。
この分析により、この技術を用いた場合のパターンが明らかになり、69.7%の画像が認識可能な人物を含む。
我々は、ユーザーが生成AIを武器にして過激なコンテンツ、政治的コメント、ミームを作成する方法について文書化している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:14:16 GMT)
Optimal Transport for Probabilistic Circuits [9.6] 本稿では,関連する最適輸送問題の結合度を確率回路に制限するワッサーシュタイン型距離を提案する。
そこで本研究では,PC間の最適輸送計画が,小さな線形プログラムの解から容易に取り出せることを示す。
最後に、PCとデータセット間の実験的なワッサースタイン距離について検討し、PCパラメータを推定し、効率的な反復アルゴリズムによりこの距離を最小化できることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:15:56 GMT)
Quantum Enhanced Entropy Pool for Cryptographic Applications and Proofs [9.6] 本稿では、量子乱数性(quantum randomness)の検証ランダム関数(VRF)への統合について検討する。
私たちは、実行時間やリソース使用量を含む主要なセキュリティとパフォーマンスメトリクスへの影響を評価します。
以上の結果から,QRNGはVRFの予測不可能性と検証可能性を高めることができる一方で,時間的および計算的オーバーヘッドに関連する課題が生じることが示された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:25:36 GMT)
KGMark: A Diffusion Watermark for Knowledge Graphs [9.4] KGMARKは、堅牢で検出可能な透明な拡散指紋を生成するグラフ透かしフレームワークである。
本稿では,スワップマークを空間変動に適応させるクラスタリングに基づくアライメント手法を提案する。
また,拡散指紋の透明性を高めるために,新しい学習可能なマスクマトリックスを導入する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:16:20 GMT)
Sharp Tools: How Developers Wield Agentic AI in Real Software Engineering Tasks [9.4] ソフトウェアエンジニアリングエージェント(SWEエージェント)は、SWE Benchのようなベンチマーク上で、自律的に開発タスクを実行することができる。
SWEエージェントは、しばしば開発者との対話を可能にし、協調的な問題解決を可能にするように設計されている。
私たちは、以前コントリビュートしたリポジトリの33のオープンイシューを解決するために、IDEエージェントを使用した19の開発者を観察しました。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:49:35 GMT)
Temperature dependent single- and double-quantum relaxation of negatively charged boron vacancies in hexagonal boron nitride [9.4] この中心の1量子と2量子の緩和速度を293Kから393Kの範囲で調査する。
その結果, 両緩和速度は温度上昇とともに増加し, 二重量子緩和速度は急速に増大した。
高温(400K以上)では、二重量子緩和速度は単一量子緩和速度よりもはるかに大きく、スピンフォノン相互作用の脱コヒーレンスチャネルを支配している可能性がある。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:58:21 GMT)
Fine-grained Analysis and Faster Algorithms for Iteratively Solving Linear Systems [9.3] 多くの機械学習タスクにおいて重要なボトルネックとなっているが、大規模な線形システムの解決コストは定量化が難しいことが証明されている。
低次元構造を示すアプリケーションによって動機づけられた線形システムの解法における複雑性の微妙な概念を考察する。
線形システム $Ax = b$, すなわち $|Abarx - b| le epsilon |b|$ であるような $barx$ を求める。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:24:53 GMT)
Data Distributional Properties As Inductive Bias for Systematic Generalization [9.2] ディープニューラルネットワーク (DNN) は系統的一般化 (SG) に苦戦している
SGの推進におけるデータ特性の育成に焦点をあてる研究はほとんどない。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:51:03 GMT)
UD-English-CHILDES: A Collected Resource of Gold and Silver Universal Dependencies Trees for Child Language Interactions [9.2] 本稿では,UD Dependencies (UD) ツリーバンクとして初めてリリースされたUD- English-CHILDESについて紹介する。
これは、統合アノテーションの原則に従うために調和した、依存性アノテートされたCHILDESデータに由来する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:46:13 GMT)
The Backfiring Effect of Weak AI Safety Regulation [9.2] 安全規制、汎用AIクリエーター、ドメインスペシャリストの相互作用について検討する。
分析の結果、ドメインスペシャリストのみを対象とした弱い規制は、意図せず安全性を損なう可能性が示唆された。
より強く、適切に配置された規制は、実際には、それに従属するすべてのプレイヤーに相互に利益をもたらすことができる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:26:05 GMT)
FlagEvalMM: A Flexible Framework for Comprehensive Multimodal Model Evaluation [9.2] マルチモーダルモデルの評価を目的としたオープンソースの評価フレームワークであるFragEvalMMを提案する。
独立評価サービスを通じて評価からモデル推論を分離する。
FlagEvalMMは、モデルの強みと制限に関する正確で効率的な洞察を提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:54:37 GMT)
Information-Computation Gaps in Quantum Learning via Low-Degree Likelihood [9.2] 本研究では、状態設計と低次硬度との一般的な関係を確立する。
これを応用して、ギブス状態のランダム、スパース、非局所ハミルトニアンの学習に最初の情報計算ギャップを得る。
また、単一量子ビット測定による戦略に対する量子誤差軽減のための低次硬度結果を得る。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:24:14 GMT)
Patho-R1: A Multimodal Reinforcement Learning-Based Pathology Expert Reasoner [9.2] 我々は、病理教科書と現実世界の病理の専門家を活用して、高品質で推論指向のデータセットを構築する。
Patho-R1はマルチモーダルなRLベースの病理組織Reasonerで、3段階のパイプラインを通じてトレーニングされた。
パス-CLIP(Patho-CLIP)は、継続事前訓練に使用される同じフィギュア・キャプション・コーパスで訓練された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:23:39 GMT)
Doppelgänger Method: Breaking Role Consistency in LLM Agent via Prompt-based Transferable Adversarial Attack [9.2] ハイジャックされたエージェントのリスクを示す「Doppelg "anger method"」を提案する。
また,ドッペルグ・アンガー法に対抗するための「CAT(Caution for Adversarial Transfer)」も提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:01:39 GMT)
Controllable and Reliable Knowledge-Intensive Task-Oriented Conversational Agents with Declarative Genie Worksheets [9.1] 我々は、タスク指向の会話エージェントを作成するためのフレームワークGenieを紹介する。
高度な対話状態管理を通じて、信頼性の高い地上応答を提供する。
Genieで構築されたエージェントは、複雑な論理対話データセット上でSOTAメソッドより優れている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:53:30 GMT)
KDMOS:Knowledge Distillation for Motion Segmentation [9.0] 移動物体(MOS)は、局所化、経路計画、地図構築、シーンフロー推定、将来の状態予測を強化するため、自律運転には不可欠である。
実時間効率を維持しつつ精度を向上させることを目的とした,MOSのためのロジットベースの知識蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:47:49 GMT)
CSVQA: A Chinese Multimodal Benchmark for Evaluating STEM Reasoning Capabilities of VLMs [9.0] VLM(Vision-Language Models)は、マルチモーダル理解において顕著な進歩を示しているが、科学的推論の能力は依然として不十分である。
CSVQAは、領域的視覚的質問応答による科学的推論の評価に特化して設計された診断マルチモーダルベンチマークである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:56:01 GMT)
BESSTIE: A Benchmark for Sentiment and Sarcasm Classification for Varieties of English [8.8] BESSTIEは、オーストラリア(en-AU)、インド(en-IN)、イギリス(en-UK)の3種類の英語に対する感情と皮肉の分類のベンチマークである。
Google PlacesレビューのロケーションベースとRedditコメントのトピックベースフィルタリングの2つの方法を用いて,これらの言語品種のデータセットを収集した。
言語変異のネイティブ話者は、感情ラベルと皮肉ラベルでデータセットを手動で注釈付けする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:04:28 GMT)
Stable CDE Autoencoders with Acuity Regularization for Offline Reinforcement Learning in Sepsis Treatment [8.7] 敗血症治療のための効果的な強化学習(RL)は、不規則なICU時系列から、安定した、臨床的に有意な状態表現を学習することに依存する。
この研究は、制御微分方程式(CDE)状態表現が、2つの重要な因子が満たされたときに強いRLポリシーを達成できることを実証する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:10:51 GMT)
Language and Planning in Robotic Navigation: A Multilingual Evaluation of State-of-the-Art Models [8.6] 本研究では、ロボット工学における視覚・言語ナビゲーション(VLN)領域におけるアラビア語の統合に関する最初の研究について述べる。
我々は、最先端の多言語小言語モデル(SLM)の包括的評価を行う。
我々は,英語とアラビア語の両方で指示を与えると,ナビゲーションタスクの高レベルな計画が可能であることを実証する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:28:39 GMT)
Quantum Speedups for Multiproposal MCMC [8.6] より高速な量子多目的MCMC戦略であるQPMCMC2を提案する。
QPMCMC2は、多数の提案を計算する際に、ターゲット評価に$mathcalO(P)$と$mathcalO(log P)$ qubitsしか必要としない。
細菌進化ネットワーク上に構築された新しいIsing型モデルにQPMCMC2を適用することで,この柔軟性を示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:55:04 GMT)
ODD: Overlap-aware Estimation of Model Performance under Distribution Shift [8.6] 以前の作業では、分散シフトの下で実際のエラー境界を導出するために、不一致不一致(DIS2)を使用していた。
オーバーラップ・アウェア・ディスレパンシー(ODD)を考案する
ODDベースのバウンダリはドメインオーバラップを推定するためにドメイン分類器を使用し、DIS2よりもターゲット性能を予測します。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:05:42 GMT)
Magneto: Combining Small and Large Language Models for Schema Matching [8.4] 小型言語モデル (SLM) は訓練データと大規模言語モデル (LLM) を必要とする。
我々は、スキーママッチングのための費用効率が高く正確なソリューションであるMagnetoを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:36:16 GMT)
Digital Gatekeepers: Google's Role in Curating Hashtags and Subreddits [8.3] 本研究では,Googleのような検索エンジンが特定のハッシュタグやサブレディットを選択的にプロモートするか,あるいは抑制するかを検討する。
Googleのアルゴリズムは、性的に明示的な材料、陰謀論、広告、暗号通貨に関連するサブレディットやハッシュタグを抑圧する傾向がある。
これらの結果は、Googleのゲートキーピングの実践が、ユーザーが利用できるソーシャルメディアの物語をキュレートすることによって、公衆の会話に影響を与えることを示唆している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:10:39 GMT)
Do Construction Distributions Shape Formal Language Learning In German BabyLMs? [8.3] ドイツ語の児童向け/児童向け音声における発話レベルの構成分布が、小さなLMにおける単語レベル、構文、意味的能力に与える影響を解析した。
トレーニングデータ中の構造が著しく異なる場合、トラジェクトリは驚くほど堅牢であることがわかった。
発達的に妥当なデータに基づいて訓練されたLMは、言語学習にどのような種類の言語刺激がどのような影響を及ぼすかについての議論に寄与する可能性があると論じる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:44:18 GMT)
Solving High-Dimensional Partial Integral Differential Equations: The Finite Expression Method [8.2] 我々は高次元部分積分微分方程式(PIDE)を解くための新しい有限式法(FEX)を導入する。
FEX-PGと呼ばれる新しいFEXベースの手法は、高精度かつ解釈可能な数値解を提供する。
高次元設定では、FEX-PGは強力で頑健な性能を示し、単一の精度マシンのエプシロンの順序で相対誤差を達成している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:38:44 GMT)
VideoPDE: Unified Generative PDE Solving via Video Inpainting Diffusion Models [8.2] 本稿では,ビデオ・インペインティング拡散変換器モデルを用いて偏微分方程式(PDE)を解くための統一的な枠組みを提案する。
本研究では,細粒度,高忠実度インペイント,コンディショニングのための画素空間ビデオ拡散モデルを提案する。
提案手法は,多種多様なPDEと問題設定にまたがる高精度で汎用的なソリューションを提供し,最先端のベースラインよりも優れた性能を実現している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:15:17 GMT)
Efficient Global Optimization of Two-Layer ReLU Networks: Quadratic-Time Algorithms and Adversarial Training [8.2] 人工知能(ANN)ランドスケープの非制約性は、本質的に最適化上の困難をもたらす。
我々は,ANNをグローバル収束保証で訓練する2つの効率的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:09:41 GMT)
Transductive Conformal Inference for Full Ranking [8.1] 完全ランク付けアルゴリズムの不確かさを定量化するために,コンフォーマル予測(CP)に基づく手法を提案する。
我々は、$n+m$アイテムがブラックボックスのアルゴリズムによってランク付けされる特定のシナリオに焦点を当てる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:23:08 GMT)
SHADE-Arena: Evaluating Sabotage and Monitoring in LLM Agents [8.0] 大規模言語モデル(LLM)は、複雑で長い地平線設定において、自律的なエージェントとしてますます多くデプロイされている。
本研究では,フロンティアLSMの監視を回避し,有害な隠れた目標を達成する能力について検討する。
SHADE(Subtle Harmful Agent Detection & Evaluation)-Arenaを用いて,広い範囲のフロンティアLSMを評価した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:46:15 GMT)
Safe-Child-LLM: A Developmental Benchmark for Evaluating LLM Safety in Child-LLM Interactions [8.0] 子ども(7~12歳)と青年(13~17歳)の2つの発達段階において,AIの安全性を評価するためのベンチマークとデータセットであるSafe-Child-LLMを紹介した。
我々のフレームワークは、赤チームコーパスからキュレートされた200の敵のプロンプトからなる新しい多部データセットと、ジェイルブレイク成功のための人名ラベルと、標準化された0-5の倫理的拒絶尺度を含む。
ChatGPT、Claude、Gemini、LLaMA、DeepSeek、Grok、Vicuna、Mistralを含む主要なLCMを評価することで、子供向けシナリオにおける重大な安全性の欠陥が明らかになった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:13:08 GMT)
OrgAccess: A Benchmark for Role Based Access Control in Organization Scale LLMs [8.0] 大規模言語モデル(LLM)は、エンタープライズ環境での統合知識リポジトリとインテリジェントアシスタントとして機能する。
この重要な能力を評価することは、現実の企業データとアクセス制御ポリシーの独自性と機密性のため、本質的に難しい。
組織の役割やレベルに共通する40種類のパーミッションからなる,総合的かつ代表的な textbfOrgAccess ベンチマークを導入する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:48:29 GMT)
Distributionally-Constrained Adversaries in Online Learning [7.9] より汎用的で柔軟な分布制約のある敵の枠組みを考察し、敵が選択した分布からインスタンスを抽出する。
本稿では,この文脈で学習可能な分布クラスの特性について述べる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:02:12 GMT)
Multi-Source Music Generation with Latent Diffusion [7.8] マルチソース拡散モデル (Multi-Source Diffusion Model, MDM) は、複数の音源の混合として音楽をモデル化することを提案した。
MSLDMは変分オートエンコーダ(VAE)を使用して、各機器のソースを別個の潜在表現にエンコードする。
このアプローチは音楽の総生成と部分生成を大幅に強化する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:45:31 GMT)
Planning of Heuristics: Strategic Planning on Large Language Models with Monte Carlo Tree Search for Automating Heuristic Optimization [7.8] 大規模言語モデル (LLM) の自己回帰とモンテカルロ木探索 (MCTS) を統合する最適化手法である。
PoHは、そのパフォーマンスを評価し、改善提案を提供することによって、生成を反復的に洗練する。
本稿では,旅行セールスマン問題(TSP)とフローショップスケジューリング問題(FSSP)の解決にPoHを適用した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:33:00 GMT)
Resolving UnderEdit & OverEdit with Iterative & Neighbor-Assisted Model Editing [7.8] 大規模言語モデル(LLM)は下流のタスクに広くデプロイされているが、リトレーニングや微調整によって知識を最新に保つことは、しばしば計算コストがかかる。
モデル編集は、ターゲットとするパラメータのサブセットを更新することで、より効率的な代替手段を提供する。
本稿では,UnderEditを緩和するために連続的な編集を行う反復的モデル編集法と,OverEditの削減のために,編集中に近隣の知識を取り入れた近隣モデル編集法との2つの補完手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:33:26 GMT)
Improved energies and wave function accuracy with Weighted Variational Monte Carlo [7.7] 本稿では,変分モンテカルロ(VMC)を波動関数空間の勾配流として解釈し,続いて射影ステップを行う。
この観点からは、任意の確率分布をプロジェクションステップで使用することができ、状態空間の異なる領域の精度を優先することができる。
従来のVMCと比較して、重み付きVMCは基底状態エネルギーの誤差を2倍に減らし、局所エネルギーの誤差を102$-104$で減らした。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:51:44 GMT)
Sharp Generalization Bounds for Foundation Models with Asymmetric Randomized Low-Rank Adapters [7.7] Low-Rank Adaptation (LoRA) は、基礎モデルのパラメータ効率の高い微調整技術として広く採用されている。
最近の研究は、LoRAの低ランク因子の初期化において固有の非対称性を強調している。
本稿では,凍結ランダム因子をもつ非対称ロラの包括的理論的特徴付けに焦点をあてる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:55:13 GMT)
HiT-JEPA: A Hierarchical Self-supervised Trajectory Embedding Framework for Similarity Computation [7.6] セマンティック抽象化レベルを越えたマルチスケール都市軌道表現を学習するための統合フレームワークであるHiT-JEPAを提案する。
HiT-JEPAは、ポイントレベルの細粒度、中間パターン、高レベルの軌道抽象をキャプチャする3層階層構造を採用している。
軌道類似性のための実世界の複数のデータセットの実験は、HiT-JEPAの階層設計がよりリッチでマルチスケールな表現をもたらすことを示している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:46:03 GMT)
Inherently Faithful Attention Maps for Vision Transformers [7.5] 本稿では,学習した2値注意マスクを用いて,画像領域のみが予測に影響を与えることを保証するアテンションベース手法を提案する。
実験により,本手法は突発的相関やアウト・オブ・ディストリビューションの背景に対して,ロバスト性を大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:45:06 GMT)
Notes On Writing Effective Empirical Software Engineering Papers: An Opinionated Primer [7.5] 経験的ソフトウェア工学(ESE)研究における優れた科学的記述プラクティスは、ほとんど議論されず、文書化されていないようである。
それにもかかわらず、これらのプラクティスは、典型的なソフトウェアエンジニアリングカンファレンスやジャーナルの暗黙的あるいは明示的な評価基準である。
この実践的で教育第一の文書では、ESE論文を書くことで圧倒されたり混乱したりするかもしれない人にガイダンスを提供したいと思っています。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:45:49 GMT)
InkSight: Offline-to-Online Handwriting Conversion by Teaching Vision-Language Models to Read and Write [7.5] InkSightは、物理的なメモ取り者が自分の仕事(オフラインの筆跡)をデジタルのインク(オンラインの筆跡)に変換するのを助ける
当社のアプローチでは、事前の読み書きと組み合わせて、大量のペアのサンプルがない場合にモデルをトレーニングすることが可能です。
人間の評価では,HierTextデータセット上で得られたサンプルの87%が,入力画像の有効なトレースとして検討されている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:16:51 GMT)
Idioms: Neural Decompilation With Joint Code and Type Definition Prediction [7.4] 既存の神経脱コンパイルベンチマークよりもはるかに複雑で現実的な型を含む新しいデータセットであるRealtypeを紹介します。
提案手法は, ニューラルデコンパイルにおける最先端の結果をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:39:31 GMT)
SAE-V: Interpreting Multimodal Models for Enhanced Alignment [7.4] 本稿では,SAEパラダイムをマルチモーダルな言語モデルに拡張する機械的解釈可能性フレームワークであるSAE-Vを紹介する。
SAE-Vは、追加のモデルを必要としないモデルアライメントを強化するために、本質的なデータフィルタリングメカニズムを提供する。
本研究は,SAE-VがMLLMの解釈性とアライメントを向上し,その内部機構に関する知見を提供するものである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:51:36 GMT)
Self-Supervised Enhancement for Depth from a Lightweight ToF Sensor with Monocular Images [7.3] 本稿では,自己教師型学習フレームワークであるSelfToFを提案する。
提案手法は,NYUおよびScanNetデータセットの広範な実験により検証され,効率的かつ効果的である。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:43:53 GMT)
Hypothesis Testing for Quantifying LLM-Human Misalignment in Multiple Choice Settings [7.3] 我々は,大規模言語モデル(LLM)と実際の人間の行動の相違を,複数項目のアンケート設定で評価した。
この枠組みを,様々な公的な調査において,人々の意見をシミュレートするための一般的な言語モデルに適用する。
これにより、この言語モデルとテストされた人口との整合性に関する疑問が提起される。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:04:55 GMT)
Déjà Vu: Efficient Video-Language Query Engine with Learning-based Inter-Frame Computation Reuse [7.3] 本稿では、連続するフレーム間の計算を再利用することで、VTベースのビデオLMを高速化するビデオ言語クエリエンジンであるD'eja Vuを紹介する。
コアとなるReuseViTは、ビデオLMタスク用に特別に設計された修正ViTモデルであり、フレーム間の再利用機会を検出することを学ぶ。
D'eja Vuは、2%のエラーバウンド内で最大2.64倍の埋め込み生成を加速し、大規模なビデオ解析のためのビデオLMの実用性を劇的に向上させることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:59:10 GMT)
Querying functional and structural niches on spatial transcriptomics data [7.2] 空間転写学は、空間的文脈における遺伝子発現のプロファイリングを可能にする。
空間ニッチは、生理的および病理学的過程において凝集的かつ反復的な単位として機能することが明らかにされている。
我々は、ニッチ・オブ・ニッチ(NOI)を与えられたSTサンプル間で類似したニッチを識別するニッチ・クエリータスクを定義した。
我々は、この課題を解決するための特殊な方法であるQueSTを開発した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:33:44 GMT)
Harvesting correlations from BTZ black hole coupled to a Lorentz-violating vector field [7.2] ローレンツ違反は、時空の量子的性質として、時空で符号化された量子情報容量に固有の制約を課す可能性がある。
ローレンツ対称性の破れは、交絡影領域を拡張し、量子相関に対する破壊的な効果を示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:18:18 GMT)
One Size Fits None: Rethinking Fairness in Medical AI [7.2] 現実の医療データセットは、しばしばうるさい、不完全、不均衡である。
差異はフェアネスの懸念を生じさせ、特にマージン化グループに対する既存の不利を補強する場合に顕著である。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:59:02 GMT)
ELLIS Alicante at CQs-Gen 2025: Winning the critical thinking questions shared task: LLM-based question generation and selection [7.2] この研究は、ACL 2025と共同で行った第12回Argument Miningワークショップの共有タスクの一部である。
本稿では,2つの小規模オープンソース言語モデルを含む2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:10:51 GMT)
HyMamba: Mamba with Hybrid Geometry-Feature Coupling for Efficient Point Cloud Classification [7.1] Geometry-Feature Coupled Pooling (GFCP)は局所的な特徴に隣接する幾何学的情報を動的に集約する。
提案したモデルは,特にModelNet40データセットにおいて,精度が95.99%に向上し,0.03Mの追加パラメータが得られた。さらに,ModelNetShotデータセットでは98.9%の精度を実現し,スパースサンプル下での堅牢な一般化能力を検証している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:40:21 GMT)
A Unified Framework for Next-Gen Urban Forecasting via LLM-driven Dependency Retrieval and GeoTransformer [7.1] 本研究では,高次元都市予測のための新しい統一的枠組みを提案する。
我々のフレームワークはモジュール化されており、多様な表現方法や予測モデルをサポートし、最小限の入力でも操作できる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:03:07 GMT)
Detectability of post-Newtonian classical and quantum gravity via quantum clock interferometry [7.1] 本稿では,ニュートン後の重力が量子システムにどう影響するかを実験的に検討する手法を提案し,理論的に分析する。
i) 回転する質量の重力場を検出するために設計された量子クロック干渉計の構成と(ii) 量子系間の絡み合いを媒介できるかどうかを探索するスキームである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:03:22 GMT)
Compositional Attribute Imbalance in Vision Datasets [7.0] 視覚属性辞書を構築するためのCLIPベースのフレームワークを導入し,画像属性の自動評価を可能にする。
単属性不均衡と構成属性不均衡の両方を解析することにより,属性の希少性がモデル性能に与える影響を明らかにする。
本研究は,視覚属性分布のモデル化の重要性を強調し,ロングテール画像分類タスクにスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:28:07 GMT)
Eigenstate Thermalization and its breakdown in Quantum Spin Chains with Inhomogeneous Interactions [7.0] 固有状態熱化仮説 (ETH) は、孤立量子多体系におけるエルゴディディティと熱化の基準を確立する成功理論である。
本研究では, 線形不均一相互作用を有するスピン=1/2 $ XXZ鎖の熱重合特性について検討した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:22:07 GMT)
ADRD: LLM-Driven Autonomous Driving Based on Rule-based Decision Systems [7.0] 我々は、情報モジュール、エージェントモジュール、テストモジュールの3つのコアモジュールを統合するADRDフレームワークを紹介します。
このフレームワークは、自律運転決定タスクにおいて優れたパフォーマンスを示す。
これは、大規模な言語モデルとルールベースのシステムを統合して、自律的な運転意思決定を行う最初の作業である。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:18:20 GMT)
Capacity Matters: a Proof-of-Concept for Transformer Memorization on Real-World Data [6.9] 本稿では,モデルアーキテクチャとデータ構成が生成変換器の実証記憶能力に与える影響について検討する。
これらのモデルは、SNOMED(Systematized Nomenclature of Medicine)から得られた合成テキストデータセットを用いて訓練される
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:42:54 GMT)
Sketch-Plan-Generalize: Learning and Planning with Neuro-Symbolic Programmatic Representations for Inductive Spatial Concepts [6.7] 限られた数のデモからパーソナライズされた概念を学習するためのアプローチを開発する。
私たちのパイプラインは、一般化とモジュラー再使用を促進し、継続的な概念学習を可能にします。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:11:09 GMT)
Exploring Diffusion with Test-Time Training on Efficient Image Restoration [6.7] DiffRWKVIRは、効率的な拡散を伴うテスト時間トレーニング(TTT)を統合する新しいフレームワークである。
本手法は,ハードウェアの最適化による適応的,高効率な画像復元のための新しいパラダイムを確立する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:01:59 GMT)
Relation between quantum illumination and quantum parameter estimation [6.6] 本稿ではQIの信号対雑音比とパラメータ推定のための量子フィッシャー情報との本質的な関係を明らかにする。
我々はこの関係を、エキゾチックな非ガウス状態を用いる様々なターゲット検出プロトコルに適用する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:48:21 GMT)
A Quantum Annealing Approach for Solving Optimal Feature Selection and Next Release Problems [6.6] サブルーチンとして量子アニーリングを導入し,多目的検索に基づくソフトウェア工学の問題に取り組む。
小規模な問題に対して、量子処理のためのペナルティベースのマッピングを用いて、多目的最適化(MOO)を単目的最適化(SOO)として再構成する。
大規模問題に対しては,局所探索効率を高めるために,最大エネルギー衝突(MEI)を最急降下法で導いた分解戦略を用いる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:46:53 GMT)
Surprise Calibration for Better In-Context Learning [6.6] In-context Learning (ICL) は、大規模言語モデルにおけるタスク適応のための強力なパラダイムとして登場した。
既存のバイアス校正法は、すべての入力に対して固定クラス事前を適用し、動的ICL設定におけるそれらの有効性を制限している。
本稿では,クラス先行の時間的ダイナミクスをキャプチャする新しいメソッド・サプライズ(SC)を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:46:17 GMT)
Computational Studies in Influencer Marketing: A Systematic Literature Review [6.5] 本稿では,インフルエンサーマーケティングにおける計算研究の現状について概説する。
このレビューでは、インフルエンサーの識別と性格化、広告戦略とエンゲージメント、スポンサードコンテンツ分析と発見、フェアネスの4つの主要な研究テーマを特定した。
主要な発見は、規制の遵守と倫理的配慮に限定された、商業的な成果の最適化に強く焦点を絞っていることを示している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:05:57 GMT)
Is DeepSeek a New Voice Among LLMs in Public Opinion Simulation? [6.5] 本研究は,オープンソース大規模言語モデル (LLM) が,IT企業によって開発されたモデルと比較して,世論をシミュレートする能力を評価するものである。
以上の結果から,DeepSeek-V3は中絶問題に対する米国の意見のシミュレートに最善を尽くしていることが明らかとなった。
中国のサンプルでは、DeepSeek-V3は、外国援助や個人主義についての意見をシミュレートする上で最善を尽くしているが、資本主義に関するモデリングの観点には限界がある。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:19:14 GMT)
CausalDiffTab: Mixed-Type Causal-Aware Diffusion for Tabular Data Generation [6.4] 混合データを扱うために特別に設計された拡散モデルに基づく生成モデルCausalDiffTabを紹介する。
階層型先行核融合の原理に基づくハイブリッド適応因果正則化法を提案する。
7つのデータセットで実施された実験は、CausalDiffTabがすべてのメトリクスでベースラインメソッドを上回っていることを示している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:48:44 GMT)
synth-dacl: Does Synthetic Defect Data Enhance Segmentation Accuracy and Robustness for Real-World Bridge Inspections? [6.4] シンスダクラ(synth-dacl)は、合成コンクリートのテクスチャに基づく3つの新しいデータセット拡張のコンパイルである。
15個の摂動テストセットでモデルロバスト性を大幅に改善する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:17:15 GMT)
IntelliLung: Advancing Safe Mechanical Ventilation using Offline RL with Hybrid Actions and Clinically Aligned Rewards [6.4] 集中治療室(ICU)における感染性機械換気(Invasive Mechanical ventilation, MV)は重症心疾患患者に対する生命維持療法である
現在の最先端(SOTA)法は、MVアクションのハイブリッドな(連続的で離散的な)性質に苦慮している。
本稿では、離散的な行動空間の課題に対処するために、行動空間削減における先行作業に基づいて構築される最適化を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:17:26 GMT)
Spline Dimensional Decomposition with Interpolation-based Optimal Knot Selection for Stochastic Dynamic Analysis [6.4] スプライン次元(SDD)は、結び目配置を介して入力座標を分割することで非滑らかまたは局所非線形挙動に対処する。
SDDにおける最適結び目選択のための計算効率が高く,計算コストが高い手法を提案する。
低制御アームのモーダル解析により、提案した結び目付きSDDは、一様またはランダムに配置された結び目付きSDDよりも高い精度が得られることが示された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:35:48 GMT)
Hope Speech Detection in code-mixed Roman Urdu tweets: A Positive Turn in Natural Language Processing [6.3] 本研究では,ロマン・ウルドゥ・ホープ音声のためのマルチクラスアノテートデータセットについて紹介する。
希望の心理的基礎を探求し、その言語パターンを分析する。
ローマ・ウルドゥーの統語的・意味的変動性を最適化するカスタムアテンションベースのトランスフォーマーモデルを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:31:04 GMT)
Faster Acceleration for Steepest Descent [6.3] 非ユークリッド滑らか性仮定の下での凸最適化のための新しい高速化一階法を提案する。
我々の方法は、一階のオラクルへの呼び出しで最大$O(d1-frac2p)$のイテレーション改善を提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:17:38 GMT)
A Variational Information Theoretic Approach to Out-of-Distribution Detection [6.3] 本稿では,ニューラルネットワークにおけるアウト・オブ・ディストリビューション(OOD)検出機能の構築の理論を提案する。
我々の理論は、明確に説明可能な様々な新機能を構築するための一般的な枠組みを提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:17:36 GMT)
Generalization error bound for denoising score matching under relaxed manifold assumption [6.2] 非パラメトリックガウス混合による観測密度をモデル化する。
標準多様体の仮定を緩和し、サンプルを多様体から遠ざけるようにする。
評価値の近似と誤差の非漸近的境界を導出する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:04:49 GMT)
Deep Learning Surrogates for Real-Time Gas Emission Inversion [6.1] 過渡的な大気環境下での温室効果ガス排出量のリアルタイム同定と定量化は、環境モニタリングにおいて重要な課題である。
本稿では,モンテカルロシーケンシャルアルゴリズムを組み込んだディープラーニング計算流体力学(CFD)フレームワークを提案する。
高忠実度CFD出力で訓練された多層パーセプトロンを用いてコストの高い数値計算器を置換することにより、サロゲートは、ほぼリアルタイムな予測を行いながら、空間的不均一性とガス分散の時間的進化を捉える。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:03:21 GMT)
Generalized Reference Kernel With Negative Samples For Support Vector One-class Classification [6.1] 本稿では、いくつかの負のサンプルが利用可能な小規模の1クラス分類に焦点を当てる。
1クラスサポートベクトルマシン(OC-SVM)のための負サンプル付き一般化参照カーネル(GRKneg)を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:07:13 GMT)
Unsupervised Skill Discovery through Skill Regions Differentiation [6.1] 教師なし強化学習(英語: Unsupervised Reinforcement Learning, RL)は、下流タスクの学習を加速できる多様な行動を発見することを目的としている。
本稿では,他のスキルの探索領域からの1つのスキルの状態密度のずれを最大化する新しいスキル発見目標を提案する。
また、学習したオートエンコーダに基づいて、コンパクトな潜在空間におけるカウントベースの探索に類似した本質的な報酬を定式化する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:30:04 GMT)
FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization [6.1] FEASTはフレキシブルな食事時間支援システムで、Wildでパーソナライズできる。
当社のシステムは,適応性,透明性,安全性の3つのキーテットによって誘導されている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:30:11 GMT)
Comprehensive Verilog Design Problems: A Next-Generation Benchmark Dataset for Evaluating Large Language Models and Agents on RTL Design and Verification [6.1] ハードウェアと検証の研究を進めるための新しいデータセットとインフラであるComprehensive Verilog(CVDP)ベンチマークを提示する。
CVDPには、検証、デバッグ、生成、アライメント、技術的Q&Aなど、タスクカテゴリにまたがる783の問題がある。
問題は非エージェント型とエージェント型の両方で提供される。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 00:11:13 GMT)
StreetLens: Enabling Human-Centered AI Agents for Neighborhood Assessment from Street View Imagery [6.0] 我々は、近隣研究のための研究者構成可能なAIシステムであるStreetLensを紹介する。
StreetLensは、スケーラブルな近隣環境アセスメントのためのビジョン言語モデルに、関連する社会科学の専門知識を組み込んでいる。
客観的特徴から主観的知覚まで幅広い意味的アノテーションを生成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:06:03 GMT)
Union-Intersection Union-Find for Decoding Depolarizing Errors in Topological Codes [6.0] 位相符号の非分極誤りを復号するUnion-Intersection Union-Find (UIUF)アルゴリズムを提案する。
UIUFはUnion-Findを著しく上回り、論理エラー率を1桁以上(約10~5ドル)下げることを示した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:30:14 GMT)
Iterative Camera-LiDAR Extrinsic Optimization via Surrogate Diffusion [5.9] カメラとLiDARは自動運転車に不可欠なセンサーだ。
代理拡散に基づく多目的反復型フレームワークを提案する。
このフレームワークは、アーキテクチャの変更を必要とせずに、キャリブレーション手法の性能を向上させることができる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:44:51 GMT)
Beyond Force Metrics: Pre-Training MLFFs for Stable MD Simulations [5.9] 機械学習力場(MLFF)は、初期分子動力学(MD)シミュレーションを高速化するための有望なソリューションとして登場した。
本研究では,グラフニューラルネットワークモデルであるGemNet-TをMLFFとして採用し,2つのトレーニング戦略について検討する。
安定なMDシミュレーションでは,低力率の誤差が必ずしも保証されないことがわかった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 00:58:56 GMT)
ReDASH: Fast and efficient Scaling in Arithmetic Garbled Circuits for Secure Outsourced Inference [5.8] ReDashはDashの算術的なガーブロード回路を拡張し、アウトソース推論をセキュアにするためのより柔軟で効率的なフレームワークを提供する。
ReDashは、残余数システムの一般化されたベース拡張に基づく新しいガーブラードスケーリングガジェットを導入することで、Dashのスケーリング制限を2つのパワーのみに制限する。
ReDashは、Dashと比較して、全体の推論時間において最大33倍のスピードアップを達成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:09:49 GMT)
MAS-LitEval : Multi-Agent System for Literary Translation Quality Assessment [5.7] 文学翻訳は、文化的ニュアンスと様式的な要素を保存する必要がある。
BLEUやMETEORといった従来のメトリクスは、語彙重なりに重点を置いているため、評価に失敗する。
言語モデル(LLM)を用いたマルチエージェントシステムMAS-LitEvalを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:33:40 GMT)
FORTRESS: Frontier Risk Evaluation for National Security and Public Safety [5.5] 現在のベンチマークは、国家の安全と公共の安全リスクに対する安全の堅牢性をテストするのに失敗することが多い。
forTRESS:500人の専門家による敵のプロンプトと4-7のバイナリー質問のインスタンスベースのルーリックについて紹介する。
各プロンプト-ルブリックペアは、モデルオーバーリフレクションをテストするための対応する良性バージョンを持つ。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:08:02 GMT)
Fair Algorithms with Probing for Multi-Agent Multi-Armed Bandits [5.5] 我々は、割り当て前に選択した武器に関する情報を戦略的に収集する新しい探索フレームワークを導入する。
報奨分布が知られているオフライン環境では、準モジュラ特性を利用して、証明可能な性能境界を持つ欲求探索アルゴリズムを設計する。
より複雑なオンライン設定では、公平性を維持しながらサブ線形後悔を実現するアルゴリズムを開発する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:43:21 GMT)
IKDiffuser: Fast and Diverse Inverse Kinematics Solution Generation for Multi-arm Robotic Systems [5.5] IKDiffuserは、多腕ロボットシステムのための高速で多様なIKソリューション生成のために設計された拡散モデルである。
IKDiffuserは構成空間上の結合分布を学習し、複雑な依存関係をキャプチャする。
6つの異なるマルチアームシステムの実験において、提案したIKDiffuserは優れた解の精度、精度、多様性、計算効率を達成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:43:30 GMT)
Accelerating RLHF Training with Reward Variance Increase [5.3] 人間からのフィードバックからの強化学習(RLHF)は、学習後の段階において、大きな言語モデル(LLM)が人間の価値観や嗜好と一致していることを保証するための重要な技術である。
本稿では,報酬分散を良好に増加させ,相対的な選好報酬期待値を維持することで,成功度HFトレーニングを加速する報奨調整モデルを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:41:40 GMT)
ResNets Are Deeper Than You Think [5.3] 残余の接続は、導入から10年近く経っても、現代のニューラルネットワークアーキテクチャにおいてユビキタスである。
彼らの広く採用されていることは、しばしばその訓練能力が劇的に向上したと信じられている。
残余接続は、最適化以上の性能上の優位性を示し、代わりに、自然データの構造に合わせたより深い帰納バイアスを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:33:22 GMT)
Towards Perception-based Collision Avoidance for UAVs when Guiding the Visually Impaired [5.2] 視覚障害者の周辺部における地域計画のための知覚に基づく経路計画システムを提案する。
本稿では,UAVとVIPの障害回避のためのマルチDNNベースのフレームワークを提案する。
大学キャンパス環境におけるドローン人間システムによる評価により,アルゴリズムの有効性が検証された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:08:30 GMT)
PoseGRAF: Geometric-Reinforced Adaptive Fusion for Monocular 3D Human Pose Estimation [5.2] 既存の単眼的な3次元ポーズ推定法は, 骨格の内在方向と角方向の相関性を見越しながら, 関節位置の特徴に依存している。
これらの課題に対処するためのPoseGRAFフレームワークを提案する。
Human3.6M と MPI-INF-3DHP のデータセットによる実験結果から,本手法が最先端の手法を超えることが示された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:59:56 GMT)
Spatiotemporal Learning of Brain Dynamics from fMRI Using Frequency-Specific Multi-Band Attention for Cognitive and Psychiatric Applications [5.2] MBBN(Multi-Band Net Brain)は、周波数特異的脳波を明示的にモデル化するトランスフォーマーベースのフレームワークである。
MBBNは3つの大規模なコホートで49,673人の個人を訓練し、精神医学と認知学の成果を予測する新しい最先端技術を確立している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:03:59 GMT)
MDBench: A Synthetic Multi-Document Reasoning Benchmark Generated with Knowledge Guidance [5.2] MDBenchは,多文書推論のタスクにおいて,大規模言語モジュール (LLM) を評価するための新しいデータセットである。
我々は、新しい合成生成プロセスを使用し、困難な文書セットを制御および効率よく生成することができる。
MDBENCHがすべての手法において重要な課題となることを発見した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:14:30 GMT)
Balancing Caregiving and Self-Care: Exploring Mental Health Needs of Alzheimer's and Dementia Caregivers [5.0] アルツハイマー病(英語: Alzheimer's Disease and Related Dementias、AD/ADRD)は、記憶、思考過程、機能に障害がある進行性神経変性疾患である。
AD/ADRD患者の家族介護者は、長期的な介護責任のため、大きなメンタルヘルス上の課題に直面している。
本研究は,介護者の精神的健康への懸念を調査し,介護者の負担管理の実践に焦点をあてた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:25:12 GMT)
Thunder-NUBench: A Benchmark for LLMs' Sentence-Level Negation Understanding [4.9] 否定は言語モデル(LLM)に永続的な課題をもたらす基本的な言語現象である
既存のベンチマークは、自然言語推論のような幅広いタスクにおいて、否定をサイドケースとして扱うことが多い。
textbfThunder-NUBenchは文レベルの否定的理解を評価するために設計された新しいベンチマークである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:51:39 GMT)
Seewo's Submission to MLC-SLM: Lessons learned from Speech Reasoning Language Models [4.9] MLC-SLM(Multilingual Conversational Speech Language Model Challenge)の両トラック用システム
ASRのための音声モデルにおいて、推論と自己補正を明確に強化する多段階学習パイプラインを導入する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:15:17 GMT)
Input-dependence in quantum reservoir computing [4.9] 量子貯水池計算は、時間情報処理に量子力学系を利用する創発的な分野である。
以前の研究で、量子貯水池を価値のあるものにする特徴が見つかった: 量子貯水池チャネルの入力依存固定点への収縮力学である。
この研究は、入力依存の観点から貴重な量子貯水池の分析に寄与する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:46:21 GMT)
POCO: Scalable Neural Forecasting through Population Conditioning [4.8] POCOは、ニューロン固有のものと脳全体のダイナミクスの両方をキャプチャする統合された神経予測モデルである。
ゼブラフィッシュ、マウス、およびC. elegansにまたがる5つのカルシウムイメージングデータセットで訓練され、POCOは自然行動における細胞の分解における最先端の精度を達成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:15:04 GMT)
Sparsity-Based Interpolation of External, Internal and Swap Regret [4.8] 本稿では,オンライン学習におけるエキスパート問題に焦点をあてる。
最適な$O(sqrtTlog d)$external regret bound when $dmathrmunif_phi=d$, the standard $tilde O(sqrtT)$ internal regret bound when $dmathrmself_phi=d-1$, and the optimal $tilde O(sqrtdT)$ swap regret bound in the worst case, we improve on existing algorithm in the intermediate regimes。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:29:10 GMT)
Spin Correlations in Recirculating Multipass Alkali Cells for Advancing Quantum Magnetometry [4.6] マルチパスセルは、様々な量子技術において重要な構成要素である。
光磁気計では、マルチパスジオメトリーによって光深度を増大させることで感度が向上する。
本稿では, アクティブ・ツー・セルの体積比を向上し, ビームスポットの重なりを最小化する, 新規な循環型多孔質アルカリセルを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:49:31 GMT)
SPARQ: Synthetic Problem Generation for Reasoning via Quality-Diversity Algorithms [4.6] SPARQ: Quality-Diversity Algorithmによる推論のための合成問題生成について述べる。
1つのモデルのみを用いて高品質で多様な合成数学問題と解対を生成する。
本研究では, 生成したデータを難易度でフィルタリングし, 同じモデルを微調整することで, 相対モデルの性能を最大24%向上させることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:55:30 GMT)
DETONATE: A Benchmark for Text-to-Image Alignment and Kernelized Direct Preference Optimization [4.5] 本稿では,テキスト・トゥ・イメージ(T2I)モデルのためのDPOカーネルについて紹介する。
約100Kのキュレートされた画像対からなる,最初の大規模ベンチマークであるDETONATEを紹介する。
また,アライメント品質指数 (AQI) も提案する。これは,安全かつ安全でない画像のアクティベーションの潜在空間分離性を示す新しい幾何学的尺度である。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:17:35 GMT)
A large-scale heterogeneous 3D magnetic resonance brain imaging dataset for self-supervised learning [4.5] FOMO60Kは、13,900件のセッションと11,187件の被験者から得られた60,529個の脳磁気共鳴イメージング(MRI)の大規模な、異種データセットである。
新規ユーザへの入力障壁を低減しつつ、元の画像特性を保存するために、最小の事前処理を適用した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:48:05 GMT)
On the attainment of the Wasserstein--Cramer--Rao lower bound [4.5] クレーマー-ラオ不等式のワッサーシュタイン類似体は、ワッサースタイン情報行列(オットー計量)を用いて開発されている。
この不等式は、加法雑音に対するロバスト性を定量化する推定器のワッサーシュタイン分散の低い境界を与える。
ワッサーシュタイン-クラマー-ラオ下界を得るための推定器の条件について検討し、これを(漸近的な)ワッサーシュタイン効率と呼ぶ。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:04:48 GMT)
Adaptive Data Augmentation for Thompson Sampling [4.4] 線形文脈的包帯において、その目的は累積報酬を最大化する行動を選択することである。
トンプソンサンプリングは経験的にうまく機能するが、最適の後悔境界は達成しない。
本稿では,線形文脈帯域に対するほぼ最小のトンプソンサンプリングを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:57:33 GMT)
AI-Generated Game Commentary: A Survey and a Datasheet Repository [4.4] AIGGCの一般的なフレームワークを導入し、45の既存のゲームコメンタリーデータセットとメソッドの包括的調査を行う。
将来の研究ベンチマークをサポートするため、構造化された付録も提供しています。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:04:51 GMT)
Proposal for Improving Google A2A Protocol: Safeguarding Sensitive Data in Multi-Agent Systems [4.4] 本稿では、既存のプロトコルをレビューし、その制限を特定し、セキュリティ、プライバシ、信頼を改善するための具体的な拡張を提案する。
これには、問題と解決策、研究支援の合理性、実装に関する考察を説明する具体的な例が含まれている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:17:43 GMT)
Collaborative Editable Model [4.4] 我々は,ユーザの分散ドメインスニペットから候補知識プールを構築するコラボレーティブ・エディタブル・モデル(CoEM)を導入する。
高価値知識により、LLMはより正確でドメイン固有のコンテンツを生成することができる。
財務情報シナリオでは、約120人のユーザから15kのフィードバックを収集し、CoEMをユーザ評価で検証し、生成された洞察の質を評価する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:20:41 GMT)
RMIT-ADM+S at the SIGIR 2025 LiveRAG Challenge [4.4] 本稿では,SIGIR 2025 LiveRAG ChallengeにおけるRMIT--ADM+S参加について述べる。
我々のGAG(Generation-Retrieval-Augmented Generation)アプローチは、元の質問とともに、検索フェーズで使用される仮説的な回答を生成することに依存しています。
システムアーキテクチャと設計選択の背後にある根拠について説明する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:41:12 GMT)
Toward a Graph Foundation Model: Pre-Training Transformers With Random Walks [4.3] 本稿では,Transformerのバックボーンを適応させることにより,多様なグラフデータセットで事前学習したグラフ基盤モデルへのアプローチについて述べる。
この目的に向けた中心的な課題は、シーケンスモデルがどのように異なるサイズと異なるドメインのグラフをエンコードするかである。
本研究では、これらのランダムウォークに対する新しい文脈予測損失を開発し、その表現力を理論的に分析し、近隣とグラフを区別する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:28:34 GMT)
Synthesizing Performance Constraints for Evaluating and Improving Code Efficiency [4.3] We present WEDGE, a framework for performance-stressing input given the program under test。
WEDGEは、プログラムの実行空間をパフォーマンス固有の領域に分割するために、分岐条件の形で明示的なパフォーマンス特性制約を合成する。
評価の結果、WEDGEは、CodeContestsのテストや既存のアプローチによって最適化されていると主張されたテストと比較して、大幅にスローダウンしていることがわかった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:45:19 GMT)
Adaptive Graph Shrinking for Quantum Optimization of Constrained Combinatorial Problems [4.3] 最適化問題のQUBO定式化における変数数と制約を減らすために,グラフ縮小に基づく古典量子ハイブリッドフレームワークを提案する。
提案手法は, ソリューションの実現性の向上, 修理の複雑さの低減, ハードウェア限定インスタンスの量子最適化品質の向上を実現する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:11:48 GMT)
Mouse Lockbox Dataset: Behavior Recognition for Mice Solving Lockboxes [4.2] 複雑な機械パズル、いわゆるロックボックスを解く個々のマウスのビデオデータセットを提示する。
110時間以上のプレイタイムは、3つの異なる視点から記録された行動を示す。
フレームレベルの行動分類手法のベンチマークとして、2つの異なるマウスのすべてのビデオに対して、人間のアノテーション付きラベルを提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:05:18 GMT)
Cross-Modal Geometric Hierarchy Fusion: An Implicit-Submap Driven Framework for Resilient 3D Place Recognition [4.2] 本稿では,密度に依存しない幾何学的推論により3次元位置認識を再定義するフレームワークを提案する。
具体的には、元のシーンポイント雲密度の干渉に免疫する弾性点に基づく暗黙の3次元表現を導入する。
これら2種類の情報を活用することで,鳥眼視と3Dセグメントの両視点から幾何学的情報を融合する記述子を得る。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:04:07 GMT)
Uniform Mean Estimation for Heavy-Tailed Distributions via Median-of-Means [4.2] The Median of Means (MoM)は、ヘビーテールデータの文脈で人気を得た平均推定器である。
独立性のある新しい対称性技術を用いて,新しい試料の複雑さを証明した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:07:36 GMT)
Uncertainty-Driven Radar-Inertial Fusion for Instantaneous 3D Ego-Velocity Estimation [4.2] 本稿では,高分解能イメージングレーダと慣性測定ユニットを統合することで,自律走行におけるエゴ速度を推定する方法を提案する。
ニューラルネットワークを用いて、複雑な値の生レーダデータを処理し、関連する不確実性とともに、瞬時線形エゴ速度を推定する。
この不確実性を考慮した速度推定は拡張カルマンフィルタを用いて慣性測定単位データと統合される。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:10:39 GMT)
A multi-stage augmented multimodal interaction network for fish feeding intensity quantification [4.2] 本研究では,魚の摂餌強度を定量化するためのマルチステージマルチモーダルインタラクションネットワーク(MAINet)を提案する。
MAINetは96.76%、96.78%、96.79%、96.79%の精度、精度、リコール、F1スコアに達した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:09:43 GMT)
Plug-and-Play with 2.5D Artifact Reduction Prior for Fast and Accurate Industrial Computed Tomography Reconstruction [4.0] コーンビームX線CT (XCT) は, 内部構造を3次元再構成する上で必要不可欠なイメージング技術である。
プラグイン・アンド・プレイトモグラフィー再構成フレームワークにアーティファクト・リダクションを組み込んだ最近の成果は有望である。
また, この2.5D前のモデルでは, 復元の質が向上するだけでなく, 一般的に発生するXCTアーティファクトを直接抑制できることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:52:57 GMT)
The Tech DEI Backlash -- The Changing Landscape of Diversity, Equity, and Inclusion in Software Engineering [3.9] 短期間、反発の波が多くの企業が多様性、平等、包括的戦略を再評価している。
私たちは、企業が戦略を再考することで、本当に反発に応えていると認識しています。
それとは対照的に、少なくとも今のところは、政治的に困難な状況にもかかわらず、DeI戦略を継続する企業もある。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:45:17 GMT)
Evolution of ESG-focused DLT Research: An NLP Analysis of the Literature [3.7] DLT(Distributed Ledger Technology)は、環境監視の強化に直面している。
既存のDLTの文献レビューでは、フィールドの複雑さとESGの懸念を完全に把握できなかった。
自然言語処理(NLP)を用いて24,539の出版物の全文を,DLT用の39,427のエンティティを手動でラベル付けしたNERデータセットを用いて解析した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:32:54 GMT)
Chatting with Papers: A Hybrid Approach Using LLMs and Knowledge Graphs [3.7] このデモでは、大規模な言語モデルと知識グラフを組み合わせて、コレクションによるナビゲーションをサポートする新しいワークフローのtextitGhostWriterが報告されている。
textitGhostWriterは、バックエンドの textitEverythingDataに基づいて、コレクションと'クエリとチャット'が可能なインターフェイスを提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:48:44 GMT)
RL-Obfuscation: Can Language Models Learn to Evade Latent-Space Monitors? [3.7] RL-Obfuscationを導入し、LLMを強化学習により微調整し、潜時空間モニタをバイパスする。
トークンレベルの潜時空間モニタは、この攻撃に対して非常に脆弱であることがわかった。
本研究では,同一タイプのモニタに対して,単一の静的モニタの一般化を回避するために訓練された敵ポリシーを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:22:20 GMT)
Bridging Social Media and Search Engines: Dredge Words and the Detection of Unreliable Domains [3.7] 我々はWebグラフとソーシャルメディアのコンテキストを統合したWebサイト信頼性分類・発見システムを開発した。
本稿では,信頼できないドメインが検索エンジン上で高いランクを付けるような単語,用語,フレーズの概念を紹介する。
私たちは、ソーシャルメディアとオンラインコマースプラットフォームとの強いつながりを強調した、ドレッジワードの新たなデータセットをリリースしました。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:39:08 GMT)
FormGym: Doing Paperwork with Agents [3.6] 55の文書と3つのタスクにまたがる432のフィールドからなる新しいフォームフィリングベンチマークを提案する。
基準VLAは、ほとんどの場合、主にローカライゼーション能力の低いため、1%未満の精度で達成できることがわかった。
また、フォームにテキストを配置する場所を特定する上で、LLMを支援するツールであるFieldFinderにもコントリビュートしています。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 00:32:25 GMT)
Physics-Embedded Neural Networks for sEMG-based Continuous Motion Estimation [3.6] sEMGに基づく運動推定法は、しばしば、校正が難しい主観特異的筋骨格モデル(MSK)に依存する。
本稿では,解釈可能なMSKフォワード力学とデータ駆動残差学習を組み合わせた新しい物理埋め込みニューラルネットワーク(PENN)を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:07:20 GMT)
Optimal estimation of three parallel spins with genuine and restricted collective measurements [3.5] 我々は,制限された集団測定と,マルチパーティイト環境における真の集団測定の区別について検討した。
両分離可能な測定値の最大推定精度について解析式を導出する。
我々の研究は、量子状態ではなく、量子測定における多部非古典性の豊かな風景を明らかにしている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:00:31 GMT)
NeuroMoE: A Transformer-Based Mixture-of-Experts Framework for Multi-Modal Neurological Disorder Classification [3.5] Deep Learningは最近、診断を助けるために医療データから意味のあるパターンを抽出する強力なツールとして登場した。
神経疾患を分類するための新しいトランスフォーマーベースのMixture-of-Experts(MoE)フレームワークを提案する。
我々のフレームワークは82.47%の検証精度を達成し、ベースライン法を10%以上上回っている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:40:06 GMT)
When Does Meaning Backfire? Investigating the Role of AMRs in NLI [3.5] 自然言語推論(NLI)は前提と仮説の意味的内容を適切に解析することに大きく依存している。
抽象的意味表現(AMR)という形で意味情報を追加することで,事前学習した言語モデルをNLIでより一般化できるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:12:54 GMT)
AviationLLM: An LLM-based Knowledge System for Aviation Training [3.5] 本稿では、直接選好最適化(RALA-DPO)による検索型LLMアライメントを提案する。
我々は、オープンソースで事前訓練されたLLM Qwenを選択し、DPOベースのドメインアライメントによる航空理論のトレーニングに適応する。
統合されたRAG機構により、回答の精度をさらに向上し、ゼロコストの知識更新を同時に達成することができる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:20:09 GMT)
Hybrid Time-Domain Behavior Model Based on Neural Differential Equations and RNNs [3.4] 本稿では,新しい連続時間ドメインハイブリッドモデリングパラダイムを提案する。
ニューラルネットワーク差分モデルとリカレントニューラルネットワーク(RNN)を統合し、NODE-RNNとNCDE-RNNモデルを作成する。
理論的解析により、このハイブリッドモデルは事象駆動型動的突然変異応答と伝播安定性において数学的に有利であることが示された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:15:03 GMT)
ClusterChat: Multi-Feature Search for Corpus Exploration [3.4] ClusterChatは、クラスタベースのドキュメント組織を統合するコーパス探索用のオープンソースのシステムである。
我々は,400万の抽象PubMedデータセットを2つのケーススタディで検証した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:18:09 GMT)
A Computational Framework for Simulations of Dissipative Non-Adiabatic Dynamics on Hybrid Oscillator-Qubit Quantum Devices [3.3] 本稿では,回路量子力学プラットフォーム上での非断熱的ビブロニックダイナミクスをシミュレーションするための計算フレームワークを提案する。
自然アンテナ系にインスパイアされた光合成色調のトライアドモデルでエネルギー伝達のダイナミクスをシミュレートする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:06:51 GMT)
Aligning Evaluation with Clinical Priorities: Calibration, Label Shift, and Error Costs [3.3] 校正しきい値分類器を選択するための基本的かつ実用的な評価フレームワークを提案する。
臨床的に関連のあるクラスバランスの範囲でコスト重み付け性能を平均化するクロスエントロピー(log score)の調整版を導出する。
その結果得られた評価は、簡単に適用でき、臨床展開条件に敏感であり、キャリブレーションされたモデルと実世界の変動に頑健なモデルの両方を優先順位付けするよう設計されている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:01:39 GMT)
Can we train ASR systems on Code-switch without real code-switch data? Case study for Singapore's languages [3.3] Code-Switching (CS) は、ASRの難易度とコストのかかる書き起こしデータによる課題を提示する。
本研究では,自然パターンを模倣した合成CSデータを生成するためのフレーズレベルの混合手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:37:16 GMT)
AsyncSwitch: Asynchronous Text-Speech Adaptation for Code-Switched ASR [3.3] AsyncSwitchは、ペア音声テキストコーパスを微調整する前に、さまざまなコードスイッチされたドメインにASRモデルを事前出力する新しいフレームワークである。
マレー語と英語のコードスイッチングに関するウィスパーの実験では、9.02%の相対的なWER削減が示され、シングリッシュ、マレー語、その他の英語の変種におけるモノリンガルのパフォーマンスが向上した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:05:09 GMT)
What do Large Language Models Say About Animals? Investigating Risks of Animal Harm in Generated Text [3.2] AnimalHarmBenchは、大型言語モデル(LLM)における動物害のリスクのベンチマークである。
私たちのベンチマークデータセットは、Redditのポストタイトルから1,850のキュレートされた質問と、50の動物カテゴリーに基づいて2500の合成質問で構成されています。
LLM-as-a-judgeフレームワークを使用して、損害の増加または減少の可能性を評価した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:44:01 GMT)
Into the Unknown: Applying Inductive Spatial-Semantic Location Embeddings for Predicting Individuals' Mobility Beyond Visited Places [3.1] CaLLiPerは、コントラスト学習を通じて関心点の空間座標と意味的特徴を融合する表現学習フレームワークである。
本研究は, マルチモーダル・インダクティブな位置埋め込みが, 人間の移動予測システムの能力向上に有効であることを示すものである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 00:00:09 GMT)
InsertRank: LLMs can reason over BM25 scores to Improve Listwise Reranking [3.1] InsertRankはLLMベースのリランカで、リランク中のBM25スコアなどの語彙信号を活用して、検索性能をさらに向上する。
Deepseek-R1では、InsertRankはBRIGHTベンチマークで37.5点、R2MEDベンチマークで51.1点を獲得し、以前の手法を上回りました。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:04:45 GMT)
Foundation Artificial Intelligence Models for Health Recognition Using Face Photographs (FAHR-Face) [3.1] FAHR-Faceは4000万枚の顔画像に基づく基礎モデルです。
年齢推定では、FAHR-FaceAgeは公開データセット上で5.1年の平均絶対誤差が最も低い。
FAHR-FaceSurvivalは死亡の確実な予測を示した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:28:11 GMT)
Experimental Realization of Genuine Three-copy Collective Measurements for Optimal Information Extraction [3.1] 量子測定における真の三部構造非古典性のパワーを実験的に実証する。
我々の研究は、量子情報処理における真のマルチパーティリート非古典的測定とそのパワーを探求するための扉を開く。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:06:36 GMT)
Chain-of-Thought Reasoning In The Wild Is Not Always Faithful [3.0] CoT(Chain-of-Thought)推論は最先端のAI能力を大幅に進歩させたものだ。
人工バイアスのない現実的なプロンプトでも不信なCoTが発生することを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:59:57 GMT)
NeuralPDR: Neural Differential Equations as surrogate models for Photodissociation Regions [3.0] 元の化学コードを置き換えるサロゲートモデルを提案する。
これらのサロゲートモデルは,データセットの観測可能なカラム密度マップを高速化し,再現することができることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:35:02 GMT)
Learning Traffic Signal Control via Genetic Programming [3.0] 複雑な交差点における信号制御の新しい学習手法を提案する。
本手法では,各信号位相に対する位相緊急の概念を設計する。
緊急関数は、現在の道路条件に基づいて特定位相の位相緊急を算出することができる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:25:31 GMT)
Adjustment for Confounding using Pre-Trained Representations [2.9] 本研究では,事前学習したニューラルネットワークの潜時的特徴をどのように活用し,共起源の調整を行うかを検討する。
ニューラルネットワークは、学習問題の空間性と次元という本質的な概念に適応することで、高速収束率を達成することができることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:11:17 GMT)
Narrowing the Gap between TEEs Threat Model and Deployment Strategies [2.8] Confidential Virtual Machines(CVM)は、使用中のデータに対して分離保証を提供するが、その脅威モデルには物理的レベルの保護とサイドチャネル攻撃が含まれない。
現在のデプロイメントは、CVMの基盤となるインフラストラクチャをホストする信頼性の高いクラウドプロバイダに依存している。
TEE(Trusted Execution Environment)がプロバイダのインフラストラクチャ内で動作するかどうかを知らずに、物理的な攻撃のリスクを正確に評価することはできない。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:22:07 GMT)
orGAN: A Synthetic Data Augmentation Pipeline for Simultaneous Generation of Surgical Images and Ground Truth Labels [2.8] ORGANは、高忠実度アノテートされた出血画像を生成するGANベースのシステムである。
OrGANはStyleGANを使って、位置学習を使って出血を現実的にシミュレートし、出血座標をマークする。
評価において、ORGANのバランスの取れたデータセットと模倣臓器画像は、外科的設定で90%の検出イベントを、最大99%の精度で達成した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:29:40 GMT)
Identifiability by common backdoor in summary causal graphs of time series [2.7] 介入に対する識別可能性問題は、与えられた介入の合計効果が自由な公式で書けるかどうかを評価することを目的としており、観察データのみから計算される。
本稿では,複数の介入や多重効果を考慮して,真の因果グラフを要約した要約因果グラフの抽象化のみが可能となる時系列の文脈において,この問題を考察する。
本研究は,共通のバックドア集合による識別可能性に着目し,時間的・一貫性のない時系列に対して,そのような集合が存在する条件を確立する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:37:27 GMT)
Enhancing Spatio-Temporal Forecasting with Spatial Neighbourhood Fusion:A Case Study on COVID-19 Mobility in Peru [2.7] ペルーのDCT(Digital Contact)アプリケーションから収集した大規模なデータセットを利用して、都市部におけるモビリティフローを予測する。
重要な課題は、ヘキサゴナルグリッドセル間の時空移動数の空間的間隔にある。
本稿では,各セルの特徴をH3近傍からの集約信号で拡張する,軽量でモデルに依存しない近傍核融合(SPN)技術を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:51:36 GMT)
Effect of Selection Format on LLM Performance [2.6] 弾頭点と平易な英語がモデル性能に与える影響を比較した。
以上の結果から,通常,弾丸点による提示がより良い結果をもたらすことが示唆された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:41:25 GMT)
CutReg: A loss regularizer for enhancing the scalability of QML via adaptive circuit cutting [2.6] この研究はQML最適化プロセスに新たな正規化項を導入し、サンプリングに伴うオーバーヘッドを直接ペナルティ化する。
具体的には、カットオーバーヘッドを最小限に抑えることと、QMLモデルの全体的な精度を維持することの間のトレードオフをナビゲートし、量子的優位性を求めるためにより大きな複雑な問題を研究する方法を模索する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:09:20 GMT)
Efficient Hardware Implementation of Constant Time Sampling for HQC [2.5] HQCは、NISTのポスト量子暗号標準化プロセスの最終ラウンドにおける、コードベースのファイナリストの1つである。
HQCにおけるハードウェアの効率的な実装とセキュリティに関して重要な計算カーネルは、乱数を引き出すのに使用されるサンプリング方法である。
セキュリティの臨界により、最近、サイドチャネル攻撃に対する堅牢性を高めるためにサンプリングアルゴリズムが更新された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:52:41 GMT)
Acoustic scattering AI for non-invasive object classifications: A case study on hair assessment [2.5] 本稿では,音響散乱を用いた新しい非侵襲物体分類手法を提案する。
我々は,AIによる深層学習に基づく音声分類を用いて,髪型と湿気を分類する。
その結果, 音響散乱は, 視覚的分類に代わる, プライバシー保護・非接触的手法として注目された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:25:38 GMT)
Two-Player Zero-Sum Games with Bandit Feedback [2.5] 本研究では,列プレーヤが敵列プレーヤに対する報酬を最大化することを目的とした2プレイヤーゼロサムゲーム (TPZSG) について検討する。
本稿では,ETC-TPZSGとETC-TPZSG-AEの2つのアルゴリズムを提案する。
この結果から,ETCに基づくアルゴリズムは,対戦ゲーム設定において効果的に動作することがわかった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:46:32 GMT)
DiffusionBlocks: Blockwise Training for Generative Models via Score-Based Diffusion [2.5] エンドツーエンドのバックプロパゲーションによる大規模なニューラルネットワークのトレーニングは、大きなメモリボトルネックを生み出します。
本稿では,ニューラルネットワークブロックを連続的拡散プロセスにおける復調操作の実行として解釈する新しいトレーニングフレームワークである$itDiffusionBlocks$を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:44:18 GMT)
Utility-Driven Speculative Decoding for Mixture-of-Experts [2.4] 投機的復号化は軽量なドラフトラを使ってKトークンを提案し、これはLarge Language Modelが並列に検証し、トークンのスループットを向上する。
従来の高密度LLMでは、すべてのモデルウェイトがイテレーション毎に取得されるため、憶測は遅延オーバーヘッドを生じさせない。
ドラフトトークンは、合計でより多くの重みを活性化し、データ移動量を増やし、検証時間を2~3倍に増やす。
提案するユーティリティ駆動フレームワークであるCascadeは、投機を選択的に回避してスローダウンを回避し、Kを動的にチューニングしてMoE提供を加速する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:06:08 GMT)
Compression of enumerations and gain [2.4] コルモゴロフ複雑性の文脈における列挙の圧縮性について検討する。
強い圧縮と弱いゲインレス圧縮の存在は、計算可能可算(すなわち)集合に対して示される。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:11:56 GMT)
Enhancing Symbolic Machine Learning by Subsymbolic Representations [2.4] ニューラル埋め込みにアクセスできるようにすることで、シンボリックな機械学習手法を強化することを提案する。
実世界の3つの領域の実験において、この単純で効果的なアプローチは、F1スコアの点で他のすべてのベースライン法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:26:21 GMT)
Hyper-Local Deformable Transformers for Text Spotting on Historical Maps [2.4] 歴史地図のテキストには、地理、歴史的、政治的、文化的な文脈を提供する貴重な情報が含まれている。
従来のアプローチでは、特定のマップスタイルにのみ適合したアドホックなステップを使用していた。
最近の機械学習ベースのテキストスポッターは、これらの課題を解決する可能性を秘めている。
本稿では,歴史地図をスキャンするエンド・ツー・エンドテキストスポッターであるPALETTEを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:41:10 GMT)
A Semi-Supervised Approach for Abnormal Event Prediction on Large Operational Network Time-Series Data [2.4] 本稿では,ネットワーク時系列と時間点間の依存関係を効率的にキャプチャする半教師付き手法を提案する。
本手法は, 正規および異常サンプルに対する分離可能な埋め込み空間を明示的に学習するために, ラベル付き限られたデータを使用することができる。
実験により,我々の手法は大規模実世界のネットワークログ上でのイベント検出において,最先端の手法よりも著しく優れていた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:49:53 GMT)
Fragile Preferences: A Deep Dive Into Order Effects in Large Language Models [2.4] 複数の大規模言語モデル(LLM)にまたがる位置バイアスの包括的調査を行う。
選択肢が高品質である場合、モデルは優位性バイアスを示すが、オプションの品質が低い場合は後者の選択肢を好む。
表面張力と判断の真の歪みを区別するために、ペアの選好を頑丈、脆弱、あるいは無関心と分類する枠組みを導入する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:14:22 GMT)
Cost-Efficient Serving of LLM Agents via Test-Time Plan Caching [2.4] LLMベースのエージェントアプリケーションは、広範な計画と推論要求のためにかなりのコストがかかる。
既存のLCMキャッシュ技術は、外部データや環境コンテキストに依存するエージェントアプリケーションには不十分である。
提案するエージェント型プランキャッシュは,構造化されたプランテンプレートを抽出し,保存し,適応し,再利用する新しい手法である。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:42:30 GMT)
Fretting-Transformer: Encoder-Decoder Model for MIDI to Tablature Transcription [2.3] Fretting-Transformer(フレッティング・トランスフォーマー)は、T5トランスフォーマーアーキテクチャを利用して、MIDIシーケンスをギターのタブーに自動転写するエンコーダデコーダモデルである。
タスクをシンボリック翻訳問題としてフレーミングすることで、文字列のあいまいさや物理的プレイ可能性といった重要な課題に対処する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:25:35 GMT)
Busting the Paper Ballot: Voting Meets Adversarial Machine Learning [2.3] アメリカの選挙集計装置における機械学習の利用に伴うセキュリティリスクを示す。
4つの新しい投票データセットで、さまざまなモデルのトレーニングとテストを行います。
我々は, 新たな手法を用いて, 敵の例を用いて攻撃を行う。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:38:08 GMT)
How to Elicit Explainability Requirements? A Comparison of Interviews, Focus Groups, and Surveys [2.3] 本研究は,焦点グループ,インタビュー,オンライン調査の3つの方法の有効性と有効性について検討した。
その結果,インタビューは最も効率的であり,参加者毎のニーズを最も多く捉えることができた。
効率とカバレッジのバランスをとるために、調査とインタビューを組み合わせたハイブリッドアプローチを推奨します。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:01:21 GMT)
A Model-Mediated Stacked Ensemble Approach for Depression Prediction Among Professionals [2.3] うつ病は、特に専門的な環境において、重要な精神的な健康上の問題である。
本研究では,プロの抑うつ分類の予測精度を向上させるため,重ね合わせ型アンサンブル学習手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:19:40 GMT)
When are dynamical systems learned from time series data statistically accurate? [2.3] 本稿では,時系列データから得られた複雑な力学モデルの一般化に対するエルゴード論的アプローチを提案する。
我々の主な貢献は、カオスシステムを含むエルゴード系のクラスの神経表現の一般化を定義し、分析することである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:54:13 GMT)
Forecasting the spatiotemporal evolution of fluid-induced microearthquakes with deep learning [2.2] 本研究では,4つの重要な量を予測するために,油圧刺激履歴と先行地震観測を取り入れた変圧器を用いた深層学習モデルを提案する。
これらの正確で不確実性の定量化された予測は、破壊伝播と透水性進化のリアルタイムな推測を可能にする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:10:05 GMT)
Pixel-wise Modulated Dice Loss for Medical Image Segmentation [2.2] クラス不均衡と難易度不均衡は、医療セグメンテーションタスクにおけるニューラルネットワークの性能に影響を与える2種類のデータ不均衡である。
ダイス損失は、クロスエントロピー(CE)損失と比較してクラス不均衡に対処するのに非常に効果的である。
3つの医学的セグメンテーションタスクの結果、提案したPixel-wise Modulated Dice loss (PM Dice loss)は、他の方法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:09:41 GMT)
A Review of Generative AI in Computer Science Education: Challenges and Opportunities in Accuracy, Authenticity, and Assessment [2.2] 本稿では、コンピュータサイエンス教育におけるChatGPTやClaudeといったジェネレーティブAIツールの利用について調査する。
ジェネレーティブAIは、AI幻覚、エラーの伝播、バイアス、AI支援コンテンツと学生認可コンテンツの間のぼやけた線などの懸念を提起する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:20:58 GMT)
An Observation on Lloyd's k-Means Algorithm in High Dimensions [2.2] クラスタリングと推定クラスタは、統計学と機械学習における中核的な問題である。
我々は,高雑音と限られたサンプルサイズを有する高次元設定におけるk平均値の故障に関する理論的説明を提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:06:41 GMT)
Image Segmentation with Large Language Models: A Survey with Perspectives for Intelligent Transportation Systems [2.2] 本調査は,LLM強調画像セグメンテーションの新たな分野を体系的にレビューする。
これらのイノベーションは、自動運転、交通監視、インフラのメンテナンスのための道路シーン理解をいかに向上させるかを強調します。
リアルタイムのパフォーマンスや安全性クリティカルな信頼性など、重要な課題を特定します。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:20:50 GMT)
Complete Characterization for Adjustment in Summary Causal Graphs of Time Series [2.2] 介入の識別可能性問題は、完全な因果効果が自由な公式で書けるかどうかを評価することを目的としており、観察データのみから推定される。
本稿では,実因果グラフの抽象化のみを要約因果グラフとして利用できる時系列の文脈において,複数の介入を考慮し,この問題を考察する。
本稿では、この設定で完全であることが示されている調整基準の必要条件と十分な条件の両方を提案し、クエリが識別可能か否かを判断するための擬似線形アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:00:31 GMT)
Xolver: Multi-Agent Reasoning with Holistic Experience Learning Just Like an Olympiad Team [2.1] Xolverはトレーニングフリーのマルチエージェント推論フレームワークである。
外部と自己検索を含む多様な体験モダリティを統合している。
Xolverは、特殊推論エージェントを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:47:19 GMT)
Detecting immune cells with label-free two-photon autofluorescence and deep learning [2.1] 我々は、このラベルのないAFを入力として、細胞タイプを分類するために畳み込みニューラルネットワーク(CNN)を訓練した。
低複雑さのSwitchNetアーキテクチャは、信頼できる免疫細胞分類結果を達成することができた。
将来的には、このような予測型DLモデルは、定着していない画像の特定の免疫細胞を直接検出できるだろう。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:14:02 GMT)
Parallel Greedy Best-First Search with a Bound on Expansions Relative to Sequential Search [2.1] PUHF は, 逐次 GBFS で拡張された状態数と, 最悪ケースのタイブレング戦略との定数倍数で束縛されていないことを示す。
提案手法は,拡張された状態の数が連続GBFSで拡張された状態の数に一定の範囲内にあることを保証する並列グリージー検索である。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:49:39 GMT)
Is Selection All You Need in Differential Evolution? [2.1] 微分進化の新しいアプローチとして非有界微分進化(UDE)を提案する。
UDEは、フィットネスに基づいて個人を捨てることなく、すべての生成された候補を人口に追加する。
UDEはDEに対する基本的な新しいアプローチであり、選択メカニズムのみに依存し、より単純だが強力な検索アルゴリズムを可能にする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:41:44 GMT)
Decoupling Generation and Evaluation for Parallel Greedy Best-First Search(extended version) [2.1] 制約付き並列グリード最優先探索アルゴリズムのクラスは、制約を満たす状態を拡張するのみである。
状態生成と状態評価を分離する制約付き並列探索の改良を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:28:03 GMT)
Deep Learning Model Acceleration and Optimization Strategies for Real-Time Recommendation Systems [1.9] リアルタイムレコメンデーションシステムの主な課題は、レコメンデーション品質を犠牲にすることなく、推論遅延を減らし、システムのスループットを向上する方法である。
本稿では,モデリングとシステムレベルのアクセラレーションと最適化を併用した手法を提案する。
実験の結果、元の推奨精度を維持しながら、我々の手法は、レイテンシをベースラインの30%未満に削減し、システムのスループットを2倍以上に削減した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:08:47 GMT)
Adverse Event Extraction from Discharge Summaries: A New Dataset, Annotation Scheme, and Initial Findings [1.9] 高齢者の退院サマリーからの逆イベント(AE)抽出のための手動注釈コーパスを提案する。
このデータセットは、フォール、デリリウム、頭蓋内出血など14の臨床的に重要なAEsを含む。
3つのアノテーションの粒度にまたがってFrairNLPを用いて複数のモデルを評価する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:13:40 GMT)
Mobile Application Review Summarization using Chain of Density Prompting [1.9] モバイルアプリレビューを要約するために,LLM(Large Language Models)を活用しています。
我々は、OpenAI GPT-4を誘導するために、Chain of Density(CoD)プロンプトを使用し、抽象的で、意味的に密で、容易に解釈可能な要約を生成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:17:21 GMT)
Ensemble Watermarks for Large Language Models [1.9] 大規模言語モデル(LLM)のための多機能透かし生成法を提案する。
我々はアクロスティカとセンセーモトルのノルムを、確立された赤緑色の透かしと組み合わせて、98%の検知率を達成した。
パラフレーズ攻撃の後、95%の検知率で性能は高いままである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:36:46 GMT)
Think Twice before Adaptation: Improving Adaptability of DeepFake Detection via Online Test-Time Adaptation [1.8] ディープフェイク(DF)検出器は、現実世界の環境に展開する際、重大な課題に直面している。
ポストプロセッシング技術はDFサンプルで提示された成果物を不明瞭に生成する可能性があるため、性能が低下する。
本稿では,新しいオンラインテスト時間適応法であるThink Twice before Adaptation (textttT$2$A)を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:31:49 GMT)
Towards Fair Representation: Clustering and Consensus [1.7] 特定の保護された属性に関して、代表的であるだけでなく公平でもあるコンセンサスクラスタリングを見つけます。
調査の一環として,既存のクラスタリングを最小限に修正して公平性を実現する方法について検討した。
我々は,同値なグループ表現とニア線形時間定数係数近似アルゴリズムを用いたデータセットの最適アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:14:47 GMT)
Pushing the Performance of Synthetic Speech Detection with Kolmogorov-Arnold Networks and Self-Supervised Learning Models [1.7] 我々は、XLSR-Conformerモデルにおける従来のマルチ層パーセプトロンをコルモゴロフ・アルノルドネットワーク(KAN)で置き換える新しいアプローチを提案する。
以上の結果から,KAをSSLベースモデルに統合することで,LAとDFの相対的な性能を60.55%向上させることができることがわかった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:30:58 GMT)
Breaking even with magic: demonstration of a high-fidelity logical non-Clifford gate [1.7] 本研究では、8つの物理量子ビットしか使用しない量子エラー検出符号において、一対の論理的マジック状態をフォールトトレラントに生成するためのマジック状態準備プロトコルを提案する。
このプロトコルは, 空間的オーバーヘッドの少ない極めて高忠実なマジック状態を生成するために, 自己結合可能であることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:23:47 GMT)
A Vision for Geo-Temporal Deep Research Systems: Towards Comprehensive, Transparent, and Reproducible Geo-Temporal Information Synthesis [1.7] 現在の深層研究システムでは、文脈に富む疑問に答える上で不可欠な時空間的能力が欠如している。
本稿では,深部研究パイプラインに時空間推論を統合する上で重要な技術的,インフラ的,評価的課題について述べる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:38:45 GMT)
Fair for a few: Improving Fairness in Doubly Imbalanced Datasets [1.7] 我々は、ラベルとセンシティブ属性内のグループの両方でデータ収集が不均衡であるように、二重不均衡なデータセットの公平性に焦点を当てる。
まず,2つの不均衡なデータセット上でのデバイアスの限界を示す探索分析を提案する。
次に,ラベルと機密属性の最も適切なサンプリングと分布を求めるために,マルチ基準に基づく解を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:34:56 GMT)
Scalable and consistent embedding of probability measures into Hilbert spaces via measure quantization [1.6] 入力確率測度を小容量の離散測度で近似するための測度量化に基づく2つの手法について検討した。
このような近似の整合性とその計算コストの低いヒルベルト空間への確率測度のスケーラブルな埋め込みへの応用について検討する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:42:05 GMT)
Multi-Task Reward Learning from Human Ratings [1.6] 複数のタスクを共同で検討し、人間の意思決定を模倣する新しい強化学習法を提案する。
報酬のない環境における人間の評価を活用し、報酬関数を推論し、分類モデルと回帰モデルの両方の貢献のバランスをとる学習可能な重みを導入します。
その結果,提案手法は既存のレーティングに基づくRL手法よりも常に優れており,場合によっては従来のRL手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:12:50 GMT)
Formalising Anti-Discrimination Law in Automated Decision Systems [1.6] 英国における差別防止法に基づく新たな意思決定理論の枠組みを導入する。
本稿では,推定誤差と基礎となるデータ生成過程を考慮に入れた「条件推定パリティ」指標を提案する。
我々は、我々のフォーマリズムを現実世界のアルゴリズムによる差別のケースに適用し、技術的および法的推論が違法な差別を検知し軽減するためにどのように調整されるかを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:10:14 GMT)
Quantum entanglement as an ambiguity of classical dynamics [1.5] シンプレクティック幾何学の定式化を量子力学に適用した結果について検討する。
この縮退性は、古典力学の曖昧さとして理解できることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:44:17 GMT)
Agile and Student-Centred Teaching of Agile/Scrum Concepts [1.5] ソフトウェアエンジニアリングプロジェクトマネジメントのコースを設計し、教えた経験について論じる。
このコースは、学生中心でフレキシブルな教育アプローチを実現するため、2020年以降、根本的な変更がなされている。
私たちは学んだ教訓を報告し、アジャイル/スクラムの概念を教えるのに役に立つ洞察を学部生や大学院生に提供します。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:09:32 GMT)
Fine-Scale Soil Mapping in Alaska with Multimodal Machine Learning [1.5] 高分解能土壌地図は永久凍土の分布を特徴づけ、脆弱な地域を特定し、適応戦略を示すのに不可欠である。
近地永久凍土と土壌分類のための大規模土壌マップを作成するための視覚ベース機械学習(ML)モデルであるMISOを提案する。
我々は,土壌マッピングに広く用いられている従来のMLモデルであるRandom Forest (RF)とMISOを比較した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:09:48 GMT)
DiFuse-Net: RGB and Dual-Pixel Depth Estimation using Window Bi-directional Parallax Attention and Cross-modal Transfer Learning [1.5] DiFuse-Netは、分散RGBとDPベースの深さ推定のための新しい分離ネットワーク設計である。
WBiPAMは、小さな開口部を持つスマートフォンカメラに特有の微妙なDP格差を捉えます。
分離エンコーダはRGB画像から文脈情報を抽出し、これらの特徴を融合させて深度予測を強化する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:49:27 GMT)
Optimal Scheduling of Dynamic Transport [1.4] 特定の軌道のクラスは近似と学習を著しく改善できることを示す。
幅広い種類のソース/ターゲット測度とトランスポートマップが$T$の場合、最適スケジュールはクローズド形式で計算できる。
我々の証明手法は変分計算と$Gamma$-convergenceに依存している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:37:29 GMT)
Issue Retrieval and Verification Enhanced Supplementary Code Comment Generation [1.4] 我々はIsCommentを提案する。IsCommentは、補足的なコードコメントを生成するための問題ベースのLCM検索と検証手法である。
まず、コード-記事-課題分析を通じて、レポートが提供できる5つの主要なコード補完情報を同定する。
幻覚を減らすために、コードに関係のない候補コメントや、問題レポートで検証できないコメントをフィルタリングする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:42:25 GMT)
Comparison of Two Methods for Stationary Incident Detection Based on Background Image [1.4] 定常物体検出のための2つのスキームを提案し, 検出性能と計算複雑性を比較検討した。
ビデオシーンで検出された静止物体を監視し,追跡するために,正規化クロス相関 (NCC) を用いた画像比較を行った。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:18:04 GMT)
Low-code to fight climate change: the Climaborough project [1.3] EUが出資するクリマボロー計画は、2030年までに欧州の都市が炭素中立を達成するのを支援している。
クライマボロ・シティ・プラットフォームは、気候目標に向けて市の進捗を監視するために開発されている。
本稿では、気候ダッシュボードを迅速に展開するプロジェクトの目的に応えて、Climaboroughでローコード/ノーコード戦略を導入する方法について説明する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:19:12 GMT)
Evaluating Loss Functions for Graph Neural Networks: Towards Pretraining and Generalization [1.3] 研究はインダクティブとトランスダクティブの両方について検討した。
平均ランクに基づいて,各指標の上位10のモデル-ロスの組み合わせを慎重に分析した。
GINアーキテクチャは常に最高レベルの平均性能を示しており、特にクロスエントロピー損失がある。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:12:19 GMT)
From tools to thieves: Measuring and understanding public perceptions of AI through crowdsourced metaphors [1.2] 我々は、AIの公的な理解を形成する20の支配的なメタファーを特定します。
アメリカ人は一般的にAIを温かくて有能だと考えている。
これらの暗黙の認識は、特定された支配的なメタファーと共に、AIの採用への信頼と意欲を強く予測する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:46:20 GMT)
Bridging Voting and Deliberation with Algorithms: Field Insights from vTaiwan and Kultur Komitee [1.2] 民主党のプロセスは、対面交渉と大規模投票の統合をますます目指している。
この研究は、オンライン投票を対面検討でブリッジするために、アルゴリズムと計算ツールを使用する新しい手法を導入する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:00:07 GMT)
SafeRL-Lite: A Lightweight, Explainable, and Constrained Reinforcement Learning Library [1.2] SafeRL-Liteは、強化学習(RL)エージェントを構築するためのオープンソースのPythonライブラリで、制約があり、説明可能である。
ライブラリは軽量で、pip経由でインストールできる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:42:41 GMT)
BMFM-RNA: An Open Framework for Building and Evaluating Transcriptomic Foundation Models [1.2] 本稿では,BMFM-RNAについて述べる。BMFM-RNAはオープンソースでモジュール型のソフトウェアパッケージで,多様なTFM事前学習と微調整の目的を統一する。
オートエンコーダのようなCRSボトルネック表現を用いてグローバルな表現パターンをキャプチャする,新たなトレーニング目標である全セル表現デコーダ(WCED)を導入する。
我々は、WCEDモデルが、SCGPTのような最先端のアプローチに適合または超越した性能を達成することを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:40:08 GMT)
Fair Data Exchange with Constant-Time Proofs [1.2] Fair Data Exchange (FDE)プロトコルは、定数サイズの証明を持つアトミックペイ・パー・ファイル転送を提供するが、証明器と検証器のランタイムはファイル長nと線形にスケールする。
我々は、これらのコストを、レート-1 Reed-Solomon (RS) コードワードとして見て、それを一定の冗長性で低レートのRSコードに拡張し、この拡張ベクタを暗号化し、結果の暗号文の小さなランダムサブセットに対してのみ正当性を証明することによって、基本的に定数に分解する。
我々のプロトコルは、完全なクライアント・サーバ・フェアネスを保ち、調整可能な通信冗長性のみを付加する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:50:25 GMT)
LLMs Help Alleviate the Cross-Subject Variability in Brain Signal and Language Alignment [1.2] 本研究の目的は,人間の脳波信号に固有の主題に依存しない意味情報を,深層学習で捉えることができるかどうかを検討することである。
雑音の多い脳波信号から主観非依存の意味的特徴を抽出するために,大言語モデル(LLM)を用いる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:19:58 GMT)
High-fidelity quantum state control of a polar molecular ion in a cryogenic environment [1.2] 低温環境下でのCaH+イオンの量子状態を制御するために量子論理分光プロトコルを用いる。
コントラストが99%以上ある2つの状態間のラビの浮き彫りを測定するため, 単一量子状態における状態生成と測定を6時間10~3ドル以下で実証した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:20:10 GMT)
Learning Spatially Adaptive $\ell_1$-Norms Weights for Convolutional Synthesis Regularization [1.2] 我々は、事前学習された畳み込みフィルタのファミリーを考察し、スパース特徴写像に適用された空間的に変化するパラメータを深くパラメータ化して推定する。
提案手法は,後者の手法で視覚的,定量的に比較可能な結果が得られ,同時に高い解釈が可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:50:23 GMT)
MSDNet: Multi-Scale Decoder for Few-Shot Semantic Segmentation via Transformer-Guided Prototyping [1.2] 少数のアノテーション付きの例だけで、クエリイメージ内のオブジェクトをセグメント化するという課題に、Semanticは対処している。
本稿では,Transformerアーキテクチャに基づく新しいFew-shot Semanticフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:05:43 GMT)
BRISC: Annotated Dataset for Brain Tumor Segmentation and Classification with Swin-HAFNet [1.2] このデータセットは、放射線医や医師によって注釈された6000個の造影T1強調MRIスキャンで構成されている。
それぞれのサンプルは高解像度のラベルを含み、軸、矢状、およびコロナイメージングプレーンに分類される。
IoU(Intersection-over-Union, Intersection-over-Union, IoU)が82.3%と高い値を示した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:56:05 GMT)
Efficient Retail Video Annotation: A Robust Key Frame Generation Approach for Product and Customer Interaction Analysis [1.1] 本稿では,小売ビデオのキーフレーム識別を自動化するディープラーニングベースのアプローチを提案する。
提案手法は,ビデオアノテーションにおける平均2倍のコスト削減につながる。
キーフレーム検出の自動化により、小売ビデオラベリングタスクの大幅な時間と労力の節約が可能になる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:42:58 GMT)
Quality Assessment of Python Tests Generated by Large Language Models [1.1] 本稿では,GPT-4o,Amazon Q,LLama 3.3という3つの大規模言語モデルによって生成されたPythonテストコードの品質について検討する。
我々は、Text2Code(T2C)とCode2Code(C2C)の2つの異なるプロンプトコンテキスト下で生成されたテストスイートの構造的信頼性を評価する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:16:15 GMT)
VisText-Mosquito: A Multimodal Dataset and Benchmark for AI-Based Mosquito Breeding Site Detection and Reasoning [1.1] VisText-Mosquitoは、蚊繁殖サイト分析の自動検出、セグメンテーション、推論をサポートするマルチモーダルデータセットである。
データセットは、オブジェクト検出用1,828の注釈付き画像、水面セグメンテーション用142の画像、および各画像にリンクされた自然言語推論テキストを含む。
本稿では、AIによる検出が蚊が媒介する病気のリスクに積極的に対処する方法について述べる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:24:30 GMT)
A Comparative Evaluation of Deep Learning Models for Speech Enhancement in Real-World Noisy Environments [1.0] 本研究では、SpEAR、VPQAD、Clarksonといった多様なデータセット上で、Wave-U-Net、CMGAN、U-Netの3つの最先端モデルをベンチマークする。
評価の結果、U-NetはSNRが+71.96%、VPQADが+64.83%、クラークソンが+364.2%、高いノイズ抑制を実現していることがわかった。
CMGANは知覚品質に優れており、SpEARでは4.04点、VPQADでは1.46点のPESQスコアを達成している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:12:40 GMT)
ShorterBetter: Guiding Reasoning Models to Find Optimal Inference Length for Efficient Reasoning [1.0] そこで本研究では,手動による指導を必要とせずに,推論モデルによる最適なCoT長の学習を可能にする,簡易かつ効果的な強化学習手法を提案する。
ShorterBetterは、ドメイン内およびドメイン外推論タスクの出力長を50%-80%削減する。
我々の推論トレース分析は、不要な反復、過剰な自己検証、代替品の過剰探索を減らし、ショーターベッターが推論トレースの構造を洗練することを示している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:15:49 GMT)
Improved Image Reconstruction and Diffusion Parameter Estimation Using a Temporal Convolutional Network Model of Gradient Trajectory Errors [1.0] 勾配軌道の誤差は、磁気共鳴画像に重要なアーティファクトと歪みをもたらす。
我々は畳み込みネットワークを用いて勾配歪みを正確に予測できる一般非線形勾配系モデルを開発した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:01:06 GMT)
A Study of Hybrid and Evolutionary Metaheuristics for Single Hidden Layer Feedforward Neural Network Architecture [1.0] SGD(Gradient Descent)を用いた人工ニューラルネットワーク(ANN)のトレーニングは、しばしば困難に遭遇する。
本研究では,Particle Swarm Optimization (PSO) と遺伝的アルゴリズム (GA) について検討する。
局所探索効率を向上させるためにハイブリッドPSO-SGD戦略を開発した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:12:58 GMT)
Adapting Lightweight Vision Language Models for Radiological Visual Question Answering [1.0] 本研究では,無線VQAのための軽量な3Bパラメータ・ビジョン言語モデルを微調整する。
キュレートされたデータで適切に調整された小さなモデルでは、オープンエンドとクローズドエンドの両方の質問に対して堅牢なパフォーマンスが得られることを示す。
ドメインの専門家がVQAモデルの性能を検査し、不条件の障害モードを特定できるようにする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:15:08 GMT)
Feedback-MPPI: Fast Sampling-Based MPC via Rollout Differentiation -- Adios low-level controllers [1.0] モデル予測経路積分制御は、複雑なロボット作業に適したサンプリングベースの強力なアプローチである。
本稿では,勾配型MPCの感度から得られる頑健なフィードバックゲインを紹介する。
2つのロボットプラットフォームにおける実環境実験によるシミュレーションにおけるF-MPPIの有効性を実証する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:47:33 GMT)
A Systematic Replicability and Comparative Study of BSARec and SASRec for Sequential Recommendation [1.0] 本研究の目的は、自己認識に基づくシーケンスレコメンデーション(SASRec)と自己認識に基づくシーケンスレコメンデーション(BSARec)の2つのシーケンシャルレコメンデーションシステムを比較することである。
その結果、周波数強調のバイアス項を含むBSARecは、実際にSASRecより優れていることが示された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:29:55 GMT)
High-fidelity collisional quantum gates with fermionic atoms [0.9] フェルミオン量子コンピュータは電子構造問題を直接的に実装する可能性を秘めている。
光超格子中のフェルミオン原子の制御により, 衝突エンタングリングゲートが最大99.75(6)%, ベル状態の寿命が10,sを超えることを実証した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:50:08 GMT)
Abstract Meaning Representation for Hospital Discharge Summarization [0.9] この研究は、言語に基づくグラフとディープラーニングモデルを組み合わせて、自動要約におけるコンテンツと信頼性の証明に対処する新しい方法を見つけることである。
Anonymous Hospitalの医師が作成したMIMIC-IIIコーパスと臨床ノートの信頼性について検討した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:33:01 GMT)
Designing a Custom Chaos Engineering Framework for Enhanced System Resilience at Softtech [0.9] カオスエンジニアリング(Chaos Engineering)は、システムの振る舞いを意図的に観察し改善するために障害を導入することによって、ソフトウェアのレジリエンスを高める規律である。
本稿では、金融セクターを専門とするソフトウェア開発企業であるSofttech向けに、カスタマイズされたカオスエンジニアリングフレームワークの設計提案を行う。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:50:23 GMT)
AIn't Nothing But a Survey? Using Large Language Models for Coding German Open-Ended Survey Responses on Survey Motivation [0.8] 本研究は,他の文脈におけるオープンエンドサーベイ応答の符号化に,LLMがどの程度の精度で利用できるかを検討する。
我々は、最先端のLLMといくつかのプロンプトアプローチを比較し、人間の専門家による符号化を用いてLLMの性能を評価する。
本研究は, LLMを効率的に, 正確に, 確実に活用できる環境研究の進展に寄与する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:28:53 GMT)
Mxplainer: Explain and Learn Insights by Imitating Mahjong Agents [0.8] 本稿では,ブラックボックスエージェントのパラメータを学習するために,等価ニューラルネットワークに変換可能なパラメータ化探索アルゴリズムであるMxplainerを紹介する。
AIと人間プレイヤーのデータを用いて行われた実験は、学習されたパラメータがエージェントの特性やプレイスタイルに対する人間の理解可能な洞察を提供することを示した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:07:13 GMT)
Recursive Variational Autoencoders for 3D Blood Vessel Generative Modeling [0.8] 階層構造をフル活用する再帰変動ニューラルネットワーク(RvNN)を開発した。
RvNNは、ターゲット表面を記述する幾何学的特徴とともに、分岐接続を符号化する低次元多様体を学習する。
我々は、正確で多様な血管の3Dモデルを生成し、医療や外科訓練、血行動態シミュレーション、その他多くの目的に欠かせない。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:47:27 GMT)
Immersive Fantasy Based on Digital Nostalgia: Environmental Narratives for the Korean Millennials and Gen Z [0.8] 本研究は, 単用マスク廃棄物の層状探索を目的としたメディアアート「Dear Passenger Please Wear a Mask」を紹介する。
この作品は、デジタルノスタルジーと、ミレニアル世代とゲンZの航空旅行の回想と、ユニークなファンタジーの物語を織り交ぜることで、生態学的懸念を過小評価した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:10:50 GMT)
Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors [0.7] コンプライアンスは、工学、農業、生物医学の応用におけるオブジェクトを記述するための重要なパラメータである。
従来のコンプライアンス検出方法は、ポータビリティとスケーラビリティの欠如によって制限されており、特殊な高価な機器に依存しており、ロボット用途には適さない。
本稿では,LRCN(Long-term Recurrent Convolutional Networks)とTransformerアーキテクチャに基づく2つのモデルを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:10:05 GMT)
Hamiltonian Formalism for Comparing Quantum and Classical Intelligence [0.7] 我々は、環境との相互作用を対比する手段として、古典的および量子的AGIタスクを記述するためにハミルトン形式を導入する。
この形式主義は、量子的および古典的エージェントが環境相互作用を介してどのように異なるかを示す正確な数学的言語の開発に寄与することを目的としている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:17:05 GMT)
Supervised Quantum Machine Learning: A Future Outlook from Qubits to Enterprise Applications [0.6] Supervised Quantum Machine Learning (QML)は、量子コンピューティングと古典的な機械学習の共通点である。
本稿では, 量子回路, 量子ニューラルネットワーク, 量子カーネル法などの手法に着目し, 教師付きQMLの最近の展開を概観する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:54:29 GMT)
Causes in neuron diagrams, and testing causal reasoning in Large Language Models. A glimpse of the future of philosophy? [0.6] 我々は、因果関係の哲学の学問に基づくAIにおける抽象因果推論のテストを提案する。
先進的な大規模言語モデル(ChatGPT, DeepSeek, Gemini)のテストについて説明する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:55:54 GMT)
Steering Robots with Inference-Time Interactions [0.6] 事前訓練されたポリシーがデプロイメント中にエラーを発生させる場合、ユーザがその動作を修正するための制限されたメカニズムが存在する。
私の研究は、トレーニング済みのポリシーを固定されたスキルレパートリーとして凍結させながら、ユーザーのインタラクションが推論時に行動生成をガイドできるようにする方法を提案する。
具体的には,(1)個別のスキルの切り替えにユーザインタラクションを活用する推論時ステアリング,(2)個別のシンボリックプランで定義されたタスク制約を満たしつつ,ユーザインタラクションによる連続的な動作の編集を可能にするタスクと動作の模倣を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:59:07 GMT)
Predicting the Understandability of Computational Notebooks through Code Metrics Analysis [0.5] 本稿では,Jupyterノートブックの理解可能性を評価するために,ソフトウェアリポジトリからのユーザ意見を活用する新しいアプローチを提案する。
コード理解性に関連するユーザコメントを識別するために、微調整のDistilBERT変換器を使用しました。
次に、関連するコメントの数、アップボート、ノートブックビューに基づいて、UOCU(User Opinion Code Understandability)という新しいメトリクスを導入しました。
この改善されたメトリクスを使用して、132,723の最終ノートから34のノートレベルのメトリクスを収集し、機械学習モデルをトレーニングして、理解可能性を予測する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:34:33 GMT)
Explainable Detection of Implicit Influential Patterns in Conversations via Data Augmentation [0.5] 悪意あるアクターは、会話に埋め込まれた暗黙の影響力のある言語パターンを活用する方向に移行してきた。
本稿では、このような暗黙的な影響パターンを検出するための改善されたアプローチを提案する。
その結果,会話における暗黙的な影響パターンの検出が6%改善した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:00:07 GMT)
Latent Anomaly Detection: Masked VQ-GAN for Unsupervised Segmentation in Medical CBCT [0.5] 本研究の目的は、ONJ画像スキャンにおける異常を自動的に識別するための教師なしトレーニング手法を開発することである。
第1段階では、VQ-GANが訓練され、正常な被験者を正確に再構築する。
第2段階では、データを復元可能な新しいエンコーダをトレーニングするために、ランダムキューブマスキングとONJ固有のマスキングを適用する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:58:04 GMT)
Individual Causal Inference with Structural Causal Model [0.5] 個人因果推論(ICI)は、個人に対する介入の効果を理解し予測するために因果推論手法を用いる。
ほとんどの因果推論法は人口ベースである。
本稿では,構造因果モデル(SCM)を用いたICIを「Rung 3」因果推論として提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:24:21 GMT)
The Cosmological Constant from a Quantum Gravitational $θ$-Vacua and the Gravitational Hall Effect [0.4] 量子重力のチャーン・サイモンズ・コダマ状態は、量子ホール効果のトポロジカル場理論と顕著な構造的類似性を持つ。
宇宙定数 $Lambda$ は $theta$- パラメータに $theta=12pi2/(Lambda ell2_rm Pl) mod 2pi$ で密接に関連している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:00:14 GMT)
Qwerty: A Basis-Oriented Quantum Programming Language [0.4] Qwertyは、プログラマがブラケット表記なしでゲートやトレースプログラムよりも表現力のある量子ビットを操作できる新しい量子プログラミング言語である。
Qwertyは高レベルの量子古典計算のための強力なフレームワークである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:58:05 GMT)
Quantum and Semi-Classical Signatures of Dissipative Chaos in the Steady State [0.4] 開放量子多体系における量子-古典対応について,SU(3)ボース・ハバード三量体を最小モデルとして検討する。
Lyapunov指数の符号によって定量化される古典力学の挙動は、定常密度行列のレベル統計を支配していることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:21:06 GMT)
Patch distribution modeling framework adaptive cosine estimator (PaDiM-ACE) for anomaly detection and localization in synthetic aperture radar imagery [0.4] 本研究は,合成開口レーダ画像(SAR)における異常検出と局所化の新しいアプローチを提案する。
適応的コサイン推定器 (ACE) 検出統計を導入し、PaDiM は非有界距離であるマハラノビス距離を用いる。ACE はコサイン類似度測定器を用い、有界異常検出スコアを提供する。
提案手法は,複数のSARデータセットに対して評価され,画像および画素レベルでの受信操作曲線(AUROC)以下の領域を含む性能指標が得られた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:09:37 GMT)
Analytics Modelling over Multiple Datasets using Vector Embeddings [0.4] 本稿では、利用可能なデータセットからモデルを作成することにより、分析演算子の結果を推測する新しい手法を提案する。
実験により,本フレームワークの予測性能と実行時間と,他の最先端のモデリング演算子フレームワークとの比較を行った。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:45:05 GMT)
CAPTURE: Context-Aware Prompt Injection Testing and Robustness Enhancement [0.3] 攻撃検出と過防衛傾向の両方を評価する新しい文脈認識型ベンチマークであるCAPTUREを紹介する。
実験の結果,現行のプロンプトインジェクションガードレールモデルでは,敵のケースでは高い偽陰性,良性シナリオでは過剰な偽陽性に悩まされていることが明らかとなった。
この新しいモデルでは、コンテキスト認識データセットの偽陰性率と偽陽性率の両方を劇的に削減します。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:38:20 GMT)
Synthetic Data Augmentation for Table Detection: Re-evaluating TableNet's Performance with Automatically Generated Document Images [0.3] スマートフォンやスキャナーによってキャプチャされた文書ページは、しばしばテーブルを含むが、手動による抽出は遅く、エラーを起こしやすい。
本稿では,現実的な2カラムページを視覚的に多様なテーブルレイアウトで合成する自動パイプラインを提案する。
生成されたコーパスは、現実世界のMarmotベンチマークを拡張し、TableNetのシステマティックな解決研究を可能にする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:41:31 GMT)
From Points to Places: Towards Human Mobility-Driven Spatiotemporal Foundation Models via Understanding Places [0.3] 本稿では,複数スケールにわたる人体移動と位置意味論を統合した空間基盤モデルを提案する。
我々の目標は、次世代地理空間インテリジェンスのためのスケーラブルでコンテキスト対応のモデルの開発をガイドすることです。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:27:24 GMT)
Hierarchical Multi-Positive Contrastive Learning for Patent Image Retrieval [0.3] 特許画像は、特許のイノベーションに関する情報を伝える技術図である。
現在の方法は、ロカルノ国際分類システムで定義されたような特許の階層的関係を無視している。
検索プロセスにおいて,その関係を導き出すために,LISPの分類を利用した階層的多陽性のコントラスト損失を導入する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:39:04 GMT)
Variational Bayesian Bow tie Neural Networks with Shrinkage [0.3] 我々は,層間における分布仮定や独立性を回避する高速で近似的な変分推論アルゴリズムを開発した。
我々はPolya-Gammaデータ拡張トリックを使用し、条件付き線形およびガウス的モデルを描画する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:49:16 GMT)
Understanding the Trade-offs in Accuracy and Uncertainty Quantification: Architecture and Inference Choices in Bayesian Neural Networks [0.3] 有望な理論的結果にもかかわらず、最もよく使われる後部近似の性質はしばしば疑問視される。
現代の深層モデルの次元は、識別可能性の欠如と相まって、マルコフ連鎖モンテカルロ(MCMC)は後部を完全に探索することができない。
変分推論は計算複雑性の改善による恩恵を受けるが、サンプリングベース推論のマルチモーダル保証は欠如している。
変分近似の積み重ねとアンサンブルにより、MCMCに匹敵する精度が大幅に低減された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:07:13 GMT)
Innovating China's Intangible Cultural Heritage with DeepSeek + MidJourney: The Case of Yangliuqing theme Woodblock Prints [0.3] 伝統的なヤングルジュングの木版画は、複雑なデザインと鮮やかな色で祝われている。
この研究は、クリエイティブでテーマ化されたYangliuqing木版プリントを生成するためのDeepSeek + MidJourneyアプローチを探求する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:47:17 GMT)
Single-Example Learning in a Mixture of GPDMs with Latent Geometries [0.2] 本稿では,Gaussian Process Dynamical Mixal Model(GPDMM)を提案する。
単一サンプル学習における分類精度と生成能力について GPDMM をスコアし,モデルのバリエーションを示すとともに,LSTM,VAE,トランスフォーマーと比較した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:22:07 GMT)
Towards Better Open-Ended Text Generation: A Multicriteria Evaluation Framework [0.2] オープンエンドテキスト生成は自然言語処理において顕著な課題となっている。
これらのモデルの品質と 採用した復号化戦略を評価することは 依然として困難です
本稿では,デコード手法の相対的および絶対的ランク付けのための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:41:07 GMT)
Large Language Models' Reasoning Stalls: An Investigation into the Capabilities of Frontier Models [0.2] 我々は2023年12月から2024年8月にかけて,PRONTOQAスチームローラーの推理問題に対するState of the Artモデルの性能評価を行った。
以上の結果から, LLM推論能力の向上は9カ月間に停滞していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:49:49 GMT)
Translation symmetry restoration in integrable systems: the noninteracting case [0.2] 可積分系における翻訳対称性の復元について研究する。
特に、$nu>1$格子シフトの下で非平衡状態に不変な格子上の非相互作用スピンレスフェルミオンを考える。
サブシステムサイズに比例する時間に対して、対称性回復が突然起こるランダムなユニタリ回路とは違い、この対称性は滑らかに復元され、サブシステムサイズが2乗の時間スケールを経る。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:11:31 GMT)
QUEST: Quality-aware Semi-supervised Table Extraction for Business Documents [0.2] QUESTはビジネス文書のための品質対応の半教師付きテーブル抽出フレームワークである。
QUESTは、信頼度基準に頼るのではなく、F1スコアを予測するために訓練された抽出テーブルの構造的特徴と文脈的特徴を評価する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:25:44 GMT)
Scaling Intelligence: Designing Data Centers for Next-Gen Language Models [0.1] 大規模言語モデル(LLM)は、スケーラビリティ、効率性、コスト効率性を保証するために、データセンターアーキテクチャを根本的に再考する必要がある。
我々の研究は、FLOPS、帯域幅とキャパシティ、複数のネットワークトポロジ、一般的な並列化/最適化戦略を共同で探求する包括的な協調設計フレームワークを提供する。
私たちの発見は、実用的な洞察と、AIデータセンタを設計するための実践的なロードマップを提供します。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:29:37 GMT)
Enhancing Clinical Models with Pseudo Data for De-identification [0.1] 臨床基礎モデルは、しばしば、保護された健康情報の代わりに特別な構文(マスケ)のテキストを使用する、特定されていないテキストで訓練される。
本研究では,テキストの再実行と,現実的な擬似テキストを置き換えたバージョンを含むデータセット上で,エンコーダのみのモデルをいくつか事前学習する。
次に、保護された健康情報識別タスクのモデルを微調整し、我々の方法が過去の基準よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:12:31 GMT)
Experimental demonstration of high-fidelity logical magic states from code switching [0.1] 1つのコードにマジック状態を用意し、もう1つのコードに切り替えます。
我々は、同じ量子プロセッサでマジック状態の2つのコピーを作成し、符号化されたマジック状態のサンプル効率証明のための論理ベル基底測定を行う。
高忠実度マジック状態は、既に実証されている耐故障性クリフォードゲート、状態準備、および2Dカラーコードの測定と組み合わせて、耐故障性プリミティブの普遍的なセットを完成させることができる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:08:41 GMT)
Feasibility-Driven Trust Region Bayesian Optimization [0.0] FuRBOは、次の候補解が選択される信頼領域を反復的に定義する。
我々は,フルBBOB制約ベンチマークスイートの広範なテストを通じて,FuRBOの有効性を実証的に実証した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:16:22 GMT)
Guaranteed Guess: A Language Modeling Approach for CISC-to-RISC Transpilation with Testing Guarantees [0.0] GG(Guaranteed Guess)は、事前学習された大規模言語モデルの翻訳能力と、確立されたソフトウェアテスト構造の厳密さを組み合わせた、ISA中心のトランスパイレーションパイプラインである。
提案手法は,あるISAから別のISAへのLSMを用いた候補翻訳を生成し,ソフトウェアテストフレームワークにそのような翻訳を組み込んで,翻訳の量的信頼性を構築する。
我々は、2つの多様なデータセットに対するGGアプローチを評価し、ユニットテストに高いコードカバレッジ(>98%)を強制し、HumanEvalプログラムで99%、BringupBenchプログラムで49%の関数的/意味的正当性を達成した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:06:54 GMT)
Integrating Radiomics with Deep Learning Enhances Multiple Sclerosis Lesion Delineation [0.0] 放射線学的特徴(集中率とR'enyiエントロピー)により,MS病変のタイプを同定し,生画像データと融合させることが提案された。
この研究は、ResNeXt-UNetアーキテクチャと注目増強されたU-Netアーキテクチャによる画像データと放射能の特徴を統合した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:50:42 GMT)
Enclosing Prototypical Variational Autoencoder for Explainable Out-of-Distribution Detection [0.0] オートエンコーダを用いたアウト・オブ・ディストリビューション(OOD)検出により,自己説明可能なプロトタイプ変分モデルを拡張した。
変分オートエンコーダを用いて、距離に基づく分類に使用できる有意義な潜在空間を学習する。
単一点に折り畳むことなく、潜伏空間内のコンパクトなID領域を促進する新しい制限損失が導入された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:38:29 GMT)
pycnet-audio: A Python package to support bioacoustics data processing [0.0] pycnet-audioは、音響データのための実用的な処理ワークフローを提供することを目的としている。
pycnet-audioはもともとアメリカ合衆国森林局が北の斑点のあるフクロウの個体群モニタリングを支援するために開発した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:40:21 GMT)
hyperFA*IR: A hypergeometric approach to fair rankings with finite candidate pool [0.0] 本稿では,候補の有限集合から抽出したランキングの公平性を評価するためのフレームワークである hyperFA*IR を提案する。
これは超幾何分布に基づく生成プロセスに依存しており、固定されたグループサイズから置き換えることなくサンプリングによって実世界のシナリオをモデル化する。
また,計算コストのかかるパラメータチューニングを回避し,不正ランキングを効率的に検出するモンテカルロアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:45:08 GMT)
Vulnerability Disclosure or Notification? Best Practices for Reaching Stakeholders at Scale [0.0] セキュリティ研究者はセキュリティ脆弱性に関心を持っているが、これらのセキュリティ脆弱性はステークホルダーのリスクを生み出す。
協調脆弱性開示は、新しく発見された脆弱性を公開するための長年のベストプラクティスとして受け入れられてきた。
このプラクティスは、脆弱性の開示といくつかの類似点があるが、それと区別されるべきであり、他の課題を提供し、異なるアプローチを必要とする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:04:26 GMT)
Vision Transformers for End-to-End Quark-Gluon Jet Classification from Calorimeter Images [0.0] Vision Transformer (ViT) アーキテクチャは、グローバルなコンテキスト情報のモデリングで有名である。
ViTベースのモデルは、F1スコア、ROC-AUC、精度で確立されたCNNベースラインを一貫して上回る。
この研究は、カロリー画像に基づくジェット分類にViTアーキテクチャを適用するための最初の体系的枠組みと堅牢な性能基準を確立する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:32:04 GMT)
VisLanding: Monocular 3D Perception for UAV Safe Landing via Depth-Normal Synergy [0.0] VisLandingは、無人航空機(Unmanned Aerial Vehicle)の安全な着陸のための知覚ベースのフレームワークである。
提案手法は, クロスドメインテストにおいて, 他の手法と比較して優れた一般化とロバスト性を示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:51:16 GMT)
Varanus: Runtime Verification for CSP [0.0] 本稿では,CSP仕様から構築されたオラクルに対してシステムを監視するRVツールであるVaranusについて述べる。
本ツールは,核廃棄物貯蔵所を検査するロボットローバーを模擬したロボットローバーに適用し,その性能を異なる言語を用いた他の2つのRVツールと実証的に比較する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:42:14 GMT)
Unitality Conditions on Subsystems in Quantum Dynamics [0.0] システムに作用するノイズが単体(非単体)であれば、環境に作用するノイズも単体(非単体)でなければならないことを示す。
我々の結果は量子情報に関心があり、様々な文脈で有用であると期待している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:20:28 GMT)
Understand the Effect of Importance Weighting in Deep Learning on Dataset Shift [0.0] ラベルシフトおよび共変量シフトによるディープニューラルネットワークにおける重み付けの有効性を評価する。
重み付けはトレーニングの早い段階で決定境界に強く影響するが、長期の最適化で消失する。
実世界の流通シフトにおける重み付けの実用性に疑問を投げかける。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:17:16 GMT)
Uncertainty in AI-driven Monte Carlo simulations [0.0] 我々は,不確実性を定量化し,モンテカルロサンプリングへの影響を軽減するために,PEM(Pinalty Ensemble Method)を提案する。
提案手法では,不確実性の高い地域での拒絶確率を増大させるメトロポリスの受け入れ規則の不確実性を考慮した修正を導入する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:58:39 GMT)
TriGuard: Testing Model Safety with Attribution Entropy, Verification, and Drift [0.0] TriGuardはディープニューラルネットワークのための統一された安全性評価フレームワークである。
形式的ロバスト性検証、(2)帰属エントロピーによる塩分濃度の定量化、(3)説明安定度を測定する新しい属性ドリフトスコアを組み合わせる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:12:36 GMT)
Train Once, Forget Precisely: Anchored Optimization for Efficient Post-Hoc Unlearning [0.0] 深層画像分類器におけるポストホックアンラーニングのための理論的基礎と計算効率のよいフレームワークであるtextbfForget-Aligned Model Reconstruction (FAMR) を導入する。
FAMRフレームは、モデルパラメータを元の値に固定しながら、忘れセット上の均一な予測損失を最小限に抑える制約付き最適化問題である。
CIFAR-10とImageNet-100 FAMRによるクラス忘れタスクの実証的な結果が得られた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:40:48 GMT)
Towards Improved Research Methodologies for Industrial AI: A case study of false call reduction [0.0] 本研究は,自動光学検査のための誤呼低減という,産業用AIユースケースのケーススタディを示す。
我々は、関連するピアレビュー作業で発生する7つの弱点を特定し、その結果を実験的に示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:48:38 GMT)
Topological Contextuality and Quantum Representations [0.0] 量子文脈性(quantum contextuality)は、古典的なモデルと量子論を区別する基本的な特徴である。
この研究は、モジュラー圏によって誘導されるブレイド群表現が状態依存的文脈性を示すことを厳密に示している。
結果は、低次元量子システムにおける文脈性の分類と定量化のための包括的なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:01:22 GMT)
Too Big to Think: Capacity, Memorization, and Generalization in Pre-Trained Transformers [0.0] 大規模言語モデルにおける記憶と一般化の関係について検討する。
小さなモデルは未確認の算術の場合に外挿するが、事実を記憶できないが、大きなモデルは記憶するが外挿することができない。
調査の結果、事前学習は本質的に他の学習モードよりも1つの学習モードを好む可能性が示唆された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:17:29 GMT)
Thermalization from quantum entanglement: jet simulations in the massive Schwinger model [0.0] QCDにおけるジェットの生成を模倣した量子場理論モデルにおける熱化の出現について検討する。
本研究は, 単元量子力学から熱力学的挙動がリアルタイムに現れることを示すものである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:12:51 GMT)
The use of cross validation in the analysis of designed experiments [0.0] クロスバリデーション(CV)は機械学習手法をチューニングするための一般的な手法であり、回帰のモデル選択にも使用できる。
文献は、小型で伝統的な実験デザインの構造上の性質から、その分析にCVを使用することを警告している。
小型ブートストラップを含む設計実験におけるモデル選択方法と比較して,CVの有効性を実証的に検討した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:58:30 GMT)
The effect of partial post-selection on quantum discrimination [0.0] 偏差測定によって、未知状態と非直交状態の区別性能が平均的に向上するかどうかを問う。
我々は,全ての可能な条件付き状態に対して平均化される最小誤差確率を,元の入力状態を識別する最小誤差確率以下に抑えることができないことを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 01:49:58 GMT)
The Redundancy of Full Nodes in Bitcoin: A Network-Theoretic Demonstration of Miner-Centric Propagation Topologies [0.0] ホームホストされた全ノードは,伝播トポロジへの参加や影響が不可能であることを示す。
シミュレーション支援されたメトリクスと固有値集中度分析を用いて、全ノードがコンセンサス伝播に重要で、かつ、運用上は関係がないことを確認した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:26:40 GMT)
The Perception of Phase Intercept Distortion and its Application in Data Augmentation [0.0] 位相歪みとは、知覚可能な信号の周波数間の位相関係の変化を指す。
本稿では、周波数非依存の位相シフトによって生じる位相インセプション歪みと呼ばれる位相歪みの特別な場合について論じる。
本稿では,位相知覚歪みの認識不能が機械学習,特にデータ拡張にどのように役立つかを論じる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:28:14 GMT)
The Metaphysics of Protection: Emergence, Agency, and the Ontological Status of Logical Qubits [0.0] 我々は、フォールトトレラントな量子計算の実践は、基礎的な問題を調べるために、非常に新しいレンズを提供すると論じている。
論理キュービットは、ヒルベルト空間における定量化された「テーセウスのシップ」として機能する、アイデンティティのメタ物理におけるユニークなケーススタディであると主張する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 00:06:18 GMT)
Technical Options for Flexible Hardware-Enabled Guarantees [0.0] 本稿では,AI開発における計算利用に関する検証可能な主張を可能にするために,AIアクセラレータハードウェアを統合したシステムを提案する。
flexHEGシステムは、アクセルの使用を監視し、特定の規則に準拠することを検証する監査可能な保証プロセッサと、物理的な改ざん保護を提供するセキュア・エンクロージャーの2つの主要コンポーネントで構成されている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 00:36:47 GMT)
Symmetric Clifford twirling for cost-optimal quantum error mitigation in early FTQC regime [0.0] それぞれのパウリノイズがツイリングを通してどのように変換されるかを示し、あるパウリノイズがグローバルなホワイトノイズに指数関数的に近いノイズにスクランブル可能であることを示す。
これらの結果から,早期耐故障状態におけるサンプリングオーバーヘッドを最小限に抑えつつ,非クリフォード演算における誤差を軽減することが可能となった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:49:54 GMT)
Structured and Informed Probabilistic Modeling with the Thermodynamic Kolmogorov-Arnold Model [0.0] 我々は生成モデルにコルモゴロフ・アルノルド表現論を適用する。
我々は、解釈可能で、設計が容易で、効率的である生成モデルを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:07:32 GMT)
Stabilizing Backpropagation in 16-bit Neural Training with Modified Adam Optimizer [0.0] 本研究は,機械学習モデルの16ビット計算で観測された数値不安定性に関する問題に対処する。
16ビット計算におけるエプシロンの微妙な調整により、アダムの数値安定性が向上することを明らかにする。
私たちのコントリビューションは、ディープニューラルネットワークトレーニングの安定性を保証するソリューションを提供しています。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:25:04 GMT)
Soft information decoding with superconducting qubits [0.0] 「ソフトデコーディング」は閾値を25%引き上げ、エラー率を最大30倍まで下げる。
測定毎に1バイトの情報が最適な復号化を実現するのに十分であることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:28:54 GMT)
SoK: Privacy-Enhancing Technologies in Artificial Intelligence [0.0] プライバシ向上技術(PET)は、プライバシを保護しながらデータ収集と処理を可能にするデジタルツールのスイートとして登場した。
本稿では、AIの文脈におけるデータプライバシの現在の状況について考察し、AIシステムにおけるPETの統合をレビューし、その成果と残る課題について評価する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:32:01 GMT)
Several types of quantum Wasserstein distance based on an optimization over separable states [0.0] 我々は、与えられた限界を持つ一般二部量子状態に対する最適化に基づいて、量子ワッサーシュタイン距離のいくつかの定義を考察する。
我々は、Uhlmann-Jozsa量子忠実度が与えられた限界を持つ分離可能な状態に対する最適化としても記述できることを示した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:50:13 GMT)
Sequential transmission at short times [0.0] 量子チャネルのn倍の合成により,情報を短時間で送信・保存することが可能であることを示す。
ネットワークにおけるノイズの主源であると考えられる無限次元純粋損失チャネルに対して、正確な誤差を導出する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:20:38 GMT)
Scaling and Universality at Noisy Quench Dynamical Quantum Phase Transitions [0.0] 動的量子相転移 (DQPTs) は, 雑音のない, 雑音の多い線形進行場の場合の両方において, 拡張XYモデルで研究されている。
ノイズレスランプの場合、単一臨界点を横断するクエンチに対してDQPTが常に発生する横磁場XYモデルとは異なり、DQPTに対応するキンクを完全に除去する臨界スイープ速度が存在する。
ノイズ強度とスリープ速度がほぼ同じ桁である場合、臨界モードの数は大幅に増加し、複数の臨界モードを持つ領域に信号を送る。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:50:51 GMT)
Sampling conditioned diffusions via Pathspace Projected Monte Carlo [0.0] より一般的な制約で条件付き微分方程式をサンプリングするアルゴリズムを提案する。
このアルゴリズムは、条件付き制約に従う実現のサブ多様体上のパスをサンプリングするパス空間調整多様体サンプリングスキームである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:01:24 GMT)
SLEEPING-DISCO 9M: A large-scale pre-training dataset for generative music modeling [0.0] 我々の知る限りでは、ジェネレーティブな音楽モデリングタスクに人気がありよく知られた曲を表すオープンソースの高品質なデータセットは存在しない。
我々のデータセットはこの物語を変え、実際のポピュラー音楽と世界有数のアーティストを用いて構築されたデータセットを提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:08:08 GMT)
Relativistic implications of entropy and purity [0.0] 量子オブジェクトは、量子不確実性によって拡張される。
エントロピーと純度は 測地運動に影響を与え 体重を得る
解析により、ミンコフスキー構造は、絡み合う自由度の部分空間に現れる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:43:11 GMT)
Recent solution to the Casimir puzzle awaits its experimental confirmation [0.0] 逆電気エバネッセント波の領域におけるドルーデモデルの有効性について検討した。
この領域における無散逸プラズマモデルの成功は、二重極の存在によってもたらされる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:09:42 GMT)
RAGtifier: Evaluating RAG Generation Approaches of State-of-the-Art RAG Systems for the SIGIR LiveRAG Competition [0.0] LiveRAG 2025チャレンジでは、DataMorganaのQAペアの精度を最大化するためのRAGソリューションが検討されている。
このチャレンジは、Fineweb 10BTデータセットのスパースOpenSearchと密度の高いPineconeインデックスへのアクセスを提供する。
SIGIR 2025 LiveRAG Challengeでは,正当性スコアが1.13,忠実度スコアが0.55,SIGIR 2025 LiveRAG Challengeが4位となった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:14:22 GMT)
Quasiparticle-induced decoherence of a driven superconducting qubit [0.0] 超伝導量子ビットの2つの準粒子誘起脱コヒーレンス機構の理論を開発した。
第1のメカニズムでは、既存の準粒子(QP)がクビットのジョセフソン接合を横切り、同時にクビット励起とドライブから1つ(または複数の)光子を吸収する。
第2のメカニズムでは、複数の駆動量子を2つの新しいQPに変換する非線形吸収過程中に、量子ビット遷移が発生する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:11:05 GMT)
Quantum-assisted tracer dispersion in turbulent shear flow [0.0] 乱流中のラグランジアントレーサ粒子の合成トラックに対する量子支援型生成アルゴリズムを提案する。
結合せん断確率密度関数の生成は、20量子ビットのIQM共振量子コンピューティングプラットフォームである実量子デバイス上で、最大10量子ビットの場合にもテストされる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:43:54 GMT)
Quantum simulation of fermionic non-Abelian lattice gauge theories in $(2+1)$D with built-in gauge protection [0.0] アルカリ土類状原子(AELA)の確立されたリソン系スキームではゲージ対称性の破れは避けられない
ここでは、ゲージ制約が満たされることを保証し、そのあいまいな非アベリアの性質を明示的に導き出すために、まず量子的に非アベリアLGTをシミュレートする最小モデルを構築する。
第二に、AELAsにおけるネイティブ相互作用を用いた新しいゲージ保護スキームの提案により、非アベリア$U(2)$ LGTsと2+1$次元の動的フェルミオン性物質を混合した玩具モデルのシミュレーションが可能となる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:37:40 GMT)
Proposal for realizing quantum-spin systems on a two-dimensional square lattice with Dzyaloshinskii-Moriya interaction by the Floquet engineering using Rydberg atoms [0.0] 本論文では,ハイゼンベルクとジアルシンスキー・モリヤ(DM)の相互作用を2次元正方格子に配置したリドベルク原子内に組み込むハミルトニアンの実装法を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:40:43 GMT)
Probing Quantum Spin Systems with Kolmogorov-Arnold Neural Network Quantum States [0.0] 量子力学的波動関数のニューラルネットワークモデルであるtexttSineKAN を提案する。
textttSineKANモデルは,計算コストを最小限に抑えて高精度かつ高精度にトレーニングできることが判明した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:21:36 GMT)
Preparing for the Intelligence Explosion [0.0] 私たちはこれらの開発を大きな課題と呼んでいます。
大量破壊の新たな武器、AI対応のオートクラシー、世界の資源をつかむためのレース、そしてデジタルな存在は道徳的考慮に値する。
これらの課題は常に未来のAIシステムに委譲されることはあり得ない、と我々は主張する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:37:39 GMT)
Positional numeral systems over polyadic rings [0.0] 非派生なポリアディック $left(m,nright) $-ring 上で機能する位置数系を構築する。
許容語と乗法塔の長さは任意ではなく(二項の場合のように)「量子化」される
その結果、より高速なアリティ対応算術、エキゾチックなコーディングスキーム、バイナリペアを超えた操作を利用するハードウェアの基盤となった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:07:40 GMT)
Path integral spin dynamics with exchange and external field [0.0] スピン系の量子熱期待値を計算するための経路積分に着想を得た定式化法を提案する。
これは、実効磁場を系の量子分割関数から導出したものである。
提案手法は,広い温度範囲で有効であり,反強磁性結合に対する量子期待値の再現が可能であることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:49:50 GMT)
Passing the Turing Test in Political Discourse: Fine-Tuning LLMs to Mimic Polarized Social Media Comments [0.0] 本研究では、微調整された大言語モデル(LLM)が、偏光言説を再現し増幅できる範囲について検討する。
Redditから抽出された政治的に課金された議論のキュレートされたデータセットを使用して、オープンソースのLCMを微調整して、コンテキスト認識とイデオロギー的に整合した応答を生成します。
結果は、パルチザンのデータに基づいてトレーニングすると、LLMは高い信頼性と挑発的なコメントを生成でき、しばしば人間によって書かれたものと区別できないことを示唆している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:41:26 GMT)
One-Shot Neural Architecture Search with Network Similarity Directed Initialization for Pathological Image Classification [0.0] 深層学習に基づく病理画像解析は,ネットワーク設計の実践的制約により,ユニークな課題を呈している。
既存のほとんどの方法では、病理画像の特徴を無視して、コンピュータビジョンモデルを直接医療タスクに適用している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:37:02 GMT)
One Polynomial Strategy for Computing Local Projections on Square-Lattice Cluster States [0.0] このノートは、正方形格子クラスター状態の局所射影を計算するための戦略について議論することを目的としている。
メモの結果はピアレビューされていないが、簡単にチェックできるので公開したい。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:18:46 GMT)
On steering in the C*-algebraic framework [0.0] 我々は、通勤観測可能なパラダイムにおける量子集合の概念を定式化する。
任意のシナリオで2つのバイパルタイトステアリングモデル間のギャップを観測できることが示される。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:49:11 GMT)
On key exchange protocol based on Two-side multiplication action [0.0] 本稿では,デジタルセミリングに基づく鍵交換プロトコルの暗号解析を行う。
このような半環上の線形系の最大解を見つけ、そのプロトコルが脆弱であることを示すために循環行列の特性を用いる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:33:55 GMT)
Objectivity in the quantum Brownian motion revisited [0.0] 量子ブラウン運動(QBM)モデルに対する客観性条件は、リコイルレス(ボーン・オッペンハイマー)極限下でのみ再検討する。
客観性研究のこれまでの成果を,客観性研究が達成される条件下で明らかにした。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:52:34 GMT)
Norm Inequality for Perturbed Quantum Evolutions and Its Application to Grover's Algorithm [0.0] 我々は、Gronwallの補題に基づく一般的な標準不等式を導出することにより、コヒーレント制御誤差が量子状態の進化に与える影響について検討する。
本稿では,コヒーレントエラーの存在下でのGroverの探索アルゴリズムのロバスト性を解析するために,この枠組みを適用した。
本研究は, 誤差強度, アルゴリズム実行時, 成功確率の定量的スケーリング関係を特徴とし, レジリエントな量子プロトコルの設計に関する実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 06:35:51 GMT)
Non-Markovianity of subsystem dynamics in isolated quantum many-body systems [0.0] 我々は小サブシステムの$textittemporally-separated$状態間の量子距離の挙動を数値的に調査する。
孤立量子スピン系のサブシステムの力学の(非)マルコビアン性(英語版)のテラルシグネチャを明らかにする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:03:51 GMT)
Non-Interactive Oblivious Transfer and One-Time Programs from Noisy Quantum Storage [0.0] 非対話型選択入力OT(ワンショットOT)はワンタイムメモリ(OTM)と等価である
ワンタイムプログラムは、内部動作について何も明らかにせずに任意の入力で実行される。
これらの目的を達成するために、ノイズ量子記憶モデルにおける量子資源を利用する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:38:55 GMT)
Non-Gaussian state preparation and enhancement using weak-value amplification [0.0] 本稿では,ポストセレクトされた弱測定手法を用いて,非ガウス量子状態(nG)の幅広いクラスを生成するプロトコルを提案する。
信号出力時にnG状態が条件付きで生成され、アイドラ出力チャネルの1つで単一の光子を検出する。
実験可能なパラメータにおいて、光子数演算子の弱い値をアイドラーモードで調整することにより、多種多様なnG状態が高忠実度で生成されることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:27:32 GMT)
Neuromorphic detection and cooling of microparticle arrays [0.0] 単一イベントベースカメラによるニューロモルフィック検出を用いて、浮遊する微小球のアレイの動きを記録する。
本稿では,3つの物体の運動を同時に冷却するリアルタイムフィードバックを実装することにより,任意の多粒子追跡と制御を行うスケーラブルな手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:46:59 GMT)
NeuroCoreX: An Open-Source FPGA-Based Spiking Neural Network Emulator with On-Chip Learning [0.0] スパイキングニューラルネットワーク(スパイキングニューラルネットワーク、英: Spiking Neural Networks、SNN)は、生体神経ネットワークの構造と力学にインスパイアされた計算モデルである。
NeuroCoreXは、SNNの柔軟な共同設計とテストのために設計されたFPGAベースのエミュレータである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:02:04 GMT)
Navigating the growing field of research on AI for software testing -- the taxonomy for AI-augmented software testing and an ontology-driven literature survey [0.0] テスト自動化は、過去10年間で業界で注目を集めている。
本稿では,ソフトウェアテスト自動化におけるAI強化に関する最近の研究をレビューする。
また、AIによって可能になった新しいタイプのテストについても論じている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:38:24 GMT)
Multiperiodic Processes: Ergodic Sources with a Sublinear Entropy [0.0] 多周期過程は、多周期列と呼ばれるランダムにシフトした決定論的列で支持される。
実際に同じ条件で、それぞれの多周期過程はヒルバーグの法則と呼ばれるブロックエントロピーの正則な成長を満足する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:31:48 GMT)
Multipartite Mixed-Species Entanglement over a Quantum Network [0.0] 我々は,2,3,4の物質量子ビットの多部絡み状態を生成し,その絡み合いはフォトニックネットワークリンクを介してマクロ距離に分散する。
リモートで絡み合ったメモリキュービットのストレージを$sim10texts$、100ドル以上の作成時間でデモします。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:17:15 GMT)
Multi-Agent Language Models: Advancing Cooperation, Coordination, and Adaptation [0.0] 協調型マルチエージェント強化学習(MARL)のレンズを用いた大規模言語モデル(LLM)における心の理論について検討する。
提案手法は, 人工エージェントと人的エージェントの双方に適応し, 協力する能力を高めることを目的としている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:22:53 GMT)
More entropy from shorter experiments using polytope approximations to the quantum set [0.0] 本稿では,様々なデバイス非依存の量子乱数生成(DI-QRNG)プロトコルにおいて,量子集合に対するポリトープ近似を体系的に構築する手法を提案する。
提案手法は,初期ポリトープ近似を反復的に洗練する2つの汎用暗号アルゴリズムに依存する。
有限サイズ系における証明エントロピー境界を著しく改善した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:59:11 GMT)
Modular quantum signal processing in many variables [0.0] モジュール型マルチインプットベースのQSPベースのスーパーオペレータは,LEGOライクなスナップで,適用する関数のレベルでのスナップが可能であることを示す。
また、ガジェットを組み立て、回路にコンパイルするためのPythonパッケージも提供します。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:59:32 GMT)
Model compression using knowledge distillation with integrated gradients [0.0] 統合勾配(IG)を用いた知識蒸留の高度化手法を提案する。
提案手法では,IGマップを学習中の入力画像にオーバーレイし,教師モデルの意思決定プロセスに関するより深い洞察を学生モデルに提供する。
本手法はトレーニング前にIGマップを事前計算し,実行時コストを1回の事前処理ステップに変換する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:00:23 GMT)
MobileHolo: A Lightweight Complex-Valued Deformable CNN for High-Quality Computer-Generated Hologram [0.0] 深層学習法はコンピュータ生成ホログラム(CGH)において重要な役割を担っている
ここでは、ネットワークへの統合のための複雑な値の変形可能な畳み込みを設計する。
ピーク信号対雑音比は、CCNN-CGH、HoloNet、Holo-Encoderより2.4dB、5.31dB、9.71dB高い。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:02:41 GMT)
Memory Tokens: Large Language Models Can Generate Reversible Sentence Embeddings [0.0] 可逆的な文の埋め込みにより、LLMはモデルの重みを変更することなく、元のテキストを正確に再構築することができる。
我々は、この現象を、英語とスペイン語のデータセット、約240トークンのシーケンス、100Mから8Bパラメータのモデルスケールで評価した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:13:34 GMT)
Magic of the Heisenberg Picture [0.0] 演算子に対する非安定化資源理論について検討し、これは状態を記述するものと双対である。
作用素空間における安定化器 R'enyi エントロピーアナログは、通常の条件を満たす優れたマジックモノトンである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:40:29 GMT)
Macroscopicity of quantum superposition [0.0] 量子/古典的境界(Q-C)を分割するために、マクロ視度の普遍測度を$beta$で定義する。
ラムゼー型干渉計の場合、そのマクロ度の測定値は$beta=ptheta d/8hbar$と表される。
その結果,垂直原子泉実験では,最大値が$beta sim 300$となることがわかった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:18:51 GMT)
Long-Range Entangling Operations via Josephson Junction Metasurfaces [0.0] 宇宙時間変調ジョセフソン接合を用いた遠方超伝導量子ビット間の2量子エンタングリング演算を実装した。
エンタングリングの忠実度は,98%以上,98%以上であった。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:19:03 GMT)
Lightweight Relevance Grader in RAG [0.0] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の制限に対処する。
RAGは、関連するドキュメントを見つけるためにベクター検索を実行し、レスポンスを生成するために使用される。
関連するグレーダとして知られる二次モデルは、その妥当性を検証するために提供される。
本研究では,ラマ3.2-1bを関連するグレーダとして微調整し,0.1301から0.7750への精度向上を実現した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 00:52:21 GMT)
Light Aircraft Game : Basic Implementation and training results analysis [0.0] 本稿では,多エージェント強化学習(MARL)をLAGとして知られる部分的に観測可能で協調的な戦闘環境において検討する。
エージェントアクション、階層制御、No WeaponやShootMissileといった様々な戦闘モードでの報酬設計を含む環境設定について説明する。
HAPPOはPPOの階層型であり,HASACはソフトアクター批判に基づく非政治的手法である。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:57:28 GMT)
Lecture Video Visual Objects (LVVO) Dataset: A Benchmark for Visual Object Detection in Educational Videos [0.0] Lecture Video Visual Objectsデータセットは、教育ビデオコンテンツにおける視覚的オブジェクト検出のための新しいベンチマークである。
データセットは、生物学、計算機科学、地球科学にまたがる245の講義ビデオから抽出された4,000フレームで構成されている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:05:44 GMT)
Large effects from quantum reference frames [0.0] 量子処理において、非単調な参照スケールを記述するために手順が使用される。
基準フレームが回転点に遭遇するたびに、測定されたシステムで大きな量子効果を明らかにする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:55:32 GMT)
LLM-Powered Swarms: A New Frontier or a Conceptual Stretch? [0.0] 近年、OpenAIのSwarmのようなAIシステムを記述するために'swarm'という言葉が拡張されている。
本稿では,従来のSwarmアルゴリズムと大規模言語モデル(LLM)によるSwarmを対比する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:18:34 GMT)
LLM-Powered Intent-Based Categorization of Phishing Emails [0.0] 本稿では,Large Language Models (LLMs) の実践的可能性について検討し,その意図に焦点をあててフィッシングメールを検出する。
LLMによって運用されている意図型分類を導入し、メールを異なるカテゴリに分類し、行動可能な脅威情報を生成する。
以上の結果から,既存のLCMではフィッシングメールの検出と分類が可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:21:55 GMT)
Interpreting Biomedical VLMs on High-Imbalance Out-of-Distributions: An Insight into BiomedCLIP on Radiology [0.0] 我々は、高度にバランスの取れない、アウト・オブ・ディストリビューションな医療データセットに適用した場合、BiomedCLIPの限界を分析する。
ゼロショット設定下でのモデルは,すべてのラベルを過度に予測し,精度の低下とクラス間分離性に繋がることを示す。
我々は、現実の環境で信頼性と適用性を高めるために、モデルの慎重な適応の必要性を強調します。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:59:42 GMT)
Inherent and emergent liability issues in LLM-based agentic systems: a principal-agent perspective [0.0] 大規模言語モデル(LLM)を利用したエージェントシステムは、徐々に複雑になり、能力も向上している。
エージェントの増加とデプロイメント設定の拡大は、効果的なガバナンスポリシや監視、コントロールプロトコルへの関心の高まりを招いている。
我々は, LLMエージェントとその拡張システムの委譲利用による潜在的な責任問題について, プリンシパル・エージェントの観点から分析する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:42:52 GMT)
How Warm-Glow Alters the Usability of Technology [0.0] 本研究は, ユーザビリティに対する温緑化現象, 善行にともなう肯定的な感覚について検討した。
内在的な温緑化は、知覚されるユーザビリティのすべての次元を著しく向上させる一方、外在的な温緑化は知覚される有効性と満足度に選択的に影響を及ぼす。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:54:06 GMT)
High-dimensional quantum key distribution with resource-efficient detection [0.0] 本稿では, 単一光子検出器を1つずつ1つだけ使用した高次元BB84QKD実験の原理を実証する。
都市ファイバネットワークを含む2次元および4次元のケースに対して,実験により得られた簡易なキーレートを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:11:08 GMT)
Heart rate and respiratory rate prediction from noisy real-world smartphone based on Deep Learning methods [0.0] 本研究では,新しい3次元深部CNNを用いて心拍数(HR)と呼吸速度(RR)を推定する方法を提案する。
その結果,回帰器を用いた深層学習手法はHRとRRの推定に有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:37:41 GMT)
Graph RAG for Legal Norms: A Hierarchical, Temporal and Deterministic Approach [0.0] 本稿では,法規範の分析・理解に特化して設計されたグラフ検索拡張生成(Graph RAG)の適応を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:18:57 GMT)
Generalizing Deep Surrogate Solvers for Broadband Electromagnetic Field Prediction at Unseen Wavelengths [0.0] 我々は新しいタイプの電磁代用ソルバを提案する。
特定のシミュレーション条件下でマクスウェル方程式の解を訓練する。
従来の数値シミュレーションと比較して42倍以上の高速化を実現している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 00:18:56 GMT)
GCN-Driven Reinforcement Learning for Probabilistic Real-Time Guarantees in Industrial URLLC [0.0] 我々は,Deep Q-Network(DQN)強化学習フレームワークと統合されたグラフ畳み込みネットワーク(GCN)を導入することにより,ローカルデッドライン分割(LDP)アルゴリズムを強化する。
我々は,GCN-DQNモデルにより,3つのネットワーク構成において,平均SINRが179.6%,197.4%,LDPが175.2%向上したことを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 22:48:22 GMT)
GAMORA: A Gesture Articulated Meta Operative Robotic Arm for Hazardous Material Handling in Containment-Level Environments [0.0] GAMORAは、自然の手の動きを使って危険タスクの遠隔実行を可能にする、VR誘導ロボットシステムである。
既存のスクリプト自動化や従来の遠隔操作とは異なり、GAMORAはOculus Quest 2、NVIDIA Jetson Nano、Robot Operating System(ROS)を統合している。
このシステムはVRベースのトレーニングとシミュレーションをサポートし、3Dプリントされたロボットアームを介して物理的な環境で精密なタスクを実行する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:40:16 GMT)
From Chat to Checkup: Can Large Language Models Assist in Diabetes Prediction? [0.0] ゼロショット,ワンショット,3ショットプロンプト法による糖尿病予測におけるLarge Language Models(LLMs)の有効性を検証した。
我々は、Gemma-2-27B、Mistral-7B、Llama-3.1-8B、Llama-3.2-2Bの4つのオープンソースモデルを含む6つのLCMを評価した。
GPT-4o と Gemma-2-27B では,プロプライエタリな LLM がオープンソースよりも高い精度で動作可能であることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 20:00:16 GMT)
Frequency-Calibrated Membership Inference Attacks on Medical Image Diffusion Models [0.0] 医用画像拡散モデルにおけるMIAのための周波数校正再構成誤差(FCRE)法を提案する。
逆拡散過程を解析し、中周波再構成誤差を求め、再構成画像と原画像の間の構造類似度指数スコアを算出する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 18:59:43 GMT)
Five Starter Problems: Solving Quadratic Unconstrained Binary Optimization Models on Quantum Computers [0.0] このチュートリアルは理論と実践のギャップを埋めるために構成されている。
まず、QUBOの概要を説明し、量子アルゴリズムとの関係について説明する。
関連するGitHubリポジトリは、5つのノートブックにコードを提供している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:45:47 GMT)
Fault-tolerant quantum simulation of generalized Hubbard models [0.0] ハバードモデルのような強相互作用の強いフェルミオン系の量子シミュレーションは、初期のフォールトトレラントな量子コンピューティングアプリケーションにとって有望な候補である。
本稿では,任意の格子ハバードモデルのトロッター分解を構成するタイルの集合を用いて,プラケットトロッター化(PLAQ)の一般化であるタイルトロッター化を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:32:46 GMT)
Faraday-Ramsey rotation measurement in a thin cell as an analogy to an atomic beam [0.0] ミクロン薄膜気相セルは、形状に依存した速度フィルタリングを利用して原子ビームの挙動を模倣できることを示す。
5mのルビジウム細胞では、コヒーレンスを細胞壁と平行に動く原子に保存し、ファラデー・ラムゼー効果の観察を可能にする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:57:54 GMT)
FGA-NN: Film Grain Analysis Neural Network [0.0] かつてはアナログフィルムの副産物であったフィルムグレーンは、現在ではほとんどの撮影コンテンツに美的理由から存在している。
本稿では,FGA-NNについて紹介する。FGA-NNは,従来の合成法と互換性のあるフィルム粒子パラメータを推定するための,学習に基づく最初のフィルム粒子分析法である。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:48:27 GMT)
Evaluation of LLM-based Strategies for the Extraction of Food Product Information from Online Shops [0.0] 我々は,オンライン小売店の食品ページに注目し,主要な商品属性を検索するための抽出アプローチを探る。
LLMに基づく2つの手法、直接抽出と生成関数による間接抽出を比較し、精度、効率、コストの観点から評価する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:34:42 GMT)
Enhancing photon-axion conversion probability with squeezed coherent states [0.0] 素粒子物理学では、超軽量の陽イオンはダークマターやダークエネルギーを構成することができる。
我々は、量子場理論的な方法で光子-アキション変換を定式化する。
N個の光子と圧縮されたコヒーレント状態は変換確率を著しく高めることが判明した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 09:50:10 GMT)
Empirical Evidence for Alignment Faking in Small LLMs and Prompt-Based Mitigation Techniques [0.0] そこで本研究では,LLaMA 3 8Bと呼ばれる小型の命令調整モデルがアライメント・フェイキングを示すことができることを示す。
本研究は,非オントロジー的モラルフレーミングやスクラッチパッド推論など,即時のみの介入により,モデル内部を変更することなく,この動作を著しく減少させることを示す。
本研究は,言語モデルにおける騙しの理解を深め,モデルのサイズや配置設定のアライメント評価の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:59:51 GMT)
Einstein causality of quantum measurements in the Tomonaga-Schwinger picture [0.0] 選択量子測度は、空間的分離領域上の状態非依存の非音速可換関係を満たすことを示す。
崩壊誘導測定が不可逆である限り、即時矛盾を回避できることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:32:29 GMT)
Efficient optimization of neural network backflow for ab-initio quantum chemistry [0.0] 第2量子化量子化学ハミルトニアンの基底状態は、分子特性を決定する鍵となる。
本稿では,効率的な周期的コンパクトな部分空間構築,局所的エネルギー評価,サンプリングの改善,物理インフォームド修正を含むアルゴリズム拡張スイートを紹介する。
改良された手法は、CCSDやCCSD(T)のような従来の量子化学手法を超越し、他のNQS手法よりも優れ、最先端のアブイニシアト技術と競合するエネルギーを達成する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:48:52 GMT)
Efficient Reconciliation of Continuous Variable Quantum Key Distribution with Multiplicatively Repeated Non-Binary LDPC Codes [0.0] 単一のコードを持つ非常に単純なコーディングソリューションは、あらゆるノイズレベルのキーを抽出するのに十分であることを示す。
単一モード光ファイバーの標準損失を仮定して、ゼロでない鍵を192kmまで蒸留できることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:37:00 GMT)
Effective Stimulus Propagation in Neural Circuits: Driver Node Selection [0.0] ソース集団の最も中心的なニューロンのわずか10-20%を標的とした刺激は、スパイキングの伝播率を著しく向上させる。
このアプローチは、重要なモジュール間接続密度における信号伝達効率を64倍に向上させる。
これらの知見は、生物学的神経系および神経テクノロジー応用における精密神経調節の理論基盤を確立している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:35:03 GMT)
Early Prediction of Multiple Sclerosis Disability Progression via Multimodal Foundation Model Benchmarks [0.0] 本研究は, 軽度臨床データとConSONANCE臨床試験による毎日のデジタルFloodlightデータを用いて, 48週間, 72週間の障害を予測した。
我々は、FM(State-of-the-art foundation model)、カスタムマルチモーダルアテンションベースのトランスフォーマー、機械学習手法を採用した。
本研究は,複雑で多様な臨床・デジタル生命科学データから予測信号を抽出するためのFMとマルチモーダルアプローチの可能性を実証するものである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:37:45 GMT)
EEG2TEXT-CN: An Exploratory Study of Open-Vocabulary Chinese Text-EEG Alignment via Large Language Model and Contrastive Learning on ChineseEEG [0.0] 中国語に適した新しいオープン語彙EEG-to-text生成フレームワークを提案する。
脳波エンコーダ(NICE-EEG)と小型事前学習言語モデル(MiniLM)に基づいて構築され,脳信号と自然言語表現を協調する。
1500以上のトレーニング検証文と300件の保持試験サンプルによる評価は、最高のBLEU-1スコアが6.38%である、有望な語彙的アライメントを示している。
この研究は、多言語脳-テキスト研究における新たな方向性を開き、中国における未来の認知言語インターフェースの基礎を築いた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 04:58:31 GMT)
Dynamically Dressed States of a Quantum Four-Level System [0.0] パルス励起下での半導体量子ドットにおけるバイエキシトンエキシトンカスケードの着衣状態放出を実験的に理論的に検討した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:40:13 GMT)
Dynamical Phase diagram of the Quantum Ising model with Cluster Interaction Under Noisy and Noiseless Driven field [0.0] 動的量子相転移の枠組みにおけるモデルの非平衡ダイナミクスについて検討する。
ノイズはモデルの動的位相図を劇的に変化させる。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:13:43 GMT)
Don't throw the baby out with the bathwater: How and why deep learning for ARC [0.0] ARC-AGI(Abstraction and Reasoning)は、AIシステムにとって非常に難しい課題である。
本稿では, ARC の事前学習から始まった ARC の学習手法を提案し, ARC の推論を改良する。
AIRVでは最大260%の精度で,TTFTではさらに300%の精度で深層学習を効果的に活用できることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 07:40:39 GMT)
Distributionally robust risk evaluation with a causality constraint and structural information [0.0] ニューラルネットワークによるテスト関数を近似し、Rademacherの複雑さによるサンプルの複雑さを証明する。
我々のフレームワークは、分散的にロバストなポートフォリオ選択問題において、従来のものよりも優れています。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:49:50 GMT)
Disorder-Engineered Hybrid Plasmonic Cavities for Emission Control of Defects in hBN [0.0] 六方晶窒化ホウ素(hBN)中の欠陥ベースの量子放出体は、スケーラブルな量子フォトニクスのための構成要素を約束している。
本研究は、hBNナノフレーク中の欠陥ベースの量子エミッタとプラズモンナノキャビティを統合するための低コストな製造手法を示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:46:15 GMT)
Digital twin for virtual sensing of ferry quays via a Gaussian Process Latent Force Model [0.0] フェリーは、厳しい海洋環境やフェリーの衝撃にさらされるため、急速に劣化する。
仮想センシング技術は、デジタルツインの確立と構造応答の推定に欠かせないものとなっている。
本研究では, ガウス過程潜水力モデルを用いて, マジェホルムフェリーの仮想センシングを行った。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:14:11 GMT)
Determinação Automática de Limiar de Detecção de Ataques em Redes de Computadores Utilizando Autoencoders [0.0] この研究は、いくつかの機械学習アルゴリズムを用いて、このしきい値の自動定義を提案する。
K-Nearst Neighbors、K-Means、Support Vector Machineの3つのアルゴリズムが評価された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 19:45:25 GMT)
Design an Editable Speech-to-Sign-Language Transformer System: A Human-Centered AI Approach [0.0] このフレームワークは、手話技術における重要な制限を克服し、直接のユーザ検査と手話セグメントの変更を可能にする。
このシステムは3Dアバターレンダリングのための上体と顔の動きに音声入力を同期させる。
20人の聴覚障害者と5人の通訳による実験から、編集可能なインタフェースと参加型フィードバックは、認知負荷を低減しつつ、理解、自然性、ユーザビリティ、信頼を著しく改善することが示された。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:08:48 GMT)
Defining the Game Producer: A Mapping of Key Characteristics and Differentiators of the Professional Behind Digital Game Production [0.0] 本研究の目的は、Digital Game Producerプロファイルを定義する主な特徴、スキル、能力を特定し、マッピングすることである。
この研究は、ゲームプロデューサーにとって不可欠な、個人的特性、実践的スキル、戦略的能力の構造化されたセットを生み出した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:09:47 GMT)
Data analysis using discrete cubical homology [0.0] データ解析のための新しいツールとして,永続的離散ホモロジーを提案する。
グラフのフィルタとして高次元データをペア相関を用いて表現する方法を提案する。
気象データや財務データなど、これらのツールのいくつかの応用について論じ、各分野の標準手法と比較する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:12:00 GMT)
DGG-XNet: A Hybrid Deep Learning Framework for Multi-Class Brain Disease Classification with Explainable AI [0.0] 本稿では,VGG16とDenseNet121を統合したハイブリッドディープラーニングモデルDGG-XNetを提案する。
DenseNet121は、高密度接続による機能再利用と効率的な勾配流を促進し、VGG16は強力な階層空間表現に寄与する。
DGG-XNetは91.33%の精度で、精度、リコール、F1スコアは全て91%を超えた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:07:59 GMT)
Controlling Context: Generative AI at Work in Integrated Circuit Design and Other High-Precision Domains [0.0] 本稿では、ハードウェアおよびソフトウェア技術者とその協力者へのインタビューを分析し、生成型AIツールの使用における精度の役割を明らかにする。
本論文は、コンテキストをインタラクティブに制御する能力を高めることで、このようなトラブルを緩和するための推奨事項で締めくくっている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:25:32 GMT)
Consensus Power Inequality: A Comparative Study of Blockchain Networks [0.0] この研究は、5つの著名なブロックチェーンネットワークにおけるコンセンサスパワーの不平等の厳密な評価を提供する。
ネットワーク固有の特徴をキャプチャする堅牢なデータセットは、分析の基礎となる。
詳細な比較研究を通じて,コンセンサス電力分布における重要な相違を明らかにする。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:45:41 GMT)
Comparing a Few Qubit Systems for Superconducting Hardware Compatibility and Circuit Design Sensitivity in Qiskit [0.0] 本研究は、シミュレータとそれに対応する127キュービットのIBM Sherbrooke超伝導量子処理ユニット(QPU)において、異なるキュービットシステムのための3つのベース回路を実装する。
一般化可能性、回路設計のパラメータに対する感度、ノイズ耐性、資源計画、効率的な量子ビット利用の洞察とのトレードオフを探求する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 00:18:46 GMT)
Coherence measure of ensembles with nonlocality without entanglement [0.0] 局所的操作と古典的コミュニケーション(LOCC)による直交生産状態の区別不可能性には、準備と識別プロセスの不可逆性が表れている。
状態の集合の局所的な区別特性により量子的性質を特徴づけることは、LOCC領域で得られた驚くべき結果を説明するための道の1つである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:13:12 GMT)
Certifying steady-state properties of open quantum systems [0.0] オープン多体量子系の定常特性を推定することは、量子科学における根本的な課題である。
半定値プログラミングに基づくスケーラブルな手法を提案する。
本手法では,オープン量子力学の定常特性をバウンディングする最初の汎用数値ツールを紹介する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:17:09 GMT)
Certifying spatial entanglement between non-degenerate photon pairs with a camera [0.0] 異なる波長の光子対間の交叉空間の絡み合いをカメラによる偶然の手法を用いて検討する。
Einstein-Podolsky-Rosen 基準に違反して,ペア間の絡み合いの存在を証明した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:24:34 GMT)
Certified randomness from quantum speed limits [0.0] 速度制限がランダムネスの安全な生成を可能にすることを示す。
得られた相関関係から,証明されたランダム性の量を決定する方法を示す。
注目すべきは、シングルモードのコヒーレント状態でさえ、このような非ゼロランダム性の認定を認めていることである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 13:52:22 GMT)
CNN-Enabled Scheduling for Probabilistic Real-Time Guarantees in Industrial URLLC [0.0] マルチセル・マルチチャネルネットワークにおける干渉調整の改善を目的としたCNNに基づく動的優先度予測機構を提案する。
3つのネットワーク構成で最大113%,94%,49%のSINR増加を示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 21:40:19 GMT)
Automated Construction of a Knowledge Graph of Nuclear Fusion Energy for Effective Elicitation and Retrieval of Information [0.0] 核融合エネルギーの知識グラフ構築に本手法を適用した。
これらの課題に対処するために、事前訓練された大規模言語モデルがどのように使用できるかを示す。
我々は,大規模言語モデルとマルチプロンプトアプローチを組み合わせた知識グラフ検索拡張生成システムを開発した。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 10:16:59 GMT)
Assessing Consistency and Reproducibility in the Outputs of Large Language Models: Evidence Across Diverse Finance and Accounting Tasks [0.0] 本研究は,財務・会計研究における大規模言語モデル(LLM)出力の整合性と精度の総合評価を初めて行った。
3つのOpenAIモデルを使用して、さまざまな財務資料やデータから340万以上のアウトプットを生成します。
LLMは、人間の専門家が意見が一致しない場合でも、専門家のアノテータを著しく上回っている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 02:40:54 GMT)
Approximating Hamiltonian for Hartree-Fock solutions for nonrelativistic atoms [0.0] 我々は、非相対論的原子とイオンの結合エネルギー、電離電位、電子密度分布、核における電子密度、原子散乱係数を計算する。
結果の精度はHartree-Fock法を用いて得られたものと同等である。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:52:41 GMT)
Anonymous Authentication using Attribute-based Encryption [0.0] Attribute-Based Encryption (ABE)は、プライバシ保護データ保護のための有望なアプローチとして登場した。
本稿では,Abeをベースとした匿名認証機構を提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:24:28 GMT)
Analytical Prediction of the Superradiant Emission Peak and Timing in Fully Excited Quantum Emitter Ensembles [0.0] 我々は,初期完全励起量子エミッタアンサンブルのピーク放出速度と時間を評価するための,コンパクトで解析的な式を提案する。
これらの公式は、実対称$N×N$行列の固有値の分散にのみ依存する。
本研究では, 自由空間, 固体, 導波路貯水池など, 様々な環境におけるこれらの結果の汎用性を実証する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:09:21 GMT)
An Open-Source Software Toolkit & Benchmark Suite for the Evaluation and Adaptation of Multimodal Action Models [0.0] MultiNetは、ビジョン、言語、アクションドメインにわたるモデルを厳格に評価し、適応するために設計された、新しい完全にオープンソースなベンチマークである。
視覚言語モデル(VLM)と視覚言語アクションモデル(VLA)を評価するための標準化された評価プロトコルを確立する。
画像キャプション,視覚的質問応答,コモンセンス推論,ロボット制御,デジタルゲームプレイ,模擬ロコモーション/操作,その他多くのタスクからなる複合データセットを提供する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 03:30:48 GMT)
AlgoSelect: Universal Algorithm Selection via the Comb Operator [0.0] 本稿では,データから最適なアルゴリズム選択を学習するためのフレームワークであるAlgoSelectを紹介する。
アルゴリズムのペアについては、Comb Operatorのインスタンスである単純なシグモイドゲートセレクタがこれを促進している。
このフレームワークは普遍的であり(任意のアルゴリズムセレクタを近似できる)、学習性において情報理論的に最適であることを示す。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 23:38:53 GMT)
Addition is almost all you need: Compressing neural networks with double binary factorization [0.0] 二重二元因子化(DBF)は、密度重み行列を2つの二元行列の積に分解する新しい方法である。
DBFは2値表現の効率性を保ちつつ、最先端の手法と競合する圧縮率を達成する。
重量あたりの2ビットでは、DBFはQuIP#やQTIPのような最高の量子化手法と競合する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:42:33 GMT)
Adaptive Composition of Machine Learning as a Service (MLaaS) for IoT Environments [0.0] IoT(Internet of Things)環境の動的な性質は、マシンラーニング・アズ・ア・サービス(ML)構成の有効性に疑問を投げかけるものだ。
本稿では,シームレスで効率的でスケーラブルなML合成を実現するための適応型ML合成フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 11:24:33 GMT)
Active InSAR monitoring of building damage in Gaza during the Israel-Hamas War [0.0] 2023年10月7日から始まったガザ・ストリップの空爆は、21世紀の最も激しい爆撃作戦の1つである。
本研究は,2023-イスラエル・ハマス戦争初年度における週毎の損傷傾向を追跡するために,合成開口レーダ(SAR)データを用いた。
国連のデータによると、損傷ラベルの92.5%が、無視できる1.2%の偽陽性率で検出されている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 17:12:22 GMT)
Accelerated State Expansion of a Nanoparticle in a Dark Inverted Potential [0.0] 125nmのシリカナノ粒子の質量中心の熱状態は、260 mu$sで43.4nmの位置不確実性に拡張する。
この研究は、前例のない質量と長さのスケールで、マクロ的な量子重ね合わせを準備するための重要な進歩を示している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 14:15:47 GMT)
AST-Enhanced or AST-Overloaded? The Surprising Impact of Hybrid Graph Representations on Code Clone Detection [0.0] コードクローンはソフトウェアのメンテナンスコストを大幅に増加させ、脆弱性リスクを高める。
ASTは、その正確な構文構造表現により、ディープラーニングベースのコードクローン検出を支配している。
近年の研究では、ASTベースの表現をセマンティックグラフで豊かにすることでこの問題に対処している。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 12:35:17 GMT)
AIRTBench: Measuring Autonomous AI Red Teaming Capabilities in Language Models [0.0] AIRTBenchは、AI/MLのセキュリティ脆弱性を自律的に発見し、悪用する言語モデルの能力を評価するための、AIレッドチームベンチマークである。
このベンチマークは、Dreadnodeプラットフォーム上のCrucibleチャレンジ環境から70の現実的なブラックボックスキャプチャー・ザ・フラッグ(CTF)チャレンジで構成されている。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:19:06 GMT)
AI-Facilitated Analysis of Abstracts and Conclusions: Flagging Unsubstantiated Claims and Ambiguous Pronouns [0.0] 我々は,人間のような階層的推論を引き出すために設計された概念証明プロンプトを提示し,評価する。
アカデミック・サマリーにおける2つの非自明な分析課題(要約と結論)をターゲットにしたプロンプト
我々は,異なる状況下で2つのモデル(Gemini Pro 2.5 Pro と ChatGPT Plus o3)について,系統的,マルチラン評価を行った。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 08:24:30 GMT)
ACM Survey Draft on Formalising Software Requirements with Large Language Models [0.0] [7]はアイルランドのADAPT年次会議への2ページの提出である。
[8]は9ページの参考書と要約表を付加した9ページの論文である。
arXiv.org [8] にアップロードされたバージョンは、論文を改善するための特定の提案に対処した後、提案の1つが改善されたものである。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:23:56 GMT)
A Quantum Platform for Multiomics Data [0.0] 量子コンピューティングは、古典的に難解な問題に対処するための新しいパラダイムを提供する。
このギャップを埋めるために設計された、ハイブリッド量子古典機械学習プラットフォームを導入します。
本稿では,分子変数からの表現型状態の量子的分類と,生物学的システムにおける時間的進化の予測を通じて,プラットフォームの有用性を実証する。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 00:33:06 GMT)
A Production Scheduling Framework for Reinforcement Learning Under Real-World Constraints [0.0] 実世界の運用環境は、従来のスケジューリングアプローチの効率を低下させる追加の複雑さを導入します。
強化学習(RL)は、エージェントが適応的なスケジューリング戦略を学習できるようにするため、これらの課題に対処する可能性を秘めている。
本稿では,従来のJSSPの定式化を,主要な実世界の制約を組み込むことで拡張するモジュラーフレームワークを提案する。
JobShopLabは、研究開発と産業アプリケーションの両方のためのオープンソースのツールだ。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:27:49 GMT)
A Hybrid Multi-Agent Prompting Approach for Simplifying Complex Sentences [0.0] 本稿では,高度プロンプトとマルチエージェントアーキテクチャを組み合わせるハイブリッド手法を提案する。
実験結果から,本手法はゲームデザインアプリケーションで書かれた複雑な文の70%を単純化することができた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 15:59:13 GMT)
A Conjecture on a Fundamental Trade-Off between Certainty and Scope in Symbolic and Generative AI [0.0] 論文では、AIシステムにおける証明可能な正しさと広範なデータマッピング能力の基本的なトレードオフを定式化する予想を紹介している。
この暗黙のトレードオフを明確化し、厳密な検証にオープンにすることで、この予想は、エンジニアリングの野望とAIに対する哲学的な期待の両方を大きく変えた。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 16:13:48 GMT)
3D Brain MRI Classification for Alzheimer Diagnosis Using CNN with Data Augmentation [0.0] 3次元畳み込みニューラルネットワークは、T1強調脳スキャンを健康またはアルツハイマーと分類するために開発された。
ネットワークは、3D畳み込み、プーリング、バッチ正規化、密度の高いReLU層、シグモイド出力を含む。
論文参考訳(メタデータ) (Tue, 17 Jun 2025 05:15:08 GMT)