Hunyuan-TurboS: Advancing Large Language Models through Mamba-Transformer Synergy and Adaptive Chain-of-Thought [196.7] Hunyuan-TurboSは、Transformer-Mamba Mixture of Expertsの大型ハイブリッドモデルである。
高いパフォーマンスと効率のバランスを保ち、推論コストを低く抑えている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:36:38 GMT)
Graphs Meet AI Agents: Taxonomy, Progress, and Future Opportunities [117.5] データ構造化は、複雑で非組織的なデータをよく構造化された形式に変換することで、有望な役割を果たす。
この調査では、グラフがAIエージェントにどのように権限を与えるかを、初めて体系的にレビューする。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:29:40 GMT)
MemOS: A Memory OS for AI System [115.3] 大規模言語モデル(LLM)は、人工知能(AGI)にとって不可欠な基盤となっている。
既存のモデルは、主に静的パラメータと短命なコンテキスト状態に依存しており、ユーザの好みを追跡したり、長い期間にわたって知識を更新する能力を制限する。
MemOSはメモリを管理可能なシステムリソースとして扱うメモリオペレーティングシステムである。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 17:21:46 GMT)
GenSim: A General Social Simulation Platform with Large Language Model based Agents [111.0] 我々はtextitGenSim と呼ばれる新しい大規模言語モデル (LLM) ベースのシミュレーションプラットフォームを提案する。
我々のプラットフォームは10万のエージェントをサポートし、現実世界のコンテキストで大規模人口をシミュレートする。
我々の知る限り、GenSimは汎用的で大規模で修正可能な社会シミュレーションプラットフォームに向けた最初の一歩である。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 03:07:07 GMT)
SS-GEN: A Social Story Generation Framework with Large Language Models [87.1] 自閉症スペクトラム障害(ASD)を持つ子供たちは、しばしば社会的状況を誤解し、日々のルーチンに参加するのに苦労する。
社会物語は伝統的にこれらの課題に対処するために厳格な制約の下で心理学の専門家によって作られた。
大規模言語モデル(LLM)を用いたソーシャルストーリージェネレーションフレームワークであるSS-GENを提案する。
この研究は、AIを活用して、大規模に自閉症の子供にとって費用対効果の高いソーシャルストーリーをパーソナライズするための重要なステップである。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 07:45:14 GMT)
Specification-Guided Repair of Arithmetic Errors in Dafny Programs using LLMs [84.3] 本稿では,検証を意識したプログラミング言語であるDafnyに対して,革新的なAPRツールを提案する。
プログラム内の各ステートメントの状態を決定するために、Hoare Logicの使用を含む一連のステップを通じて、障害をローカライズします。
実世界のDafnyプログラムのベンチマークであるDafnyBenchを用いて,我々のアプローチを評価する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:36:12 GMT)
3DTrajMaster: Mastering 3D Trajectory for Multi-Entity Motion in Video Generation [84.0] 制御可能なビデオ生成における従来の方法は、主に物体の動きを操作するために2D制御信号を利用する。
本稿では3次元空間におけるマルチエンタリティダイナミクスを制御する頑健なコントローラである3DTrajMasterを紹介する。
3DTrajMasterは,多心性3D動作を制御するための精度と一般化の両面において,新しい最先端技術を設定する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 03:57:48 GMT)
Generalization or Hallucination? Understanding Out-of-Context Reasoning in Transformers [76.4] 我々は、両方の行動は、アウト・オブ・コンテクスト推論(OCR)として知られる単一のメカニズムに由来すると論じる。
OCRは、関連する概念が因果関係であるかによって、一般化と幻覚の両方を駆動する。
我々の研究は、OCR現象を理解するための理論的基盤を提供し、知識注入から望ましくない行動を分析し緩和するための新しいレンズを提供する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:35:38 GMT)
RefineX: Learning to Refine Pre-training Data at Scale from Expert-Guided Programs [76.3] RefineXは、プログラムによる編集タスクを通じて、トレーニング済みデータの大規模かつ外科的な洗練を行うための新しいフレームワークである。
RefineXのコアとなる強みは、高品質で専門家が指導するエンドツーエンドの精錬結果を最小限の編集ベースの削除プログラムに蒸留することにある。
RefineXを複数のモデルスケールで事前学習し、生データ、フィルタリングデータ、または代替データでトレーニングされたモデルより一貫して優れています。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 02:19:58 GMT)
Learning Video Generation for Robotic Manipulation with Collaborative Trajectory Control [72.0] 本稿では,協調的軌跡定式化を通じてオブジェクト間ダイナミクスをモデル化する新しいフレームワークであるRoboMasterを紹介する。
オブジェクトを分解する従来の方法とは異なり、我々のコアは、相互作用プロセスを3つのサブステージ(相互作用前、相互作用後、相互作用後)に分解することである。
提案手法は既存の手法よりも優れており,ロボット操作のための軌道制御ビデオ生成における最先端性能を確立している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 04:06:12 GMT)
Agentic 3D Scene Generation with Spatially Contextualized VLMs [67.3] 本稿では,複雑な3D環境の生成,理解,編集を可能にする新しいパラダイムを提案する。
我々は,VLMが空間コンテキストから反復的に読み取って更新するエージェント型3Dシーン生成パイプラインを開発した。
その結果,我々のフレームワークは多様かつ困難な入力を処理でき,事前の作業では観測できないような一般化のレベルを達成することができることがわかった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:28:37 GMT)
Implicit Reward as the Bridge: A Unified View of SFT and DPO Connections [65.4] 本稿では,Large Language Model (LLM) 後の学習において,SFT(Supervised Fine-Tuning) と優先学習を統合した理論フレームワークを提案する。
そこで本研究では,学習率の簡易かつ効果的な削減手法を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:16:16 GMT)
Conformal Information Pursuit for Interactively Guiding Large Language Models [64.4] 本稿では,クエリ数の最小化を目的としたシーケンシャルクエリ戦略について検討する。
そのような戦略の1つは情報探索(IP)であり、各反復で情報ゲインを最大化または同等に不確実性を最小化するクエリを選択する。
本稿では,コンフォーマル情報探索法(C-IP)を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 03:55:39 GMT)
SciVid: Cross-Domain Evaluation of Video Models in Scientific Applications [63.9] ビデオファウンデーションモデル(FM)は、汎用ドメインに依存しないアプローチとしてかなりの可能性を秘めている。
SciVidは、医療コンピュータビジョン、動物行動、天気予報の5つのタスクからなるベンチマークである。
簡単なトレーニング可能な読み出しモジュールを用いて6つの主要なViFMをSciVidに適用し、強力なベースラインを確立し、効果的な転送学習の可能性を示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:48:12 GMT)
Less is More: Empowering GUI Agent with Context-Aware Simplification [62.0] 我々は,SimpAgentと呼ばれる,効率的かつ効果的なGUIエージェントを構築するためのコンテキスト認識フレームワークを提案する。
上記のコンポーネントにより、SimpAgentは27%のFLOPを削減し、優れたGUIナビゲーション性能を実現する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 17:37:15 GMT)
KEPLA: A Knowledge-Enhanced Deep Learning Framework for Accurate Protein-Ligand Binding Affinity Prediction [60.2] KEPLAは、遺伝子オントロジーとリガンド特性の事前知識を統合し、予測性能を向上させる新しいディープラーニングフレームワークである。
2つのベンチマークデータセットの実験では、KEPLAは一貫して最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 05:48:34 GMT)
On the Expressiveness and Length Generalization of Selective State-Space Models on Regular Languages [56.2] SSM(Selective State-space Model)はTransformerの代替品である。
正規言語タスクにおける表現性や長さの一般化性能を解析する。
本稿では,Selective Dense State-Space Model (SD-SSM)を紹介する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:39:27 GMT)
DNN-Based Precoding in RIS-Aided mmWave MIMO Systems With Practical Phase Shift [56.0] 本稿では、直接通信路を妨害したミリ波マルチインプット多重出力(MIMO)システムのスループットを最大化する。
リコンフィギュアブルインテリジェントサーフェス(RIS)は、視線(LoS)とマルチパス効果に関連するmmWave特性を考慮して伝送性を高めるために使用される。
ディープニューラルネットワーク(DNN)は、より高速なコードワード選択を容易にするために開発された。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 03:10:52 GMT)
MPX: Mixed Precision Training for JAX [54.6] 混合精度トレーニングは、ニューラルネットワークトレーニングの効率を高めるために必要なツールとして登場した。
本稿では,大規模ニューラルネットワークのトレーニングを簡略化し,高速化するJAX用混合精度トレーニングツールボックスMPXを提案する。
MPXはEquinoxやFraxといった一般的なツールボックスとシームレスに統合され、完全な精度パイプラインを混合精度バージョンに変換することができる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 05:47:04 GMT)
Zero-shot Inexact CAD Model Alignment from a Single Image [53.4] 1つの画像から3Dシーン構造を推測する実践的なアプローチは、データベースから密に一致する3Dモデルを検索し、画像内のオブジェクトと整列させることである。
既存のメソッドは、イメージによる教師付きトレーニングとアノテーションのポーズに依存しており、オブジェクトカテゴリの狭いセットに制限されている。
ポーズアノテーションを必要とせず、未知のカテゴリに一般化する不正確な3次元モデルの弱い教師付き9-DoFアライメント法を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 04:46:59 GMT)
Towards Fair RAG: On the Impact of Fair Ranking in Retrieval-Augmented Generation [53.3] 本論文は,公正度を意識したランキングを組み込んだRAGシステムの最初の体系的評価である。
フェアネスを意識した検索を組み込むことで、ランキング品質と生成品質の両面を維持・強化することが少なくない。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 20:56:35 GMT)
Finetuning CLIP to Reason about Pairwise Differences [52.0] 本稿では,CLIPのような視覚言語モデルの学習手法を提案する。
画像間の差異のテキスト記述が画像埋め込み空間の差に対応するようにCLIPを微調整する。
提案手法は,特定の属性によって画像のランク付け能力を大幅に向上させ,下流画像分類タスクにおけるゼロショット分類性能を向上する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 18:25:46 GMT)
Neural Discrete Token Representation Learning for Extreme Token Reduction in Video Large Language Models [50.2] 最小限の離散トークンを用いてビデオ全体を表現することを目的としたExtreme Short Token Reductionという新しいタスクを紹介した。
Extreme Short Token Reductionタスクでは、私たちのVQTokenはシーケンスをオリジナルの長さのわずか0.07パーセントまで圧縮し、NextQA-MCベンチマークでは0.6%の精度しか達成していません。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 00:31:19 GMT)
Casper: Inferring Diverse Intents for Assistive Teleoperation with Vision Language Models [50.2] 現実の遠隔操作における中心的な課題は、ロボットがユーザー制御入力から幅広い人間の意図を推測することである。
我々は、事前学習された視覚言語モデルに埋め込まれたコモンセンス知識を活用する、支援型遠隔操作システムであるCasperを紹介する。
我々は,Casperがタスク性能を改善し,人間の認知負荷を低減し,直接遠隔操作や補助遠隔操作のベースラインよりもユーザ満足度が高いことを示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 20:27:52 GMT)
A bound on the quantum value of all compiled nonlocal games [49.3] 暗号コンパイラは、任意の非ローカルゲームを単一の計算バウンド証明器で対話的プロトコルに変換する。
我々は、コンパイルされた2人プレイヤの非ローカルゲームに対して量子音響結果を確立する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:24:12 GMT)
VLAI: A RoBERTa-Based Model for Automated Vulnerability Severity Classification [49.2] RoBERTa上に構築されたVLAIは、60万以上の現実世界の脆弱性に微調整されている。
モデルとデータセットはオープンソースで、Vulnerability-Lookupサービスに統合されている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:28:14 GMT)
Tip of the Tongue Query Elicitation for Simulated Evaluation [49.1] Tip-of-the-tongue (TOT) 検索は、ユーザがドキュメントタイトルなどの特定の識別子を思い出すのに苦労する場合に発生する。
現在のアプローチはコミュニティ質問回答(CQA)のウェブサイトに大きく依存しており、労働集約的な評価とドメインバイアスにつながっている。
大規模言語モデル(LLM)と人的参加者を活用するため,TOTクエリを抽出する2つの手法を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 20:45:42 GMT)
EMERGE: A Benchmark for Updating Knowledge Graphs with Emerging Textual Knowledge [48.4] Wikidata KGスナップショットとウィキペディアの文節からなるデータセットを生涯にわたって構築する手法を提案する。
結果として得られたデータセットは、2019年から2025年までのWikidataの10種類のスナップショットを合計125万KGで編集したウィキペディアの376K節で構成されている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:43:21 GMT)
Towards a Playground to Democratize Experimentation and Benchmarking of AI Agents for Network Troubleshooting [48.1] ネットワークトラブルシューティングにおけるAIエージェントの適用に焦点を当てる。
標準化され、再現可能で、オープンなベンチマークプラットフォームの必要性について詳しく説明します。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 07:39:58 GMT)
TI-PREGO: Chain of Thought and In-Context Learning for Online Mistake Detection in PRocedural EGOcentric Videos [48.1] オンラインのオープンセットの手続きミスを効果的に検出する技術はない。
1つのブランチは、入力されたエゴセントリックビデオからステップ認識を連続的に行う。
もう1つは、認識モジュールの出力に基づいて将来のステップを予測します。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:46:30 GMT)
Helping CLIP See Both the Forest and the Trees: A Decomposition and Description Approach [43.4] CLIPのようなビジョンランゲージモデル(VLM)は、対照的な学習を通じて、横断的なアライメントを実現する。
伝統的なプロンプトエンジニアリングは、きめ細かいカテゴリラベルに依存しており、きめ細かい局所的意味論を無視している。
そこで我々は,CLIPが局所化された視覚ディスクリプタを処理できるプラグイン・アンド・プレイソリューションを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 10:24:26 GMT)
Explainable Information Retrieval in the Audit Domain [40.3] Microsoft CopilotやGoogle Geminiといった会話エージェントは、複雑な検索タスクをユーザを支援するが、しばしば誤解を招く、あるいは偽造された参照を生成する。
これは信頼を損なうもので、特に医学や金融などの高額な領域では顕著である。
説明可能な情報検索(XIR)は,検索結果をより透明で解釈可能なものにすることを目的としている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:07:20 GMT)
Playing with Transformer at 30+ FPS via Next-Frame Diffusion [40.0] Next-Frame Diffusion (NFD) は、ブロックワイズ因果的注意を組み込んだ自己回帰拡散変換器である。
視覚的品質とサンプリング効率の両面でNFDが自己回帰ベースラインを上回っていることを示す。
310Mモデルを用いて,A100 GPU上で30フレーム/秒(FPS)以上の自己回帰ビデオ生成を実現する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:56:46 GMT)
SFATTI: Spiking FPGA Accelerator for Temporal Task-driven Inference -- A Case Study on MNIST [39.8] スパイキングニューラルネットワーク(SNN)は、イベント駆動で時間的に疎らな性質のため、有望である。
本稿では,オープンソースのSpikeer+フレームワークを用いて手書き文字認識のための最適化SNNアクセラレータを生成する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:22:13 GMT)
Quantum Algorithm for the Fixed-Radius Neighbor Search [39.6] 本稿では,Grover アルゴリズムの固定点バージョンに基づく固定 RAdius Neighbor Search problem (FRANS) の量子アルゴリズムを提案する。
我々は,FRANSを,粒子数$N$の線形クエリ複雑性で解くための効率的な回路を導出する。
読み出し誤差に対するモデルのレジリエンスを評価し,結果の精度を確認するための誤り訂正フリー戦略を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 10:01:10 GMT)
Interaction Techniques that Encourage Longer Prompts Can Improve Psychological Ownership when Writing with AI [38.7] チャットベースのAIアシスタントの入力インタフェースを即時変更する2つのインタラクション手法を評価する。
プロンプトのプロンプトボタンを押して保持し、短いプロンプトを送信したときにスライダーを上下に連続的に動かします。
その結果,これらのテクニックは即時長が増加し,ベースライン技術よりも心理的オーナーシップが高くなった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:44:24 GMT)
Deep Autoregressive Models as Causal Inference Engines [38.3] 本稿では、複雑な共同ファウンダーやシーケンシャルアクションを扱える自己回帰的因果推論フレームワークを提案する。
提案手法は,基礎となる因果図からトークンの列へとデータを変換するemシーケンシフィケーションを用いてこれを実現している。
我々は,CIに適応したARモデルは,迷路をナビゲートしたり,チェスのエンドゲームを行ったり,あるキーワードが紙の受容率に与える影響を評価するなど,様々な複雑な応用において効率的かつ効果的であることが実証された。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:09:35 GMT)
When There Is No Decoder: Removing Watermarks from Stable Diffusion Models in a No-box Setting [37.9] 本研究では,透かしの埋め込みをテキスト・ツー・イメージ生成と組み合わせたモデル固有透かしの堅牢性について検討する。
我々は、エッジ予測ベースの3つの攻撃戦略、ボックスのぼかし、ノーボックス設定で微調整ベースの攻撃を導入する。
我々の最高の攻撃は、透かし検出精度を約47.92%に低下させる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:22:20 GMT)
MatRL: Provably Generalizable Iterative Algorithm Discovery via Monte-Carlo Tree Search [37.2] MatRLは、行列関数を計算するための反復アルゴリズムを自動的に発見する強化学習フレームワークである。
そこで本研究では,MateRLが文献の様々なベースラインを上回るアルゴリズムを生成することを示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 22:57:33 GMT)
Towards Unified Neurosymbolic Reasoning on Knowledge Graphs [37.2] 知識グラフ推論(KG)は人工知能と知識工学の分野で大きな注目を集めている。
我々は、KG推論のための統合されたニューロシンボリック推論フレームワーク、すなわちTunsrを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:29:45 GMT)
Do You Trust Your Model? Emerging Malware Threats in the Deep Learning Ecosystem [36.3] ニューラルネットワークに自己抽出型自己実行型マルウェアを組み込むテクニックであるMaleficNet 2.0を紹介する。
MaleficNet 2.0インジェクションテクニックはステルス性があり、モデルのパフォーマンスを低下させることなく、除去テクニックに対して堅牢である。
我々は、MaleficNet 2.0を用いた概念実証型自己抽出ニューラルネットワークマルウェアを実装し、広く採用されている機械学習フレームワークに対する攻撃の実用性を実証した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:59:48 GMT)
SecureT2I: No More Unauthorized Manipulation on AI Generated Images from Prompts [30.0] SecureT2Iは拡散ベースの生成モデルにおける不正な編集を防止するために設計されたフレームワークである。
画像は、編集許可に基づく許可セットと禁止セットに分類する。
SecureT2Iは、許諾画像の性能を維持しながら、禁じられた画像の操作品質を効果的に劣化させることを示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:05:55 GMT)
Sign Spotting Disambiguation using Large Language Models [29.8] 本稿では,Large Language Models(LLMs)を統合して,符号スポッティング品質を大幅に向上させる,学習自由フレームワークを提案する。
提案手法は,グローバル・テンポラル・ハンド形状の特徴を抽出し,その特徴を大規模手話辞書と照合する。
この辞書ベースのマッチングは本質的に、モデルの再訓練を必要とせず、より優れた語彙の柔軟性を提供する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:38:09 GMT)
ArticulatedGS: Self-supervised Digital Twin Modeling of Articulated Objects using 3D Gaussian Splatting [29.7] RGBの出現と動きパラメータの推定により,部分レベルでの同時再構成の課題に対処する。
我々は3次元ガウス表現において、外観情報と幾何学情報の両方を同時に再構成する。
我々はArticulatedGSを紹介した。ArticulatedGSは自己監督型で総合的なフレームワークで、パートレベルで形状や外観を自律的にモデル化する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:28:11 GMT)
GRAFT: A Graph-based Flow-aware Agentic Framework for Document-level Machine Translation [29.4] 文書翻訳のためのGRAFT(Graph Augmented Agentic Framework for Document Level Translation)を提案する。
GRAFTは、セグメンテーション、DAGに基づく依存性モデリング、凝集性フレームワークへの談話対応翻訳を統合している。
8つの翻訳方向と6つの多様なドメインにわたる実験により、GRAFTはDocMTシステムよりも大きな性能向上を達成できることが示された。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 05:45:55 GMT)
SAMed-2: Selective Memory Enhanced Medical Segment Anything Model [28.5] SAM-2アーキテクチャ上に構築された医用画像分割のための新しい基礎モデルを提案する。
画像エンコーダにテンポラプタアダプタを導入し、画像相関をキャプチャし、信頼性駆動型メモリ機構により、後続の検索のために高確かさの機能を格納する。
内部ベンチマークと10の外部データセットによる実験は、マルチタスクシナリオにおける最先端のベースラインよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:30:38 GMT)
Performance-Driven QUBO for Recommender Systems on Quantum Annealers [27.9] 我々は,個々の特徴と特徴の組み合わせがモデル性能に与える影響を測定するために,反実解析を用いる。
提案手法は, 量子アニーラーの係数行列を構成するために, 推奨系の最適特徴組合せを選択するために用いられる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 00:35:42 GMT)
OpenRLHF: An Easy-to-use, Scalable and High-performance RLHF Framework [27.3] 私たちは、Ray、vLLM、DeepSpeed、HuggingFace Transformers上に構築された、ユーザフレンドリーでスケーラブルで、簡単に学習できるオープンソースRLHFフレームワークであるOpenRLHFを紹介します。
実験の結果,OpenRLHFはモデルサイズによって1.22倍から1.68倍のスピードアップを達成できることがわかった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:10:22 GMT)
Should We Still Pretrain Encoders with Masked Language Modeling? [27.2] 最近の証拠は、コーサル言語モデリング(CLM)で事前訓練されたデコーダモデルをエンコーダとして効果的に再利用できることを示唆している。
2億1000万から10億のパラメータの合計38モデルをトレーニングし、15,000以上の微調整と評価を実行します。
高いレベルのCLMを用いたトレーニングでは,テキスト表現タスク間で性能が向上する一方で,CLM学習モデルの方がデータ効率が良く,微調整安定性が向上していることがわかった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:12:44 GMT)
Estimating Quantum Execution Requirements for Feature Selection in Recommender Systems Using Extreme Value Theory [24.8] 量子解のユーザビリティを定量的に評価するために,エクストリーム値理論に基づく解を提案する。
提案手法は,広く使用されている2つのベンチマークデータセットにおいて,要求される実行回数を効果的に推定する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 00:09:49 GMT)
The Geometries of Truth Are Orthogonal Across Tasks [24.7] 我々は「真理のゲノム」が本質的にタスク依存であり、タスク間での転送に失敗していることを示す。
より高度なアプローチはこの制限を克服することができないが、これはおそらく、タスクをまたいで調べる際に、解の分類に一般的に使用されるアクティベーションベクトルが明確に分離されたクラスタを形成するためである。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:21:15 GMT)
Exploring Object Status Recognition for Recipe Progress Tracking in Non-Visual Cooking [24.6] 我々は、非視覚的調理におけるレシピの進行追跡を可能にするために、オブジェクトの状態認識を利用する技術パイプラインであるOSCAR(Object Status Context Awareness for Recipes)を提案する。
OSCARはレシピ解析、オブジェクトの状態抽出、調理ステップとの視覚的アライメント、リアルタイムステップトラッキングをサポートするための時系列モデリングを統合している。
その結果、オブジェクトの状態は視覚言語モデル間でのステップ予測精度を一貫して改善し、実環境における性能に影響を及ぼす重要な要因を明らかにした。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:30:50 GMT)
Securing Transformer-based AI Execution via Unified TEE and Crypto-protected Accelerators [24.1] マシンラーニングは信頼できないクラウドインフラストラクチャ上で動作し、データとモデルを潜在的な侵害に晒す。
信頼された実行環境(TEE)内で完全にモデル推論を実行すると、非自明なスローダウンが発生する。
異種TEEおよびアクセラレータシステムにおけるセキュアトランスフォーマー推論を実現するフレームワークであるTwinShieldを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 03:52:53 GMT)
Dual-Alignment Knowledge Retention for Continual Medical Image Segmentation [24.1] 既存の継続学習方法は、タスク間の複雑な依存関係をキャプチャできない。
本稿では,歴史データとネットワーク間の複雑な依存関係の確立と強化により,忘れを緩和する新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:09:30 GMT)
NTU Speechlab LLM-Based Multilingual ASR System for Interspeech MLC-SLM Challenge 2025 [24.1] MLC-SLM(Interspeech 2025 Multilingual Conversational Speech and Language Model)チャレンジ(Task I)のために開発されたNTU音声ラボシステムについて詳述する。
本稿では,多言語自動音声認識システムの包括的分析を行い,モデルアーキテクチャ,データ選択,学習戦略における重要な進歩に注目した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 04:13:19 GMT)
Bi-directional Context-Enhanced Speech Large Language Models for Multilingual Conversational ASR [23.3] 本稿では、多言語連続会話自動音声認識(ASR)を改善するために、言語固有の双方向コンテキストを音声大言語モデル(SLLM)に統合する。
トレーニング中の文字レベルのコンテキストマスキング戦略を提案する。これにより、コンテキストの一部がランダムに除去され、堅牢性が向上し、推論中に発生する可能性のある欠陥のある文字のエミュレートが向上する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 04:11:53 GMT)
Foundation versus Domain-specific Models: Performance Comparison, Fusion, and Explainability in Face Recognition [23.1] 考慮されたすべてのデータセットにおいて、ドメイン固有のモデルはゼロショット基礎モデルよりも優れていた。
ファンデーションモデルとドメイン固有FRモデルとの単純なスコアレベル融合により、低FMRでの精度が向上した。
基礎モデルはFRパイプラインに説明可能性を与えるために使用できる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 12:46:45 GMT)
LACONIC: A 3D Layout Adapter for Controllable Image Creation [23.0] 誘導画像合成のための既存の生成アプローチは、画像やテキスト空間の2D制御に依存している。
本稿では,事前訓練されたテキスト・画像拡散モデルに接続可能な新しい条件付け手法,トレーニング方法,アダプタネットワークを提案する。
本手法は, カメラ制御, 明快な3次元空間におけるジオメトリの条件付け, シーンのコンテキスト全体について初めて記述する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 02:25:36 GMT)
Static Segmentation by Tracking: A Label-Efficient Approach for Fine-Grained Specimen Image Segmentation [22.6] 静的追跡(SST)は、擬似先行画像から注釈付きまたは予測されたマスクを伝搬することにより、ラベルなし画像のためのマスクを生成する。
SSTは1種につき1つのラベル付き画像で高品質な特徴セグメンテーションを実現し、検体画像解析のブレークスルーとなった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 22:40:19 GMT)
Roadmap for Molecular Benchmarks in Nonadiabatic Dynamics [22.2] CECAMのワークショップであるStandardizing Nonadiabatic Dynamics: Towards Common Benchmarksが2024年5月に開催された。
このパースペクティブは、非断熱力学のための分子ベンチマークを定義するワークショップで特定された重要な課題を浮き彫りにする。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:11:50 GMT)
EvoAgentX: An Automated Framework for Evolving Agentic Workflows [22.2] 本稿では,マルチエージェントシステムの生成,実行,進化的最適化を自動化するオープンソースプラットフォームであるEvoAgentXを紹介する。
我々は,HotPotQA,MBPP,MATH上のEvoAgentXをマルチホップ推論,コード生成,数学的問題解決のためにそれぞれ評価し,GAIAを用いて実世界のタスクで評価する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:43:10 GMT)
Rewriting Pre-Training Data Boosts LLM Performance in Math and Code [21.6] Llama 3.3 Community Licenseの下でリリースされた2つのデータセットを導入し、大きな言語モデル(LLM)のパフォーマンスを大幅に向上させる。
SwallowCodeはPythonスニペットを,構文検証,ピリントベースのスタイルフィルタリング,2段階の書き換えプロセスという,新しい4段階のパイプラインを通じて洗練する。
We show that continual pre-training of Llama-3.1-8B with SwallowCode boosts pass@1 by +17.0 on HumanEval and +17.7 on HumanEval+ than Stack-Edu。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:10:53 GMT)
MPG-SAM 2: Adapting SAM 2 with Mask Priors and Global Context for Referring Video Object Segmentation [21.4] ビデオオブジェクトセグメンテーション(RVOS)の参照は、ビデオ内のオブジェクトをテキスト記述に従ってセグメントすることを目的としている。
Segment Anything Model 2 (SAM2)は、様々なビデオセグメンテーションタスクにおいて大きな効果を示している。
本稿では,これらの課題に対処する新しいRVOSフレームワークMPG-SAM 2を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 10:10:49 GMT)
H2HTalk: Evaluating Large Language Models as Emotional Companion [21.0] H2HTalk(Heart-to-Heart Talk)は、人格発達と共感的相互作用の相性を評価するベンチマークである。
H2HTalkは、対話、再コンパイル、そして現実世界のサポート会話を反映する反復計画にまたがる4,650のキュレートされたシナリオを特徴としている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 12:50:43 GMT)
ConceptMix++: Leveling the Playing Field in Text-to-Image Benchmarking via Iterative Prompt Optimization [20.9] ConceptMix++は、ビジュアルジェネレーション機能からプロンプトのフレーズをアンタングルするフレームワークである。
最適化されたプロンプトは構成生成性能を大幅に向上することを示す。
これらの結果から,厳密なベンチマーク手法が真のモデル能力を著しく過小評価している可能性が示唆された。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 03:27:04 GMT)
Robotic Manipulation by Imitating Generated Videos Without Physical Demonstrations [19.3] RIGVidは、AI生成ビデオの模倣により、ロボットが複雑な操作タスクを実行できる。
ビデオ拡散モデルは潜在的なデモビデオを生成し、視覚言語モデルはコマンドに従わない結果を自動的にフィルタリングする。
6Dポーズトラッカーは、ビデオからオブジェクトの軌跡を抽出し、その軌跡をエンボディメント非依存の方法でロボットに再ターゲティングする。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:35:12 GMT)
Anymate: A Dataset and Baselines for Learning 3D Object Rigging [19.0] 本稿では,230Kの3Dアセットの大規模データセットと,専門家によるリギングとスキン情報の組み合わせについて述べる。
本稿では,関節,接続性,およびスキンウェイト予測のための3つの逐次モジュールを用いた学習ベースの自動リギングフレームワークを提案する。
我々のモデルは既存の手法を著しく上回り、自動化リギングとスキンニングにおける将来の手法を比較する基盤を提供する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 02:11:50 GMT)
Artificial intelligence in drug discovery: A comprehensive review with a case study on hyperuricemia, gout arthritis, and hyperuricemic nephropathy [18.8] 本稿では、薬物発見パイプライン全体にわたる人工知能(AI)と機械学習(ML)の最近の進歩を体系的にレビューする。
本来的な複雑さ、コストのエスカレーション、タイムラインの延長、従来の薬物発見手法の失敗率の高さなどにより、AI/MLがプロセス全体を通してどのように効果的に統合できるかを理解することが不可欠である。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:14:56 GMT)
MoDA: Multi-modal Diffusion Architecture for Talking Head Generation [18.7] MoDAは、モーション生成とニューラルレンダリングをブリッジするためのジョイントパラメータ空間を実装し、フローマッチングを活用して拡散学習プロセスを単純化する。
実験結果から,MoDAは映像の多様性,リアリズム,効率性を著しく向上し,実世界のアプリケーションに適したものとなった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 02:25:10 GMT)
VLMs have Tunnel Vision: Evaluating Nonlocal Visual Reasoning in Leading VLMs [18.3] ビジュアル言語モデルは、VQAやチャート理解といった複雑なビジュアルタスクに優れていますが、最近の研究は、単純なテストで苦労していることを示唆しています。
非局所的な視覚的推論のための視覚言語モデルの能力を評価する。
その結果,生の視力の上昇にもかかわらず,現在のモデルでは中心的な視覚的推論能力が欠如していることが判明した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 23:15:52 GMT)
Open-Vocabulary Object Detection in UAV Imagery: A Review and Future Perspectives [17.3] 近年、無人航空機(UAV)技術の進歩により、この分野は新たな高地へと押し上げられている。
従来のUAV空中物体検出方法は、主に事前に定義されたカテゴリーを検出することに焦点を当てている。
クロスモーダルテキストイメージアライメント(例えばCLIP)の出現は、この制限を克服し、オープン語彙オブジェクト検出(OVOD)を可能にした。
本稿では,UAV空域におけるOVODの包括的調査について述べる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 04:56:25 GMT)
Investigating Redundancy in Multimodal Large Language Models with Multiple Vision Encoders [17.1] MLLM(Multimodal Large Language Models)は、様々な視覚情報を取得するために複数の視覚エンコーダを採用する。
エンコーダの追加によるパフォーマンス向上は、しばしば減少し、パフォーマンスの低下につながる可能性があります。
それぞれのエンコーダのユニークな貢献を定量化するために,条件付き利用率(CUR)という指標を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 02:38:59 GMT)
Evaluating the Evaluators: Trust in Adversarial Robustness Tests [17.1] AttackBenchは、新しい最適度基準に基づいて既存の攻撃実装をランク付けする評価ツールである。
このフレームワークは、一貫したテスト条件を実行し、継続的な更新を可能にする。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 10:07:26 GMT)
HOTS3D: Hyper-Spherical Optimal Transport for Semantic Alignment of Text-to-3D Generation [16.3] 最近のCLIP誘導3D生成法は,有望な結果を得たが,入力テキストに適合した忠実な3D形状の生成に苦慮している。
本稿では,テキスト特徴と画像特徴とを球形最適輸送(SOT)で整列させることにより,このギャップを効果的に橋渡しするHOTS3Dを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:24:11 GMT)
CodeAgents: A Token-Efficient Framework for Codified Multi-Agent Reasoning in LLMs [16.2] マルチエージェント推論を符号化し、マルチエージェントシステムにおける構造化されたトークン効率の計画を可能にするプロンプトフレームワークであるCodeAgentsを紹介する。
その結果, 計画性能は一貫した改善がみられ, 基本となる自然言語よりも3~36ポイントの絶対的な向上が見られた。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 02:20:19 GMT)
Universal Checkpointing: A Flexible and Efficient Distributed Checkpointing System for Large-Scale DNN Training with Reconfigurable Parallelis [16.0] Universal Checkpointing (UCP)は、ディープニューラルネットワーク(DNN)トレーニングのための新しいチェックポイントシステムである。
UCPは、チェックポイント構造を並列トレーニング戦略とハードウェア構成から分離することで、既存のシステムの課題を克服する。
本稿では,様々な並列化戦略に対するチェックポイント状態の自動マッピングを可能にするパターンベースの再構成パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:16:30 GMT)
DBA-DFL: Towards Distributed Backdoor Attacks with Network Detection in Decentralized Federated Learning [15.5] 攻撃成功率はネットワークアーキテクチャにおける攻撃者の分布に依存することを実験的に実証した。
本論文は,攻撃者が位置情報を判断できないことを考慮し,攻撃者の位置分布に関わらず高い攻撃成功率を達成することを目的とする。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 03:49:02 GMT)
Hallucinatory Image Tokens: A Training-free EAZY Approach on Detecting and Mitigating Object Hallucinations in LVLMs [15.5] LVLM(Large Vision-Language Models)は、まだオブジェクト幻覚の課題に直面している。
我々の研究は、画像入力源に焦点を移し、特定の画像トークンが幻覚にどのように貢献するかを調べる。
本稿では,幻覚器画像トークンをゼロにすることで,hAllucinationsを自動的に識別し,除去する新しい学習自由化手法EAZYを紹介する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 20:41:54 GMT)
On the rankability of visual embeddings [15.2] 本研究では,視覚埋め込みモデルが線形方向に沿って連続的,順序的特性を捉えているかどうかを考察する。
このような軸に埋め込まれた埋め込みが属性の順序を保存する場合、モデルを定義します。
7つの一般的なエンコーダと9つのデータセットがあり、年齢、群衆数、頭部ポーズ、美学、そして相対性といった属性があるため、多くの埋め込みが本質的にランク付け可能であることが分かりました。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:03:31 GMT)
ODE: Open-Set Evaluation of Hallucinations in Multimodal Large Language Models [15.2] 大規模言語モデル(MLLM)における幻覚を評価するためのオープンセット動的プロトコルを提案する。
ODEは、現実世界のオブジェクト概念、それらの属性、それらの間の分布関係を表現するために、グラフベースの構造を用いる。
生成タスクと識別タスクの両方において幻覚を評価する構造化クエリのさまざまなサンプルを生成する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 17:19:12 GMT)
FastDINOv2: Frequency Based Curriculum Learning Improves Robustness and Training Speed [14.7] DINOv2のような大規模ビジョンファウンデーションモデルは、大規模なアーキテクチャとトレーニングデータセットを活用することで、素晴らしいパフォーマンスを誇っている。
本稿では, コンバージェンスを同時に促進し, 副産物としての一般的な汚職に対する堅牢性を高めるDINOv2の事前学習戦略を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 18:56:04 GMT)
LearnAlign: Reasoning Data Selection for Reinforcement Learning in Large Language Models Based on Improved Gradient Alignment [14.7] 強化学習(Reinforcement Learning, RL)は、LLMの推論能力を高めるための重要な技術となっているが、そのデータ非効率性は依然として大きなボトルネックとなっている。
本稿では、RL後学習のための学習可能および代表的トレーニング推論データを知的に選択するLearnerAlignを提案する。
3つの数学的推論ベンチマークによる実験により,本手法はトレーニングデータ要求を大幅に低減することが示された。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 07:31:49 GMT)
MusGO: A Community-Driven Framework For Assessing Openness in Music-Generative AI [13.1] 我々は,音楽生成AIにおけるオープン性の概念を明確にし,その透明で責任ある開発を促進することを目的としている。
我々は16の最先端な生成モデルを評価し、公開調査やコミュニティのコントリビューションに対して完全にオープンなオープンネスリーダーボードを提供する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:12:19 GMT)
Online Estimation with Rolling Validation: Adaptive Nonparametric Estimation with Streaming Data [13.1] 本稿では,多くの典型的な勾配勾配勾配推定器において最小限の費用がかかる,オンライン版Left-one-outクロスバリデーションである重み付き転がり検証手法を提案する。
我々の分析は単純であり、主にいくつかの一般的な統計的仮定に依存している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 20:45:51 GMT)
Elevator, Escalator, or Neither? Classifying Conveyor State Using Smartphone under Arbitrary Pedestrian Behavior [12.8] 歩行者のコンベア状態を知ることは、屋内ナビゲーションや人流管理など多くの応用に欠かせない。
スマートフォンの慣性ナビゲーションシステム(INS)を用いて,任意の歩行者行動下での分類問題について検討した。
エレベータやエスカレーター,あるいはその両方に携帯電話のINSを使って歩行者を分類する,斬新で軽量なディープラーニング手法であるELESONを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 05:41:31 GMT)
Structure-Aware Compound-Protein Affinity Prediction via Graph Neural Network with Group Lasso Regularization [11.6] 我々は、複合特性予測のための構造活性関係(SAR)モデリングのためのエンドツーエンドで説明可能な機械学習モデルを構築した。
グラフニューラルネットワーク (GNN) を用いて, 原子レベルの特徴情報を取得し, 複合タンパク質親和性を予測する。
また, グループラッソとスパースグループラッソを用いて, 分子サブグラフのプーンとハイライトを行い, 構造特異的モデル説明可能性を高める。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:12:18 GMT)
All-atom inverse protein folding through discrete flow matching [11.5] 本稿では, タンパク質配列を設計するための生成モデルとしてADFLIP(All-atom Discrete FLow matching Inverse Protein folding)を提案する。
本モデルは, 単一構造および多構造逆折り畳みタスクにおける最先端性能を実現し, 全原子タンパク質設計に優れた可能性を示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:57:38 GMT)
ShareCMP: Polarization-Aware RGB-P Semantic Segmentation [11.3] 共有デュアルブランチアーキテクチャ(ShareCMP)を用いたRGB-Pセマンティックセマンティックセマンティックセマンティクスフレームワークを設計する。
ShareCMPは、UPLight (92.45 Small (+0.32)%)、ZJU (92.7 Small (+0.1%)、MCubeS (50.99 Small (+1.51)%)のデータセットでパラメータが少ないmIoUで最高のパフォーマンスを達成する。
われわれのShareCMPは、対応する最先端のRGB-X手法と比較して、他のRGB-Xデータセットの競合や、さらに高いパフォーマンスを実現しています。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:00:14 GMT)
Non-negative matrix factorization algorithms generally improve topic model fits [11.3] 少なくとも非公式に、トピックモデルにおける最大類似度推定が非負の分解(NMF)と密接に関連していることは知られている。
NMF最適化手法の最近の進歩は、トピックモデルに非常によく適合するように活用できることを示す。
トピックモデルに対する期待(EM)アルゴリズムは,NMFの古典的乗法更新と基本的に同じであることを示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:26:14 GMT)
MRC-DETR: An Adaptive Multi-Residual Coupled Transformer for Bare Board PCB Defect Detection [11.2] そこで本研究では,PCB 欠陥検査のための新規かつ効率的な検出フレームワーク MRC-DETR を提案する。
特徴表現能力を高めるため,MRDCB(Multi-Residual Directional Coupled Block)を設計する。
非効率な層間情報融合による計算冗長性を低減するため、適応スクリーニングピラミッドネットワーク(ASPN)を導入する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:42:38 GMT)
Graph Repairs with Large Language Models: An Empirical Study [11.1] 資産グラフは医療、金融、ソーシャルネットワークなどの分野で広く使われている。
従来のグラフ修復手法は、データセットごとに調整する必要があるため、適応性に制限がある。
大規模言語モデル(LLM)の最近の進歩は、グラフの自動修復の新たな機会を提供する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:16:21 GMT)
Query-Based Adaptive Aggregation for Multi-Dataset Joint Training Toward Universal Visual Place Recognition [10.9] クエリベースのアダプティブアグリゲーション(QAA)は、学習したクエリを参照コードブックとして活用する、新たな機能アグリゲーション技術である。
QAAは最先端モデルよりも優れており、データセット固有のモデルに匹敵するピーク性能を維持しつつ、多様なデータセット間でのバランスの取れた一般化を実現している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 22:40:03 GMT)
TRACE: Training and Inference-Time Interpretability Analysis for Language Models [10.8] 本稿では、トランスモデルのトレーニングおよび推論時間解釈可能性解析のためのモジュラーツールキットTRACEを紹介する。
言語的および表現的信号の軽量なイントレーニング分析を可能にする。例えば、探索、内在的次元性、ヘッセン曲率、出力診断などである。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:42:51 GMT)
Learning to Translate Ambiguous Terminology by Preference Optimization on Post-Edits [10.6] 企業的な文脈では、有効だが誤った用語の人間のポストエジットの多くの例が存在する。
我々のアプローチは、好みの知識としてポストエジットという用語を用いて、好みの最適化に基づいている。
我々は,英語とドイツ語の編集後データの結果を報告するとともに,教師付き微調整と選好最適化の最適組み合わせが,COMETスコアにおいて有意な損失を伴わない強いNMTベースラインに対して,項精度の統計的に有意な改善をもたらすことを見出した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:49:14 GMT)
Participatory Evolution of Artificial Life Systems via Semantic Feedback [10.5] 人工生命系の進化を自然言語で導くためのセマンティックフィードバックフレームワークを提案する。
このシステムでは、視覚的な結果と基礎となる行動ルールの両方をユーザが変更できる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 23:51:50 GMT)
The Role of Humour in Software Engineering -- A Literature Review and Preliminary Taxonomy [10.4] 本稿では,ソフトウェアエンジニアリングチームにおけるユーモアの特徴化と利用を探る文献レビューに基づく分類法を紹介する。
提案した枠組みはユーモアを異なる理論、スタイル、モデル、スケールに分類し、SE専門家と研究者にユーモアを理解するための構造化されたアプローチを提供する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 12:23:53 GMT)
CMD-HAR: Cross-Modal Disentanglement for Wearable Human Activity Recognition [9.9] HAR(Human Activity Recognition)は、多くの人間中心のインテリジェントなアプリケーションのための基礎技術である。
本研究の目的は、マルチモーダルデータミキシング、アクティビティディスク、センサに基づく人間活動における複雑なモデル展開などの課題に対処することである。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:36:03 GMT)
Characterizing the Distinguishability of Product Distributions through Multicalibration [9.7] 我々は、$X_0otimes k$と$X_1otimes k$を効率的に区別するために必要となるサンプル数$k$の新しい厳密な特徴を証明した。
私たちのフレームワークは、Halevi と Rabin (TCC 2008) と Geier (TCC 2022) の結果を導出するのに使用できます。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 21:14:57 GMT)
ReviewInstruct: A Review-Driven Multi-Turn Conversations Generation Method for Large Language Models [9.7] マルチターン対話データを生成する既存の方法は、命令の多様性と品質の両方を保証するために苦労している。
Ask-Respond-Review」プロセスを通じて複数回会話を合成する新しいフレームワークであるReview-Instructを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 12:51:51 GMT)
GENPLUGIN: A Plug-and-Play Framework for Long-Tail Generative Recommendation with Exposure Bias Mitigation [9.6] ジェネレーティブレコメンデーション(GenRec)は、LCMの統合、埋め込みコストの削減、候補ごとのスコアリングの排除を提供する。
GenRecは、ジェネレーション露光バイアスとロングテールアイテムの一般化に悩まされている。
本稿では,デュアルエンコーダと共有デコーダアーキテクチャを備えたプラグアンドプレイフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:25:51 GMT)
Probabilistic Embeddings for Frozen Vision-Language Models: Uncertainty Quantification with Gaussian Process Latent Variable Models [9.5] 視覚言語モデル(VLM)は、画像とテキストを共有潜在空間にマッピングすることで、共同表現を学習する。
GroVEはGaussian Process Latent Variable Model (GPLVM)に基づいて構築され、画像とテキストの入力を統一表現にマッピングする共有低次元潜在空間を学習する。
GroVEは、クロスモーダル検索、視覚的質問応答、アクティブラーニングなど、複数の下流タスクにわたる最先端の不確実性キャリブレーションを実現する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 18:13:55 GMT)
Causal Evidence for the Primordiality of Colors in Trans-Neptunian Objects [9.4] TNO(Trans-Neptunian Objects)の色の起源は、重要な未解決問題である。
最近の調査では、TNOの偏心性と傾きと色との相関が明らかになっている。
このことは、これらの色がTNO形成の条件やその後の衝突進化を反映しているかという長年にわたる議論を再燃させた。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 18:17:18 GMT)
Lion Cub: Minimizing Communication Overhead in Distributed Lion [9.4] 通信オーバーヘッドは、分散ディープラーニング、特に遅いイーサネット相互接続において重要な課題である。
分散学習に不可欠な3つの要因をLionを用いて分析し、コミュニケーション手法の最適化、効果的な量子化手法の同定、モーメント同期の必要性を評価する。
これはLionと比較して、エンドツーエンドのトレーニングで最大5倍のスピードアップを可能にします。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 04:44:35 GMT)
AgentPS: Agentic Process Supervision for Content Moderation with Multimodal LLMs [9.4] 本稿では,Agentic Process Supervisionを大規模言語モデルに統合するフレームワークであるAgentPSを紹介する。
我々は、AgentPSが、公開ベンチマークとプロプライエタリデータセットのベースラインMLLMよりも大幅に改善されていることを示す。
これらの結果は、大規模産業アプリケーションにおける複雑なマルチモーダル分類のためのスケーラブルで効果的なソリューションとして、AgentPSを確立している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 00:16:22 GMT)
On the Verification of Control Flow Attestation Evidence [9.3] 我々は、Vrfが受信した証拠を効果的に分析できれば、実行時の検証と監査は本当に役に立つと論じる。
Vrfによる実行時のエビデンスを実際に活用するためのケーススタディとして,SABRE: A Security Analysis and Binary repair Engineを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:28:11 GMT)
TACOS: Open Tagging and Comparative Scoring for Instruction Fine-Tuning Data Selection [9.0] We present TACOS, a innovative method that integrates Open Tagging and Comparison Scoring for IFT data selection。
データの多様性を捉えるために、LLMを活用して、オープンドメインタグを人間のクエリに割り当てる。
本稿では,クラスタ内のサンプルの相対的品質評価を可能にする比較評価手法を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:46:07 GMT)
REINFORCE++: An Efficient RLHF Algorithm with Robustness to Both Prompt and Reward Models [8.6] REINFORCE++は、バッチの正規化報酬をベースラインとして使用しながら、批判モデルを削除する新しいアプローチである。
プロンプトセットのトランケーションを必要とせずに、様々な報酬モデルに対して堅牢なパフォーマンスを示す。
RLHFとREINFORCEベースの手法に比べて長いチェーン・オブ・シント設定において優れた一般化を実現している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 03:51:01 GMT)
Evaluating Disassembly Errors With Only Binaries [8.4] この作業は、バイナリのみを使用して分解エラーを評価する最初のものである。
TraceBinは、ターゲットバイナリのセキュリティタスクを自動で分解するユースケースをターゲットにしている。
また、デアセンブラに依存する(クローズドソース)バイナリのセキュリティタスクの自動化にも役立ちます。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:52:35 GMT)
Forecast Evaluation and the Relationship of Regret and Calibration [8.3] 本稿では,現在使用されている評価指標を2次元階層で推定する一般構造を提案する。
このフレームワークは、これらの評価指標を、予測と観測の単一インスタンスベースの大規模な比較に組み込む。
特に、この枠組みは、その評価能力に理論的に等価であるが、得られたスコアの実用的不適合性を示す、後悔型および校正型評価指標の関係に光を当てている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:35:32 GMT)
Mirror in the Model: Ad Banner Image Generation via Reflective Multi-LLM and Multi-modal Agents [8.1] 本稿では,自動広告バナー生成のためのエージェント改良フレームワークであるMirror In-the-Model(MIMO)を紹介する。
MIMOは階層型マルチモーダルエージェントシステム(MIMO-Core)と協調ループ(MIMO-Loop)を組み合わせることで、複数のスタイルの方向を探索する。
MIMOは、現実世界のバナーデザインシナリオにおいて、既存の拡散とLLMベースのベースラインを著しく上回る。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:19:16 GMT)
ACE: Automated Technical Debt Remediation with Validated Large Language Model Refactorings [8.0] 本稿では、検証された出力を使用してコード改善を自動化するツールであるAugmented Code Engineering (ACE)を紹介する。
ユーザからの初期のフィードバックは、AIが利用できることが、そうでなければほとんど起こらないコードレベルの技術的負債を軽減するのに役立つことを示唆している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 12:39:27 GMT)
Ranking-based Fusion Algorithms for Extreme Multi-label Text Classification (XMTC) [7.8] XMTC(Extreme Multi-label Text Classification)においてラベルの長期分布は重要な課題である
ラベルは、頻繁で高被覆のtextbfhead ラベルと頻繁で低被覆の textbftail ラベルに大別できる。
Sparse retrieverは高次元のbag-of-words表現に基づいて関連度スコアを計算し、Sparse retrieverは密接なテキストとラベルを共有埋め込み空間内に埋め込むANNアルゴリズムを利用する。
ランクベース融合アルゴリズムは、スパースレトリバーの正確なマッチング能力とセマンティックリッチネスを組み合わせ、これらの差を利用した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 18:17:52 GMT)
PhotIQA: A photoacoustic image data set with image quality ratings [7.8] PhotIQAは、5つの品質特性の2人の専門家によって評価された1134個の再構成光音響画像からなるデータセットである。
ベースライン実験の結果,HaarPSI$_med$は品質評価と相関してSSIMを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:06:54 GMT)
Exploring Robustness of LLMs to Paraphrasing Based on Sociodemographic Factors [7.3] 我々は、SocialIQAデータセットを拡張して、社会デマログラフィー要因に基づく多様なパラフレーズセットを作成する。
人口統計に基づく言い回しが言語モデルの性能に大きな影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:35:01 GMT)
From Video to EEG: Adapting Joint Embedding Predictive Architecture to Uncover Visual Concepts in Brain Signal Analysis [7.2] 脳波信号は、高時間分解能と低空間分解能で脳活動を捉え、神経学的診断、認知モニタリング、脳-コンピュータインターフェースなどの応用をサポートする。
本稿では,脳波分類のためのビデオ共同埋め込み予測アーキテクチャ(VJEPA)の新たな適応であるEEG-VJEPAを提案する。
脳波をビデオライクなシーケンスとして扱うことで、EEG-VJEPAは共同埋め込みと適応マスキングを用いて意味的に意味のある表現を学ぶ。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:01:34 GMT)
VGMShield: Mitigating Misuse of Video Generative Models [7.2] VGMShieldは、フェイクビデオ生成のライフサイクルを通じて、単純だが効果的な軽減策のセットである。
まずは偽のビデオ検出から始め、生成されたビデオにユニークさがあるかどうかを理解します。
そこで本研究では,偽動画を生成したモデルにマッピングする,偽ビデオソース追跡問題について検討する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 04:21:23 GMT)
LLM4Hint: Leveraging Large Language Models for Hint Recommendation in Offline Query Optimization [7.0] 本稿では,学習句の一般化を促進するために,Large Language Model(LLM)をどのように組み込むかを検討する。
我々は,中規模のバックボーンLLMを利用してクエリ最適化ヒントを推奨する textbfLLM4Hint を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:32:17 GMT)
Orientation Scores should be a Piece of Cake [6.9] 位置空間 $mathbbR2$ から位置空間 $mathbbR2times S1$ へ持ち上げ、位置方向の不確実性を最小化する。
これらの最小不確実性状態がケーキウェーブレットによってよく近似されていることを示す。
我々は,PDE-)G-CNNのネットワークの複雑さを低減し,モデルの性能にわずかに影響を及ぼすことなく,解釈可能性を向上させることを実験的に示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:49:15 GMT)
CHIME: Conditional Hallucination and Integrated Multi-scale Enhancement for Time Series Diffusion Model [6.9] CHIMEは、時系列拡散モデルのための条件付き幻覚と統合されたマルチスケール拡張フレームワークである。
時系列の分解された特徴をキャプチャし、生成されたサンプルと元のサンプルの間のドメイン内分布のアライメントを達成する。
さらに,時間的特徴の移動を可能にする条件付き認知プロセスにおいて,特徴幻覚モジュールを導入する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 07:41:33 GMT)
Neuroverse3D: Developing In-Context Learning Universal Model for Neuroimaging in 3D [6.8] 我々は,複数のニューロイメージングタスクを3Dで実行可能なICLモデルであるNeuroverse3Dを紹介する。
Neuroverse3Dは、適応並列シーケンスコンテキスト処理によって3D入力に関連する大きなメモリ消費を克服する。
本研究は、19のニューロイメージングデータセットから43,674個のマルチモーダルスキャンを取り入れ、ホールドアウトテストセットを用いて14のタスクでニューロバース3Dを評価する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 10:04:18 GMT)
Code Simulation as a Proxy for High-order Tasks in Large Language Models [6.7] 我々は、Large Language Models (LLM) の能力を評価するために、自然主義的および合成的推論タスクのペアを収集する。
我々は、プログラミングにおける共通構造を、自然主義的推論タスクの構成要素の1つとして活用する。
我々の貢献は、手作りの人間注記問題に対するスケーラブルな補完として、LLMの推論能力を総合的にテストすることの上に成り立っている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:53:00 GMT)
MolVision: Molecular Property Prediction with Vision Language Models [6.7] MolVisionは、分子構造を画像とテキスト記述の両方に統合し、特性予測を強化する新しいアプローチである。
分類、回帰、記述タスクをカバーする10の多様なデータセットにまたがるベンチマークを構築した。
その結果,視覚情報だけでは不十分であるが,マルチモーダル融合は分子特性の一般化を著しく促進することが明らかとなった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 04:15:31 GMT)
ArithmAttack: Evaluating Robustness of LLMs to Noisy Context in Math Problem Solving [6.7] 大規模言語モデル(LLM)は数学の問題解決タスクにおいて素晴らしい能力を示している。
そこで我々はArismAttackを提案し,LLMが句読点の形で余分な雑音を含む雑音的プロンプトに遭遇したときのロバストさを検証した。
LLama3,Mistral,Mathstral,DeepSeekの8つのLLMの頑健さをGSM8KとMultiArithmデータセットで評価した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:22:05 GMT)
Reinforcement Learning-based Feature Generation Algorithm for Scientific Data [6.4] 特徴生成(FG)は、高次特徴の組み合わせを構築し、冗長な特徴を取り除くことにより、元のデータの予測可能性を高めることを目的としている。
本稿では、マルチエージェント特徴生成(MAFG)フレームワークを提案する。具体的には、マルチエージェントは、協調的に数学的変換方程式を構築し、高情報コンテンツを禁止した特徴組合せを合成し、識別し、強化学習機構を利用して戦略を進化させる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:52:09 GMT)
Lessons from a Chimp: AI "Scheming" and the Quest for Ape Language [6.4] 我々は、現在のAIシステムが「計画」能力を開発しているかどうかを問う最近の研究を検討する。
我々は、この分野での現在の研究実践を1970年代に採用されたものと比較し、非ヒト霊長類が自然言語を習得できるかどうかを検証した。
私たちは、AIスキーマの研究がこれらの落とし穴を避けるために積極的に取り組むことを推奨します。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:16:11 GMT)
Temporal Window Smoothing of Exogenous Variables for Improved Time Series Prediction [6.3] グローバル統計に基づくデータ内に持続する冗長性を抑えるために,内因性入力を白くする手法を提案する。
提案手法は、4つのベンチマークデータセットで最先端のパフォーマンスを達成し、11のベースラインモデルより一貫して優れています。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 17:27:55 GMT)
Boundary Exploration of Next Best View Policy in 3D Robotic Scanning [6.2] NBV問題(Next Best View)は、3Dロボットスキャンにおける重要な課題である。
そこで本研究では,次の視点でスキャンした点雲の境界を内在的に検討したNBVポリシーを提案する。
本稿では,参照モデルに基づいて候補ビューを反復的に提案するモデルベースアプローチを提案する。
さらに,NBVをスキャンデータから直接予測する境界探索NBVネットワーク(BENBV-Net)を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 18:54:54 GMT)
Disentangling the Roles of Representation and Selection in Data Pruning [6.1] 我々はデータプルーニングをデータ表現と選択アルゴリズムの2つの重要なコンポーネントに分解する。
我々の理論的および実証的な結果は、表現の重要な役割を浮き彫りにする。
異なる選択アルゴリズムは異なる設定で優れており、どのアルゴリズムも他のアルゴリズムより一貫して優れているわけではない。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:25:04 GMT)
Making Sense of Korean Sentences: A Comprehensive Evaluation of LLMs through KoSEnd Dataset [6.1] この研究は、複雑な文終末で知られる韓国語に焦点を当てた。
韓国文終末データセットを導入し, 3000の文を含む15の文終末形式の自然性について注釈を付けた。
韓国語文終末の理解度を評価するため,11のLLMを評価し,パラメータ数と予測整合性に基づいて分析した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:21:24 GMT)
MT2-CSD: A New Dataset and Multi-Semantic Knowledge Fusion Method for Conversational Stance Detection [5.9] MT2-CSDは,多目的・多ターン会話姿勢検出のための包括的データセットである。
これらの課題に対処するため,Large Language Model enhanced Conversational Attention Network (LLM-CRAN)を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:30:32 GMT)
Leveraging Out-of-Distribution Unlabeled Images: Semi-Supervised Semantic Segmentation with an Open-Vocabulary Model [5.5] 現実のシナリオでは、豊富なラベルのないイメージは、しばしばオンラインソースや大規模なデータセットから利用可能である。
これらのイメージを半教師付き学習におけるラベルなしのデータとして使用すると、偽ラベルが不正確になる可能性がある。
我々は,未ラベルOOD画像の有効活用を目的とした,オープン語彙セグメンテーションモデル(SemiOVS)を用いた半教師付きセグメンテーションフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 05:12:37 GMT)
LTLCrit: A Temporal Logic-based LLM Critic for Safe and Efficient Embodied Agents [5.3] 大規模言語モデル(LLM)は、静的環境におけるタスクの推論と一般的な意思決定において有望であることを示す。
本稿では,LLM アクターを軌跡レベルの LLM 評論家である byCrit に案内するモジュラーアクター批判アーキテクチャを提案する。
我々のセットアップは、言語モデルの推論強度と形式論理の保証を組み合わせる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 04:53:53 GMT)
KinyaColBERT: A Lexically Grounded Retrieval Model for Low-Resource Retrieval-Augmented Generation [5.2] そこで本稿では,クエリとドキュメント間の単語レベルの遅延インタラクションと,2層トランスフォーマ符号化を組み合わせた形態素ベースのトークン化という,2つの重要な概念を統合した検索モデルKinyaColBERTを提案する。
評価の結果,KinyaColBERTはKinyarwandaの農業用ベンチマークにおいて,強いベースラインと商業用テキスト埋め込みAPIよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 01:18:08 GMT)
Identifying Large-Scale Linear Parameter Varying Systems with Dynamic Mode Decomposition Methods [5.2] 本研究は,大規模LPVシステムの局所的およびグローバルな同定手法を開発する。
この方法は動的モード分解(DMD)にインスパイアされたDMD-LPVと呼ばれる。
実験により,提案手法は,全次元の同定を行うことなく,与えられた大規模システムの低次モデルを容易に同定できることが示唆された。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 19:20:50 GMT)
Parsing Through Boundaries in Chinese Word Segmentation [5.1] 英語とは異なり、中国語は明示的な単語境界を欠いているため、区分けは必要であり、本質的に曖昧である。
本研究は, 単語分割と構文解析の複雑な関係に注目し, 中国語の係り受け構造をどう形成するかを明確にする。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 20:54:45 GMT)
Improving Social Determinants of Health Documentation in French EHRs Using Large Language Models [5.1] 健康の社会的決定因子(SDoH)は、健康結果、病気の進行、治療の順守、健康格差に影響を及ぼす。
本研究では,フランスの臨床ノートから13のSDoHカテゴリーを抽出するための大規模言語モデル(LLM)に基づくアプローチを提案する。
Flan-T5-Largeをフランスのナント大学病院で臨床ノートから注釈付き社会史のセクションで訓練した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:41:33 GMT)
MORDA: A Synthetic Dataset to Facilitate Adaptation of Object Detectors to Unseen Real-target Domain While Preserving Performance on Real-source Domain [4.9] 我々は、新しい駆動データセットであるMORDA: Mixture of Real- Domain Characteristics for synthetic-data-assisted Domain Adaptationを構築できる合成融合ドメインを作成する。
実験の結果,MORDAはAI-Hubデータセットの平均精度(mAP)を大幅に向上する一方,nuScenesはわずかに向上することがわかった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 04:40:14 GMT)
CLOT: Closed Loop Optimal Transport for Unsupervised Action Segmentation [4.9] 教師なしのアクションセグメンテーションは、最近、最適なトランスポート(OT)ベースの方法であるASOTによってその限界を推し進めた。
マルチレベル循環型特徴学習機構を導入した新しいOTベースのフレームワークであるClosed Loop Optimal Transport (CLOT)を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 12:42:34 GMT)
A Survey of Large Language Models on Generative Graph Analytics: Query, Learning, and Applications [4.8] 大規模言語モデル(LLM)は、様々な自然言語処理タスクを処理する強力な一般化能力を示した。
LLMは、グラフタスクの一般化の課題に対処する上で、優れたアドバンテージを享受する。
LLMをグラフ解析タスクに適応させることは困難である。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:22:10 GMT)
MAGIC: Mask-Guided Diffusion Inpainting with Multi-Level Perturbations and Context-Aware Alignment for Few-Shot Anomaly Generation [4.8] 産業品質管理設定において, 少ない異常データを増大させるための実用的なソリューションとして, ショット異常生成が出現している。
マルチレベル摂動とコンテキスト認識アライメントを備えたMAGIC-Mask-Guided Inpaintingを提案する。
MAGICは、下流の異常なタスクにおいて、過去の最先端のタスクより優れています。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:51:57 GMT)
Beyond Accuracy: Metrics that Uncover What Makes a `Good' Visual Descriptor [4.8] 我々は,(1)表現能力,(2)VLM事前学習データとの関係の2つの重要な側面に沿って,記述子の品質を体系的に解析する。
表現アライメントと言語理解のアイデアに触発されて,2つのアライメントベースのメトリクスであるGlobal AlignmentとCLIP similarityを導入する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 12:50:04 GMT)
Hybrid-View Attention for csPCa Classification in TRUS [4.7] 3次元TRUSにおけるcsPCa分類のための新しいハイブリットビューアテンションネットワークを提案する。
提案手法は,CNN-transformerハイブリッドアーキテクチャを統合し,畳み込み層がきめ細かい局所的特徴を抽出する。
前立腺生検を施行した590名の被験者を対象とした社内データセットを用いて実験を行った。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:27:48 GMT)
CosmoBench: A Multiscale, Multiview, Multitask Cosmology Benchmark for Geometric Deep Learning [4.3] 宇宙論的シミュレーションは、点雲と有向木という形で、豊富なデータを提供する。
重要なゴールは、宇宙の性質と構成に光を当てたこのデータから洞察を抽出することである。
最先端の宇宙学シミュレーションから算出したベンチマークデータセットであるCosmoBenchを紹介する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:46:25 GMT)
Causal-SAM-LLM: Large Language Models as Causal Reasoners for Robust Medical Segmentation [4.3] Causal-SAM-LLMはLarge Language Models(LLM)を因果推論の役割に高める新しいフレームワークである。
第一に、Linguistic Adrial Disentanglement (LAD)は視覚言語モデルを用いて、融合した画像スタイルのリッチでテキストによる記述を生成する。
第2に、Test-Time Causal Intervention (TCI)は、LLMが臨床者の自然言語コマンドを解釈し、セグメント化デコーダの特徴をリアルタイムで変調する対話的なメカニズムを提供する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:52:16 GMT)
Deep Retrieval at CheckThat! 2025: Identifying Scientific Papers from Implicit Social Media Mentions via Hybrid Retrieval and Re-Ranking [4.3] CLEF CheckThat! 2025コンペティションのサブタスク4bに対するDeep Retrievalチームの方法論と結果を示す。
本稿では,語彙的精度,意味的一般化,文脈的再ランク付けを併用したハイブリッド検索パイプラインを提案する。
提案手法は, 開発セットで76.46%, 隠されたテストセットで66.43%の平均相反ランクを5 (MRR@5) 達成する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:06:20 GMT)
Index Theorem and Vortex Kinetics in Bose-Einstein Condensates on a Haldane Sphere with a Magnetic Monopole [4.0] ボース・アインシュタイン凝縮体(BEC)の磁極を持つハルダン球面における幾何ゲージ相互作用の動的効果について検討した。
運動論的理論を発展させることで、スケール不変渦力学と創発的双対性を予測する。
この研究はまず、空間幾何学とゲージ場の間の動的結合機構を示し、超流動系の深い洞察を与える。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:15:50 GMT)
Four Shades of Life Sciences: A Dataset for Disinformation Detection in the Life Sciences [3.7] 偽情報の識別者は、しばしば注意を引き付け、感情を喚起する。
我々は,不定形テキストを識別するためのプロキシとして,言語的特徴と修辞的特徴を探求する。
14のライフサイエンストピックに関する2,603のテキストのコーパスをラベル付けした小説『Four Shades of Life Sciences』を紹介します。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:28:09 GMT)
Computationally efficient non-Intrusive pre-impact fall detection system [3.7] 既存の影響前の転倒検知システムは精度が高いが、被検体に侵入するか、転倒検出に大量の計算資源を必要とする。
本研究では,非侵襲的かつ計算効率のよいプリインパクト・フォール検出システムを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:41:10 GMT)
On Jailbreaking Quantized Language Models Through Fault Injection Attacks [3.6] 言語モデル(LM)の安全性の整合性は重要な問題であるが、それらの整合性は直接パラメータ操作による攻撃によって解決される。
本稿では, 異なる量子化方式におけるジェイルブレイクアライメント LM に対する攻撃の有効性について検討する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 00:48:48 GMT)
A Tactical Behaviour Recognition Framework Based on Causal Multimodal Reasoning: A Study on Covert Audio-Video Analysis Combining GAN Structure Enhancement and Phonetic Accent Modelling [3.6] TACTIC-GRAPHSは、スペクトルグラフ理論とマルチモーダルグラフニューラル推論を組み合わせて、戦術ビデオにおけるセマンティック理解と脅威検出を行うシステムである。
このフレームワークは、スペクトル埋め込み、時間的因果エッジモデリング、異種モーダル間の識別経路推論を含む。
TACTIC-AVSとTACTIC-Voiceデータセットの実験は、時間的アライメントにおける89.3%の精度と、完全な脅威連鎖の85%以上の認識を示し、ノード遅延はプラス150ミリ秒以内である。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:43:43 GMT)
Can LLMs Play Ô Ăn Quan Game? A Study of Multi-Step Planning and Decision Making [3.5] 我々は,ベトナムのボードゲーム「O uAn Quan」のレンズを通して,大規模言語モデル(LLM)を計画し,意思決定する能力について検討する。
具体的には,攻撃的から防御的まで多岐にわたるエージェントペルソナを開発し,O uAn Quan ゲームを様々な戦略で LLM 性能を評価するテストベッドとして利用する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:50:40 GMT)
Chat2SPaT: A Large Language Model Based Tool for Automating Traffic Signal Control Plan Management [3.5] 本研究では,Chat2SPaTを提案する。Chat2SPaTは,ユーザの信号制御計画に関する半構造化および曖昧な記述を,正確な信号位相とタイミングに変換する手法である。
プロンプトにより、Chat2SPaTはユーザーの計画記述を理解するための大きな言語モデル(LLM)の機能を利用する。
pythonスクリプトは、サイクル内のフェーズを特定し、トラフィック信号制御のニュアンスに対処し、最終的に完全なトラフィック信号制御計画を組み立てるように設計されている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:10:24 GMT)
Articulatory clarity and variability before and after surgery for tongue cancer [3.3] 舌癌に対する外科治療は, 明瞭度と変動性に悪影響を及ぼす可能性がある。
母音調音指数(VAI)による調音明瞭度と母音フォルマント分散(VFD)による可変性について検討した。
本研究は,舌癌術後の明瞭度が典型的範囲に留まっていたものの,調音の多様性は増大したことを示唆している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:46:40 GMT)
PRUNE: A Patching Based Repair Framework for Certifiable Unlearning of Neural Networks [3.3] トレーニングされたニューラルネットワークモデルからトレーニングデータの特定の部分(すなわち未学習)を取り除くことが望ましい。
既存のアンラーニング手法では、残ったデータで代替モデルを訓練する。
我々は、要求されたデータのターゲットの「偽造」を除去するために、元のニューラルネットワークに慎重に構築された「パッチ」を付与して、新しいアンラーニングアプローチを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:33:43 GMT)
Large Language Models for Combinatorial Optimization: A Systematic Review [3.3] 本稿では,組合せ最適化におけるLarge Language Modelsの適用について検討する。
われわれはScopusとGoogle Scholarを通じて2000以上の出版物を調べて文献検索を行っている。
我々はこれらの研究を意味圏とトピックに分類し、その分野を包括的に概観する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:08:10 GMT)
A Real-Time Digital Twin for Type 1 Diabetes using Simulation-Based Inference [3.3] 信頼性の高いデジタル双生児を実現するためには、生理モデルの正確なパラメータ推定が不可欠である。
マルコフ・チェイン・モンテカルロに基づく伝統的な手法は高次元パラメータ空間と競合する。
本稿では,ニューラルネットワークによる後部推定に基づくシミュレーションに基づく推論手法を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:09:31 GMT)
Read Quietly, Think Aloud: Decoupling Comprehension and Reasoning in LLMs [3.2] 大規模言語モデル(LLM)は、テキストの理解と高品質な応答の生成に顕著な熟練性を示した。
本稿では,LLMを内部処理に類似の能力で実装する方法について検討する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:23:06 GMT)
Skewed Score: A statistical framework to assess autograders [3.1] LLM-as-a-judge"あるいはオートグラファーは、人間の評価に代わるスケーラブルな代替手段を提供する。
彼らは様々な信頼性を示し、体系的なバイアスを示すかもしれない。
そこで本稿では,研究者が自動分解器を同時に評価できる統計フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 18:45:10 GMT)
Entanglement features from heavy particle scattering [3.0] 中間重粒子によって伝播される情報の量は非弾性散乱の特徴を示す。
我々は,2~3ドル,2~4ドル散乱のコンクリートモデルについて検討し,領域法則を超えた絡み合い構造に光を当てた。
実際には、これらの特徴は最終粒子の位相空間分布を適切に極小化することで探究することができる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:07:53 GMT)
Third-party compliance reviews for frontier AI safety frameworks [3.0] 本稿では、サードパーティのコンプライアンスレビューという潜在的な解決策を探求する。
独立した外部当事者は、フロンティアAI会社がその安全フレームワークに準拠しているかどうかを評価する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:51:47 GMT)
Energy Management for Renewable-Colocated Artificial Intelligence Data Centers [3.0] 我々は、再生可能エネルギーを共配置した人工知能(AI)データセンターのためのエネルギー管理システム(EMS)を開発した。
利益を最大化するフレームワークの下で、EMSはAIワークロードスケジューリング、現場での再生可能利用、電力市場への参加を共同で最適化する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 18:25:42 GMT)
Plugging Attention into Power Grids: Towards Transparent Forecasting [2.9] グラフニューラルネットワーク(GNN)は、エネルギーネットワークに固有の空間依存を組み込むための原則的なフレームワークを提供する。
本研究は,フランスとイギリスにおける2つの実世界の電力消費データセット上で,GNNアーキテクチャの広範な集合を評価した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:18:18 GMT)
Generating Novelty in Open-World Multi-Agent Strategic Board Games [2.9] GNOMEは、新規性に直面した場合に、マルチエージェントAIシステムの有効性をテストするために設計された実験用プラットフォームである。
Web GUIを使用して、GNOMEは先日のNeurIPS 2020で、モノポリー(Monopoly)というゲームを使用して、AIの堅牢性に関するオープンな議論を促進するデモが行われた。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 20:44:33 GMT)
Prompt Engineering Guidelines for Using Large Language Models in Requirements Engineering [2.9] 大規模言語モデル(LLM)のようなジェネレーティブAIモデルは、要求工学(RE)を含むさまざまな活動において、その実用性を実証している。
LLM出力の品質と精度の確保は重要であり、迅速なエンジニアリングがモデル応答のガイドとなる。
既存の文献は、特にREアクティビティのために、迅速なエンジニアリングをどのように活用できるか、限定的なガイダンスを提供している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:13:50 GMT)
High-resolution efficient image generation from WiFi CSI using a pretrained latent diffusion model [2.8] WiFi CSI測定から物理環境の画像を生成する新しい方法であるLatentCSIを提案する。
本手法は軽量ニューラルネットワークを用いてCSI振幅を直接LCMの潜在空間にマッピングする。
次に、復号化前のテキストベースガイダンスを用いて、LCMの復号化拡散モデルを潜在表現に適用する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 12:27:28 GMT)
PhenoBench: A Comprehensive Benchmark for Cell Phenotyping [2.5] フェノベンチ(PhenoBench)は、ヘマトキシリンとエオシン染色組織像の細胞性形質転換のベンチマークである。
PhenoCellは、多重イメージングを用いて識別された14の粒状細胞を特徴とする新しいデータセットである。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 12:37:57 GMT)
STRUCTSENSE: A Task-Agnostic Agentic Framework for Structured Information Extraction with Human-In-The-Loop Evaluation and Benchmarking [2.4] StructSenseは、大規模言語モデル上に構築された構造化情報抽出のためのモジュラーでタスクに依存しないオープンソースのフレームワークである。
複雑なドメインコンテンツを効果的にエンコードできるドメイン固有のシンボリック知識によって導かれる。
我々は、StructSenseがドメイン感度の限界とクロスタスクの一般化性の欠如を克服できることを実証した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:51:07 GMT)
WETBench: A Benchmark for Detecting Task-Specific Machine-Generated Text on Wikipedia [2.3] 既存の研究は主にジェネリックジェネレーションタスクにおけるMGT検出器を評価する。
MGT検出のための多言語,マルチジェネレータ,タスク固有ベンチマークを提案する。
設定によって、トレーニングベースの検出器は平均精度78%、ゼロショット検出器は平均58%に達する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:13:10 GMT)
Behaviour Space Analysis of LLM-driven Meta-heuristic Discovery [2.1] メタヒューリスティックな最適化アルゴリズムを大規模言語モデル駆動型アルゴリズム探索法で自動生成する。
我々は、BBOBベンチマークスイートから10個の関数に対して評価したブラックボックス最適化を反復的に進化させる。
探索,搾取,収束,停滞といった行動指標を各実行毎に記録し,これらを視覚的投影とネットワークベースの表現を通じて分析する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:19:39 GMT)
Evaluating the Impact of Multiple DER Aggregators on Wholesale Energy Markets: A Hybrid Mean Field Approach [2.1] 地域エネルギー市場への分散エネルギー資源の統合は、グリッドの柔軟性を大幅に向上させ、市場効率を向上し、より持続可能なエネルギーの未来に貢献することができる。
我々は、複数のDERアグリゲータを特徴とする市場モデルについて検討し、それぞれがDERリソースのポートフォリオを制御し、DER資産所有者に代わって市場への入札を行う。
本稿では,MFGフレームワーク内で各エージェントが最適な戦略を学習し,市場状況や不確実性に適応する能力を向上させるための強化学習(RL)手法を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 01:17:58 GMT)
ChestGPT: Integrating Large Language Models and Vision Transformers for Disease Detection and Localization in Chest X-Rays [2.0] 視覚変換器(ViT)は、視覚データをLLMが効率的に処理できるフォーマットに変換するのに有効であることが証明されている。
本稿では,EVA ViTとLlama 2 LLMを統合するフレームワークであるChestGPTについて紹介する。
提案手法は, F1スコア0.76のVinDr-CXRデータセットを用いて, 強いグローバルな疾患分類性能を達成した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 17:58:52 GMT)
REAL: Benchmarking Abilities of Large Language Models for Housing Transactions and Services [1.7] 本稿では,不動産業者の大規模言語モデル評価(REAL)について,住宅取引・サービス分野におけるLCMの能力を評価するための評価スイートとして紹介する。
REALは、メモリ、理解、推論、幻覚の4つのトピックにわたる5,316の高品質な評価項目で構成されている。
実験結果から, LLMには不動産分野に適用すべき改善の余地がまだ残っていることが示唆された。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:05:44 GMT)
Testing the spin-bath view of self-attention: A Hamiltonian analysis of GPT-2 Transformer [1.7] 対話型2体スピンシステムとして,Large Language Models (LLMs) の注意機構について検討した。
我々は、プロダクショングレードのGPT-2モデルから、すべての注目ヘッドに対して対応する実効ハミルトニアンを導出する。
本研究は, 生産段階モデルにおけるスピンバス類似性の最初の強い実証的証拠である。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:40:45 GMT)
ReservoirChat: Interactive Documentation Enhanced with LLM and Knowledge Graph for ReservoirPy [1.7] 本稿では,ReservoirPyライブラリを用いたコード開発を支援するために,LLM(Large Language Models)の機能向上を目的としたツールを紹介する。
検索型生成(RAG)と知識グラフを通じて外部知識を組み込むことにより,幻覚の低減と,生成した応答の事実的正確性の向上を目指す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:48:15 GMT)
Circuit-QED simulator of the Bose-Hubbard model for quantum spin dynamics [1.7] ボソニック系の複雑なスピンダイナミクスを再現する回路QEDボース・ハバードシミュレータを実験により提案する。
我々は、スピンダイナミクスとマイクロ波光子の動作の一致を回路QEDに基づくアナログシミュレーターで求める。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:53:09 GMT)
JanusDNA: A Powerful Bi-directional Hybrid DNA Foundation Model [1.6] 大規模言語モデル(LLM)は自然言語処理に革命をもたらし、他のシーケンシャルなデータタイプにもますます適用されてきている。
我々は、新しい事前学習パラダイムに基づいて構築された、最初の双方向DNA基盤モデルであるJanusDNAを紹介する。
JanusDNAは、1つの80GB GPU上で1つのヌクレオチド分解能で100万塩基対を処理する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:40:34 GMT)
Invariance of quantum scattering rate coefficients to anisotropy of atom-molecule interactions [1.5] 強い相互作用を持つ分子系の量子散乱計算は、計算的に要求される。
全(弾性+非弾性)原子に対する熱速度係数 - 分子散乱は、基礎となるポテンシャルエネルギー表面の相互作用異方性に不感である。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 20:42:35 GMT)
Exploring the Effect of Context-Awareness and Popularity Calibration on Popularity Bias in POI Recommendations [1.4] POI(Point-of-interest)レコメンデーターシステムは、ユーザが関連する場所を見つけるのに役立つが、その効果は人気バイアスによってしばしば損なわれる。
本稿では、文脈認識モデルの有効性を評価し、人気バイアスを緩和するための戦略として人気手法を校正する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:56:11 GMT)
Exploring Privacy and Security as Drivers for Environmental Sustainability in Cloud-Based Office Solutions [1.4] 本稿では,クラウドベースのオフィスソリューションにおけるプライバシ,セキュリティ,環境サステナビリティの交わりについて検討する。
プライバシを重視したサービスは、一般的にデータ収集や広告を通じて得られたものよりもエネルギー効率が高いと仮定する。
当社のフレームワークは,プライバシポリシを反映して選択された3つの主流メールサービスに適用する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:50:03 GMT)
Offline RLAIF: Piloting VLM Feedback for RL via SFO [1.4] VLM(Vision-Language Models)は、アクション条件のトレーニングデータがないため、制御タスクを解く能力に制限がある。
AIフィードバックからの強化学習における重要な課題は、VLM由来の信号を学習プロセスに統合する方法を決定することだ。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:44:27 GMT)
Robust estimation of heterogeneous treatment effects in randomized trials leveraging external data [1.3] 本研究では, 条件付き平均治療効果(CATE)を推定するモデル非依存学習者QR-learnerを提案する。
外部データが試行に一致していない場合でも、一貫性を維持しながらCATE予測平均2乗誤差を低減することができる。
提案手法を実世界のデータセットに適用し,不均一な影響を検出するためのCATE推定と統計的パワーの両方の改善を実証する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:01:05 GMT)
Deepfakes in Criminal Investigations: Interdisciplinary Research Directions for CMC Research [1.3] ディープフェイクは、犯罪捜査のような高度な文脈における新しい応用を可能にする可能性がある。
我々は、コンピュータ科学、哲学、法則に基づく学際的アプローチを採用し、刑事捜査でディープフェイクを責任を持って使うために何が必要かを調べる。
本分析は,CMCコミュニティにおける重要な研究の方向性を概説し,この発展途上領域における学際的連携の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 10:22:50 GMT)
A First Runtime Analysis of the PAES-25: An Enhanced Variant of the Pareto Archived Evolution Strategy [1.2] 本稿では,PAES-25の数学的実行時解析について述べる。
PAES-25は,m$-LOTZに1ビットの変異を伴って,厳密なランタイム境界を導出する。
標準的なビット突然変異を持つPAES-25は、予想される$O(n4)$イテレーションで、双方向のLOTZベンチマークを最適化する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:38:29 GMT)
PHEONA: An Evaluation Framework for Large Language Model-based Approaches to Computational Phenotyping [1.1] 計算表現型は生物医学研究に不可欠であるが、しばしばかなりの時間と資源を必要とする。
本研究では,観察保健データに対するPHEノッティピングの評価フレームワークを開発し,文脈に特有な考察を概説した。
テストしたサンプル概念から高い分類精度を達成し,計算表現法の改良を目的としたLCM法の可能性を示した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:34:14 GMT)
Transforming Calabi-Yau Constructions: Generating New Calabi-Yau Manifolds with Transformers [1.1] 我々は、さまざまなポリトープサイズにわたるFRSTを生成するために、ディープラーニングモデルを使用します。
我々のモデルは、効率的で偏りのないサンプリングを示し、自分たちの出力を再トレーニングすることで自己改善することができる。
これらの結果は、コミュニティ主導のプラットフォームであるAICYの基礎を築いた。機械学習モデルと継続的に拡張するFRSTデータベースを組み合わせて、Calabi-Yauランドスケープを探索しカタログ化する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 17:42:04 GMT)
Heterogeneous participation and allocation skews: when is choice "worth it"? [1.0] この選択と情報集約は価値がありますか?
比較的有利な人は、経験的に、時間コストを支払い、そのメカニズムによって課される管理負担をナビゲートすることができる。
私は、実践と研究のレッスンで終わり、コミュニティに異質性を減らすこと、そして両方の世界の北の星の最高のものを満たすような設計と展開のメカニズムに挑戦します。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:15:36 GMT)
Agent-Based Detection and Resolution of Incompleteness and Ambiguity in Interactions with Large Language Models [1.0] 本稿では, LLMに基づく質問応答システムにエージェント・ベース・アーキテクチャを付加的な推論能力で活用することを検討した。
我々は、不完全性と曖昧性の欠陥を検知し解決する専門家として働くエージェントを、異なるLLMに装備する。
エージェントベースのアプローチを提案することは、LLMのパワーを利用してより堅牢なQAシステムを開発するための有用なメカニズムである。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 17:28:33 GMT)
ViMRHP: A Vietnamese Benchmark Dataset for Multimodal Review Helpfulness Prediction via Human-AI Collaborative Annotation [1.0] ベトナムにおけるMRHPタスクのための大規模ベンチマークデータセットViMRHP(Vietnamese Multimodal Review Helpfulness Prediction)を紹介する。
このデータセットは、46Kレビュー付き2K製品を含む4つのドメインをカバーする。
AIアシストでは、AIを活用して、ViMRHPデータセットを構築するアノテータを支援します。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:18:20 GMT)
A Multistakeholder Approach to Value-Driven Co-Design of Recommender System Evaluation Metrics in Digital Archives [0.8] 本稿では、多様な利害関係者の値をRecommender Systems(RecSys)の評価基準に翻訳する最初のマルチステークホルダーアプローチを提案する。
我々のコントリビューションはデジタルアーカイブを超えて広くRecSysコミュニティに広がり、即時消費ではなく持続的なエンゲージメントを通じて価値が生まれるドメインに対して、転送可能な評価アプローチを提供しています。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:09:08 GMT)
Shaping Cold Atom Clouds with a Vortex Beam [0.7] 中心に偏光特異点を持つ渦レーザービームを用いて冷間原子雲を形成する方法を提案する。
ミクロンスケールの線状およびシート状原子密度分布を作成するための2つの異なるスキームを実験的に実証した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:49:01 GMT)
An Elementary Characterization of Bargmann Invariants [0.7] 我々は、$n$-次不変量を取ることができる複素値の集合 $B_n$ の完全な特徴づけを与える。
どちらの範囲も複素単位 $n$-gon の$n$-次乗に等しいことを示し、従って凸である。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 17:05:20 GMT)
Efficient Quantum Access Model for Sparse Structured Matrices using Linear Combination of Things [0.6] 構成されたスパース行列に対する線形結合型ユニタリ分解法(LCU)を提案する。
伝統的に、パウリ基底はLCU分解に使用されるが、最悪の場合、行列サイズに対して2次にスケールするLCU項の数が生じる。
また,完全フォールトトレラントアルゴリズムの多種多様な利用が可能なシグマベースで分解された任意の演算子のブロック符号化手法を開発した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 17:05:07 GMT)
Order Acquisition Under Competitive Pressure: A Rapidly Adaptive Reinforcement Learning Approach for Ride-Hailing Subsidy Strategies [0.6] 本稿では,高速競争適応(FCA)とRLA(Reinforced Lagrangian Adjustment)を提案し,競争相手の価格調整に迅速に適応する。
提案手法は,動的価格変動に対する迅速な対応を可能にする高速競争適応(FCA)と,予算制約の遵守を保証する強化ラグランジアン調整(RLA)の2つの重要な手法を統合する。
実験結果から,提案手法は多様な市場条件におけるベースラインアプローチを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 03:27:45 GMT)
Differentially private scale testing via rank transformations and percentile modifications [0.5] 我々は、階級変換パーセンタイル修飾シーゲル-テューキー検定(RPST検定)と呼ばれる、微分的にプライベートな2サンプル検定のクラスを開発する。
これらのRPSTテストは、いくつかの一般的なランクテストの最近の微分プライベート拡張と、非プライベートなランクテストに対する古い修正の両方にインスパイアされている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 17:25:50 GMT)
Leveraging Large Language Models for Tacit Knowledge Discovery in Organizational Contexts [0.4] 本稿では,従業員とのインタラクションを通じて,データセット記述を反復的に再構築するエージェントベースのフレームワークを提案する。
本研究の結果から, 自己批判的フィードバックスコアは外部文献評論家のスコアと強く相関し, 94.9%の完全知識リコールが達成された。
これらの知見は、エージェントが組織的な複雑さをナビゲートし、そうでなければアクセスできないような断片化された知識をキャプチャする能力を強調している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 21:09:32 GMT)
Beyond classical and contemporary models: a transformative ai framework for student dropout prediction in distance learning using rag, prompt engineering, and cross-modal fusion [0.4] 本稿では、ドロップアウト予測を再定義する変換型AIフレームワークを提案する。
フレームワークの精度は89%、F1スコアは0.88で、従来のモデルよりも7%、偽陰性は21%向上している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 21:41:43 GMT)
Benchmarking Vector, Graph and Hybrid Retrieval Augmented Generation (RAG) Pipelines for Open Radio Access Networks (ORAN) [0.4] 大きな言語モデル(LLM)は、RAN Intelligent Controller(RIC)プラットフォームから仕様とAPI定義を活用することで、xAppsとrAppsを生成するために特殊化することができる。
Retrieval-Augmented Generation (RAG)は、コンテキスト内学習を通じて実践的な代替手段を提供する。
本研究では,ORAN仕様を用いたベクトルRAG,GraphRAG,Hybrid GraphRAGの比較評価を行った。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:31:30 GMT)
Classical Algorithms for Constant Approximation of the Ground State Energy of Local Hamiltonians [0.4] 我々は、任意の$k$局所ハミルトニアンが$n$ qubitsで作用する基底状態エネルギーの近似を計算する古典的アルゴリズムを構築する。
定数近似が古典的に$mathrmpolyleft (1/chi,nright)$ time と $mathrmpoly(n)$ space で計算可能であることを示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 05:36:25 GMT)
CCi-YOLOv8n: Enhanced Fire Detection with CARAFE and Context-Guided Modules [0.4] 都市部や森林地帯での火災は深刻な脅威となる。
小型火災や煙の検知を目標とした改良型YOLOv8モデルであるCCi-YOLOv8nを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 01:52:25 GMT)
Security of quantum key distribution with source and detector imperfections through phase-error estimation [0.4] 量子鍵分布(QKD)は、量子力学に基づく情報理論のセキュリティを約束するが、実際の実装はデバイス不完全性によるセキュリティ上の脆弱性に直面している。
近年の進歩は、位相誤差推定に基づくセキュリティ証明フレームワークにおけるソースと検出の不完全性に別々に対処している。
BB84型プロトコルの既存の手法を組み合わせることで、ソースおよび検出器の欠陥を同時に考慮した統一されたセキュリティ証明を構築することができることを示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 12:58:12 GMT)
Recurrent Expansion: A Pathway Toward the Next Generation of Deep Learning [0.3] Recurrent Expansion (RE)は、従来の機械学習(ML)とディープラーニング(DL)を超えて進化する新しい学習パラダイムである。
REは、同一のディープアーキテクチャによるデータの複数のマッピングを強調し、内部表現(フィーチャーマップ)を損失などの観測されたパフォーマンス信号とともに分析する。
スケーラブルで適応的な変種であるSc-HMVREは、現実世界のデプロイメントに選択的なメカニズムとスケールの多様性を導入している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 19:26:48 GMT)
Is It Time To Treat Prompts As Code? A Multi-Use Case Study For Prompt Optimization Using DSPy [0.3] 本研究では,大規模言語モデル(LLM)の性能向上のために,Declaryの体系的即時最適化について検討する。
影響はタスクによって異なり、迅速な最適化研究において特定のユースケースを評価することの重要性を強調している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:46:56 GMT)
A Solvable Semi-infinite Fock-state-lattice SSH Model: the Stable Topological Zero Mode and the Non-Hermitian Bound Effect [0.2] 半無限FSLに基づくSu-Schrieffer-Heeger(SSH)モデルのHermitian領域および非Hermitian領域における位相特性について検討した。
従来のSSHモデルよりも安定な位相零モードが見出され、固有領域壁の境界状態から導かれる。
我々の研究は、有望なFSLシミュレータに基づく無限異方性トポロジモデルにおいて、ユニークなトポロジ特性を探求する第一歩を踏み出す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:37:57 GMT)
Deep Transformer Network for Monocular Pose Estimation of Shipborne Unmanned Aerial Vehicle [0.2] トランスフォーマーニューラルネットワークモデルは、2Dキーポイントを検出し、各部分の6Dポーズを推定するように訓練される。
この手法は、船舶による無人無人無人航空機の着陸と航行に応用できる可能性がある。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 23:23:59 GMT)
Segmentation of separated Lumens in 3D CTA images of Aortic Dissection [0.2] 大動脈解離は大動脈の内膜壁の断裂を特徴とする。
本稿では, 涙を埋める表面を用いて, ゴム間の接続を切断し, 分離する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:30:26 GMT)
From Street Form to Spatial Justice: Explaining Urban Exercise Inequality via a Triadic SHAP-Informed Framework [0.1] 都市通りは日常的な身体活動を促進し、健康的平等を促進するために欠かせない公共空間である。
本研究では,街路レベルの運動不足を認知的(計画と構造)、知覚的(視覚と感覚)、生活的(実践と経験)な都市空間の次元を通じて定量化する概念的,方法論的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:28:30 GMT)
Evaluating AI capabilities in detecting conspiracy theories on YouTube [0.1] 本研究では,オープンウェイトなLarge Language Models (LLMs) のテキストのみとマルチモーダルの両方を用いて,YouTube上での陰謀論のビデオの識別を行う。
我々は、ゼロショット設定で様々なLLMを評価し、その性能を微調整されたRoBERTaベースラインと比較した。
その結果,テキストベースのLLMは高いリコール精度,低い精度を実現し,偽陽性が増大した。
マルチモーダルモデルはテキストのみのモデルよりも遅れており、ビジュアルデータ統合のメリットが限定されている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:02:59 GMT)
A little bit of self-correction [0.1] 有限スピン鎖の低温量子熱力学における安定部分空間の出現について検討する。
準安定部分空間の出現は基底状態の絡み合い構造に直接関係しない
この研究は、非可換な多くの体モデルの熱力学に非自明な量子的挙動が存在することを強調している。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:24:38 GMT)
Exploring LLM Capabilities in Extracting DCAT-Compatible Metadata for Data Cataloging [0.1] データカタログは、メタデータを使用してユーザクエリに応答することで、データの探索をサポートし、加速することができる。
本研究では,LLMがテキストベースのメタデータのメンテナンスを自動化し,高品質なDCAT互換メタデータを生成できるかどうかを検討する。
以上の結果から,LLMは人為的コンテンツ,特に高度な意味理解を必要とするタスクに匹敵するメタデータを生成できることが示唆された。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 10:49:37 GMT)
Short Blocklength Error Correction Codes for Continuous-Variable Quantum Key Distribution [0.1] 本稿では,連続可変量子鍵分布系における2段階誤り訂正方式を提案する。
短いブロック長(1000ビット)の誤り訂正符号を使用することで、140kmの距離で秘密鍵レートを最大7.3倍に向上させることができる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 12:28:29 GMT)
MLASDO: a software tool to detect and explain clinical and omics inconsistencies applied to the Parkinson's Progression Markers Initiative cohort [0.1] MLASDOは、オミクスデータに基づいて異常サンプルを特定し、特徴付けし、自動的に記述する新しい方法とソフトウェアツールである。
パーキンソン病317例(HC)とパーキンソン病465例(PD)の転写学的データを用いたMLASDOの紹介を行った。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:31:12 GMT)
Efficient Knowledge Graph Construction and Retrieval from Unstructured Text for Large-Scale RAG Systems [0.1] 企業環境にグラフベースの検索拡張生成(GraphRAG)をデプロイするためのスケーラブルで費用効率のよいフレームワークを提案する。
これらの結果は、現実の大規模エンタープライズアプリケーションにGraphRAGシステムをデプロイできる可能性を検証する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 00:05:55 GMT)
Scientific Machine Learning of Chaotic Systems Discovers Governing Equations for Neural Populations [0.1] カオス力学系から解釈可能な数学的表現を抽出するPEM-UDE法を提案する。
神経集団に適用した場合、生物学的制約を尊重する新しい支配方程式を導出する。
これらの方程式は、ニューラルネットワークにおける接続密度と発振周波数と同期の両方の創発的関係を予測する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:57:58 GMT)
Coil Geometry Learning for Short-Range Magnetic Actuation [0.0] 燃料のないドッキングは、宇宙での組み立て、宇宙ステーションの補給、サンプル帰還ミッション、大規模な衛星群の形成維持のための重要な運用技術である。
スラスタを含む従来の推進システムの使用は、短い距離で悪影響を及ぼす可能性がある。
電磁石が生成する磁場相互作用制御は、これらの推進の弱点を克服することができる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 20:54:30 GMT)
Efficient and Effective Query Context-Aware Learning-to-Rank Model for Sequential Recommendation [0.0] 本稿では、因果的言語モデリング手法を用いて訓練されたトランスフォーマーにクエリコンテキストを組み込むための様々な戦略を解析する。
そこで本稿では,アイテムシーケンスをアテンションメカニズム内でクエリコンテキストと効果的に融合する手法を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 19:50:01 GMT)
Towards Machine Theory of Mind with Large Language Model-Augmented Inverse Planning [0.0] 本稿では,大言語モデル(LLM)を仮説と可能性関数を生成するメカニズムとして用いたマシン理論(ToM)のハイブリッド手法を提案する。
また、オープンエンドタスクにおいて精神状態を予測するモデルの可能性を示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:01:27 GMT)
Zero Memory Overhead Approach for Protecting Vision Transformer Parameters [0.0] ViTパラメータをメモリオーバーヘッドゼロのビットフリップフォールトから保護するために、フォールトトレランス技術が導入された。
故障が検出された場合、影響を受けるパラメータは、ViTモデルのほとんどのパラメータがゼロに近いため、ゼロアウトによってマスクされる。
このアプローチは、ViTモデル全体の信頼性を高め、最大3桁のビットフリップに対するパラメータの堅牢性を向上させる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 21:32:24 GMT)
Theory of Three-Photon Transport Through a Weakly Coupled Atomic Ensemble [0.0] 非平衡量子系における多光子相互作用を理解することは、量子光学において顕著な課題である。
本研究では1次元導波路に弱結合した原子アンサンブルにおける3光子相互作用を探索するための解析的および図式的枠組みを開発する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:36:26 GMT)
The outcomes of measurements in the de Broglie-Bohm theory-II [0.0] 第1部では、ド・ブロイ=ボーム理論の量子計測過程について論じている。
第2部はより一般的な議論を伴う短い補題である。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:09:10 GMT)
The Magnus expansion for non-Hermitian Hamiltonians [0.0] 任意の有限次元エルミート・ハミルトニアンに対して、標準マグナス展開は明らかなユニタリ表現を保証する。
本研究では、すべての有界有限次元ハミルトニアンに対するユニタリ性の性質を維持する一般化展開を導出する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:56:13 GMT)
The Free Will Equation: Quantum Field Analogies for AGI [0.0] 本稿では,AGIエージェントに適応性,制御性を付与する枠組みとして,自由意志方程式(Free Will Equation)を提案する。
中心となる考え方は、AIエージェントの認知状態を潜在的な行動や思考の重ね合わせとして扱うことである。
非定常的マルチアームバンディット環境での実験は、このフレームワークを用いたエージェントがベースライン法よりも高い報酬とポリシーの多様性を達成することを示した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 10:25:52 GMT)
SymmetryLens: Unsupervised Symmetry Learning via Locality and Density Preservation [0.0] 我々は、生データから始まる新しい教師なし対称性学習法を開発し、基礎となるLie群を最小限に生成する。
この方法は、近似翻訳対称性のみを用いてデータセットから画素変換演算子を学習することができる。
この対称性と局所性との結合が,エントロピー推定のために開発された最適化手法と相まって,安定したシステムを実現することを実証する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:19:05 GMT)
Symmetry Sectors in Chord Space and Relational Holography in the DSSYK [0.0] 我々は、DSSYK のコードヒルベルト空間内の特定の制約によって生成される異なる対称性セクターを物質とともに発見する。
コードパリティ対称性はETWブレーンとユークリッドワームホールの正弦ディラトン重力に対応している。
パリティゲージ付きDSSYKの拡散複雑さとバルク内の測地線長を一致させてホログラフィック辞書を推定する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:04:44 GMT)
Roadmap for using large language models (LLMs) to accelerate cross-disciplinary research with an example from computational biology [0.0] 大きな言語モデル(LLM)は、研究の実施方法を変える強力な人工知能(AI)ツールである。
研究における彼らの使用は、幻覚、偏見、研究への潜在的な害に関する懸念から懐疑論に満ちている。
本稿では,LSMを学際的な研究に統合するためのロードマップを示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 17:20:14 GMT)
Reversing Hydrogen-Related Loss in $α$-Ta Thin Films for Quantum Device Fabrication [0.0] 製造中の水素吸収、特にネイティブオキシドを除去する場合は、マイクロ波損失を増大させることで性能を低下させることができる。
本研究では, 水素が10vol%のフッ化水素酸を3分以上曝露した場合に, $alpha$-Ta薄膜に侵入できることを実証した。
共振器の性能の低下は、非超伝導タンタル水和物の生成によって生じる可能性が高い。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:10:33 GMT)
Recommender systems, stigmergy, and the tyranny of popularity [0.0] 本稿では,ユーザ固有のキャリブレーションを取り入れた検索プラットフォームを提案する。
私たちはプラットフォーム開発者に、テキストの埋め込みとLCMを、ユーザの自律性を高める方法でどのように実装できるかをアドバイスします。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 03:51:55 GMT)
Re-Emergent Misalignment: How Narrow Fine-Tuning Erodes Safety Alignment in LLMs [0.0] 安全でないコードに対する微調整は、アライメントに反する内部的な変更を誘発することを示す。
我々は、アライメントの振る舞いを管理するモデルの活性化空間における共有潜在次元を同定する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:36:58 GMT)
Randomized Gradient Descents on Riemannian Manifolds: Almost Sure Convergence to Global Minima in and beyond Quantum Optimization [0.0] 我々は,サドル点が存在するにもかかわらず,ランダム化勾配降下法が一局所最適化にほぼ確実に収束することを証明した。
主要な応用として、一元群上の量子最適化による基底状態の準備を考える。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:36:54 GMT)
Quantum Computation with Correlated Measurements: Implications for the Complexity Landscape [0.0] 私たちは$mathsfCorrBQP$が$mathsfBPPmathsfPP$と全く同じであることを示す。
また、$mathsfCorrBQP$は古典的なクエリに関して自己低であることを示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:21:45 GMT)
Probing Latent Subspaces in LLM for AI Security: Identifying and Manipulating Adversarial States [0.0] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。
しかし、彼らは、迅速な注射攻撃による脱獄のような敵の操作に弱いままである。
LLMから隠れた活性化を抽出し, 安全状態と脱獄状態の潜伏部分空間について検討した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:13:55 GMT)
Predicting the von Neumann Entanglement Entropy Using a Graph Neural Network [0.0] 本稿では,実験可能なビットストリングから直接フォン・ノイマンエントロピーを予測するために,グラフニューラルネットワークを用いた機械学習手法を提案する。
我々は、このアプローチをRydbergのはしごシステム上でテストし、0から1.9までのエントロピー値を持つデータセット上でトレーニング範囲内で評価する場合、平均絶対誤差は3.6倍10-3$となる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 10:38:35 GMT)
Predicting Business Angel Early-Stage Decision Making Using AI [0.0] ビジネスエンジェルは重要な資金源を提供するが、意思決定は主観的でリソース集約的であることが多い。
このようなツールの1つ、CFA(Critical Factor Assessment)は、意思決定後に評価され、投資家自身の決定よりもはるかに正確であることが判明した。
この研究は、トレーニングされたAIモデルを用いて、導入を妨げる制約を克服できるかどうかを、以前の研究に基づいて調査する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 17:17:34 GMT)
On the choice of non-linear terms in blocking cat states by energy conservation [0.0] エントロピー25, 564 (2023) ではスピンモデルの波動関数アンサンブルの問題を検討した。
W.D. Wick, arXiv:1710.03278]で導入された種類の非線形項は、測定問題の解法としてエネルギー保存によって空間猫をブロックすることであった。
最後に [W.D. Wick, arXiv:1710.03278] の提案を検証するための実験的見積もりを述べる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 19:20:49 GMT)
On the Effectiveness of the $z$-Transform Method in Quadratic Optimization [0.0] シーケンスの$z$変換(英: $z$-transform)は、信号処理、制御理論、計算機科学、電気工学において用いられるツールである。
特に、$z$-transform 法は振る舞いに焦点をあて、テイラー展開の使用を可能にする。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:12:23 GMT)
On classical advice, sampling advise and complexity assumptions for learning separations [0.0] トレーニングセットの形式でのアドバイスと古典的アドバイスの関係について検討する。
mathsfBPP/samp$は、$mathsfP/poly$の適切なサブセットです。
量子学習の高速化を示す概念クラスの存在に対する十分かつ必要な複雑性理論の仮定を同定する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 16:23:36 GMT)
Novel Blockchain-based Protocols for Electronic Voting and Auctions [0.0] 我々は、ブロックチェーン上に構築されるいくつかの分散プロトコル、特にスマートコントラクトに関するスマートコントラクトについて検討している。
我々はBlind Voteという新しいアプローチを提案し、これは追跡不能で、安全で、効率的で、秘密保持であり、完全にオンチェーンの電子投票プロトコルである。
一方,入札者の身元と入札価値を保護し,個人的かつ信頼できないオークションのための新しいアルゴリズム群を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 02:26:04 GMT)
Nonequilibrium thermometry via an ensemble of initially correlated qubits [0.0] 温度プローブとして働く量子ビットのアンサンブルは、マクロな熱浴と弱く結合される。
熱化の過渡期におけるQFI(Quantum Fisher Information)のピークを観測する。
量子相関の影響は、この研究の中心的な特徴として現れている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 10:49:39 GMT)
Learning Dark Souls Combat Through Pixel Input With Neuroevolution [0.0] ダークソウルにおけるゲームプレイの自動化にNEAT(Neuroevolution of Augmenting Topologies)を適用した。
従来の強化学習やゲームプレイのアプローチとは異なり,本手法は生の画素データから直接ニューラルネットワークを進化させる。
我々はDark Souls API(DSAPI)を紹介した。Dark Souls APIは、リアルタイムコンピュータビジョン技術を利用して重要なゲームメトリクスを抽出する新しいPythonフレームワークである。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 19:58:59 GMT)
Introduction to abelian anyons in planar systems [0.0] 本稿では,平面系におけるアーベル異性体の理論を序項レベルで概説する。
本研究の目的は,これらの粒子励起の数学的構造と理論的および実験的物理的側面との関係を明らかにすることである。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:09:49 GMT)
Inclusive Review on Advances in Masked Human Face Recognition Technologies [0.0] Masked Face Recognition (MFR) は生体認証技術においてますます重要になっている分野である。
本稿では,ディープラーニング技術に焦点をあてて,この分野の最新動向を包括的にレビューすることを目的とする。
本稿では,照明の変化,顔の位置の変化,部分隠蔽,マスクの種類がシステムの性能に与える影響など,最も顕著な課題について論じる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:55:18 GMT)
Hungary and AI: efforts and opportunities in comparison with Singapore [0.0] この研究は、戦略文書、公開財務記録、専門家インタビューの分析を通じて、ハンガリーの国家AI戦略とその実施を評価している。
主な発見は、ハンガリーにおけるAI関連公共投資の合計465億ドルである。
この論文は、シンガポールのフレームワークを基準点として、ハンガリーの今後のAI戦略をターゲットとしたレコメンデーションを提供する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:12:47 GMT)
Horus: A Protocol for Trustless Delegation Under Uncertainty [0.0] 検証ゲームにおいて,コラテラライズされたクレームによる正当性を強制するプロトコルを提案する。
タスクは意図として公開され、解決者はそれらを満たすために競います。
どんな挑戦者でも、検証プロセスのトリガーとして挑戦することで結果に挑戦することができる。
不正なエージェントがスラッシュされ、正しい反対が報われ、誤検証自体を罰するエスカレーションパスが設けられる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 01:19:50 GMT)
High-power readout of a transmon qubit using a nonlinear coupling [0.0] 本研究では,トランスモン量子ビットとその読み出しモード間の非線形結合が,高忠実度量子ビット読み出しを実現することを示す。
その結果、高忠実度量子ビット読み出しのための高出力状態におけるトランスモン分子の有望な性能が明らかとなった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:15:41 GMT)
Early Termination of Low-Density Parity-Check Codes for Continuous-Variable Quantum Key Distribution [0.0] 連続可変量子鍵分布の復号スループットに及ぼすlog a-posteriori早期終了の影響を解析する。
デコードされた秘密鍵レートのスループットは182%まで増加し、シミュレーションと実験の両方で報告されている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 12:06:39 GMT)
Domain-wall melting and entanglement in free-fermion chains with a band structure [0.0] ホッピング振幅の周期的変動がバンド構造を生じさせる自由フェルミオン鎖におけるドメイン壁の融解について検討した。
二量体鎖の場合、粒子密度と電流は、速度の再スケーリングまで均質の場合と同じ表現を持つ。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 19:01:15 GMT)
Disentangling Doubt in Deep Causal AI [0.0] 本稿では,予測分散を表現の不確実性に分割する深層ツインネットワークモデルのためのモンテカルロ・ドロップアウトフレームワークを提案する。
3つの共シフト状態の中で、我々の間隔はよく校正され、sigma_rep2 + sigma_pred2 sigma_tot2を満たす。
このモジュールレベルの分解は、深い因果効果モデルにおける不確実性源を検出し、解釈するための実用的な診断を提供する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:48:51 GMT)
Disambiguation-Centric Finetuning Makes Enterprise Tool-Calling LLMs More Realistic and Less Risky [0.0] 大規模言語モデル(LLM)はますますエンタープライズAPIの呼び出しを担っているが、ほぼ重複したツールが同じユーザ意図で動作しようとすると、日常的にフェールする。
人格駆動の多ターン対話を合成する,曖昧性中心の3段階パイプラインであるDiaFORGEを紹介する。
DiaBENCHのベンチマークでは、DiaFORGEでトレーニングしたモデルは、GPT-4oで27pp、Claude-3.5-Sonnetで49pp、それぞれ最適化されたプロンプトで成功した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:49:02 GMT)
Dilution, Diffusion and Symbiosis in Spatial Prisoner's Dilemma with Reinforcement Learning [0.0] 囚人ジレンマの空間バージョンにおける希釈と移動性の影響について検討した。
固定された更新ルールを持つゲームは、学習したゲームと質的に等価であることを示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:32:01 GMT)
Cylindrically confined $H$ atom in magnetic field: variational cut-off factor [0.0] 一定磁場の存在下では、水素原子は半径$rho_0$の無敵無限円筒空洞内に閉じ込められていると考えられる。
ボルン=オッペンハイマー近似では、シリンダーの幾何学中心に核を固定し、物理的に意味のある3パラメトリックトライアル関数を用いて基底状態エネルギーを決定する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 07:14:25 GMT)
Contextuality of the probability current in quantum mechanics [0.0] 我々は、局所現実理論についてハーディが提唱した議論を再考するが、標準量子力学の確率電流の観点から考える。
我々は、構成空間における軌跡の驚くべき性質、特に文脈(実験装置)が変更されたときの(準)不連続な変動を強調した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:17:57 GMT)
Compressing Deep Neural Networks Using Explainable AI [0.0] XAIを用いた新しい圧縮手法を提案する。
実験の結果,提案手法はモデルサイズを64%削減し,精度は42%向上した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 21:45:34 GMT)
Compact detector for atom-atom correlations on an atom chip [0.0] 本稿では, 原子チップ近傍に閉じ込められたRydberg原子の, 状態選択的, 空間分解的測定のための, コンパクトで電離型検出器を提案する。
このシステムは、荷電粒子を誘導する静電レンズシステムと、イオン化によって生じるイオンと電子の両方を検出することができる一連のチャネル電子乗算器(CEM)を組み合わせる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 14:49:01 GMT)
Cancer cytoplasm segmentation in hyperspectral cell image with data augmentation [0.0] ヘマトキシリンとエオシン(H&E)の染色された画像は、通常、細胞の核またはがん領域を検出するために用いられる。
深層学習モデルを用いたハイパースペクトル画像における癌細胞質の検出法を提案する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 06:18:50 GMT)
Beyond Weaponization: NLP Security for Medium and Lower-Resourced Languages in Their Own Right [0.0] 本研究は,低級・中級言語におけるLMの安全性について検討する。
これらの言語に対する単言語および多言語LMの安全性を評価するため、最大70言語に対する既存の敵攻撃を拡張した。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 10:54:04 GMT)
Be the Change You Want to See: Revisiting Remote Sensing Change Detection Practices [0.0] リモートセンシング変化検出は、異なるタイミングでキャプチャされた同じ位置の画像間のセマンティックな変化をローカライズすることを目的としている。
ほとんどの場合、バックボーンの選択、事前トレーニング戦略、トレーニング設定など、基本的な設計選択のパフォーマンスのコントリビューションの測定に失敗する。
このような基本的な設計選択は、新しいアーキテクチャコンポーネントの追加よりもパフォーマンスを著しく向上させることが多い、と私たちは主張する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:01:28 GMT)
An infinite family of Dunkl type superintegrable curved Hamiltonians through coalgebra symmetry: Oscillator and Kepler-Coulomb models [0.0] 我々は、ダンクル超可積分系と、超可積分性に対するコレージュブラ対称性のアプローチの間のギャップを橋渡しする。
反射を伴う$N$次元準最大超可積分量子系の無限族が導入された。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:33:05 GMT)
An Advanced Deep Learning Framework for Ischemic and Hemorrhagic Brain Stroke Diagnosis Using Computed Tomography (CT) Images [0.0] 脳卒中は世界中で死亡率と長期障害の主な原因の1つである。
ほとんどのストローク分類技術は、単一のスライスレベルの予測機構に依存している。
機械学習(ML)は、脳卒中診断を改善するための新しい道を開いた。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:11:29 GMT)
Alpay Algebra IV: Symbiotic Semantics and the Fixed-Point Convergence of Observer Embeddings [0.0] 本稿では,文書とAIモデルが一定の不動点相互作用を行う理論的枠組みを提案する。
このような収束は数学的に健全であり、意味的不変であり、永続的であることを証明している。
この固定点は「共感的埋め込み」として機能し、AIはコンテンツの意味だけでなく著者の意図も内部化する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 18:49:18 GMT)
Accelerating Private Heavy Hitter Detection on Continual Observation Streams [0.0] 遅延更新に基づく新たな微分プライベートスケッチ技術を導入し、各ステップで出力スケッチの小さな回転部分のみを摂動・更新する。
実験の結果、スループットが250ドル向上し、リアルタイム、連続観察、アプリケーションに差分プライバシーをより実用的なものにしている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 07:49:00 GMT)
Absolute Evaluation Measures for Machine Learning: A Survey [0.0] この調査は、機械学習における絶対評価指標の概要を提供する。
学習のタイプによって構成され、クラスタリング、回帰、ランキングのメトリクスをカバーする。
モデルの適切なメトリクスを選択するために必要なツールを実践者に提供することを目的としている。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:53:08 GMT)
AI-VaxGuide: An Agentic RAG-Based LLM for Vaccination Decisions [0.0] ワクチンは世界の公衆衛生において重要な役割を担っているが、医療専門家は予防接種ガイドラインの迅速かつ効率的な利用に苦慮することが多い。
本プロジェクトは,静的接種ガイドラインを対話的でユーザフレンドリな知識ベースに変換する多言語・インテリジェントな質問応答システムを開発することで,この問題に対処する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 11:33:56 GMT)
AI is the Strategy: From Agentic AI to Autonomous Business Models onto Strategy in the Age of AI [0.0] 私たちは現在、エージェントAIが価値創造、デリバリ、キャプチャのコアメカニズムを実行することができる段階に入りつつある、と論じています。
このシフトは、AIを戦略をサポートするツールではなく、戦略そのものとして再編成する。
ABMがエージェント実行、継続的適応、段階的な人的意思決定のオフロードを通じて、競争上の優位性をいかに作り直すかを示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 08:41:00 GMT)
A Vision-Based Closed-Form Solution for Measuring the Rotation Rate of an Object by Tracking One Point [0.0] ホログラフィック投影と、剛体上の点に固定されたカメラにより、その体の回転を解析的に得ることができる。
提案手法は3次元オブジェクトの形状とは独立であり,シーンに関する事前知識を必要としない。
本稿では,実映像データから解析的導出,シミュレーション結果,結果について述べる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 00:56:32 GMT)
A Useful Metric for the NISQ Era: Qubit Error Probability and Its Role in Zero Noise Extrapolation [0.0] 本稿では,1キュービット当たりの1つの評価値に緩和,復調,ゲート,測定の寄与を組み合わせ,実行前に計算可能なデバイス固有の測定値であるqubit error probability (QEP)を提案する。
原回路が有限平均QEPを示すレジームでは、回路深さを拡大したZNEで達成可能なもの以外の観測可能な誤差を抑える。
これらの結果から,QEPは透過的かつ効率的な誤差測定であり,そのZNEへの統合は,現在の超伝導ハードウェアにおける信頼性向上への実践的な道筋を提供することが示された。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 07:33:48 GMT)
A Universal Approach to Feature Representation in Dynamic Task Assignment Problems [0.0] 課題解決のための技術として,深層強化学習(DRL)が提案されている。
本稿では,無限の状態と行動空間を用いた代入問題の表現と解法を提案する。
実験の結果,提案手法は最適タスク割り当てポリシーを表現および学習するのに適していることがわかった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 13:48:28 GMT)
A Survey on Integrating Quantum Computers into High Performance Computing Systems [0.0] 汎用マシンであるにもかかわらず、量子コンピュータは古典的なコンピュータを置き換えることは期待されていない。
これにより、量子コンピュータを高性能コンピューティングシステムに統合することが、ますます関連するトピックとなる。
文献データベースを方法論的に検索し、107の出版物を手作業で評価する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 12:46:02 GMT)
A Study of Gate-Based and Boson Sampling Quantum Random Number Generation on IBM and Xanadu Quantum Devices [0.0] 本稿では、2つの量子プラットフォームから乱数を生成する実用性について検討する。
我々は古典的なフォン・ノイマン抽出器を含む単純な後処理手法を実装した。
その結果、両プラットフォームで未バイアスのビットストリームを実現することができるが、スループットは低く、ランダムビット当たりのコストが高いことがわかった。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 22:01:55 GMT)
A Lie-algebraic perspective on Tree-Adjoining Grammars [0.0] 我々は、TAGの数学的定式化の1つが、TAGシステムの特性を、システムの追加コンポーネントとして仮定することなく、どのように捉えているかを示す。
我々は,TAGの数学的定式化の1つが,TAGシステムの特性をシステムに追加の構成要素として仮定することなく,どのように捉えているかを示すことによって,この視点の有用性を実証する。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 00:25:27 GMT)
A Hybrid Supervised and Self-Supervised Graph Neural Network for Edge-Centric Applications [0.0] 本稿では,2つのノード間の関係(エッジ中心タスク)を含むタスクを対象とした,グラフに基づく新しいディープラーニングモデルを提案する。
このモデルは教師付き学習と自己教師型学習を組み合わせ、学習した埋め込みとパターンが真実と無関係に学習される損失関数を考慮に入れている。
実験により、タンパク質間相互作用予測と遺伝子オントロジー(GO)用語予測の既存の手法と一致するか、超えるかを示す。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 15:15:10 GMT)
A Hybrid Game-Theory and Deep Learning Framework for Predicting Tourist Arrivals via Big Data Analytics and Opinion Leader Detection [0.0] 本稿では,海外旅行者の来訪を2つの異なる文脈で予測するための非線形ハイブリッド手法を提案する。
この手法は、インターネットのビッグデータの複数のソースを統合し、ソーシャルメディアプラットフォーム上の意見リーダーを識別する革新的なゲーム理論ベースのアルゴリズムを用いる。
実験により,本手法は既存の最先端技術より優れていることが示された。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 09:17:17 GMT)
A Data-Transparent Probabilistic Model of Temporal Propositional Abstraction [0.0] 標準確率モデルは、データの不足、大きな仮説空間、データの透明性の低下など、基本的な課題に直面している。
本稿では,データ駆動型時間命題推論の新しい確率論的モデルを提案する。
我々は,本モデルが高次,すなわち全メモリ,マルコフ連鎖と等価であることを示し,隠れ変数と観測変数の区別を必要としない。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 21:37:47 GMT)
A Better Multi-Objective GP-GOMEA -- But do we Need it? [0.0] シンボリック回帰(SR)では、正確性と解釈可能性の適切なバランスを達成することが重要な課題である。
Gene-pool Optimal Mixing Evolutionary Algorithm (GP-GOMEA) の遺伝的プログラミングの変種は、表現のサイズを制限するテンプレートを用いて最先端のパフォーマンスを達成するために特に関心がある。
最近導入されたモジュラGP-GOMEAは、複数の部分表現を使って表現を分解することができ、さらに解釈可能性を高めることができる。
GP-GOMEAの多目的変種が存在し、例えば、サイズと精度を同時に最適化するために使用することができる。
論文参考訳(メタデータ) (Fri, 04 Jul 2025 18:54:27 GMT)