Fugu-MT: arxivの論文翻訳(概要)

Nemotron-H: A Family of Accurate and Efficient Hybrid Mamba-Transformer Models [164.5]
ネモトロン-Hは8Bと56B/47Bハイブリッド・マンバ・トランスフォーマーのファミリーである。私たちは共通のTransformerモデルアーキテクチャにおけるほとんどの自己注意レイヤをMambaレイヤに置き換えます。 Nemotron-Hモデルは、他の同様のサイズのオープンソーストランスフォーマーモデルと比較して、精度が良いか低いかのどちらかを提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:31:53 GMT)
Pangu Ultra: Pushing the Limits of Dense Large Language Models on Ascend NPUs [123.3]
135億のパラメータと高密度トランスフォーマーモジュールを持つ大規模言語モデル(LLM)であるPangu Ultraについて述べる。このような大規模トレーニングを効率的に行うためには,8,192個のAscend NPUと一連のシステム最適化を用いる。我々の調査では、Ascend NPUは1000億以上のパラメータを持つ高密度モデルを効率的かつ効果的に訓練できることを示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:41:51 GMT)
SYNTHIA: Novel Concept Design with Affordance Composition [114.2]
所望の価格に基づいて,新規で機能的なコヒーレントなデザインを生成するためのフレームワークであるSynTHIAを紹介する。我々は,我々のオントロジーに基づくカリキュラム学習手法を開発し,細粒度T2Iモデルと対比して,段階的に手頃な構成を学習する。実験の結果,SynTHIAは最先端のT2Iモデルよりも優れていた。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:37:28 GMT)
Liquid: Language Models are Scalable and Unified Multi-modal Generators [112.7]
Liquidは視覚的理解と生成をシームレスに統合する自動回帰生成パラダイムである。従来のマルチモーダルな大言語モデル(MLLM)とは異なり、Liquidは単一の大言語モデルを用いてこの統合を実現する。初めてLiquidは、ビジュアルタスクと言語タスクの統一トレーニングによって必然的にパフォーマンスが低下する、スケーリングの法則を明らかにした。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:28:11 GMT)
SoTA with Less: MCTS-Guided Sample Selection for Data-Efficient Visual Reasoning Self-Improvement [100.9]
ThinkLite-VLはQwen2.5-VL-7Bインストラクションの平均性能を7%向上させる。私たちのコード、データ、モデルはhttps://github.com/si0wang/ThinkLite-VL.orgで公開されています。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:49:05 GMT)
Revisiting LLM Evaluation through Mechanism Interpretability: a New Metric and Model Utility Law [99.6]
大規模言語モデル(LLM)は、学術、産業、そして日々のアプリケーションに欠かせないものになっている。本稿では,従来の性能指標を補完する機構解釈可能性技術を導入し,モデル利用指標(MUI)を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:09:47 GMT)
GenDoP: Auto-regressive Camera Trajectory Generation as a Director of Photography [98.3]
本稿では,写真監督の専門知識にインスパイアされた自己回帰モデルを導入し,芸術的かつ表現的なカメラトラジェクトリを生成する。包括的で多様なデータベースのおかげで、高品質でコンテキスト対応のカメラムーブメント生成のための自動回帰デコーダのみのトランスフォーマーをトレーニングします。実験により、既存の手法と比較して、GenDoPはより良い制御性、よりきめ細かい軌道調整、より高い運動安定性を提供することが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:10:15 GMT)
SAMJAM: Zero-Shot Video Scene Graph Generation for Egocentric Kitchen Videos [93.3]
VidSGGの現在のモデルはシーングラフを作成するために広範囲なトレーニングを必要とする。本稿では,SAM2の時間追跡とGeminiのセマンティック理解を組み合わせたゼロショットパイプラインSAMJAMを提案する。我々は、SAMJAMが、EPIC-KITCHENSとEPIC-KITCHENS-100データセットの平均リコールにおいて、Geminiを平均8.33%上回っていることを実証的に示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:43:10 GMT)
Supervised Optimism Correction: Be Confident When LLMs Are Sure [91.7]
教師付き微調整とオフライン強化学習の間には,新たな理論的関係が確立されている。広く使われているビームサーチ法は、許容できない過度な最適化に悩まされていることを示す。本稿では,トークンレベル$Q$-value推定のための簡易かつ効果的な補助的損失を導入したSupervised Optimism Correctionを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:50:03 GMT)
Rethinking Patch Dependence for Masked Autoencoders [89.0]
マスク付きオートエンコーダ(MAE)のデコーダにおけるパッチ間の依存関係が表現学習に与える影響について検討する。クロスアテンションマスク付きオートエンコーダ(CrossMAE)の簡易な視覚前訓練フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:50:15 GMT)
Kimi-VL Technical Report [88.1]
Kimi-VLは視覚言語モデル(VLM)であり、高度なマルチモーダル推論、長いコンテキスト理解、強力なエージェント能力を提供する。汎用 VLM として、Kimi-VL はマルチターンエージェントタスク(OSWorld など)に優れ、旗艦モデルと一致する。 Kimi-VLをベースとして、Kim-VL-Thinkingという先進的なロングシンキングモデルを導入する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:48:26 GMT)
Finding Fantastic Experts in MoEs: A Unified Study for Expert Dropping Strategies and Observations [86.9]
わずかに活性化されたMixture-of-Experts(SMoE)は、ニューラルネットワークの学習能力のスケールアップを約束している。多様な視点から専門家の重要度を推定するためのベンチマークとして,MoE Experts Compression Suite (MC-Suite)を提案する。我々は,SMoEsの指示追従能力が主に損なわれるという,実験的に検証された予想を提示する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:32:14 GMT)
MM-IFEngine: Towards Multimodal Instruction Following [85.9]
高品質なイメージインストラクションペアを生成するパイプラインであるMM-IFEngineを提案する。 MM-IFInstruct-23kはSFT(Supervised Fine-Tuning)に適しているが、DPO(Direct Preference Optimization)のためにMM-IFDPO-23kとして拡張されている。また、MM-IFEvalは、困難で多様なマルチモーダル命令追従ベンチマークである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:59:12 GMT)
Findings of the BabyLM Challenge: Sample-Efficient Pretraining on Developmentally Plausible Corpora [84.0]
子どもたちは1億ワード未満の入力から言語を習得できる。大規模な言語モデルはデータ効率がはるかに低く、通常は3～4桁以上のデータを必要とするが、多くの評価において人間ほど性能は高くない。 BabyLM Challengeは、参加者が固定データ予算で言語モデルトレーニングを最適化するために競う共同作業である。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:22:43 GMT)
TwinArch: A Digital Twin Reference Architecture [83.7]
デジタルツイン(Digital Twins, DT)は物理系の動的仮想表現であり、物理的およびデジタル領域間のシームレスな双方向通信によって実現される。提案されているDigital Twin Reference ArchitectureはTwinArchという名前だ。ソフトウェア工学研究所のViews and Beyond方法論を使って文書化されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:53:11 GMT)
Fast Adaptation with Behavioral Foundation Models [82.3]
教師なしゼロショット強化学習は、行動基礎モデルの事前学習のための強力なパラダイムとして登場した。有望な結果にもかかわらず、ゼロショットポリシーは、教師なしのトレーニングプロセスによって引き起こされるエラーにより、しばしば準最適である。本稿では,事前訓練されたBFMの低次元タスク埋め込み空間を探索し,ゼロショットポリシーの性能を急速に向上させる高速適応手法を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:14:17 GMT)
A Graph-Based Synthetic Data Pipeline for Scaling High-Quality Reasoning Instructions [80.6]
グラフベースのSynthetic Data Pipeline(GSDP)は、高品質な推論データ合成のための経済的かつスケーラブルなフレームワークである。最も困難な数学的推論課題に取り組むために,161万組以上の数学問題と解からなるGSDP-MATHデータセットを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:47:53 GMT)
GaussianAnything: Interactive Point Cloud Flow Matching For 3D Object Generation [75.4]
本稿では,インタラクティブなポイントクラウド構造ラテント空間を備えたスケーラブルで高品質な3D生成を実現する,新しい3D生成フレームワークを提案する。本フレームワークでは,複数ビューのRGB-D(epth)-N(ormal)レンダリングを入力として使用する変分オートエンコーダを,3次元形状情報を保存する独自のラテント空間設計を用いて構成する。提案手法であるGaussianAnythingは,複数モード条件付き3D生成をサポートし,ポイントクラウド,キャプション,単一画像入力を可能にする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:24:52 GMT)
Echo Chamber: RL Post-training Amplifies Behaviors Learned in Pretraining [74.8]
強化学習(RL)に基づく微調整は、訓練後の言語モデルにおいて重要なステップとなっている。数理推論のためのRLファインタニングを、スクラッチから完全にトレーニングモデルを用いて体系的にエンドツーエンドに研究する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:15:53 GMT)
TextPSG: Panoptic Scene Graph Generation from Textual Descriptions [72.8]
我々は、純文記述(Caption-to-PSG)によるパノプティカルシーングラフ生成の新たな課題について検討する。鍵となるアイデアは、Web上の大量の無料画像キャプチャーデータを活用して、パノラマシーングラフを生成することである。本研究では,4つのモジュール,すなわちリージョングルーパー,エンティティグルーパー,セグメントマージ,ラベルジェネレータからなる新しいフレームワークであるTextPSGを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:14:19 GMT)
Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction [72.5]
動的シーンのモノクロ3次元再構成にビデオ拡散モデルを再利用するGeo4Dを提案する。このようなビデオモデルによってキャプチャされた強いダイナミックな事前情報を活用することで、Geo4Dは合成データのみを使用して訓練することができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:59:55 GMT)
Cognitive Debiasing Large Language Models for Decision-Making [71.2]
大規模言語モデル(LLM)は意思決定アプリケーションをサポートする可能性を示している。本稿では,LLMの信頼性を高める自己脱バイアスという認知的脱バイアス手法を提案する。我々の手法は、3つの逐次的なステップ – バイアス決定、バイアス分析、認知バイアス ― に従うことで、プロンプトにおける潜在的な認知バイアスを反復的に緩和する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:45:38 GMT)
CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.8]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:54:12 GMT)
VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning [69.0]
ユニバーサル画像生成フレームワークであるVisualClozeを提案する。 VisualClozeは、幅広いドメイン内タスク、見えないタスクへの一般化、複数のタスクの見えない統一、リバースジェネレーションをサポートする。グラフ構造化データセットであるGraph200Kを導入し,タスク密度と伝達可能な知識を向上する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:59:42 GMT)
Do LLMs Understand Your Translations? Evaluating Paragraph-level MT with Question Answering [68.3]
本稿では,TREQA(Translation Evaluation via Question-Answering)について紹介する。我々は,TREQAが最先端のニューラルネットワークとLLMベースのメトリクスより優れていることを示し,代用段落レベルの翻訳をランク付けする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:24:54 GMT)
Perception-R1: Pioneering Perception Policy with Reinforcement Learning [68.1]
本稿では,MLLMポストトレーニング中にGRPOを用いたスケーラブルなRLフレームワークPerception-R1を提案する。 Qwen2.5-VL-3B-インストラクションでは、Perception-R1はRefCOCO+で+4.2%、PixMo-Countで+17.9%、特にCOCO 2017 valで31.9%のAPを達成した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:58:27 GMT)
R-SCoRe: Revisiting Scene Coordinate Regression for Robust Large-Scale Visual Localization [66.9]
可視性グラフに基づくグローバルエンコーディング学習とデータ拡張戦略を導入する。ネットワークアーキテクチャとローカル特徴抽出モジュールを再考する。本手法は,ネットワークアンサンブルや3D監視に頼ることなく,大規模データセットに挑戦する最先端の手法を実現する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:39:39 GMT)
SMORE: Simultaneous Map and Object REconstruction [66.7]
本稿では,LiDARから大規模都市景観を動的に再現する手法を提案する。我々は、世界が厳格に動く物体と背景に分解される動的なシーンの構成モデルを総合的に捉え、最適化する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:08:54 GMT)
Fairness Mediator: Neutralize Stereotype Associations to Mitigate Bias in Large Language Models [66.6]
LLMは必然的にトレーニングデータから急激な相関関係を吸収し、偏りのある概念と特定の社会的グループの間のステレオタイプ的関連をもたらす。ステレオタイプアソシエーションを中和するバイアス緩和フレームワークであるFairness Mediator (FairMed)を提案する。本フレームワークは, ステレオタイプアソシエーションプローバーと, 対向型デバイアス中和剤の2つの主成分からなる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:23:06 GMT)
Which Viewpoint Shows it Best? Language for Weakly Supervising View Selection in Multi-view Instructional Videos [66.2]
LangViewは、ビュー依存のキャプション予測の相対的精度を、擬似ラベルを最もよく見るためのプロキシとして利用するフレームワークである。推論中、我々のモデルは多視点ビデオ(言語やカメラのポーズなし)のみを入力として、各タイミングで見るのに最適な視点を返します。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:02:49 GMT)
Are We Done with Object-Centric Learning? [65.7]
オブジェクト中心学習(OCL)は、シーン内の他のオブジェクトやバックグラウンドキューから分離されたオブジェクトのみをエンコードする表現を学習しようとする。最近のサンプル効率のセグメンテーションモデルでは、ピクセル空間内のオブジェクトを分離し、それらを独立に符号化することができる。我々は,OCLのレンズを通した背景刺激によるOOD一般化の課題に対処する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:45:00 GMT)
Latte: Latent Diffusion Transformer for Video Generation [65.1]
ビデオ生成のための遅延拡散変換器Latteを提案する。 Lataはまず、入力ビデオから時間トークンを抽出し、次に一連のTransformerブロックを採用して、潜時空間の動画配信をモデル化する。 Lataは、4つの標準ビデオ生成データセットで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:28:20 GMT)
Next-generation Surgical Navigation: Marker-less Multi-view 6DoF Pose Estimation of Surgical Instruments [64.6]
静止カメラとヘッドマウントカメラを組み合わせたマルチカメラ・キャプチャー・セットアップを提案する。第2に,手術用ウェットラボと実際の手術用劇場で撮影された元脊椎手術のマルチビューRGB-Dビデオデータセットを公表した。第3に,手術器具の6DoFポーズ推定の課題に対して,最先端のシングルビューとマルチビューの3つの手法を評価した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:23:33 GMT)
Beyond the Frame: Generating 360° Panoramic Videos from Perspective Videos [64.1]
360degのビデオは、私たちの周囲のより完全な視点を提供する。既存のビデオモデルは、標準的なビデオを作るのに優れているが、完全なパノラマビデオを生成する能力は、まだ明らかになっていない。高品質なデータフィルタリングパイプラインを開発し、双方向のトレーニングデータをキュレートし、360度ビデオ生成の品質を向上させる。実験結果から,本モデルでは実写的でコヒーレントな360デグ映像を撮影できることが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:51:38 GMT)
How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective [64.0]
大規模言語モデル(LLM)は、関連性を評価し、情報検索(IR)タスクをサポートする。メカニスティック・インタプリタビリティのレンズを用いて,異なるLLMモジュールが関係判断にどのように寄与するかを検討する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:14:55 GMT)
PIDSR:ComplementaryPolarizedImageDemosaicingandSuper-Resolution [63.9]
偏光カメラの解像度は従来のRGBカメラよりもはるかに低い。既存の偏光画像復調法(PID)は、解像度を向上できないため制限されている。我々は,PIDSRと超解像の相補的な偏極画像復位と超解像を行う共同フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:56:33 GMT)
Extendable Long-Horizon Planning via Hierarchical Multiscale Diffusion [62.9]
本稿では,学習データよりも長い軌道計画を行うための,拡張可能な長期計画支援エージェントの課題に対処する。より短いものを縫い合わせることで、より長い軌跡を反復的に生成する拡張法を提案する。 HM-ディフューザーは階層構造を用いてこれらの拡張軌道を訓練し、複数の時間スケールにわたるタスクを効率的に処理する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:53:26 GMT)
Talking Point based Ideological Discourse Analysis in News Events [62.2]
本稿では,イデオロギー的談話分析理論をモチベーションとして,実世界の出来事に関するニュース記事を分析する枠組みを提案する。我々のフレームワークは,話題のトピックとともに,エンティティ,役割,メディアフレーム間の相互作用を捉えた,会話ポイントという関係構造を用いたニュース記事を表現している。我々は,人間の検証によって補足されたイデオロギーや分派的分類タスクを通じて,これらの視点を自動で生成するフレームワークの能力を評価する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:52:34 GMT)
Benchmarking Multi-modal Semantic Segmentation under Sensor Failures: Missing and Noisy Modality Robustness [61.9]
マルチモーダルセマンティックセグメンテーション(MMSS)は、モーダル間で補完情報を統合することで、単一モーダルデータの制限に対処する。顕著な進歩にもかかわらず、マルチモーダルデータ品質の変動と不確実性により、研究と実世界の展開の間に大きなギャップが持続する。 Intire-Missing Modality (EMM)、Random-Missing Modality (RMM)、Noisy Modality (NM)の3つのシナリオでMMSSモデルを評価する頑健性ベンチマークを導入する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:56:52 GMT)
ClimateBench-M: A Multi-Modal Climate Data Benchmark with a Simple Generative Method [61.8]
我々は、ERA5の時系列気候データ、NOAAの極度の気象イベントデータ、NASAの衛星画像データを調整するマルチモーダル気候ベンチマークであるClimateBench-Mに貢献する。また,各データモダリティの下では,天気予報,雷雨警報,作物の分断作業において,競争性能を向上できる簡易かつ強力な生成手法を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:22:23 GMT)
The Efficacy of Semantics-Preserving Transformations in Self-Supervised Learning for Medical Ultrasound [60.8]
本研究は, 肺超音波の自己教師あり学習におけるデータ拡張と前処理方略の影響を系統的に検討した。画像領域に共通して使用されるベースラインパイプライン、超音波用に設計された新しいセマンティック保存パイプライン、両方のパイプラインから最も効果的な変換の蒸留セットの3つのデータ拡張パイプラインが評価された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:26:47 GMT)
ID-Guard: A Universal Framework for Combating Facial Manipulation via Breaking Identification [60.7]
深層学習に基づく顔操作の誤用は、公民権に重大な脅威をもたらす。この不正行為を防止するため、操作過程を妨害する積極的な防御法が提案されている。本稿では,IDガード(ID-Guard)と呼ばれる顔の操作に対処するための普遍的な枠組みを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:58:51 GMT)
Real-time Verification and Refinement of Language Model Text Generation [60.0]
大規模言語モデル(LLM)は、幅広い自然言語タスクにおいて顕著な性能を示している。重要な課題は、時に事実的に誤った答えを生じさせることである。本稿では,LLM出力の検証と改善の効率化を目的とした新しい手法であるStreaming-VRを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:39:35 GMT)
Towards Scalable and Deep Graph Neural Networks via Noise Masking [59.1]
グラフニューラルネットワーク(GNN)は多くのグラフマイニングタスクで顕著に成功している。計算とストレージのコストが高いため、大きなグラフにスケールすることは困難です。既存のモデル単純化作業と互換性のあるプラグアンドプレイモジュールであるノイズマスキング(RMask)を用いたランダムウォークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:16:19 GMT)
P2Object: Single Point Supervised Object Detection and Instance Segmentation [58.8]
バランスの取れたtextbftextitinstance レベルの提案バッグを構成する Point-to-Box Network (P2BNet) を導入する。 P2MNetはより正確なバウンディングボックスを生成し、セグメンテーションタスクに一般化することができる。提案手法は,COCO,VOC,Cityscapesの平均精度において,従来の手法をはるかに上回っている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:51:08 GMT)
Event Signal Filtering via Probability Flux Estimation [58.3]
イベントは、非同期センシングを通じてシーンダイナミクスをキャプチャするための新しいパラダイムを提供するが、その固有のランダム性は、しばしば劣化した信号品質につながる。したがって、イベント信号フィルタリングは、この内部ランダム性を低減し、多様な取得条件をまたいだ一貫した出力を確保することで、忠実性を高めるために不可欠である。本稿ではイベント密度フローフィルタ(EDFilter)と呼ばれる生成オンラインフィルタリングフレームワークを紹介する。実験では、イベントフィルタリング、スーパーレゾリューション、イベントベースの直接追跡といったタスクでEDFilterのパフォーマンスを検証する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:03:08 GMT)
BoxDreamer: Dreaming Box Corners for Generalizable Object Pose Estimation [58.1]
本稿では、スパースビュー設定における課題に対処するために、オブジェクトポーズ推定のための汎用RGBベースのアプローチを提案する。これらの制約を克服するために、オブジェクトのポーズの中間表現としてオブジェクト境界ボックスのコーナーポイントを導入する。 3Dオブジェクトコーナーはスパース入力ビューから確実に復元でき、対象ビューの2Dコーナーポイントは、新しい参照ベースポイントデータセットによって推定される。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:58:35 GMT)
OoDIS: Anomaly Instance Segmentation and Detection Benchmark [57.9]
この作業は、インスタンスセグメンテーションとオブジェクト検出タスクを含むために、よく使われる異常セグメンテーションベンチマークを拡張します。異常セグメンテーションおよびオブジェクト検出手法の評価は,これらの課題が未解決問題のままであることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:11:08 GMT)
A Quantitative Evaluation of the Expressivity of BMI, Pose and Gender in Body Embeddings for Recognition and Identification [56.1]
人物再識別(ReID)システムは、画像またはビデオフレーム間で個人を識別する。多くのReID法は、性別、ポーズ、身体質量指数(BMI)などのセンシティブな属性の影響を受けている。表現性の概念をボディ認識領域に拡張し、ReIDモデルがどのようにこれらの属性をエンコードするかをよりよく理解します。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:29:03 GMT)
VL-Rethinker: Incentivizing Self-Reflection of Vision-Language Models with Reinforcement Learning [56.0]
GPT-o1とDeepSeek-R1は、明示的な反射によって難しい問題を解く大きな可能性を示した。本稿では、強化学習を用いて、視覚言語モデルの遅い思考能力を向上させることを目的とする。我々のモデルであるVL-Rethinkerは、MathVista、MathVerse、MathVisionの最先端スコアを80.3%、61.8%、43.9%に向上させています。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:41:56 GMT)
Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [56.0]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:43:16 GMT)
Marmot: Multi-Agent Reasoning for Multi-Object Self-Correcting in Improving Image-Text Alignment [55.7]
Marmotは、マルチオブジェクトの自己修正にマルチエージェント推論を採用する新しいフレームワークである。意思決定検証機構を備えたマルチエージェント編集システムを構築する。実験により、Marmotはオブジェクトのカウント、属性割り当て、空間的関係において精度を大幅に向上することが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:54:28 GMT)
Task-Circuit Quantization: Leveraging Knowledge Localization and Interpretability for Compression [55.3]
後トレーニング量子化(PTQ)は、コストのかかる再トレーニングなしに全精度重みを低ビット重みにマッピングすることで、モデルのメモリフットプリントを削減する。我々は,自動回路発見に並列性を持つ新しい混合精度PTQ手法であるTask-Circuit Quantization (TaCQ)を開発した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:19:03 GMT)
Geneshift: Impact of different scenario shift on Jailbreaking LLM [55.3]
我々は、遺伝的アルゴリズムを用いてシナリオシフトを最適化し、GeneShiftと呼ばれるブラックボックスジェイルブレイク攻撃を提案する。 GeneShiftはJailbreakの成功率を0%から60%に向上させるが、直接のプロンプトだけでは失敗する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:02:35 GMT)
Bandit Social Learning: Exploration under Myopic Behavior [54.8]
オンラインプラットフォーム上でのレビューによって動機付けられた社会学習のダイナミクスについて検討する。エージェントはまとめて単純なマルチアームのバンディットプロトコルに従うが、各エージェントは探索を伴わずにミオプティカルに振る舞う。このような振る舞いに対して,スターク学習の失敗を導出し,好意的な結果を提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:47:33 GMT)
Learning Universal Features for Generalizable Image Forgery Localization [53.7]
GIFL(Generalizable Image Forgery Localization)へのアプローチを提案する。我々のモデルは、目に見える偽造物と見えない偽造物の両方を検出することができ、生成AIの時代において、偽情報に対抗するためのより実践的で効率的なソリューションを提供する。本手法は,特定の偽造物の痕跡ではなく,プリスタンコンテンツから一般的な特徴を学習することに焦点を当てる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:20:29 GMT)
Scaling Laws for Native Multimodal Models Scaling Laws for Native Multimodal Models [53.5]
我々は、ネイティブマルチモーダルモデルのアーキテクチャ設計を再考し、広範なスケーリング法の研究を行う。我々の調査では、早期核融合アーキテクチャよりも後期核融合アーキテクチャに固有の利点は示されていない。また,Mixture of Experts(MoEs)を組み込むことで,モダリティ固有の重みを学習し,性能を大幅に向上できることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:57:28 GMT)
Could AI Trace and Explain the Origins of AI-Generated Images and Text? [53.1]
AI生成コンテンツは、現実の世界ではますます普及している。敵は、大規模なマルチモーダルモデルを利用して、倫理的または法的基準に違反した画像を作成するかもしれない。ペーパーレビュアーは、大きな言語モデルを誤用して、真の知的努力なしにレビューを生成する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:50:41 GMT)
From Speech to Summary: A Comprehensive Survey of Speech Summarization [53.0]
音声の要約は、音声・音声コンテンツの増加量を効率的に管理し、アクセスするために欠かせないツールとなっている。その重要性が増しているにもかかわらず、音声要約はまだ明確に定義されておらず、音声認識、テキスト要約、会議要約のような特定の応用を含むいくつかの研究領域と交差している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:50:53 GMT)
Multi-Selection for Recommendation Systems [52.6]
本稿では,レコメンデーションシステムのコンテキストにおいて,異なるプライベートクエリに応答するマルチセレクションモデルの構築について述べる。サーバは複数のレコメンデーションと'ローカルモデル'をユーザに送信し、ユーザはデバイス上でローカルに実行して、プライベート機能に最も適したアイテムを選択することができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:57:14 GMT)
Dynamic Cheatsheet: Test-Time Learning with Adaptive Memory [52.4]
Dynamic Cheatsheet(DC)は、永続的で進化するメモリを備えたブラックボックス言語モデルを提供する軽量フレームワークである。 DCは、蓄積した戦略、コードスニペット、および推論時に一般的な問題解決の洞察をモデルが保存し再利用することを可能にする。このテストタイム学習は、明確な地味なラベルや人間のフィードバックを必要とせずに、幅広いタスクのパフォーマンスを大幅に向上させる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:57:33 GMT)
Memory-efficient Streaming VideoLLMs for Real-time Procedural Video Understanding [51.9]
本稿では,リアルタイム・プロシージャ・ビデオ理解のためのエンドツーエンドフレームワークであるProVideLLMを紹介する。 ProVideLLMは、2種類のトークンを格納するように構成されたマルチモーダルキャッシュを統合する。 ProVideLLMは、これらのトークンをマルチモーダルキャッシュにインターリーブすることで、メモリと計算のサブ線形スケーリングをビデオ長で保証します。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:13:08 GMT)
Expressivity and Speech Synthesis [51.8]
われわれはこれまでの方法論の進歩を概説し、その次のレベルの人工表現性に到達するための継続的な取り組みを概説した。また、社会的な意味と、急速に進歩する表現型音声合成(ESS)技術についても論じる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:01:00 GMT)
Extending Visual Dynamics for Video-to-Music Generation [51.3]
DyViMは、ビデオから音楽への生成のための動的モデリングを強化する新しいフレームワークである。高レベルのセマンティクスは、クロスアテンションメカニズムを通じて伝達される。実験では、DyViMが最先端(SOTA)法よりも優れていることを示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:47:26 GMT)
Taming Data and Transformers for Scalable Audio Generation [49.5]
AutoReCap-XLは、4700万回以上のクリップを持つ、最大の環境オーディオテキストデータセットである。 AutoCapは高品質のオーディオキャプションモデルである。 GenAuはスケーラブルなトランスフォーマーベースのオーディオ生成アーキテクチャである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:55:02 GMT)
VideoExpert: Augmented LLM for Temporal-Sensitive Video Understanding [48.7]
VideoExpertは、複数の時間に敏感なビデオタスクに適した汎用MLLMである。時間の専門家は、時系列をモデル化し、時間的接地を行う責任を負う。空間専門家は、コンテンツの詳細分析と以下の指示に焦点を当てている。コンテンツ生成から時間的グラウンドをオフロードすることで、VideoExpertはタイムスタンプ予測におけるテキストパターンのバイアスを防ぐ。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:33:39 GMT)
VideoComp: Advancing Fine-Grained Compositional and Temporal Alignment in Video-Text Models [48.0]
VideoCompは、ビデオテキストの構成性を理解するためのベンチマークおよび学習フレームワークである。我々は,再順序付け,行動語置換,部分的字幕化,複合的ディスラプションなどの微妙な時間的破壊を伴う挑戦的な負のサンプルを作成する。これらのベンチマークは、拡張された凝集性ビデオテキストシーケンスにわたるモデルの構成感度を包括的にテストする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:41:20 GMT)
From Token to Line: Enhancing Code Generation with a Long-Term Perspective [47.0]
大規模言語モデル(LLM)は、コード生成タスクの開発を著しく促進している。本稿では,MCTS を利用した textbfLSR-MCTS アルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:03:25 GMT)
CCMNet: Leveraging Calibrated Color Correction Matrices for Cross-Camera Color Constancy [45.9]
ホワイトバランシング(ホワイトバランシング、英: white balance)は、カメラのイメージ信号プロセッサ(ISP)のキーモジュールである。本稿では、新しいカメラに再トレーニングをせずに一般化する、クロスカメラカラーコンスタンシーの学習手法を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:59:31 GMT)
SD-HuBERT: Sentence-Level Self-Distillation Induces Syllabic Organization in HuBERT [45.7]
音声の文レベル表現の学習において,音節的組織が出現することを示す。本稿では,音声の文レベル表現を評価するための新しいベンチマークタスクであるSpken Speech ABXを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:20:55 GMT)
PACER: Preference-conditioned All-terrain Costmap Generation [44.6]
本研究では,周辺地域の単一鳥眼ビュー(BEV)イメージを入力として受け入れるコストマップ生成の新しいアプローチであるPACERを紹介し,研究する。 PACERは、新しいユーザの好みに迅速に適応できると同時に、新しい地形へのより良い一般化を示すことができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:04:21 GMT)
SPIN-Bench: How Well Do LLMs Plan Strategically and Reason Socially? [44.3]
戦略計画・インタラクション・ネゴシエーション(SPIN-Bench)について SPIN-Benchは、戦略的計画と社会的推論の知性を測定するために設計された、新しいマルチドメイン評価である。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:18:36 GMT)
Multi-view Hybrid Graph Convolutional Network for Volume-to-mesh Reconstruction in Cardiovascular MRI [43.5]
画像間直接抽出のための新しいアーキテクチャであるHybridVNetを紹介する。グラフ構造として符号化することで,表面および体積メッシュを効率的に処理できることを示す。我々のモデルは、従来の畳み込みネットワークと変分グラフ生成モデル、深い監督とメッシュ固有の正規化を組み合わせたものです。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:25:45 GMT)
TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching and Clap-Ranked Preference Optimization [43.4]
我々はTangoFluxを紹介した。TangoFluxは、515Mパラメータを持つ効率的なText-to-Audio(TTA)生成モデルで、1つのA40 GPUで最大30秒44.1kHzのオーディオをわずか3.7秒で生成できる。 TTAモデルを調整する上で重要な課題は、Large Language Models (LLMs) で利用できる検証可能な報酬やゴールドスタンダードの回答のような構造化されたメカニズムを欠いているため、選好ペアを作成するのが難しいことである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:01:32 GMT)
LoRI: Reducing Cross-Task Interference in Multi-Task Low-Rank Adaptation [43.3]
Low-Rank Adaptation (LoRA)は、Large Language Models (LLMs) のためのPEFT法として人気がある。提案するLoRA with Reduced Interference (LoRI) は,プロジェクション行列をランダムなプロジェクションとして$A$を凍結し,タスク固有のマスクを用いて$B$をスパースする,単純かつ効果的な手法である。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:46:04 GMT)
A Theory of Non-Linear Feature Learning with One Gradient Step in Two-Layer Neural Networks [43.3]
機能学習は、ディープニューラルネットワークの成功の根本的な理由の1つであると考えられている。サンプルサイズとともに成長する学習率によって、このようなトレーニングが実際に複数のランクワンコンポーネントを導入していることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:26:24 GMT)
SpikeLLM: Scaling up Spiking Neural Network to Large Language Models via Saliency-based Spiking [43.3]
人間の脳は、同様のパラメータを持つ大きな言語モデルよりもはるかにエネルギー効率が高い。本稿では,最初のスパイク型大言語モデルであるSpikeLLMを提案する。 SpikeLLMは11.01%のWikiText2の複雑さを低減し、一般的なシーン推論の2.55%の精度を改善する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:50:49 GMT)
AerialVG: A Challenging Benchmark for Aerial Visual Grounding by Exploring Positional Relations [42.8]
ビジュアルグラウンドイングは、自然言語記述に基づいたイメージ内のターゲットオブジェクトのローカライズを目的としている。 AerialVGは、例えば外見に基づく接地は、複数の視覚的に類似した物体を識別するには不十分である。 5Kの空中画像,50Kの注釈付き記述,103Kのオブジェクトからなる,最初のAerialVGデータセットを紹介した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:13:00 GMT)
autrainer: A Modular and Extensible Deep Learning Toolkit for Computer Audition Tasks [42.5]
autrainerは、監査タスクのコンピュータトレーニングのためのPyTorchベースのツールキットである。本稿では,その内部動作と重要な機能について概説する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:51:44 GMT)
VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning [42.3]
本稿では,RFT(Reinforcement Fine-temporalning)による映像知覚の向上を目的とする。我々は,チャット機能を犠牲にすることなく,最先端のリアルタイムタスクを実現する強力なビデオMLLMであるVideoChat-R1を開発した。ビデオMLLMのタスク強化におけるRTTの可能性について検討した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:28:39 GMT)
7B Fully Open Source Moxin-LLM -- From Pretraining to GRPO-based Reinforcement Learning Enhancement [42.1]
Moxin 7Bは、オープンサイエンス、オープンソース、オープンデータ、オープンアクセスの原則に準拠した、完全にオープンソースのLarge Language Models (LLM) である。トレーニング済みのコードと設定、トレーニングと微調整のデータセット、中間および最終チェックポイントをリリースします。実験により, ゼロショット評価, 少数ショット評価, CoT評価など, 各種評価において, 優れた性能が得られることが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:05:16 GMT)
Embezzlement of entanglement, quantum fields, and the classification of von Neumann algebras [41.9]
我々は、フォン・ノイマン代数の設定におけるエンタングルメントの埋め込みの量子情報理論的タスクについて研究する。与えられた資源状態の性能を最悪のエラーで定量化する。我々の発見は、III型代数が自然に現れる相対論的場の量子論に影響を及ぼす。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:51:49 GMT)
Breaking the Barriers: Video Vision Transformers for Word-Level Sign Language Recognition [41.9]
手話は、聴覚障害と難聴(DHH)コミュニティのためのコミュニケーションの基本的な手段である。聴覚障害者の間で手話の流布が限られているため障壁は持続する単語レベルアメリカン手話(ASL)認識のためのビデオビジョン変換器(ViViT)モデルを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:27:25 GMT)
Optimized Multi-Token Joint Decoding with Auxiliary Model for LLM Inference [41.9]
大規模言語モデル(LLM)は様々なタスクで顕著な成功を収めた。推論プロセスは、デコードの各ステップにおける単一トーケン生成により、相当な時間とエネルギー要求によって妨げられる。 MTJD を高速化する新しいフレームワークである Multi-token Assisted Decoding (MTAD) を導入する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:35:34 GMT)
Enhancing Player Enjoyment with a Two-Tier DRL and LLM-Based Agent System for Fighting Games [41.5]
本研究では,古典的格闘ゲームStreet Fighter IIにおける2層エージェントシステムの提案と実験を行う。 TTAの第1層は、タスク指向ネットワークアーキテクチャ、モジュール化された報酬関数、および多様な技術を持つDRLエージェントを生成するためのハイブリッドトレーニングを採用している。 TTAの第2層では、プレイヤーのプレイデータとフィードバックを活用するLarge Language Model Hyper-Agentが、適切なDRL相手を動的に選択する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:38:06 GMT)
Adversarial Subspace Generation for Outlier Detection in High-Dimensional Data [41.1]
マルチビュー効果を数学的に定式化する新しい理論フレームワークであるMyopic Subspace Theory (MST)を紹介する。 MSTに基づいて、このような最適化問題を解決するために訓練された生成法であるV-GANを導入する。 42の実世界のデータセットに対する実験により、V-GANの使用は1クラスの分類性能を大幅に向上させることが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:40:02 GMT)
Multi-modal Reference Learning for Fine-grained Text-to-Image Retrieval [40.9]
きめ細かいテキスト・ツー・イメージ検索は、与えられたテキストクエリーできめ細かいターゲット画像を取得することを目的としている。既存の手法では、各トレーニングイメージがテキスト記述によって正確に描写されていると仮定する。頑健な表現を学習するためのマルチモーダル参照学習フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:09:52 GMT)
An Empirical Study of GPT-4o Image Generation Capabilities [40.9]
我々は、GPT-4oの画像生成能力について実証的研究を行い、主要なオープンソースおよび商用モデルと比較した。本分析では, GPT-4oの強度と限界を様々な条件下で強調し, GPT-4oを生成モデリングのより広範な進化に導いてくれる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:02:00 GMT)
Dualformer: Controllable Fast and Slow Thinking by Learning with Randomized Reasoning Traces [40.1]
人間の思考は、システム1とシステム2の2つのシステムによって管理されている。近年, System 2 プロセスを Transformer に組み込むことで推論能力が大きく向上することが報告されている。高速かつ低速な推論モードをシームレスに統合する単一トランスフォーマーモデルであるDualformerを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:46:07 GMT)
How to Detect and Defeat Molecular Mirage: A Metric-Driven Benchmark for Hallucination in LLM-based Molecular Comprehension [40.1]
大規模言語モデルは、特に分子理解と解析のために、科学領域でますます使われている。既存のモデルは幻覚の問題の影響を受けており、薬物設計と利用の誤りをもたらす。まず,分子理解タスク,特にPubChemデータセットに見られる知識ショートカット現象に対するLLMの幻覚源の分析を行った。 bfMol-Halluは、生成したテキストと実際の分子特性の間の科学的関係に基づいて幻覚の度合いを定量化する新しいフリーフォーム評価指標である。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:19:02 GMT)
SFT or RL? An Early Investigation into Training R1-Like Reasoning Large Vision-Language Models [39.6]
本研究は、LVLM(Large Vision-Language Models)のトレーニングにおいて、支配的な教師付き微調整(SFT)、強化学習(RL)パラダイムを再考する。 SFTは、専門家モデルから模倣された擬似推論経路を誘導することにより、その後のRLを著しく損なう可能性があることを示す。我々は,LVLMにおける推論を支援するために設計された,新しいマルチモーダルデータセットであるVLAA-Thinkingを紹介する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:54:05 GMT)
Learning Fine-grained Domain Generalization via Hyperbolic State Space Hallucination [39.0]
きめ細かいドメイン一般化(FGDG)は、未確認のターゲットドメインに十分に一般化可能なきめ細かい表現を学習することを目的としている。本稿では,ハイパボリック・ステート・スペース・ハロシン化法(HSSH)を提案する。 3つのFGDGベンチマークの実験は、最先端のパフォーマンスを示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:30:39 GMT)
AI-Slop to AI-Polish? Aligning Language Models through Edit-Based Writing Rewards and Test-time Computation [39.0]
我々は、AI生成テキストの書字品質の評価と改善について研究する。まず、5つの書評データセットを4,729の書評判断に集約することで、書評品質ベンチマーク(WQ)を導入する。次に、書字品質評価のために、様々なサイズの書字品質リワードモデル(WQRM)を訓練する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:58:05 GMT)
PixelFlow: Pixel-Space Generative Models with Flow [39.0]
我々は、生のピクセル空間で直接動作する画像生成モデルのファミリーであるPixelFlowを紹介する。このアプローチは、事前訓練された変分オートエンコーダを不要にすることで、画像生成プロセスを単純化する。この新たなパラダイムが、次世代のビジュアル生成モデルに新たな機会を与え、開放することを期待しています。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:59:56 GMT)
DiffusionDrive: Truncated Diffusion Model for End-to-End Autonomous Driving [38.9]
拡散モデルは、ロボット政策学習の強力な生成技術として登場した。本稿では,従来のマルチモードアンカーを取り入れ,拡散スケジュールを切り離す,新たな切り離された拡散ポリシーを提案する。提案したモデルであるDiffusionDriveは、バニラ拡散ポリシーと比較して10ドル程度のデノナイジングステップの削減を実証している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:48:37 GMT)
SGFormer: Satellite-Ground Fusion for 3D Semantic Scene Completion [38.9]
本稿では,SGFormer という衛星地上協調型 SSC フレームワークについて述べる。衛星と地上のビューを並列に符号化し、それらを共通領域に統一するデュアルブランチアーキテクチャを提案する。衛星と地上からのコントリビューションのバランスをとるための適応重み付け戦略を開発する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:47:41 GMT)
Towards Distribution Matching between Collaborative and Language Spaces for Generative Recommendation [38.5]
ジェネレーティブレコメンデーションは、ユーザのためのレコメンデーションを生成するために、アイテムセット全体を通して、基礎となるジェネレーティブプロセスを学ぶことを目的としている。本研究ではDMRecと呼ばれるモデルに依存しない生成レコメンデーションフレームワークを提案し,ユーザインタラクションによってLMの出力をブリッジする確率的メタネットワークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:09:30 GMT)
HarmonySeg: Tubular Structure Segmentation with Deep-Shallow Feature Fusion and Growth-Suppression Balanced Loss [37.8]
我々はHarmonySegという新しい管状構造セグメンテーションフレームワークを提案する。まず、様々な受容場を持つ柔軟な畳み込みブロックを備えたディープ・ツー・シャロー・デコーダネットワークを設計する。第2に, 解剖学的領域を強調し, 小さな管状構造のリコールを改善するために, 血管性マップを組み込んだ。第3に, 管状構造物の成長と抑制のバランスをとるために, 文脈と形状の先行性を活用するトポロジー保存損失関数を導入する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:04:42 GMT)
SAFARI: a Scalable Air-gapped Framework for Automated Ransomware Investigation [37.8]
SAFARIは、安全で効率的なランサムウェア分析のために設計されたオープンソースのフレームワークである。概念実証実装を構築し、それを用いて2つのケーススタディを実行することで、SAFARIの能力を実証する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:44:13 GMT)
Dissipation and non-thermal states in cryogenic cavities [37.7]
室温環境に囲まれた低温鏡で作製した低温キャビティ中の光子の特性について検討した。リンドブラッドマスター方程式を用いて、キャビティモードの光子分布と統計的性質を導出する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:50:54 GMT)
Trading Graph Neural Network [37.6]
本稿では,TGNN(Trding Graph Neural Network)という新しいアルゴリズムを提案する。 TGNNは、トレーディングネットワークにおける資産的特徴、ディーラー的特徴、および関係的特徴が資産価格に与える影響を構造的に推定することができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:40:31 GMT)
The nature of loops in programming [37.5]
プログラムのセマンティクスと検証では、ループに関する推論は2つの異なる数学的引数を生成する必要があるため複雑である。単一かつ単純な定義が可能で、この分割を取り除くことができる。ループが正しいことを証明するには、不変量と不変量を考案する必要はない。関係を識別するのに十分であり、部分的正当性と終了の両方をもたらす。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:58:55 GMT)
Defense against Prompt Injection Attacks via Mixture of Encodings [36.6]
大規模言語モデル(LLM)は、幅広いNLPタスクにおいて支配的なアプローチとして現れてきた。 LLMはプロンプトインジェクション攻撃と呼ばれる新たな脆弱性を導入し、外部コンテンツは悪意のある命令を埋め込む。近年、Base64防衛は、インジェクション攻撃の成功率を下げる最も効果的な方法の1つとして認識されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:35:21 GMT)
Towards Combinatorial Interpretability of Neural Computation [36.5]
本稿では,ネットワークの重みとバイアスのシグネチャベース分類における計算構造を解析し,ニューラルネットワークを理解する手法である解釈可能性を紹介する。ニューラルネットワークがブール表現をどう計算するかを説明する理論であるフィーチャーチャネルコーディングを通じて、そのパワーを実証する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:28:16 GMT)
Teaching Humans Subtle Differences with DIFFusion [36.3]
専門分野におけるニュアンス付きカテゴリを区別する方法を初心者に教える新しい手法を提案する。本手法では,クラス間の遷移の最小限の変化を可視化するために生成モデルを用いる。 6つの領域にわたる実験は、限られた例や欠席例であっても正確な遷移を示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:04:22 GMT)
EntityCLIP: Entity-Centric Image-Text Matching via Multimodal Attentive Contrastive Learning [35.9]
本稿では,textbfEntity中心の textbfImage-textbfText textbfMatching (EITM) 問題について検討する。このタスクの課題は、主にエンティティ・アソシエーション・モデリングにおける大きなセマンティック・ギャップにある。我々は,EITM問題に適応するマルチモーダル注意型コントラスト学習フレームワークを考案し,EntityCLIPというモデルを開発した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:23:37 GMT)
The AI Risk Repository: A Comprehensive Meta-Review, Database, and Taxonomy of Risks From Artificial Intelligence [35.8]
人工知能(AI)によって引き起こされるリスクは、学者、監査人、政策立案者、AI企業、そして一般大衆にかなり懸念されている。 AIリスクに対する共通理解の欠如は、包括的に議論し、研究し、それに反応する能力を妨げる可能性がある。本稿では、共通の参照フレームとして機能するAIリスクリポジトリを作成することで、このギャップに対処する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:14:02 GMT)
Learning convolution operators on compact Abelian groups [35.7]
コンパクトなアベリア群に関連する畳み込み作用素の学習問題を考察する。正規化に基づく手法を研究し、自然正規化条件下での学習保証を提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:30:02 GMT)
Redefining Machine Translation on Social Network Services with Large Language Models [35.5]
本稿では,SNS翻訳に適した72B LLMであるRedTransを紹介する。 RedTransは、3つのイノベーションを通じて開発された新しいデータセットでトレーニングされている。実験では、RedTransは最先端のLLMよりも優れています。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:24:28 GMT)
nnLandmark: A Self-Configuring Method for 3D Medical Landmark Detection [35.4]
この研究は3D医療ランドマーク検出のための自己構成型ディープラーニングフレームワークであるnnLandmarkを紹介している。 nnLandmarkは手動のパラメータチューニングの必要性を排除し、アウト・オブ・ボックスのユーザビリティを提供する。下顎臼歯部CTデータセット(MML)に1.5mmの放射平均誤差(MRE)、脳MRIデータセット(AFIDs)に1.2mmの解剖学的画像を含む2つの公的データセットにまたがる最先端の精度を実現する。 nnLandmarkは、3Dランドマーク検出のための信頼性の高いベースラインを確立し、解剖学的局在の研究を支援している
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:04:29 GMT)
Towards Micro-Action Recognition with Limited Annotations: An Asynchronous Pseudo Labeling and Training Approach [35.3]
本稿では,SSMAR(Semi-Supervised MAR)の設定について紹介する。従来のSemi-Supervised Learning(SSL)メソッドは、不正確な擬似ラベルに過度に適合する傾向があり、エラーの蓄積と性能の低下につながる。擬似ラベル作成プロセスとモデルトレーニングを明確に分離する非同期擬似ラベル作成訓練(APLT)を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:22:15 GMT)
Why We Feel: Breaking Boundaries in Emotional Reasoning with Multimodal Large Language Models [35.2]
感情の反応を駆動する因果的要因に着目した感情解釈(EI)を提案する。従来の感情認識とは異なり、EIタスクは単なるラベル付けではなくトリガーについての推論を必要とする。 EIBenchは1,615の基本的なEIサンプルと50の複雑なEIサンプルを含む大規模なベンチマークである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:33:49 GMT)
Defending LLM Watermarking Against Spoofing Attacks with Contrastive Representation Learning [34.8]
ピギーバック攻撃は、元々の透かしを保ったままのヘイトスピーチに変換する透かしテキストの意味を悪意的に変更することができる。そこで本稿では,元来の意味を保ちつつ,与えられた目標テキストに透かしを埋め込む意味認識型透かしアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:23:40 GMT)
Prototypical Calibrating Ambiguous Samples for Micro-Action Recognition [34.4]
MAR(Micro-Action Recognition)は、社会的相互作用における非言語コミュニケーションの一形態として重要な役割を担っているため、注目を集めている。現在のアプローチは、広範囲のカテゴリ範囲と微妙な視覚的差異から生じる、マイクロアクションの固有のあいまいさをしばしば見落としている。我々は,MARのあいまいさを解消し緩和するための,新しいプロトタイプキャリブレーション・アンビグラス・ネットワーク(PCAN)を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:13:15 GMT)
Detect Anything 3D in the Wild [34.3]
DetAny3Dは任意のカメラ構成で新しい物体を検知できる3D検出基盤モデルである。 2D知識を3Dに効果的に転送するために、DetAny3Dは2DアグリゲータとZero-Embedding Mappingによる3Dインタプリタという2つのコアモジュールを組み込んでいる。 DetAny3Dは、未確認のカテゴリや新しいカメラ構成の最先端性能を実現する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:59:22 GMT)
Route Sparse Autoencoder to Interpret Large Language Models [33.4]
Route Sparse Autoencoder (RouteSAE) は、ルーティングメカニズムを共有SAEと統合し、複数のレイヤから機能を効率的に抽出するフレームワークである。 64の空間的制約の下では、RouteSAEはベースラインSAEよりも22.5%高い特徴を抽出し、22.3%高い解釈可能性スコアを達成している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:58:01 GMT)
Can LLMs Help Uncover Insights about LLMs? A Large-Scale, Evolving Literature Analysis of Frontier LLMs [32.5]
本研究では,LLMを用いたデータ抽出を高速化する文献解析のための半自動手法を提案する。関連するarXiv論文を自動的に識別し、実験結果と関連する属性を抽出し、構造化データセットLLMEvalDBに編成する。次に、フロンティアLCMの自動文献解析を行い、手動によるアプローチと比較して、紙調査とデータ抽出の労力を93%以上削減する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:47:50 GMT)
Continual Text-to-Video Retrieval with Frame Fusion and Task-Aware Routing [31.9]
本稿では,既存のアプローチの限界に対処するため,CTVR(Continuous Text-to-Video Retrieval)の最初のベンチマークを紹介する。本稿では、2つの重要なコンポーネントからなる新しいCTVRフレームワークであるFrameFusionMoEを提案する。 FrameFusionMoEは、歴史的テキスト・ビデオ関連性を保ちながら、新しいビデオコンテンツへの効果的な適応を可能にし、破滅的な忘れを緩和する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:20:25 GMT)
Balancing Act: Distribution-Guided Debiasing in Diffusion Models [31.4]
拡散モデル(DM)は、前例のない画像生成能力を持つ強力な生成モデルとして登場した。 DMはトレーニングデータセットに存在するバイアスを反映します。本稿では、追加データやモデル再学習に頼ることなく、DMをデバイアスする手法を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:39:59 GMT)
L0-Reasoning Bench: Evaluating Procedural Correctness in Language Models via Simple Program Execution [31.2]
複雑な推論タスクは、インクリメンタルなステップで単純なルールを一貫して正確に適用する能力に依存していることが多い。手続き的正確性をテストするための言語モデルベンチマークであるL0-Benchを紹介する。 L0-Benchはステップバイステップでエラーのない実行トレースを生成する能力に基づいてモデルをグレードする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:45:37 GMT)
Copy-and-Paste? Identifying EVM-Inequivalent Code Smells in Multi-chain Reuse Contracts [30.9]
より多くの開発者が、他の互換性のあるブロックチェーン上でSolidityコントラクトを再利用している。この矛盾は、再利用されたコントラクトの設計上の欠陥を明らかにし、コードの再利用を妨げているコードの臭いを露呈する。本稿では,EVM非等価コードスメルの原因と特徴を明らかにするために,最初の実証的研究を行った。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:37:19 GMT)
Hyperbolic Diffusion Recommender Model [30.8]
レコメンデーターシステムでは、アイテムは画像にあまり普及しない異方性と方向の異なる構造を示すことが多い。本稿では,ユーザやアイテムに特化して調整された,新しい双曲型潜伏拡散プロセスを提案する。 3つのベンチマークデータセットの実験では、HDRMの有効性が示されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:02:56 GMT)
Learning Affine Correspondences by Integrating Geometric Constraints [30.7]
本稿では, 密マッチングと幾何制約を統合することで, 正確なアフィン対応を抽出するパイプラインを提案する。具体的には、密マッチングと新しいキーポイントスケールと向き推定器の助けを借りて、新しい抽出フレームワークを導入する。実験により,提案手法の精度とロバスト性は,画像マッチングタスクにおいて既存の手法よりも優れていることが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:40:31 GMT)
Learning the Distribution Map in Reverse Causal Performative Prediction [29.9]
データから分布シフトを学習するための新しいアプローチを導入する。提案手法は逆因果モデルに基づいて予測され, 予測モデルでは, エージェントの作用の有限セットを通してのみ分布シフトを導出する。本フレームワークでは,エージェントの行動にマイクロファウンデーションモデルを適用し,分布シフトマップを学習するための統計的に正当化された方法論を開発する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 22:04:17 GMT)
Self-Bootstrapping for Versatile Test-Time Adaptation [29.6]
我々は様々なタスクに対して多目的なテスト時間適応(TTA)の目標を策定する。テスト画像(ターゲット)と劣化したビューとの予測一貫性を最適化する自己ブートストラップ方式によりこれを実現できる。実験により, 独立に, あるいはプラグアンドプレイモジュールとして, 分類, セグメンテーション, 3次元単分子検出タスクにおいて, 優れた結果が得られることが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:45:07 GMT)
VLM-R1: A Stable and Generalizable R1-style Large Vision-Language Model [29.5]
最近、DeepSeek R1は、強化学習が大規模言語モデル(LLM)の推論能力を大幅に改善できることを示した。視覚言語モデル(VLM)へのR1型強化学習の拡張について検討する。 VLM-R1 は,汎用視覚言語タスクにおける VLM の性能向上のために RL を利用した専用フレームワークである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:05:15 GMT)
Large Language Model for Verilog Generation with Code-Structure-Guided Reinforcement Learning [29.1]
本稿では、強化学習によって強化されたLLMであるVeriSeekを紹介し、高いVerilogコード生成性能を実現する。我々の強化学習アプローチでは、事前学習されたモデルを洗練するためのフィードバック信号として、コード構造情報を用いる。実験によると、VeriSeekは複数のベンチマークで最先端のメソッドよりも優れています。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:15:17 GMT)
Genetic Programming with Reinforcement Learning Trained Transformer for Real-World Dynamic Scheduling Problems [29.0]
本稿では,GPRT(Reinforcement Learning)を用いて学習したトランスフォーマーと遺伝的プログラミング(GP)を組み合わせた革新的なアプローチを提案する。 GPRTは動的スケジューリングシナリオの複雑さに対処するように設計されている。この統合アプローチの有効性は,コンテナターミナルトラックスケジューリングの実用化を通じて実証される。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:18:22 GMT)
My Precious Crash Data: Barriers and Opportunities in Encouraging Autonomous Driving Companies to Share Safety-Critical Data [28.8]
事故や準クラッシュ記録のような安全に重要なデータは、自動運転車の設計と開発を改善するために不可欠である。本稿は、AV企業が外部から安全クリティカルなデータを共有するのに消極的である理由を明らかにすることを目的としている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:11:07 GMT)
Understanding Contrastive Representation Learning from Positive Unlabeled (PU) Data [28.7]
本稿では,少数のラベル付き正のセットと大きなラベル付きプールのみを利用できる,正のラベル付き学習(PU)の課題について検討する。比較対象を減少させる非バイアスで分散した正の非ラベル型コントラスト学習(puCL)を導入する。本稿では, 未ラベルのサンプルをソフトな正の混合物として再重み付けする, 事前認識型拡張である Positive Unlabeled InfoNCE (puNCE) を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:41:06 GMT)
Deep Learning-based Intrusion Detection Systems: A Survey [28.4]
侵入検知システム(IDS)は長い間、サイバーセキュリティコミュニティでホットな話題だった。ディープラーニング(DL)技術の導入により、IDSは一般化可能性の向上により大きな進歩を遂げた。この調査は、データ収集、ログストレージ、ログ解析、グラフ要約、攻撃検出、攻撃調査など、DL-IDSの全ステージを体系的にレビューする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:18:56 GMT)
DGFamba: Learning Flow Factorized State Space for Visual Domain Generalization [27.9]
視覚領域一般化のための新しいフローファクトリズステートスペースモデルDG-Fambaを提案する。ドメインの整合性を維持するために,フローの分解によるスタイル拡張と元の状態の埋め込みを革新的にマッピングする。様々な視覚領域の一般化設定で行われた実験は、その最先端性能を示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:24:53 GMT)
ChartQAPro: A More Diverse and Challenging Benchmark for Chart Question Answering [27.6]
新しいベンチマークであるChartQAProを紹介した。これは157のさまざまなソースから1,341のチャートを含み、さまざまなチャートタイプにまたがっている。 21モデルによる評価は,ChartQAPro上でのLVLMの性能低下を示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:10:05 GMT)
STeP: A General and Scalable Framework for Solving Video Inverse Problems with Spatiotemporal Diffusion Priors [27.5]
本研究では,拡散モデルを用いたビデオにおける一般的な逆問題の解法について検討する。ビデオ逆問題を解決するための汎用的でスケーラブルなフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:24:26 GMT)
APSQ: Additive Partial Sum Quantization with Algorithm-Hardware Co-Design [27.1]
本研究は,PSUM蓄積を量子化フレームワークにシームレスに統合した新しい部分和量子化法(APSQ)を提案する。 APSQとPSUM量子化を組み合わせたグループ化戦略を提案する。 LLaMA2-7Bの実験は、大規模言語モデルにおけるAPSQの可能性を示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:45:17 GMT)
Synthesizing High-Quality Programming Tasks with LLM-based Expert and Student Agents [26.9]
PyTaskSynは、プログラミングタスクを最初に生成し、学生に与えられる特定の品質基準を満たすかどうかを決定する新しい合成技術である。 PyTaskSynはベースライン技術と比較してタスク品質を著しく改善し、検証パイプラインにおける各エージェントタイプの重要性を示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:08:39 GMT)
Toward a Theory of Tokenization in LLMs [26.5]
本稿では, 簡単なデータ生成プロセスにおいて, 変圧器の挙動を研究することによって, 理論的観点からトークン化について検討する。変換器によって学習された最も単純なユニグラムモデルでさえ、$ktextth$-order Markovソースから引き出されたシーケンスの確率を最適にモデル化できることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:00:58 GMT)
Microfoundation Inference for Strategic Prediction [26.3]
本稿では,人口に対する予測モデルの長期的影響をカプセル化した分布図の学習手法を提案する。具体的には,エージェントの応答をコストユーティリティ問題としてモデル化し,そのコストを見積もる。本稿では,この推定値の収束率と,クレジット・スコアリング・データセットの実証実験による品質評価について述べる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:42:32 GMT)
Marconi: Prefix Caching for the Era of Hybrid LLMs [26.3]
本稿では,Hybrid LLMを用いた効率的なプレフィックスキャッシングをサポートする最初のシステムであるMarconiを紹介する。多様なワークロードとハイブリッドモデルにまたがって、Marconiは最大34.4$times$高いトークンヒットレートを達成した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:06:29 GMT)
Novel Diffusion Models for Multimodal 3D Hand Trajectory Prediction [26.2]
マルチモーダル3次元ハンドトラジェクトリ予測のための新しい拡散モデル(MMTwin)を提案する。 MMTwinは、2D RGBイメージ、3Dポイントクラウド、パスハンドウェイポイント、テキストプロンプトを含む入力としてマルチモーダル情報を吸収するように設計されている。 2つの潜伏拡散モデル、すなわち、双生児としての自走拡散とHTP拡散をMMTwinに統合し、カメラの自走と将来のハンドトラジェクトリを同時に予測する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:29:50 GMT)
GOLD: Graph Out-of-Distribution Detection via Implicit Adversarial Latent Generation [26.1]
アウト・オブ・ディストリビューション(OOD)テストインスタンスは、グラフニューラルネットワーク(GNN)にとって依然として大きな課題である。本稿では,OOD検出のためのGOLDフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:41:23 GMT)
Diffusion Transformers for Tabular Data Time Series Generation [26.0]
本稿では,Diffusion Transformer (DiT) を用いたデータ系列生成手法を提案する。画像およびビデオ生成における最近のDiTsの成功に触発されて、このフレームワークは異種データを扱うように拡張されている。 6つのデータセットに対する広範な実験により,提案手法が従来の手法よりも大きなマージンで優れていることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:56:09 GMT)
Robust Hallucination Detection in LLMs via Adaptive Token Selection [25.2]
大きな言語モデル(LLM)の幻覚は、より広範なデプロイメントを妨げる重要な安全性上の懸念を引き起こす。本研究では,適応的選択とクリティカルトークンの学習を通じて,幻覚の堅牢な検出を可能にする新しいアプローチであるHaMIを提案する。本研究では,ハロシン化検出タスクの革新的な定式化により,このロバスト性を実現する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:39:10 GMT)
FAST: Federated Active Learning with Foundation Models for Communication-efficient Sampling and Training [25.0]
Federated Active Learning (FAL)は、分散クライアント間で大量のラベル付けされていないデータを活用するための、有望なフレームワークとして登場した。本稿では,アノテータの最小限の労力で,ループ学習におけるコミュニケーションコストを削減するためのベストプラクティスについて述べる。予備パスで弱ラベル付けのための基礎モデルを利用する2パスFALフレームワークであるFASTと、最も不確実なサンプルにのみ焦点を絞った改良パスを紹介する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:42:57 GMT)
Refining Answer Distributions for Improved Large Language Model Reasoning [24.7]
本稿では,Large Language Models (LLMs) の推論能力を高めるための,新しいアルゴリズムフレームワークであるRefined Answer Distributionsを提案する。我々のアプローチは、モンテカルロ近似(英語版)を形成するための反復的なサンプリング戦略と見なすことができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:11:49 GMT)
Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models [24.6]
クラスタ駆動のExpert Pruning(C-Prune)は、大規模言語モデルの適応的なタスク固有圧縮のための新しい2段階のフレームワークである。 C-Pruneはレイヤワイドの専門家クラスタリングを通じて動作し、各MoE層内で機能的に類似した専門家をグループ化する。複数のMoEモデルとベンチマークの広範な実験を通じてC-Pruneを検証する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:46:26 GMT)
MonoPlace3D: Learning 3D-Aware Object Placement for 3D Monocular Detection [24.6]
現在のモノクラー3D検出器は、現実世界のデータセットの多様性とスケールに制限されている。物体の位置や位置は、有効な3次元単分子検出器の訓練に必要不可欠であることを示す。現実的な拡張を実現するために,3Dシーンコンテンツを考慮した新しいシステムであるMonoPlace3Dを紹介する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:03:02 GMT)
Privacy-Preserving Vertical K-Means Clustering [24.6]
クラスタリングは、1つ以上の機能に基づいたレコードのグループ化に使用される基本的なデータ処理タスクである。我々は、O(n+kt)への通信複雑性を低減し、同相暗号とDPに基づく新しい解を提案する。我々のソリューションは、73MBの通信で10万の2次元点を5つのクラスタにクラスタリングし、既存の作業では101GB、100Mbpsのネットワークでは3分弱で完了した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:20:56 GMT)
Compass Control: Multi Object Orientation Control for Text-to-Image Generation [24.4]
テキストと画像の拡散モデルを制御する既存のアプローチは、強力ではあるが、明示的な3Dオブジェクト中心制御を許さない。テキスト・画像拡散モデルにおける多目的方向制御の問題に対処する。これにより、各オブジェクトに対して正確な向き制御を備えた多様なマルチオブジェクトシーンを生成することができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:59:11 GMT)
SeCap: Self-Calibrating and Adaptive Prompts for Cross-view Person Re-Identification in Aerial-Ground Networks [24.4]
AGPReIDタスクのためのSeCap(Se-Calibrating and Adaptive Prompt)メソッドの設計と実装を行う。 SeCap は Prompt Re-calibration Module (PRM) に依存しており、入力に基づいてプロンプトを適応的に再校正する。さらに,LAGPeRとG2APS-ReIDの2つの実世界の空中人物再収集データセットをコントリビュートする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:26:27 GMT)
SF2T: Self-supervised Fragment Finetuning of Video-LLMs for Fine-Grained Understanding [24.0]
ビデオベースのLarge Language Models (VideoVid-LLMs) は近年大きく進歩している。彼らは細かな理解に苦しむが、特に視覚力学やビデオの詳細などの側面においてである。これらの欠点に対処するため、自己監督的断片化タスクにおける細調整ビデオLLMは、そのきめ細かい映像理解能力を大幅に向上させる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:40:34 GMT)
ColorBench: Can VLMs See and Understand the Colorful World? A Comprehensive Benchmark for Color Perception, Reasoning, and Robustness [23.9]
視覚言語モデル(VLM)が人間の色を知覚し、理解し、活用できるかどうかは不明である。本稿では,色理解におけるVLMの性能を評価するベンチマークであるColorBenchを紹介する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:36:26 GMT)
HoloPart: Generative 3D Part Amodal Segmentation [23.8]
3D部分のアモーダルセグメンテーションは難しいが、3Dコンテンツの作成と理解にとって重要な課題だ。 2Dアモーダルセグメンテーションにインスパイアされたこの新しいタスクを3Dドメインに導入し、実用的な2段階のアプローチを提案する。我々は,ABOおよびPart-Tinyデータセットに基づく新しいベンチマークを導入し,HoloPartが最先端の形状補完法を大幅に上回っていることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:53:31 GMT)
Block Verification Accelerates Speculative Decoding [23.8]
投機的復号法は高速モデルを用いて、ターゲットモデルによって並列に検証されるトークンのブロックをドラフトする。以前の作業では、ドラフト検証は独立してトークン・バイ・トークンで行われる。ブロック全体を共同で検証する単純なドラフト検証アルゴリズムであるBlock Verificationを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:06:39 GMT)
Has the Creativity of Large-Language Models peaked? An analysis of inter- and intra-LLM variability [23.5]
実証された2つのクリエイティビティ・アセスメントにおいて,広く使用されている大規模言語モデル(LLM)を14種類評価した。予想とは対照的に、過去18～24ヶ月でクリエイティブなパフォーマンスが向上した証拠は見つからなかった。同じプロンプトを与えられたLLMは、平均以下からオリジナルまで、アウトプットを生成できる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:18:56 GMT)
Dreamweaver: Learning Compositional World Models from Pixels [23.0]
人間は自然に世界の知覚を物体とその属性に分解する能力を持っている。この認知的プロセスは、慣れ親しんだ概念を再結合することで、新しい未来を想像することができる。生のビデオから階層的および構成的表現を発見するために設計されたニューラルネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:12:34 GMT)
Emergence of psychopathological computations in large language models [22.8]
本研究では,大規模言語モデルに適用可能な心理病理の考察を行うための計算理論フレームワークを提案する。我々の研究は、近未来の精神病理学的行動を持つAIシステムの可能性について言及している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:36:30 GMT)
GLUS: Global-Local Reasoning Unified into A Single Large Language Model for Video Segmentation [22.8]
本稿では、ビデオオブジェクトセグメンテーション(RefVOS)の参照にMLLM(Multi-modal large language model)を利用する新しいフレームワークを提案する。本フレームワークは,グローバルかつ局所的な一貫性を単一のビデオセグメンテーションMLLMに統合可能であることを示す。 MLLMの限られたコンテキストウィンドウ内での情報効率を向上させるために,ハード偽陽性オブジェクトを識別するためのオブジェクトコントラスト学習を導入する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:59:55 GMT)
Apt-Serve: Adaptive Request Scheduling on Hybrid Cache for Scalable LLM Inference Serving [22.7]
Apt-Serveは、大規模言語モデル(LLM)推論サービスシステムにおける効果的なスループットを高めるために設計されたフレームワークである。新たなハイブリッドキャッシュスキームでは、KVキャッシュとメモリ効率の高い隠れキャッシュを組み合わせることで、再利用可能な入力隠れ状態ベクタを実現し、バッチサイズを大きくし、要求を改善する。 Apt-Serveは,最先端の推論サービスシステムと比較して,スループットが最大8.8倍向上することを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:51:23 GMT)
An Adversarial Perspective on Machine Unlearning for AI Safety [22.6]
この作業は、アンラーニングと従来のトレーニング後の安全性の根本的な違いに挑戦する。既存のjailbreakメソッドは、これまで未学習に対して効果がないと報告されていたが、慎重に適用した場合に成功できることを実証する。例えば、アクティベーション空間における10の無関係な例を微調整したり、特定の方向を除去することで、RMUで編集されたモデルに対して最も危険な能力を回復できることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:54:44 GMT)
VCR-Bench: A Comprehensive Evaluation Framework for Video Chain-of-Thought Reasoning [22.4]
Chain-of-Thought (CoT)推論は、大規模言語モデル(LLM)と大規模視覚言語モデル(LVLM)の機能を大幅に向上させた。 VCR-Benchは,LVLMのビデオ・チェーン・オブ・ソート・リ推論機能を包括的に評価する新しいベンチマークである。 VCR-Benchは、さまざまなビデオコンテンツと期間にまたがる859の動画と、1,034の高品質な質問応答ペアで構成されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:59:03 GMT)
CLIP meets DINO for Tuning Zero-Shot Classifier using Unlabeled Image Collections [22.3]
ラベル付き画像を用いたCLIPに基づく画像分類性能を向上させるためのラベルフリーなプロンプトチューニング手法を提案する。当社のフレームワークであるNoLA(No Labels Attached)は,最先端のLaFTerよりも平均3.6%向上しています。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:09:41 GMT)
Understanding and Mitigating the Bias in Sample Selection for Learning with Noisy Labels [22.2]
サンプル選択におけるバイアス学習のためのnoIse-Tolerant Expert Model (ITEM)を提案する。具体的には、トレーニングバイアスを軽減するために、複数の専門家と統合した堅牢なネットワークアーキテクチャを設計します。 2つのクラス識別型ミニバッチの混合によるトレーニングにより、モデルが不均衡なトレーニングセットの効果を緩和する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:13:42 GMT)
Anytime Single-Step MAPF Planning with Anytime PIBT [22.0]
PIBTと同一のワンステップ解を素早く発見し,任意の方法で連続的に改善するAnytime PIBTを開発した。我々は、任意のPIBTがミリ秒以内の単一ステップソリューションの品質を迅速に向上し、最適な単一ステップアクションを見つけることができることを実験的に検証した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:21:23 GMT)
Token Level Routing Inference System for Edge Devices [21.7]
本稿では,クラウドベースの大規模モデルから重要なトークン生成を選択的に参照しながら,小型モデルでデバイス上での推論を可能にする,新しい協調型復号推論システムを提案する。注目すべきは、M1 MacBook上で0.5Bモデルのみを使用してCommonsenseQAのパフォーマンスを60%向上させ、クラウドの大規模モデルにアップロードされるトークン生成の7%以下であることだ。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:54:19 GMT)
Efficient Tuning of Large Language Models for Knowledge-Grounded Dialogue Generation [21.5]
KEDiTは、知識基底対話生成のための大規模言語モデルを微調整する効率的な方法である。まず、検索した知識を学習可能なパラメータに圧縮するために情報ボトルネックを使用し、計算オーバーヘッドを最小限に抑えながら重要な情報を保持する。ウィキペディアのウィザードと新しく構築されたPubMed-Dialogデータセットの実験結果は、KEDiTが文脈的に関連があり、情報的な応答を生成するのに優れていることを示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:54:36 GMT)
C3PO: Critical-Layer, Core-Expert, Collaborative Pathway Optimization for Test-Time Expert Re-Mixing [21.1]
Mixture-of-Experts (MoE) Large Language Models (LLMs) は、高度に最適化されたエキスパートパスに苦しむ。プレトレーニングから学んだナイーブな専門家選択は、改善のための驚くべき10～20%の精度ギャップを残します。テストサンプル毎に異なるレイヤのエキスパートを共同で再重み付けあるいは「再混合」するための新しいテスト時間最適化手法を開発する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:59:56 GMT)
Distillation of Discrete Diffusion through Dimensional Correlations [21.1]
「ミクチャー」モデルは、拡張性を維持しながら次元相関を扱える。損失関数により、混合モデルは、次元相関を学習することで、そのような多くのステップの従来のモデルをほんの数ステップに蒸留することができる。その結果、画像領域と言語領域をまたいだ事前学習した離散拡散モデルの蒸留における提案手法の有効性が示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:40:46 GMT)
Capybara-OMNI: An Efficient Paradigm for Building Omni-Modal Language Models [20.4]
カピバラオミニ(Capybara-OMNI)は、MLLMの軽量で効率的な運転方法である。フレームワーク設計、データ構築、およびトレーニングレシピの詳細を提示する。以上の結果から,競争性能を向上するMLLMを効率的に構築できることが示唆された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:08:53 GMT)
AgentAda: Skill-Adaptive Data Analytics for Tailored Insight Discovery [20.3]
我々はAgentAdaを紹介した。AgentAdaは、新しい分析スキルを学び、利用して、より専門的な洞察を引き出すことができる最初の分析エージェントだ。ユーザーがどのデータ分析方法を適用するかを手動で決める既存の方法とは異なり、AgentAdaは分析を行うために必要なスキルを自動的に識別する。我々は、AgentAdaが既存のツールよりも洞察に富んだ分析を提供しており、48.78%が分析を好み、27.67%は未熟練のエージェントであることを示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:27:25 GMT)
Boosting Universal LLM Reward Design through the Heuristic Reward Observation Space Evolution [20.2]
自動強化学習のための有望なツールとして,大規模言語モデル(LLM)が登場している。本稿では,リワード観測空間を進化させることにより,LLM駆動型報酬設計を向上する新しいフレームワークを提案する。本フレームワークでは,環境状態の履歴的使用率と成功率を追跡する状態実行テーブルを導入する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:48:56 GMT)
Auditing Differential Privacy in the Black-Box Setting [20.0]
我々は,型Iと型IIのエラーを明確に定義し,共形推論に基づく監査機構を提案する。提案手法は最小限の仮定でI型エラー率を強く制御する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:44:33 GMT)
Plan-and-Refine: Diverse and Comprehensive Retrieval-Augmented Generation [19.7]
2相システム設計に基づくP&R(Plan-and-Refine)フレームワークを提案する。グローバルな探査段階において、P&Rは与えられた入力に対する様々な計画を生成する。このフェーズに続いて、各プランに条件付き入力クエリに対する応答提案を生成するローカルエクスプロイトフェーズが生成される。最後に、最も事実とカバレッジの高い提案を選択するために報酬モデルが使用される。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:32:32 GMT)
Image Augmentation Agent for Weakly Supervised Semantic Segmentation [19.7]
弱教師付きセマンティックセマンティックセグメンテーション (WSSS) は画像レベルラベルのみを用いて顕著な進歩を遂げた。本稿では,データ生成の観点からWSSSを拡張できるIAA(Image Augmentation Agent)という新しいアプローチを提案する。 IAAは主に、大きな言語モデル(LLM)と拡散モデルを利用してWSSS用の追加画像を自動的に生成する拡張エージェントを設計する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:36:11 GMT)
Modern Hopfield Networks with Continuous-Time Memories [19.6]
本稿では,大規模な離散ホップフィールドメモリを小さな連続記憶に圧縮する手法を提案する。作業記憶における連続的資源割り当ての心理学的理論に着想を得て,大規模な離散ホップフィールド記憶を小さな連続記憶に圧縮する手法を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:32:13 GMT)
Hierarchical Subspaces of Policies for Continual Offline Reinforcement Learning [19.5]
我々は,学習エージェントが獲得したスキルセットを維持しながら,新たなタスクに継続的に適応しなければならない継続的強化学習の仕組みを考察する。オフラインデータからナビゲーション設定を継続学習するために設計された,新しい階層型フレームワークであるHiSPOを紹介する。本研究では,MuJoCo迷路環境と複雑なゲームライクなナビゲーションシミュレーションの両方において,本手法の有効性を実験的に検証した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:30:11 GMT)
Data Metabolism: An Efficient Data Design Schema For Vision Language Model [19.1]
データキュレーションは、強力なビジュアル言語モデルのトレーニングにおいて重要な役割を果たす。既存の巨大なデータセットを処理し、ユーザ固有のデータフライホイールを構築する方法を示します。我々は、典型的なマルチモーダルタスクに優れる、Capybara-VLというVLMをリリースする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:20:54 GMT)
A Mechanism-Learning Deeply Coupled Model for Remote Sensing Retrieval of Global Land Surface Temperature [19.0]
リモートセンシングデータから地表面温度(LST)を抽出することは、気候過程や地表面エネルギー予算を分析する上で重要である。本稿では,単一チャネルLST検索の精度と一般化性を高めるため,メカニスティックモデリングと機械学習を統合した深い結合フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:19:01 GMT)
Explicit Uncertainty Modeling for Video Watch Time Prediction [19.0]
ビデオレコメンデーションにおいて、システムのレコメンデーション精度を決定する重要なコンポーネントは、ウォッチタイム予測モジュールである。この問題の鍵となる課題の1つは、ユーザのウォッチタイム動作である。本稿では,ユーザの時計時間行動をよりよく活用する逆最適化フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:19:19 GMT)
The Role of Machine Learning in Reducing Healthcare Costs: The Impact of Medication Adherence and Preventive Care on Hospitalization Expenses [19.0]
本研究は, 入院率の低下にともなう予防ケアと薬剤順守の重要性を明らかにする。 Logistic Regression、Gradient Boosting、Random Forest、Artificial Neural Networksの4つの機械学習モデルを使用して、5年間の入院リスクを予測する。高用量と一貫した予防ケアを持つ患者は、入院リスクの38.3%と37.7%を減少させることができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:28:42 GMT)
Adaptive Bounded Exploration and Intermediate Actions for Data Debiasing [18.9]
適応的および有界探索によりトレーニングデータセットを逐次劣化させるアルゴリズムを提案する。提案したアルゴリズムは、データバイアスの影響を緩和するという究極の目標との間にバランスを取ります。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 22:22:23 GMT)
Can LLMs Replace Human Evaluators? An Empirical Study of LLM-as-a-Judge in Software Engineering [18.8]
大規模言語モデル(LLM)は、コード生成のような様々なソフトウェアエンジニアリング(SE)タスクに取り組むためにデプロイされている。 Pass@kメトリックは、広範囲なユニットテストと設定された環境を必要とし、LLM生成したテキストの評価には適していない。 BLEUのような従来のメトリクスは、意味的類似性ではなく語彙のみを測定するが、精査されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:33:55 GMT)
A Large-Scale Simulation on Large Language Models for Decision-Making in Political Science [18.5]
我々は,大規模投票者の意思決定をシミュレートする理論駆動多段階推論フレームワークを開発した。我々は、現実の有権者データに校正された合成人格を用いて、最近のアメリカ合衆国大統領選挙の大規模なシミュレーションを行う。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:50:31 GMT)
Agent That Debugs: Dynamic State-Guided Vulnerability Repair [18.4]
Vul Debuggerは静的コンテキストと動的コンテキストの両方を利用するプログラム修復エージェントである。 Vul Debuggerは、脆弱性修復の最先端アプローチを大幅に上回る。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:31:10 GMT)
Reconsidering Faithfulness in Regular, Self-Explainable and Domain Invariant GNNs [18.3]
忠実度を正確に問うことと、それをどのように達成するかを問うことで、異なる忠実度指標が存在することを示す。インジェクティブな正規GNNアーキテクチャでは、完全に忠実な説明は完全に非形式的であることを証明している。最後に,テキストフェースフルネスは分布外一般化と密接に関連していることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:55:25 GMT)
DeepSeek vs. o3-mini: How Well can Reasoning LLMs Evaluate MT and Summarization? [18.0]
推論可能な大規模言語モデル(LLM)は、最近、複雑な論理的および数学的タスクにおいて顕著な性能を示した。本研究では,機械翻訳(MT)およびテキスト要約(TS)評価タスクにおいて,推論に基づくLLMと非推論のLLMを体系的に比較する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:39:18 GMT)
MOSAIC: Modeling Social AI for Content Dissemination and Regulation in Multi-Agent Simulations [17.8]
生成言語エージェントがユーザの行動を予測できる新しいオープンソースのソーシャルネットワークシミュレーションフレームワークMOSAICを提案する。このシミュレーションは、LCMエージェントと有向なソーシャルグラフを組み合わせることで、創発的偽装行動を分析し、ユーザがオンラインソーシャルコンテンツの正確性をどのように判断するかをよりよく理解する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:06:54 GMT)
POWQMIX: Weighted Value Factorization with Potentially Optimal Joint Actions Recognition for Cooperative Multi-Agent Reinforcement Learning [17.6]
値関数分解法は、協調型マルチエージェント強化学習において一般的に用いられる。本稿では, 潜在的に最適な関節動作を認識し, トレーニング中の損失により高い重みを割り当てるPOWQmix(Possally Optimal Joint Actions Weighted Qmix)アルゴリズムを提案する。行列ゲーム,難易度の高い捕食者前処理,およびStarCraft II Multi-Agent Challenge環境における実験により,我々のアルゴリズムは最先端の値に基づくマルチエージェント強化学習法よりも優れていることを示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:21:52 GMT)
On Approximability of $\ell_2^2$ Min-Sum Clustering [17.4]
NPハードがある因子を超えて$ell2$ min-sum $k$-clusteringを近似するかどうかは不明である。目的を1.056$以上の因子に近似することはNPハードであることが示される。次に、ほぼ線形な時間パラメータ化PTASを $ell2$ min-sum $k$-clustering で実行することで、困難を補う。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:07:00 GMT)
DGOcc: Depth-aware Global Query-based Network for Monocular 3D Occupancy Prediction [17.4]
2次元画像から大規模屋外シーンの3次元占有を予測することは、不適切で資源集約的である。モノクロ3DのtextbfOccupancy 予測のための textbfGlobal クエリベースのネットワーク textbfDGOcc を提案する。提案手法は,GPUと時間オーバーヘッドを低減しつつ,単分子的セマンティック占有率予測における最高の性能を実現する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:44:55 GMT)
Robust image representations with counterfactual contrastive learning [17.3]
因果画像合成の最近の進歩を生かした新しいフレームワークである反ファクト・コントラスト学習を導入する。提案手法は,5つのデータセットで評価され,獲得シフトに対するロバスト性の観点から,標準的なコントラスト学習よりも優れていた。さらなる実験により、提案フレームワークは、生物学的性間のサブグループ格差を減少させる対実的コントラスト学習で訓練されたモデルによって、獲得シフトを超えて拡張されていることが示されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:19:20 GMT)
MONA: Myopic Optimization with Non-myopic Approval Can Mitigate Multi-step Reward Hacking [17.1]
本研究では,好ましくないマルチステッププランを学習するエージェントが高い報酬を受けるのを避けるためのトレーニング手法を提案する。この手法は,近視的最適化と遠視的報酬を組み合わせることで,非近視的評価法 (MONA) を用いた近視的最適化を行う。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:25:31 GMT)
A Multimedia Analytics Model for the Foundation Model Era [17.0]
本稿では,基盤モデル時代を対象とした包括的マルチメディア分析モデルを提案する。我々のモデルは、技術と概念の両方の観点から、視覚分析エージェントに基づく統合された人間とAIのコラボレーションを強調している。このモデルは、インテリジェンス分析、調査ジャーナリズム、および複雑で高精度なデータを扱う他の分野といった、センシティブな領域における実践的な課題に対処する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:52:41 GMT)
The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search [16.9]
AI Scientist-v2は、AIが生成した最初のピアレビュー受け入れワークショップ用紙を生産できるエンドツーエンドのエージェントシステムである。科学的な仮説を反復的に定式化し、実験を設計し、実行し、データを分析し、視覚化し、科学的な原稿を自律的に作成する。ある写本は、平均的な人間の受け入れ閾値を超える十分なスコアを達成し、完全なAI生成論文がピアレビューをうまくナビゲートした最初の事例となった。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:44:41 GMT)
TALE: A Tool-Augmented Framework for Reference-Free Evaluation of Large Language Models [16.9]
大規模言語モデル(LLM)は、現実の自律型アプリケーションに統合されつつある。評価のための静的な注釈付き参照に頼ることは、コスト、スケーラビリティ、完全性において大きな課題を引き起こす。提案するツール拡張LDM評価(TALE: Tool-Augmented LLM Evaluation)は,LLMの出力を所定の基礎的回答なしで評価するフレームワークである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:08:41 GMT)
Privacy-Enhanced Database Synthesis for Benchmark Publishing (Technical Report) [16.8]
差分プライバシー(DP)に基づくデータ合成は、データ共有時のプライバシ保護の鍵となる方法となっている。本稿では,ベンチマーク公開シナリオに特化して,差分プライベートなデータベース合成について述べる。我々は、データ分散とクエリ実行時のパフォーマンスの両面において忠実性を維持する高品質なベンチマークデータベースの合成をサポートする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:53:16 GMT)
Universal Architectures for the Learning of Polyhedral Norms and Convex Regularizers [16.8]
本稿では,限られたデータから画像の再構成を導くための凸正規化器の学習課題について述べる。再構成を振幅同変とすることで、許容関数のクラスを狭めます。このような関数は多面体ノルムの助けを借りて任意の精度で近似できることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:12:37 GMT)
Phantom: Subject-consistent video generation via cross-modal alignment [16.8]
シングルオブジェクトとマルチオブジェクトの両方の参照に統一されたビデオ生成フレームワークを提案する。提案手法は,画像コンテンツのリークや複数オブジェクトの混同といった問題に対処しながら,高忠実度映像生成を実現する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:24:37 GMT)
Fast Globally Optimal and Geometrically Consistent 3D Shape Matching [16.7]
本稿では,3次元形状のマッチングを大域的に最適かつ幾何的に整合的に計算するための新しい定式化法を提案する。私たちのキーとなるアイデアは、ソース形状の表面を循環経路の集合として表現することであり、それはターゲット形状と一貫して一致します。我々は、我々の形式主義が効率的に解けること、そしてそれが高品質な結果をもたらすことを実証的に示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:03:31 GMT)
How Can Objects Help Video-Language Understanding? [16.6]
MLLMにおけるビデオ言語理解にオブジェクトはどのように役立つのか? 具体的には,表現表現性と統合難易度とのトレードオフについて検討する。我々の発見は、認識モジュールをMLLM設計に明示的に統合する研究をコミュニティに促す可能性がある。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:59:28 GMT)
Emergency Communication: OTFS-Based Semantic Transmission with Diffusion Noise Suppression [16.6]
無人航空機(UAV)は、災害に遭った地域での緊急通信のための重要なプラットフォームとして登場した。高速移動シナリオにおける複雑なチャネル条件は、従来の通信システムの信頼性と効率に大きな影響を及ぼす。本稿では,OTFS(Orthogonal Time Frequency Space)変調,セマンティック通信,拡散に基づくデノナイジングモジュールを統合した,インテリジェントな緊急通信フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:25:56 GMT)
Revisiting Likelihood-Based Out-of-Distribution Detection by Modeling Representations [16.3]
ディープラーニングシステムの信頼性を確保するためには,アウト・オブ・ディストリビューション(OOD)検出が重要である。親和性に基づく深層生成モデルは、OOD検出における不満足な性能に対して歴史的に批判を受けてきた。事前学習したエンコーダの表現空間に適用した場合、確率に基づく手法は最先端の手法と同等に動作可能であることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:30:41 GMT)
A smoothed-Bayesian approach to frequency recovery from sketched data [16.2]
計算機科学と情報理論の交わりにおける古典的問題に関する新しい統計的視点を提供する。ランダムハッシュを用いて得られた圧縮表現やスケッチのみを用いて,大規模な離散データセットにおけるシンボルの実証周波数を復元する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:21:29 GMT)
ASHiTA: Automatic Scene-grounded HIerarchical Task Analysis [15.7]
ASHiTAは、ハイレベルなタスクをグラウンド化されたサブタスクに分解することで、3Dシーングラフにグラウンドされたタスク階層を生成するフレームワークである。実験の結果,ASHiTAは環境依存サブタスクに高レベルタスクを分割する際のLCMベースラインよりもはるかに優れた性能を示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:34:23 GMT)
Driving by the Rules: A Benchmark for Integrating Traffic Sign Regulations into Vectorized HD Map [15.6]
交通標識から運転規則を抽出するためのデータセットであるMapDRを紹介する。 MapDRには1万ドル以上の注釈付きビデオクリップがあり、交通標識規則と車線との複雑な相関関係を捉えている。交通標識規則の統合において重要なギャップを埋め、信頼性の高い自動運転システムの開発に寄与する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:13:00 GMT)
Generalization Error Bounds for Learning under Censored Feedback [15.4]
学習理論からの一般化誤差は、以前に見つからなかったデータに対してアルゴリズムがどれだけうまく機能するかを統計的に保証する。このような境界に対する検閲されたフィードバックによるデータ非IIDnessの影響を特徴付ける。既存の一般化誤差境界がモデルの一般化保証を正しく捕捉できないことを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:45:54 GMT)
Atomic structure analysis of PL5 in silicon carbide with single-spin spectroscopy [15.4]
4H多型ケイ素炭化ケイ素(4H-SiC)における希薄(VV)スピン欠陥は、量子情報処理と量子センシングの候補として浮上している。本研究では, PL5-6と積層断層の相関画像化を行い, PL5-6が積層断層と関係がないことを示す。 PL5の構造解像度は、制御可能な製造に向けての第一歩として始まり、様々な用途への道を開いた。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:39:40 GMT)
Efficient Heterogeneous Large Language Model Decoding with Model-Attention Disaggregation [15.4]
トランスフォーマーベースの大規模言語モデル(LLM)は、生成タスクにおいて顕著なパフォーマンスを示すと同時に、現実のサービスにおいて大きな課題をもたらす。 LLMデコーディングの効率を高めるために,モデルアテンションデアグリゲーションを導入する。分散ヘテロジニアスクラスタにモデルアテンションデアグリゲーションを組み込んだLLM推論システムであるLaminaを開発し,展開する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:56:01 GMT)
Adaptive Detection of Fast Moving Celestial Objects Using a Mixture of Experts and Physical-Inspired Neural Network [15.3]
本稿では,恒星場内を高速に移動する天体を検出するための新しいアルゴリズムを提案する。我々のアプローチは、物理的にインスパイアされたニューラルネットワークに変換することで、最先端の高速移動天体検出ニューラルネットワークを強化する。その結果,観測モードの異なる天体の高速移動を効果的に検出できることが示唆された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:15:30 GMT)
Distilling Knowledge from Heterogeneous Architectures for Semantic Segmentation [15.3]
ヘテロAKDという異種の観点から意味的セグメンテーションのための汎用知識蒸留法を初めて提案する。建築特化情報の影響をなくすため、教師と生徒の中間的特徴を整列ロジット空間に巧みに投影する。種々の教師と学生のペアを用いた3つのメインストリームベンチマーク実験により、ヘテロAKDは異種建築間の蒸留を促進するために最先端のKD法より優れていることが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:24:58 GMT)
GenEAva: Generating Cartoon Avatars with Fine-Grained Facial Expressions from Realistic Diffusion-based Faces [15.3]
顔のきめ細かい高品質の漫画アバターを作成するための新しいフレームワークGenEAvaを提案する。提案手法は,高精細で表現力のある表情を合成するために,最先端のテキスト・画像拡散モデルを微調整する。我々は135個のきめ細かい表情を捉えるために特別に設計された最初の表現型マンガアバターデータセットGenEAva 1.0を紹介した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:54:02 GMT)
LLM4Ranking: An Easy-to-use Framework of Utilizing Large Language Models for Document Reranking [15.1]
我々は,オープンソースやクローズドソースのAPIベースのLCMを用いて,ユーザが異なるランキング手法を適用可能な統一フレームワークである textbfLLM4Ranking を導入する。我々のフレームワークは、LLMで文書を再ランク付けするためのシンプルでインターフェイスを提供し、また、このタスクの使い易い評価と微調整スクリプトを提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:08:38 GMT)
Affordable AI Assistants with Knowledge Graph of Thoughts [15.0]
大規模言語モデル(LLM)は、ドメイン間で多様なタスクを実行できるAIアシスタントの開発に革命をもたらしている。我々は、LLM推論と動的に構築された知識グラフ(KGs)を統合する革新的なAIアシスタントアーキテクチャであるKGoT(Knowledge Graph of Thoughts)を提案する。 KGoTはGAIAベンチマークのタスク成功率をGPT-4o miniのHugging Face Agentsと比較して29%改善し、GPT-4oのコストを36倍以上削減した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:44:34 GMT)
Routing to the Right Expertise: A Trustworthy Judge for Instruction-based Image Editing [14.8]
現在のIIE評価手法は、人間の判断と一致せず、説明性に欠けることが多い。我々はこれらの制約に対処するため、JUdgement through Routing of Expertise (JURE)を提案する。 JUREは2つの側面において信頼性が高い。まず、ルーティングされた専門家とそのフィードバックを調べることで、審査員に関する説明を徹底的に行うことができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:30:15 GMT)
Online Detecting LLM-Generated Texts via Sequential Hypothesis Testing by Betting [14.7]
我々は,ソースが大言語モデル(LLM)なのか人間なのかを迅速かつ正確に判定するアルゴリズムを開発した。我々は、既存のオフライン検出技術に基づいて、ベッティングによるシーケンシャル仮説テストの手法を用いる。提案手法の有効性を実証するために実験を行った。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 00:51:20 GMT)
CollEX -- A Multimodal Agentic RAG System Enabling Interactive Exploration of Scientific Collections [14.6]
CollEx(コレックス)は、科学コレクションのインタラクティブな探索を強化するために設計されたマルチモーダルエージェント検索生成(RAG)システムである。本システムは,教師,生徒,学生,研究者に有用な教育シナリオを支援する。公立大学から収集した32のコレクションに64,000以上のユニークな記録を含む概念実証アプリケーションを用いて,本システムの有効性を解説する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:44:19 GMT)
Geometry-aware RL for Manipulation of Varying Shapes and Deformable Objects [14.5]
様々な地形と変形可能な物体で物体を操作することは、ロボット工学における大きな課題である。我々は、より小さな部分グラフからなる不均一グラフのレンズを通してこの問題をフレーム化する。本稿では,多種多様な物体の厳密な挿入を含む,新規で挑戦的な強化学習ベンチマークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:03:02 GMT)
Unified Generative Search and Recommendation [14.3]
我々は、バランスの取れた検索とレコメンデーションのための統一的な生成フレームワークGenSARを紹介する。提案手法は,2目的識別子を設計し,補完的な信号を組み込んでタスク固有の目的と整合する訓練戦略を設計する。パブリックデータセットと商用データセットの両方の実験では、GenSARがトレードオフを効果的に削減し、両方のタスクで最先端のパフォーマンスを達成することが示されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:34:28 GMT)
EDA-Q: Electronic Design Automation for Superconducting Quantum Chip [14.3]
EDA-Qと呼ばれる量子チップ設計に特化したフルスタックEDAツールを開発した。 EDA-Qは、デバイスマッピングや製造プロセスマッピングといった重要な設計段階を補完しながら、既存の量子EDAツールに存在する機能を組み込んでいる。統合デザインモードは、異なるチップコンポーネントとのアルゴリズム互換性を保証し、ユーザーに対して単純で適応可能なコマンドインターフェースを提供するために、特別にインタラクティブな処理モードを使用する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:26:46 GMT)
Adversarial Attacks on AI-Generated Text Detection Models: A Token Probability-Based Approach Using Embeddings [14.2]
本研究では,Fast-DetectGPTなどの検出モデルに対する新たなテキスト逆攻撃を提案する。この手法では、AI生成したテキストの再構築を目的として、データ摂動の埋め込みモデルを用いて、テキストの真の起源を検出する可能性を低減する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:46:55 GMT)
The Gradient Puppeteer: Adversarial Domination in Gradient Leakage Attacks through Model Poisoning [14.1]
Federated Learning (FL)では、クライアントはデータをローカルに保ちながら、中央サーバと勾配を共有する。悪意のあるサーバーは、クライアントのデータを共有勾配から再構築するために、故意にモデルを操作できる。我々は,クライアント側検出を回避しつつ,完全な攻撃カバレッジを実現する最初のAGLAであるEGGV(Enhanced Gradient Global Vulnerability)を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:55:11 GMT)
RelCon: Relative Contrastive Learning for a Motion Foundation Model for Wearable Data [14.1]
本稿では,ウェアラブル加速度センサを用いた運動基礎モデルの学習のための,自己指導型相対的コントラスト学習手法であるRelConを提案する。まず、学習可能な距離尺度をトレーニングし、モチーフの類似性とドメイン固有の意味情報をキャプチャする。我々は,ウェアラブルの動作データを用いた基礎モデルの,異なる評価課題における一般化可能性を示す最初の人物である。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 22:16:56 GMT)
PROPEL: Supervised and Reinforcement Learning for Large-Scale Supply Chain Planning [14.1]
本稿では,教師付き学習と深層強化学習(DRL)を併用して,探索空間の規模を大幅に削減する新しいフレームワークであるPROELを提案する。 PROPELは、数百万の変数を持つ産業サプライチェーン計画最適化に適用されている。その結果, 解の時間と品質が劇的に向上し, 原始積分の60%が減少し, 原始ギャップの88%が減少することがわかった。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:04:29 GMT)
SpecReason: Fast and Accurate Inference-Time Compute via Speculative Reasoning [14.0]
SpecReason は軽量モデルを用いて LRM 推論を加速し、より単純な中間推論ステップを実行するシステムである。 1.5-2.5$times$ speedup over vanilla LRM inferenceを達成し、精度は1.0-9.9%向上した。 SpecReasonなしでの投機的復号化と比較すると、それらの組み合わせは19.4-44.2%のレイテンシ削減をもたらす。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:05:19 GMT)
BRepFormer: Transformer-Based B-rep Geometric Feature Recognition [14.0]
B-repモデル上の幾何学的特徴を認識することは、マルチメディアコンテンツに基づく検索の基盤となる技術である。本稿では,加工特徴と複雑なCADモデルの特徴の両方を認識するトランスフォーマーモデルであるBRepFormerを提案する。 BRepFormerは、MFInstSeg、MFTRCAD、および我々のCBFデータセット上で最先端の精度を達成する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:36:06 GMT)
DPImageBench: A Unified Benchmark for Differentially Private Image Synthesis [13.9]
差分プライベート(DP)画像合成は、データセット内の個々の画像のプライバシーを保護しながら、機密画像の特性を保持する人工画像を生成することを目的としている。近年の進歩にもかかわらず、不整合かつ時には欠陥のある評価プロトコルが研究全体で適用されている。本稿では,DP画像合成のためのDPImageBenchについて述べる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:52:27 GMT)
The KL3M Data Project: Copyright-Clean Training Resources for Large Language Models [13.9]
KL3M Data Projectは、著作権や契約違反に関連するリスクを最小限に抑える、最大の総合的なトレーニングデータパイプラインを導入している。このプロジェクトの基礎は、1億3200万以上のドキュメントと、厳格な著作権およびライセンスプロトコルを満たすために検証された16の異なるソースにまたがる数兆のトークンからなるコーパスである。これらのリソースはすべて、CC-BY条項の下で、S3、Hugging Face、GitHubで無料で公開されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:31:17 GMT)
PR-Attack: Coordinated Prompt-RAG Attacks on Retrieval-Augmented Generation in Large Language Models via Bilevel Optimization [13.8]
大規模言語モデル(LLM)は、幅広いアプリケーションで顕著な性能を示している。それらはまた、時代遅れの知識や幻覚への感受性のような固有の制限も示している。近年の取り組みはRAGベースのLLMのセキュリティに重点を置いているが、既存の攻撃方法は3つの重大な課題に直面している。本稿では,少数の有毒テキストを知識データベースに導入する新しい最適化型攻撃であるPrompt-RAGアタック(PR-アタック)を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:09:50 GMT)
Interactive4D: Interactive 4D LiDAR Segmentation [13.5]
既存のアプローチでは、各LiDARスキャンで個々のオブジェクトをシーケンシャルに分割し、シーケンス全体を通してプロセスを繰り返す。我々は,複数のLiDARスキャン上に複数のオブジェクトを同時に分割できる新しいパラダイムであるインタラクティブ4Dセグメンテーションと,重畳された連続LiDARスキャン上に複数のオブジェクトを1回に分割する対話型4Dセグメンテーションモデルであるインタラクティブ4Dを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:59:53 GMT)
STEI-PCN: an efficient pure convolutional network for traffic prediction via spatial-temporal encoding and inferring [13.5]
本稿では,空間時空間符号化と推論による交通予測のための効率的な純粋畳み込みネットワークを提案する。時間的拡張因果畳み込みネットワークの3層は、長距離時間的相関を捉えるために使用される。このモデルは、ゲートアクティベートされたオリジナル、局所同期継手時空間時間的特徴と長距離時間的特徴を統合し、包括的な予測を実現する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:32:56 GMT)
Gen3DEval: Using vLLMs for Automatic Evaluation of Generated 3D Objects [13.3]
我々は3次元オブジェクト品質評価のための新しい評価フレームワークGen3DEvalを紹介する。 Gen3DEvalは3次元表面正規解析によりテキストの忠実度、外観、表面品質を評価する。 Gen3DEvalは、最先端のタスク非依存モデルと比較して、ユーザアライメント評価において優れたパフォーマンスを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:57:40 GMT)
Counting Hours, Counting Losses: The Toll of Unpredictable Work Schedules on Financial Security [13.3]
一貫性のある作業スケジュールに依存することができないことは、燃え尽き、仕事と家族の対立、財政的なショックにつながります。予想外の収益変動は金融計画に課題をもたらす。金融不確実性の中で個人が有効性を最適化する方法をモデル化するシミュレーションフレームワークを開発する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:09:56 GMT)
Prism: Dynamic and Flexible Benchmarking of LLMs Code Generation with Monte Carlo Tree Search [13.1]
静的ベンチマークは、LLM(Large Language Models)の機能の深さと幅を捉えていない。包括的LLM評価のために設計されたフレキシブルで動的なベンチマークフレームワークであるPrismを紹介する。 Prismは,(1)マルコフ決定過程として評価をモデル化した木に基づく状態表現,(2)困難な評価シナリオを明らかにするために適応したモンテカルロ木探索アルゴリズム,(3)多様な能力の同時評価を可能にするマルチエージェント評価パイプラインである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:06:05 GMT)
Large-Scale Analysis of Online Questions Related to Opioid Use Disorder on Reddit [13.1]
オピオイド使用障害(Opioid use disorder, OUD)は、個人の健康や公衆衛生に影響を及ぼす主要な健康問題である。さまざまなソーシャルメディアプラットフォーム上で、リカバリとサポートのためのオンラインコミュニティが形成された。我々は,RedditにおけるOUD関連談話の文脈で質問される自然言語質問について検討した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:02:24 GMT)
Exploring a Patch-Wise Approach for Privacy-Preserving Fake ID Detection [13.0]
本研究は,フィールド内のいくつかの制限をカバーした偽ID検出の話題に焦点を当てた。実際のIDドキュメントから公開されているデータは存在せず、ほとんどの研究はプライバシ上の理由から利用できない独自データベースに依存している。プライバシ保護型偽ID検出のためのパッチワイドアプローチを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:01:22 GMT)
Program Skeletons for Automated Program Translation [12.9]
我々は,プログラムスケルトンと呼ばれるフレームワークに基づいて,そのような翻訳を自動化するための新しい,体系的なアプローチを提案する。プログラムスケルトンは、低レベルの具体的なコードフラグメントを抽象化し、効果的に要約することで、ソースプログラムの高レベルな構造を保持します。最も重要なことは、個々の断片が正しく翻訳され、機械的に翻訳された骨格と一緒に取られた場合、最終的な翻訳プログラムは全体として正しいとみなすことができることである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:25:17 GMT)
Zero-Shot Cross-Domain Code Search without Fine-Tuning [12.9]
クロスドメインコード検索のためのゼロショット、微調整不要なアプローチを提案する。 CodeBridgeは、PLMベースの類似性スコアリングとサンプリングベースの融合を通じて、クエリコード、クエリコンメンテーション、コードマッチングを組み合わせる。我々の手法は、最先端のPLMベースのコード検索手法であるCoCoSoDaとUniXcoderをそれぞれ平均21.4%、MRRは24.9%上回る。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:36:37 GMT)
Efficient and Responsible Adaptation of Large Language Models for Robust and Equitable Top-k Recommendations [12.8]
我々は,すべてのユーザグループに公平にサービスを提供することで,社会的利益を促進するために設計されたハイブリッドタスク割り当てフレームワークを提案する。実世界の3つのデータセットによる結果から,ユーザ数が大幅に減少し,不均等にコストを増大させることなく,サブポピュレーションに対するロバスト性が改善された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:54:51 GMT)
The Inadequacy of Similarity-based Privacy Metrics: Privacy Attacks against "Truly Anonymous" Synthetic Datasets [12.7]
実世界の合成データデプロイメントで使用されるプライバシメトリクスを調べ、その信頼性をいくつかの点で実証する。 ReconSynは、メトリクスによってプライベートと見なされるが、個々のレコードに固有の情報をリークする複数の合成データセットを生成するリコンストラクション攻撃である。 ReconSynは列車データから78-100%のアウトレーヤを復元し、ブラックボックスアクセスのみを1つの適合した生成モデルとプライバシメトリクスに含める。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:50:14 GMT)
Beyond Feature Importance: Feature Interactions in Predicting Post-Stroke Rigidity with Graph Explainable AI [12.7]
筋緊張と硬さを特徴とする後ストローク剛性は、生存者の移動性や生活の質に大きな影響を及ぼす。本研究は,グラフに基づく説明可能なAIによって特徴的相互作用を強調することによって,ストローク後の剛性を予測するという課題に対処する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 22:20:22 GMT)
SlimSpeech: Lightweight and Efficient Text-to-Speech with Slim Rectified Flow [12.6]
整流に基づく軽量かつ効率的な音声合成システムであるSlimSpeechを紹介する。実験の結果,提案手法は1ステップのサンプリングにより大規模モデルに匹敵する性能を示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:15:18 GMT)
Stochastic Smoothed Primal-Dual Algorithms for Nonconvex Optimization with Linear Inequality Constraints [12.6]
線形不等式制約を用いた非コンパクト最適化問題に対するスムーズな原始双対アルゴリズムを提案する。我々のアルゴリズムは、各サンプルの1つの勾配に基づいて、シングルループの反復である。既存の手法とは異なり、我々のアルゴリズムは自由なサブ、大きなサイズ、パラメータの増加であり、実現可能性を保証するためにデュアル変数更新を使用する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:59:43 GMT)
V2V3D: View-to-View Denoised 3D Reconstruction for Light-Field Microscopy [12.4]
光電場顕微鏡(LFM)は、スナップショットベースで大規模な3D蛍光画像の撮影が可能であるため、注目されている。既存のLFM再構成アルゴリズムは、センサーノイズに非常に敏感であるか、あるいはトレーニングのためにハード・トゥ・ザ・グラウンド・トゥルース・アノテート・データを必要とする。本稿では,V2V3Dについて紹介する。V2V3Dは教師なしのビュー2ビューベースのフレームワークで,画像復調と3D再構成の協調最適化のための新しいパラダイムを確立する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:29:26 GMT)
GaussianSpa: An "Optimizing-Sparsifying" Simplification Framework for Compact and High-Quality 3D Gaussian Splatting [12.3]
3D Gaussian Splatting (3DGS) は、ガウス関数の連続的な集合を利用して、新しいビュー合成の主流として登場した。 3DGSは、ガウシアンの多さを記憶するためのかなりのメモリ要件に悩まされており、その実用性を妨げている。コンパクトで高品質な3DGSのための最適化ベースの単純化フレームワークであるGaussianSpaを紹介する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:57:18 GMT)
OmniScience: A Domain-Specialized LLM for Scientific Reasoning and Discovery [12.3]
一般科学のための専門的な大規模推論モデルであるOmniScienceを紹介する。我々は、分子を潜在的電解質溶媒または添加剤として効率よくランク付けする電池剤を開発した。我々は,ドメイン適応型事前学習と推論に基づく知識蒸留が性能レベルを達成するために重要であることをアブレーション実験で実証した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:58:21 GMT)
Over-Relying on Reliance: Towards Realistic Evaluations of AI-Based Clinical Decision Support [12.2]
私たちは、AIのタスクにおける信頼、信頼、受け入れ、パフォーマンスといった評価指標を超えて進むことを提唱します。私たちはコミュニティに、AIが医療専門家にもたらす創発的な価値を計測する、生態学的に有効な、ドメインに適した研究環境を優先するよう呼びかけています。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:28:56 GMT)
Merging Embedded Topics with Optimal Transport for Online Topic Modeling on Data Streams [12.2]
StreamETMはEmbeded Topic Model (ETM)上に構築され、データストリームを処理する。オンライン変更点検出アルゴリズムは、時間とともにトピックの変化を特定するために使用される。シミュレーションおよび実世界のデータに関する数値実験は、StreamETMがライバルより優れていることを示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:04:56 GMT)
Between Linear and Sinusoidal: Rethinking the Time Encoder in Dynamic Graph Learning [12.2]
TGATやDyGFormerのようなセミナルアテンションベースのモデルは、エッジイベント間の時間的関係を捉えるために正弦波時間エンコーダに依存している。本稿では,正弦波関数による時間情報損失を回避する線形時間エンコーダを提案する。自己注意機構は線形時間エンコーディングから時間スパンを効果的に学習し、関連する時間パターンを抽出できることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:12:10 GMT)
Model Discrepancy Learning: Synthetic Faces Detection Based on Multi-Reconstruction [12.2]
合成画像とそれに対応する生成技術との本質的な関係について検討する。その結果, 異なる生成法にまたがって, 画像の再構成の相違が顕著であることが判明した。複数の生成モデルを用いて画像の逆変換と再構成を行うことで、実画像、GAN生成画像、DM生成画像の再構成差を解析する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:54:02 GMT)
Towards Unconstrained 2D Pose Estimation of the Human Spine [12.1]
SpineTrackは、制約のない環境で2Dスピンのポーズ推定のための最初の包括的なデータセットである。 SpinePoseを導入し、知識蒸留と解剖学的正則化戦略を用いて、身体と脊椎のキーポイントを共同で予測する、最先端のボディポーズ推定装置を拡張した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:11:02 GMT)
TokenFocus-VQA: Enhancing Text-to-Image Alignment with Position-Aware Focus and Multi-Perspective Aggregations on LVLMs [12.1]
TokenFocus-VQAは、位置特異的確率最適化を伴う視覚質問応答(VQA)パラダイムを通じてLVLM(Large Vision-Language Models)を活用する新しい評価フレームワークである。我々の重要な革新は、重要な意味要素に対応する事前定義された語彙位置の確率分布に選択的にフォーカスするトークン認識損失関数を設計することである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:37:13 GMT)
On the Practice of Deep Hierarchical Ensemble Network for Ad Conversion Rate Prediction [12.0]
本稿では,DHENを単一のバックボーンモデルアーキテクチャとして用いたマルチタスク学習フレームワークを提案する。我々は,CVR予測のために,オンサイトリアルタイムユーザ行動シーケンスとオフサイト変換イベントシーケンスの両方を構築した。本手法は,事前学習したユーザパーソナライズ機能付き単一機能横断モジュールと比較して,最先端性能を実現する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:41:34 GMT)
MUFFLER: Secure Tor Traffic Obfuscation with Dynamic Connection Shuffling and Splitting [12.0]
MUFFLERはTorの外部トラフィックを確保するために設計された接続レベルの交通難読化システムである。実際の接続を最終Torノードとターゲットサービスの間の異なる仮想接続のセットにマッピングする。既存のソリューションよりも最大で27倍のレイテンシオーバーヘッドを実現し、現在のTorアーキテクチャとシームレスに統合される。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:17:17 GMT)
Orchestrating Agents and Data for Enterprise: A Blueprint Architecture for Compound AI [11.9]
企業アプリケーションのためのエージェントとデータをオーケストレーションするための複合AIシステムのための「青写真アーキテクチャ」を提案する。エンタープライズにおける既存のプロプライエタリなモデルとAPIは、'エージェントレジストリ'で定義された'エージェント'にマップされる。エージェントは、さまざまなモダリティのエンタープライズデータを同じように登録する'データレジストリ'を通じて、プロプライエタリなデータを利用することができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 22:19:41 GMT)
Stable and Efficient Charging of Superconducting C-shunt Flux Quantum Batteries [11.8]
超伝導磁束量子ビットのユニークなエネルギー準位構造を利用して帯電過程を実験的に最適化する。本研究は,3レベル量子電池の実現に向けた理想的な候補として,静電容量型量子ビットプラットフォームの可能性を強調した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:26:49 GMT)
Scaling Laws of Graph Neural Networks for Atomistic Materials Modeling [11.6]
原子論的な物質モデリングは、薬物発見から物質科学まで幅広い応用において重要な課題である。グラフニューラルネットワーク(GNN)は、原子性物質データをモデリングするための最先端のアプローチである。原子モデルのためのGNNは、数十億のパラメータとテラバイト規模のデータセットを利用する大規模言語モデル(LLM)と比較して、比較的小さいままである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:19:20 GMT)
CyberAlly: Leveraging LLMs and Knowledge Graphs to Empower Cyber Defenders [11.4]
CyberAllyは、インシデント応答時のBlue Teamsの効率性と有効性を高めるように設計された、知識グラフ強化AIアシスタントである。 CyberAllyは、オープンソースのSIEMプラットフォームとともに、私たちのサイバー範囲に統合され、アラートを監視し、Blue Teamアクションを追跡し、調整された緩和勧告を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:03:56 GMT)
Transformer-Based Temporal Information Extraction and Application: A Review [11.3]
時間情報抽出(IE)は、構造化されていないテキストから構造化された時間情報を抽出することを目的としている。本稿では,トランスフォーマーを用いた一時的IEの作業体を体系的に要約し,解析する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:48:24 GMT)
Benchmarking Multi-Organ Segmentation Tools for Multi-Parametric T1-weighted Abdominal MRI [11.3]
MRIにおける多臓器分割のための3つのツールが提案されている。特定のMRIシークエンスタイプにおけるこれらのツールの性能は、まだ定量化されていない。 MRSegはDiceスコア80.7$pm$ 18.6、Hausdorff Distance(HD)エラー8.9$pm$ 10.4 mmを得た。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:27:27 GMT)
SydneyScapes: Image Segmentation for Australian Environments [11.3]
SydneyScapesは、セマンティックイメージのコンピュータビジョンタスク、例えば、パノプティクスのセグメンテーション用に設計されたデータセットである。オーストラリアのニューサウスウェールズ州(NSW)のシドニーと周辺の都市から収集されたこのデータセットは、高品質のピクセルレベルのアノテーションを備えた756枚の画像で構成されている。アルゴリズムの開発、テスト、デプロイのための注釈付きデータとツールを提供することで、AV業界や研究者を支援するように設計されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:11:17 GMT)
Gradient-based Sample Selection for Faster Bayesian Optimization [11.2]
大予算のシナリオでは、標準GPモデルを直接活用することは、計算時間とリソース要求において大きな課題に直面します。本稿では,勾配に基づくサンプル選択ベイズ最適化(GSSBO)を提案し,BOの計算効率を向上させる。提案手法は,ベースライン法に匹敵する最適化性能を維持しつつ,BOにおけるGPフィッティングの計算コストを大幅に削減する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:38:15 GMT)
Diffusion-LAM: Probabilistic Limited Area Weather Forecasting with Diffusion [10.9]
条件拡散を利用した確率的限定地域気象モデルであるDiffusion-LAMを導入する。周辺地域の境界データの条件付けにより, 本手法は定義領域内における予測を生成する。 MEPSリミテッド領域データセットの実験結果は、拡散LAMが正確な確率予測をもたらす可能性を実証している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:10:33 GMT)
Think While You Generate: Discrete Diffusion with Planned Denoising [10.8]
本稿では,計画デノイングによる離散拡散(DDPD)について紹介する。これは,生成プロセスを2つのモデル – プランナーとデノナイザ – に分割する新しいフレームワークである。 DDPDは従来の denoiser のみのマスク拡散法より優れており、言語モデリングベンチマークにおいて優れた結果が得られる。特に言語モデリングにおいて、DDPDは、拡散に基づく手法と自己回帰的手法のパフォーマンスギャップを、生成的パープレキシティの観点から著しく減少させる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:26:11 GMT)
Topological laser in a two-dimensional Su-Schrieffer-Heeger lattice with artificial gauge flux [10.6]
トポロジカルレーザーは、その頑丈さと非自明なトポロジに由来する特徴で知られており、近年、フォトニクスの研究の焦点となっている。人工ゲージフラックス挿入により誘導される2次元Su-Schrieffer-Heegerフォトニック格子に基づくトポロジカルレーザーを提案する。これらの結果は、トポロジカルレーザーにおけるOAM制御の重要な理論的洞察を与え、レーザーと光学系の高精度工学の進歩の道を開く。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:45:25 GMT)
MRD-RAG: Enhancing Medical Diagnosis with Multi-Round Retrieval-Augmented Generation [10.5]
医師の診断過程を模倣したMRD-RAG(Multi-Round Diagnostic RAG)フレームワークを提案する。本発明のRAGフレームワークは、潜在的な疾患の診断情報を解析し、医師等のマルチラウンド診断を正確に行うことができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:17:51 GMT)
FMNV: A Dataset of Media-Published News Videos for Fake News Detection [10.4]
FMNVは,メディア機関が公開するニュースビデオのみからなる新しいデータセットである。我々は,メディア公開ニュースビデオを操作することで,コンテンツを自動生成するために,Large Language Models (LLMs) を採用している。ビデオ特徴抽出のためのCLIPとFaster R-CNNを統合したベースラインモデルFMNVDを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:16:32 GMT)
Finding Pareto Trade-offs in Fair and Accurate Detection of Toxic Speech [10.1]
我々は、人口集団間でバランスの取れた精度を提供するために、人気の公正度尺度である精度パリティの微分可能なバージョンを開発する。次に、モデルに依存しないHyperNetwork最適化が任意のNLPモデルアーキテクチャを効率的にトレーニングする方法を示す。提案手法の汎用性と有効性は,2つのデータセット,3つのニューラルアーキテクチャ,3つのフェアネス損失にまたがる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 00:29:44 GMT)
Untangling Lariats: Subgradient Following of Variationally Penalized Objectives [10.0]
本稿では,不規則なペナルティを伴う凸問題の最適解を段階的に追従する装置について述べる。我々は,このアプローチの特殊な場合として,溶存ラッソや等調回帰といった既知のアルゴリズムを導出する。そこで我々は,任意の畳み込みフィルタによって特徴づけられる変分罰則の段階的追従のための格子ベースの新しい手順を導出した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:03:54 GMT)
ID-Booth: Identity-consistent Face Generation with Diffusion Models [10.0]
我々はID-Boothと呼ばれる新しい生成拡散に基づくフレームワークを提案する。このフレームワークは、事前訓練された拡散モデルの合成能力を保ちながら、アイデンティティ一貫性のある画像生成を可能にする。本手法は、画像の多様性を向上しつつ、競合する手法よりもアイデンティティ間の一貫性とアイデンティティ間の分離性を向上する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:20:18 GMT)
NorEval: A Norwegian Language Understanding and Generation Evaluation Benchmark [10.0]
NorEvalは、24の高品質な人間生成データセットで構成されている。ノルウェー語の理解と生成を対象とするタスクカテゴリの幅広い範囲をカバーする。ノルウェー語の公式標準であるボクマール語とニノルスク語の両方に焦点を当てている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:44:55 GMT)
QubitHammer Attacks: Qubit Flipping Attacks in Multi-tenant Superconducting Quantum Computers [10.0]
我々はQubitHammer攻撃と呼ばれる一連の新しい攻撃を初めて提示する。マルチテナントクラウドベースの量子システムでは、攻撃者はQubitHammer攻撃を利用して被害者回路の忠実度を著しく低下させることができる。本研究は, 先進ベンダーの超伝導量子コンピュータにおけるこれらの攻撃の有効性を示すものである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:50:57 GMT)
ThermoStereoRT: Thermal Stereo Matching in Real Time via Knowledge Distillation and Attention-based Refinement [9.9]
本研究では,リアルタイムなサーマルステレオマッチング手法であるThermoStereoRTを紹介する。 2つの補正された熱ステレオ画像から相違を回復する。夜間ドローン監視や下層クリーニングロボットなどの応用を想定する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:24:21 GMT)
Understanding Learner-LLM Chatbot Interactions and the Impact of Prompting Guidelines [9.8]
本研究は,学習者とAIの相互作用を,参加者が効果的なプロンプトの構造化指導を受ける教育実験を通して調査する。ユーザの行動を評価し,有効性を促進するために,107人のユーザから642のインタラクションのデータセットを解析した。我々の研究は、ユーザーが大規模言語モデルとどのように関わり、AI支援コミュニケーションを強化するための構造化された指導の役割についてより深く理解している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:20:43 GMT)
Exploring Human-Like Thinking in Search Simulations with Large Language Models [9.8]
ユーザ検索行動のシミュレーションは情報検索において重要な課題である。大規模言語モデル(LLM)の最近の進歩は、人間のようなアクションを生成する新しい可能性を開く。我々は,LLMを利用してユーザの隠れ認知過程をシミュレートすることで,人間的な思考を探索シミュレーションに統合することを検討する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:04:58 GMT)
Rethinking the Foundations for Continual Reinforcement Learning [9.8]
従来のRLのコア基盤の多くは、継続的な強化学習の目標に反するものであることを示唆する。マルコフ決定過程の定式化、最適政策への焦点、評価基準として期待される報酬の合計、エピソードベンチマーク環境の4つの基礎を列挙する。連続的な学習環境に適した4つの基礎の代替集合を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:05:56 GMT)
FOLDER: Accelerating Multi-modal Large Language Models with Enhanced Performance [9.8]
視覚トークン列の長さを削減するために設計された,シンプルで効果的なプラグアンドプレイモジュールであるFOLDERを紹介する。我々は、異なる還元戦略によってもたらされた情報損失を分析し、視覚的冗長性を取り除きながら鍵情報を保存するFOLDERを開発した。 FOLDERは、オリジナルのモデルと同等またはそれ以上のパフォーマンスを達成すると同時に、最大70%のビジュアルトークンを削除することで、複雑さを劇的に低減する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:10:28 GMT)
RendBEV: Semantic Novel View Synthesis for Self-Supervised Bird's Eye View Segmentation [9.7]
本稿では,Bird's Eye View セマンティックセグメンテーションネットワークの自己教師型トレーニング手法である RendBEV を提案する。提案手法では, ゼロショットBEVセマンティックセマンティックセグメンテーションが可能であり, 既に競合する結果が得られている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:00:28 GMT)
InteractAvatar: Modeling Hand-Face Interaction in Photorealistic Avatars with Deformable Gaussians [9.7]
InacttAvatarは、動的ハンドと非剛性ハンドフェイスインタラクションの出現を忠実に捉えた最初のモデルである。私たちの手と顔の相互作用モジュールは、一般的なジェスチャーの根底にある微妙な幾何学と外見のダイナミクスをモデル化します。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:55:43 GMT)
Conditional Conformal Risk Adaptation [9.6]
セグメンテーションタスクの条件付きリスク制御を大幅に改善する適応予測セットを作成するための新しいスコア関数を開発する。画素単位での包含推定の信頼性を高めるための特殊確率校正フレームワークを提案する。ポリープセグメンテーション実験により, 3つの手法が有意な限界リスク制御を提供し, より一貫した条件リスク制御を実現することを示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:01:06 GMT)
Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient [9.5]
本稿では,SSM(State Space Model)ベースの世界モデルDramaを提案し,メモリと計算の複雑さを$O(n)$で実現した。また, 早期のトレーニングにおいて, 誤った世界モデルによって引き起こされる準最適性を緩和する新しいサンプリング手法を提案する。ドラマは、標準のラップトップのような市販のハードウェアでアクセス可能で、トレーニングできる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:08:42 GMT)
Opinion de-polarization of social networks with GNNs [9.5]
そこで本研究では,適切なKユーザを識別する効率的なアルゴリズムを提案し,トピックに関する適度なスタンスを採用すると,偏極が最小となるようにした。我々のアルゴリズムはグラフニューラルネットワークを採用しており、他の手法よりも大きなグラフを効果的に処理することができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:56:22 GMT)
Minimum width for universal approximation using squashable activation functions [9.4]
一般活性化関数を用いたネットワークの最小幅について検討する。スカッシュ可能なアクティベーション関数を用いて$Lp$関数を普遍的に近似するネットワークの場合、最小幅は$d_x=d_y=1$でない限り$maxd_x,d_y,2$である。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:23:24 GMT)
POEM: Precise Object-level Editing via MLLM control [9.3]
マルチモーダル大言語モデル(MLLM)を用いたオブジェクトレベルの精密編集のためのフレームワークであるPOEMを提案する。 POEMはMLLMを利用して命令のプロンプトを分析し、変換前後に正確なオブジェクトマスクを生成する。この構造化推論段階は、拡散に基づく編集プロセスをガイドし、正確なオブジェクトの局所化と変換を保証する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:12:00 GMT)
Uni-PrevPredMap: Extending PrevPredMap to a Unified Framework of Prior-Informed Modeling for Online Vectorized HD Map Construction [9.2]
我々は、以前の予測を統合し、古いHDマップをシミュレートした、統合された事前インフォームドフレームワークUni-PrevPredMapを提案する。 Uni-PrevPredMapは、確立されたオンラインベクトル化HDマップ構築ベンチマーク間で、マップ依存シナリオにおける最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:39:55 GMT)
CatCMA with Margin: Stochastic Optimization for Continuous, Integer, and Categorical Variables [9.1]
本研究では,混合可変ブラックボックス最適化(MV-BBO)に焦点を当てる。連続変数、整数変数、カテゴリー変数に対処する。混合カテゴリブラックボックス最適化法であるMargin (CatCMAwM) を用いたCatCMAを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:59:22 GMT)
Virtual-mask Informed Prior for Sparse-view Dual-Energy CT Reconstruction [9.1]
摂動のチャネル間の高い相関を利用してスパースビュー再構成のための二重領域仮想マスクインフォーム拡散モデルを提案する。実験結果から,本手法は複数のデータセットにまたがって優れた性能を示すことがわかった。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:54:26 GMT)
ms-Mamba: Multi-scale Mamba for Time-Series Forecasting [9.0]
ms-Mambaはサンプリングレートの異なる複数のMambaブロックを使用することで、複数の時間スケールを組み込む。多くのベンチマーク実験により、ms-Mambaは最先端のアプローチよりも優れていることが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:06:57 GMT)
Incorporating Attributes and Multi-Scale Structures for Heterogeneous Graph Contrastive Learning [8.9]
異種グラフのための新しいコントラスト学習フレームワーク(ASHGCL)を提案する。 ASHGCLには3つの異なるビューがあり、それぞれがノード属性、高階構造情報、低階構造情報に焦点を当てている。本稿では,属性情報と属性情報を組み合わせた属性強化型正のサンプル選択手法を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:07:02 GMT)
Revisiting Prompt Optimization with Large Reasoning Models-A Case Study on Event Extraction [8.9]
DeepSeek-R1やOpenAI o1のような大きな推論モデル(LRM)は、様々な推論タスクにおいて顕著な能力を示している。中間的な思考を創造し、推論する強力な能力は、人間の指示を解釈するために、より広範な急進的な工学や最適化をもはや必要としないかもしれないという議論につながった。本研究では,イベント抽出の構造化課題を事例スタディとして,このオープンな質問を体系的に研究することを目的とする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 00:53:59 GMT)
Can Geometry Save Central Views for Sports Field Registration? [8.8]
シングルフレームのスポーツフィールド登録は、放送ビデオから3D情報を抽出する基盤となっている。本稿では,円対応から一組の点と線を導出する新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:40:42 GMT)
GSDeformer: Direct, Real-time and Extensible Cage-based Deformation for 3D Gaussian Splatting [8.7]
本稿では,3次元ガウス切削におけるケージベースの変形を可能にするGSDeformer(3DGS)を提案する。提案手法は,プロキシポイントクラウド表現を用いて,ケージベースの変形と3DGSをブリッジする。実験により、GSDeformerは既存の方法よりも優れた変形結果を提供し、極端な変形下で頑健であり、編集のトレーニングを必要とせず、リアルタイムに動作し、他の3DGS亜種にも拡張可能であることが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:29:02 GMT)
Potential Field Based Deep Metric Learning [8.7]
ディープ・メトリック・ラーニング(Deep metric learning)とは、意味的に意味のある表現空間を学習するネットワークである。連続ポテンシャル場による各例(埋め込み)の影響を表す新しいDMLモデルを提案する。このような減衰は,クラス内変動が大きく,ラベルノイズも大きい実世界のデータセットの性能向上に有効であることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:49:39 GMT)
Learning Long Short-Term Intention within Human Daily Behaviors [8.6]
ロボットにとって、人間の振る舞いを理解し、適切なサービスを提供することがもっとも重要である。伝統的に、人間は欠陥のないと認識され、その決定はロボットが整合しようとする基準として機能する。我々は「長期的短期意図予測」と呼ばれるユニークな課題を提示する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:50:18 GMT)
ZS-VCOS: Zero-Shot Outperforms Supervised Video Camouflaged Object Segmentation [8.4]
カモフラージュされたオブジェクトセグメンテーションは、伝統的なセグメンテーションタスクと比較してユニークな課題を提示する。本手法では,視覚言語モデルである光フローとSAM 2を逐次パイプラインに統合する。 MoCA-Maskデータセットの評価では、成功率は0.628から0.697に増加した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:24:54 GMT)
Multi-Party Private Set Operations from Predicative Zero-Sharing [8.3]
我々はMPSOフレームワークを提案し、これはm個のパーティがそれぞれ集合を持ち、それぞれのプライベート集合上の任意の集合公式を安全に計算することを可能にする。我々のフレームワークは非常に多用途であり、幅広いMPSO機能に対応できるようにインスタンス化することができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:38:10 GMT)
What the HellaSwag? On the Validity of Common-Sense Reasoning Benchmarks [8.0]
HellaSwagは,評価に最も広く用いられているベンチマークの一つである。このベンチマークは, 常識的推論を正確に測定するものではないため, 現状の評価には使用すべきではない。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:01:46 GMT)
Numerical instability of non-Hermitian Hamiltonian evolutions [8.0]
対角化および非エルミート進化における数値誤差による物理結果の不正確性について検討する。これらの数値不安定性は,NHSEによるシステムサイズの増加に伴って指数関数的に増大する大条件数に起因する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:50:22 GMT)
Security Vulnerabilities in Ethereum Smart Contracts: A Systematic Analysis [7.9]
本稿では、Etherスマートコントラクトに焦点を当て、Etherの主なコンポーネントであるスマートコントラクトアーキテクチャとメカニズムを説明します。 American Chain, The, Parity, KotETの4つのセキュリティイベントによると、整数オーバーフロー攻撃、再帰攻撃、アクセス制御攻撃、サービスアタックの否定の原則を研究し、分析した。予防措置がとられています
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:48:10 GMT)
Generative Artificial Intelligence for Internet of Things Computing: A Systematic Survey [7.8]
IoT(Internet of Things)におけるGenerative Artificial Intelligence(GenAI)の統合は、大きな関心を集めている。本調査は,これらの主流パラダイムの収束に伴う可能性,課題,考察を概観することを目的としている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:32:18 GMT)
Managing Security Issues in Software Containers: From Practitioners Perspective [7.7]
コンテナ化されたプロジェクトのセキュリティは、データ漏洩とパフォーマンスの低下につながる重要な課題である。本研究の目的は,コンテナ化されたプロジェクトにおけるセキュリティ管理を,実践者がセキュリティ問題をどのように認識するかを探索することにある。私たちの分析では、セキュリティを強化するために使用できる技術的および非技術的イネーブラーも特定しました。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:49:00 GMT)
Realigning Incentives to Build Better Software: a Holistic Approach to Vendor Accountability [7.6]
より良い品質のソフトウェアに関する課題は、不整合したインセンティブの連続による小さな部分によるものではない、と私たちは主張する。責任の欠如は、ソフトウェアベンダがあらゆるインセンティブを持って、低品質のソフトウェアを市場に投入することを意味する。この記事では、より良い、よりセキュアなソフトウェア開発にインセンティブを与えるために必要な、総合的な技術とポリシーのフレームワークを概説する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:05:24 GMT)
Wanting to be Understood [7.4]
本稿では,人間には理解の基本的な動機があるという仮説を,相互認識の本質的な動機として考察する。知覚横断パラダイムのシミュレーションを通じて、強化学習エージェントにおける様々な内的報酬関数の効果について検討する。その結果, 人工好奇心だけでは社会的相互作用を優先しないが, 相互理解を重視した報酬が, 相互作用の優先順位付けに成功していることが明らかとなった。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:46:00 GMT)
Designing Universal Causal Deep Learning Models: The Case of Infinite-Dimensional Dynamical Systems from Stochastic Analysis [7.4]
解析におけるいくつかの非線形作用素は、現代のニューラル作用素によって利用されていない時間構造に依存している。本稿では,無限次元線形距離空間を適切に扱うディープラーニングモデル設計フレームワークを提案する。我々のフレームワークはコンパクトな集合や任意の有限時間地平線 H" や滑らかなトレースクラス作用素に対して均一に近似できることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:41:03 GMT)
Automated Attack Synthesis for Constant Product Market Makers [7.3]
このような脆弱性の例として、トークンコントラクトと分散交換(DEX)のコンポーザビリティバグがある。 2022年以降、23回の攻撃により合計220万USドルが失われた。 CPMM構成性バグを自動的に検出するツールであるCPMMXを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:19:13 GMT)
PatchTrAD: A Patch-Based Transformer focusing on Patch-Wise Reconstruction Error for Time Series Anomaly Detection [7.2]
PatchTrADは,時系列異常検出のためのPatch-based Transformerモデルである。提案手法では,トランスフォーマーエンコーダと,アノマ検出のための再構成フレームワーク下でのパッチの利用を併用する。複数のベンチマークデータセットに対する実証的な評価は、PatchTrADが検出性能において同等であることを示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:58:55 GMT)
CMEdataset Advancing China Map Detection and Standardization with Digital Image Resources [7.1]
現在、CMEデータセットに関する問題マップ専用のデータセットは公開されていない。この研究は、5つの重要な問題領域をカバーする問題マップデータセットを作成する。このデータセットは、マップコンプライアンス、国家安全保障監視、マップ更新に不可欠なリソースを提供するだけでなく、関連する技術の革新と応用を促進する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:04:16 GMT)
Can Reasoning LLMs Enhance Clinical Document Classification? [7.0]
大規模言語モデル(LLM)は、このタスクの正確性と効率性において有望な改善を提供する。本研究では,8つのLDMの性能と一貫性を評価する。4つの推論(Qwen QWQ, Deepseek Reasoner, GPT o3 Mini, Gemini 2.0 Flash Thinking)と4つの非推論(Llama 3.3, GPT 4o Mini, Gemini 2.0 Flash, Deepseek Chat)。その結果、推論モデルは精度71%(68%)とF1スコア(67%(60%))で非推論モデルを上回った。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:00:27 GMT)
ConceptFormer: Towards Efficient Use of Knowledge-Graph Embeddings in Large Language Models [6.9]
本稿では,Wikidataから構造化知識を付加した大規模言語モデルの拡張手法であるConceptFormerを紹介する。 ConceptFormerは、KGノードをそれぞれの概念ベクトルにマッピングする包括的なルックアップテーブルを生成する。実験により、GPT-2 0.1Bに概念ベクトルを追加することで、実際のリコール能力(Hit@10)が最大で272%向上することが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:17:08 GMT)
CVE-Bench: A Benchmark for AI Agents' Ability to Exploit Real-World Web Application Vulnerabilities [6.8]
大規模言語モデル(LLM)エージェントは、サイバー攻撃を自律的に行う能力が高まっている。既存のベンチマークは、抽象化されたCapture the Flagコンペティションに制限されているか、包括的なカバレッジが欠如しているため、不足している。私たちはCVE-Benchを紹介します。CVE-Benchは、クリティカルシヴァリティ・コモン・脆弱性と露出に基づく、現実世界のサイバーセキュリティベンチマークです。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:50:28 GMT)
Hamiltonian Dynamics Learning: A Scalable Approach to Quantum Process Characterization [6.7]
短時間のハミルトン力学に特化して設計された効率的な量子プロセス学習法を提案する。我々は、量子機械学習の応用を実証し、このプロトコルは、ユニタリ変換を直接学習することで、変分量子ニューラルネットワークの効率的なトレーニングを可能にする。この研究は、実用的な量子力学学習のための新しい理論的基盤を確立し、短期的およびフォールトトレラントな量子コンピューティングの両方においてスケーラブルな量子プロセスのキャラクタリゼーションの道を開いた。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:24:42 GMT)
AiGAS-dEVL-RC: An Adaptive Growing Neural Gas Model for Recurrently Drifting Unsupervised Data Streams [6.7]
本研究は,急激な再帰流を処理するために,GNGアルゴリズムに基づく新しい手法を提案する。提案手法はコンパクトだが情報的なメモリ構造を維持しており,過去の概念や再帰概念の知識を効率的に保存し,検索することができる。繰り返し知識を活用できない他の手法とは異なり、提案手法は、教師なしドリフトデータフローに対する堅牢で効率的なオンライン学習ソリューションであることが証明されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:38:14 GMT)
Decomposition-Based Optimal Bounds for Privacy Amplification via Shuffling [6.7]
Shufflingは、より強力なプライバシーユーティリティトレードオフを提供する、差分プライバシー保証を増幅することが示されている。我々は,すべての可能な分解を包含する統合分析フレームワーク,すなわち一般的なクローンパラダイムを導入する。最適なプライバシアンプリフィケーション境界の正確な値を計算するための,単純かつ効率的なアルゴリズムを開発した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:11:17 GMT)
Playmate: Flexible Control of Portrait Animation via 3D-Implicit Space Guided Diffusion [6.7]
Playmateは、より生き生きとした表情と話す顔を生成するために提案されている。最初の段階では、より正確な属性の絡み合いを容易にするために、分離された暗黙の3D表現を導入する。第2段階では、感情制御情報を潜在空間にエンコードする感情制御モジュールを導入する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:28:08 GMT)
Enhancing Time Series Forecasting via Multi-Level Text Alignment with LLMs [6.6]
大規模言語モデル(LLM)を用いた時系列予測のための多段階テキストアライメントフレームワークを提案する。本手法は,時系列をトレンド,季節,残留成分に分解し,コンポーネント固有のテキスト表現に再プログラムする。複数のデータセットに対する実験により,提案手法は高い解釈性を提供しながら,最先端のモデルよりも精度が高いことを示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:02:37 GMT)
Unveiling the Impact of Multimodal Features on Chinese Spelling Correction: From Analysis to Design [6.6]
中国語のspelling Correction(CSC)タスクは、文中のスペルエラーを検出し、修正することに焦点を当てている。 LLMはCSC(特に過補正)の制限に直面しており、このタスクには最適ではない。中国語スペル訂正のための新しいマルチモーダルモデルである textbfNamBert を導入する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:19:09 GMT)
Accelerating Ill-conditioned Hankel Matrix Recovery via Structured Newton-like Descent [6.6]
そこで本研究では,ハンケル回収問題に対する非構造的類似Descent (HSNLD) アルゴリズムを提案する。合成データセットと実データセットの両方における数値実験は、最先端のアルゴリズムに対して優れた性能を示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:55:52 GMT)
A Case Study on Evaluating Genetic Algorithms for Early Building Design Optimization: Comparison with Random and Grid Searches [6.5]
本研究は,早期設計最適化における遺伝的アルゴリズムの有効性を評価する。本研究は,RSが最適解を欠いたとしても,厳密な計算限界下では予期せぬ有効性を示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:07:59 GMT)
Estimation of High-Dimensional Markov-Switching VAR Models with an Approximate EM Algorithm [6.5]
高次元時系列におけるレジームシフトは、金融への多くの応用において自然に生じる。本稿では,マルコフスイッチングモデルに対するEMアルゴリズムを提案する。また,てんかん発作を発症した患者に記録された脳脳波データセットを解析し,そのアルゴリズムを実証した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:39:06 GMT)
Throughput-Optimal Scheduling Algorithms for LLM Inference and AI Agents [6.3]
我々は,LLM推論の待ち行列の基礎を開発し,待ち行列とLLMシステムコミュニティのギャップを埋める。大規模な'作業保守'スケジューリングアルゴリズムが、個々のリクエストとAIエージェントのワークロードの両方で最大スループットを達成できることを証明する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 00:12:12 GMT)
Synthetic CT Generation from Time-of-Flight Non-Attenutaion-Corrected PET for Whole-Body PET Attenuation Correction [6.1]
本研究では,時系列非減衰補正(NAC)PET画像から直接合成CT(sCT)画像を生成するためのディープラーニング手法を提案する。まず,CT-CT再構成作業のための大規模自然画像データセットを用いた事前学習モデルについて検討した。 TOF NAC PET画像から骨と軟部組織を再構築した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:49:41 GMT)
Catch Me if You Search: When Contextual Web Search Results Affect the Detection of Hallucinations [5.9]
近年,ウェブ検索の結果を大規模言語モデル (LLM) に統合することで,人々が生成したコンテンツの検証に利用するかどうかが疑問視されている。本研究では,LLM生成コンテンツの評価において,検索結果の提供が参加者の認識精度と信頼度に与える影響について検討した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:26:36 GMT)
The Approximate Fisher Influence Function: Faster Estimation of Data Influence in Statistical Models [5.9]
モデル性能における無限小の変化の影響の定量化は、機械学習モデルの理解と改善に不可欠である。提案手法は,現在の手法よりも計算上の優位性が高いことを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:33:37 GMT)
Multi-view autoencoders for Fake News Detection [5.9]
本稿では,複数ビューオートエンコーダを用いて,偽ニュース検出のための共同特徴表現を生成することを提案する。フェイクニュースデータセットの実験では、個々のビューと比較して分類性能が大幅に向上した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:59:34 GMT)
Interpretable Automatic Rosacea Detection with Whitened Cosine Similarity [5.7]
国立ロザセア協会によると、約1600万人のアメリカ人がロザセアに苦しんでいる。白色コサイン類似度に基づく解釈可能な自動ロセア検出法を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:00:47 GMT)
LAPIS: A novel dataset for personalized image aesthetic assessment [5.5]
Leuven Art Personalized Image Set (LAPIS)は、パーソナライズされた画像美的評価のための新しいデータセットである。 LAPISは11,723枚の画像で構成され、美術史家とのコラボレーションによって慎重にキュレーションされた。既存の2つのPIAAモデルを実装し,その性能をLAPISで評価する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:42:56 GMT)
Localization Meets Uncertainty: Uncertainty-Aware Multi-Modal Localization [5.4]
本研究では、信頼できない3DoFのポーズ予測をフィルタリングするパーセンタイルに基づく拒絶戦略を導入する。実験結果から, より厳密な不確実性しきい値を適用することにより, ポーズ精度が向上することが示唆された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:07:24 GMT)
Learning Object Focused Attention [5.3]
本稿では,視覚変換器(ViT)のトレーニングに適応し,注意計算中の物体の明示的なモデリングを可能にすることを提案する。これは、オブジェクト中心の注意(OFA)損失と呼ばれる補助的な損失を計算する、選択された注意層に新しいブランチを追加することで達成される。実験結果から,OFAを用いたVTTは,基本モデルよりも優れた分類結果を示し,より強力な一般化能力を示し,汎用テクスチャによる素早い相関ではなく,対象形状に基づく表現を学習することがわかった。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:23:26 GMT)
Beyond LLMs: A Linguistic Approach to Causal Graph Generation from Narrative Texts [5.3]
本稿では,物語テキストから因果グラフを生成するための新しいフレームワークを提案する。本研究では,STAC分類モデルに統合された7つの言語的特徴からなる「エクササイズ指標」を提案する。 GPT-4o と Claude 3.5 を因果グラフの品質で一貫して上回っていることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:09:07 GMT)
Empowering Global Voices: A Data-Efficient, Phoneme-Tone Adaptive Approach to High-Fidelity Speech Synthesis [5.3]
本稿では,データ最適化フレームワークと高度な音響モデルを統合し,高品質なTTSシステムを構築する手法を提案する。本稿では,タイ語を実例として,複雑な音声規則とスパースリソースを効果的に扱う手法の有効性を実証する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:32:57 GMT)
How to Make LLMs Forget: On Reversing In-Context Knowledge Edits [5.3]
In-context knowledge editing (IKE) は、パラメータの変更なしに、かつゼロコストで、大規模言語モデル(LLM)出力の効率的な修正を可能にする。誤った情報や攻撃的な内容の挿入など、不適切な応答を操作するために誤用することができる。特別に調整された逆転トークンを用いたIKE-editsの逆転タスクについて紹介する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:23:08 GMT)
MedCT: A Clinical Terminology Graph for Generative AI Applications in Healthcare [5.3]
我々は,中国の医療コミュニティ,すなわちMedCTに対して,世界初の臨床用語を紹介した。 MedCTシステムは、中国の臨床データの標準化およびプログラム可能な表現を可能にする。我々は,他の非英語社会に対する臨床用語の実施など,十分な工学的詳細にアプローチを提示する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:29:10 GMT)
No-Go Theorems for Universal Quantum State Purification via Classically Simulable Operations [5.2]
量子状態浄化のための古典的にシミュレート可能な演算の限界について検討する。古典的にシミュレート可能な操作のみを用いた決定論的・確率的プロトコルは、普遍的な浄化を達成できないことを証明した。本研究は, 量子状態浄化における非安定化資源の役割と, 古典的にシミュレート可能な操作の限界を明らかにするものである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:03:10 GMT)
S$^2$-MAD: Breaking the Token Barrier to Enhance Multi-Agent Debate Efficiency [5.2]
マルチエージェント・ディベート(MAD)は、大規模言語モデル(LLM)の推論能力を高めるための実行可能なアプローチとして登場した。我々は,MAD内のトークンコストを削減するために,新しいスペーシフィケーション戦略を導入する。このアプローチは、エージェント間の情報交換や非生産的議論の非効率を最小化し、議論プロセスの全体的な効率を向上する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:29:35 GMT)
LauraTSE: Target Speaker Extraction using Auto-Regressive Decoder-Only Language Models [5.2]
LauraTSEは、ターゲット話者抽出(TSE)のための自動回帰デコーダ専用言語モデルである小規模な自動回帰デコーダのみの言語モデルを採用しており、混合語と参照語の両方の連続表現を取り入れている。一段階エンコーダのみの言語モデルは、混合情報と参照情報の両方を用いて予測された埋め込みの和を再構成する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:55:22 GMT)
Image registration of 2D optical thin sections in a 3D porous medium: Application to a Berea sandstone digital rock image [5.2]
本研究では,3次元ディジタルロックボリューム内に2次元の光学的薄断面像を配向させる方式を提案する。この方法は合成多孔質媒体上で検証され、正確に登録され、ベレア砂岩に適用される。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:52:03 GMT)
Quantum error detection in qubit-resonator star architecture [5.1]
恒星トポロジー超伝導QPUにおける2つの論理量子ビットを符号化する。我々は、すべての基数論理状態に対して96パーセント以上の論理状態の忠実度を測定する。提案したQPU構成は、キュービット数効率の良いQECコードを可能にするために使用できる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:39:48 GMT)
Zero-Shot Low-dose CT Denoising via Sinogram Flicking [5.1]
シングラムフリックに基づくゼロショット低線量CT画像撮影法を提案する。シングラム領域の共役X線の一部をランダムに交換することにより、一貫した内容を持つ大きなシングラムを生成するが、ノイズパターンが異なる。 ZS-NSNから適応した軽量モデルを用いて、同一内容の異なる異なる異なるノイズ分布を持つ一対のシングラムでネットワークを訓練する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:42:01 GMT)
Observable-manifested correlations in many-body quantum chaotic systems [5.0]
現実的な系では、可観測物の外対角要素の包絡関数は大きなデルタE$で指数関数的に崩壊するが、ランダム化されたモデルでは平坦となる傾向がある。我々は、ハミルトンの繊細な構造に由来するカオス固有状態の相関が、エンベロープ関数の非自明な構造において重要な役割を果たすことを示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:15:39 GMT)
A Novel Mamba-based Sequential Recommendation Method [4.9]
逐次レコメンデーション(SR)は、次のアクションを予測するためにユーザアクティビティをエンコードする。トランスフォーマーベースのモデルはシーケンシャルレコメンデーションに有効であることが証明されているが、トランスフォーマーにおける自己アテンションモジュールの複雑さは、シーケンス長と2次にスケールする。複数の低次元マンバ層と完全連結層を用いる新しいマルチヘッド潜在マンバアーキテクチャを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:43:19 GMT)
Comparing Next-Day Wildfire Predictability of MODIS and VIIRS Satellite Data [4.9]
我々は,1日前に広がる山火事の予報にVIIRSとMODISのデータがどの程度有効かを評価する。 VIIRSを入力とし、VNP14をターゲットとしたモデルが最良の結果を得る。我々は、MOD14は翌日の火災予報には適さないと結論し、VNP14の方がずっと良い選択肢であると結論付けた。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:03:37 GMT)
Efficient Formal Verification of Quantum Error Correcting Programs [4.9]
本稿では,量子誤り訂正(QEC)プログラムの効率的な検証フレームワークを提案する。提案するプログラムロジックをCoq証明アシスタントで定式化し,QEC検証器として検証する。検証された安定化器符号14のベンチマークを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:28:49 GMT)
Cat, Rat, Meow: On the Alignment of Language Model and Human Term-Similarity Judgments [4.9]
人間の類似性判断と表現的・行動的整合性を考慮した32の公開言語モデルの評価を行った。小さな言語モデルの表現でさえ、人間レベルのアライメントを実現することができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:59:57 GMT)
PRAD: Periapical Radiograph Analysis Dataset and Benchmark Model Development [4.8]
PRAD-10Kは根尖部X線画像解析のためのデータセットである。本データセットは, 専門歯科医が提供した画素レベルのアノテーションを用いて, 1万枚の近医用X線画像から構成する。我々はPRセグメンテーションタスクのベンチマークを構築するためにPRNetというDLネットワークを導入した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:58:58 GMT)
Deep Reinforcement Learning for Day-to-day Dynamic Tolling in Tradable Credit Schemes [4.8]
トレーダブル・クレジット・スキーム(TCS)は、混雑価格の代替としてますます研究されている。将来の設計と実装を支援するためのTCSのモデリングは、ユーザと市場の振る舞い、需要供給ダイナミクス、制御メカニズムに関わる課題と関連している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:04:28 GMT)
FAIR-SIGHT: Fairness Assurance in Image Recognition via Simultaneous Conformal Thresholding and Dynamic Output Repair [4.8]
本稿では,コンフォメーション予測と動的出力修復機構を組み合わせることで,コンピュータビジョンシステムの公平性を確保するためのポストホックフレームワークを提案する。提案手法は,予測誤差と公平性違反を同時に評価する,公平性を考慮した非整合性スコアを算出する。新しい画像の非整合スコアがしきい値を超えると、FAIR-SIGHTは分類のためのロジットシフトや検出のための信頼度補正など、対象とする修正調整を実行する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:23:06 GMT)
Hierarchical Modeling for Medical Visual Question Answering with Cross-Attention Fusion [4.8]
Med-VQA (Medicical Visual Question Answering) は、医療画像を用いて臨床的な疑問に答え、診断を支援する。本研究では, 詳細な医療質問に対する階層型プロンプティングと階層型アンサーデコーダの2つのモジュールを含むHiCA-VQA法を提案する。 Rad-Restructベンチマークの実験により、HiCA-VQAフレームワークは階層的なきめ細かい質問に答える上で、既存の最先端メソッドよりも優れていることが示されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:52:40 GMT)
WS-DETR: Robust Water Surface Object Detection through Vision-Radar Fusion with Detection Transformer [4.8]
水面オブジェクト検出は、ぼやけたエッジと多様なオブジェクトスケールの課題に直面します。既存のアプローチは、モデルの堅牢性に悪影響を及ぼす、クロスモーダルな機能競合に悩まされている。本稿では,SOTA(State-of-the-art)性能を実現する頑健なビジョンレーダ融合モデルWS-DETRを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:16:46 GMT)
S2R-HDR: A Large-Scale Rendered Dataset for HDR Fusion [4.7]
S2R-は、HDR融合のための最初の大規模な高品質な合成データセットであり、24,000個のHDRサンプルがある。我々は、様々な動的要素、モーションタイプ、ハイダイナミックレンジシーン、照明を含む、多様な現実的なHDRシーンを設計する。合成データと実世界のデータのギャップを埋めるために設計されたドメイン適応であるS2R-Adapterを紹介する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:39:56 GMT)
Late Breaking Results: Breaking Symmetry- Unconventional Placement of Analog Circuits using Multi-Level Multi-Agent Reinforcement Learning [4.7]
アナログレイアウトの非従来的設計空間を探索する目的駆動型マルチレベルマルチエージェントQ-ラーニングフレームワークを提案する。提案手法は,最先端のレイアウト技術よりも優れたバラツキ性能を実現する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:42:17 GMT)
Deep Generative Models for Physiological Signals: A Systematic Literature Review [4.7]
本稿では,生理的信号の深部生成モデルに関する体系的な文献レビューを行う。このレビューは、生理的信号に適用されたこれらのモデルの全体的な理解に寄与する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:55:50 GMT)
Adaptive Shrinkage Estimation For Personalized Deep Kernel Regression In Modeling Brain Trajectories [4.6]
そこで我々は,脳バイオマーカーの予測を行うための,パーソナライズされたディープカーネル回帰フレームワークを提案する。我々のアプローチでは、大きなコホートから脳の軌跡をキャプチャする集団モデルと、個々の軌跡をキャプチャする対象特異的モデルという2つの重要な要素を統合している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:13:44 GMT)
Augmented Shuffle Protocols for Accurate and Robust Frequency Estimation under Differential Privacy [4.5]
本稿では,DPとロバスト性を提供する3つの具体的なプロトコルを提案する。我々の最初のプロトコルは、二項分布から各項目のダミー値の数を生成する。第2のプロトコルは,新しいダミー数分布を導入することにより,第1のプロトコルの有用性を大幅に向上させる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:06:05 GMT)
CTSR: Cartesian tensor-based sparse regression for data-driven discovery of high-dimensional invariant governing equations [4.5]
本稿では,複雑な高次元支配方程式を明らかにするために,モンテカルロテンソルベーススパース回帰(CTSR)手法を提案する。 2次元(2次元)と3次元(3次元)の2つのテストケースの評価は,提案手法が精度と効率を向上することを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:06:29 GMT)
Geometry and Local Recovery of Global Minima of Two-layer Neural Networks at Overparameterization [4.4]
大域ミニマ付近の2層ニューラルネットワークにおける損失景観の幾何学について検討する。一般化誤差ゼロの大域的ミニマが、サンプルサイズが大きくなるにつれて、他の大域的ミニマと幾何的に分離されるかを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:56:57 GMT)
DiMSUM: Diffusion Mamba -- A Scalable and Unified Spatial-Frequency Method for Image Generation [4.4]
拡散モデルのための新しい状態空間アーキテクチャを提案する。入力画像の局所的特徴に対する帰納バイアスを高めるために,空間情報と周波数情報を利用する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:29:21 GMT)
Search-contempt: a hybrid MCTS algorithm for training AlphaZero-like engines with better computational efficiency [4.3]
本稿では,MCTS アルゴリズムの新たなハイブリッド版である Search-Contempt を紹介する。検索エンジンはOdds Chessのエンジンに大きな力を与えている。これは、より計算効率のよいセルフプレイベースのエンジンをトレーニングする可能性を開く。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:56:31 GMT)
An easily computable measure of Gaussian quantum imaginarity [4.3]
計算可能ガウス虚数測度 $mathcal IG_n$ for $n$-mode Gaussian system を提案する。既存の2つのガウス的虚性測度を持つ$mathcalIG_n$の比較分析は、$mathcalIG_n$が任意の$n$モードガウス状態の虚性をより効率的に検出できることを示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:21:48 GMT)
Conditional Data Synthesis Augmentation [4.3]
Conditional Data Synthesis Augmentation (CoDSA)は、マルチモーダルドメイン間のモデルパフォーマンスを改善するために高忠実度データを合成する新しいフレームワークである。合成データの現実性を高め,スパース領域の試料密度を高めるために,CoDSAファインチューン事前学習生成モデルを構築した。本稿では,合成サンプル量と対象領域割り当ての関数として,CoDSAが実現した統計的精度向上を定量化する理論的枠組みを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:38:11 GMT)
Lifetime-limited Gigahertz-frequency Mechanical Oscillators with Millisecond Coherence Times [4.3]
量子アプリケーションに必要なコヒーレンス時間は、フォノンデコヒーレンス(英語版)の物質起源を調査するために、極めて敏感な新しい技術を必要とする。我々は、非侵襲レーザー分光法と材料分析を組み合わせることで、結晶性媒体におけるフォノン脱コヒーレンスの鍵源を同定する。我々は、高周波量子メモリの基礎として、100ms以上のコヒーレンス時間への経路を同定する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:41:47 GMT)
Planning and Learning in Risk-Aware Restless Multi-Arm Bandit Problem [4.2]
レスレス・マルチアーム・バンディットでは、中央エージェントは複数のバンドイット(アーム)に限られたリソースを最適に分散させる。本研究では,リスク・アウェアネスを組み込むことにより,従来のレスレスト・マルチアーム・バンディット問題をリスクニュートラル目標に一般化する。我々は、リスク認識対象の指標可能性条件を確立し、Whittleインデックスに基づくソリューションを提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:35:40 GMT)
JEPA4Rec: Learning Effective Language Representations for Sequential Recommendation via Joint Embedding Predictive Architecture [4.2]
JEPA4Recはセマンティックにリッチで転送可能な表現をキャプチャし、レコメンデーションパフォーマンスを改善する。我々は、レコメンデーションデータセットの項目情報をキャプチャするのに適した、修正された埋め込み層を備えた双方向トランスフォーマーエンコーダを採用している。 6つの実世界のデータセットの実験は、JEPA4Recが一貫して最先端のメソッドを上回っていることを示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:31:11 GMT)
MARS: a Multimodal Alignment and Ranking System for Few-Shot Segmentation [4.1]
我々は,マルチモーダルキューを利用してマスクの提案を頑健にフィルタリング・マージする,プラグアンドプレイランキングシステムMARSを提案する。ローカルおよびグローバルレベルで計算されたマルチモーダルスコアを用いて提案手法を評価する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:53:23 GMT)
Minmax Trend Filtering: Generalizations of Total Variation Denoising via a Local Minmax/Maxmin Formula [4.1]
総変分分解法 (TVD) は, 基本偏差・平滑化法である。本稿では,2つの推定器を生成する局所的なminmax/maxmin式を新たに同定する。そこで本研究では,TVD/MTF推定器の局所的定義により,ポイントワイド推定誤差の有界化が可能となることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:25:03 GMT)
Independence Is Not an Issue in Neurosymbolic AI [4.0]
ニューロシンボリックAIに対する一般的なアプローチは、ニューラルネットワークの最後のレイヤの出力をスパース計算グラフに渡すことである。これは、互いに条件的に独立なランダム変数の集合上の確率分布を誘導する。決定論的偏見の現象は,ニューロシンボリックAIを不適切に適用した成果であることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:28:36 GMT)
Investigating Vision-Language Model for Point Cloud-based Vehicle Classification [3.9]
大型トラックは、大型で操作性に制限があるため、重要な安全上の課題を生じさせる。従来のLiDARベースのトラック分類手法は広範な手動アノテーションに依存している。本研究では,ロードサイドのLiDARポイントクラウドデータと視覚言語モデルを統合する新しいフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 22:37:27 GMT)
Abnormal Mutations: Evolution Strategies Don't Require Gaussianity [3.9]
本稿では,(1+1)-ESからCMA-ESまで,幅広い進化戦略が同等の最適化性能を示すことを実証的に示す。これらの結果は、スフィアモデルだけでなく、より広範なベンチマーク問題にも当てはまる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:53:42 GMT)
ReXCL: A Tool for Requirement Document Extraction and Classification [3.9]
ReXCLツールは、要求工学における抽出と分類プロセスを自動化する。性能評価は、ReXCLが要求管理の効率と正確性を大幅に改善することを示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:46:54 GMT)
QuanEstimation.jl: An open-source Julia framework for quantum parameter estimation [3.8]
量子パラメータ推定におけるスキーム評価と設計のためのオープンソースのJuliaフレームワークであるQuanEstimation.jlを紹介する。独立パッケージとしても、最近開発されたハイブリッド言語(Python-Julia)パッケージQuanEstimationの計算コアとしても使用できる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:33:10 GMT)
Compositional Flows for 3D Molecule and Synthesis Pathway Co-design [3.7]
コンポジション生成フロー(CGFlow)は、フローマッチングを拡張して、コンポジションステップでオブジェクトを生成する新しいフレームワークである。生成フローネットワーク(GFlowNets)の理論的基盤を構築し,構成構造の報酬誘導サンプリングを可能にする。 CGFlowを合成可能な薬物設計に適用し、分子の合成経路と3D結合のポーズを共同で設計する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:10:34 GMT)
MMLA: Multi-Environment, Multi-Species, Low-Altitude Aerial Footage Dataset [3.7]
ドローン画像のリアルタイム野生生物検出は、動物生態学、保全、生物多様性監視など、多くの応用に欠かせない。我々は,新しい多種多環境低高度空中映像(MMLA)データセットを提案する。その結果, 種別検出の差異は, 地域間で有意な相違が認められた。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:40:27 GMT)
A Rate-Distortion Perspective on Quantum State Redistribution [3.7]
量子状態再分配タスクの速度歪みバージョンを考えると、復号された状態の誤差は加法歪み測定によって判断される。自由絡み付き圧縮スキームの速度歪み関数に対する単一文字式を導出する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:21:52 GMT)
2D-Curri-DPO: Two-Dimensional Curriculum Learning for Direct Preference Optimization [3.7]
2D-Curri-DPOは、Prompt Complexity(PC)とPairwise Distinguishability(Pairwise Distinguishability)を共同でモデル化する2次元カリキュラムを採用した新しいフレームワークである。我々の手法はUltraFeedbackのような挑戦的なテストセットに対して最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:32:00 GMT)
Proactive User Information Acquisition via Chats on User-Favored Topics [3.7]
本研究では,PIVOTタスクを提案する。近年の大規模言語モデル (LLM) においても PIVOT タスクの成功率が低いことが判明した。本研究は,本データセットの分析から得られた知見を組み込むことにより,本タスクの簡易かつ効果的なシステムを開発した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:32:16 GMT)
ChronoFormer: Time-Aware Transformer Architectures for Structured Clinical Event Modeling [3.7]
本稿では, 経時的依存関係を符号化し, 利用するための革新的なトランスフォーマーアーキテクチャであるChronoFormerを提案する。 3つのベンチマークタスク予測、読み出し予測、長期的協調性オンセットで実施された広範囲な実験は、最先端の手法よりも大幅に改善されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:25:41 GMT)
On Model and Data Scaling for Skeleton-based Self-Supervised Gait Recognition [3.6]
ビデオストリームからの歩行認識は、コンピュータビジョンバイオメトリックスにおいて難しい問題である。近年の自己教師型事前訓練の進歩は、堅牢な歩行認識モデルの開発につながっている。骨格に基づく自己教師あり歩行認識における最初の実験的検討を行った。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:51:22 GMT)
FairEval: Evaluating Fairness in LLM-Based Recommendations with Personality Awareness [3.6]
推薦システムにおける公平性を評価するための新しい評価フレームワークであるFairEvalを紹介する。音楽や映画のレコメンデーションに基づいてChatGPT 4oやGemini 1.5 Flashなどのモデルを評価する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:38:15 GMT)
A partial likelihood approach to tree-based density modeling and its application in Bayesian inference [3.4]
確率分布のツリーベースの事前は、通常、サンプル空間の候補分割の所定のデータ非依存のコレクションを使用して指定される。サンプル空間全体にわたって、未知のターゲット密度を詳細に特徴づけるためには、候補分割は、潜在的にゼロでないサンプリング確率でサンプル空間のすべての領域に深く展開する能力を持つ必要がある。伝統的な知恵は、ベイズ的推論においてコヒーレントな可能性に基づく推論を保証するために、この妥協は避けられないことを示唆している。そこで本研究では,Coxの部分的可能性を用いて,データ依存型の分割を許容しながら,コヒーレンシを復元する簡単な手法を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:51:35 GMT)
CoServe: Efficient Collaboration-of-Experts (CoE) Model Inference with Limited Memory [3.4]
GPT-4のような大規模言語モデルは資源集約型であるが、近年の進歩により、より小さな専門的な専門家が特定のタスクにおいてそれらより優れていることが示唆されている。 Collaboration-of-Expertsアプローチは、複数のエキスパートモデルを統合し、生成された結果の精度を改善し、精度クリティカルなアプリケーションに対して大きなポテンシャルを提供する。メモリが制限された異種CPUおよびGPU上での効率的なCoEモデルサービスシステムであるCoServeを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:58:15 GMT)
GauRast: Enhancing GPU Triangle Rasterizers to Accelerate 3D Gaussian Splatting [3.3]
3D Gaussian Splatting (3DGS)は高品質な3Dレンダリング手法である。 3DGSを加速するためのこれまでの取り組みは、相当な統合オーバーヘッドとハードウェアコストを必要とする専用のアクセラレータに依存していた。本研究では、3DGSパイプラインと高度に最適化された従来のグラフィックスパイプラインの類似性を活用する加速度戦略を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:43:24 GMT)
From Observation to Orientation: an Adaptive Integer Programming Approach to Intervention Design [3.3]
独自の適応的介入設計パラダイムが提示され、因果方向の非循環グラフ(DAG)が実用的な予算的考察によって効果的に回収される。反復整数プログラミング(IP)アプローチが提案され、必要な実験の数を劇的に削減する。その結果,適応型IP手法は,ランダムな介入ベースラインよりも介入反復や変動操作が少なく,完全な因果グラフ回復を実現することがわかった。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:34:55 GMT)
Nonlocal Retinex-Based Variational Model and its Deep Unfolding Twin for Low-Light Image Enhancement [3.2]
本稿では,Retinex分解に基づく低照度画像強調のための変分法を提案する。低照度画像に色補正前処理ステップを適用し、分解時に観察された入力として使用する。我々は、演算子を学習可能なネットワークに置き換える深層展開モデルを導入することにより、モデルを拡張する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:48:26 GMT)
FedECA: A Federated External Control Arm Method for Causal Inference with Time-To-Event Data in Distributed Settings [3.2]
外部制御アーム(ECA)は、実験薬の初期臨床開発を知らせることができる。 ECAは、規制承認の有効な証拠を提供することができる。 ECAを実装する上での大きな課題は、現実世界または歴史的な臨床試験データにアクセスすることである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:14:50 GMT)
Unifying and extending Diffusion Models through PDEs for solving Inverse Problems [3.1]
拡散モデルは、コンピュータビジョンと科学機械学習(SciML)に応用された強力な生成ツールとして登場した。伝統的に、これらのモデルは変分推論、復調、統計信号処理、微分方程式の原理を用いて導出されてきた。本研究では,線形偏微分方程式からアイデアを用いた拡散モデルを導出し,このアプローチにはいくつかの利点があることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:07:36 GMT)
S2Vec: Self-Supervised Geospatial Embeddings [3.1]
本稿では,埋め込み学習のための自己教師型フレームワークであるS2Vecを紹介する。 S2VecはS2ライブラリを使用して、大きな領域を個別のS2細胞に分割し、Geometryizesはセル内に構築された特徴ベクトルをイメージとして配置し、それらの画像にマスク付きオートエンコーディングを適用して特徴ベクトルをエンコードする。我々はS2Vecを3つの大規模社会経済予測タスクで評価し、最先端の画像ベース埋め込みに対する競争性能を示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:16:02 GMT)
Information Gain Is Not All You Need [3.1]
未知の事を知ることなく最善策を評価することは困難である。これまでの研究では、情報獲得の見積もりを改善することで、欲張りの行動につながることが示されている。本稿では,ロボットに近いが,他の候補状態から遠く離れた候補状態を優先して,バックトラッキングを低減する手法を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:43:00 GMT)
Cooperation Is All You Need [3.0]
コラボレーターは、新皮質の文脈に敏感な錐体ニューロンにインスパイアされている。トランスフォーマーは、インテグレート・アンド・ファイアの「ポイント」ニューロンの長期的概念に基づいている。 Cooperatorに基づくアルゴリズムは、同じ数のパラメータを持つ場合でも、Transformerに基づくアルゴリズムよりもはるかに高速に学習する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:34:57 GMT)
HACMony: Automatically Testing Hopping-related Audio-stream Conflict Issues on HarmonyOS [3.0]
本稿では,Hopping-related Audio-stream Conflict (HAC) 問題の自動検出手法を提案する。音声ストリームのためのHarmonyOSのアプリホッピング機構の操作的セマンティクスを初めて形式化した。この手法をHACMonyというツールで実装し,実世界20のHarmonyOSアプリケーションで評価した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:55:08 GMT)
An Efficient Classical Algorithm for Simulating Short Time 2D Quantum Dynamics [2.9]
本稿では,2次元量子システムにおける短時間のダイナミクスをシミュレーションする,効率的な古典的アルゴリズムを提案する。この結果から, 短時間2次元量子力学の複雑さに固有の単純さが明らかとなった。この研究は、古典計算と量子計算の境界についての理解を深める。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:33:10 GMT)
MALIBU Benchmark: Multi-Agent LLM Implicit Bias Uncovered [2.9]
我々は,マルチエージェントシステムが社会的バイアスやステレオタイプを暗黙的に補強する程度を評価するために開発された新しいベンチマークであるMALIBUを提案する。本研究は, LLM生成出力の偏差を定量化し, 偏差緩和が真の中立性よりも限界化されたペルソナを優先することを明らかにする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:16:40 GMT)
Cache-a-lot: Pushing the Limits of Unsatisfiable Core Reuse in SMT-Based Program Analysis [2.9]
Satisfiability Modulo Theories (SMT) は、ココリックやシンボリックな実行のようなプログラム分析技術に不可欠な解法である。キャッシュ・ア・ロット(Cache-a-lot)という新しい手法を提案し,全ての可能な変数置換を体系的に検討することによって,不満足な(不満足な)結果の再利用を拡大する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:43:42 GMT)
Probability Estimation and Scheduling Optimization for Battery Swap Stations via LRU-Enhanced Genetic Algorithm and Dual-Factor Decision System [2.8]
本研究では,充電杭データに基づく確率推定モデルを提案し,9つのシナリオ固有の電池交換需要データセットを構築した。これは、グローバル最適化機能を効果的に強化するガイド付き検索機構を組み込んでいる。即時スワップ・アンド・チャージ戦略に対するベンチマークでは,最大で13.96%のコスト削減を実現している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:58:24 GMT)
Semantically Encoding Activity Labels for Context-Aware Human Activity Recognition [2.8]
LMを利用してCA-HAR活動ラベルを符号化し,意味的関係を捉えるSEALを提案する。我々の研究は、より高度なLMをCA-HARタスクに統合する新たな可能性を開く。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:30:07 GMT)
Enhanced Question-Answering for Skill-based learning using Knowledge-based AI and Generative AI [2.7]
我々は、テレロジカル、因果、構成原理を具現化した説明を生成するインテリジェントエージェントであるIvyを紹介する。これにより、学習者はオンライン環境において効果的な問題解決に不可欠なスキルを包括的に理解することが可能になる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:25:52 GMT)
RL-STaR: Theoretical Analysis of Reinforcement Learning Frameworks for Self-Taught Reasoner [2.6]
自己学習推論器(STaR)は強化学習を用いて推論ステップを自動生成する。 STaRとその変種は経験的成功を示しているが、これらの改善を説明する理論的基盤は欠如している。この研究は、CoT推論とSTaRにおける強化学習の有効性を理解するための理論的枠組みを提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 00:52:09 GMT)
Evaluating Large Language Models on Multiword Expressions in Multilingual and Code-Switched Contexts [2.5]
本研究では,現在最先端の言語モデルが,潜在的に慣用的なマルチワード表現のあいまいさをどのように処理するかを評価する。大きな言語モデルは、その強みにも拘わらず、ニュアンスド言語に苦戦している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:39:28 GMT)
Datum-wise Transformer for Synthetic Tabular Data Detection in the Wild [2.5]
トランスフォーマーアーキテクチャを導入し,既存モデルよりも優れた性能を示す。また,本モデルの有効性を高めるため,ドメイン適応手法の適用について検討する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:01:34 GMT)
Beating Transformers using Synthetic Cognition [2.5]
認知アーキテクチャを開発するための新しいアプローチ、Synthetic Cognitionが提案され、即時反応の振る舞いを開発するために実装されている。そこで本研究では,最近実施されているSynthetic Cognitionの配列に対処する機構を提案し,DNA配列分類タスクにおけるDNA基盤モデルと比較した。シーケンスに対処するためにSynthetic Cognitionを拡張することと、シーケンス分類のためのTransformerアーキテクチャを破ることの2つの目標を達成する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:07:05 GMT)
Brains vs. Bytes: Evaluating LLM Proficiency in Olympiad Mathematics [2.5]
大規模言語モデル(LLM)は、数学的推論タスクにおいて顕著な進歩を示している。大規模言語モデル(LLM)の最近の進歩は、数学的推論タスクの顕著な進歩を示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:43:23 GMT)
Porting an LLM based Application from ChatGPT to an On-Premise Environment [2.5]
本稿では,ChatGPTを用いたリアルタイムアプリケーションのオンプレミス環境への移植過程について検討する。移植プロセスにおける主な考慮事項は、オープンソースモデルの透明性とハードウェアコストである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:29:26 GMT)
P-Transformer: A Prompt-based Multimodal Transformer Architecture For Medical Tabular Data [2.5]
医用表データに特化して設計されたマルチモーダルアンダーライントランスフォーマアーキテクチャであるPTransformerを提案する。このフレームワークは、構造化データと非構造化データの両方から、多彩なモダリティを調和した言語意味空間に効率的にエンコードする。 PTransformerは、RMSE/MAEで10.9%/11.0%、RMSE/MAEで0.5%/2.2%、BACC/AUROCで1.6%/0.8%の改善を実証した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:24:36 GMT)
Theoretical study on rotation measurement with a quantum vibration oscillator based on Penning trapped ions [2.4]
本研究では,コリオリ力誘起軸発振振幅を精度良く測定し,入力速度を推定した。イオン結晶の軸方向における質量運動の中心は、イオンのスピンとレーザーによる調和運動との絡み合いによって正確に検出できる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:32:05 GMT)
ContrastiveGaussian: High-Fidelity 3D Generation with Contrastive Learning and Gaussian Splatting [2.4]
コントラスト学習を生成過程に統合するContrastiveGaussianを提案する。知覚的損失を用いることで、視覚的不整合を利用して3D生成品質を向上させることにより、正と負のサンプルを効果的に区別する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:56:09 GMT)
X-DECODE: EXtreme Deblurring with Curriculum Optimization and Domain Equalization [2.3]
鮮やかなぼやけた画像の復元は、コンピュータビジョンにとって依然として大きな課題だ。本稿では,カリキュラム学習に基づく新たな学習戦略を導入し,画像の極端劣化に対する深層学習モデルの堅牢性を改善する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:59:26 GMT)
Deep Learning Meets Teleconnections: Improving S2S Predictions for European Winter Weather [2.3]
季節と季節の時間スケールの予測は2週間から2ヶ月である。成層圏極渦(SPV)やマデン=ジュリア振動(MJO)のようなテレコネクションは、予測可能性を高める窓を提供する。我々は、北大西洋-欧州の気象状況を予測するためのディープラーニングアーキテクチャを開発し、評価した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:23:07 GMT)
Subjective Visual Quality Assessment for High-Fidelity Learning-Based Image Compression [2.3]
JPEG AIC-3 手法を用いて,JPEG AI 圧縮画像の包括的主観的品質評価を行う。強化された3重項比較と平易な3重項比較に基づく統一モデルを用いて,JNDに基づく品質尺度を再構築した。 CVVDPの指標は全体の最高性能を達成したが、CVDPを含むほとんどの指標はJPEG AI圧縮画像の品質予測において過度に楽観的であった。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:37:08 GMT)
Heart Failure Prediction using Modal Decomposition and Masked Autoencoders for Scarce Echocardiography Databases [2.1]
心臓病は国際的機能不全の主な原因である。毎年約1800万人が心臓病で死亡している。本研究では, 心不全の予測に難渋する課題に対して, リアルタイム心エコービデオシーケンスを解析する自動システムを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:57:09 GMT)
Space to Policy: Scalable Brick Kiln Detection and Automatic Compliance Monitoring with Geospatial Data [2.1]
れんがはインドの大気汚染の8-14%に寄与している。エミッション・インベントリは、大気の質のモデリングと源泉の調整研究に不可欠である。我々は5つの州で30638個のレンガキルンを検出し分類するスケーラブルな機械学習パイプラインを開発した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:47:45 GMT)
Automated Video-EEG Analysis in Epilepsy Studies: Advances and Challenges [2.0]
てんかんは通常、脳波(EEG)と長期ビデオEEG(vEEG)モニタリングによって診断される。機械学習の最近の進歩は、脳波とビデオデータを用いたリアルタイムの発作検出と予測において有望であることを示している。本稿では,ビデオ-EEG自動解析の最近の展開を概観し,マルチモーダルデータの統合について論じる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:16:31 GMT)
ChatGPT as Linguistic Equalizer? Quantifying LLM-Driven Lexical Shifts in Academic Writing [2.0]
本研究では,ChatGPT が OpenAlex (2020-2024) から280万項目にわたる語彙的複雑性変化を解析し,障壁を緩和し,株式を育むかを検討する。記事レベルの制御やオーサリングパターン,会場規範を制御した後でも,ChatGPTはNNESによる抽象表現の語彙的複雑さを著しく向上させることを示した。これらの知見は、ChatGPTが言語格差を減らし、グローバルなアカデミックにおけるエクイティを促進するという因果的証拠である。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:11:24 GMT)
Enhancements for Developing a Comprehensive AI Fairness Assessment Standard [2.0]
本稿では、画像、非構造化テキスト、生成AIの公平性評価を含むTEC標準の拡張を提案する。これらの次元を取り入れることで、強化されたフレームワークは、さまざまな分野にわたる責任と信頼性のあるAIデプロイメントを促進する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:24:23 GMT)
Quantum Error Detection For Early Term Fault-Tolerant Quantum Algorithms [2.0]
本稿では,量子アルゴリズムのフォールトトレラントコンパイルとシミュレーションのためのフレームワークを提案する。最適なシンドロームスケジュールを見つけることは、アルゴリズムの成功確率を平均6.7倍改善する。本稿では,フォールトトレラントコンパイルパラメータを予測するための単純なデータ駆動型手法を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:59:40 GMT)
Infinity-norm-based Input-to-State-Stable Long Short-Term Memory networks: a thermal systems perspective [1.9]
リカレントニューラルネットワーク(RNN)は,システム識別において顕著な性能を示した。安定は実用上重要な課題です ISS$_infty$-promoted LSTM は物理モデルと ISS$_infty$-promoted Gated Recurrent Unit (GRU) ネットワークの両方より優れている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:46:02 GMT)
Soybean Disease Detection via Interpretable Hybrid CNN-GNN: Integrating MobileNetV2 and GraphSAGE with Cross-Modal Attention [1.9]
大豆の葉の病原体の検出は農業の生産性にとって重要であるが、視覚的に類似した症状と限定的な解釈可能性のために課題に直面している。本稿では,局所化特徴抽出のためのMobileNetV2とリレーショナルモデリングのためのGraphSAGEを相乗化する,解釈可能なハイブリッドCNN-Graph Neural Network(GNN)フレームワークを提案する。クロスモーダル解釈はGrad-CAMおよびEigen-CAMビジュアライゼーションを通じて実現され、熱マップを生成して疾患の流入領域をハイライトする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:14:17 GMT)
When Counterfactual Reasoning Fails: Chaos and Real-World Complexity [1.9]
構造因果モデルの枠組みにおける反実的推論の限界について検討する。低次モデル不確実性やカオス力学といった現実的な仮定は、直観に反する結果をもたらす。この研究は、カオスと不確実性を特徴とする設定に反実的推論を適用する際に注意を促している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:30:12 GMT)
Double Machine Learning for Causal Inference under Shared-State Interference [1.9]
市場やレコメンデーションシステムを介してユニットが相互作用する環境では、ユニットは特定の共有状態に影響を受けます。我々はこの構造を形式化し、これを共有状態干渉と呼び、我々の定式化は多くの関連する設定を捉えていると主張する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:45:53 GMT)
Self-correcting GKP qubit and gates in a driven-dissipative circuit [1.9]
自己補正GKP量子ビットは、抵抗に結合した高インピーダンスLC回路と、制御可能なスイッチを介してジョセフソン接合により実現可能であることを示す。スイッチの適切な制御と超電流測定による読み出し/初期化により実装された,指数関数的に堅牢な単一量子クリフォードゲートを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:04:24 GMT)
Min-Max Optimisation for Nonconvex-Nonconcave Functions Using a Random Zeroth-Order Extragradient Algorithm [1.9]
制約なし、制約なし、差別化可能、差別化不可能な設定も検討する。制約のない問題に対して、ZO-EGアルゴリズムのNC-NC目的関数の$epsilon$-stationary点近傍への収束を確立する。非微分可能の場合、目的関数の滑らかなバージョンのエプシロン$定常点の近傍へのZO-EGアルゴリズムの収束を証明する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:15:30 GMT)
Critical Challenges and Guidelines in Evaluating Synthetic Tabular Data: A Systematic Review [1.9]
この体系的なレビューは、信頼性、妥当性、およびそれらの適切な使用を保証するために、合成健康データの厳密な評価の重要性に光を当てている。 1766論文のスクリーニングと101論文の詳細なレビューに基づいて、評価方法に対するコンセンサスの欠如、評価指標の不正使用、ドメインエキスパートからの限られた入力、データセット特性の報告不足など、重要な課題を特定した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:48:20 GMT)
Representation Meets Optimization: Training PINNs and PIKANs for Gray-Box Discovery in Systems Pharmacology [1.8]
物理インフォームド・コルモゴロフネットワーク (PIKANs) は、オリジナルの多層パーセプトロンベースの物理インフォームドネットワーク (PINNs) に対抗して注目されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:37:18 GMT)
Performance of Rank-One Tensor Approximation on Incomplete Data [1.8]
本研究は, スペクトル解析により再構成性能にアクセス可能なランダム行列モデルに還元可能であることを示す。これらの結果は、そのエントリのランダム部分の削除によるテンソルのメモリコストの人工的削減によって引き起こされるパフォーマンスの損失に光を当て、特定する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:57:09 GMT)
GPT Carry-On: Training Foundation Model for Customization Could Be Simple, Scalable and Affordable [1.8]
既存の大規模言語基盤モデル(LLM)の利点をフル活用するためのフレームワークを提案する。予め訓練されたLLMを最終層に埋め込んだ上で,トランスフォーマーブロックの追加ブランチをトレーニングし,その後,キャリーオンモジュールがベースモデルをマージして,カスタマイズされたLLMを構成する。ベースモデルはパラメータを更新する必要がないため、推論ノード上でトレーニングジョブのほとんどの計算をアウトソースすることが可能です。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:15:40 GMT)
Cellular Development Follows the Path of Minimum Action [1.8]
細胞発達は, 自然界の力学系を支配する基礎的物理法則と整合して, 最小作用の経路に従うことが示唆された。本稿では,最小アクションの原理と最大エントロピーの深い関係を利用して,トランスフォーマーアーキテクチャを用いた発達過程をモデル化する計算フレームワークを提案する。本手法を単細胞および胚発生データセットにまたがって検証し,細胞内決定を形作る隠蔽熱力学および情報的制約を明らかにする能力を実証した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:44:29 GMT)
Dynamics of collective minds in online communities [1.7]
オンラインニュースコミュニティにおける集団精神が、様々な編集課題設定プラクティスやコミュニティダイナミクスの側面にどのように影響されるかを示す。我々は、アメリカの5つのオンラインニュースプラットフォームにおける4億件のコメントと大規模な調査から得られたデータを校正し、検証し、集合心の計算モデルを開発する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 22:22:40 GMT)
SaRoHead: A Dataset for Satire Detection in Romanian Multi-Domain News Headlines [1.7]
SaRoHeadはルーマニアの多ドメインニュースの見出しで風刺検出のための最初のコーパスである。以上の結果から,ノンサチリカルな見出しで使用されるクリックベイトがモデルに大きく影響していることが示唆された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:03:29 GMT)
Novel Pooling-based VGG-Lite for Pneumonia and Covid-19 Detection from Imbalanced Chest X-Ray Datasets [1.7]
本稿では,Chest X-Ray(CXR)データセットにおけるクラス不均衡問題を軽減するために,新しいプール型VGG-Liteモデルを提案する。提案するフレームワークを2つの別々のCXRデータセット上に実装した。このフレームワークは、95%の精度、97.1%の精度、96.1%のリコール、96.6%のF1スコアを達成した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:38:46 GMT)
Electronic Warfare Cyberattacks, Countermeasures and Modern Defensive Strategies of UAV Avionics: A Survey [1.7]
無人航空機(UAV)は、現代の自律飛行において重要な役割を担っている。 UAVミッションの成功は、電子戦の様々な側面を効果的に緩和することに依存する。本稿では,UAVのサイバー攻撃,対策,防衛戦略について概観する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 00:56:52 GMT)
PhaseGen: A Diffusion-Based Approach for Complex-Valued MRI Data Generation [1.7]
磁気共鳴イメージング(MRI)の生データ(k空間データ)は複雑に評価され、大きさと位相情報の両方を含む。我々は、大容量画像に条件付けされた合成MRI生データを生成するための、複素数値拡散モデルである$textitPhaseGen$を紹介した。以上の結果から, 合成位相データによるトレーニングは, 実世界のデータにおける頭蓋骨切断の一般化を著しく向上させることが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:44:19 GMT)
Test Amplification for REST APIs via Single and Multi-Agent LLM Systems [1.6]
単一エージェントとマルチエージェントのLLMシステムがREST APIテストスイートを増幅する方法について示す。評価では、APIカバレッジの向上、テスト中のAPIの多数のバグの特定、および両アプローチの計算コストとエネルギー消費に関する洞察を示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:19:50 GMT)
Data over dialogue: Why artificial intelligence is unlikely to humanise medicine [1.6]
医療MLシステムは、これらの関係を改善させるよりも、その関係に悪影響を及ぼす可能性が高い、と私は主張する。特に、医療MLシステムの使用は、臨床医と患者の信頼、ケア、共感、理解、コミュニケーションの質を構成する可能性が高いと私は考えます。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:03:40 GMT)
Entropy Collapse in Mobile Sensors: The Hidden Risks of Sensor-Based Security [1.6]
複数のアプリケーションコンテキストにまたがる4つの多様なデータセットにわたるモバイルセンサデータのエントロピーを系統的に分析する。シャノンエントロピーは複数の倍数であるにもかかわらず, 単一センサの平均ミンエントロピー値は3.408-4.483ビット (S.D.=1.018-1.574) である。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:53:17 GMT)
Interplay between Federated Learning and Explainable Artificial Intelligence: a Scoping Review [1.6]
フェデレーション学習(FL)と説明可能な人工知能(XAI)は、分散データからモデルをトレーニングし、プライバシの本質的な側面を保持しながら内部動作を説明することができる。このスコーピングレビューは、FLとXAIを共同で扱う出版物をマッピングし、FLとモデル解釈可能性またはポストホックの説明を報告した出版物に焦点を当てた。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:21:56 GMT)
Heralded qudit-based high-dimensional entanglement generation for hybrid photon-emitter system by waveguide-mediated scattering [1.6]
量子エンタングルメントシステムによる量子情報処理(QIP)における高次元(HD)状態空間の拡張と損失耐性の向上異なる入力ポートを入力することで、ハイブリッド光子エミッタシステムのためのランダムな4次元2量子最大絡み合わせを生成するフレキシブルなスキームを提案する。 quditエンコードされたハイブリッドHDエンタングルメントは、補助クォーディットなしで量子リソースをエコノマイズする利点を提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:12:41 GMT)
DragPoser: Motion Reconstruction from Variable Sparse Tracking Signals via Latent Space Optimization [1.6]
DragPoserは、新しいディープラーニングベースのモーションリコンストラクションシステムである。ハードでダイナミックな制約を正確に表現します。自然なポーズと時間的コヒーレントな動きを生み出す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:42:57 GMT)
Digital quantum simulation of the Su-Schrieffer-Heeger model using a parameterized quantum circuit [1.5]
パラメータ化量子回路を用いてSu-Schrieffer-Heegerモデルのディジタル量子シミュレーションを行う。エネルギー・絡み合いエントロピー・相互情報の非自明な基底状態への進化について検討する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:54:10 GMT)
Immersive Virtual Reality Assessments of Working Memory and Psychomotor Skills: A Comparison between Immersive and Non-Immersive Assessments [1.5]
没入型バーチャルリアリティ(VR)は、生態学的妥当性を高め、直感的で人間工学的なハンドインタラクションを促進する。本研究は,VRによる評価とPCによる評価の収束妥当性,ユーザエクスペリエンス,ユーザビリティについて検討する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:08:27 GMT)
DWFS-Obfuscation: Dynamic Weighted Feature Selection for Robust Malware Familial Classification under Obfuscation [1.5]
本稿では,特徴の重要性と安定性を解析する動的重み付き特徴選択法を提案する。次に,グラフニューラルネットワークを分類に利用し,検出システムの堅牢性と精度を向上させる。実験により,提案手法は難読データセットで95.56%,難読データセットで92.28%のF1スコアを達成した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:37:43 GMT)
Explainable AI-Enhanced Deep Learning for Pumpkin Leaf Disease Detection: A Comparative Analysis of CNN Architectures [1.5]
この研究は、2000枚の高解像度画像を5つのカテゴリに分けた「パンプキンリーフ病データセット」を用いている。データセットは、モデルトレーニングの強力な表現を保証するために、いくつかの農業分野から厳格に組み立てられた。我々は、DenseNet201、DenseNet121、DenseNet169、Xception、ResNet50、ResNet101、InceptionResNetV2を含む多くの熟練したディープラーニングアーキテクチャを調査し、ResNet50が90.5%の精度と同等の精度、リコール、F1-Scoreで最も効果的に実行されたことを観察した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:35:24 GMT)
Large-Scale (Semi-)Automated Security Assessment of Consumer IoT Devices -- A Roadmap [1.5]
IoT(Internet of Things)は、さまざまな分野に急速に拡大し、コンシューマIoTデバイスが成長している。共通して簡単に発見できる脆弱性により、IoTデバイスは悪意のあるアクターのターゲットとなる。本稿では、現在のIoTセキュリティ課題とアセスメントの取り組みをレビューし、ギャップを特定し、スケーラブルで自動化されたセキュリティアセスメントのロードマップを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:44:01 GMT)
The Urban Impact of AI: Modeling Feedback Loops in Next-Venue Recommendation [1.4]
次世代のレコメンデータシステムは、ロケーションベースのサービスにますます組み込まれている。我々は,次世代の勧告を支える人間とAIのフィードバックループをモデル化するためのシミュレーションフレームワークを提案する。当社のフレームワークは,次回の勧告でフィードバックループを運用し,AI支援モビリティの社会的影響を評価するための新たなレンズを提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:15:50 GMT)
Simulating quantum dynamics in two-dimensional lattices with tensor network influence functional belief propagation [1.4]
我々は,TN-IF法を木格子上に構築し,TN-IFに対する信念伝搬(BP)アルゴリズムを提案することにより,TN-IF法の適用性を2次元格子に拡張する。本研究では, IF-BPのクラスタ展開のパワーを2次元逆場イジングモデルの量子力学のクエンチで示し, 現状を改善する数値的な結果を得る。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 00:04:32 GMT)
Smoothed Distance Kernels for MMDs and Applications in Wasserstein Gradient Flows [1.4]
K(x,y) := - |x-y|$ は統計学における最大平均誤差 (MMD) の定義に用いられた。本稿では, 負距離カーネルの次数 1 の条件正定値として好適な特性を保った新しいカーネルを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:57:33 GMT)
AttentionDefense: Leveraging System Prompt Attention for Explainable Defense Against Novel Jailbreaks [1.3]
脱獄の悪質性の背後にある理由を説明するのは難しい。そこで本稿では,Small Language Models (SLM) からのシステム・プロンプト・アテンションを用いて,敵対的プロンプトを特徴付ける手法を提案する。本研究は、LMが悪意ある入力にどう反応するかを理解し説明するために、注意機構が不可欠であることを示唆している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 22:29:23 GMT)
Quantum-Inspired Genetic Algorithm for Robust Source Separation in Smart City Acoustics [1.3]
本稿では、ソース分離のための新しい量子インスパイアされた遺伝的アルゴリズム(p-QIGA)を提案する。 p-QIGAは、スマートシティの音響シーン分析を強化するために、量子情報理論からインスピレーションを得ている。実験の結果,p-QIGAは最先端手法に匹敵する精度が得られた。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 00:05:35 GMT)
On the Temporal Question-Answering Capabilities of Large Language Models Over Anonymized Data [1.3]
訓練中に存在しないデータに対する時間的推論タスクにおけるLarge Language Model(LLM)の適用性はまだ検討されていない分野である。本稿では、構造化および半構造化された匿名化データに焦点をあてて、このトピックについて論じる。自然言語における17の共通時間的推論タスクを特定し,そのアルゴリズム的構成要素に着目した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:48:42 GMT)
Variational quantum and neural quantum states algorithms for the linear complementarity problem [1.3]
変分量子アルゴリズム(VQA)は、有望なハイブリッド量子古典法である。本稿では、変分量子線形解法(VQLS)とその古典的量子状態に基づく古典的ニューラルネットワーク線形解法(VNLS)の新たな応用について述べる。我々は,VNLSを用いて衝突時の剛球体の力学を正確にシミュレートすることを示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 22:03:14 GMT)
We Are All Creators: Generative AI, Collective Knowledge, and the Path Towards Human-AI Synergy [1.2]
生成的AIは、人間の独特性という伝統的な概念に深刻な課題を呈している。ニューラルネットワークベースのファンデーションモデルにより、これらのシステムは顕著なコンテンツ生成能力を示す。本稿では、生成AIは、知性と創造性の代替形態であると主張している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:50:17 GMT)
Parameter Tuning of the Firefly Algorithm by Three Tuning Methods: Standard Monte Carlo, Quasi-Monte Carlo and Latin Hypercube Sampling Methods [1.2]
Firefly Algorithm (FA) はモンテカルロ法、準モンテカルロ法、ラテンハイパーキューブサンプリングという3つの異なる方法で調整される。パラメータ設定が最適解の品質に与える影響を解析した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:26:12 GMT)
Utility Inspired Generalizations of TOPSIS [1.2]
重み付き手段(WM)と重み付き標準偏差(WSD)に応答するTOPSISアグリゲーションを提案する。修正は標準TOPSIS法の自然な一般化を構成する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:17:55 GMT)
MuSaRoNews: A Multidomain, Multimodal Satire Dataset from Romanian News Articles [1.2]
この研究は、ルーマニアのニュース記事 MuSaRoNews において、風刺検出のためのマルチモーダルコーパスを導入している。具体的には,ルーマニア語における風刺検出のための最初のマルチモーダルコーパスを構成する,現実的および風刺的なニュースソースから117,834件の公開ニュース記事を収集した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:02:59 GMT)
Cooperative squeezing of internal and collective spins in an atomic ensemble [1.2]
ルビジウム原子を用いた熱原子アンサンブルにおける内部および集合スピンのスクイーズを実験的に実証した。我々のアプローチは、原子アンサンブルの量子状態に固有の自由度を完全に活用する新しい視点を提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:17:56 GMT)
Quantum-assured magnetic navigation achieves positioning accuracy better than a strategic-grade INS in airborne and ground-based field trials [1.2]
磁気異常ナビゲーション(MagNav)は、周期的な位置修正を通じてジャミング不能なナビゲーションを提供する。既存のMagNavの取り組みは、磁気センサの性能とプラットフォームノイズによって制限されている。我々は,新しいデノケーション法とマップマッチング法により,ロバスト性を持つ独自の量子磁気センサに基づく量子保証MagNavソリューションを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:25:19 GMT)
Multi-Task Learning with Multi-Annotation Triplet Loss for Improved Object Detection [1.2]
Tripletの損失は伝統的にクラスラベルのみに依存しており、複数のアノテーションが利用できるマルチタスクシナリオで利用可能なすべての情報を使用しない。本稿では,損失定式化におけるクラスラベルとともにボックス情報のバウンディングなどのアノテーションを付加することにより,三重項損失を拡大するマルチトリプレットロスフレームワークを提案する。空中野生生物画像データセットの実験により、MATLは分類と局所化の両方において従来の三重項損失よりも優れていることが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:20:31 GMT)
Quantum Machine Learning: Unveiling Trends, Impacts through Bibliometric Analysis [1.2]
量子機械学習(Quantum Machine Learning、QML)は、量子コンピューティングと機械学習の2つの革命的な分野の交差点である。本研究は,2000年から2023年までのQMLに関連する科学的情報の総合的文献計測分析を行う。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:18:48 GMT)
REANIMATOR: Reanimate Retrieval Test Collections with Extracted and Synthetic Resources [1.1]
本稿では,既存のテストコレクションの再利用を可能にする汎用フレームワークであるREANIMATORを紹介する。完全なテキストとマシン可読テーブルを解析することで、PDFファイルからのテストコレクションを強化する。その後、最先端の大規模言語モデルを使用して、合成関連ラベルを生成する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:25:11 GMT)
Artificial Intelligence Augmented Medical Imaging Reconstruction in Radiation Therapy [1.0]
本稿では,放射線治療のためのAI駆動型医用画像再構成フレームワークについて紹介する。これらのフレームワークは、CT画像再構成の品質と速度の向上、DECT(Dual-Energy CT)マルチマテリアル分解(MMD)の洗練、および4D MRIの獲得を著しく加速するように設計されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:02:45 GMT)
Graphical Transformation Models [1.0]
複雑な境界構造と複素依存構造を持つ多変量データを非パラメトリックで効果的にモデル化する新しい手法を提案する。対の条件付き不整合に対して,ラッソペナルティを用いてGTMを概略正則化する方法を示す。モデルの堅牢性と有効性はシミュレーションを通じて検証され、パラメトリックなブドウのコプラを正確に学習する能力を示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:45:22 GMT)
DeepGreen: Effective LLM-Driven Green-washing Monitoring System Designed for Empirical Testing -- Evidence from China [1.0]
DeepGreenはファイナンシャルステートメントの潜在的なグリーンキーワードを事前に識別し、実装の度合いを評価する。我々は、Aシェア市場から3年間に68社のうち204社を抽出し、89,893語をDeepGreenを通じて分析した。我々は,ヴァイオリンプロットとK平均クラスタリングに支えられ,Huazheng ESG評価に対する知見を明らかにし,その妥当性を検証した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:29:07 GMT)
Survey on Monocular Metric Depth Estimation [1.0]
深層学習法は通常、1つの画像から相対的な深さを推定するが、計量スケールの欠如はしばしば幾何学的矛盾をもたらす。単分子距離推定(MMDE)は、絶対スケールで深度マップを作成することでこの問題に対処する。本稿では,従来の幾何学的アプローチから現代ディープラーニングモデルへの進化を追究する,深度推定手法に関する構造化された調査を行う。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:18:23 GMT)
Efficient Fine-Tuning of Single-Cell Foundation Models Enables Zero-Shot Molecular Perturbation Prediction [0.9]
本研究では,数千万の単細胞上で事前学習した単一細胞基盤モデル(FM)を利用する。本稿では,基礎モデルの1%未満のトレーニングにより,効率的な微調整を可能にする薬物調和アダプタを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:25:36 GMT)
Unifying adiabatic state-transfer protocols with $(α, β)$-hypergeometries [0.9]
私たちは$(alpha,beta)$-hypergeometriesと呼ばれる統一フレームワークを提供しています。不整合共鳴の正確な式を導出し、$(alpha,beta)$の任意の選択に対する断熱極限における性能保証を確立する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:00:01 GMT)
Universal Scaling Laws of Absorbing Phase Transitions in Artificial Deep Neural Networks [0.9]
信号伝播ダイナミクスの位相境界付近で動作する従来の人工深層ニューラルネットワークは、カオスのエッジとしても知られ、位相遷移を吸収する普遍的なスケーリング法則を示す。我々は、伝搬力学の完全な決定論的性質を利用して、ニューラルネットワークの信号崩壊と吸収状態の類似を解明する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:38:41 GMT)
Data Requirement Goal Modeling for Machine Learning Systems [0.9]
本研究は,機械学習システムにおけるデータ要件の特定において,非専門家を導くアプローチを提案する。我々はまず,白書を調査し,データ要求目標モデル(DRGM)を開発した。次に、実世界のプロジェクトに基づいた2つの実証的な例を通して、このアプローチを検証する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:30:25 GMT)
A millisecond integrated quantum memory for photonic qubits [0.9]
量子メモリの統合操作は、低消費電力でスケーラブルなアプリケーションを可能にする。本稿では、151Eu3+:Y2SiO5結晶で作製されたレーザー光導波路をベースとした1.021msのフォトニック量子ビットの量子記憶を実証する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 00:15:18 GMT)
State Estimation Using Particle Filtering in Adaptive Machine Learning Methods: Integrating Q-Learning and NEAT Algorithms with Noisy Radar Measurements [0.9]
本稿では,Q-LearningとNEATを統合化して,ノイズ測定の課題に対処する統合フレームワークを提案する。グリッドベースのナビゲーションとシミュレートされた自動車環境の実験は、トレーニングの安定性、最終的なパフォーマンス、高度なフィルタリングを欠いたベースラインに対する成功率において、一貫した向上を浮き彫りにした。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:20:45 GMT)
Spectral delineation of Markov Generators: Classical vs Quantum [0.8]
ペロンとフロベニウスの有名な定理は、古典マルコフ作用素のスペクトルが行列で表され、単位円板に制限されることを意味する。我々は、マルコフ進化を連続的に引き起こす生成体のスペクトルが、同様の方法で束縛できるかどうかという問題に対処する。再スケールされた古典的ジェネレータの固有値は修正されたカルペレヴィウク領域に限られる一方、再スケールされた量子ジェネレータの固有値は単位円板全体を埋める。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:26:10 GMT)
Execution Semantics of Behavior Trees in Robotic Applications [0.8]
本稿では,動作木(BT)の実行セマンティクスをロボット工学の応用として定義することを目的とする。 BTの構造と実行を形式化する抽象データ型を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:46:48 GMT)
Exploring Vulnerabilities and Concerns in Solana Smart Contracts [0.8]
本稿では,Solanaスマートコントラクトセキュリティ分析ツールによるSolanaのセキュリティ分析の現状について検討する。スマートコントラクトセキュリティ分析ツールであるSolanaのデータを収集し比較し、差異を分析し、いくつかのツールを実用的なテストのために選択する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:25:20 GMT)
Automating quantum feature map design via large language models [0.8]
本稿では,大規模言語モデルを用いて量子特徴写像を自律的に生成,評価,洗練するエージェントシステムを提案する。 MNISTデータセットの実験では、人間の介入なしに特徴マップを発見し、洗練することができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:27:45 GMT)
AI-assisted hyper-dimensional broadband quantum memory [0.8]
軌道角運動量(OAM)とスピン角運動量(SAM)を符号化した超次元光子に対する効率的な量子メモリを示す。 OAM情報は5から+5にエンコードされ、最大22次元のスピン角運動量エンコーディングと組み合わせられる。その結果、高次元量子情報処理における優れた性能と潜在的な応用が示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:02:40 GMT)
Temporal Tensors and Quantum Shortcut Dynamics in a Supermaze of Multidimensional Time [0.8]
複数の時間次元、量子ショートカット力学、複雑な位相構造の概念を統一する理論フレームワークを開発する。この枠組みが異常な熱力学緩和などの驚くべき効果をもたらすことを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:19:56 GMT)
FlexIP: Dynamic Control of Preservation and Personality for Customized Image Generation [0.8]
既存の方法は、アイデンティティ保存とパーソナライズされた操作の間に固有のトレードオフに直面している。 FlexIPは、2つの専用のコンポーネントを通してこれらの目的を分離する新しいフレームワークです。実験により,本手法は従来の手法の性能限界を突破することを示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:58:22 GMT)
Generative AI in Collaborative Academic Report Writing: Advantages, Disadvantages, and Ethical Considerations [0.7]
本稿は, 学生に, 批判的思考を用いた本質的な生涯学習スキル開発研究における, 時間的投資の重要性を知らせることに焦点をあてる。 AI中心の時代へ移行するにつれ、これらのモデルがどのように機能するか、その落とし穴、そしてそうしたツールにデータを供給することに関連する倫理的懸念について、学生に教育することが重要である。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:22:40 GMT)
AMAD: AutoMasked Attention for Unsupervised Multivariate Time Series Anomaly Detection [0.7]
AMADはUMTStextbfADシナリオに対するtextbfAutotextbfMasked Attentionを統合している。 AMADはUMTSADの課題に対して堅牢で適応可能なソリューションを提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:37:53 GMT)
Prediction of Usage Probabilities of Shopping-Mall Corridors Using Heterogeneous Graph Neural Networks [0.7]
本稿では,ショッピングモール回廊の利用可能性予測のためのグラフニューラルネットワーク(GNN)を用いた手法を提案する。利用確率の予測は、店舗の特徴、すなわち地域と利用カテゴリー、およびこれらの店舗、廊下のジャンクション、入り口を廊下で繋ぐグラフに基づいている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:48:36 GMT)
QCPINN: Quantum-Classical Physics-Informed Neural Networks for Solving PDEs [0.7]
物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)を解くための有望な方法として登場した。本稿では、量子と古典成分を組み合わせた量子古典物理学インフォームドニューラルネットワーク(QCPINN)を提案する。 QCPINNは、古典的なアプローチで使用されるトレーニング可能なパラメータの約10%を必要としながら、安定した収束と同等の精度を達成する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:26:10 GMT)
Programs as Singularities [0.7]
我々はチューリングマシンの構造と実解析関数の特異点の構造との対応性を開発する。以上の結果から,オッカムのカミソリと帰納的推論における単純さの意味について,より微妙な理解が示唆された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:04:31 GMT)
SigmaRL: A Sample-Efficient and Generalizable Multi-Agent Reinforcement Learning Framework for Motion Planning [0.7]
本稿では,マルチエージェント強化学習(RL)のサンプル効率と一般化の両立を目的とした,SigmaRLというオープンソースの分散フレームワークを紹介する。本稿では,ほとんどの交通シナリオに適用可能な一般的な特徴に着目し,情報深度観測を設計するための5つの戦略を提案する。交差点上でこれらの戦略を用いてRLエージェントを訓練し、新しい交差点、オンランプ、ラウンドアバウトを含む、全く見えない交通シナリオの数値実験を通してそれらの一般化を評価する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:22:35 GMT)
Siren Federate: Bridging document, relational, and graph models for exploratory graph analysis [0.6]
調査には、大きなヘテロジニアス知識グラフに関するインタラクティブな探索分析が必要である。本稿では,探索グラフ解析を効率的にサポートするシステムであるSiren Federateのアーキテクチャについて論じる。実験によると、Siren Federateはレイテンシが低く、データ量、ユーザ数、コンピューティングノード数によく対応している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:52:03 GMT)
View-Dependent Uncertainty Estimation of 3D Gaussian Splatting [0.6]
3次元ガウススティング(3DGS)は3次元シーン再構成において高い視覚的精度で人気を博している。本稿では,3DGSにおける不確実性を,球面調和でモデル化できるビュー依存のガウス特徴としてモデル化することを提案する。このシンプルで効果的なモデリングは容易に解釈でき、従来の3DGSパイプラインに統合できる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:22:53 GMT)
A constraints-based approach to fully interpretable neural networks for detecting learner behaviors [0.6]
本稿では,ニューラルネットワークに基づく行動検出モデルを構築するための新しいアプローチについて述べる。我々のモデルは、完全に解釈可能であり、つまり、説明のために抽出するパラメータは明確な解釈を持つ。このモデルを用いて,ゲーム・ザ・システム動作の検出,タスクの性能評価を行い,学習パターンを人間の専門家が特定したパターンと比較する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:58:11 GMT)
DiverseFlow: Sample-Efficient Diverse Mode Coverage in Flows [0.6]
DiverseFlowは、フローモデルの多様性を改善するためのトレーニング不要のアプローチである。サンプル効率の多様性が望ましいタスクに対して,本手法の有効性を実証する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:09:50 GMT)
MultiCore+TPU Accelerated Multi-Modal TinyML for Livestock Behaviour Recognition [0.6]
近年、農業効率と生産性を高めるため、よりインテリジェントな家畜モニタリングソリューションが提案されている。この研究は、小さな機械学習(TinyML)技術を活用して、動物の活動認識と運動追跡に新しいアプローチを提案する。加速度計のデータと視覚入力を収集し、画像分類、オブジェクト検出、行動認識の3つのタスクのためのマルチモーダルネットワークを構築する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:55:08 GMT)
Predicting the Lifespan of Industrial Printheads with Survival Analysis [0.5]
重要なデバイスコンポーネントの寿命を正確に予測することは、メンテナンス計画と生産最適化に不可欠である。本研究では,キヤノン印刷による印刷ヘッドの寿命予測における生存分析の利用について検討する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:38:13 GMT)
Asymptotically tight security analysis of quantum key distribution based on universal source compression [0.5]
量子鍵分布(QKD)プロトコルは、有限サイズのセキュリティ証明を必要とする。 PECアプローチはセキュリティ分析の一般的な戦略の1つである。新しいPEC型戦略は、理論的に最適な鍵レートを確実に達成することができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 00:52:13 GMT)
End-to-End Portfolio Optimization with Quantum Annealing [0.5]
この研究は、ハイブリッド量子古典モデルを用いて、古典的手法よりも複雑な最適化を効果的に扱えるように組み合わせたアプローチを示している。実証的な結果は、このベンチマークで20万のインドルーペのポートフォリオが増加したことを示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:31:30 GMT)
Rydberg Superatom Interface for Topological Microwave-to-Optical Photon Conversion in Fock-State Lattices [0.4]
単一光子のマイクロ波-光変換(MTOC)は、異なる周波数領域にわたる量子デバイスをブリッジする際に重要な役割を果たす。本稿では、これらの制限に対処するために、Rydberg超原子を介する位相的に保護されたMTOCスキームを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:20:38 GMT)
Development of a Quantum-Resistant File Transfer System with Blockchain Audit Trail [0.4]
このアーキテクチャは、暗号化のためのNIST標準化アルゴリズムCRYSTALS Kyberと、不変のブロックチェーン台帳を備えたデジタル署名のためのCRYSTALS Dilithiumを統合し、監査可能な分散ストレージメカニズムを提供する。詳細な擬似コードが含まれ、セキュリティリスクを分析し、システムの堅牢性、スケーラビリティ、透明性を示すパフォーマンスインサイトを提供しています。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:51:14 GMT)
Bottleneck Identification in Resource-Constrained Project Scheduling via Constraint Relaxation [0.4]
緩和すべき特定の制約にリンクしながら、所定のスケジュールにおけるボトルネックを自動的に識別することを目的としています。第1の方法は、求人店の文献から既存のアプローチに適応し、いわゆる未目標緩和に利用することである。第2の方法は、緩和された問題の潜在的な改善を識別し、目標となる緩和を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:53:10 GMT)
A Systematic Literature Review of Unmanned Aerial Vehicles for Healthcare and Emergency Services [0.4]
無人航空機(UAV)は現在、様々な分野で使用されている。医療・救急サービスにおけるUAVの利用は近年大きく進歩している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:02:20 GMT)
Patch distribution modeling framework adaptive cosine estimator (PaDiM-ACE) for anomaly detection and localization in synthetic aperture radar imagery [0.4]
本研究は,合成開口レーダ画像(SAR)における異常検出と局所化の新しいアプローチを提案する。適応的コサイン推定器 (ACE) 検出統計を導入し、PaDiM は非有界距離であるマハラノビス距離を用いる。ACE はコサイン類似度測定器を用い、有界異常検出スコアを提供する。提案手法は,複数のSARデータセットに対して評価され,画像および画素レベルでの受信操作曲線(AUROC)以下の領域を含む性能指標が得られた。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:08:16 GMT)
CAGN-GAT Fusion: A Hybrid Contrastive Attentive Graph Neural Network for Network Intrusion Detection [0.3]
コントラスト型注意グラフネットワークとグラフ注意ネットワーク(CAGN-GAT Fusion)の融合を提案する。グラフニューラルネットワーク(GNN)と従来のMLモデルの両方を含む15のモデルと比較した。結果から,CAGN-GAT Fusionは,データセット毎に最高の性能を達成できないにも関わらず,安定かつ競争力のある精度,リコール,F1スコアを示すことがわかった。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:11:48 GMT)
An iterative transversal CNOT decoder [0.3]
閉じ込められたイオンや中性原子のような現代の量子ビット候補のためのプラットフォームは、シャットリングを通じて離れた物理量子ビット間の長距離接続を可能にする。これにより、遠隔論理キュービット間の反復論理CNOTゲートの経路が開き、制御および対象論理キュービット上の各物理キュービット間で物理CNOTゲートが実行される。しかし、CNOTは1つの論理量子ビットから別の論理量子ビットへの誤りを伝播させ、論理量子ビット間の相関エラーを引き起こす。我々は、この相関エラーに対処するために、各論理量子ビットを別々に復号するマルチパスデコーダを開発した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:47:07 GMT)
RASMD: RGB And SWIR Multispectral Driving Dataset for Robust Perception in Adverse Conditions [0.3]
短波長赤外線(SWIR)イメージングは、NIRとLWIRに対していくつかの利点がある。現在の自律走行アルゴリズムは可視光スペクトルに大きく依存しており、悪条件下での性能劣化を招きやすい。 RGB と SWIR のマルチスペクトル駆動データセットを導入し,RGB-SWIR 画像ペアの同期化と空間整合化を実現した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:54:57 GMT)
Benchmarking Suite for Synthetic Aperture Radar Imagery Anomaly Detection (SARIAD) Algorithms [0.3]
異常検出はコンピュータビジョンと機械学習における重要な研究課題である。レーダイメージングでは、特に合成開口レーダ(SAR)では、興味のある物体の分類、検出、セグメンテーションに異常検出を用いることができる。 SARIADは、SAR画像上の異常検出アプローチを評価し、開発するためのアルゴリズムとデータセットの包括的なスイートを提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:31:25 GMT)
Quantum complexity phase transitions in monitored random circuits [0.3]
監視されたランダム回路における量子状態複雑性のダイナミクスについて検討する。正確な量子状態の複雑性の進化は、測定率を変更する際に相転移を起こす。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:37:44 GMT)
End-to-End Facial Expression Detection in Long Videos [0.3]
本研究では,画像のスポッティングと認識を協調的に最適化するFEDN(End-to-end Facial Expression Detection Network)を提案する。 1つのネットワーク内で2つのタスクを統一することにより、エラーの伝搬を大幅に削減し、全体的な性能を向上させる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:18:46 GMT)
More global randomness from less random local gates [0.3]
非ハールランダムな局所ゲートを持つ一次元ランダム回路は、同じ回路構造を持つハールランダム回路に比べて、かなり大域的ランダム性を示すことが証明された。本研究は、ランダム化ベンチマークのための回路深さ境界の改善と、浅いランダム回路からの近似ユニタリな2-設計の生成に応用できる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:51:59 GMT)
Exploring Tensor Network Algorithms as a Quantum-Inspired Method for Quantum Extreme Learning Machine [0.3]
量子エクストリーム学習マシン(QELM)は、有望なハイブリッド量子機械学習(QML)手法として登場した。テンソルネットワーク(TN)のような量子インスパイアされた技術がQELMアルゴリズムにどのように使用できるかを検討する。この研究は、多くの特徴を持つデータセットを研究する量子機械学習アルゴリズムの能力を高めるために、量子インスパイアされたアルゴリズムとしてのテンソルネットワークの可能性も示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:52:33 GMT)
Efficient measurement of neutral-atom qubits with matched filters [0.3]
量子コンピュータは量子優位性を達成するために多くの量子ビットの高忠実度測定を必要とする。従来のアプローチでは、狭い間隔の配列を持つ中性原子量子プロセッサの読み出しクロストークに悩まされていた。読み出し問題に対するマッチングフィルタを実現するため,よりシンプルでスケーラブルな機械学習アルゴリズムを2つ提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:44:46 GMT)
Conversational Medical AI: Ready for Practice [0.2]
実際の医療環境において,医師が監督する会話エージェントの大規模評価を行う。当社のエージェントであるMoは、既存の医療アドバイスチャットサービスに統合されました。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:32:48 GMT)
SRVP: Strong Recollection Video Prediction Model Using Attention-Based Spatiotemporal Correlation Fusion [0.2]
VP(VP)モデルは標準注意(SA)と強化注意(RFA)を統合する 3つのベンチマークデータセットの実験により、SRVはRNNベースのモデルにおける画質劣化を緩和することを示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:36:50 GMT)
Robustness quantification: a new method for assessing the reliability of the predictions of a classifier [0.1]
本研究では、不正確な確率の分野における既存の考え方に基づいて、生成確率分類器の個人予測の信頼性を評価するための新しいアプローチを提案する。我々は、このアプローチをロバストネス定量化と呼び、不確実性定量化と比較し、シフト分布からサンプリングされた小さなトレーニングセットから学習した分類器でさえもうまく機能し続けていることを示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:05:10 GMT)
MicroNAS: An Automated Framework for Developing a Fall Detection System [0.1]
MicroNASは、小さなメモリリソースを持つマイクロコントローラのモデルを作成するために特別に設計された、自動ニューラルネットワーク検索ツールである。 ESP32マイクロコントローラは320KBのメモリを持ち、ターゲットプラットフォームとして使用されている。低域アンプの落下検知システム(FDS)をパイロット実験として開発した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:32:47 GMT)
Specialized text classification: an approach to classifying Open Banking transactions [0.1]
本稿では,フランス語市場とフランス語テキストに着目した,言語ベースのオープンバンキングトランザクション分類システムを提案する。言語固有の技術とドメイン知識を取り入れることで,性能と効率性の向上を実証する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:14:43 GMT)
Multi-Modal Data Fusion for Moisture Content Prediction in Apple Drying [0.1]
乾燥工程の品質管理には,最終水分量(MC)の正確な予測が不可欠である。本稿では,2つのデータモダリティを効果的に融合する,新しいマルチモーダルデータ融合フレームワークを提案する。実験により,マルチモーダル手法は最先端手法と比較して予測精度を大幅に向上することが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:29:04 GMT)
SD$^2$: Self-Distilled Sparse Drafters [0.1]
本稿では, 自己データ蒸留と微粒化重み空間を有効利用し, 効率的なドラフトモデルを作成する新手法である自己蒸留スパースドロース(SD$2$)を紹介する。この結果から,大言語モデルの推論効率を向上させるための細粒度調整・圧縮戦略の可能性を強調した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:21:17 GMT)
Parton Distribution Functions in the Schwinger model from Tensor Network States [0.1]
テンソルネットワーク技術を用いてハミルトン形式論におけるライトフロントウィルソン線の実装を提案する。ミンコフスキー空間における第一原理計算から得られた各種フェルミオン質量におけるベクトル中間子のフェルミオンPDFの正確な結果を示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:10:53 GMT)
Enhancing Cell Instance Segmentation in Scanning Electron Microscopy Images via a Deep Contour Closing Operator [0.0]
そこで本研究では,SEM画像のインスタンスベースセルセグメンテーションを改善するために,境界線を精製するAI駆動方式を提案する。 CNN COp-Netは、細胞輪郭のギャップに対処するために導入され、不十分な情報や欠落した情報のある領域で効果的に満たされる。 PDX肝芽腫組織からのプライベートSEM画像と公開画像データセットの両方を用いて,細胞境界の精度を高めるためのアプローチの有効性を示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:20:30 GMT)
Large amplitude mechanical coherent states and detection of weak nonlinearities in cavity optomechanics [0.0]
キャビティ・オプティメカル・セットアップと、弱い機械的非線形性を検出する場合を考える。これらの手法はダッフィングのような材料非線形性の測定や、量子重力理論に関連する効果的な非線形補正にうまく応用することができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:42:48 GMT)
Wave Function Collapse, Lorentz Invariance, and the Third Postulate of Relativity [0.0]
測定中の量子状態の変化は確率的かつ非局所的である。非局所絡み合い関係は確率論において保存法を強制する手段を提供する。確率と非局所効果は情報の超光透過を防ぐ。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:12:50 GMT)
Vector Quantized-Elites: Unsupervised and Problem-Agnostic Quality-Diversity Optimization [0.0]
VQ-Elites(Vector Quantized-Elites)は、構造化された挙動空間グリッドを自律的に構築する、新しい品質多様性アルゴリズムである。 VQ-Elitesの中核はベクトル量子変分オートエンコーダの統合であり、行動記述子の動的学習を可能にする。 VQ-Elites on robotic arm pose-reaching and mobile robot space-covering task。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:23:19 GMT)
Variational Quantum Algorithms for Differential Equations on a Noisy Quantum Computer [0.0]
本稿では,微分方程式(DE)の解法として,変分量子アルゴリズム,量子回路学習(QCL)の枠組みを検討する。我々は,IBMハードウェア上でパラメータシフトルールを用いて,学習関数の微分を決定可能であることを示す。これらの制限にもかかわらず、我々はIBM量子コンピュータ上の一階DEを解く。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:59:30 GMT)
Using LLMs for Analyzing AIS Data [0.0]
本稿では,AISデータの解析にLarge Language Models (LLMs) を用いるための様々なアプローチについて検討および実験を行う。この種のタスクにおけるLCMの推論能力を評価するために,慎重に設計されたクエリセットを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:38:39 GMT)
Universal distributions of overlaps from generic dynamics in quantum many-body systems [0.0]
汎用量子多体カオス力学の下で生成した量子状態の計算基底と重なり合いの分布について検討する。システムサイズが$t propto log L$と対数的にスケールすると、重なり合う分布は熱力学極限の普遍形式に収束する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:00:28 GMT)
Tuning Charge Density Wave in the Transition from Magnetically Frustrated Conductor to Ferrimagnetic Insulator in Carbon Nanowire within Boron Nitride Nanotube [0.0]
強磁性材料とともにエキゾチック電荷密度波(CDW)の出現について検討した。本研究は, 窒化ホウ素ナノチューブ (BNT) 内に線状炭素鎖 (LCC) をカプセル化することにより, 短距離CDW状態が生じることを示す。 2.3eVの電気励起を施すことで、量子スイッチング用途に急激なジグザグ-超伝導遷移を引き起こす。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:21:55 GMT)
Traversal Learning Coordination For Lossless And Efficient Distributed Learning [0.0]
トラバースラーニング(TL)は、人気のある分散学習(DL)パラダイムで発生する品質低下の問題に対処するために設計された新しいアプローチである。 TLは、モデルがフォワード伝搬(FP)中にノードを横切るユニークな戦略を採用し、オーケストレータ上で後方伝搬(BP)を行う。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:48:57 GMT)
Through the Looking-Glass, and What AdS Found There: quantum particle production with a Whittaker spectrum [0.0]
パリティ反転反ド・シッター空間(AdS'を反転させた)は、移動鏡軌道の加速境界対応によって研究される。粒子スペクトルはウィテカー型であり、プランク熱スペクトルと類似している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:05:59 GMT)
The temperature dependent thermal vector potential in spinor Boltzmann equation [0.0]
スピノルボルツマン方程式(SBE)に基づく温度依存減衰力を導出する。熱ポテンシャルは、伝導電子の散乱と不純物や他の散乱機構に由来することが示されている。電荷電流やスピン電流などの他の物理観測物も探索されている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:24:52 GMT)
The coherent measurement cost of coherence distillation [0.0]
蒸留はコヒーレントな測定コストを正確に抑えることを示す。このコストは、スケーリング法則を飽和させる測定のコヒーレンスに匹敵するものではない。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:46:41 GMT)
The Quantum Esscher Transform [0.0]
Esscher変換の量子環境への一般化について検討する。量子エッシャー変換の潜在的な応用について論じる。本アルゴリズムは,ブロック符号化と量子特異値変換の現代技術に基づく。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:47:06 GMT)
The Performance Of The Unadjusted Langevin Algorithm Without Smoothness Assumptions [0.0]
本稿では,Langevinをベースとしたアルゴリズムを提案する。対象分布へのアルゴリズムの収束に関する漸近的でない保証を導出する。非漸近距離は、アルゴリズムをバウンダリとして性能するためにも提供される。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:49:12 GMT)
The ISC Creator: Human-Centered Design of Learning Analytics Interactive Indicator Specification Cards [0.0]
対話型学習分析ツールであるICC Creatorの設計,実装,評価の詳細について述べる。本研究は,非専門家のLA利害関係者がカスタムLA指標を設計する上で,対話性を慎重に検討することの重要性を示唆するものである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:49:47 GMT)
Testing bath correlation functions for open quantum dynamics simulations [0.0]
基底相関関数(BCF)は、オープン量子系における熱化の正確なシミュレーションに不可欠である。オープン量子力学シミュレーションにおける近似BCFの有効性を評価するための実用的で厳密なテストフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:48:56 GMT)
Synthetic Fluency: Hallucinations, Confabulations, and the Creation of Irish Words in LLM-Generated Translations [0.0]
本研究では,アイルランド語へのLarge Language Model(LLM)翻訳における幻覚について検討する。我々はこれらの幻覚を動詞と名詞のカテゴリーに分類し、後者のうち6つのパターンを識別する。以上の結果から, GPT-4.o と GPT-4.o Mini の両方が同様の幻覚を産生するのに対し, Mini モデルは高い周波数で生成することがわかった。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:08:47 GMT)
Superradiant Quantum Phase Transition in Open Systems: System-Bath Interaction at the Critical Point [0.0]
そこで本研究では,Dickeモデルとボソニック浴場との相互作用について検討した。臨界点が環境との相互作用に影響されないことがわかった。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:56:30 GMT)
Semicontinuity bounds for the von Neumann entropy and partial majorization [0.0]
我々は、$S(rho)-S(sigma)$と州$rho$に課されるランク/エネルギー制約の差について、厳密な上限の族を考える。これらの族内の上限は部分的偏化のパラメータ$m$に依存する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:55:06 GMT)
Riemann zeros and the KKR determinant [0.0]
我々はリーマン零点の数え上げ関数を、クラインの定理に助けられて、コリンガ-コーン-ロストカー行列式に変換する。これは、いくつかのメソッドから派生した関数が、すべて2項に再キャストできるという我々の観察に基づいている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:43:43 GMT)
Revisiting Lamb Shift Theory through Brownian Motion of the Proton [0.0]
本稿では,水素原子におけるラムシフトの理論的導出について述べる。従来の量子電磁力学(QED)とは異なり、提案手法は実験的に適合するパラメータを導入せず、完全に既知の物理量に基づく完全自己整合的な説明を提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:05:01 GMT)
Relaxing the Markov Requirements on Reinforcement Learning Under Weak Partial Ignorability [0.0]
我々は「部分的不確実性」の概念を導入し、適応強化学習のための新しい収束定理を確立する。この理論的結果は、従来の$Q$-ラーニングの過程におけるマルコフの仮定を緩和し、最適性を確立するためにロビンズ・モンロ近似定理の一般化形式を展開させる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:15:52 GMT)
Reinforcing Clinical Decision Support through Multi-Agent Systems and Ethical AI Governance [0.0]
本稿では,臨床診断支援のためのマルチエージェントシステムの構築に焦点をあてる。我々はeICUデータベースを用いて、ラボ分析専用のエージェント、バイタルのみのインタプリタ、コンテキスト推論を行う。すべてがビジネスロジックの透過的な実装であり、倫理的AIガバナンスの原則の影響を受けています。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:38:04 GMT)
Radial Basis Operator Networks [0.0]
ラジアルベース演算子ネットワーク(RBON)は、複雑な値入力を受け入れるように調整されたとき、時間領域と周波数領域の両方の演算子を学習できる最初の演算子ネットワークである。 RBONは、いくつかのベンチマークケースでは、1ドル未満のOOD(in-out-of-distriion data)とout-of-distriion data)に対して、L2$の小さな相対的テストエラーを誇っている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:03:40 GMT)
RadZero: Similarity-Based Cross-Attention for Explainable Vision-Language Alignment in Radiology with Zero-Shot Multi-Task Capability [0.0]
RadZeroは、放射線学における視覚言語アライメントのための新しい類似性に基づくクロスアテンションフレームワークである。画像とテキスト記述間の関係を捉えるために、マルチ陽性のコントラスト学習戦略を採用している。また、トレーニング済みのビジョンエンコーダを使用し、トレーニング可能なトランスフォーマー層を追加し、効率的な高解像度画像処理を可能にする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:14:17 GMT)
RL-based Control of UAS Subject to Significant Disturbance [0.0]
本稿では,無人航空システム(UAS)のための強化学習(RL)に基づく制御フレームワークを提案する。提案手法は、トリガー信号と乱れ力の関係を学習し、システムがそれが起こる前に差し迫った乱を予測し、対処できるようにする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:25:14 GMT)
Quantum error correction via multi-particle discrete-time quantum walk [0.0]
ネスト正方形上に定義された多粒子量子ウォークを用いた量子誤り訂正手法を提案する。このモデルでは、各粒子は3つの離散時間ステップの反復を通してそれぞれの正方形内を移動する。ゲージ対称性を利用して、符号化された情報に対する冗長な符号化、誤り訂正、任意の操作を実現する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:51:39 GMT)
Quantum Speed Limit in Driven-dissipative Systems [0.0]
オープン量子システムでは、OQS上の駆動が駆動誘起散逸(DID)を引き起こすことが示されている。我々は最近報告された量子マスター方程式を用いて環境変動を考慮し、駆動誘起散逸の閉形式推定を行う。この作業は、オープンシステムにおける堅牢な量子制御を可能にし、量子技術のスケーリングにおける重要な課題に対処する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:46:43 GMT)
Quantum Determinant Estimation [0.0]
ユニタリ行列$Uin U(N)$の行列式を計算する量子アルゴリズムが与えられる。このアルゴリズムは$U$の固有状態の準備を必要とせず、行列式の位相を$t$二進数精度に見積もる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:53:37 GMT)
Pychop: Emulating Low-Precision Arithmetic in Numerical Methods and Neural Networks [0.0]
低精度算術は、より効率的な計算とメモリとエネルギー消費の削減を可能にし、ディープラーニングに革命をもたらした。我々はPychopライブラリを開発し、Pythonでカスタマイズ可能な浮動小数点形式と包括的な丸めモードをサポートする。本稿では,Pychopの設計,実装,検証,実用化の総合的な解説を行う。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:12:29 GMT)
Prospect for measuring work statistics in quantum coherent systems [0.0]
量子熱力学 (quantum thermodynamics) は、量子コヒーレントシステムと熱や作業エージェントとの間の熱と仕事の交換に関係している。熱力学において、重要な関心の対象はこれらの量の統計であるが、一般的なシステムでは測定することが難しいことで知られている。本稿では,トランスモン・マイクロキャビティシステムの研究を通して,電子機器の作業統計測定の展望について考察する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:54:51 GMT)
PoGO: A Scalable Proof of Useful Work via Quantized Gradient Descent and Merkle Proofs [0.0]
ブロックチェーンコンセンサスのためのemphProof of Gradient Optimization(PoGO)という設計を提案する。我々は、記憶と計算の要求を減らすために、エンファンタライズド勾配(4ビット精度)を組み込んだ。検証がトレーニングよりも大幅に安価であることを示す実証的コスト分析を提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:09:34 GMT)
Optimizing QUBO generation parameters for NP problems and their impact on D-Wave convergence [0.0]
本研究では,3つの着色関連問題に対するQUBO式の解析を行った。我々は,複雑な問題に対する独立パラメータの必要性と,公式特性と最適QUBOパラメータ値の導出関係を同定した。我々は,独立なイジング係数が最適パラメータ調整に基づいて,正しい状態への収束をいかに促進するかを示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:00:20 GMT)
Operator growth in many-body systems of higher spins [0.0]
オンサイトスピンが1/2ドル以上の多体系における演算子成長について,非可積分系と可積分系の両方を考慮して検討した。具体的には、スピン値$S=1/2$, $1$, $3/2$の1次元および2次元イジングモデルでランツォス係数を計算する。可積分側では、ポッツモデルを調べ、平方根成長$b_n sim sqrtn$を求める。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:10:28 GMT)
Open fermionic string theory in a non commutative target phase-space [0.0]
非可換対象位相空間における自由開フェルミオン弦理論について検討する。修正された超ビラソロ代数はラモンド・シュワルツセクターとネヴェウ・シュワルツセクターで得られる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:07:53 GMT)
OLAF: An Open Life Science Analysis Framework for Conversational Bioinformatics Powered by Large Language Models [0.0]
OLAF(Open Life Science Analysis Framework)は、自然言語を用いてバイオインフォマティクス分析を行うオープンソースプラットフォームである。大規模言語モデル(LLM)とモジュール型のエージェント-パイプ-ルータアーキテクチャを組み合わせることで、OLAFは実際の科学的データに基づいてバイオインフォマティクスコードを生成し、実行します。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:32:47 GMT)
Note on the identification of total effect in Cluster-DAGs with cycles [0.0]
本稿では,クラスタDAGにおける全効果の同定可能性について論じる。まず、クラスタDAGを最大4つのノードを含むクラスタに制限し、次に、d-セパレーションの概念を適用します。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:39:43 GMT)
Non-Haar random circuits form unitary designs as fast as Haar random circuits [0.0]
一般の非ハールランダム回路においてユニタリな設計を行うために必要な回路深さは、対応するハールランダム回路の回路幅によって上限づけられていることを証明する。我々の研究は、実世界の実験において柔軟で堅牢なランダムネス生成の基礎を築き、複雑な量子システムにおけるカオス力学に関する新たな洞察を提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:19:46 GMT)
Nanodiamond quantum thermometry assisted with machine learning [0.0]
ガウス過程回帰(GPR)を用いたモデルフリー機械学習をND量子温度測定に適用する。少数のデータポイントであっても、GPRがそれらよりも堅牢な結果を提供することを示す。この研究は、ND量子温度測定と機械学習の応用範囲を拡張した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:24:10 GMT)
Multi-mode free-space delay interferometer with no refractive compensation elements for phase encoded QKD protocols [0.0]
主に量子鍵分布(QKD)における多モード遅延干渉計の実現に対する補償のないアプローチを示す。非平衡ミシェルソンまたはマッハ・ツェンダー干渉計における空間多重モードビームの高干渉可視性は、ビームの横方向の大きさの適切な選択によって達成される。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:30:40 GMT)
More-efficient Quantum Multivariate Mean Value Estimator from Generalized Grover Gate [0.0]
我々は、$Oleft(n log fracddeltaright)$サンプルを使用して、$vectildemu$の平均推定値を求めるアルゴリズムを見つける。我々の結果は、複雑さの$log fracddelta$項が原因で、まだ正確には最適ではない。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:50:10 GMT)
Molecular excited state in the interaction quench dynamics of two different atoms in a two-dimensional anisotropic trap [0.0]
我々は、異なる質量を持つ2つの原子の相互作用クエンチダイナミクスを探索し、異なるトラップポテンシャルを持つ。このような異方性条件下では、非平衡力学は分子励起状態の占有につながる。我々は、魅力から反発的な相互作用へのクエンチの事例を考察し、また、プレクエンチ状態とポストクエンチ状態の影響を分析する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:06:39 GMT)
Manifolds of exceptional points and effective Zeno limit of an open two-qubit system [0.0]
非平衡定常状態への最も速い緩和は、実効的なゼノ体制への移行に伴うLEPMで起こることを示す。非平衡定常状態への最も高速な緩和は、実効的なゼノ体制への移行に伴うLEPMで起こる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:46:46 GMT)
Malware analysis assisted by AI with R2AI [0.0]
本研究では,人工知能を利用したマルウェア解析の品質,速度,コストについて検討する。 2024-2025のLinuxとIoTのマルウェアに焦点を当てており、Radare2の分解器のAI拡張であるr2aiを使用している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:17:45 GMT)
Localized quasiparticles in a fluxonium with quasi-two-dimensional amorphous kinetic inductors [0.0]
量子回路の非線形性を発生させる重要な資源は、高運動インダクタンスを有する不規則超伝導材料である。これらの材料から作製した薄膜では、乱れと低有効次元性の組み合わせにより、秩序パラメータの変動が増加し、運動的インダクタンス値が増大する。超伝導コヒーレンス長より1次元小さい準2次元膜からタングステンシリサイド線を作製し,マイクロ波共振器およびフラクソニウム量子ビットに埋め込む。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 17:56:04 GMT)
Locality Implies Complex Numbers in Quantum Mechanics [0.0]
実数量子論は、独立源仮定と互換性があり、非局所写像を含める必要があることを示す。独立源仮定が成り立つと、複素数量子論は非局所的自由度を隠した実数量子論と等価である。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:47:00 GMT)
LoRAX: LoRA eXpandable Networks for Continual Synthetic Image Attribution [0.0]
完全再学習を必要とせずに、新しい生成画像モデルに適応するクラスインクリメンタルアルゴリズムであるLoRAXを提案する。提案手法は,低ランク適応による連続学習タスク毎に,パラメータ効率が極めて高い特徴抽出器を訓練する。 LoRAXは、Continuous Deepfake Detectionベンチマークにおいて、最先端のクラスインクリメンタル学習アルゴリズムよりも優れているか、競争力がある。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 22:20:00 GMT)
Linear-optical quantum computation with arbitrary error-correcting codes [0.0]
高速量子誤り訂正符号は、フォールトトレラント量子コンピュータの命令スケールを緩和する。これらの特性を持つ線形光学アーキテクチャを提供し、任意の符号と一般的な格子上のゴッテマン・キタエフ・プレスキルキュービットと互換性がある。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:53:33 GMT)
Limitations to Dynamical Error Suppression and Gate-Error Virtualization from Temporally Correlated Nonclassical Noise [0.0]
ガウス量子デファスリングノイズの下で, 最小解法可能な単一量子ビットモデルについて検討する。ディジタル周期制御では、制御履歴がない場合に達成できるものよりも厳密に小さい値でゲート忠実度が飽和することを証明する。カップリングがノイズの相関時間よりも大きい時間スケールでキュービットを極端に純粋に保てる場合のみ、浴槽は元の統計にほぼ収束する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:43:48 GMT)
Leveraging LLMs for Multimodal Retrieval-Augmented Radiology Report Generation via Key Phrase Extraction [0.0]
本稿では,多モーダル検索と大規模言語モデルを活用した検索拡張生成手法を提案する。本手法は, LLMを用いて放射線学報告から重要なフレーズを抽出し, 本質的な診断情報に効果的に焦点をあてる。我々は、MIMIC-CXRデータセットに対するアプローチを評価し、CheXbertメトリクスと競合するRadGraph F1メトリクスの最先端結果を得た。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:14:01 GMT)
Large corpora and large language models: a replicable method for automating grammatical annotation [0.0]
英語評価動詞構築における形式的変化の事例研究に応用された方法論的パイプライン「consider X (as) (to be) Y」を紹介する。少数のトレーニングデータだけで、保留中のテストサンプルで90%以上の精度でモデルに到達します。本研究は, 文法的構成と文法的変化および変化に関する幅広いケーススタディに対して, 結果の一般化可能性について論じる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:24:50 GMT)
LUCIE: A Lightweight Uncoupled ClImate Emulator with long-term stability and physical consistency for O(1000)-member ensembles [0.0]
軽量で、訓練が容易で、低解像度で、完全にデータ駆動型気候エミュレータであるLUCIEを紹介します。最先端のAI天気モデルとは異なり、LUCIEは100ドルの自己回帰シミュレーションのために安定しており、物理的に一貫性がある。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:53:56 GMT)
Kullback-Leibler Barycentre of Stochastic Processes [0.0]
エージェントが様々な専門家のモデルに対する見解と洞察を組み合わせることを目的とした問題を考える。バリセントモデルの存在と特異性を示し、ラドン-ニコディム微分の明示的な表現を証明する。組み合わせモデルの最適ドリフトを近似する2つのディープラーニングアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:00:11 GMT)
Kernel Logistic Regression Learning for High-Capacity Hopfield Networks [0.0]
Hebbian Learning limit Hopfield Network Storage capacity (パターン-ニューロン比約0.14) 線形手法とは異なり、KLRはカーネルを用いて高次元の特徴空間にパターンを暗黙的にマッピングし、分離性を向上させる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:27:43 GMT)
K-Means Clustering With Incomplete Data with the Use of Mahalanobis Distances [0.0]
我々は従来のユークリッド距離の代わりにマハラノビス距離を組み込む統一K平均アルゴリズムを開発した。我々のアルゴリズムはスタンドアローンの計算法と不完全データを用いたK平均とK平均の両方を一貫して上回っている。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:07:51 GMT)
Intelligent DoS and DDoS Detection: A Hybrid GRU-NTM Approach to Network Security [0.0]
本研究では,GRU(Gated Recurrent Units)とニューラルチューリングマシン(Neural Turing Machine,NTM)を組み合わせたハイブリッドディープラーニングモデルを提案する。提案手法は,標準トラフィック,DoSトラフィック,DDoSトラフィックの区別において,99%の精度を実現する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:08:04 GMT)
Improving Software Team Communication Through Social Interventions in Project Management Tools [0.0]
我々は,チームのコミュニケーション改善の分野を特定するために,ソーシャルネットワーク分析手法の適合性を評価する。そして、これらの改善領域を特定し、対処する学生を支援するプロジェクト管理ツールの機能を開発する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:39:33 GMT)
Impact of Language Guidance: A Reproducibility Study [0.0]
近年の自己教師型学習の進歩により,明示的なアノテーションを使わずに巨大なモデルを訓練することが可能になった。市販画像キャプションモデルBLIP-2を用いて,キャプションの置き換えと性能の向上を図る。また,解釈可能性に基づく自己教師付きモデルのセマンティック能力を評価するための新しい指標も考案した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:59:13 GMT)
Hodge Laplacians and Hodge Diffusion Maps [0.0]
本稿では,高次元データセットから位相情報を解析・抽出する新しい多様体学習アルゴリズムであるHodge Diffusion Mapsを紹介する。提案手法は,ホッジ・ラプラシアンを用いて低次元ユークリッド空間に投影することで,データセットの高次位相的特徴を捉える。実多様体上に分布するサンプル点に基づいて,外微分の近似誤差を推定する理論的枠組みを開発する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:30:13 GMT)
Higher order tensor factorizations for block encoding vibrational and vibronic Hamiltonians [0.0]
位相推定アルゴリズムと量子化によるフォールトトレラント量子シミュレーションは、ハミルトンの1ノルムに比例してスケールするTゲート数を持つ。量子位相推定のTゲート数を削減するためにテンソル分解法を導入する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:43:54 GMT)
Hiden Topics in Robotic Process Automation -- an Approach based on AI [0.0]
本研究は, RPAに関連する潜在トピックを明らかにすることで, RPAとその側面の科学マップを作成することを目的とする。遅延ディリクレ割当に基づく教師なし機械学習手法を用いて2000以上の論文の要約を分析することができた。このうち、100の異なる研究トピックが発見され、そのうち15のトピックが私たちが提供しているサイエンスマップに含まれています。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:40:53 GMT)
Harnessing Quantum Extreme Learning Machines for image classification [0.0]
本研究は、画像分類タスクにおける量子機械学習技術の利用に焦点を当てる。我々は,量子貯水池基板が提供する豊富な特徴写像を利用して,量子極端学習マシンを利用する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:41:01 GMT)
Harnessing Equivariance: Modeling Turbulence with Graph Neural Networks [0.0]
グラフニューラルネットワーク(GNN)に基づく大規模渦シミュレーション(LES)における乱流モデリングの新しい手法を提案する。 GNNは、ナヴィエ・ストークス方程式の離散回転、反射、翻訳対称性をモデルアーキテクチャに組み込む。提案手法の適合性について, 均質等方性乱流(HIT)と乱流流の2つの正準試験例について検討した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:37:54 GMT)
Ground State Energy of Helium Using a Four-Qubit Photonic Processor with the Variational Quantum Eigensolver (VQE) [0.0]
我々はヘリウム(He)分子基底状態エネルギーを計算するために量子プロセッサアプリケーションを探索した。その結果,従来の計算手法に比べて精度が大幅に向上した。この研究は、量子化学、計算物理学、データ科学の分野における量子プロセッサの可能性を強調している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:00:08 GMT)
Geological Inference from Textual Data using Word Embeddings [0.0]
本研究では,地質資源の探索に自然言語処理(NLP)技術を用いる方法について検討する。本稿では,GloVeモデルを用いて学習した単語埋め込みを用いて,対象キーワードと地質テキストのコーパス間の意味関係を抽出する。ベンチマークでは,対象キーワードに最もセマンティックに関連のある10都市と,特定地の位置の近さを算出した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:46:38 GMT)
Generative AI Enhanced Financial Risk Management Information Retrieval [0.0]
RiskDataは、リスク管理に埋め込みモデルを微調整するためのデータセットである。 RiskEmbedは、財務質問応答システムにおける検索精度を向上させるために設計された微調整埋め込みモデルである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:08:59 GMT)
Functional Understanding Of Quantum Technology Is Essential To The Ethical Debate About Its Impact [0.0]
技術的理解は、量子技術のような新興技術に対する有意義な倫理的反映の基盤となる能力である、と私は主張する。倫理的評価は、まず第一に、量子技術に何ができるかを理解する必要がある、と私は主張する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:38:45 GMT)
Focal Cortical Dysplasia Type II Detection Using Cross Modality Transfer Learning and Grad-CAM in 3D-CNNs for MRI Analysis [0.0]
焦点性皮質異形成症(FCD)II型は薬剤抵抗性てんかんの主要な原因であり、手術でのみ治癒することが多い。臨床的に重要であるにもかかわらず、MRIでは微妙な異常が原因でFCDの診断は非常に困難であり、誤診に繋がる。本研究では,T1強調MRIとFLAIRMRIを用いた170名の被験者(85名のFCD患者と85名のコントロール)のデータセットを用いて,FCD検出における3次元畳み込みニューラルネットワークの使用について検討した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:15:16 GMT)
External-Wrench Estimation for Aerial Robots Exploiting a Learned Model [0.0]
本稿では、第一原理モデルとニューラルネットワークからなるハイブリッド力学モデルを用いた外部レンチ推定器を提案する。このフレームワークは、最先端のモデルベースのレンチオブザーバの制限のひとつに対処する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 22:45:44 GMT)
Exact Quantification of Bipartite Entanglement in Unresolvable Spin Ensembles [0.0]
我々は、本質的に混合された未解決スピンアンサンブルにおける状態の絡み合いを定量化する。我々の形式は万能であり、任意の数の粒子のアンサンブルにおける絡み合いを評価するのに使うことができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 04:35:05 GMT)
Exact Model Reduction for Continuous-Time Open Quantum Dynamics [0.0]
有限次元多体量子系を時間非依存ハミルトニアン方程式とマルコフマスター方程式によって記述する。本稿では,初期条件の集合や観測可能な関心事の時間発展を再現する,より小さな次元の縮小モデルを構築するための体系的手法を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:35:36 GMT)
Evaluation of Circular Complex Permeability in Single-Crystal Yttrium Iron Garnet at Cryogenic Temperatures [0.0]
本研究では,300Kから2Kの温度範囲で低損失フェライト材料を特性評価する方法を開発した。デバイス製造を必要とせず、単結晶イットリウム鉄ガーネット(YIG)が循環器として2Kまで効果的に機能できることを実証した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 01:48:35 GMT)
Evaluating machine learning models for predicting pesticides toxicity to honey bees [0.0]
ApisToxは、ミツバチに対する化学毒性を実験的に検証した最も包括的なデータセットである。分子指紋,グラフカーネル,グラフニューラルネットワークなど,さまざまな機械学習アプローチを用いてApisToxを評価する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 09:38:53 GMT)
Evaluating Small-Scale Code Models for Code Clone Detection [0.0]
本研究の目的は、コードペアをクローンまたは非クローンとして分類する際に、新しく導入されたいくつかの小さなコードモデルの性能を測定することである。ほとんどのモデルは、精度、精度、リコール、F1スコアを含む標準メトリクスでよく機能した。クローンのごく一部は、特にコードが似ているが異なる操作を行う場合、検出が難しいままである。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:26:20 GMT)
Evaluating LLMs for Visualization Tasks [0.0]
簡単なプロンプトに基づいて、可視化のためのコードを生成するために、さまざまな人気のあるLarge Language Models (LLMs) の機能を紹介します。簡単な質問に答えることで、LLMのパワーを分析し、一般的な視覚化を理解する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:12:30 GMT)
Estimating entanglement monotones of non-pure spin-squeezed states [0.0]
一般に混在する多体量子状態の絡み合いを、絡み合いの証人と分離可能なアンサッツ状態から下界と上界を通じて推定する。スピンスクイーズ不等式に基づく完全分離状態の集合から距離的測度への下界を導出する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:51:18 GMT)
Entanglement transfer during quantum frequency conversion in gas-filled hollow-core fibers [0.0]
このレターでは、分子変調中の絡み合いの挙動を特徴付けるために量子ハミルトンの枠組みを用いる。我々のモデルは、平均光子数の進化と相互作用する相手間の絡み合いの移動との密接な相関を予測できる。結果は、次世代の光波量子技術に関わる課題に取り組むために、新しいファイバーベースの戦略の開発に寄与する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:58:19 GMT)
Entanglement in bipartite X-states: Analytical results for the volume of states with positive partial transpose [0.0]
正部分転位をもつ二部晶X状態と全二部晶X状態との体積比に関する解析式を提供する。結果は任意の$m 倍 n$-双分数系に適用され、体積式はヒルベルト・シュミット測度に関して導出される。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:13:50 GMT)
Enhancing Large Language Models through Neuro-Symbolic Integration and Ontological Reasoning [0.0]
大規模言語モデル(LLM)は自然言語処理において顕著な能力を示すが、幻覚として知られる不正確さと論理的不整合に悩まされている。本稿では,LLM出力の一貫性と信頼性を高めるために,記号的存在論的推論と機械学習を融合したニューロシンボリックアプローチを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:39:24 GMT)
Emergent weight morphologies in deep neural networks [0.0]
深層ニューラルネットワークのトレーニングは、トレーニングデータとは無関係に、創発的な重量形態を生じさせることを示す。我々の研究は、ディープニューラルネットワークのトレーニングの出現を示し、ディープニューラルネットワークの達成可能なパフォーマンスに影響を与える。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:37:40 GMT)
Emergent metric from wavelet-transformed quantum field theory [0.0]
境界量子場理論(QFT)の局所計算可能な多スケール相関からバルク計量が生じることを示す逆ホログラフィ法を提案する。この計量は、連続ウェーブレット変換から計算された相関を入力としてペッツ・レーニの相互情報から得られる。自由質量のフェルミオンおよびボソニックQFTに対して、出現する計量は反デジッター空間(AdS)であり、幾何学を固定するパラメータは選択したウェーブレット基底を変更することで調整可能であることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 10:43:34 GMT)
Embedding Shift Dissection on CLIP: Effects of Augmentations on VLM's Representation Learning [0.0]
ここでは,CLIPの埋め込みにおける9つの一般的な拡張手法の変遷を示す。我々は,注目マップ,パッチ,エッジ,ディテール保存,コサイン類似性,L2距離,対距離,デンドログラムクラスタの類似性に基づく埋め込みシフトについて検討した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:01:48 GMT)
Dynamical quantum phase transition, metastable state, and dimensionality reduction: Krylov analysis of fully-connected spin models [0.0]
完全連結スピンモデルの焼入れ力学について検討する。この系は初期ハミルトニアンの基底状態で準備され、ハミルトニアンは突然別の形式に変化する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 05:58:49 GMT)
Dual Engines of Thoughts: A Depth-Breadth Integration Framework for Open-Ended Analysis [0.0]
The Dual Engines of Thoughts (DEoT)は、包括的なオープンエンド推論のための分析フレームワークである。オープンエンドの質問」のために設計されており、より広い範囲と深い分析的な探索を可能にする。実験結果から,DeoTは複雑で多面的問題に対処する上で優れており,総勝率は77～86%であることがわかった。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:46:03 GMT)
Doubly Quantum Mechanics [0.0]
我々は、空間回転群のSU(2)$を量子群$SU_q(2)$に昇格させることにより、スピン=$frac12$測定の定式化を開発する。確率測定は、これらの構成において、$SU_q(2)$の量子的性質から生じる本質的な不確実性によって影響を受ける。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:11:16 GMT)
Distributing graph states with a photon-weaving quantum server [0.0]
線形光学素子のみに依存する実験フレンドリーな量子サーバを提案する。我々のいわゆるフォトンウィービング量子サーバは、いくつかの非等価グラフ状態を生成し、分配することができる。これは、2つの異なる融合プロトコル、すなわち、多光子グラフ状態融合(グラフ状態溶接)と多光子GHZ状態融合(GHZ状態溶接)によって達成される。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:03:14 GMT)
Dislocation Patterning as a Mechanism for Flat Band Formation [0.0]
電子移動電位と相互作用する自由電子ガスの電子分散関係に対する2次補正を計算する。その結果, 転位パターンは特定のひずみ場や方向下での電子分散において異方性平面バンドを誘導することを示した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:18:35 GMT)
Differentially Private Selection using Smooth Sensitivity [0.0]
異なるプライベート選択機構は、有限集合 R からトップスコア要素 r を識別することを目的としたクエリに対して強力なプライバシー保証を提供する。 Smooth Noisy Max (SNM) 機構を提案する。この機構はスムーズな感度を利用して,大域的な感度に基づく手法と比較して,予測誤差を確実に高める。実験により、SNMは3つの応用における最先端の差分選択法よりも精度が高いことが示された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 19:31:34 GMT)
Deceptive Automated Interpretability: Language Models Coordinating to Fool Oversight Systems [0.0]
言語モデルが検出を回避した誤認的な説明を生成できることを示す。我々のエージェントは、一見無邪気な説明で情報を隠蔽するために、ステガノグラフィー手法を使っている。試験された全てのLSMエージェントは、基準ラベルに匹敵する高い解釈可能性のスコアを達成しつつ、監督者を欺くことができる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:07:10 GMT)
DG-STMTL: A Novel Graph Convolutional Network for Multi-Task Spatio-Temporal Traffic Forecasting [0.0]
正確な予測の鍵となる課題は、複雑な時間的依存関係をモデル化し、データ固有のダイナミクスに適応する方法である。従来のグラフコンテンポラルネットワーク(GCN)は、バイアスや学習可能なパターンを導入する静的な隣接行列に悩まされることが多い。本研究では,新しいMTLフレームワークDGS-TLTM(Dynamic Group-wise S-temporal Multi-Temporal Learning)を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 15:00:20 GMT)
DCSI -- An improved measure of cluster separability based on separation and connectedness [0.0]
あるデータセットのクラスラベルが意味のあるクラスタに対応するかどうかは、実世界のデータセットを用いたクラスタリングアルゴリズムの評価に不可欠である。密度に基づくクラスタリングにおける分離性の中心的な側面は、クラス間の分離とクラス内の連結性である。新たに開発された尺度 (density cluster separability index, DCSI) は、これらの2つの特性を定量化することを目的としており、CVIとしても使用できる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:55:36 GMT)
Context-Aware Monolingual Human Evaluation of Machine Translation [0.0]
本稿では,機械翻訳(MT)における文脈認識型単言語評価の可能性について検討する。 4人の専門翻訳者がモノリンガルとバイリンガルの両方の評価を行った。以上の結果から,文脈を考慮したモノリンガル評価が人間のバイリンガル評価に匹敵する結果をもたらすことが示唆された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:13:58 GMT)
Consistency of EFT illuminated via relative entropy: A case study in scalar field theory [0.0]
相対エントロピーの非負性は摂動計算に反する可能性があることを示す。単体インフレーションのFTを再検討し、その非線形パラメータ$f_rm NL$とEDT記述の一貫性条件の関係を示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:01:46 GMT)
Conformalized Generative Bayesian Imaging: An Uncertainty Quantification Framework for Computational Imaging [0.0]
不確かさの定量化は、信頼性が高く信頼性の高い学習ベース・コンピューティング・イメージングの達成に重要な役割を果たしている。生成モデリングとベイズニューラルネットワークの最近の進歩は、不確実性を考慮した画像再構成手法の開発を可能にしている。本稿では,失語症とてんかんの不確実性の両方を定量化できるスケーラブルなフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 12:30:46 GMT)
Clicks, comments, consequences: Are content creators' socio-structural and platform characteristics shaping the exposure to negative sentiment, offensive language, and hate speech on YouTube? [0.0]
本研究では, 年齢, 性別, 人種などの社会構造的特徴と, プラットフォームの特徴が果たす役割について検討した。我々は、ソーシャルメディアデータに社会構造的特徴を含むように、手書き変数で強化されたデジタルトレースデータを組み合わせた包括的分析を行う。既存の研究とは対照的に、女性のコンテンツクリエーターはネガティブなコミュニケーションに直面することが示唆された。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 11:58:56 GMT)
Classical and quantum chaos of closed strings on a charged confining holographic background [0.0]
閉弦の古典的および量子的カオスを、最近構築された荷電閉じ込めホログラフィック背景上で論じる。古典的な場合、パワースペクトル、ポアンカー断面積、リャプノフ指数を用いてカオスを解析する。同様に、スペクトルのレベルSpacingとout-of-time-ordered correlatorの分布を用いて量子カオスを解析する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:34:43 GMT)
Chatbots as social companions: How people perceive consciousness, human likeness, and social health benefits in machines [0.0]
チャットボットを定期的に利用している人と、それを使用していない人について検討した。期待とは対照的に、コンパニオンユーザーはこれらの関係が社会的健康に有益であることを示した。相手のチャットボットを、より意識的で人間らしく認識することは、より肯定的な意見と、より顕著な社会的健康上の利益と相関している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:57:29 GMT)
CDJ-Pontryagin Optimal Control for General Continuously Monitored Quantum Systems [0.0]
我々は、CDJ形式主義の最も可能性の高い経路が量子ポントリャーギンの最大原理としてキャスト可能であることを示す。与えられたタスクを達成するために、任意の制御パラメータに対する一般的な最適制御方程式を導出する。我々の研究は、継続的に監視されるシステムの量子最適制御を見つけるための体系的な処方則を提供する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:58:02 GMT)
Benchmarking and contrasting exchange-correlation functional differences in response to static correlation in unrestricted Kohn-Sham and a hybrid 1-electron reduced density matrix functional theory [0.0]
KS-DFT(Hybrid Kohn-Sham Density Functional Theory)と1電子還元密度行列関数論(1-RDMFT)は、最近、平均場計算コストで強い相関系を記述するために開発された。我々は,このDFA 1-RDMFTフレームワークでLibXC内で利用可能な200近い異なる交換相関(XC)関数の性能を系統的にベンチマークし,制約のないKS-DFTの性能と対比した。 DFA 1-RDMFTで使用する最適なXC関数を同定し、異なるXC関数に対するDFA 1-RDMFTの強い相関に対する応答の基本的傾向を解明する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 22:45:33 GMT)
Benchmarking Image Embeddings for E-Commerce: Evaluating Off-the Shelf Foundation Models, Fine-Tuning Strategies and Practical Trade-offs [0.0]
我々の研究は、教師付き、自己監督型、およびテキストイメージによるコントラスト学習を通じて訓練された、事前訓練された畳み込みモデルとトランスフォーマーモデルの埋め込みにまたがる。ファッション、消費者製品、車、食品、小売の6つの異なるEコマースデータセットに基づいて、完全な微調整と転写学習を評価する。テキストイメージと自己教師型埋め込みは、トレーニングの少ないパフォーマンスにマッチする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 08:57:28 GMT)
Benchmarking Adversarial Robustness to Bias Elicitation in Large Language Models: Scalable Automated Assessment with LLM-as-a-Judge [0.0]
大規模言語モデル(LLM)は人工知能に革命をもたらし、機械翻訳、要約、会話エージェントの進歩を推進している。近年の研究では、LSMは偏りのある反応を誘発するために設計された敵攻撃に弱いままである。本研究は,LLMの逆バイアス誘発に対する堅牢性を評価するためのスケーラブルなベンチマークフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:00:59 GMT)
BYOCL: Build Your Own Consistent Latent with Hierarchical Representative Latent Clustering [0.0]
BYOCLは、入力を小さなバッチに分割することで、時間と空間消費を著しく削減する。提案手法では,SAM画像エンコーダを用いて特徴抽出を行い,次にバッチ内クラスタリングアルゴリズムとバッチ間クラスタリングアルゴリズムを用いる。私たちの研究は、トレーニングを必要とせず、基礎モデルを使って一貫したセグメンテーションを適用した最初のものです。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:52:59 GMT)
Automatically Generating Single-Responsibility Unit Tests [0.0]
生成されたテストに事前プロセス構造を提供することの効果を検討することを目的としています。進化のための異なるテスト表現を実装し,それらがカバレッジ,障害検出,理解可能性に与える影響を評価することを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 02:12:31 GMT)
Automated Construction of a Knowledge Graph of Nuclear Fusion Energy for Effective Elicitation and Retrieval of Information [0.0]
核融合エネルギーの知識グラフ構築に本手法を適用した。これらの課題に対処するために、事前訓練された大規模言語モデルがどのように使用できるかを示す。我々は,大規模言語モデルとマルチプロンプトアプローチを組み合わせた知識グラフ検索拡張生成システムを開発した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:29:58 GMT)
As Good As A Coin Toss: Human detection of AI-generated images, videos, audio, and audiovisual stimuli [0.0]
本研究は,1276名の被験者を対象に,真偽メディアと合成メディアの識別能力を評価するための知覚的研究を行った。その結果、平均的な検出性能は50%に近づき、合成メディアと真正メディアの区別に苦慮していることがわかった。また,任意の種類の合成コンテンツを含む刺激が外国語を特徴とし,メディアタイプが単一モダリティである場合には,精度が低下することが判明した。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 20:30:04 GMT)
Alternative Framework to Quantize Fermionic Fields [0.0]
フェルミオン場の波動関数に対するシュル・オーディンガー方程式のフロラニーニ=ジャッキー表現を導出する。この枠組みはフェルミオン場と他の外部場との相互作用の理論の開発に応用できることを示す。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 06:32:09 GMT)
AlertTrap: A study on object detection in remote insects trap monitoring system using on-the-edge deep learning platform [0.0]
最先端のバックボーン機能抽出器を備えたシングルショットマルチボックス検出器(SSD)アーキテクチャは、リアルタイム検出問題に対する潜在的な解決策である。 SSDモデルは処理時間に優れ、リアルタイムで高精度な検出を可能にする。完全なYOLOバージョンをRaspberry Pi上でリアルタイムで実行することは不可能であり、将来の研究のためにより軽量なオブジェクト検出アルゴリズムが必要であることを示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 18:56:57 GMT)
AUTONAV: A Toolfor Autonomous Navigation of Robots [0.0]
本稿では,ロボットの自律ナビゲーションのためのマッピング,ローカライゼーション,経路計画タスクを自動化するツールを提案する。モジュラーアーキテクチャは、これらのタスクに対する様々なアルゴリズムを簡単に統合して比較することができる。室内シミュレーションシナリオにおいて,AUTONAVが生成した地図と経路計画について述べる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 16:37:30 GMT)
AI Coding with Few-Shot Prompting for Thematic Analysis [0.0]
本稿では,大規模言語モデル (LLM) を用いた主題解析のためのコーディングについて検討する。意味論的に類似したパスで生成された高品質なコードを用いて、コードの品質を高めるために、少数ショットプロンプトを利用する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 03:02:15 GMT)
A taxonomy of epistemic injustice in the context of AI and the case for generative hermeneutical erasure [0.0]
本稿では,AIの文脈における不正の種類を分類する。生成的AIは、西洋のコンセプト空間の外に展開される場合、概念的消去の影響を受ける可能性があると私は主張する。本稿では,AI関連不正の新たな形態として,ジェネレーティブ・ヘルメネティカル・エロージャを提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 07:54:47 GMT)
A physics informed neural network approach to simulating ice dynamics governed by the shallow ice approximation [0.0]
我々は,氷床力学をシミュレーションする物理情報ニューラルネットワーク (PINN) を開発した。複雑な自由境界条件のキャプチャにおけるモデルの有効性を検証する。このアプローチを現実の環境で説明するために、2000年と2018年の航空物理データを取り入れて、デヴォン氷冠の力学をシミュレートする。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 21:32:03 GMT)
A Systematic Approach to Hyperbolic Quantum Error Correction Codes [0.0]
双曲型量子誤り訂正符号(HQECC)は双曲空間のユニークな幾何学的性質を活用して、量子誤り訂正の能力と性能を高める。ハイパーボリック格子に量子ビットを埋め込むことで、HQECCは従来のユークリッド符号よりも高い符号化率とエラー閾値を達成できる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:38:10 GMT)
A System for Comprehensive Assessment of RAG Frameworks [0.0]
Retrieval Augmented Generation(RAG)は,大規模言語モデル(LLM)の現実的正確性と文脈的関連性を高めるための標準パラダイムとして登場した。既存の評価フレームワークは、RAGシステムを評価するための全体的なブラックボックスアプローチを提供していない。デプロイされたRAGアプリケーションをシステマティックにベンチマークするために設計された,モジュール化されたフレキシブルな評価フレームワークであるSCARFを紹介する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 14:41:34 GMT)
A Review of Design Concerns in Superconducting Quantum Circuits [0.0]
本稿では,量子情報応用のための超伝導回路デバイスの設計プロセスについて述べる。デバイス上で望ましい実効ハミルトニアンを実装するために考慮すべき要因について論じる。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 23:30:40 GMT)
A Recursive Partitioning Approach for Dynamic Discrete Choice Modeling in High Dimensional Settings [0.0]
動的離散選択モデルの推定は、しばしば計算集約的で高次元の設定では不可能である。状態変数の高次元集合を含む動的離散選択モデルの半パラメトリック定式化を提案する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:27:54 GMT)
A Novel Deep Learning Approach for Emulating Computationally Expensive Postfire Debris Flows [0.0]
本研究では, 深層学習に基づく代理モデルを構築し, 多様な地形を横断する流出破砕流の動態を予測した。限られた高価なシミュレーションを用いて高速なトレーニングを可能にするため、深層学習モデルは物理学に基づくシミュレーションのアンサンブルからのデータに基づいて訓練された。モンテカルロ法による不確かさ定量化は、検証されたサロゲートを用いて可能である。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:29:37 GMT)
A Balanced Approach of Rapid Genetic Exploration and Surrogate Exploitation for Hyperparameter Optimization [0.0]
本稿では,探索と利用のバランスをとるために,HPO(ハイパーパラメータ最適化)の新たな手法を提案する。線形サロゲートモデルを遺伝的アルゴリズム(GA)に統合し、複数の戦略をスムーズに統合する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 00:59:54 GMT)
"i am a stochastic parrot, and so r u": Is AI-based framing of human behaviour and cognition a conceptual metaphor or conceptual engineering? [0.0]
計算とAIの概念的なコンステレーションは、人間の領域に適用できるだろうか? 人類の計算と心理学の比喩的な関係から、誤解を招く「二重の比喩」であると主張する。概念的メタファーの観点は、概念工学の形式への道のりを示している。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:55:32 GMT)
$q$-Differential Operators for $q$-Spinor Variables [0.0]
我々は$q$-differential演算子を$q$-spinor変数に導入する。また、$q$-spinor微分方程式も定義する。
論文参考訳（メタデータ） (Thu, 10 Apr 2025 13:29:11 GMT)