Command A: An Enterprise-Ready Large Language Model [165.9] コマンドAはエージェント最適化および多言語対応モデルである。
クラス内で最高のRetrieval Augmented Generation機能を提供する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:08:07 GMT)
Alleviating Hallucinations in Large Vision-Language Models through Hallucination-Induced Optimization [123.5] 大規模ビジュアル言語モデル(LVLM)は、マルチモーダルデータの理解において、例外的な能力を示した。
彼らは必然的に幻覚に悩まされ、生成されたテキストと対応するイメージを切断する。
現在の視覚的コントラスト復号法のほとんどは、視覚的不確実性情報を導入して幻覚を緩和しようとするものである。
しかし、彼らは幻覚トークンを正確に誘導するのに苦労し、幻覚を緩和する効果を著しく制限した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 02:38:09 GMT)
EditRoom: LLM-parameterized Graph Diffusion for Composable 3D Room Layout Editing [114.1] 自然言語コマンドで様々なレイアウト編集を実行できるフレームワークであるEditRoomを提案する。
特にEditRoomは、コマンドプランニングとターゲットシーンの生成にLarge Language Models(LLM)を利用している。
既存の3Dシーンデータセットを拡張する自動パイプラインを開発し,83kの編集ペアを備えた大規模データセットであるEditRoom-DBを導入した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 23:38:07 GMT)
Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method [108.6] 本研究では,乱数から発散する概念に触発された偏差に基づくキャリブレーション手法を導入し,プリトレーニングデータ検出のためのトークン確率のキャリブレーションを行う。
我々は,中国語テキスト上でのLLMの検出手法の性能を評価するために,中国語のベンチマークであるPatentMIAを開発した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:09:19 GMT)
Crossing the Reward Bridge: Expanding RL with Verifiable Rewards Across Diverse Domains [92.4] 検証可能な報酬付き強化学習(RLVR)は、大規模言語モデル(LLM)の数学的推論と符号化性能の向上に成功している。
本稿では,医学,化学,心理学,経済学,教育など,さまざまな現実世界領域におけるRLVRの有効性と拡張性について検討する。
我々は,2値検証による制限を克服するために,ソフトなモデルに基づく報酬信号を生成する生成的スコアリング手法を利用する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:48:02 GMT)
When To Solve, When To Verify: Compute-Optimal Problem Solving and Generative Verification for LLM Reasoning [90.5] 大規模な言語モデルの推論能力を向上するための重要な戦略として、テスト時間計算のスケーリングが登場した。
次世代予測課題としてのジェネレーティブ・リワード・モデル(GenRM)再フレーム検証の最近の進歩
我々は、さまざまなモデルやデータセットにまたがる最も実用的な推論予算について、GenRMと自己整合性(SC)を評価した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:41:57 GMT)
HyperSIGMA: Hyperspectral Intelligence Comprehension Foundation Model [88.1] Hyper SIGMAは、タスクやシーン間でHSI解釈を統合するビジョントランスフォーマーベースの基礎モデルである。
さらに,約450Kのハイパースペクトル画像を含む,事前学習のための大規模ハイパースペクトルデータセットHyperGlobal-450Kを構築した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:14:22 GMT)
DecoFuse: Decomposing and Fusing the "What", "Where", and "How" for Brain-Inspired fMRI-to-Video Decoding [82.9] 既存のfMRI-to-video法は、しばしば空間情報や動き情報を見下ろしながら意味的内容に焦点を当てる。
そこで我々は,fMRI信号から映像をデコードするための,脳にインスパイアされた新しいフレームワークであるDecoFuseを提案する。
まず、ビデオはセマンティック、空間、動きの3つのコンポーネントに分解し、次に各コンポーネントを別々にデコードしてから、ビデオを再構成する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:28:37 GMT)
Will the Prince Get True Love's Kiss? On the Model Sensitivity to Gender Perturbation over Fairytale Texts [80.2] 本稿では, モデルが非現実的データ拡張を通じて, ジェンダーステレオタイプ摂動にどう反応するかを検討する。
実験結果から, 性別の摂動に直面すると, モデルの性能低下がわずかであることがわかった。
反現実的なトレーニングデータに基づいて微調整を行うと、モデルは反ステレオタイプな物語に対してより堅牢になる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:17:49 GMT)
Long-context Protein Language Modeling Using Bidirectional Mamba with Shared Projection Layers [77.0] 言語モデル(LM)の自己教師による訓練は、有意義な表現の学習や創薬設計において、タンパク質配列に大きな成功を収めている。
ほとんどのタンパク質LMは、短い文脈長を持つ個々のタンパク質に基づいて訓練されたトランスフォーマーアーキテクチャに基づいている。
そこで本研究では,選択的構造化状態空間モデルに基づく代替タンパク質であるBiMamba-Sに基づくLC-PLMを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:10:09 GMT)
Geometric Median Matching for Robust k-Subset Selection from Noisy Data [75.9] 最適分解点1/2のロバストな推定器であるGeometric Medianを利用する新しいk-subset選択法を提案する。
提案手法は, k-subset を反復的に選択し,部分集合の平均が(潜在的に)ノイズデータセットの GM に近似し,任意の汚損の下でもロバスト性を確保する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:22:05 GMT)
Olympus: A Universal Task Router for Computer Vision Tasks [74.1] Olympusは,マルチモーダル大規模言語モデル(MLLM)を,幅広いコンピュータビジョンタスクを処理可能な統一フレームワークに変換する新しいアプローチである。
Olympusは20のタスクで平均94.75%のルーティング精度を達成し、連鎖したアクションシナリオでは91.82%の精度を実現している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:08:07 GMT)
BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature [73.4] BIOMEDICAはスケーラブルでオープンソースのフレームワークで、PubMed Central Open Accessサブセット全体を抽出、注釈付け、シリアライズして、使いやすく、公開可能なデータセットにする。
われわれのフレームワークは600万以上の記事から2400万以上のユニークな画像テキストペアで包括的なアーカイブを生成する。
BMCA-CLIPは、ストリーミングを通じてBIOMEDICAデータセット上で継続的に事前トレーニングされたCLIPスタイルのモデルのスイートで、27TBのデータをローカルにダウンロードする必要がなくなる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:50:25 GMT)
BigCodeBench: Benchmarking Code Generation with Diverse Function Calls and Complex Instructions [72.6] BigCodeBenchは、大規模言語モデル(LLM)に対して、139のライブラリと7つのドメインから1140のきめ細かいタスクに対して、複数の関数呼び出しをツールとして呼び出すためのベンチマークである。
評価の結果,LLMは機能コールを正確に使用するための複雑な指示に従うことができず,スコアは最大60%,人的性能は97%と極めて低いことがわかった。
そこで本研究では,BigCodeBench-Instructという自然言語指向の変種を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:36:44 GMT)
A Large-Scale Vision-Language Dataset Derived from Open Scientific Literature to Advance Biomedical Generalist AI [70.1] PubMed Central Open Accessサブセットから派生したオープンソースのデータセットであるBiomedicaを紹介する。
Biomedicaには600万以上の科学論文と2400万の画像テキストペアが含まれている。
私たちは、Webサーバを通じてスケーラブルなストリーミングと検索APIを提供し、AIシステムとのシームレスな統合を容易にします。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:34:20 GMT)
DoubleDiffusion: Combining Heat Diffusion with Denoising Diffusion for Texture Generation on 3D Meshes [67.4] 本稿では,3次元メッシュ上でテクスチャを直接生成する手法を提案する。
この手法を生成拡散パイプラインに統合することにより,テクスチャ生成の効率を大幅に向上する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:27:48 GMT)
EventMamba: Enhancing Spatio-Temporal Locality with State Space Models for Event-Based Video Reconstruction [66.8] EventMambaは、イベントベースのビデオ再構成タスク用に設計された、特殊なモデルである。
EventMambaは、Transformerベースの方法と比較して、優れた視覚的品質を提供しながら、スピードを著しく向上させる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 02:49:17 GMT)
GENERator: A Long-Context Generative Genomic Foundation Model [66.5] 本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 03:14:15 GMT)
FisherTune: Fisher-Guided Robust Tuning of Vision Foundation Models for Domain Generalized Segmentation [65.9] 既存のアプローチでは、パラメータを選択的に微調整するか、VFMを凍結し、アダプタのみを更新する。
我々は、Domain-Related Fisher Information Matrix (DR-FIM) によって誘導される堅牢な微調整法である textbfFisherTune を提案する。
DR-FIMはタスクやドメイン間でパラメータの感度を測定し、汎用性を維持し、DGSS適応性を高めるための選択的更新を可能にする。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:23:00 GMT)
Unveiling the Mist over 3D Vision-Language Understanding: Object-centric Evaluation with Chain-of-Analysis [65.4] 3Dビジョン言語(3D-VL)ベンチマークは、3D-VLモデルの評価に不足している。
我々は3D-VLグラウンドとQAタスクのベンチマークであるBeacon3Dを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:32:41 GMT)
Memorizing is Not Enough: Deep Knowledge Injection Through Reasoning [60.0] 本稿では,知識注入のレベルである記憶,検索,推論,関連性を定義した4段階の知識注入フレームワークを提案する。
次に、様々な知識注入シナリオを調査し、ベンチマーク上の各シナリオに対する知識注入の深さを評価する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:59:59 GMT)
Robust Recommender System: A Survey and Future Directions [58.9] まず,悪質な攻撃や自然騒音に耐える現在の手法を整理するための分類法を提案する。
次に、不正検出、敵の訓練、悪意のある攻撃から守るための確実な堅牢な訓練など、各カテゴリにおける最先端の手法を検討する。
さまざまなレコメンデーションシナリオの堅牢性や,正確性や解釈可能性,プライバシ,公正性といった他の特性との相互作用について論じる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:33:46 GMT)
NNsight and NDIF: Democratizing Access to Open-Weight Foundation Model Internals [58.8] NNsightとNDIFを導入し、非常に大きなニューラルネットワークによって学習された表現と計算の科学的研究を可能にする。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:04:53 GMT)
4D LangSplat: 4D Language Gaussian Splatting via Multimodal Large Language Models [58.8] 動的シーンにおいて,時間に依存しない,あるいは時間に敏感なオープン語彙クエリを効率的に処理するために,4D言語フィールドを学習する4D LangSplatを提案する。
4D LangSplatは視覚機能から言語フィールドをバイパスし、オブジェクトワイドビデオキャプションから生成されたテキストから直接学習する。
以上の結果から、4D LangSplatは時間に敏感かつ時間に依存しないオープン語彙クエリに対して,正確かつ効率的な結果が得られることが示された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 03:10:36 GMT)
AnimeGamer: Infinite Anime Life Simulation with Next Game State Prediction [58.2] 近年,無限アニメライフシミュレーションの先駆的なアプローチとして,多ターンテキスト対話を画像生成のための言語命令に変換するために,大規模言語モデル(LLM)が採用されている。
本稿では,MLLM(Multimodal Large Language Models)をベースとしたAnimeGamerを提案する。
本稿では,アニメーション映像を高品質なビデオクリップにデコード可能な,アクション対応のマルチモーダル表現を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:57:18 GMT)
Bridging the Gap: Integrating Ethics and Environmental Sustainability in AI Research and Practice [57.9] 我々は、AIの倫理的影響を研究するための努力は、その環境への影響を評価するものと相まって行われるべきであると論じる。
我々は,AI研究と実践にAI倫理と持続可能性を統合するためのベストプラクティスを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:53:11 GMT)
Making Large Language Models Better Reasoners with Orchestrated Streaming Experiences [57.9] 大規模言語モデル(LLM)は、ゼロショットまたは少数ショット設定下で中間思考を生成することで複雑な推論を行うことができる。
複雑な外部の努力なしに自己改善できる推論タスクを解くためのフレームワークであるRoSEを紹介する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:04:04 GMT)
RipVIS: Rip Currents Video Instance Segmentation Benchmark for Beach Monitoring and Safety [57.2] RipVISは、リップ電流セグメンテーション用に設計された大規模ビデオインスタンスセグメンテーションベンチマークである。
我々のデータセットは、波の破れパターン、堆積物の流れ、水色の変化など、様々な視覚的文脈を包含している。
結果は複数のメトリクスで報告され、特にリコールの優先順位付けと偽陰性の低減に$F$スコアに重点を置いている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:57:15 GMT)
PICLe: Pseudo-Annotations for In-Context Learning in Low-Resource Named Entity Detection [56.9] In-context Learning (ICL)により、大規模言語モデルでは、デモをほとんど使わずにタスクを実行することができる。
PICLeは、ノイズの多い擬似アノテーション付き実演によるインコンテキスト学習のためのフレームワークである。
バイオメディカルな5つのNEDデータセット上でPICLeを評価し,PICLeが低リソース環境でICLより優れていることを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:45:58 GMT)
Transfer Your Perspective: Controllable 3D Generation from Any Viewpoint in a Driving Scene [56.7] 共同自動運転(CAV)は有望な方向のようだが、開発のためのデータ収集は簡単ではない。
本研究では,運転シーンにおける異なる視点から現実的な知覚を生み出すことを目的とした,救助支援のための新しいサロゲートを提案する。
シミュレーションされたコラボレーティブデータと実車データを組み合わせた,最初のソリューションを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:10:21 GMT)
$p$-Adic Polynomial Regression as Alternative to Neural Network for Approximating $p$-Adic Functions of Many Variables [55.2] 任意の精度で連続関数を近似できる回帰モデルを構築している。
提案モデルは、ニューラルネットワークアーキテクチャに基づく$p$-adicモデルの簡単な代替と見なすことができる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:48:08 GMT)
Less is More: Efficient Black-box Attribution via Minimal Interpretable Subset Selection [52.7] 部分モジュラー部分集合選択の最適化問題として重要領域の帰属を再構成するLiMA(Less input is more faithful for Attribution)を提案する。
LiMAは、エラーを最小限に抑える最適な帰属境界を確保しながら、最も重要かつ最も重要でないサンプルを識別する。
また, 帰属効率が1.6倍に向上し, 帰属効率が向上した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:58:15 GMT)
Training a Utility-based Retriever Through Shared Context Attribution for Retrieval-Augmented Language Models [51.6] SCARLetは、RALMsでユーティリティベースのレトリバーをトレーニングするためのフレームワークである。
マルチタスクの一般化とパッセージ間相互作用という2つの重要な要素が組み込まれている。
ドメイン内とドメイン外の両方で、さまざまなタスクにまたがる10のデータセットに対するアプローチを評価します。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:28:28 GMT)
PRISM-0: A Predicate-Rich Scene Graph Generation Framework for Zero-Shot Open-Vocabulary Tasks [51.3] SGG(Scene Graphs Generation)では、オブジェクトノードの形式で視覚入力から構造化された表現を抽出し、それらを接続する。
PRISM-0はゼロショットオープン語彙SGGのためのフレームワークで、ボトムアップアプローチで基礎モデルをブートストラップする。
PRIMS-0は、イメージキャプションやSentence-to-Graph Retrievalのような下流タスクを改善する意味のあるグラフを生成する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:29:51 GMT)
TurboFill: Adapting Few-step Text-to-image Model for Fast Image Inpainting [51.0] TurboFillは、高速な画像インペイントモデルであり、高品質で効率的なインペイントのためのインペイントアダプタを備えた、数ステップのテキスト-画像拡散モデルを強化する。
我々は,新しい3段階の対角訓練手法を用いて,数ステップの蒸留テキスト・ツー・イメージ・モデルであるDMD2の塗布アダプタを訓練することで,これを克服する。
実験の結果,TurboFillはマルチステップのBushNetと数ステップのインペインティング手法の両方に優れており,ハイパフォーマンスなインペインティングタスクのための新しいベンチマークが設定されている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:33:29 GMT)
SMILE: Infusing Spatial and Motion Semantics in Masked Video Learning [51.0] Masked Video Modelingはビデオ自己教師型学習(SSL)に有効なパラダイムである
本稿では,空間的意味論と動き的意味論を融合させることにより,SMILEと呼ばれるビデオ表現学習のための新しいSSL手法を提案する。
我々は、自然な映像データを必要とせず、強力な映像表現を学習できる、新しい自己教師型ビデオ学習パラダイムを確立した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:20:55 GMT)
Is the Top Still Spinning? Evaluating Subjectivity in Narrative Understanding [50.9] 曖昧なクレームにバイナリラベルを強制すると、評価の信頼性が低下する。
請求項のニュアンス評価を提供する方法として,LCM生成した要約の編集を紹介する。
我々は,ARMが主張の忠実性に関するアノテータ合意において,絶対的な21%の改善をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:08:24 GMT)
Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.3] 本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。
本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:43:19 GMT)
Generalized Tensor-based Parameter-Efficient Fine-Tuning via Lie Group Transformations [50.0] さまざまな下流タスクに事前訓練された基礎モデルを適用することは、人工知能のコアプラクティスである。
これを解決するために、LoRAのようなパラメータ効率細調整(PEFT)手法が登場し、研究の焦点となっている。
本稿では,行列型PEFT法を高次元パラメータ空間に拡張する一般化法を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:36:45 GMT)
Controllable Human Image Generation with Personalized Multi-Garments [46.0] BootCompは、テキストから画像への拡散モデルに基づく新しいフレームワークである。
本研究では,ヒトとマルチガーメントのペアからなる大規模な合成データセットを構築するためのデータ生成パイプラインを提案する。
ファッションドメインにおいて、異なるタイプの参照ベース生成に適応することで、フレームワークの幅広い適用性を示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 04:36:01 GMT)
Mixture-of-Attack-Experts with Class Regularization for Unified Physical-Digital Face Attack Detection [45.6] 現実のシナリオにおける顔認識システムは、デジタル攻撃と物理的攻撃の両方に影響を受けやすい。
従来は包括的特徴空間を学習して分類を試みてきた。
クラス認識正規化CLIPフレームワーク(FG-MoE-CLIP-CAR)を用いたファイングラインドMoEを提案する。
2つの統合物理デジタル攻撃データセットの実験結果から,提案手法がSOTA(State-of-the-art)性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:33:30 GMT)
ScholarCopilot: Training Large Language Models for Academic Writing with Accurate Citations [45.6] 我々はScholarCopilotを紹介した。ScholarCopilotは学術書記のための既存の大規模言語モデルを強化するために設計された統合フレームワークである。
ScholarCopilotは、検索トークン[RET]を生成して学術的な参照をいつ取得するかを決定し、その表現を利用してデータベースから関連する引用を検索する。
効率を上げるために、単一のフレームワーク内で生成タスクと引用タスクの両方を共同で最適化します。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:12:14 GMT)
QualiSpeech: A Speech Quality Assessment Dataset with Natural Language Reasoning and Descriptions [45.3] 包括的低レベル音声品質評価データセットであるQuariSpeechを紹介する。
また,聴覚大言語モデルの低レベル音声理解能力を評価するために,QuariSpeech Benchmarkを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:33:53 GMT)
DetailGen3D: Generative 3D Geometry Enhancement via Data-Dependent Flow [44.7] DetailGen3Dは、生成された3D形状を強化するために特別に設計されたジェネレーティブなアプローチである。
我々の重要な洞察は、潜在空間におけるデータ依存フローを通して、粗大から細小への変換を直接モデル化することである。
改質時に正確な空間対応を確保するためのトークンマッチング戦略を導入する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:56:24 GMT)
Provable Guarantees for Nonlinear Feature Learning in Three-Layer Neural Networks [44.3] 3層ニューラルネットワークは,2層ネットワークよりも特徴学習能力が豊富であることを示す。
この研究は、特徴学習体制における2層ネットワーク上の3層ニューラルネットワークの証明可能なメリットを理解するための前進である。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:11:53 GMT)
BALROG: Benchmarking Agentic LLM and VLM Reasoning On Games [44.2] 本稿では,大規模言語モデル(LLM)と視覚言語モデル(VLM)のエージェント能力を評価する新しいベンチマークであるBALROGを紹介する。
私たちのベンチマークでは、熟練していない人間が数秒で解決できるタスクや、習得に何年もかかるような極めて困難なタスクなど、さまざまな難易度を持つ既存の強化学習環境を取り入れています。
より簡単なゲームでは,現行のモデルが部分的には成功しているが,より困難なタスクに苦しむことが示唆された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:45:22 GMT)
Beyond Quacking: Deep Integration of Language Models and RAG into DuckDB [44.1] 大規模言語モデル(LLM)により、このような検索と推論データパイプラインのプロトタイプがより簡単になった。
これはしばしば、データシステムのオーケストレーション、データムーブメントの管理、低レベルの詳細処理を含む。
我々はFlockMTLを紹介した。FlockMTLはLLM機能と検索拡張生成を深く統合した抽象化用拡張である。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:48:17 GMT)
NTSEBENCH: Cognitive Reasoning Benchmark for Vision Language Models [44.0] 我々は,大規模モデルの認知的マルチモーダル推論と問題解決能力を評価するために設計された新しいデータセットNTSEBenchを紹介する。
データセットには2728の質問があり、合計4,642の画像が26種類に分類されている。
これらの質問は、インドのNTSE試験から引き出され、視覚的およびテキスト的一般適性の問題が混在している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:25:53 GMT)
DG-TTA: Out-of-domain Medical Image Segmentation through Augmentation and Descriptor-driven Domain Generalization and Test-Time Adaptation [43.8] ドメイン外の画像に事前訓練された深層学習セグメンテーションモデルを適用すると、品質の不足を予測できる。
本研究では、拡張とともに強力な一般化記述子を用いて、ドメイン一般化事前学習とテスト時間適応を実現することを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:54:39 GMT)
GME: Improving Universal Multimodal Retrieval by Multimodal LLMs [43.5] Universal Multimodal Retrieval (UMR) は、統一モデルを用いて様々なモダリティを探索することを目的としている。
これまで、テキストデータのみを用いてUMRを実現するためにMLLM(Multimodal large language model)を採用してきた。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:48:04 GMT)
MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization [43.1] ベクトル量子化(VQ)を用いたマスクド画像モデリング(MIM)は,自己教師付き事前学習と画像生成において大きな成功を収めている。
本稿では,VQに基づく生成モデルにトークンマージ手法を組み込んで,画像生成と視覚表現学習のギャップを埋めるMergeVQを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:39:19 GMT)
ShortV: Efficient Multimodal Large Language Models by Freezing Visual Tokens in Ineffective Layers [42.9] MLLM(Multimodal Large Language Models)はその巨大なサイズと多数の視覚トークンのために高い計算コストを被る。
本稿では,レイヤの変換が視覚およびテキストトークンに与える影響を定量化する新しいメトリクスであるレイヤ貢献(LC)を紹介する。
LCを利用して非効率なレイヤを識別し,これらのレイヤの視覚的トークン更新を凍結する,トレーニング不要なShortVを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:47:55 GMT)
How does Watermarking Affect Visual Language Models in Document Understanding? [42.8] 視覚言語モデル(VLM)の性能に及ぼす透かしの影響を調べるための新しい評価フレームワークを提案する。
実験の結果,VLMの性能は透かしによって著しく損なわれ,性能低下率は最大36%に達することがわかった。
本研究は、文書理解のためのVLMの展開における重要な課題を強調し、透かし付き文書に頑健な推論機構を構築するための洞察を提供する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:57:01 GMT)
HomeEmergency -- Using Audio to Find and Respond to Emergencies in the Home [42.2] 米国だけで、事故死は年間128,000人を超えている。
我々の研究は、家庭の緊急事態に対処し、怪我や死を防ぐホームロボットを可能にすることを目的としている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:07:25 GMT)
Balancing Multi-Target Semi-Supervised Medical Image Segmentation with Collaborative Generalist and Specialists [40.7] 我々は,協力的ジェネリストと複数のスペシャリストからなる新しい手法をCGSと呼ぶ。
それぞれのターゲットクラスにスペシャリストを雇うという考え方が中心であり、より大きなターゲットの優位性を避ける。
理論的知見に基づいて,CGSがよりバランスの取れたトレーニングを達成できることを実証する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:52:12 GMT)
Hallucination of Multimodal Large Language Models: A Survey [40.7] マルチモーダル大規模言語モデル(MLLM)は,多モーダルタスクにおいて顕著な進歩と顕著な能力を示した。
これらの有望な発展にもかかわらず、MLLMは視覚的内容と矛盾する出力をしばしば生成する。
本調査は,MLLMにおける幻覚の理解を深め,この分野のさらなる進歩を促すことを目的としている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:36:08 GMT)
Deconver: A Deconvolutional Network for Medical Image Segmentation [40.7] 本稿では,U字型アーキテクチャの中核となる学習可能なコンポーネントとして,画像復元から従来のデコンボリューション技術を統合する新しいネットワークであるDeconverを紹介する。
デコンバーは計算コストのかかる注意機構を非負の効率的なデコンボリューション操作に置き換える。
これは、DiceスコアとHausdorff距離における最先端のパフォーマンスを達成し、主要なベースラインと比較して計算コスト(FLOP)を最大90%削減する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:11:04 GMT)
CoRanking: Collaborative Ranking with Small and Large Ranking Agents [40.0] 大規模言語モデル(LLM)は、優れたリストワイドランキング性能を示している。
CoRankingは、小規模と大規模なランキングモデルを組み合わせて、効率的かつ効果的なランク付けを行う。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 02:24:42 GMT)
UQABench: Evaluating User Embedding for Prompting LLMs in Personalized Question Answering [39.8] nameは、パーソナライズのための大きな言語モデルを促進するために、ユーザ埋め込みの有効性を評価するために設計されたベンチマークである。
ユーザ埋め込みをモデル化するための様々な最先端手法について広範な実験を行った。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:18:34 GMT)
Process or Result? Manipulated Ending Tokens Can Mislead Reasoning LLMs to Ignore the Correct Reasoning Steps [39.8] 入力推論チェーンの微妙なエラーに対するモデル推論の脆弱性について検討する。
この脆弱性は、操作された計算結果を含む推論トークンが提示されたモデルが正しい推論ステップを無視し、その代わりに誤った結果を採用する傾向がある。
我々の研究は、推論の堅牢性を理解することを強化し、推論集約アプリケーションに対するセキュリティ上の配慮を強調します。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:07:54 GMT)
MedReason: Eliciting Factual Medical Reasoning Steps in LLMs via Knowledge Graphs [39.7] 高品質な医療推論データセットであるMedReasonを紹介する。
我々のパイプラインは7つの医学データセットから様々な医学的質問の詳細な推論を生成する。
私たちの最高のパフォーマンスモデルであるMedReason-8Bは、最先端の医療推論モデルであるHuatuo-o1-8Bを、臨床ベンチマークMedBulletsで最大4.2%上回っています。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:31:44 GMT)
Towards shutdownable agents via stochastic choice [39.6] グリッドワールドをナビゲートするための単純なエージェントを訓練するために、DReST報酬関数を使用します。
これらのエージェントは、USEFULとNEUTRALで学ぶことができる。
我々の理論的研究は、これらのエージェントが有用でシャットダウン可能であることを示唆している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:27:34 GMT)
Scaling Prompt Instructed Zero Shot Composed Image Retrieval with Image-Only Data [39.2] Composed Image Retrieval (CIR)は、テキストに付加された参照画像と一致する画像を取得するタスクである。
画像とテキストのモダリティを効果的に組み合わせた埋め込み型再構成アーキテクチャを提案する。
InstructCIRというモデルでは、CIRRおよびFashionIQデータセット上のゼロショット合成画像検索において、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:03:46 GMT)
Taxonomizing Representational Harms using Speech Act Theory [38.4] 本稿では, 生成言語システムによって引き起こされる表現的害を, 特定の種類の食行為の迫害効果(即ち実世界の影響)として概念化する枠組みを提案する。
次に、我々の枠組みを用いて、表現的害を引き起こす食行為のきめ細かい分類法を開発する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:00:17 GMT)
Can LLMs Assist Computer Education? an Empirical Case Study of DeepSeek [38.3] 本研究は,中国のネットワーク技術者によるコンピュータネットワークセキュリティに関するシミュレーション質問と実世界調査の両方を用いている。
これらの結果は、プロンプトがロール定義を含むか否かに関わらず、モデルが一貫して機能することを示す。
DeepSeek-V3はネットワークセキュリティ教育にかなりの実用的価値を提供するが、マルチモーダルデータを処理する能力には課題がある。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 04:58:16 GMT)
Data Synthesis with Diverse Styles for Face Recognition via 3DMM-Guided Diffusion [37.8] アイデンティティ保護顔合成は、仮想被験者の合成顔画像を生成することを目的としており、現実のデータを代用して顔認識モデルを訓練する。
先行芸術は、一貫したアイデンティティと多様なスタイルでイメージを作成しようとするが、それらは両者のトレードオフに直面している。
本稿では拡散型フェイスジェネレータであるMorphFaceを紹介する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:22:53 GMT)
Follow the Flow: On Information Flow Across Textual Tokens in Text-to-Image Models [35.9] テキスト・トゥ・イメージ(T2I)モデルは、しばしばセマンティック・リーク、不正確な特徴バインディング、生成した画像における重要な概念の欠落といった問題に悩まされる。
本研究は,テキストトークン表現間の情報フローの役割を考察することによって,これらの現象を研究する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:17:44 GMT)
Efficient Construction of Model Family through Progressive Training Using Model Expansion [35.7] 本稿では,進行学習によるモデルファミリの効率的な構築法を提案する。
本手法は,独立に訓練されたモデルに匹敵する性能を維持しつつ,計算コストを約25%削減する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:21:52 GMT)
GenPRM: Scaling Test-Time Compute of Process Reward Models via Generative Reasoning [35.4] 我々は、コード検証を伴う明示的なChain-of-Thought(CoT)推論を行う生成プロセス報酬モデルGenPRMを紹介する。
実験の結果,GenPRMはMATHデータセットから23Kのトレーニングデータしか得られず,従来のPRMよりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:21:05 GMT)
Efficient Near-Optimal Algorithm for Online Shortest Paths in Directed Acyclic Graphs with Bandit Feedback Against Adaptive Adversaries [34.4] 本稿では,適応的相手に対する帯域フィードバックの下で,有向非巡回グラフ(DAG)における最短経路問題について検討する。
我々は,任意の適応的敵に対して高い確率で$tilde O(sqrt|E|Tlog |X|)$の最小限の最小残差を求めるアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:35:42 GMT)
SPF-Portrait: Towards Pure Portrait Customization with Semantic Pollution-Free Fine-tuning [33.7] SPF-Portraitは、テキスト駆動のポートレートカスタマイズにおいてセマンティックな汚染を排除しつつ、カスタマイズされたセマンティクスを純粋に理解する先駆的な研究である。
筆者らはSPF-Portraitにおいて,従来の微調整パスの参照としてオリジナルのモデルを導入したデュアルパスパイプラインを提案する。
本稿では,ターゲットセマンティクスの応答領域を正確に表現するセマンティック・アウェア・ファイン・コントロール・マップを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 03:37:30 GMT)
VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning [33.4] VideoMindは、ビデオ理解のための新しいビデオ言語エージェントである。
ビデオの時間的推論に不可欠な機能を特定し,ロールベースのエージェントワークフローを開発する。
軽量なLoRAアダプタによるシームレスなロールスイッチングを実現する新しいChain-of-LoRA戦略を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 03:49:08 GMT)
A planar rotor trapped and coupled to the vibrational modes of an ion crystal [33.0] 平面ローターは、ポールトラップ内の原子イオンとともに分子イオンまたは荷電ナノ粒子を閉じ込めることで実現される。
電気双極子モーメントを有する分子イオンまたは荷電ナノ粒子の場合, トラップ内の一般的な振動運動のモードに結合する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:48:15 GMT)
Learned Image Compression with Dictionary-based Entropy Model [33.0] エントロピーモデルは学習画像圧縮において重要な役割を果たす。
既存の手法のほとんどは、エントロピーモデルを形成するためにハイパープライアおよび自動回帰アーキテクチャを使用した。
辞書に基づくクロスアテンションエントロピーモデルという新しいエントロピーモデルを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:43:10 GMT)
Exploring Scene Affinity for Semi-Supervised LiDAR Semantic Segmentation [28.5] 本稿では,運転シーンにおける半教師付きLiDARセマンティックセマンティックセグメンテーションのためのシーン親和性,すなわちシーン内一貫性とシーン間相関について検討する。
AISceneは教師教育を採用し、教師ネットワークを用いて、未ラベルのデータから擬似ラベル付きシーンを生成し、学生ネットワークの学習を監督する。
実験の結果、AISceneは4つの設定で2つの人気のあるベンチマークで過去の手法よりも優れており、最も困難な1%のラベル付きデータにおいて1.9%と2.1%の顕著な改善を達成している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:31:12 GMT)
ConsistencyDet: A Few-step Denoising Framework for Object Detection Using the Consistency Model [28.2] 本稿では,物体検出を認知拡散過程として記述するための新しいフレームワークを提案する。
textbfConsistencyDetと呼ばれるこのフレームワークは、Consistency Modelとして知られる革新的な概念を活用している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:46:03 GMT)
A Survey on Personalized Alignment -- The Missing Piece for Large Language Models in Real-World Applications [28.2] 大きな言語モデル(LLM)は目覚ましい能力を示しているが、現実のアプリケーションへの移行には限界がある。
本稿では、パーソナライズされたアライメントに関する最初の包括的調査を示す。
本稿では、優先メモリ管理、パーソナライズされた生成、フィードバックに基づくアライメントを含む統合されたフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:33:19 GMT)
Prethermalization by Random Multipolar Driving on a 78-Qubit Superconducting Processor [26.7] 可変加熱速度多体系における長寿命予熱相の実験的観察を報告する。
78キュービットと137カプラの2次元構成で、遠方から平衡加熱のダイナミクスはシミュレーションの範囲を超えている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:23:17 GMT)
FA^{3}-CLIP: Frequency-Aware Cues Fusion and Attack-Agnostic Prompt Learning for Unified Face Attack Detection [26.6] 顔認識システムは物理的(例えば印刷された写真)やデジタル(例えばディープフェイク)の顔攻撃に対して脆弱である。
既存の手法では、クラス内の大きなバリエーションにより、物理的およびデジタル攻撃を同時に検出するのに苦労している。
本稿では、FAsupertextscript3-CLIP(FAsupertextscript3-CLIP)と呼ばれる攻撃検出モデルを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:19:50 GMT)
AP-CAP: Advancing High-Quality Data Synthesis for Animal Pose Estimation via a Controllable Image Generation Pipeline [26.5] 本稿では,動物ポーズ推定のための新しい制御可能な画像生成パイプライン,AP-CAPを提案する。
このパイプライン内では、期待されたポーズで画像を合成できるマルチモーダル動物画像生成モデルを導入する。
さらに, マルチソース表現を統合するモダリティ・フュージョン・アニマル画像合成戦略, 多様なポーズを動的に捉えるポス・アジャイメント・アニマル画像合成戦略, 視覚的セマンティック理解を強化するキャピオン・エンハンスメント・アニマル画像合成戦略の3つの革新的戦略を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 03:28:29 GMT)
Coca-Splat: Collaborative Optimization for Camera Parameters and 3D Gaussians [26.4] Coca-Splatは、スパースビューのポーズレスシーン再構築と新規ビュー合成(NVS)の課題に対処する新しいアプローチである
変形検出TRansformerにインスパイアされ、3次元ガウスおよびカメラパラメータの別クエリを設計する。
変形可能なトランスフォーマー層を通じて層ごとにレイヤを更新し、単一のネットワークで共同最適化を可能にする。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:48:46 GMT)
Towards Robust and Parameter-Efficient Knowledge Unlearning for LLMs [25.9] 大規模言語モデル(LLM)は、大量のテキストコーパスの事前学習を通じて、強い推論と記憶能力を示す。
これはプライバシーと著作権侵害のリスクを生じさせ、効率的な機械学習手法の必要性を強調している。
LLMの堅牢かつ効率的なアンラーニングを可能にする新しいフレームワークであるLoKUを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:53:30 GMT)
Enhancing the Robustness of LLM-Generated Code: Empirical Study and Framework [25.8] RobGenは、モデルの再トレーニングを必要とせずに、コードの堅牢性を高めるように設計されたフレームワークである。
RobGenは、ロバストなモデル生成コードの比率を20.0%削減する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:06:38 GMT)
Mr. DETR: Instructive Multi-Route Training for Detection Transformers [25.8] モデルをマルチタスクフレームワークとして扱い、同時に1対1と1対マニーの予測を行う。
本研究では,一対一予測のための一次経路と,一対多予測のための2つの補助訓練経路を特徴とする多経路学習機構を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:32:36 GMT)
Monocular and Generalizable Gaussian Talking Head Animation [25.7] 単分子および一般化可能なガウス音声頭部アニメーション(MGGTalk)を紹介する。
MGGTalkはモノラルなデータセットを必要とし、パーソナライズされた再トレーニングをすることなく、未確認のIDに一般化する。
我々は,MGGTalkが従来の最先端手法を超越し,様々な指標において優れた性能を発揮することを実証する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:16:52 GMT)
Explorable INR: An Implicit Neural Representation for Ensemble Simulation Enabling Efficient Spatial and Parameter Exploration [25.6] 現在のサロゲートモデルは、ポイントまたはリージョンベースの予測の柔軟性に欠ける。
暗黙的ニューラル表現に基づくサーロゲートモデルであるExplorable INRを提案する。
本研究では,空間探索とパラメータ探索を併用したExplorable INRにより,計算とメモリコストを大幅に削減できることを実証する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:33:28 GMT)
Example-Based Concept Analysis Framework for Deep Weather Forecast Models [25.6] 本研究では,類似の推論プロセスに従う事例を対象モデルにおける対象インスタンスとして識別する,実例に基づく概念分析フレームワークを開発する。
本フレームワークは,気象メカニズムの曖昧さを解消するための概念割り当ての確率を含む,視覚的および概念的に類似した例をユーザに提供する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:22:41 GMT)
Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation [25.5] 音声品質評価には、平均世論スコア(MOS)や話者類似度(SIM)など、複数の側面から音声を評価する必要があるのが一般的である。
本稿では,最近導入された聴覚大言語モデル(LLM)を音声品質自動評価に活用することを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:35:25 GMT)
FairCoder: Evaluating Social Bias of LLMs in Code Generation [25.4] コード生成における社会的バイアスを評価するための新しいベンチマークであるFairCoderを紹介する。
このベンチマークでは、フェアネスのパフォーマンスを評価するために、3つのメトリクスが設計されている。
その結果、全てのLSMが社会的偏見を示すことが明らかとなった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:17:32 GMT)
No, of course I can! Refusal Mechanisms Can Be Exploited Using Harmless Fine-Tuning Data [24.8] 安全でないLMを生成するために無害なデータを使用する既存の攻撃は、応答の最初の数個のトークンでモデル拒絶を除去することに依存していることを示す。
我々は、LMの定式的拒絶機構を利用して有害な応答を誘発する新たなデータ汚染攻撃、No, course, I Can Execute' (NOICE)について述べる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:57:07 GMT)
Zero-shot Benchmarking: A Framework for Flexible and Scalable Automatic Evaluation of Language Models [24.5] タスクごとに高品質なベンチマークを作成するためのフレームワークであるZero-shot Benchmarking (ZSB)を提案する。
ZSBはシンプルで柔軟性があり、データ生成のためのプロンプトの作成と評価のためのプロンプトのみを必要とする。
実際のデータを収集する作業や言語には、費用がかかるか実用的でない。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:40:08 GMT)
Efficient LLaMA-3.2-Vision by Trimming Cross-attended Visual Features [24.3] 我々は、相互注意マップにおけるスパースの性質を利用して、冗長な視覚的特徴を選択的に創り出す。
我々のモデルは、ベンチマークパリティを達成しながら、推論レイテンシとメモリ使用量を減らすことができる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:10:32 GMT)
The Illusionist's Prompt: Exposing the Factual Vulnerabilities of Large Language Models with Linguistic Nuances [23.9] 大規模言語モデル(LLM)は、専門家でないユーザによるリアルタイム情報ソースとしてますます頼りになってきている。
The Illusionist's Promptは,言語的ニュアンスを敵対的クエリに組み込んだ,新たな幻覚攻撃である。
我々の攻撃は、ユーザーの意図や意味を保ちながら、内部の事実的誤りを誘発する高度に伝達可能なイラストルプロンプトを自動生成する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:10:00 GMT)
Investigating Large Language Models in Diagnosing Students' Cognitive Skills in Math Problem-solving [23.8] 本研究では,現在最先端の大規模言語モデルが,数学における生徒の認知能力をどのように診断するかを検討する。
110の中学校数学問題に対する639の学生回答からなる新しいベンチマークデータセットであるMathCogを構築した。
評価の結果,現在最先端のLCMでもF1スコアは0.5以下であり,誤った症例に対して強い虚偽の信頼感を示す傾向にあることがわかった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:29:41 GMT)
UniFlow: A Foundation Model for Unified Urban Spatio-Temporal Flow Prediction [23.8] 都市インフラの最適化と交通災害対応管理には,都市時流予測が不可欠である。
従来のアプローチは、グリッドベースのデータまたはグラフベースのデータに合わせた、別々のモデルに依存してきた。
本稿では,グリッドベースのグラフベースデータを統一した一般都市流予測モデルを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:32:13 GMT)
Is Your LLM Secretly a World Model of the Internet? Model-Based Planning for Web Agents [22.6] 本稿では,各候補行動の結果をシミュレートし,考慮した世界モデルを用いたWebエージェントのためのモデルベース計画フレームワークを提案する。
実証的な結果は、WebDreamerがリアクティブベースラインよりも大幅にパフォーマンスが向上していることを示している。
我々の訓練された世界モデルDreamer-7Bは、GPT-4oに匹敵する性能を発揮し、複雑なウェブ環境における効率的かつ効率的な計画のための特殊な世界モデルの可能性を強調した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:04:47 GMT)
GTree: GPU-Friendly Privacy-preserving Decision Tree Training and Inference [22.6] 決定木(Decision Tree, DT)は、その汎用性、速度、解釈性から広く使われている機械学習モデルである。
プライバシに敏感なアプリケーションでは、DTトレーニングのアウトソーシングとクラウドプラットフォームへの推論が、データのプライバシに関する懸念を提起する。
GTreeは、GPUを用いてMPCで保護されたセキュアDTトレーニングと推論を高速化する最初のスキームである。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:33:59 GMT)
InformGen: An AI Copilot for Accurate and Compliant Clinical Research Consent Document Generation [22.5] 提案するインフォームジェネレーションは,ICF(ICF)ドラフト作成のためのLCM駆動型コーパスである。
実験の結果、InformGenはFDAガイドラインから派生した18のコア規制規則にほぼ100%準拠していることが示されている。
手動による介入と統合すると、InformGenは90%以上の事実精度を獲得し、バニラ GPT-4o モデルの 57%-82% をはるかに上回っている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:14:48 GMT)
AgentNet: Decentralized Evolutionary Coordination for LLM-based Multi-Agent Systems [22.3] AgentNet(エージェントネット)は、マルチエージェントシステムのための分散化された検索型生成(RAG)ベースのフレームワークである。
静的代入や集中制御に依存する従来のマルチエージェントシステムとは異なり、エージェントは動的に専門化できる。
AgentNetはスケーラブルな適応性を促進し、組織間のプライバシ保護コラボレーションを可能にする。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:45:25 GMT)
Hierarchical Attention Networks for Lossless Point Cloud Attribute Compression [22.2] 本稿では,点雲の属性圧縮のための階層的注意コンテキストモデルを提案する。
単純で効果的なレベル・オブ・ディーテール(LoD)構造を導入し、粗い粒度表現を生成する。
同じ改善レベル内の点は並列に符号化され、共通のコンテキストポイントグループを共有する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:14:10 GMT)
Large Language Models are In-Context Molecule Learners [22.1] In-Context Molecule Adaptation (ICMA)は、大規模言語モデルが文脈例から分子文アライメントを学習できるようにする新しいパラダイムである。
ICMAは、Hybrid Context Retrieval、Post-Retrieval Re- rank、In-context Molecule Tuningの3つのステージを組み込んでいる。
実験の結果、ICMAは、余分な訓練コーパスや複雑な構造を伴わずに、LLMに最先端または同等のパフォーマンスを達成できることが示されている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:02:03 GMT)
LLM-Human Pipeline for Cultural Context Grounding of Conversations [22.0] 社会的規範の遵守または違反は、しばしば会話のテナーを規定する。
会話に「文化コンテキスト」を導入する。
我々は中国の文化から、110kの社会規範と23kの会話の違反記述を生成する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:24:24 GMT)
m1: Unleash the Potential of Test-Time Scaling for Medical Reasoning with Large Language Models [21.8] 本研究は,医学的推論のためのテストタイムスケーリングとm1の総合的な研究である。
各種医療タスクに対する評価は,テストタイムのスケーリングが医学的推論を継続的に促進することを示す。
データスケールの増加,データ品質の向上,モデル能力の拡大により,医療知識の基盤化が一貫して進んでいることが判明した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:57:43 GMT)
Explainable AI-Based Interface System for Weather Forecasting Model [21.8] 本研究では,気象学におけるブラックボックスモデルの説明の要件を3つ定義する。
適切なXAI法を各要件にマッピングし、生成した説明を定量的に定性的に検証する。
以上の結果から, 意思決定性やユーザ信頼度の向上が示唆された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:52:34 GMT)
You Cannot Feed Two Birds with One Score: the Accuracy-Naturalness Tradeoff in Translation [21.6] 我々は,情報理論の最近の進歩を数学的に証明し,そのような単一スコアの要約がシステムの性能の完全な図面を与えていないことを実証するために構築した。
例えば、特定の精度のメートル法(BLEUなど)に翻訳システムを最適化することは、当初はシステムの自然性を改善するが、"オーバーフィッティング"のシステムは、その自然性を大幅に低下させる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:31:40 GMT)
Unleashing the Power of Pre-trained Encoders for Universal Adversarial Attack Detection [21.0] アドリアック攻撃は、現実世界のAIシステムにとって重要なセキュリティ脅威となる。
本稿では,大規模事前学習型視覚言語モデルCLIPに基づく,軽量な逆検出フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:21:45 GMT)
CrackSQL: A Hybrid SQL Dialect Translation System Powered by Large Language Models [20.7] CrackはルールとLLMベースのメソッドを組み合わせて制限を克服する最初のハイブリッドSQL方言翻訳システムである。
Crackは3つの翻訳モードをサポートし、Webコンソールインターフェース、PyPIパッケージ、コマンドラインプロンプトを含む複数のデプロイオプションを提供する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:11:03 GMT)
Machine Unlearning Fails to Remove Data Poisoning Attacks [20.5] データ削除要求に従うことに加えて、未学習の手法の潜在的な応用として、有毒なデータの影響を取り除くことが挙げられる。
実験により,既存のアンラーニング手法は様々な環境で有効であることが実証されているが,データ中毒の影響を除去することはできなかった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:49:56 GMT)
Towards Resilient Federated Learning in CyberEdge Networks: Recent Advances and Future Trends [20.5] 我々は,CyberEdgeネットワークにおけるレジリエント・フェデレート・ラーニング(ResFL)の最新技術について検討する。
我々は,集約的推論と機能指向型セキュリティ機構を用いた共同トレーニングに重点を置いている。
これらの進歩は、超低レイテンシ、人工知能(AI)駆動のネットワーク管理、敵攻撃に対するレジリエンスの改善を提供する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 23:06:45 GMT)
Whispering Under the Eaves: Protecting User Privacy Against Commercial and LLM-powered Automatic Speech Recognition Systems [20.5] 本稿では,音声認識システムに対して音声認識を保護するための新しいフレームワークであるAudioShieldを提案する。
摂動を潜伏空間に転送することにより、音質は広範囲に保存される。
AudioShieldは、リアルタイムのエンドツーエンドシナリオにおいて高い効果を示し、適応的な対策に対して強力なレジリエンスを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:49:39 GMT)
UniGS: Modeling Unitary 3D Gaussians for Novel View Synthesis from Sparse-view Images [20.1] 我々は,新しい3次元ガウス再構成と新しいビュー合成モデルであるUniGSを紹介する。
UniGSは、任意の数のスパースビュー画像から3Dガウスの高忠実度表現を予測する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:18:27 GMT)
Conditional Temporal Neural Processes with Covariance Loss [19.8] 本稿では,条件付きニューラルプロセスと概念的に等価な新しい損失関数Covariance Lossを紹介する。
我々は、最先端のモデルを用いた実世界のデータセットに関する広範な実験を行う。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:51:44 GMT)
OncoReg: Medical Image Registration for Oncological Challenges [19.6] この作業は、OncoReg Challengeの背後にある方法論とデータについて詳述する。
コンペのエントリーと結果の包括的分析を提供する。
この登録タスクでは、特徴抽出が重要な役割を担っていることが判明した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:44:33 GMT)
Multilingual and Multi-Accent Jailbreaking of Audio LLMs [19.5] Multi-AudioJailは、マルチリンガルおよびマルチアクセントオーディオジェイルブレイクを利用する最初の体系的なフレームワークである。
音の摂動が言語間音声学とどのように相互作用し、ジェイルブレイクの成功率を急上昇させるかを示す。
クロスモーダル・ディフェンスの研究を促進するためにデータセットをリリースする予定です。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:12:23 GMT)
Consistency-Guided Asynchronous Contrastive Tuning for Few-Shot Class-Incremental Tuning of Foundation Models [19.2] CoACTは、(i)非同期コントラストチューニング、(ii)制御された微調整、(iii)一貫性のあるインクリメンタルチューニングの3つの重要なコンポーネントから構成される。
提案したFew-Shot Class-Incremental Learning (FSCIL)とFew-Shot Class-Incremental Tuning (FSCIT)と呼ばれる新しい挑戦的なセットアップについて検討した。
CoACTは、FSCILで最大5.02%、個々のデータセットで最大12.51%、平均2.47%改善している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:28:44 GMT)
Video-T1: Test-Time Scaling for Video Generation [19.1] 大規模言語モデル(LLM)の研究者たちは、スケーリングをテスト時間に拡大した。
ビデオ生成モデルが非自明な量の推論時間計算を許せば、挑戦的なテキストプロンプトによって生成品質をどの程度向上できるかという問題に答えることを目指している。
テキスト条件付きビデオ生成ベンチマークの実験では、テスト時間計算の増加がビデオの品質を大幅に向上させることを示した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:52:58 GMT)
Where am I? Cross-View Geo-localization with Natural Language Descriptions [19.0] クロスビュージオローカライゼーションは、ジオタグ付き衛星画像やOSMとマッチングすることで、ストリートビュー画像の位置を特定する。
本稿では,シーンテキスト記述に基づいて,対応する衛星画像やOSMデータベースを検索することを目的とした,自然言語記述を用いたクロスビュージオローカライズのための新しいタスクを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 02:48:45 GMT)
Output Prediction of Quantum Circuits based on Graph Neural Networks [19.0] 本稿では,量子回路の出力期待値を予測するためのグラフニューラルネットワーク(GNN)ベースのフレームワークを提案する。
我々は,同じデータセット上での畳み込みニューラルネットワーク(CNN)に対する雑音条件と雑音条件の両方において,GNNの予測性能を比較した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:38:47 GMT)
Diffusion Models in 3D Vision: A Survey [18.8] 3Dビジョンはコンピュータビジョンにおいて重要な分野となり、自律運転、ロボット工学、拡張現実、医療画像などの幅広い応用に力を入れている。
本稿では,3次元オブジェクト生成,形状完備化,点雲再構成,シーン構築など,三次元視覚タスクに拡散モデルを用いる最先端の手法について概説する。
計算効率の向上,マルチモーダル融合の強化,大規模事前学習による3次元タスクの一般化の促進など,潜在的なソリューションについて議論する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:46:41 GMT)
Improved Visual-Spatial Reasoning via R1-Zero-Like Training [18.6] ビデオ視覚空間インテリジェンス(VSI)は、マルチモーダル大言語モデル(MLLM)の最も重要な推論能力の1つである。
この研究は、R1-Zeroライクなトレーニングを通してMLLMの視覚空間的推論を改善するための、最初の詳細な研究を行う。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:11:11 GMT)
Simple yet Effective Node Property Prediction on Edge Streams under Distribution Shifts [18.6] 出現するエッジのストリームから動的ノード特性を予測するために、時間グラフニューラルネットワーク(TGNN)が開発された。
本稿では,分散シフト下でのエッジストリーム上のノード特性の予測方法であるSPLASHを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:20:52 GMT)
LVAgent: Long Video Understanding by Multi-Round Dynamical Collaboration of MLLM Agents [18.6] LVAgentは,MLLMエージェントの長時間映像理解におけるマルチラウンド動的協調を実現するフレームワークである。
提案手法は,選択,知覚,行動,反射の4つの重要なステップから構成される。
LVAgentは4つのメインストリームビデオ理解タスクにおいて80%の精度を実現している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 02:07:45 GMT)
One Policy to Run Them All: an End-to-end Learning Approach to Multi-Embodiment Locomotion [18.6] 統一ロボット形態学アーキテクチャであるURMAを紹介する。
我々のフレームワークは、脚のあるロボットの領域にエンドツーエンドのマルチタスク強化学習アプローチをもたらす。
URMAはロボットプラットフォームに容易に移動可能な複数の実施形態の移動ポリシーを学習できることを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:17:30 GMT)
Deep Generative Models: Complexity, Dimensionality, and Approximation [18.5] 生成ネットワークは低次元入力から高次元データを生成することができることを示す。
本研究は,入力次元と生成ネットワークによるデータ分布のモデル化能力の関係について考察した。
この新たな洞察は、複雑なデータ構造を扱うための生成ネットワークの実用的効果を裏付けるだけでなく、近似誤差、次元性、モデルの複雑さの間の重要なトレードオフを浮き彫りにする。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:07:02 GMT)
Scene4U: Hierarchical Layered 3D Scene Reconstruction from Single Panoramic Image for Your Immerse Exploration [18.2] 本研究では,パノラマ画像を用いた新しい3次元シーン再構築フレームワークScene4Uを提案する。
具体的には、Scene4Uはオープン語彙セグメンテーションモデルと大きな言語モデルを統合して、実際のパノラマを複数の層に分解する。
次に、拡散モデルに基づく階層化された修復モジュールを用いて、視覚的手がかりと深度情報を用いて隠蔽領域を復元し、シーンの階層的表現を生成する。
Scene4Uは最先端の手法より優れ、LPIPSでは24.24%、BRISQUEでは24.40%向上し、訓練速度も最速となった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 03:17:24 GMT)
Privacy-Preserving Transfer Learning for Community Detection using Locally Distributed Multiple Networks [18.1] ネットワークデータのコミュニティ検出において,TransNetと呼ばれる新しいスペクトルクラスタリング手法を開発した。
我々は、異質でプライバシーが保護され、様々なソースにローカルに保存される補助的なソースネットワークを使用している。
重み付きソースネットワークのみを用いた対象ネットワークと推定器のみを用いた推定器よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:19:07 GMT)
Experimental realization and synchronization of a quantum van der Pol oscillator [18.1] そこで本研究では, 非線形減衰型自律型量子駆動散逸システムについて, 単一トラップ原子を用いて述べる。
我々は、ドライブのない位相空間における量子極限サイクルの存在を実証する。
さらに、ドライブの方向と直交する直線的消散の助けを借りて同期を向上できることを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:02:50 GMT)
Using Language Models to Decipher the Motivation Behind Human Behaviors [17.9] 大規模な言語モデルへの様々なプロンプトによって、人間の行動を完全に引き出すことができることを示す。
そして、どの行動を引き出すのにどのプロンプトが必要なのかを分析することで、人間の行動の背後にあるモチベーションを推測することができる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:37:24 GMT)
CancerLLM: A Large Language Model in Cancer Domain [17.7] CancerLLMは70億のパラメータとMistralスタイルのアーキテクチャを持つモデルで、270万近い臨床ノートと17種類のがんに関する515K以上の病理報告で事前訓練されている。
F1スコアは91.78%、表現型抽出は86.81%、ジガノア生成は86.81%である。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 02:23:57 GMT)
Cooper: A Library for Constrained Optimization in Deep Learning [17.6] Cooperは、ディープラーニングモデルにおける制約付き最適化問題を解決するオープンソースのパッケージである。
CooperはLagrangianベースの一階更新スキームをいくつか実装している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:52:53 GMT)
SCRec: A Scalable Computational Storage System with Statistical Sharding and Tensor-train Decomposition for Recommendation Models [17.6] Deep Learning Recommendation Models (DLRMs)は、ソーシャルネットワークやビデオストリーミングといったWebアプリケーション間でパーソナライズされたコンテンツを配信する上で、重要な役割を果たす。
性能の改善により、DLRMsのパラメータサイズはテラバイト(TB)に拡大し、メモリ帯域幅の要求はTB/sを超えるようになった。
TBスケールの産業用DLRMを扱えるスケーラブルな計算ストレージレコメンデーションシステムであるSCRecを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:12:45 GMT)
Retrieval-augmented Few-shot Medical Image Segmentation with Foundation Models [17.5] 本稿では,DINOv2 と Segment Anything Model 2 を併用して,画像の検索を行う手法を提案する。
我々のアプローチでは、DINOv2の機能をクエリとして使用し、制限付きアノテートデータから類似したサンプルを検索し、それをメモリバンクにエンコードする。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 04:02:44 GMT)
Dynamic Graph Structure Estimation for Learning Multivariate Point Process using Spiking Neural Networks [14.8] Spiking Dynamic Graph Networkは、スパイキングニューラルネットワーク(SNN)とスパイク依存塑性(STD-P)の時間的処理能力を活用する新しいフレームワークである。
イベントデータから直接動的時間的依存関係を学習し、一般化性とモデリングを強化することで、任意のデータセットに適応する。
NYC Taxi、911 Reddit、Stack Overflowなどの合成および実世界のデータセットで行った評価は、計算効率を維持しながら、優れた精度を示している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 23:23:10 GMT)
A Survey on Music Generation from Single-Modal, Cross-Modal, and Multi-Modal Perspectives: Data, Methods, and Challenges [14.7] マルチモーダル音楽生成は、画像、ビデオ、テキストなどの複数のモダリティと、音楽スコアとオーディオをガイダンスとして使用する。
本稿では、モーダル性の観点から音楽生成システムを分類し、この分野を概観する。
この領域の主な課題は、効果的なマルチモーダル統合、大規模包括的なデータセット、体系的な評価方法である。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:26:25 GMT)
TS-RAG: Retrieval-Augmented Generation based Time Series Foundation Models are Stronger Zero-Shot Forecaster [14.5] 時系列基礎モデル (TSFM) にはドメイン適応の固有のメカニズムが欠如しており、限定的な解釈可能性に悩まされている。
TS-RAGは、検索強化世代別時系列予測フレームワークである。
TS-RAGは最先端のゼロショット予測性能を達成し,様々な領域でTSFMを最大6.51%上回った。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:23:59 GMT)
Image as an IMU: Estimating Camera Motion from a Single Motion-Blurred Image [14.5] 本研究では,動きのぼかしを動き推定のためのリッチキューとして活用する新しいフレームワークを提案する。
提案手法は, 単一動画像から直接, 濃密な運動流場と単眼深度マップを推定することにより機能する。
本手法は,高速でアグレッシブなカメラの動きを強く捉えるIMUライクな計測法である。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:58:06 GMT)
Light-R1: Curriculum SFT, DPO and RL for Long COT from Scratch and Beyond [14.4] 本稿では、長い推論モデルをトレーニングするためのオープンソースのスイートであるLight-R1を紹介する。
カリキュラムの学習は、多段階のポストトレーニングと組み合わせて、データの難易度を徐々に高めていく。
最終的なLight-R1-14B-DSは,AIME24と25のスコアが74.0,60.2の14Bモデル間でSOTA性能を実現している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:08:26 GMT)
On Benchmarking Code LLMs for Android Malware Analysis [13.9] 大規模言語モデル(LLM)は、様々なコードインテリジェンスタスクにおいて強力な機能を示しているが、Androidのマルウェア分析に対するその有効性はまだ未定である。
本稿では,Android マルウェア解析タスクにおける Code LLM の有効性を体系的に評価するベンチマークフレームワークである Cama を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:05:49 GMT)
Investigating the Capabilities and Limitations of Machine Learning for Identifying Bias in English Language Data with Information and Heritage Professionals [13.6] 支配的なMLアプローチはバイアスを取り除き、公正なモデルを作成することができると仮定している。
バイアスのある言語を識別するモデルを作成し、それを削除しようとするのではなく、データセットのバイアスに注意を向けます。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:51:25 GMT)
Role and Use of Race in AI/ML Models Related to Health [13.5] 健康関連人工知能と機械学習(AI/ML)モデルにおける人種の役割と利用は、注目と論争を呼んでいる。
関連する問題の複雑さと広さにもかかわらず、ステークホルダーの検査と解決をガイドする堅牢で包括的な枠組みはいまだに欠如している。
この視点は、AI/MLライフサイクルを中心に構成され、調査と意思決定を支援するために"検討すべきポイント"を網羅した、レース関連の課題を、幅広いベースで体系的で横断的なランドスケープ分析を提供する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:27:31 GMT)
Recitation over Reasoning: How Cutting-Edge Language Models Can Fail on Elementary School-Level Reasoning Problems? [12.9] 既存の最先端LCMは, 極めて重篤なリサイクリング行動を示す。
これは、最先端のLSMの真のインテリジェンスレベルを再評価するために私たちを補完するLLMコミュニティへの覚醒電話です。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:57:58 GMT)
Context-Aware Human Behavior Prediction Using Multimodal Large Language Models: Challenges and Insights [12.9] 本研究では,事前学習したMLLMを文脈を考慮した人間の行動予測に応用する体系的解析手法を提案する。
我々のフレームワークは、ターゲットフレームにおける人間の振る舞いを予測する際に、92.8%のセマンティック類似性と66.1%の正確なラベル精度に達することができる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:28:19 GMT)
AI Hiring with LLMs: A Context-Aware and Explainable Multi-Agent Framework for Resume Screening [12.8] 大規模言語モデル(LLM)を用いたスクリーニング再開のためのマルチエージェントフレームワークを提案する。
フレームワークは、履歴抽出器、評価器、要約器、スコアフォーマッターを含む4つのコアエージェントから構成される。
この動的適応は、パーソナライズされた採用を可能にし、AI自動化と人材獲得のギャップを埋める。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:56:39 GMT)
Active teacher selection for reinforcement learning from human feedback [12.8] 人間のフィードバックからの強化学習(RLHF)により、機械学習システムは人間のフィードバックから目的を学ぶことができる。
教師の合理性、専門性、コストの相違をモデル化するHidden Utility Banditフレームワークを提案する。
我々は、さまざまなソリューションアルゴリズムを開発し、それらを紙レコメンデーションシステムと新型コロナウイルスワクチンテストという2つの現実世界の領域に適用する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 20:34:11 GMT)
Loschmidt echo zeros and dynamical quantum phase transitions in finite-size quantum systems with linear quench [12.8] 位相遷移点を横切るとき、正確なLoschmidtエコーゼロは、クエンチ率を調整することで常にアクセス可能であることを示す。
臨界時間は、クエンチ速度、システムサイズ、運動量モードの影響を受け、有限サイズ効果と臨界力学の間の相互作用を具現化している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:15:19 GMT)
Data Cleansing for GANs [12.5] 機械学習タスクに適用可能な効果的な戦略の1つは、パフォーマンスを改善する有害なインスタンスを特定することである。
以前のアプローチでは、トレーニングインスタンスが存在しないことがパラメータに直接影響を与えている。
本稿では,GAN評価基準がインスタンスの削除によってどのように変化するかに基づいて,各トレーニングインスタンスの有害度を測定するインスタンス評価手法を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:02:37 GMT)
Amelia: A Large Dataset and Model for Airport Surface Movement Forecasting [12.2] Ameliaフレームワークは4つの重要なコントリビューションで構成されている。
まず、Amelia-48はFAAのシステムワイド・インフォメーション・マネジメント(SWIM)プログラムを通じて収集された空港表面の動きの大規模なデータセットである。
第2に,マルチエージェント・マルチエアポート軌道予測のための大規模トランスフォーマーベースラインであるAmeliaTFを開発した。
第3に,Amelia-10は10の空港から292日間の処理後データからなる訓練と評価のベンチマークである。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 22:28:25 GMT)
StarGen: A Spatiotemporal Autoregression Framework with Video Diffusion Model for Scalable and Controllable Scene Generation [12.0] StarGenは、トレーニング済みのビデオ拡散モデルを長距離シーン生成のために自動回帰的に利用するフレームワークである。
各ビデオクリップの生成は、隣接する画像の3Dワープと、以前に生成されたクリップから時間的に重なる画像とに条件付けされる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:18:01 GMT)
Provably accurate adaptive sampling for collocation points in physics-informed neural networks [11.9] 物理インフォームドニューラルネットワーク(PINN)は、サロゲート解法を効率的に学習する方法として登場した。
本稿では,PDE残差のヘシアンに基づくコロケーション点の精度の高いサンプリング手法を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:45:08 GMT)
ALLVB: All-in-One Long Video Understanding Benchmark [11.9] ALLVB(ALL-in-One Long Video Understanding Benchmark)は、長いビデオ理解のための総合的なベンチマークである。
16のカテゴリーで1,376本のビデオがあり、それぞれ平均で2時間近く、QAは252kだ。
これはビデオの数、平均持続時間、QAの数で最大の長ビデオ理解ベンチマークである。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:30:16 GMT)
Learning to Normalize on the SPD Manifold under Bures-Wasserstein Geometry [11.8] 共分散行列は多くの科学分野において非常に有効であることが証明されている。
表現学習における主要な課題は、この基礎となる幾何学的構造を尊重することである。
本稿では,学習可能なパラメータを組み込んだ新しいRBNアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:12:58 GMT)
Beijing Normal University 12-meter Interferometric kHz GW Detector Prototype: Design and Scientific Prospects [11.8] 高周波体制、特にキロヘルツ(kHz)の範囲では、未探索のままである。
北京師範大学(BNU)の試作機は、専用のkHz GW検出器を開発する先駆的な試みである。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:53:52 GMT)
A predictive machine learning force field framework for liquid electrolyte development [11.5] 本稿では,分子動力学(MD)シミュレーションの予測フレームワークであるBAMBOOを紹介する。
我々は、量子力学シミュレーションから学ぶため、BAMBOOのバックボーンとして、物理に着想を得たグラフ同変変変圧器アーキテクチャを設計する。
また,アンサンブル知識蒸留手法を導入してMLFFに適用し,MDシミュレーションによる観測の変動を低減する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 04:36:27 GMT)
Real-Time Navigation for Autonomous Aerial Vehicles Using Video [11.4] 我々は,コンピュータビジョン(CV)アルゴリズムの作業量を削減するために,新しいマルコフ決定プロセス(MDP)フレームワークを導入する。
提案するフレームワークは,機能ベースとニューラルネットベースのオブジェクト検出タスクの両方に適用する。
これらの総合的なテストは、エネルギー消費と速度に大きな利点を示し、精度は限られている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:14:42 GMT)
Att-Adapter: A Robust and Precise Domain-Specific Multi-Attributes T2I Diffusion Adapter via Conditional Variational Autoencoder [11.4] 我々は,事前学習した拡散モデルにおける細粒度多属性制御を実現するために設計された,新しいプラグイン・アンド・プレイモジュールであるAttribute (Att) Adapterを紹介する。
Att-Adapterは柔軟性があり、トレーニングのためにペア化された合成データを必要としない。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:42:51 GMT)
Personalized Federated Training of Diffusion Models with Privacy Guarantees [11.1] アクセシビリティ、コンプライアンス、倫理的根拠を持つデータの不足は、センシティブな分野における人工知能(AI)の採用への挑戦である。
プライバシー、著作権、競争に対する懸念が高まっているため、制限のない公開データセットへのアクセスはますます制限されている。
合成データは有望な代替手段として登場し、拡散モデルは高品質で多様な合成データを生成する効果的なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:45:26 GMT)
Enhancing Large Language Models for Text-to-Testcase Generation [11.0] 大規模言語モデル(GPT-3.5)に基づくテキスト・ツー・テストケース生成手法を提案する。
提案手法の有効性を,5つの大規模オープンソースプロジェクトを用いて評価した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:37:55 GMT)
Astrea: A MOE-based Visual Understanding Model with Progressive Alignment [10.9] マルチモーダル理解において,Mixture-of-Experts (MoE)アーキテクチャに基づく視覚言語モデル (VLM) が重要なパラダイムとして登場した。
本稿では,プログレッシブ事前アライメントに基づく新しいマルチエキスパート協調型VLMアーキテクチャであるAstreaを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 03:10:50 GMT)
Understanding the Effectiveness of Coverage Criteria for Large Language Models: A Special Angle from Jailbreak Attacks [10.9] 大規模言語モデル(LLM)は人工知能に革命をもたらしたが、重要なドメインにまたがるデプロイメントは、悪意のある攻撃に直面した際の異常な振る舞いを懸念している。
本稿では,このような不確実性を特定する上で,従来のカバレッジ基準の有効性を評価するための総合的な実証的研究を行う。
我々は、クエリを正規またはジェイルブレイクとして分類する際の高精度(平均93.61%)を実現するリアルタイムジェイルブレイク検出機構を開発した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:01:15 GMT)
Disentangling Safe and Unsafe Corruptions via Anisotropy and Locality [10.8] 最先端の機械学習システムは、脅威モデルに従って「小さい」が定義される場合、入力に対する小さな摂動に対して脆弱である。
本稿では,既存の等方的およびグローバルな脅威モデルを超えるロバスト性を研究するために,textttProjected Displacement (PD) と呼ばれる新しい脅威モデルを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:00:20 GMT)
PLM4NDV: Minimizing Data Access for Number of Distinct Values Estimation with Pre-trained Language Models [10.7] マルチセット/カラムの固有値数(NDV)推定は、多くのデータ管理タスクの基盤となる。
何十年にもわたっての研究にもかかわらず、既存の手法のほとんどは、かなりの量のサンプルを必要とするか、見積もりを生成するために列全体にアクセスする必要がある。
我々はこれらの課題に対処するために意味情報、すなわちスキーマを活用することを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:06:20 GMT)
MolGround: A Benchmark for Molecular Grounding [10.2] そこで本研究では,モデル参照能力の評価を目的とした分子基盤ベンチマークを提案する。
我々はこれまでに79kのQAペアからなる分子理解ベンチマークを構築した。
我々のシステムはGPT-4oを含む既存のモデルよりも優れており、その基盤出力は従来のタスクを強化するために統合されている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:49:07 GMT)
VerifiAgent: a Unified Verification Agent in Language Model Reasoning [10.2] 本稿では,メタ検証とツールベース適応検証の2つのレベルを統合した統合検証エージェントを提案する。
VerifiAgentは推論型に基づいて適切な検証ツールを自律的に選択する。
推論スケーリングに効果的に適用でき、より少ないサンプルとコストでより良い結果が得られる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 04:05:03 GMT)
FastRM: An efficient and automatic explainability framework for multimodal generative models [10.2] FastRMは、LVLMの説明可能な関連性マップを効率的に予測する手法である。
FastRMは計算時間を99.8%削減し、メモリフットプリントを44.4%削減した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:34:45 GMT)
Active Learning Design: Modeling Force Output for Axisymmetric Soft Pneumatic Actuators [10.2] エラストマー材料からなる軟式空気圧アクチュエータ(SPA)は、大きなひずみと大きな力を与えることができる。
同心ひずみ制限型軟質空気圧アクチュエータの力-圧力-高さ関係をモデル化する。
この学習された物質モデルは,理論に基づくモデルと単純曲線整合アプローチより優れていることを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:43:00 GMT)
An Optimistic-Robust Approach for Dynamic Positioning of Omnichannel Inventories [9.9] 本稿では,データ駆動型・分散型・楽観的・ロバストなバイモーダル・インベントリ最適化 (BIO) 戦略を新たに導入する。
BIOのバイモーダルな性質は、従来のロバスト最適化(RO)のように、下方リスクのバランスをとる能力に起因している。
BIOは、ロバストネスを慎重にバランスしながら、高い平均性能を達成する従来のROに代わる、新しく、データ駆動で、分散のない代替手段を提供する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:59:59 GMT)
Illuminating the Diversity-Fitness Trade-Off in Black-Box Optimization [9.8] 現実世界のアプリケーションでは、ユーザーは1つの高品質なソリューションよりも構造的に多様な設計選択を好むことが多い。
本稿では, 所定のしきい値以上のペア距離を持つ一定数の解を同定する問題を考察する。
このトレードオフが、根底にある最適化問題の性質にどのように依存するかを分析する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:14:29 GMT)
A Unified Virtual Mixture-of-Experts Framework:Enhanced Inference and Hallucination Mitigation in Single-Model System [9.8] GPTやBERTのような生成モデルは、テキスト生成や要約といったタスクのパフォーマンスを大幅に改善した。
しかし、「モデルが非現実的または誤解を招くコンテンツを生成する場所」という幻覚は、特に小規模アーキテクチャでは問題となる。
本稿では,単一のQwen 1.5 0.5Bモデルにおいて,推論性能を高め,幻覚を緩和する仮想ミックス・オブ・エクササイズ(MoE)融合戦略を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:38:01 GMT)
CodeMMLU: A Multi-Task Benchmark for Assessing Code Understanding Capabilities of CodeLLMs [9.6] CodeMMLUは、Code Large Language Modelsにおけるソフトウェアとコード理解の深さを評価するために設計されたベンチマークである。
コード分析、欠陥検出、ソフトウェアエンジニアリングの原則など、さまざまな領域にまたがる2万近い質問が含まれている。
評価の結果,最先端モデルでさえCodeMMLUと競合することが明らかとなった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 03:31:38 GMT)
Polynomial Time Quantum Gibbs Sampling for Fermi-Hubbard Model at any Temperature [9.6] 我々は、相互作用するフェルミオンに対応する摂動型リンドブレディアンの一定のギャップを最大結合強度まで証明する。
これは格子フェルミオンのギャップの安定性に関する定理を用いて達成される。
アプリケーションとして,検討されたシステムに対する分割関数の計算方法を説明する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:27:22 GMT)
TAMIS: Tailored Membership Inference Attacks on Synthetic Data [9.1] 微分プライベートな合成データ生成手法に対する新しいMIAであるTAMISを提案する。
この攻撃は、最近公開された最先端の手法であるMAMA-MIAに基づいている。
TAMISはSNAKEチャレンジのレプリカでMAMA-MIAと同等あるいは類似のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:08:48 GMT)
Observation of Quantum Darwinism and the Origin of Classicality with Superconducting Circuits [9.1] 自然に量子世界から日々の古典的な観察を合理化するにはどうすればいいのか?
量子ダーウィン主義は古典主義の出現を説明する魅力的な枠組みを提供する。
我々は、古典性と量子相互情報の飽和をサポートする高度に構造化された分岐量子状態を観察した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:33:32 GMT)
HERA: Hybrid Edge-cloud Resource Allocation for Cost-Efficient AI Agents [9.1] AIの領域では、GPT-4のような大規模言語モデル(LLM)がAIエージェントの運用の中心であり、主にクラウドで運用されている。
ローカルベースの小型言語モデル(SLM)がより正確になるにつれて、クラウド排他的処理の必要性が再検討されている。
本稿では,AIエージェントのサブタスクを局所的なSLMとクラウドベースのLLMに自動的に分割する適応反復レベルモデルセレクタ(AIMS)を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:36:13 GMT)
Using machine learning method for variable star classification using the TESS Sectors 1-57 data [9.0] トランジット太陽系外惑星探査衛星(Transiting Exoplanet Survey Satellite, TESS)は、地球規模の太陽系外惑星を検出するために設計された全天球探査衛星である。
約1,050,000光度曲線と2分間の周期を含む1~57セクターのデータを収集した。
データをガイアの可変星カタログと交差マッチングすることで、さらなる分析のためにラベル付きデータセットを得た。
我々は6046 EA, 3859 EW, 2058 CEP, 8434 DSCT, 482 RRab, 416 RRc, 9694 ROTを取得し, 新たに14092個の変光星を発見した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:58:23 GMT)
POPEN: Preference-Based Optimization and Ensemble for LVLM-Based Reasoning Segmentation [8.9] 既存のLVLMベースの推論セグメンテーション手法は、しばしば不正確なセグメンテーション結果とテキスト応答の幻覚に悩まされる。
本稿では、これらの問題に対処し、改善された結果を達成するために設計された新しいフレームワークであるPOPENを紹介する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:51:01 GMT)
Local Information Matters: Inference Acceleration For Grounded Conversation Generation Models Through Adaptive Local-Aware Token Pruning [8.8] Grounded Conversation Generation (GCG)は、オブジェクトセグメンテーションマスクとシームレスに連動する自然言語応答を生成するモデルを必要とする、新たなビジョンタスクである。
GLaMMやOMG-LLaVAといった最近のモデルは、多数の視覚トークンを処理するため、ピクセルレベルのグラウンド化を実現するが、かなりの計算コストがかかる。
FastV や PyramidDrop のような既存のトークンプルーニング手法は、正確な接地に不可欠な局所的な視覚的特徴を保存できない。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:34:57 GMT)
The HCI GenAI CO2ST Calculator: A Tool for Calculating the Carbon Footprint of Generative AI Use in Human-Computer Interaction Research [8.7] HCI(Human-Computer Interaction)研究における生成AI(GenAI)の利用の増加は、二酸化炭素排出量から気候への影響を誘導する。
HCIの研究者たちは、ハードウェアとそのエネルギー消費が平易な視点から隠されているクラウドベースのサービスを使うことが多い。
GenAI CO2ST Calculatorは、ジェネレーションAIを用いた研究におけるエネルギー消費と炭素フットプリントの推定を支援する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:02:45 GMT)
Think or Not Think: A Study of Explicit Thinking inRule-Based Visual Reinforcement Fine-Tuning [8.7] マルチモーダル大言語モデル(MLLM)を用いた視覚分類のためのルールベース強化学習(RL)の微調整と思考プロセスの役割について検討した。
等式精度の報酬を利用して微調整時のモデル思考を最小限に抑える新しいアプローチである textitNo-Thinking-RL を導入する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:52:37 GMT)
From Intuition to Understanding: Using AI Peers to Overcome Physics Misconceptions [8.6] 我々は、学生がニュートン力学の概念に関する基本的な物理学的誤解を正すのに役立つAI「ピア」を設計した。
165人の学生によるランダム化対照試験では、AI Peerと標的となる対話を行った学生はテスト後のスコアを平均10.5ポイント上回った。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 04:09:13 GMT)
Detection of Disease on Nasal Breath Sound by New Lightweight Architecture: Using COVID-19 as An Example [8.5] 感染症、特に新型コロナウイルスは、世界的な健康問題であり続けている。
本研究の目的は、スマートフォンで収集した鼻呼吸音声データを用いて、効率的で正確で費用対効果の高い新型コロナウイルス検出のための、新しい、軽量なディープニューラルネットワークを開発することである。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:41:53 GMT)
$μ$KE: Matryoshka Unstructured Knowledge Editing of Large Language Models [8.5] Matryoshka Unstructured Knowledge Editingは、メモリ更新と出力トークン間の依存関係を保存する。
$mu$KEは、最先端の方法よりも編集効率を最大12.33%向上させる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:24:44 GMT)
DBF-UNet: A Two-Stage Framework for Carotid Artery Segmentation with Pseudo-Label Generation [8.2] 頸動脈セグメンテーションにおけるスパースアノテーション問題に対処する2段階セグメンテーションフレームワークを提案する。
我々は,これらの中心線に沿ってアノテートされたスライスセントロイドとプロパゲートラベルを補間することにより,連続的な容器中心線を構築する。
第2段階では,Dense Bidirectional Feature Fusion UNetを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:41:57 GMT)
Resource Allocation for RIS-Assisted CoMP-NOMA Networks using Reinforcement Learning [8.1] この論文は、STAR-RIS、CoMP、NOMAの3つの変換技術の相乗的統合を探求する。
この研究は、データレートの増大、スペクトル効率の向上、進化途上の6G開発環境のカバー範囲の拡大などにより、これらの技術が将来の無線ネットワークに革命をもたらす可能性を調査する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:14:01 GMT)
Convolutional Neural Networks Can (Meta-)Learn the Same-Different Relation [8.1] 人間は、関係を含む視覚的なタスクにおいて、CNNよりもはるかに優れている。
メタラーニングによる学習では,従来のトレーニングと同一の差分関係を一般化できないCNNアーキテクチャが成功することを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:57:54 GMT)
Plan-and-Act using Large Language Models for Interactive Agreement [8.1] 最近の大規模言語モデル(LLM)はロボットの動作を計画することができる。
状況的HRIにおけるLLMの適用の鍵となる問題は、「現在の人間の活動の反映」と「ロボットのタスクの優先順位付け」のバランスである。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 23:41:05 GMT)
Global Intervention and Distillation for Federated Out-of-Distribution Generalization [7.9] 連合学習における属性スキューは、地元のモデルを非因果関係の学習に集中させる。
本稿では,背景とラベルの急激な関係を断ち切るために,バックドア調整に多様な属性特徴を利用するFedGIDを提案する。
3つのデータセットの実験結果から、FedGIDは、見えないデータで主対象に集中するモデルの能力を向上することを示した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:36:24 GMT)
Towards scientific machine learning for granular material simulations -- challenges and opportunities [7.9] 粒状物質は粒状系の挙動を支配している。
粒子スケールシミュレーションはこれらの相互作用に関する洞察を与えるが、計算コストはしばしば禁止される。
このポジションペーパーは、最近のLorentz Center Workshop on "Machine Learning for Discrete Granular Media"から生まれた。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:03:59 GMT)
Alleviating Performance Disparity in Adversarial Spatiotemporal Graph Learning Under Zero-Inflated Distribution [7.9] 対人訓練(AT)は、ゼロ・イン・ディストリクト(ZID)の下での多数派と少数派のパフォーマンス格差を悪化させる
マイノリティクラスグラディエントと表現強化のためのフレームワークMinGREを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:31:39 GMT)
EMO: Edge Model Overlays to Scale Model Size in Federated Learning [7.8] Federated Learning (FL)は、分散データを持つエッジデバイス上で機械学習モデルをトレーニングする。
本稿では,SFL の課題を軽減しつつ,FL における大規模モデルのトレーニングを可能にするソリューションとして EMO を提案する。
EMOはFLと比較して17.77%の精度向上を実現し、通信コストを7.17倍まで削減し、SFLと比較して訓練時間を6.9倍まで短縮する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:34:58 GMT)
Mixture of Experts Made Personalized: Federated Prompt Learning for Vision-Language Models [7.8] フェデレート・プロンプト学習は,CLIP-like Vision-Language Model's (VLM's) によるファシリテート学習による堅牢な表現学習能力により,フェデレーション・プロンプト学習の恩恵を受ける。
現在のフェデレートされたプロンプト学習手法は、通常、従来のFLパラダイムに制限されており、参加するクライアントは通常、サーバから単一のグローバル集約モデルしかダウンロードできない。
適応確率の個人化混合(pFedMoAP)を提案する。これは、エキスパートの混合レンズ(MoE)を通して、迅速な学習プロセスをパーソナライズする新しいFLフレームワークである。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:53:12 GMT)
HCMA-UNet: A Hybrid CNN-Mamba UNet with Axial Self-Attention for Efficient Breast Cancer Segmentation [7.8] 本研究は,乳癌の病変分割のための新しいハイブリットセグメンテーションネットワークHCMA-UNetを提案する。
我々のネットワークは軽量CNNバックボーンとMISMモジュールで構成される。
我々の軽量モデルは2.87Mパラメータと126.44 GFLOPで優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:36:57 GMT)
Devils in Middle Layers of Large Vision-Language Models: Interpreting, Detecting and Mitigating Object Hallucinations via Attention Lens [7.8] LVLM(Large Vision-Language Models)の幻覚は、その信頼性を著しく損なう。
本稿では,LVLMが視覚情報をどのように処理し,その処理が幻覚を引き起こすかについて述べる。
本稿では,様々な頭部に情報を統合することで視覚的注意を調節する簡易な推論時間手法を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:33:30 GMT)
A Comparative Study of Scanpath Models in Graph-Based Visualization [7.6] アイトラッキング(ET)データは、コスト、プライバシ、スケーラビリティに関する課題を提示する。
本研究では,40名の参加者を対象に,グラフ解析を行ったET実験を行った。
我々は,DeepGaze,UMSS,Gazeformerなどのモデルで生成したヒトスキャンパスと合成パスを比較した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:51:18 GMT)
On-Chain Analysis of Smart Contract Dependency Risks on Ethereum [7.6] 私たちは2024年12月までに4100万以上の契約と1100億のインタラクションを分析します。
私たちの結果は4つの重要な洞察をもたらします。
私たちの仕事は、スマートコントラクト依存関係のリスクを理解するための、初めての大規模な基盤を提供します。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:26:43 GMT)
On the Consistency of Multilingual Context Utilization in Retrieval-Augmented Generation [7.5] 大規模言語モデル(LLM)を用いた検索言語拡張生成(RAG)は,多言語質問応答タスクにおいて高い性能を示した。
多言語RAGでは、検索されたパスは、ユーザが入力したクエリ以外の言語で書くことができる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:55:23 GMT)
Low-resource Machine Translation: what for? who for? An observational study on a dedicated Tetun language translation service [7.3] 本稿では,テトゥーン語に特化したMTサービスであるtetun.orgの実際の使用パターンについて考察する。
10万件の翻訳要求を解析した結果,既存のコーパスに基づいて仮定に挑戦するパターンが明らかになった。
この結果から,テトゥーンのような制度化されたマイノリティ言語のためのMTシステムは,教育的文脈に関連する領域の精度を優先すべきであることが示唆された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:19:04 GMT)
Hawkeye:Efficient Reasoning with Model Collaboration [7.3] CoT推論は,大規模言語モデル(LLM)の推論能力の向上に顕著な効果を示した。
ほとんどのCoTトークンは不要であり、そのごく一部しか保持していないため、高品質な応答を生成するのに十分である。
本稿では,大規模なモデルが簡潔なCoT命令を生成して,より小さなモデルに応答生成を誘導する,新しいトレーニング後推論フレームワークHAWKEYEを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:09:04 GMT)
Detecting PTSD in Clinical Interviews: A Comparative Analysis of NLP Methods and Large Language Models [6.9] 外傷後ストレス障害 (PTSD) は, 臨床現場ではまだ診断されていない。
本研究では,臨床面接書からPTSDを検出するための自然言語処理手法について検討した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 22:06:28 GMT)
Orientation Scores should be a Piece of Cake [6.9] 位置空間 $mathbbR2$ から位置空間 $mathbbR2times S1$ へ持ち上げ、位置方向の不確実性を最小化する。
これらの最小不確実性状態がケーキウェーブレットによってよく近似されていることを示す。
我々は,PDE-)G-CNNのネットワークの複雑さを低減し,モデルの性能にわずかに影響を及ぼすことなく,解釈可能性を向上させることを実験的に示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:09:20 GMT)
CVE-Bench: A Benchmark for AI Agents' Ability to Exploit Real-World Web Application Vulnerabilities [6.8] 大規模言語モデル(LLM)エージェントは、サイバー攻撃を自律的に行う能力が高まっている。
既存のベンチマークは、抽象化されたCapture the Flagコンペティションに制限されているか、包括的なカバレッジが欠如しているため、不足している。
私たちはCVE-Benchを紹介します。CVE-Benchは、クリティカルシヴァリティ・コモン・脆弱性と露出に基づく、現実世界のサイバーセキュリティベンチマークです。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:46:46 GMT)
Hamiltonian Dynamics Learning: A Scalable Approach to Quantum Process Characterization [6.7] 短時間のハミルトン力学に特化して設計された効率的な量子プロセス学習法を提案する。
我々は、量子機械学習の応用を実証し、このプロトコルは、ユニタリ変換を直接学習することで、変分量子ニューラルネットワークの効率的なトレーニングを可能にする。
この研究は、実用的な量子力学学習のための新しい理論的基盤を確立し、短期的およびフォールトトレラントな量子コンピューティングの両方においてスケーラブルな量子プロセスのキャラクタリゼーションの道を開いた。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 02:17:33 GMT)
Smart Contracts in the Real World: A Statistical Exploration of External Data Dependencies [6.7] 10,500件のスマートコントラクトを分析し,古いものや誤ったものを除くと,9,356件の有効契約を保持できた。
コントラクトコードを抽象構文木に変換するためにコード解析を採用し、外部データ依存関係に関連するキーワードを特定しました。
9,356の有効なスマートコントラクトを手作業で分類し、アプリケーションドメインと外部データとの典型的なインタラクション方法を確認しました。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 04:53:38 GMT)
MPCritic: A plug-and-play MPC architecture for reinforcement learning [6.7] 本稿では,MPCriticについて述べる。MPCriticは機械学習に優しいアーキテクチャで,MPCツールとシームレスに連携する。
MPCriticは、パラメータ化されたMPC問題によって定義された損失状況を利用して、バッチトレーニングステップに対する"ソフト"最適化に重点を置いている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:07:07 GMT)
Leveraging Large Language Models for Automated Definition Extraction with TaxoMatic A Case Study on Media Bias [6.6] TaxoMaticは、学術文献からの定義抽出を自動化するフレームワークである。
手動で評価された2,398項目のデータセットに基づいて分析し、Claude-3-sonnetは関連分類と定義抽出の両方において最良の結果を得た。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:47:16 GMT)
CFIRE: A General Method for Combining Local Explanations [6.3] 我々は,局所的な説明から,忠実で理解しやすい,そして完全なグローバルな意思決定ルールを計算するための,新しいeXplainable AIアルゴリズムを提案する。
提案手法は,特定のブラックボックス決定に対して,各サンプルに対してどの寸法が重要かを示す局所的説明器で使用することができる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:04:33 GMT)
High-Quality Pseudo-Label Generation Based on Visual Prompt Assisted Cloud Model Update [6.1] 既存の方法は、しばしば信頼性の高いクラウドモデルを仮定し、潜在的なエラーを無視したり、複雑な分散シフトに苦労する。
本稿では,クラウド適応型高品質擬似ラベル生成(CA-HQP)を提案する。
Bellevueトラフィックデータセットの実験により、CA-HQPは既存の手法と比較して、擬似ラベルの品質を著しく改善することが示された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:20:16 GMT)
A Clustering Method with Graph Maximum Decoding Information [6.1] 本稿では,CMDIと呼ばれるグラフベースモデルにおけるデコード情報の最大化のための新しいクラスタリング手法を提案する。
CMDIは2次元構造情報理論を、グラフ構造抽出とグラフ分割という2つのフェーズからなるクラスタリングプロセスに組み込んでいる。
3つの実世界のデータセットに対する実証的な評価は、CMDIが古典的ベースライン法より優れており、より優れた復号化情報比(DI-R)を示すことを示している。
これらの結果から,デコード情報の品質と計算効率を向上させるCMDIの有効性が示され,グラフベースのクラスタリング解析において有用なツールとして位置づけられた。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:10:49 GMT)
Value Iteration for Learning Concurrently Executable Robotic Control Tasks [6.1] 本稿では,複数のタスクを同時に実行するための冗長ロボットの訓練手法を提案する。
まず、学習された価値関数間のタスク独立性の概念を定義します。
次に、タスク独立の定義を用いて、その制御目的を達成するための政策を促進するコスト関数を提案します。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 20:31:36 GMT)
ReaLitE: Enrichment of Relation Embeddings in Knowledge Graphs using Numeric Literals [6.0] リンク予測に適した知識グラフ埋め込み(KGE)手法は、グラフの実体と関係に重点を置いている。
ReaLitEは、エンティティの数値属性を動的に集約し、結合関係の埋め込みとマージする新しい関係中心KGEモデルである。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:38:22 GMT)
Decomposition of one-layer neural networks via the infinite sum of reproducing kernel Banach spaces [6.0] RKBSsの和は特徴空間の直和と互換性があることが示される。
積分 RKBS を$p$-norm RKBSs の和に分解する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:21:48 GMT)
DynMoLE: Boosting Mixture of LoRA Experts Fine-Tuning with a Hybrid Routing Mechanism [6.0] DynMoLEは、ルータの確率分布のTsallisエントロピーに基づいて、専門家の選択を動的に調整するハイブリッドルーティング戦略である。
我々はDynMoLEが大幅な性能向上を実現していることを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:14:19 GMT)
Catch Me if You Search: When Contextual Web Search Results Affect the Detection of Hallucinations [5.9] 近年,ウェブ検索の結果を大規模言語モデル (LLM) に統合することで,人々が生成したコンテンツの検証に利用するかどうかが疑問視されている。
本研究では,LLM生成コンテンツの評価において,検索結果の提供が参加者の認識精度と信頼度に与える影響について検討した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:36:14 GMT)
Nonhuman Primate Brain Tissue Segmentation Using a Transfer Learning Approach [5.8] 非ヒト霊長類(NHP)は、人間の脳機能や神経疾患を理解するための重要なモデルである。
NHPの脳組織セグメンテーションは神経疾患を理解するために重要であるが、注釈付きNHP脳MRIデータセットが不足しているため困難である。
本稿では,人間の脳MRIデータから伝達される知識を活用するために,STU-Netとトランスファーラーニングを用いた新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:52:54 GMT)
Impact of Data Duplication on Deep Neural Network-Based Image Classifiers: Robust vs. Standard Models [5.5] トレーニングセット、特に言語モデルにおける重複したデータは、かなりの注目を集めています。
本分析は, モデルトレーニングの効率に悪影響を及ぼす要因として, 重複画像の存在が示唆された。
重複サンプルが均一に選択されたとしても、重複量の増加は精度を著しく向上させるには至らない。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:48:00 GMT)
Generative Data Assimilation of Sparse Weather Station Observations at Kilometer Scales [5.4] そこで本研究では,現実的に複雑な1kmスケールの気象条件下でのスコアベースデータ同化の実現可能性を示す。
40の気象観測所からの観測を取り入れることで、左の観測所で10%低いRMSEが達成される。
ますます野心的な地域国家ジェネレータと、In situ、地上ベース、衛星リモートセンシングデータストリームの集合を組み合わす拡張を探求する時期だ。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:48:48 GMT)
Experiential Semantic Information and Brain Alignment: Are Multimodal Models Better than Language Models? [5.4] 計算言語学における一般的な仮定は、マルチモーダルモデルによって学習されたテキスト表現が言語のみのモデルよりも豊かで人間的なものであるということである。
コントラッシブなマルチモーダルモデルからの単語表現と、それらが情報を取得する範囲における言語のみの表現を比較した。
その結果,言語のみのモデルは両面でマルチモーダルモデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:28:38 GMT)
Assessing the Role of Datasets in the Generalization of Motion Deblurring Methods to Real Images [5.4] 本稿では, 単純で効果的なモデルに基づいて, シャープ/ブルーのイメージペアを生成するための効率的な手続き手法を提案する。
これにより、現実的なブラー特性を模倣する、無限に多様なトレーニングペアを生成することができる。
実写映像のブルーリングにおける最終課題に対して,より優れた一般化性能を観察した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 22:22:09 GMT)
DELTA: Decomposed Efficient Long-Term Robot Task Planning using Large Language Models [5.4] 大規模言語モデル(LLM)は多くの研究分野に革命をもたらした。
膨大な知識の収集にもかかわらず、大きな言語モデルは幻覚やドメイン情報の欠落によって実現不可能な計画を生成する可能性がある。
我々は,新しいLLMインフォームドタスク計画手法であるDELTAを紹介する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:33:53 GMT)
Exposing the Ghost in the Transformer: Abnormal Detection for Large Language Models via Hidden State Forensics [5.4] 重要なアプリケーションにおける大規模言語モデル(LLM)は、重大な信頼性とセキュリティリスクを導入している。
これらの脆弱性は悪意あるアクターによって武器化され、不正アクセス、広範囲にわたる誤報、システムの完全性を侵害した。
本研究では,LLMの異常な挙動を隠蔽法で検出する手法を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:58:14 GMT)
QSViT: A Methodology for Quantizing Spiking Vision Transformers [5.3] ビジョントランスフォーマー(ViT)ベースのモデルでは、ビジョンベースのAIタスクにおける最先端のパフォーマンス(精度など)が示されている。
しかし、リソースに制約のある組み込みAIシステムにおいて、その能力を実現することは、その固有の大きなメモリフットプリントのために困難である。
本稿では,SViTモデルを体系的な量子化戦略により圧縮する新しい設計手法であるQSViTを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:34:46 GMT)
Enabling Efficient Processing of Spiking Neural Networks with On-Chip Learning on Commodity Neuromorphic Processors for Edge AI Systems [5.3] ニューロモルフィックプロセッサ上のスパイキングニューラルネットワーク(SNN)アルゴリズムは、超低消費電力/エネルギーAI計算を提供する。
本稿では,コモディティニューロモルフィックプロセッサ上での効率的なSNN処理を実現するための設計手法を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:52:03 GMT)
Mixing Time of Open Quantum Systems via Hypocoercivity [5.3] オープン量子系の混合時間を推定するための既存のアプローチは、しばしばリンドブラディアン発生器のスペクトルギャップ推定に依存する。
本研究では,ハミルトニアン系と散逸系系を別々に扱う開量子系の混合時間を推定する理論的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:33:53 GMT)
Exploring Multidimensional Checkworthiness: Designing AI-assisted Claim Prioritization for Human Fact-checkers [5.2] 我々は,AIによるクレーム優先順位付けのプロトタイプを開発し,クレームの優先順位付けにファクトチェッカーが多次元のチェック価値のある要素をどのように利用するかを探究する。
我々は、階層的な優先順位付け戦略のファクトチェッカーが暗黙的に使用していることを発見し、彼らのワークフローの過小評価された側面を明らかにした。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 03:19:22 GMT)
Class-Dependent Perturbation Effects in Evaluating Time Series Attributions [5.1] 以前見過ごされたクラス依存効果を特徴属性の指標で示す。
解析の結果,摂動に基づく評価は,本質的な属性品質よりも,特定のモデル行動を反映する可能性が示唆された。
本稿では,これらの効果の評価と評価を支援するために,クラス認識型ペナルティ用語を用いた評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:19:41 GMT)
GaussianRoom: Improving 3D Gaussian Splatting with SDF Guidance and Monocular Cues for Indoor Scene Reconstruction [5.1] 本稿では,SDFと3DGSを統合し,正確な幾何再構成とリアルタイムレンダリングを行う統合最適化フレームワークを提案する。
本手法は, 表面再構成と新しいビュー合成の両面において, 最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:49:10 GMT)
Lean Formalization of Generalization Error Bound by Rademacher Complexity [5.1] 一般化誤差は、与えられたトレーニングデータにおける学習マシンのパフォーマンスと、目に見えないテストデータとのギャップを定量化する。
我々はLean 4定理証明器において、ラデマッハ複雑性を用いて一般化誤差を定式化する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 02:26:31 GMT)
Reducing Formal Context Extraction: A Newly Proposed Framework from Big Corpora [5.0] 本研究では,自由テキストから概念階層を抽出する際の形式的文脈を削減する枠組みを提案する。
我々は、WordNetベースの手法と周波数ベースの手法のハイブリッドを用いて、形式的文脈のサイズを小さくすることで、これを実現する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:24:07 GMT)
A Proposed Hybrid Recommender System for Tourism Industry in Iraq Using Evolutionary Apriori and K-means Algorithms [5.0] 本研究では,進化的AprioriとK-meansクラスタリングアルゴリズムを組み合わせたハイブリッドレコメンデーションシステムを提案する。
このシステムは、ユーザの好みやコンテキスト情報に合わせて、パーソナライズされたレコメンデーションと観光地のクラスタを提供する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:28:13 GMT)
Efficient State Estimation of a Networked FlipIt Model [5.0] 攻撃が伝播するネットワークと、ネットワークの真の状態のノイズ信号を提供する侵入検知システムと、コンピュータのサブセットをいつでも掃除できるディフェンダーの能力を用いて、コンピュータネットワーク上での感染拡大を調査する。
ブールカルマンフィルタは、攻撃防御力学とノイズ観測から隠れた真の状態を推定することにより、最適推定問題を解くために用いられる。
本稿では,疫病モデル文献に触発された平均場推定手法を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:13:56 GMT)
On the Robustness of Agentic Function Calling [5.0] 大規模言語モデル(LLM)は、タスクのための特定のツールを呼び出すことができる機能呼び出し(FC)機能を備えた、自律的なエージェントとしてますます機能している。
本稿では,2つの重要な領域においてFCのロバスト性を評価するベンチマークを紹介する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:48:26 GMT)
GameVibe: A Multimodal Affective Game Corpus [4.8] 本稿では,マルチモーダル・オーディオ視覚刺激による感性コーパスであるGameVibeについて紹介する。
コーパスは30のゲームにまたがって公開されている様々なゲームプレイセッションのビデオで構成されている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:14:18 GMT)
Remember, but also, Forget: Bridging Myopic and Perfect Recall Fairness with Past-Discounting [4.8] マルチエージェント設定における動的リソース割り当ては、時間とともに公平さとバランスをとる必要があることが多い。
人間の公正判断は時間的距離とともに進化するという行動的洞察に触発され,過去の分散メカニズムを取り入れた時間的公正のための新しい枠組みを導入する。
本稿では, 付加的・平均的ユーティリティ・コンテキストにおけるディスカウント・リコール・フェアネスの定式化について詳述し, そのメリットを実例で説明するとともに, バランスよくスケーラブルな資源配分戦略を設計する上での意義について論じる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:42:17 GMT)
Challenges of Interaction in Optimizing Mixed Categorical-Continuous Variables [4.7] CatCMAは混合カテゴリー連続変数を最適化する手法として提案されている。
CatCMAで特に問題となる2種類の変数相互作用を同定する。
本稿では,温かい開始戦略とハイパー表現手法の2つのアルゴリズム成分を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:31:54 GMT)
GS_DravidianLangTech@2025: Women Targeted Abusive Texts Detection on Social Media [4.6] 虐待的スピーチ(Abusive speech)とは、弱い個人やグループに対する憎悪を和らげたり、扇動したりすることを目的としたコミュニケーションのこと。
本稿では,ソーシャルメディアプラットフォーム上で女性をターゲットとした乱用テキストの検出に焦点をあてる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:00:07 GMT)
MSSFC-Net:Enhancing Building Interpretation with Multi-Scale Spatial-Spectral Feature Collaboration [4.5] リモートセンシング画像からの解釈を構築するには、主に2つの基本的なタスクがある。
リモートセンシング画像における共同ビルディング抽出と変更検出のためのマルチスケール空間スペクトル特徴協調型デュアルタスクネットワーク(MSSFC-Net)を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:10:23 GMT)
Highway to Hull: An Algorithm for Solving the General Matrix Code Equivalence Problem [4.5] 行列符号同値問題は、2つの行列空間 $mathcalC,mathcalDsubset mathbbF_qmtimes n$ of dimension $k$ で与えられる。
本稿では,一般の場合の問題を解くアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 22:39:31 GMT)
PharMolixFM: All-Atom Foundation Models for Molecular Modeling and Generation [4.4] 我々は全原子基盤モデルを構築するための統一フレームワークであるPharMolixFMを提案する。
我々のフレームワークは、最先端のマルチモーダル生成モデルを用いた3つの変種を含む。
PharMolixFM-Diffはタンパク質-小分子ドッキングにおける競合予測精度を実現する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 02:12:44 GMT)
Phase-shifted remote photoplethysmography for estimating heart rate and blood pressure from facial video [4.4] 心拍数と血圧は、心臓血管系のモニタリングにとって重要な生体情報である。
本論文では,心拍数と血圧を推定する視覚的手法を提案する。
本論文では,2段階の深層学習フレームワークを,BP-NetとBBP-Netで構成する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:04:22 GMT)
Prompting Forgetting: Unlearning in GANs via Textual Guidance [4.4] 本稿では,テキストプロンプトのみを用いて,事前学習されたGANから概念を選択的に解放する新しいフレームワークであるText-to-Unlearnを提案する。
我々のアプローチは、追加のデータセットや教師付き微調整を必要とせずに、未学習プロセスをガイドする。
私たちの知る限り、Text-to-Unlearnは、GANのための最初のクロスプラットフォームなアンラーニングフレームワークです。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 22:18:40 GMT)
AutoML Benchmark with shorter time constraints and early stopping [4.4] Automated Machine Learning (AutoML)は、データ上に機械学習(ML)モデルを自動的に構築する。
AutoML Benchmark (AMLB)は、104タスクにわたる1時間と4時間の時間予算を使用してAutoMLフレームワークを評価することを提案した。
この研究は、ベンチマークで使用される全体的な計算を減らし、より少ない時間制約と早期停止の使用という2つの方法を検討する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 22:22:15 GMT)
OpenFACADES: An Open Framework for Architectural Caption and Attribute Data Enrichment via Street View Imagery [4.3] 建築特性は空間データ基盤において重要な役割を担い、エネルギーシミュレーション、リスク評価、環境モデリングなどの応用を支援する。
近年の進歩により、リモートセンシングとストリートレベルの画像を用いた客観的建物属性の抽出とタグ付けが可能になった。
この研究は,クラウドソースデータを活用したオープンなフレームワークであるOpenFACADESを導入して,そのギャップを埋めるものである。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:20:13 GMT)
GIScience in the Era of Artificial Intelligence: A Research Agenda Towards Autonomous GIS [4.3] 自律型GISの概念を詳述するとともに,その5つの目標,5レベルの自律性,5つのコア機能,3つの運用規模を定義する枠組みを提案する。
我々は,4つの概念実証GISエージェントを用いて,自律型GISがデータ検索,空間解析,マップ作成を行う方法を示した。
本稿は、GISが従来のものから自律的な理由づけ、導出、革新、先進的なソリューションを超えて世界的課題を推し進める未来を構想する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 23:58:17 GMT)
CellVTA: Enhancing Vision Foundation Models for Accurate Cell Segmentation and Classification [4.3] 本稿では,セルインスタンス分割のための視覚基盤モデルの性能を向上させる新しい手法であるCell Vision Transformer with Adapterを提案する。
提案手法は,ViTのコアアーキテクチャを保存し,事前学習した基礎モデルとのシームレスな統合を保証する。
実験の結果,CellVTAはCoNICデータセットで0.538 mPQ,PanNukeデータセットで0.506 mPQを達成した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:36:46 GMT)
FSSUWNet: Mitigating the Fragility of Pre-trained Models with Feature Enhancement for Few-Shot Semantic Segmentation in Underwater Images [4.2] Few-Shot Semantic (FSS)は、最近データスカースドメインで進歩している。
既存のFSS法は水中環境への一般化に苦慮することが多い。
機能強化を伴う水中画像のためのFSSフレームワークFSSUWNetを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:09:15 GMT)
Inaccuracy of an E-Dictionary and Its Influence on Chinese Language Users [4.1] 主要なE辞書の精度はほとんど精査されておらず、そのコーパスの作り方にはほとんど注意が払われていない。
本研究は,中国で最も広く使われているE辞書のひとつであるYoudaoについて,実験,ユーザ調査,辞書評定を併用して検討する。
結果は、不完全あるいは誤解を招く定義が深刻な誤解を引き起こす可能性があることを示している。
この研究は、データ処理における問題と辞書構築におけるAIと機械学習技術の統合を強調し、そのような欠陥定義がどのように生まれたかをさらに調査する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:54:33 GMT)
How Well do LLMs Compress Their Own Chain-of-Thought? A Token Complexity Approach [4.1] 推論長とモデル性能の関係について,最初の系統的研究を行った。
このトレードオフは、非常に明確な推論チェーンにまたがって持続することを示す。
提案手法は, 理論的な限界から遠く離れていることを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:41:36 GMT)
FDDet: Frequency-Decoupling for Boundary Refinement in Temporal Action Detection [4.0] 大規模な事前訓練されたビデオエンコーダは、背景の乱雑さと無関係なセマンティクスを導入し、コンテキストの混乱と境界に繋がる。
本稿では,事前学習したモデルから得られた雑音のセマンティクスをフィルタリングすることで,行動識別性を向上させる周波数対応デカップリングネットワークを提案する。
本手法は時間的行動検出ベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:57:37 GMT)
NeuRadar: Neural Radiance Fields for Automotive Radar Point Clouds [4.0] 我々は、レーダー点雲、カメラ画像、ライダー点雲を共同で生成するNeuRadarについて紹介する。
レーダNeRFのさらなる開発を促進するため,NeuRadarのソースコードをリリースする。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:50:19 GMT)
Deep learning for state estimation of commercial sodium-ion batteries using partial charging profiles: validation with a multi-temperature ageing dataset [3.9] 実験では、実験室の2つの電池モジュールとともに、53個の単細胞を4つの温度で収集した。
部分充電プロファイルを用いて,SOC,キャパシティ,SOHを同時に予測することができた。
SOCは0.998ドル,SOHは0.997ドルであった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 03:28:13 GMT)
A Conformal Risk Control Framework for Granular Word Assessment and Uncertainty Calibration of CLIPScore Quality Estimates [3.9] 本稿では,CLIPScore分布の生成と校正のための簡易かつ効果的な戦略を提案する。
提案手法は,所望のリスクレベルに適合した形式的保証を提供しながら,単語の一致を効果的に検出する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 22:25:00 GMT)
Convergence of Decentralized Actor-Critic Algorithm in General-sum Markov Games [3.9] 一般的なマルコフゲームにおける学習アルゴリズムの特性について検討する。
特に,各エージェントがアクター批判学習を動的に採用する分散アルゴリズムに着目した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:36:00 GMT)
Neural Approaches to SAT Solving: Design Choices and Interpretability [3.9] 本稿では,ブール充足可能性問題に適用したグラフニューラルネットワークの包括的評価を行う。
我々は、いくつかの訓練改善、特に、新しい最寄りの課題監督手法を導入する。
ニューラルネットワーク更新を繰り返す可変クラスグラフ表現の適合性について実験を行った。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 20:31:01 GMT)
Comparative Explanations: Explanation Guided Decision Making for Human-in-the-Loop Preference Selection [3.5] 本稿では,MOLONE(Multi-Output LOcal Narrative Explanation)を紹介する。
MOLONEは、PBO(Human-in-the-loop Preference Bayesian Optimization)における選好選択を高めるために設計された新しい比較説明法である。
MOLONEは、より効率的な選択肢の同定を容易にすることにより、ループ内シナリオの収束を著しく促進することを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:23:54 GMT)
Uncovering the Limitations of Query Performance Prediction: Failures, Insights, and Implications for Selective Query Processing [3.5] 本稿では,最先端QPP(NQC,UQC)の総合評価を行う。
我々は、多様なスパースローダ(BM25、DFree、クエリ拡張なし)とハイブリッドまたは高密度(SPLADE、ColBert)と多様なテストコレクションROBUST、GOV2、WT10G、MS MARCOを使用します。
結果は予測器の精度に有意なばらつきを示し, コレクションを主要因とし, 次にランク付けを行う。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:18:21 GMT)
MaLAware: Automating the Comprehension of Malicious Software Behaviours using Large Language Models (LLMs) [3.4] MaLAwareは、生のマルウェアデータを人間可読な記述に変換するツールである。
MALAwareは、Cuckoo Sandboxの生成したレポートを処理し、悪性度を相関させ、簡潔な要約を生成する。
評価では,人間によるマルウェアの行動記述データセットを基礎的真理として用いた。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:27:17 GMT)
Suite-IN++: A FlexiWear BodyNet Integrating Global and Local Motion Features from Apple Suite for Robust Inertial Navigation [3.3] Suite-IN++は、フレキシウェアボディーネットベースの歩行者ローカライゼーションのためのディープラーニングフレームワークである。
それは、各デバイスのデータの信頼性に基づいてグローバルな機能を融合して、全体の動きの傾向を捉えている。
位置決め精度とロバスト性に優れ、実生活の歩行者追跡シナリオにおいて最先端のモデルよりも大幅に優れる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:40:52 GMT)
Science Autonomy using Machine Learning for Astrobiology [3.3] 近年、人工知能(AI)と機械学習(ML)は、迅速なデータ処理、高度なパターン認識、高度な洞察抽出を可能にする宇宙ミッションに欠かせないものとなっている。
これらのツールは、複雑な生物の背景から生物のパターンを区別しなければならない宇宙生物学の応用において特に有用である。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:20:18 GMT)
Fine-Grained Behavior and Lane Constraints Guided Trajectory Prediction Method [3.3] 本稿では,行動意図認識と車線制約モデリングを統合した新しいデュアルストリームアーキテクチャBLNetを提案する。
我々のネットワークは、既存の直接回帰とゴールベースアルゴリズムよりも大きな性能向上を示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:15:11 GMT)
FedECA: A Federated External Control Arm Method for Causal Inference with Time-To-Event Data in Distributed Settings [3.2] 外部制御アーム(ECA)は、実験薬の初期臨床開発を知らせることができる。
ECAは、規制承認の有効な証拠を提供することができる。
ECAを実装する上での大きな課題は、現実世界または歴史的な臨床試験データにアクセスすることである。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:43:41 GMT)
Lattice Based Crypto breaks in a Superposition of Spacetimes [3.1] 量子重力理論において仮定された時空の重ね合わせの計算的含意について検討する。
格子ベースの暗号スキームのセキュリティは、時空の重畳に基づく計算モデルで妥協される。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:08:20 GMT)
AI Judges in Design: Statistical Perspectives on Achieving Human Expert Equivalence With Vision-Language Models [3.1] 本稿では、AI審査員のレーティングが人間の専門家のレーティングと一致するかどうかを判断する厳密な統計枠組みを提案する。
この枠組みを,VLMに基づく4人の審査員を主要な設計基準で評価するケーススタディに適用する。
その結果,トップパフォーマンスのAI審査員は,一意性や描画品質に関する専門家レベルの合意を達成できることがわかった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:20:29 GMT)
Integrated LLM-Based Intrusion Detection with Secure Slicing xApp for Securing O-RAN-Enabled Wireless Network Deployments [2.9] Open Radio Access Network (O-RAN) アーキテクチャは、オープン性、柔軟性、インテリジェントなクローズループ最適化を促進することで、通信を再構築している。
本研究では,接続されたUEの時間的トラフィックパターンに基づいて,大規模言語モデル(LLM)を用いてセキュリティレコメンデーションを生成する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:45:07 GMT)
Machine Vision-Based Assessment of Fall Color Changes and its Relationship with Leaf Nitrogen Concentration [2.9] 本研究は, 葉の色変化と葉の窒素含量との相関を定量化するための機械ビジョンに基づくシステムについて検討した。
画像データセットは2021年秋から2023年秋の5週間にわたって、地上の車両をベースとした立体視センサーを用いて商業用果樹園で収集された。
葉の窒素濃度が低い木は、高い窒素濃度の木よりも早く黄色に変化した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:39:32 GMT)
Nonparametric spectral density estimation using interactive mechanisms under local differential privacy [2.9] 本稿では,1つの共分散係数を推定し,スペクトル密度を一定周波数で推定し,スペクトル密度関数全体を推定する3つのタスクに対する対話型プライバシ機構を提案する。
提案手法は2段階のプロセスによりより高速な速度を達成し,まずラプラス機構をトランケートされた値に適用し,次に前者の民営化標本を用いて時系列における依存機構の知識を得る。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:52:50 GMT)
PROVGEN: A Privacy-Preserving Approach for Outcome Validation in Genomic Research [2.8] 本稿では,ゲノムデータセット共有のためのプライバシ保護手法であるPROVGENを紹介する。
我々のアプローチはゲノムデータをバイナリ空間にエンコードし、2段階のプロセスを適用する。
提案手法は, GWAS結果の誤り検出において, 既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:51:30 GMT)
Detecting and Mitigating Bias in LLMs through Knowledge Graph-Augmented Training [2.8] 本研究では,大規模言語モデルにおけるバイアスを軽減する新しい手法として,知識グラフ強化訓練(KGAT)について検討する。
バイアスアセスメントのためのパブリックデータセットには、Gender Shades、Bias in Bios、FairFaceがある。
また、バイアス付き関連を補正するためのターゲット緩和戦略も実施し、バイアス付きアウトプットの大幅な低下とバイアス指標の改善につながった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:27:50 GMT)
Super-Heisenberg scaling in a triple point criticality [2.8] 我々は,三点付近の終点に接近して励起を抑え,指数関数的超ハイゼンベルクスケーリングへと導く,断熱的進化プロトコルを開発した。
このスケーリング挙動は、コヒーレンス時間に制限された実験を推定する実用的なパラメーターにおいて非常に有用である。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:55:08 GMT)
Towards Responsible and Trustworthy Educational Data Mining: Comparing Symbolic, Sub-Symbolic, and Neural-Symbolic AI Methods [2.8] 本研究は、一般化可能性、解釈可能性の観点から、象徴的、サブシンボル的、ニューラルシンボル的AI(NSAI)を評価する。
シンボルとサブシンボリックの手法は、バランスの取れたデータに対してうまく機能するが、バランスの取れていないデータセットの低いパフォーマーを特定するのに苦労していることを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:14:11 GMT)
To center or not to center? Hyperspectral data vs. quantum covariance matrices [2.8] 量子状態にデータを埋め込むのに必要な$L2$正規化が、データ中心化にどのように影響するかを示す。
意外なことに,主成分分析により低下した問題における分類性能は影響を受けていない。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:23:01 GMT)
LOCO-EPI: Leave-one-chromosome-out (LOCO) as a benchmarking paradigm for deep learning based prediction of enhancer-promoter interactions [2.7] 本稿では,EPI(Enhancer-Promoter Interactions, Enhancer-Promoter Interactions)予測のための,より徹底的なトレーニングおよびテストパラダイムを提案する。
ランダムスプリッティング環境での学習およびテストにおいて高い精度を実現するディープラーニングアルゴリズムは,LOCO設定下での大幅な性能低下を示す。
また, ヌクレオチド配列のk-mer特徴を融合するEPI予測のための新しいハイブリッドディープニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:20:15 GMT)
Artificial Intelligence and Deep Learning Algorithms for Epigenetic Sequence Analysis: A Review for Epigeneticists and AI Experts [2.5] エピジェネティックス(英: Epigenetics)は、遺伝子配列を変えることなく遺伝子の発現を変化させる機構を包含する。
遺伝子調節と発現の変化は、癌や先天性変形などの様々な疾患や疾患の形で現れる。
機械学習と人工知能(AI)のアプローチは、エピジェネティックな表現表現への変換に広く用いられている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:02:34 GMT)
Brains vs. Bytes: Evaluating LLM Proficiency in Olympiad Mathematics [2.5] 大規模言語モデル(LLM)は、数学的推論タスクにおいて顕著な進歩を示している。
大規模言語モデル(LLM)の最近の進歩は、数学的推論タスクの顕著な進歩を示している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:10:10 GMT)
Modeling and Analyzing the Influence of Non-Item Pages on Sequential Next-Item Prediction [2.5] シーケンシャルレコメンデーションモデルに非イテムページを組み込む方法を示す。
我々は、一般的なシーケンシャルレコメンデータモデルを適用して、非itemページを統合する。
その結果,非イテムページは貴重な情報源であることがわかった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:03:12 GMT)
Agentic Multimodal AI for Hyperpersonalized B2B and B2C Advertising in Competitive Markets: An AI-Driven Competitive Advertising Framework [2.4] 化学業界では、AIによって発見された物質がイノベーションを加速させるが、商業的成功は市場採用に繋がる。
我々は,B2BおよびB2C市場において,自律的かつ個人性の高い広告のための多言語多目的AIフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:37:02 GMT)
IR2: Information Regularization for Information Retrieval [2.3] 本稿では,情報検索のための情報正規化手法IR2について述べる。
実験結果から,我々の正則化手法は,検討したタスクにおいて,従来の合成クエリ生成手法より優れているだけでなく,コストを最大50%削減できることが示唆された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 20:20:47 GMT)
Safety and Security Risk Mitigation in Satellite Missions via Attack-Fault-Defense Trees [2.3] 本研究は,アルゼンチンの航空宇宙専門のミッションクリティカルシステム企業であるAscentio Technologiesの事例研究である。
主な焦点は、現在同社が開発している衛星プロジェクトのためのGround Segmentだ。
本稿では,アタックツリー,フォールトツリー,防御機構を統一モデルに統合したアタック・フォールト・ディフェンス・ツリー・フレームワークの適用について述べる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:24:43 GMT)
A Decade of Deep Learning for Remote Sensing Spatiotemporal Fusion: Advances, Challenges, and Opportunities [2.2] 深層学習はリモートセンシングSTFに革命をもたらした。
本稿では,過去10年間のリモートセンシングSTFにおけるDL開発を概観的にレビューする。
既存の研究における大きな課題について論じ、将来有望な研究基準を特定する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:30:48 GMT)
Graph Classification and Radiomics Signature for Identification of Tuberculous Meningitis [2.2] 結核性髄膜炎 (TBM) は結核菌による重症脳感染症である。
本研究の目的は,T1-weighted (T1w) non-contrast Magnetic Resonance Imaging (MRI) を用いたTBM患者の分類である。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:28:39 GMT)
Towards a Trustworthy Anomaly Detection for Critical Applications through Approximated Partial AUC Loss [2.1] 2値分類器は、偽陽性率(FPR)を最小化しつつ、真陽性率(TPR)が100%に達するのを防ぐAUC ROC曲線の特定の範囲を最適化するために訓練される。
その結果、TPRは6つのデータセットで平均20.43%のFPRで92.52%向上し、他の最先端の方法と比較して12.2%のFPRコストで4.3%改善した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 20:27:35 GMT)
A Graph-to-Text Approach to Knowledge-Grounded Response Generation in Human-Robot Interaction [2.1] 本稿では,対話状態のグラフベース表現に基づく人間-ロボット間相互作用の新しい対話モデルを提案する。
ユーザの発話に応答するために使用されるニューラルネットワークモデルは、シンプルだが効果的なグラフ・トゥ・テキスト機構に依存している。
提案手法はヒューマノイドロボットを用いたユーザスタディにより実験的に評価される。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:39:05 GMT)
Quantum computing of chirality imbalance in SU(2) gauge theory [2.1] 我々は1+1次元のSU(2)非アベリアゲージ理論におけるキラル凝縮の研究のために変分量子アルゴリズムを実装した。
古典的および実際の量子ハードウェア上の量子シミュレーションによる結果は、格子ハミルトンの正確な対角化とよく一致している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:08:58 GMT)
News is More than a Collection of Facts: Moral Frame Preserving News Summarization [2.0] 本稿では,AIによるニュース要約におけるモラル・フレーミングの保存について検討する。
本稿では、ジャーナリストが意図的に用いたり、特定の道徳的な言葉を報告したりする直感を活用するアプローチを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:08:24 GMT)
When Counterfactual Reasoning Fails: Chaos and Real-World Complexity [1.9] 構造因果モデルの枠組みにおける反実的推論の限界について検討する。
低次モデル不確実性やカオス力学といった現実的な仮定は、直観に反する結果をもたらす。
この研究は、カオスと不確実性を特徴とする設定に反実的推論を適用する際に注意を促している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:57:37 GMT)
IHC-LLMiner: Automated extraction of tumour immunohistochemical profiles from PubMed abstracts using large language models [1.8] 本研究では,自動パイプライン IHC-LLMiner を用いて,PubMed の抽象化からIHC-腫瘍プロファイルを抽出する。
最高のパフォーマンスモデルである"Gemma-2 finetuned"は91.5%の精度でF1スコアは91.4である。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:58:07 GMT)
Temporal and Semantic Evaluation Metrics for Foundation Models in Post-Hoc Analysis of Robotic Sub-tasks [1.8] 本稿では,トラジェクトリデータを時間的境界と自然言語に基づく記述サブタスクに分解するフレームワークを提案する。
我々のフレームワークは、全軌道を構成する低レベルのサブタスクに対して、時間ベースの記述と言語ベースの記述の両方を提供する。
この尺度は2つのサブタスク分解の間の言語記述の時間的アライメントと意味的忠実度を測定する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 03:50:12 GMT)
Enhancing 3T BOLD fMRI SNR using Unpaired 7T Data with Schrödinger Bridge Diffusion [1.8] ほとんどの研究は、空間分解能が低く、時間とSNRが低い3T MRIシステムに依存している。
異なる対象データセットから7Tと3TのfMRIデータを整列する新しいフレームワークを提案する。
次に、3TデータのSNRを高めるために、未ペアのBrain Disk Schr"odinger Bridge拡散モデルを適用する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:41:24 GMT)
Input Resolution Downsizing as a Compression Technique for Vision Deep Learning Systems [1.7] 入力分解能の低下が分類とセマンティックセグメンテーションの両方のタスク、およびコンブネットとトランスフォーマーベースのアーキテクチャに与える影響について検討する。
標準ベンチマークによる実験結果から,本手法の可能性を強調し,計算とメモリの要求を大幅に低減し,競争性能を向上する。
本研究は,視覚応用のためのモデル圧縮技術の広い視野において,入力分解能の低減が実現可能かつ有望な方向であることを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:34:57 GMT)
Exploiting Distribution Constraints for Scalable and Efficient Image Retrieval [1.7] 最先端の画像検索システムは、データセットごとに特定のニューラルネットワークをトレーニングする。
オフザシェルフのファンデーションモデルは、データセット固有のモデルに匹敵するパフォーマンスを達成するには不足している。
本稿では,基本モデルの性能を著しく向上するAE-SVC(Strong Variance Constraints)を用いたオートエンコーダを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 22:45:37 GMT)
Global explainability of a deep abstaining classifier [1.7] 我々は,実世界のマルチタスク畳み込みニューラルネットワーク (MTCNN) を用いた深部吸収分類器 (DAC) の組織学的予測タスクにおいて,エラー源を特徴付けるグローバルな説明可能性法を提案する。
本分類法は1億4400万件の手書き検査で評価され,各報告の癌部位, サブサイト, 組織学, 側方性, 行動の同時予測を行った。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:34:10 GMT)
Diffusion models for probabilistic precipitation generation from atmospheric variables [1.6] 地球系モデル(ESM)では、降水は明示的には解決されず、パラメータ化によって表される。
本稿では,条件付き拡散モデルとUNetアーキテクチャを統合した生成機械学習に基づく新しい手法を提案する。
従来のパラメータ化とは異なり、我々のフレームワークは効率的にアンサンブル予測を生成し、降水の不確実性を把握し、手作業による微調整を必要としない。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:21:31 GMT)
Data-Driven Safety Verification using Barrier Certificates and Matrix Zonotopes [1.6] ノイズの多いデータから直接システムの安全性を検証するための,データ駆動型安全性検証フレームワークを提案する。
1つの信頼できないモデルを信頼するのではなく、観測されたデータと整合する一連のモデルを構築します。
このモデル集合は行列ゾノトープを用いてコンパクトに表現され、効率的な計算と不確実性の伝播を可能にする。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:46:42 GMT)
A Dataset of the Representatives Elected in France During the Fifth Republic [1.6] このデータベースは、フランスにおける政治的表現の進化を分析するための前例のない資源となっている。
フランスが選出した代表者の縦断的な見解を提供することで、このデータベースは第5共和政の制度的安定性の研究を促進する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:09:35 GMT)
A YOLO-Based Semi-Automated Labeling Approach to Improve Fault Detection Efficiency in Railroad Videos [1.6] 本研究は, 鉄道ビデオにおけるラベリング過程の合理化と故障検出精度の向上を目的とした半自動ラベリング手法を提案する。
手動ラベル付きデータの小さなセットでプロセスを開始することで、各サイクルの出力を用いて、モデル精度を向上させるために、我々のアプローチは反復的にYOLOモデルを訓練する。
モデル予測の修正を容易にするため, YOLOの検出データを編集可能なテキストファイルとしてエクスポートするシステムを開発した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:50:30 GMT)
Bright squeezed light in the kilohertz frequency band [1.5] 本稿では,多重雑音安定化方式により,新しい鮮やかなシャープ光発生方式を提案する。
1mWのショットノイズ限界よりはるかに低い技術的ノイズを持つレーザビームは、kHz〜MHz周波数範囲で実験的に実現される。
私たちの知る限りでは、これはキロヘルツ帯を横断するミリワットオーダーの明るい絞り光の最初のデモンストレーションである。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:26:06 GMT)
Introducing the Short-Time Fourier Kolmogorov Arnold Network: A Dynamic Graph CNN Approach for Tree Species Classification in 3D Point Clouds [1.5] 短時間フーリエ変換(STFT)を統合した新しいネットワークSTFT-KANを紹介する。
データを用いて樹木種を分類するために,DGCNNの軽量バージョンであるliteDGCNNにSTFT-KANを実装した。
実験の結果,STFT-KANは,モデルの複雑さと性能を効果的にバランスさせて,既存のKANモデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:58:46 GMT)
TheBlueScrubs-v1, a comprehensive curated medical dataset derived from the internet [1.4] BlueScrubs-v1は、広範囲のインターネットコーパスから得られた2500億以上の医療トークンの収集されたデータセットである。
各テキストには、医療関連性、精度、事実の詳細、安全性と倫理基準を含む3つのLCMベースの品質スコアが割り当てられている。
このData Descriptorは、データセットの作成と検証について詳述し、医療AI研究の潜在的有用性について説明している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 22:25:19 GMT)
Lower Bounds on Pauli Manipulation Detection Codes [1.4] パウリマニピュレーション検出(PMD)符号の低い値を示す。
我々の下限は、PMD符号におけるエラーと冗長パラメータの最初のトレードオフを明らかにします。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 02:15:35 GMT)
Minimum Description Length of a Spectrum Variational Autoencoder: A Theory [1.4] 深層学習には最小記述長(MDL)が不可欠である。
MDLに基づく深部変分オートエンコーダ(VAE)の設計と評価のための新しい理論フレームワークを提案する。
我々は、スペクトルVAEが、MDLが達成されたとき、最も適切な方法でデータ分布を理解すると主張している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 03:37:18 GMT)
ASP-based Multi-shot Reasoning via DLV2 with Incremental Grounding [1.4] DLV2は知識表現と推論のためのAIツールである。
DLV2の反復的推論への進化から得られた新しい漸進的推論器を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:43:40 GMT)
Short-PHD: Detecting Short LLM-generated Text with Topological Data Analysis After Off-topic Content Insertion [1.4] Short-PHDは、短いテキストに適したゼロショットLLM生成テキスト検出法である。
Short-PHDは、短いテキストに対する以前のPHD法の推定を安定化する。
公開データセットと生成データセットの両方の実験結果は、Short-PHDが既存のゼロショットメソッドより優れていることを示している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:26:49 GMT)
Do LLMs Surpass Encoders for Biomedical NER? [1.3] 生物医学的実体認識において,大規模言語モデルが優れているかを検討した。
以上の結果から,LLMはFスコアの2-8%で最良エンコーダモデルより2-8%優れていた。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:16:13 GMT)
TenAd: A Tensor-based Low-rank Black Box Adversarial Attack for Video Classification [1.3] textbfTenAdは低ランクの敵対攻撃であり、ビデオを4階テンソルとして表現することで、ビデオデータの多次元特性を活用する。
提案手法は,既存のブラックボックス攻撃に対して,成功率,クエリ効率,摂動障害などの点で優れる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 22:35:28 GMT)
CGKN: A Deep Learning Framework for Modeling Complex Dynamical Systems and Efficient Data Assimilation [1.3] 正確な予測と効率的なDAを同時に提供するために設計されたディープラーニングフレームワークを導入する。
条件付きガウスコオプマンネットワーク(CGKN)は、一般非線形系を条件付きガウス構造を持つ非線形神経微分方程式に変換する。
本研究では, 強い非線形および非ガウス乱流系に対するCGKNの有効性を示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:41:10 GMT)
Enhancing stroke disease classification through machine learning models via a novel voting system by feature selection techniques [1.2] 心臓病は世界中で致死率と死亡率の主要な原因である。
我々は,心臓病の分類を高度化するための特徴選択技術を備えた新しい投票システムを開発した。
XGBoostは、99%の精度、F1スコア、98%のリコール、100%のROC AUCを達成した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:16:49 GMT)
Automated Factual Benchmarking for In-Car Conversational Systems using Large Language Models [1.2] 本稿では,車内対話システムの自動実写ベンチマークのためのLCM手法を提案する。
我々は,5つのLCMに基づく手法で方法論をインスタンス化し,合意の強化と幻覚の最小化のために,アンサンブル技術と多様なペルソナを活用する。
その結果, GPT-4と入力出力プロンプトの組み合わせは, 専門家による評価で90%以上精度が高いことがわかった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 23:25:30 GMT)
Grade Guard: A Smart System for Short Answer Automated Grading [1.0] グレードガードは、ニュアンスまたは部分的に正しい回答を評価するためのフレームワークである。
Indecisiveness Score (IS) を計算し、予測されたグレードの不確かさを反映する。
また、最適化されたIndecisiveness Score(IS)を生成し、精度を高めるためにグレードの合理性を生成する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 23:45:44 GMT)
Krutrim LLM: A Novel Tokenization Strategy for Multilingual Indic Languages with Petabyte-Scale Data Processing [1.0] 我々は,多言語Indic大言語モデル構築のためのデータ準備のための新しいアプローチを開発する。
われわれの厳密なデータ取得は、Common Crawl、Indic Book、ニュース記事、Wikipediaなど、オープンソースとプロプライエタリなソースにまたがっている。
Indic言語毎に、冗長で低品質なテキストコンテンツを効果的に除去するカスタムプリプロセッシングパイプラインを設計する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:16:34 GMT)
Training Frozen Feature Pyramid DINOv2 for Eyelid Measurements with Infinite Encoding and Orthogonal Regularization [0.9] 眼のパラメータの正確な測定は、骨形成診断において重要であるが、手動、非一貫性の方法によって制限されている。
本研究は、SE-ResNet、EfficientNet、DINOv2といったディープラーニングモデルを用いて、スマートフォンで取得した画像を用いて、これらの測定を自動化する。
DINOv2は、特にモバイルデプロイメントに理想的な凍結条件下で、優れたスケーラビリティと堅牢性を示している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:06:08 GMT)
1-2-3-Go! Policy Synthesis for Parameterized Markov Decision Processes via Decision-Tree Learning and Generalization [0.9] 特に、パラメータ化されたマルコフ決定過程をインスタンス化するときに状態空間は極端に大きくなる。
我々は,そのような巨大なMDPに対して合理的な政策を得るための学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:08:39 GMT)
Curriculum Design of Competitive Programming: a Contest-based Approach [0.9] 本稿では,現実的なコンテストシナリオを形式的アセスメントに明示的に組み込んだカリキュラム設計へのコンテストベースのアプローチを提案する。
本稿では,学生の観察能力の体系的発達をめざして構成されたパーデュー大学におけるそのようなコースの設計と実践について述べる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:25:05 GMT)
TWICE: What Advantages Can Low-Resource Domain-Specific Embedding Model Bring? -- A Case Study on Korea Financial Texts [0.9] FinMTEBのような既存のベンチマークは、主に高リソース言語向けに設計されている。
韓国金融ドメインの新しいベンチマークであるKorFinMTEBを紹介する。
実験結果から,FinMTEBの翻訳版ではモデルが頑健に動作する一方で,KorFinMTEB上での性能は微妙に重要な相違点を明らかにした。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:39:12 GMT)
Medical large language models are easily distracted [0.8] 大規模言語モデル(LLM)は医学を変革する可能性を持っているが、実際の臨床シナリオには、パフォーマンスを妨げる余分な情報が含まれている。
MedDistractQAは,実世界の気晴らしをシミュレートしたUSMLEスタイルの質問を用いたベンチマークである。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:34:01 GMT)
Mind the GAP: Glimpse-based Active Perception improves generalization and sample efficiency of visual reasoning [0.8] 視覚関係を理解する人間の能力は、AIシステムよりもはるかに優れている。
Glimpse-based Active Perception (GAP) システムを開発した。
その結果,GAPは即時的な視覚内容を超えた視覚関係の抽出に不可欠であることが示唆された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:43:55 GMT)
Making the quantum world accessible to young learners through Quantum Picturalism: An experimental study [0.6] 量子ピクチュラリズム(Quantum Picturalism, QPic)は、全ての量子力学の完全な図式形式である。
このフレームワークは、絡み合い、測定、混合状態量子力学といった重要な概念を教える新しい方法として、若い学習者にとって特に有利である。
その重要性は、量子情報科学(QIST)のような複雑な分野を高校レベルで導入できることにある。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:54:35 GMT)
Predicting Field Experiments with Large Language Models [0.6] 本研究では,フィールド実験結果の予測を自動生成するフレームワークを提案し,評価する。
この枠組みを著名な経済学文献から抽出した319の実験に適用すると、顕著な予測精度は78%となる。
この歪みは、性別の違い、民族性、社会的規範など、いくつかの要因に起因している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 20:14:35 GMT)
Statistically Testing Training Data for Unwanted Error Patterns using Rule-Oriented Regression [0.6] 本稿では,欠陥に対するトレーニングデータをテストし,その後の機械学習モデルのトレーニングのための信頼性の高い基盤構造を確立する方法を提案する。
我々の手法は、テスト条件'をデータ内のパターンを記述する条件とすることで、従来の統計的テストの能力を拡張します。
デモと実験のためのオープンソース実装を提供しています。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:34:59 GMT)
Operating two exchange-only qubits in parallel [0.6] 線形配置で6個の量子ドットからなる2つの交換専用量子ビットの並列動作を示す。
また,iSWAPゲートとPauliスピンブロッキングリードアウト方式の実験実験を行った。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:12:31 GMT)
Deep Learning Model Predictive Control for Deep Brain Stimulation in Parkinson's Disease [0.6] パーキンソン病(PD)に対するDBSのためのデータ駆動計算アルゴリズムを提案する。
ベータバンド・アクティビティ・レスポンスのシミュレーションモデルを用いたテストでは、トラッキングエラーと制御アクティビティの両方で20%以上を達成する。
提案した制御戦略は、CLDBSを標的としたPDや他の疾患の治療に応用可能な、一般化可能なデータ駆動技術を提供する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:16:49 GMT)
Unveiling Hybrid Cyclomatic Complexity: A Comprehensive Analysis and Evaluation as an Integral Feature in Automatic Defect Prediction Models [0.5] 本稿では,新しい複雑性指標であるHybrid Cyclomatic Complexity(HCC)の解析と,欠陥予測モデルの特徴としての有効性について述べる。
HCCメトリックとその2つのコンポーネントの比較研究、継承された複雑性とオブジェクト指向の文脈におけるクラスの実際の複雑さについて述べる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:07:17 GMT)
WaveFormer: A 3D Transformer with Wavelet-Driven Feature Representation for Efficient Medical Image Segmentation [0.5] 医用画像用3D変換器のWaveFormerについて紹介する。
それは人間の視覚認識システムのトップダウンメカニズムにインスパイアされている。
グローバルコンテキストと高周波の詳細の両方を保存し、重いサンプリング層を効率的なウェーブレットベースの要約と再構成に置き換える。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 02:13:23 GMT)
FsPONER: Few-shot Prompt Optimization for Named Entity Recognition in Domain-specific Scenarios [0.5] FsPONERは、少数ショットプロンプトを最適化するための新しいアプローチであり、ドメイン固有のNERデータセットの性能を評価する。
FsPONERは、ランダムサンプリングとTF-IDFとの組み合わせに基づく3つのショット選択法で構成されている。
データ不足を考慮した実世界のシナリオでは、TF-IDFを用いたFsPONERは、F1スコアで約10%の微調整モデルを上回っている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:19:16 GMT)
Unfair Learning: GenAI Exceptionalism and Copyright Law [0.5] GenAIの公正な使用を支持する法的・実質的な議論はすべて、人間にも等しく適用される、と論じている。
つまり、人間が著作権の著作物に再び費用を払う必要はないということだ。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:49:39 GMT)
Putting GenAI on Notice: GenAI Exceptionalism and Contract Law [0.5] スクレーピングは、ウェブサイトページのコピーを作成するコード(スクレイピングボット)を使って行われる。
ウェブサイトのサービス規約でスクラップを禁止している1つの方法は、条件がいつ強制可能かは必ずしも明確ではないため、緩やかに強制される。
本論文は, スクレーピングとは何か, エンティティがどのように行うのか, ウェブサイトのサービス規約が強制可能であるのか, および, ウェブサイト所有者がスクレーピングの結果としてどのような損害を被るかを説明することによって, 混乱を解消することを目的としている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:58:02 GMT)
Characterizing and exploiting cross-talk effect in SPAD arrays for two-photon interference [0.4] 我々はクロストーク効果を特徴付け、LinoSPAD2カメラのハンベリー・ブラウン・ツイツ効果と比較する。
クロストーク効果を利用した検出器のタイミング校正手法を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 20:54:33 GMT)
Quantum Galilei group as quantum reference frame transformations [0.4] ガリレイ群の量子変形によって生成される量子参照フレーム変換と変換の対応性を示す。
その結果、量子参照フレームの状態が半古典状態の量子重ね合わせにある場合、量子参照フレーム変換が物理的に関係していることを示すことができる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:25:58 GMT)
Multi-objective Combinatorial Methodology for Nuclear Reactor Site Assessment: A Case Study for the United States [0.4] 高い資本コストは原子力発電所にとって依然として課題である。
ブラウンフィールドのサイトは前もって開発あるいは未使用の土地であり、もう一つの魅力的な代替手段であった。
本研究では,米国における3万件以上のNPPサイトを評価するために,新たな多目的最適化手法を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:49:55 GMT)
Leveraging LLMs for User Stories in AI Systems: UStAI Dataset [0.4] 大きな言語モデル(LLM)は、人間の生成したテキストに代わる有望な代替手段として浮上している。
本稿では,学術論文の要約に基づいて,LLMを用いたAIシステムにおけるユーザストーリ生成の可能性について検討する。
分析の結果,LLMは様々な利害関係者のニーズに触発されたユーザストーリーを生成できることがわかった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 08:03:40 GMT)
Improved Round-by-round Soundness IOPs via Reed-Muller Codes [0.4] IOPP (interactive Oracle proof of Near of Trivariate Reed-Muller codes) を提案する。
私たちのIOPPには、ラウンドバイラウンドのサウンドネス、$O(lambda)$クエリ、$O(loglog d)$ラウンド、$O(d)$長さがあります。
具体的には、Reed-Muller符号に近接生成器を与え、IOP構成におけるより体系的な「側条件処理方法」を示し、[Arnon, Chiesa, Fenzi, Yogev]のコンパイル手順を一般化する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:56:37 GMT)
DeformTime: Capturing Variable Dependencies with Deformable Attention for Time Series Forecasting [0.3] 入力空間から相関時間パターンを捕捉しようとするニューラルネットワークアーキテクチャであるDeformTimeを提案する。
これまでに確立されたベンチマークを用いて,6つのMTSデータセットに関する広範な実験を行った。
その結果,DeformTimeはMSS予測タスクの大部分にわたる従来の競合手法と比較して精度が向上することがわかった。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:18:46 GMT)
Scraping the Shadows: Deep Learning Breakthroughs in Dark Web Intelligence [0.2] 我々はダークネット市場(DNMs)からデータを抽出するフレームワークを開発する。
我々は,3つの最先端な名前付きエンティティ認識(NER)モデルの適用性を評価する。
我々は、モデルをトレーニングし、微調整し、評価するために使用する、新しい注釈付きデータセットを提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:12:19 GMT)
LLMs4SchemaDiscovery: A Human-in-the-Loop Workflow for Scientific Schema Mining with Large Language Models [0.2] 従来のスキーママイニングは半構造化データに依存しており、スケーラビリティを制限している。
本稿では,大規模な言語モデルと人間のフィードバックを組み合わせてスキーマ抽出を自動化・洗練する新しいツールであるスキーママイナーを紹介する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:03:33 GMT)
Multi-Task Neural Architecture Search Using Architecture Embedding and Transfer Rank [0.2] マルチタスクニューラルアーキテクチャサーチ(NAS)は、異なるタスク間でアーキテクチャ知識の伝達を可能にする。
我々は、トランスファー効率を高めるために、進化的クロスタスクNASアルゴリズムであるKTNASを提案する。
実験の結果、KTNASは探索効率と下流タスク性能においてピアマルチタスクNASアルゴリズムより優れていた。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:23:11 GMT)
Attainability of quantum state discrimination bounds with collective measurements on finite copies [0.2] いくつかの簡単な量子ビット例において、未知状態の任意の数のコピーに対してヘルストローム境界に対する解析式を求める。
また、M-コピーヘルストローム境界を飽和させるために必要な条件についても検討する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:06:05 GMT)
Lightweight Deep Models for Dermatological Disease Detection: A Study on Instance Selection and Channel Optimization [0.2] 本稿では,分類段階の品質向上のために,DermaMNISTデータセットを前処理する手法を提案する。
その結果,ResNetと類似したモデルの性能を得るため,ニューラルネットワークトレーニングのインスタンス数を削減した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:47:57 GMT)
Towards a Decentralised Application-Centric Orchestration Framework in the Cloud-Edge Continuum [0.2] リソース管理ソリューションは、リソース発見、最適化、アプリケーションのデプロイ、ライフサイクル管理といったタスクを自動化し、管理することで、重要な役割を担います。
本稿ではSwarmchestrateを紹介します。Swarmsの自己組織化原則にインスパイアされた、分散化されたアプリケーション中心のオーケストレーションフレームワークです。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:11:39 GMT)
Are uncloneable proof and advice states strictly necessary? [0.1] 我々は、QMA、BQP/qpoly、FEQP/qpolyといった言語が、不可能な量子証明とアドバイスを必要とすることを示す。
われわれはQMAを、不可能な証明しか持たない言語と定義している。
また、Aaronson、Buhrman、Kretschmerによって使われている言語が、厳密に拘束不能なFEQP/qpolyであるようなオラクルを使わずに示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:34:11 GMT)
Classical and mixed classical-quantum systems from van Hove's unitary representation of contact transformations [0.1] 我々はヒルベルト空間における古典力学の新しい定式化を開発する。
古典力学との整合性については、波動関数の位相を固定する制約を課さなければならない。
定式化は量子二レベル系の測定に適用される。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:32:54 GMT)
New care pathways for supporting transitional care from hospitals to home using AI and personalized digital assistance [0.1] 本稿では,欧州の伝統的なケア経路とモノのインターネット,人工知能,デジタル支援技術の統合について概説する。
移行ケアにおける現在のギャップを特定し、ケアパスを強化するための技術マッピングを定義する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:37:36 GMT)
SCFANet: Style Distribution Constraint Feature Alignment Network For Pathological Staining Translation [0.1] SCFANet(Style Distribution Constraint Feature Alignment Network)
SCFANetはStyle Distribution Constrainer(SDC)とFeature Alignment Learning(FAL)の2つの革新的なモジュールを組み込んでいる。
我々のSCFANetモデルは既存の手法より優れており、H&E画像の正確なIHC画像への変換を実現している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:29:53 GMT)
Repetitions are not all alike: distinct mechanisms sustain repetition in language models [0.1] 反復配列は様々なタスクや状況下で出現し、複数の要因によって駆動される可能性がある。
言語モデル (LM) の内部動作を2つの条件下で検討し, 繰り返しを行う。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:16:11 GMT)
GLiNER-biomed: A Suite of Efficient Models for Open Biomedical Named Entity Recognition [0.1] GLiNER-biomedは、バイオメディカルNERに特化されたジェネリストモデルと軽量モデル(GLiNER)のドメイン適応スイートである。
従来の手法とは対照的に、GLiNERは任意のエンティティ型を推論するために自然言語記述を使用し、ゼロショット認識を可能にする。
いくつかのバイオメディカルデータセットの評価では、GLiNERのバイオバイオームは、ゼロショットと少数ショットの両方のシナリオにおいて、最先端のGLiNERモデルより優れていることが示されている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:40:50 GMT)
Machine Learning Prediction of Cardiovascular Risk in Type 1 Diabetes Mellitus Using Radiomics Features from Multimodal Retinal Images [0.1] 胸部レチノグラフィ,光コヒーレンス断層撮影,OCT血管造影画像から放射線学的特徴を抽出した。
OCT+ OCTAメトリクスと眼データを組み合わせた放射能は、全身的なデータ入力なしでAUC(0.89$pm$ 0.02)を達成した。
これらの結果から,マルチモーダル網膜画像から得られた放射線学的特徴は,CVリスクラベルの識別・分類に有用であることが示唆された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:25:38 GMT)
Charge and Spin Sharpening Transitions on Dynamical Quantum Trees [0.0] U(1)およびSU(2)対称性に従うモニタリングされた量子木における絡み合いとシャープニング遷移について検討した。
その結果, エンタングルメント/パーフィケーションおよびシャープニング遷移は, 異なる測定速度で総じて起こることがわかった。
SU(2)の場合、ファジィ位相は汎用的であり、鋭い位相は最大測定率の限界においてのみ可能である。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 23:38:18 GMT)
α-Ta (111) Thin Films for Qubit Applications: A Study of Thickness Dependence and Universal Scaling [0.0] α-Ta薄膜は、c面サファイア基板上にスパッタエピタキシーにより成長した超薄膜(2nm)から厚膜(250nm)まで幅広い。
X線回折法による薄膜の格子定数と成長方向の抽出
α-Ta(111)表面上の酸化過程の密度汎関数理論シミュレーション
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:01:01 GMT)
rPPG-SysDiaGAN: Systolic-Diastolic Feature Localization in rPPG Using Generative Adversarial Network with Multi-Domain Discriminator [0.0] 本稿では,ジェネレーティブ・アドプレクティブ・ネットワークを用いた新しい深層学習アーキテクチャを提案する。
識別器は、4つの損失関数を統合する:ノイズによる局所最小値への分散損失、可変長の配列とアライメントによって誘導される局所最小値に対処する動的時間損失、所望の周波数領域における均一な分布を保証するスペーサ性損失、PSG信号の収縮期と拡張期の間の時間間隔。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 22:20:27 GMT)
n-dimensional non-commutative GUP quantization and application to the Bianchi I model [0.0] 擬似配置変数で表される構成空間において,ある時点でピークに達したウェーブパケットのダイナミックスを示す。
この選好は、2つの量子論において波のパケットによって示される異なる行動力学から生じる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:08:39 GMT)
ffstruc2vec: Flat, Flexible and Scalable Learning of Node Representations from Structural Identities [0.0] 本稿では、構造的アイデンティティを保持するノード埋め込みベクトルを学習するためのスケーラブルなディープラーニングフレームワークffstruc2vecを紹介する。
フラットで効率的なアーキテクチャは、さまざまなタイプの構造パターンをキャプチャする際の高い柔軟性を可能にし、さまざまなダウンストリームアプリケーションタスクへの広範な適応性を可能にします。
提案手法は, 多様な教師なしタスク, 教師なしタスクにまたがる既存手法を, 実用アプリケーションにおいて著しく上回っている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:47:16 GMT)
Visually Image Encryption and Compression Using a CNN-Based Auto Encoder [0.0] 本稿では,デジタル画像の機密性を確保するための視覚暗号化手法を提案する。
使用するモデルは、畳み込みニューラルネットワーク(CNN)を用いたオートエンコーダに基づく。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:43:36 GMT)
Vision-Language Models for Acute Tuberculosis Diagnosis: A Multimodal Approach Combining Imaging and Clinical Data [0.0] 本研究では,SIGLIPとGemma-3bアーキテクチャを併用したVLM(Vision-Language Model)を提案する。
VLMは胸部X線からの視覚データを臨床コンテキストと組み合わせて、詳細なコンテキスト認識診断レポートを生成する。
結石,空洞,結節などの急性TBの病態は,高い精度とリコールで検出された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:41:57 GMT)
Towards a Blockchain and Opportunistic Edge Driven Metaverse of Everything [0.0] The Metaverse of Everything (MoE)は、Metaverseの概念とInternet of Everything (IoE)を融合したプラットフォームである。
MoEは生成されたデータと仮想エンティティを統合し、相互接続されたコンポーネントの広範なネットワークを作成する。
研究者や企業が将来のサイバーレジリエンス・オパチュニストのMoEを構築するための主な課題を概説している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:40:58 GMT)
Towards Adaptive AI Governance: Comparative Insights from the U.S., EU, and Asia [0.0] 本研究は、米国(米国)、欧州連合(EU)、アジアにおけるAIトレンドの比較分析を行う。
生成AI、倫理的監視、産業応用の3つの重要な側面に焦点を当てている。
米国は最小限の規制制約で市場主導のイノベーションを優先し、EUは倫理的保護を強調する予防的リスクベースのフレームワークを施行し、アジアは規制の監督と迅速な展開のバランスをとる国家主導のAI戦略を採用している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 11:05:47 GMT)
Spectral decomposition of field operators and causal measurement in quantum field theory [0.0] 我々は、ボゾン場の量子論における場の作用素のスペクトル分解を構築する。
この分解を用いて、フィールドオブザーバブルの測定を実装した量子演算の族を構成する。
さらに、これらの量子演算が超音速信号に繋がらず、ソーキンの意味での量子場の計測が可能であることを示している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:08:56 GMT)
Spectral Normalization and Voigt-Reuss net: A universal approach to microstructure-property forecasting with physical guarantees [0.0] 設計プロセスにおける重要なステップは、効果的な機械的、熱的、あるいは一般的には弾性特性の迅速な評価である。
古典的なシミュレーションに基づくアプローチは、例えば有限要素やFFTベースの解法を使うが、かなりの計算資源を必要とする。
本稿では,これらの境界を優先的に適用するスペクトル正規化手法を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:21:57 GMT)
Semantic Mastery: Enhancing LLMs with Advanced Natural Language Understanding [0.0] 本稿では,より高度なNLU技術を用いて,大規模言語モデル(LLM)を進化させる最先端の方法論について論じる。
我々は、構造化知識グラフ、検索強化生成(RAG)、および人間レベルの理解とモデルにマッチする微調整戦略の利用を分析する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 04:12:04 GMT)
Semantic Learning for Molecular Communication in Internet of Bio-Nano Things [0.0] 本稿では,タスク指向分子通信を最適化するエンドツーエンドのセマンティックラーニングフレームワークを提案する。
提案フレームワークはディープエンコーダ・デコーダアーキテクチャを用いて,セマンティックな特徴を効率的に抽出,定量化し,デコードする。
実験により,提案するセマンティック・フレームワークは従来のJPEG圧縮と比較して診断精度を少なくとも25%向上することが示された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:32:08 GMT)
Scaling Up Resonate-and-Fire Networks for Fast Deep Learning [0.0] スパイキングニューラルネットワーク(SNN)は、イベントベースのセンサデータのニューロモルフィック処理において、有望な計算パラダイムを提供する。
RFニューロンは、その生物学的妥当性、複雑な力学、計算の単純さを訴える。
我々は、S5モデルに基づくRFニューロンからなる新しいSSM層であるS5-RFを紹介する。
S5-RFは、RFネットワークを最大4つの層を持つディープSNNに初めてスケールし、78.8%の技術的結果が得られる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:30:55 GMT)
SViQA: A Unified Speech-Vision Multimodal Model for Textless Visual Question Answering [0.0] テキストの書き起こしなしに音声質問を処理する統合音声ビジョンモデルであるSViQAを紹介する。
LLaVAアーキテクチャに基づいて、我々のフレームワークは2つの重要なイノベーションを通じて聴覚と視覚のモダリティを橋渡しします。
SBVQAベンチマークの大規模な実験結果は、提案したSViQAの最先端性能を実証している。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:15:32 GMT)
Role of Riemannian geometry in double-bracket quantum imaginary-time evolution [0.0] ダブルブラケット量子想像時間進化(Double-bracket quantum imaginary-time evolution、DB-QITE)は、エネルギーコスト関数の最も急勾配方向のステップをコヒーレントに実装する量子アルゴリズムである。
我々はDB-QITEの数値シミュレーションを行い、そのようなサドル点付近の遷移のシグネチャを記述する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:00:01 GMT)
Revolutionizing Fractional Calculus with Neural Networks: Voronovskaya-Damasclin Theory for Next-Generation AI Systems [0.0] この研究は、対称性と双曲型摂動関数によって活性化されるニューラルネットワーク演算子に対する厳密な収束率を導入する。
古典近似理論をカプトー微分を通じて分数計算に拡張する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:03:00 GMT)
Review of "Just Plain Wrong: The Dalliance of Quantum Theory with the Defiance of Bell's Inequality" [0.0] This is a review of Frank Lad's book "Just Plain Wrong: The Dalliance of Quantum Theory with the Defiance of Bell's Inequality"。
This is a review of Frank Lad's book "Just Plain Wrong: The Dalliance of Quantum Theory with the Defiance of Bell's Inequality"。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:42:11 GMT)
Resolving the Exploration-Exploitation Dilemma in Evolutionary Algorithms: A Novel Human-Centered Framework [0.0] アルゴリズム設計における探索-探索のジレンマに対する体系的な解決には、探索と搾取に関して独立して調整された制御が必要である。
本稿では,(1)と(2)の具体化を外部変数(検索空間制御)で実現するHCTPS(Human-Centered Two-Phase Search)フレームワークを提案する。
我々は,HCTPSが,EAs固有の収束機構を乱すことなく,検索空間のカバー範囲において,現在のアプローチをはるかに上回っていることを証明した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 23:55:35 GMT)
Rerouting Connection: Hybrid Computer Vision Analysis Reveals Visual Similarity Between Indus and Tibetan-Yi Corridor Writing Systems [0.0] この論文は、インダス・バレーの台本とチベット・李回廊の地図システムとの間の潜在的な歴史的つながりを調べるために、詳細な人類学的枠組みとともにCNN-Transformerのハイブリッドアーキテクチャを用いている。
チベット・李回廊の文字は、青銅器時代(10.2%-10.9%)や原エラマイト(7.6%-8.7%)に比べて、インダス文字(61.7%-63.5%)の約6倍の視覚的類似性を示した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:56:42 GMT)
Refined Quantum Algorithms for Principal Component Analysis and Solving Linear System [0.0] 主成分分析と線形方程式の解法のための2つの主要な量子アルゴリズムの洗練されたバージョンを概説する。
提案手法は,従来の量子アルゴリズムや量子化アルゴリズムよりも指数関数的に高速である。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:23:54 GMT)
Recent advances in the electromagnetic interactions of Dirac and Weyl particles [0.0] ディラック粒子は、電磁四ポテンシャル場と磁場の広い範囲で同じ量子状態を占有できることを示す。
ワイル粒子は外部電磁場がなくても局所状態を形成することができる。
我々は、ワイルフェルミオンを利用して、前例のない100ペタビット/秒の速度で情報の流れを調節する革新的な装置を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:28:19 GMT)
Quantum memory based on concatenating surface codes and quantum Hamming codes [0.0] 本研究では,量子ハミング符号と曲面符号の結合を量子メモリとして検討する。
エラーしきい値が高く、原則として表面コードのしきい値まで押し上げることができる。
エラーを抑える利点は、中間スケールの量子メモリに現れ始めます。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:30:56 GMT)
Quantum computation of a quasiparticle band structure with the quantum-selected configuration interaction [0.0] 本稿では,量子部分空間展開法(QSE)と量子選択構成相互作用法(QSCI)を組み合わせて準粒子バンド構造を計算するハイブリッド手法を提案する。
IBM量子プロセッサ上で16量子ビットを用いたシリコンの準粒子バンド構造の量子計算を実演する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:25:19 GMT)
Quantum cellular automata and categorical dualities of spin chains [0.0] スピン鎖上の対称性を反映する局所作用素の代数間の有界なスプレッド同型である圏双対について検討する。
双対性に関する根本的な問題は、量子セルオートマトンに拡張できるかどうかである。
ドップリッヒ=ハーグ=ロバーツ双加群の機械を用いた拡張問題の解を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:59:25 GMT)
Quantum Resetting Protocols Based on Synchronizing Words [0.0] 量子同期語に基づく新しいリセットプロトコルを提案する。
本稿では,このプロトコルを実現し,量子コンピュータ上で実装可能な量子回路を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:23:21 GMT)
Propaganda is all you need [0.0] 政治的指向的なアライメントは、LLMの埋め込み空間に非常に強い影響を与える。
社会政治的アプローチをとることで、ほとんどの大きなLLMはマルクス主義哲学が「支配的なイデオロギー」と呼ぶものと一致していると仮定できる。
このような偏見は、社会的一様性のための新しい、または、変装した過激主義の見解を人々の間で引き寄せることによって、社会的変化に大きな影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:54:05 GMT)
Probing the dichotomy between Yu-Shiba-Rusinov and Majorana bound states via conductance, quantum noise and $Δ_T$ noise [0.0] 一次元金属/スピンフリップ/金属/絶縁体/超伝導接合におけるマヨナ境界状態(MBS)からYSR状態を分析する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:55:31 GMT)
Predicting Movie Production Years through Facial Recognition of Actors with Machine Learning [0.0] 本研究では、機械学習アルゴリズムを用いて俳優を特定し、映画からランダムに撮影された画像から俳優の年齢を抽出する。
アラブ映画から撮影された画像の使用には、一様でない照明、俳優のための異なる複数のポーズ、俳優や俳優のグループとの複数の要素などが含まれる。
ロジスティック回帰モデルは、トレーニングフェーズにおける他のモデルと比較して最高のパフォーマンスを示した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 04:46:05 GMT)
Predicting Dynamics from Flows of the Eigenstate Thermalization Hypothesis [0.0] 統計ヤコビ近似(SJA)と呼ばれる手法を導入し,固有状態熱化仮説(ETH)を更新する。
SJAは、ETHアンザッツの様々な形状因子に対する積分微分フロー方程式を生成する。
摂動ハミルトニアンの熱状態におけるクエンチダイナミクスとオートコレレータを予測する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:00:02 GMT)
Pre-Floquet states facilitating coherent subharmonic response of periodically driven many-body systems [0.0] 本研究では,外部周期駆動力を受ける多ボソン系のコヒーレントなサブハーモニック動作を示す。
高次サブハーモニック応答でさえ体系的に設計でき、実験的に観察できると論じられている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:33:11 GMT)
Nonequilibrium Universality of a Squeezing Phase Transition [0.0] ハイゼンベルクに特徴的な位相と部分集合位相の遷移を見出した。
本研究は, 低温原子, 分子, ライドバーグプラットフォームにおける量子センシングおよび量子シミュレーションへの応用の可能性を考慮した新しい動的相転移を示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:13:40 GMT)
Non-Equilibrating a Black Hole with Inhomogeneous Quantum Quench [0.0] 1+1)次元共形場理論における量子クエンチ過程について検討する。
M"obius Hamiltonian によるクエンチでは、物理量の永遠周期的な振動が発見された。
我々のクエンチ装置は、低温状態を作り出す方法や、ブラックホールの形成と蒸発過程をシミュレートする手段として使用することができる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:02:14 GMT)
Noise-tolerant public-key quantum money from a classical oracle [0.0] 公開鍵設定において、耐雑音性を実現する方法について初めて示す。
この方式の紙幣は、共役符号化状態を作成し、標準基底ベクトルを置換するユニタリを適用することで鋳造される。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:38:01 GMT)
No-go theorem for environment-assisted invariance in non-unitary dynamics [0.0] 本研究は,非単体操作では,環境支援による断熱的ショートカットが達成できないことを示す。
また,外部浴槽にCFTが結合した場合,AdS/CFTにおける永遠ブラックホールの静的状態が侵害されることが示唆された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:54:31 GMT)
No Free Lunch with Guardrails [0.0] 我々は,現行のガードレールが実用性を維持しつつ誤用を効果的に防ぐかどうかを評価する。
調査の結果,ガードレール付き無料ランチは存在せず,セキュリティ強化がしばしばユーザビリティの犠牲となることが確認された。
ユーザビリティを維持しつつリスクを最小限に抑える優れたガードレールを設計するための青写真を提案する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 05:46:54 GMT)
New intertwining operators for the Calogero model [0.0] 我々は、結合定数の固定値と整数値に対して相互作用する粒子の数をエンハングする「新しい垂直」インタツツイン器を構築する。
副生成物として、非対称リウヴィル積分の新しい基底が標準対称積分と関連して現れる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 20:34:46 GMT)
NCAP: Scene Text Image Super-Resolution with Non-CAtegorical Prior [0.0] Scene Text Image Super- resolution (STISR) は低解像度画像の解像度と画質を向上させる。
TPのような明示的なカテゴリーの先行は、誤ってSTISRに悪影響を及ぼす可能性がある。
事前訓練された認識器は、低解像度画像とのTP闘争を発生させるのに使われた。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 04:14:07 GMT)
Multimodal LLMs for OCR, OCR Post-Correction, and Named Entity Recognition in Historical Documents [0.0] 我々は,マルチモーダル大規模言語モデル (mLLM) が研究者の歴史的文書の書き起こしにどう役立つかを検討する。
我々は,mLLMと従来のOCRモデルの両方の既製の転写精度をベンチマークした。
我々はまず,mLLMを用いたOCR出力のマルチモーダル後補正を導入する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 04:21:34 GMT)
Multilingual Performance of a Multimodal Artificial Intelligence System on Multisubject Physics Concept Inventories [0.0] 大規模言語モデルに基づく人工知能システム GPT-4o の多言語・多モーダル性能について検討する。
私たちは、複数の言語と主題カテゴリにまたがる様々な物理概念の在庫を使用します。
結果より, 被験者ごとのパフォーマンスの変動が示唆され, 実験室のスキルが最も弱いことが示唆された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:02:28 GMT)
Multi-copy activation of genuine multipartite entanglement in continuous-variable systems [0.0] 真のマルチパート・エンタングルメント(GME)のマルチコピー・アクティベーションは、2つの分離可能だが完全に分離不能な状態の複数のコピーがGMEを示す現象である。
GME-activatable non-Gaussian state の例を示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:18:47 GMT)
Linked Array Tree: A Constant-Time Search Structure for Big Data [0.0] Linked Array Tree (LAT) は、検索、挿入、削除操作の時間的複雑さを実現するために設計された新しいデータ構造である。
LATの低メモリオーバーヘッドとポインタ重構造の回避は、大規模かつ集中的なワークロードに適しています。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:15:55 GMT)
Leveraging GANs For Active Appearance Models Optimized Model Fitting [0.0] Active Outearance Models (AAM) は、画像に変形可能なモデルを適用するための確立された技術である。
AAMフィッティングプロセスがGAN(Generative Adversarial Network)の恩恵を受けるかどうかを検討する。
我々は、GAN拡張フレームワーク用のU-NetベースジェネレータとPatchGAN識別器を用いて、装着時の外観モデルを洗練する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 20:12:07 GMT)
Learning by gaming, coding and making with EDUMING: A new approach to utilising atypical digital games for learning [0.0] 本稿では、EDUMINGの概念を用いて、デジタル学習ゲームの開発を簡単にするための新しい方法を提案する。
ゲームベースの学習のような概念と確立された概念の主な違いは、ゲームが閉じられず、受動的に消費されることである。
この研究は、コンセプトの実践的なテストに対する最初の経験的アプローチとして意図されている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:02:18 GMT)
Knowledge-Aware Iterative Retrieval for Multi-Agent Systems [0.0] 本稿では,新しい大規模言語モデル (LLM) によるエージェントフレームワークを提案する。
動的に進化する知識を活用することで、クエリを反復的に洗練し、文脈的証拠をフィルタリングする。
提案システムは、更新されたコンテキストの競合的および協調的な共有をサポートする。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 14:21:15 GMT)
It costs nothing to teleport information into a black hole [0.0] 最近発見されたブラックホールのデコヒーレンス現象は、量子情報を任意のエネルギーコストでブラックホールにテレポートする方法を説明します。
ランダウアーの原理に従って、ゼロではない最小エネルギーコストは、外界からの情報とノイズの純消去がある場合や、ゼロビット'がブラックホールに送られるときのみ現れる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:00:00 GMT)
Integrating Fourier Neural Operators with Diffusion Models to improve Spectral Representation of Synthetic Earthquake Ground Motion Response [0.0] 原子炉施設は、強震動による動的負荷に耐えるように設計されなければならない。
本研究では,人工地動を生成するためのAI物理に基づくアプローチを提案する。
以上の結果から,このような手法が生成した人工地震計の現実性を高めることが示唆された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:08:09 GMT)
Innovative LSGTime Model for Crime Spatiotemporal Prediction Based on MindSpore Framework [0.0] 本稿では,Long Short-Term Memory(LSTM)とGated Recurrent Unit(RU)とMultiheadparse Self-attentionメカニズムを統合した犯罪時空間予測モデルLGSTimeを提案する。
統合モデルは、複雑な時間的データを扱うために、それぞれのテクニックの強みを活用する。
CNNモデルと比較して、Mean Squared Error(MSE)、Mean Absolute Error(MAE)、Root Mean Squared Error(RMSE)の2.8%、1.9%、および1.4%のパフォーマンス向上を示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:50:20 GMT)
Improving Mapper's Robustness by Varying Resolution According to Lens-Space Density [0.0] 本研究では,意味空間全体にわたる単一解像度スケールの仮定を除去するMapperアルゴリズムの修正を提案する。
我々の研究は、モース型関数の像中の密度(レンズ空間密度)が広く変化するデータセットによって動機付けられている。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 20:21:04 GMT)
Identifying Predictions That Influence the Future: Detecting Performative Concept Drift in Data Streams [0.0] 本稿では,データストリームにおける潜在的な性能的概念的ドリフトを特定することを目的とした,新しいタイプのドリフト検出タスクを提案する。
CheckerBoard Performative Drift Detection (CB-PDD) と呼ばれる最初のドリフト検出手法を提案する。
その結果,CB-PDDは高い有効性,偽検出率の低下,内在的ドリフトに対するレジリエンス,半合成データセットにおける実行的ドリフトを効果的に検出する能力を示した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:59:58 GMT)
Hybrid interfaces at the single quantum level in fluorescent molecules [0.0] 複数の外部レーザー源が単一の蛍光分子の振動状態を制御している。
定常状態は振動の両モード性を示し、非古典的な振動子猫状態の統計的混合をもたらす。
この研究は、電子、光子、振動のハイブリッドな絡み合った状態を作るための最適量子ツールボックスとしての分子の役割を評価する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:56:04 GMT)
Holistic analysis on the sustainability of Federated Learning across AI product lifecycle [0.0] フェデレートラーニング(FL)というAIの分散的アプローチ
Cross-Silo FLは、クライアントが生データではなくモデル更新を共有できるようにするため、プライバシが向上する。
モデルトレーニングのエネルギー消費とコストはクロスサイロ・フェデレート・ラーニングと同等である。
フェデレートラーニング。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:58:38 GMT)
Global Framework for Emulation of Nuclear Calculations [0.0] 本研究では,初期多体計算とベイズニューラルネットワークを組み合わせた階層的枠組みを構築した。
我々は、酸素同位体連鎖を用いた開発をベンチマークし、地上エネルギーと核電荷半径の正確な結果を得る。
我々の枠組みは、核力を記述する低エネルギー定数に対して、核結合エネルギーと電荷半径のグローバル感度解析を可能にする。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 21:54:07 GMT)
Gazeau-Klauder coherent states for a harmonic position-dependent mass [0.0] この系を記述するシュレーディンガー型方程式を解くことで固有系を導出する。
この系に対するガゼウ・クラウダーのコヒーレントな状態を構築する。
これらの状態の統計的性質を計算し分析する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 19:53:24 GMT)
Entanglement-verified time distribution in a metropolitan network [0.0] 本稿では,テレコム波長における量子ドットが生成する絡み合った光子対と相関した光子対を利用した量子クロック同期の新たな手法を実験的に実証する。
我々は、絡み合った光子間のタイトな時間相関を利用して、数十ピコ秒の同期精度を実現する。
その結果、実世界の量子ネットワークにおける安全な時間同期と量子鍵分布のための共有リソースとして、量子ドット生成の絡み合ったペアの可能性を強調した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:57:11 GMT)
Entanglement and Optimal Timing in Discriminating Quantum Dynamical Processes [0.0] 2つの開量子力学過程を最適に区別する問題に対処する。
この問題は、異なる時間依存チャネルの集合から引き出された2つの量子チャネルを区別できる最適時間を特定することで解決される。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:57:52 GMT)
Enhancing Negation Awareness in Universal Text Embeddings: A Data-efficient and Computational-efficient Approach [0.0] 否定は自然言語推論や知覚分析といった自然言語処理タスクにおいて重要な役割を果たしている。
近年のユニバーサルテキスト埋め込みの進歩は、様々なタスクにおけるコンテキストテキスト埋め込みよりも優れた性能を示している。
一般的な評価ベンチマークのバイアスのため、これらのモデルの否定意識能力は依然として不明である。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 09:39:57 GMT)
Emotion estimation from video footage with LSTM [0.0] 本稿では,ライブラリMediaPipeが生成したブレンド・サップを処理するLSTMモデルを提案し,顔の表情から主感情を推定する。
このモデルはFER2013データセットに基づいてトレーニングされ、71%の精度と62%のf1スコアを提供する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 23:11:09 GMT)
Effect-driven interpretation: Functors for natural language composition [0.0] 人間の言語も同様に、純粋な価値と不純なプロセスの付与と引き抜きを中心に組織されている、と我々は主張する。
自然言語合成のエレガントで明快な分析を支援するために,コンピュータサイエンスからの記述技術をどのように活用できるかを示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 00:46:01 GMT)
Double-bracket algorithm for quantum signal processing without post-selection [0.0] 量子信号処理(QSP)は、様々な量子アルゴリズムにおいて基本的なプリミティブである。
汎用性にも拘わらず、QSPを実装するためのすべての体系的なプロトコルがポストセレクションに依存している。
我々は、補助量子ビットもポストセレクションも必要としないエルミート行列のQSP変換を実装するための新しい公式を導入する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:00:04 GMT)
Double commutator method for a two band Bose-Einstein condensate: superfluid density of a flat band superfluid [0.0] 超流動密度と正規密度の和が f-sum 則の重みに等しいことを証明している。
平面バンドBose-Einstein Condensate(BEC)の超流動密度について検討する。
その結果,超流動密度は音速と圧縮率の二乗の積と直接比例していることが示唆された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 22:04:38 GMT)
Diffusion-model approach to flavor models: A case study for $S_4^\prime$ modular flavor model [0.0] 本稿では,拡散モデルを用いて,一般的なフレーバーモデルにおける実験的制約のあるパラメータを探索する手法を提案する。
我々は,自由パラメータを生成対象として扱うことにより,クォーク質量,CKM行列,Jarlskog不変量を再現するニューラルネットワークを構築した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:29:03 GMT)
Did ChatGPT or Copilot use alter the style of internet news headlines? A time series regression analysis [0.0] ChatGPTやCopilotといった先進的な大規模言語モデル(LLM)のリリースは、テキストの作成方法を変えつつある。
本研究は,この2つのLLMのリリースが,ニュースサイトにおける見出しやリンクの書き方の変化と一致したかどうかを考察した。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 06:56:57 GMT)
Detection of Anomalous Vehicular Traffic and Sensor Failures Using Data Clustering Techniques [0.0] 本研究では,高速道路センサからの交通流データの解析にクラスタリング手法を用いる。
複数のクラスタリング手法、すなわちパーティショニングと階層的手法を、様々な時系列表現と類似度尺度と組み合わせて検討する。
本手法は高速道路センサのリアルタイムデータに適用し,異なるクラスタリングフレームワークが交通パターン認識に与える影響を評価する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:09:39 GMT)
Detecting Financial Fraud with Hybrid Deep Learning: A Mix-of-Experts Approach to Sequential and Anomalous Patterns [0.0] 本研究では、Mixture of Experts(MoE)フレームワークとRecurrent Neural Networks(RNN)、Transformer Encoders、Autoencodersを統合したクレジットカード不正検出用ハイブリッドアーキテクチャを提案する。
MoEフレームワークは専門家の予測責任を動的に割り当て、適応的で文脈に敏感な意思決定を可能にする。
提案するハイブリッドシステムは、ますます洗練された詐欺パターンを検出するために、スケーラブルでモジュラーで規制対応のアプローチを提供する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 20:47:18 GMT)
Design, Implementation and Practical Energy-Efficiency Evaluation of a Blockchain Based Academic Credential Verification System for Low-Power Nodes [0.0] 教育システムは広範な文書や書類を管理しており、人的ミスや、外交官、証明書、その他の資格証明書の改ざんなどの不正行為や詐欺に繋がることがある。
本稿では、CPUブロックチェーンにデプロイされたスマートコントラクトがサポートする分散アプリケーションを通じて、学術記録の記録と検証を目的としたソリューションを提案する。
提案手法は,従来のProof-of-Workコンセンサスプロトコルと新しいProof-of-Authority(PoA)プロトコルとを比較し,性能とエネルギー効率の両面で評価する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:18:58 GMT)
Deformations of the symmetric subspace of qubit chains [0.0] 対称部分空間の変形を群構造 $mathcalU_q(mathfraksu(2))$ の変形として提示する。
対称部分空間の変形は、各スピンの内積の局所的な変形に対応し、対称性からの離脱を位置依存的な内積に符号化することができる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 15:59:29 GMT)
Cryptographic tests of the python's lunch conjecture [0.0] 絡み合いのくさびは、局所的には存在するが、CFTサブリージョンへの世界最小の面を含んでいない場合もあり、この場合、ピソンの昼食を含んでいると言われている。
我々は、適切なCFTサブリージョン間の相互情報は、ランチの幾何学に関連した領域差によって線形に下降していると論じる。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 16:56:24 GMT)
Conversations with Data: How Data Journalism Affects Online Comments in the New York Times [0.0] 本研究では、データジャーナリズム(DJ)がオンラインコメントにどのように影響するかを、データとのユーザインタラクションのケーススタディとして検討する。
コーパスは2014年から2022年までの6,400のストーリーと、DJや他のニューヨーク・タイムズのコメントセクションで構成されている。
その結果,DJはユーザ間の対話性が高いことが示唆された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 07:41:09 GMT)
Cellular automata in $d$ dimensions and ground states of spin models in $(d+1)$ dimensions [0.0] 我々は、$d$次元セルオートマトン(CA)の軌跡を用いて、$(d+1)$次元古典スピンモデルの基底状態を決定する方法を示す。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:45:22 GMT)
Catastrophic Forgetting in LLMs: A Comparative Analysis Across Language Tasks [0.0] 大規模言語モデル(LLM)は、かなり高度な自然言語処理(NLP)を持つ
本研究では,主要なNLUタスクに対する各種オープンソースLLMの連続的な微調整について検討する。
以上の結果から,Phi-3.5-miniのようなモデルでは,強い学習能力を維持しつつ,最小限の忘れを生じさせることが示唆された。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 23:06:55 GMT)
CNOT-Optimal Clifford Synthesis as SAT [0.0] 2量子CNOTゲートのようなノイズゲートの最小化は、実用的な計算に不可欠である。
我々は、CNOTカウントの最適性を保証するために、クリフォード回路上でのみ、一定の正規形式で網羅的な探索を提案する。
実験では、我々の符号化は、ランダムなクリフォード回路における既存のSATアプローチよりも大幅に優れていた。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:35:58 GMT)
Artificial Geographically Weighted Neural Network: A Novel Framework for Spatial Analysis with Geographically Weighted Layers [0.0] AGWNNは、複雑な非線形空間関係を捉えるために、地理的に重み付けされた技術とニューラルネットワークを統合する新しいフレームワークである。
AGWNNの性能を厳格に評価するために、シミュレーションデータセットと実世界のケーススタディの両方を用いて包括的な実験を行った。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 01:48:46 GMT)
Aplicação de Large Language Models na Análise e Síntese de Documentos Jurídicos: Uma Revisão de Literatura [0.0] 大規模言語モデル (LLMs) は、法的文書の分析と合成を最適化するためにますます使われている。
本研究の目的は,LLMに適用された技術の現状を法的文脈で把握するために,系統的な文献レビューを行うことである。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:34:00 GMT)
Analyzing homogenous and heterogeneous multi-server queues via neural networks [0.0] 我々は,シングルステイトンマルチサーバシステムにおいて,顧客数の定常分布を予測するために,機械学習アプローチを用いる。
システム内の顧客数の定常分布を、$GI/GI_i/2$キューで予測するのは私たちだけです。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 12:30:18 GMT)
Accelerating drug discovery with Artificial: a whole-lab orchestration and scheduling system for self-driving labs [0.0] 自動運転ラボは、自動化されたAI誘導の実験を可能にすることで、薬物発見を変革している。
しかし、複雑なオーケストレーション、さまざまな楽器とAIモデルの統合、データの効率的な管理といった課題に直面している。
人工知能は、包括的なオーケストレーションとスケジューリングシステムでこれらの問題に対処する。
ラボの操作を統一し、自動化し、AIによる意思決定を統合する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:22:50 GMT)
AI Regulation and Capitalist Growth: Balancing Innovation, Ethics, and Global Governance [0.0] ルールと監視は、信頼の構築と公衆の保護によって長期的な成長を促進するのか、それともイノベーションと自由な企業を制限するのか?
本稿では、AI規制と資本主義的理想のバランスについて検討し、AI駆動アプリケーションにおけるAIデータプライバシに対する異なるアプローチがイノベーションにどのように影響するかに焦点を当てる。
我々の分析は、過去の前例、現在のアメリカの規制の状況、経済予測、法的課題、そして最近のAI政策のケーススタディを合成する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:59:02 GMT)
A stochastic gradient descent algorithm with random search directions [0.0] ランダムな探索方向を持つ勾配降下アルゴリズムを新たに開発する。
ステップベクトルを減らしたこれらのアルゴリズムのほぼ確実に収束を確立する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 13:10:07 GMT)
A minimal Introduction to Quantum Computing [0.0] 本稿では,プログラマや機械学習技術者,データサイエンティストなど,コンピュータプロフェッショナルに適した量子コンピューティングの紹介を紹介する。
我々のアプローチは、QCの基礎となる物理を抽象化し、チューリングマシンのような計算モデルとしてフレーム化する。
基礎状態、量子ゲート、テンソル積などの基本的な概念を導入し、量子計算の構成要素がどのように形成されるかを説明する。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 17:33:28 GMT)
A Novel Approach to Reduce Derivative Costs in Variational Quantum Algorithms [0.0] QNDM(Quantum Non-Demolition Measurement)は、量子可観測体の勾配やヘッセンを効率的に推定する。
コスト関数の導関数を評価する際に、QNDMアプローチはより効率的である。
本研究の重要な成果は,補充材料として提供されたPythonにおけるQNDM法の実装である。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 10:20:18 GMT)
A Deterministic Model of Free Will [0.0] 2つの概念に基づいて自由意志の決定論的モデルを開発する。
人間には自由意志があるが、決定論はそうではない。
このモデルは、量子物理学実験における自由選択の基礎的な問題を研究するために応用される。
論文参考訳(メタデータ) (Tue, 01 Apr 2025 18:00:36 GMT)