Fugu-MT: arxivの論文翻訳(概要)

Chain of Code: Reasoning with a Language Model-Augmented Code Emulator [115.2]
我々は、LMコード駆動推論を改善するシンプルながら驚くほど効果的な拡張であるChain of Codeを提案する。キーとなるアイデアは、プログラム内のセマンティックなサブタスクを、インタープリタが明示的にキャッチできるフレキシブルな擬似コードとしてフォーマットすることを、LMに促すことである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:27:56 GMT)
Video Understanding with Large Language Models: A Survey [97.3]
言語・マルチモーダルタスクにおける大規模言語モデル(LLM)の顕著な機能を考えると,近年の映像理解の進歩について概観する。 Vid-LLMの創発的能力は驚くほど進歩しており、特にオープンな多粒性推論能力がある。本調査は,Vid-LLMのタスク,データセット,ベンチマーク,評価方法論に関する総合的研究である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:25:20 GMT)
Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI [96.0]
人工知能(Embodied AI)は、人工知能(AGI)の実現に不可欠である MLMとWMは、その顕著な知覚、相互作用、推論能力のために、大きな注目を集めている。本調査では,Embodied AIの最近の進歩を包括的に調査する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 01:59:21 GMT)
DynoSurf: Neural Deformation-based Temporally Consistent Dynamic Surface Reconstruction [93.2]
本稿では3次元点雲列から時間的に一貫した表面を対応なく再構成する問題について考察する。テンプレート表面表現と学習可能な変形場を統合した教師なし学習フレームワークDynoSurfを提案する。実験により、DynoSurfの現在の最先端アプローチに対する顕著な優位性を示した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:16:22 GMT)
AutoAD-Zero: A Training-Free Framework for Zero-Shot Audio Description [92.7]
本研究の目的は,映画とテレビシリーズのオーディオ記述(AD)を無訓練で生成することである。市販のビジュアル言語モデル(VLM)と大規模言語モデル(LLM)のパワーを利用する。当社のアプローチであるAutoAD-Zeroは、映画とテレビシリーズのAD生成において優れたパフォーマンスを示し、最先端のCRITICスコアを達成しています。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:59:56 GMT)
Dual Test-time Training for Out-of-distribution Recommender System [91.2]
DT3ORと呼ばれるOODレコメンデーションのための新しいDual Test-Time-Trainingフレームワークを提案する。 DT3ORでは、テスト期間中にモデル適応機構を導入し、リコメンデーションモデルを慎重に更新する。我々の知る限りでは、テストタイムトレーニング戦略を通じてOODレコメンデーションに対処する最初の研究である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:27:51 GMT)
OV-DINO: Unified Open-Vocabulary Detection with Language-Aware Selective Fusion [88.6]
我々はOV-DINOと呼ばれる新しいオープン語彙検出手法を提案する。言語対応の選択的融合を統一フレームワークに組み込んだ、さまざまな大規模データセットで事前トレーニングされている。提案するOV-DINOのオープン語彙検出ベンチマークにおける性能評価を行った。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:26:21 GMT)
Knowledge Mechanisms in Large Language Models: A Survey and Perspective [88.5]
本稿では,知識利用と進化を含む新しい分類法から知識メカニズムの解析をレビューする。 LLMが学んだ知識、パラメトリック知識の脆弱性の理由、そして解決が難しい潜在的な暗黒知識(仮説)について論じる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:15:59 GMT)
SEGIC: Unleashing the Emergent Correspondence for In-Context Segmentation [87.2]
In-context segmentationは、"in-context example"と呼ばれるいくつかのラベル付きサンプルイメージを使用して、新しいイメージをセグメント化することを目的としている。単一ビジョン基盤モデル(VFM)に基づくエンドツーエンドのセグメンテーション・イン・コンテクストフレームワークSEGICを提案する。 SEGICは、ワンショットセグメンテーションベンチマークで最先端のパフォーマンスをもたらす、単純だが効果的なアプローチである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:16:05 GMT)
A Survey of Large Language Models in Medicine: Progress, Application, and Challenge [85.1]
大規模言語モデル (LLM) は、人間の言語を理解し、生成する能力のために大きな注目を集めている。本総説は,医学におけるLSMの開発と展開について概説することを目的としている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:16:30 GMT)
Not All Pairs are Equal: Hierarchical Learning for Average-Precision-Oriented Video Retrieval [80.1]
平均精度(AP)は、関連ビデオのランキングを上位リストで評価する。最近のビデオ検索手法は、全てのサンプル対を等しく扱うペアワイズ損失を利用する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:52:04 GMT)
MMInstruct: A High-Quality Multi-Modal Instruction Tuning Dataset with Extensive Diversity [80.0]
高品質で多様な視覚指導訓練データセットMMInstructを構築し、24ドメインの973K命令で構成されている。提案する命令生成エンジンは,手作業のコストで半自動,低コスト,マルチドメインの命令生成を可能にする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:55:22 GMT)
MINI-SEQUENCE TRANSFORMER: Optimizing Intermediate Memory for Long Sequences Training [78.9]
ミニシーケンス変換器(Mini-Sequence Transformer, MsT)は、非常に長いシーケンスを持つ高速かつ高精度なLLMトレーニング手法である。 MsTは入力シーケンスを分割し、中間メモリ使用量を減らすためにミニシーケンスを反復的に処理する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 01:52:30 GMT)
Condition-Invariant Semantic Segmentation [77.1]
我々は現在最先端のドメイン適応アーキテクチャ上で条件不変セマンティック(CISS)を実装している。本手法は,通常の都市景観$to$ACDCベンチマークにおいて,2番目に高い性能を実現する。 CISSはBDD100K-nightやACDC-nightのようなトレーニング中に見えない領域によく一般化している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:12:50 GMT)
Benchmarks as Microscopes: A Call for Model Metrology [76.6]
現代の言語モデル(LM)は、能力評価において新たな課題を提起する。メトリクスに自信を持つためには、モデルミアロジの新たな規律が必要です。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:52:12 GMT)
STAMP: Outlier-Aware Test-Time Adaptation with Stable Memory Replay [76.1]
テスト時間適応(TTA)は、トレーニングデータとテストデータの間の分散シフトに、未ラベルのデータのみを用いて対処することを目的としている。本稿では,サンプル認識とオフリエ拒絶の両方を行う問題に注意を払っている。本稿では,STAble Memory rePlay (STAMP) と呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:25:41 GMT)
Cross-Speaker Encoding Network for Multi-Talker Speech Recognition [75.0]
Cross-MixSpeaker ネットワークは、話者間の表現を集約することでSIMOモデルの制限に対処する。ネットワークはSOTと統合され、SIMOとSISOの両方の利点を利用する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:14:07 GMT)
Promises and Pitfalls of Generative Masked Language Modeling: Theoretical Framework and Practical Guidelines [74.4]
GMLM(Generative Masked Language Models)に焦点を当てる。我々は,マルコフ連鎖の入力として使用されるマスキングにより,データ分布の条件付き確率に適合するモデルを訓練し,モデルからサンプルを抽出する。我々は,T5モデルを並列デコーディングに適応させ,最小品質の犠牲を伴って機械翻訳における2～3倍の高速化を実現した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:00:00 GMT)
Consistent Diffusion Meets Tweedie: Training Exact Ambient Diffusion Models with Noisy Data [74.3]
アンビエント拡散(アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散本稿では,ノイズの多い学習データのみを考慮し,故障のない分布から確実にサンプルを採取する拡散モデルのトレーニングのための最初のフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:31:08 GMT)
UltraEval: A Lightweight Platform for Flexible and Comprehensive Evaluation for LLMs [74.2]
本稿では,ユーザフレンドリな評価フレームワークであるUltraEvalを紹介し,その軽量性,包括性,モジュール性,効率性を特徴とする。その結果のコンポーザビリティにより、統一された評価ワークフロー内で、さまざまなモデル、タスク、プロンプト、ベンチマーク、メトリクスを自由に組み合わせることができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:07:06 GMT)
Discrete Flow Matching [74.0]
本稿では,離散データ生成に特化して設計された新しい離散フローパラダイムを提案する。我々のアプローチは、非自己回帰的な方法で高品質な離散データを生成することができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:33:27 GMT)
DGE: Direct Gaussian 3D Editing by Consistent Multi-view Editing [72.5]
オープンな言語命令に基づいて3Dオブジェクトやシーンを編集する際の問題点を考察する。この問題に対する一般的なアプローチは、3D編集プロセスをガイドするために2Dイメージジェネレータまたはエディタを使用することである。このプロセスは、コストのかかる3D表現の反復的な更新を必要とするため、しばしば非効率である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:11:07 GMT)
Conditioned Language Policy: A General Framework for Steerable Multi-Objective Finetuning [72.5]
本稿では,多目的言語モデルを微調整するためのフレームワークである条件付き言語ポリシー(CLP)を提案する。マルチタスクトレーニングとパラメータ効率の微調整のテクニックに基づいて、CLPは推論時に競合する目的を効果的にトレードオフするステアブルモデルを学ぶことができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:13:38 GMT)
Building Machines that Learn and Think with People [72.4]
我々は、協調認知の科学が、本当に思考パートナーと呼ばれることのできるエンジニアシステムにどのように機能するかを示す。我々は、人間とAIの思考パートナーが協力し、人間と互換性のある思考パートナーシップのためのデシダータを提案できる、協力的思考のいくつかのモードを配置した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:42:45 GMT)
SIGMA:Sinkhorn-Guided Masked Video Modeling [69.3]
SIGMA (Sinkhorn-guided Masked Video Modelling) は、新しいビデオ事前学習法である。時空管の特徴を,限られた数の学習可能なクラスタに均等に分散する。 10個のデータセットによる実験結果から,より高性能で時間的,堅牢な映像表現を学習する上で,SIGMAの有効性が検証された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:04:09 GMT)
Learning Where to Look: Self-supervised Viewpoint Selection for Active Localization using Geometrical Information [68.1]
本稿では, 位置決めの精度を高めるために, 視点選択の重要性を強調し, アクティブな位置決め領域について検討する。私たちのコントリビューションは、リアルタイム操作用に設計されたシンプルなアーキテクチャ、自己教師付きデータトレーニング方法、および実世界のロボティクスアプリケーションに適した計画フレームワークにマップを一貫して統合する能力による、データ駆動型アプローチの使用に関するものです。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:32:09 GMT)
CBGBench: Fill in the Blank of Protein-Molecule Complex Binding Graph [66.1]
CBGBenchは構造ベースドラッグデザイン(SBDD)のベンチマークである既存のメソッドを属性に基づいて分類することで、CBGBenchは様々な最先端メソッドを実装している。我々は,これらのモデルを薬物設計に不可欠なタスクに適応させてきた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:22:37 GMT)
Domain-Adaptive 2D Human Pose Estimation via Dual Teachers in Extremely Low-Light Conditions [65.0]
低照度ポーズ推定の最近の研究は、トレーニングのために地上の真実とペアの明るい画像と低照度画像を使用する必要がある。我々の主な新規性は、2つの補完的な教員ネットワークを活用して、より信頼性の高い擬似ラベルを生成することである。本手法は最新技術(SOTA)法に対して6.8%(2.4 AP)の改善を達成した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:09:14 GMT)
EAG: Extract and Generate Multi-way Aligned Corpus for Complete Multi-lingual Neural Machine Translation [63.9]
EAG(Extract and Generate)は,バイリンガルデータから大規模かつ高品質なマルチウェイアライメントコーパスを構築するための2段階のアプローチである。まず、異なる言語対から、非常に類似したソースやターゲット文を持つバイリンガルな例をペアリングして、候補に整列した例を抽出する。次に、よく訓練された生成モデルを用いて、候補から最終的な整列例を生成する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:22:23 GMT)
MeLo: Low-rank Adaptation is Better than Fine-tuning for Medical Image Diagnosis [63.6]
ヴィジュアルトランスフォーマー(ViT)は、医療画像のコミュニティにとってずっと大きく、アクセスしにくくなっている。 MeLo(医療画像低ランク適応)は、リソース要求の微調整の代わりに低ランク適応を採用する。提案手法は,4つの異なる医用画像データセット上で,完全に微調整されたVTモデルに匹敵する性能を実現する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:39:53 GMT)
Multi-Sentence Grounding for Long-term Instructional Video [63.3]
大規模インストラクショナルデータセットを記述するための,自動でスケーラブルなパイプラインを確立することを目的としている。複数の記述ステップを監督する高品質なビデオテキストデータセット、HowToStepを構築した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:17:29 GMT)
Boosting Reward Model with Preference-Conditional Multi-Aspect Synthetic Data Generation [63.0]
RMBoostは、新しい合成選好データ生成パラダイムである。優先ペアが意図的に構築されているため、ラベリングノイズを低減する。これは4つの異なる報酬モデルのパフォーマンスを大幅に向上させる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:21:55 GMT)
Faster Optimal Coalition Structure Generation via Offline Coalition Selection and Graph-Based Search [61.1]
本稿では,3つの革新的手法のハイブリッド化に基づく問題に対する新しいアルゴリズムSMARTを提案する。これらの2つの手法は動的プログラミングに基づいており、評価のために選択された連立関係とアルゴリズムの性能の強力な関係を示す。我々の手法は、問題にアプローチする新しい方法と、その分野に新しいレベルの精度をもたらす。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 23:24:03 GMT)
Learning High-resolution Vector Representation from Multi-Camera Images for 3D Object Detection [60.1]
本稿では,高分解能ベクトル表現を用いたカメラベースの3次元物体検出器VectorFormerを提案する。提案した高分解能ベクトル表現は、低分解能BEV表現と組み合わせて、ベクトル散乱と集光という2つの新しいモジュールを通して、高分解能のマルチカメラ画像から3次元幾何学を効率的に活用する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:51:18 GMT)
Open-CD: A Comprehensive Toolbox for Change Detection [59.8]
Open-CDは変更検出ツールボックスで、変更検出方法の豊富なセットと関連するコンポーネントとモジュールを含んでいる。徐々に、多くの一般的な変更検出方法や同時代のモジュールをカバーする統一されたプラットフォームへと進化していく。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 01:04:16 GMT)
Local All-Pair Correspondence for Point Tracking [59.8]
ビデオシーケンス間の任意の点(TAP)を追跡するタスクのために設計された,高精度かつ効率的なモデルであるLocoTrackを紹介する。 LocoTrackは、すべてのTAP-Vidベンチマークで未整合の精度を実現し、現在の最先端の約6倍の速度で動作している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:49:56 GMT)
MarkLLM: An Open-Source Toolkit for LLM Watermarking [59.5]
MarkLLMは、LLMウォーターマーキングアルゴリズムを実装するためのオープンソースのツールキットである。評価のために、MarkLLMは3つの視点にまたがる12のツールと、2種類の自動評価パイプラインを提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:16:54 GMT)
KaPQA: Knowledge-Augmented Product Question-Answering [59.1]
我々はAdobe AcrobatとPhotoshop製品に焦点を当てた2つのQAデータセットを紹介した。また、製品QAタスクにおけるモデルの性能を高めるために、新しい知識駆動型RAG-QAフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 22:14:56 GMT)
A Pairwise Comparison Relation-assisted Multi-objective Evolutionary Neural Architecture Search Method with Multi-population Mechanism [58.9]
ニューラルアーキテクチャサーチ(NAS)により、リサーチ者は広大なサーチスペースを自動的に探索し、効率的なニューラルネットワークを見つけることができる。 NASは重要なボトルネックに悩まされており、探索プロセス中に多くのアーキテクチャを評価する必要がある。 SMEM-NASは,多集団構造に基づく多目的進化アルゴリズムである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:46:22 GMT)
DragVideo: Interactive Drag-style Video Editing [58.6]
DragVideoはドラッグ・テンポラリなビデオ編集フレームワークだ。動画を直感的で、ユーザの意図に忠実に編集し、ほとんど目立たない歪みやアーティファクトで、時間的一貫性を維持しながら編集することができる。従来のプロンプトベースのビデオ編集では、前者の2つを行ない、画像ドラッグを直接適用することは最後に失敗するが、DragVideoの汎用性と汎用性が強調されている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:25:28 GMT)
PPAD: Iterative Interactions of Prediction and Planning for End-to-end Autonomous Driving [57.9]
PPAD(Iterative Interaction of Prediction and Planning Autonomous Driving)は、予測と計画のより良い統合を目的とした、タイムステップワイドなインタラクションである。我々は,階層的動的キーオブジェクトに着目したego-to-agent,ego-to-map,ego-to-BEVインタラクション機構を設計し,インタラクションをモデル化する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:57:03 GMT)
Offline Imitation Learning Through Graph Search and Retrieval [57.6]
模倣学習は、ロボットが操作スキルを取得するための強力な機械学習アルゴリズムである。本稿では,グラフ検索と検索により,最適下実験から学習する,シンプルで効果的なアルゴリズムGSRを提案する。 GSRは、ベースラインに比べて10%から30%高い成功率、30%以上の熟練を達成できる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:12:21 GMT)
Rainbow Teaming: Open-Ended Generation of Diverse Adversarial Prompts [57.5]
敵のプロンプトを多種多様に集めるための新しいブラックボックスアプローチであるレインボー・ブッキングを紹介する。提案手法では, 攻撃成功率が90%を超え, 効果的に対抗できるプロンプトが何百もあることが明らかとなった。さらに、質問応答とサイバーセキュリティに適用することで、レインボーチーム(Rainbow Teaming)の汎用性についても検討する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:31:43 GMT)
Progressive Semantic-Guided Vision Transformer for Zero-Shot Learning [56.7]
ゼロショット学習のためのプログレッシブセマンティック誘導型視覚変換器(ZSLViT)を提案する。 ZSLViTは、まずセマンティック・エンベッドド・トークン・ラーニングを導入し、セマンティック・エンハンスメントを通じて視覚・セマンティック対応を改善する。そして,視覚的強調のために,意味的無関係な視覚情報を捨てるために,低意味的・視覚的対応型視覚トークンを融合する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:09:39 GMT)
Beyond Memorization: The Challenge of Random Memory Access in Language Models [56.5]
生成言語モデル(LM)がそのメモリに逐次的またはランダムにアクセスできるかどうかを検討する。本手法により, LMのランダムメモリアクセス性能が向上することがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:29:00 GMT)
Some consequences of Sica's approach to Bell's inequalities [55.2]
ルイ・シカ(Louis Sica)は、ベルの不等式は、あるステーションで観測された結果の時系列が、他のステーションの設定が変更されても変化しないという仮説から導いた。本稿では,Sicaのアプローチを非理想的効率と実時間構造に拡張する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:39:00 GMT)
MAVEN-Fact: A Large-scale Event Factuality Detection Dataset [55.0]
我々は,MAVENデータセットに基づく大規模かつ高品質なEFDデータセットであるMAVEN-Factを紹介する。 MAVEN-Factには112,276のイベントのファクトリティアノテーションが含まれており、EFDデータセットとしては最大である。 MAVEN-Factは従来の微調整モデルと大規模言語モデル(LLM)の両方において困難であることを示す実験結果が得られた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:43:46 GMT)
Meta-Task Prompting Elicits Embeddings from Large Language Models [54.8]
本稿では,新しい教師なしテキスト埋め込み手法であるMeta-Task Prompting with Explicit One-Word Limitationを紹介する。モデル微調整を必要とせずに,大規模言語モデルから高品質な文埋め込みを生成する。提案法は,多種多様なシナリオにまたがって生成を組み込む汎用的で資源効率のよい手法を提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:35:08 GMT)
GSQA: An End-to-End Model for Generative Spoken Question Answering [54.4]
本稿では,システムに抽象的推論を強制するGSQA(Generative Spoken Question Answering)モデルを提案する。本モデルでは, 抽出QAデータセットにおいて, 従来の抽出モデルよりも3%上回っている。我々のGSQAモデルは、幅広い質問に一般化する可能性を示し、それによって、抽象的QAの音声質問応答能力をさらに拡張する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:47:56 GMT)
vTensor: Flexible Virtual Tensor Management for Efficient LLM Serving [54.0]
大規模言語モデル(LLM)は様々なドメインで広く使われ、数百万の日次要求を処理する。大規模言語モデル(LLM)は様々なドメインで広く使われ、数百万の日次要求を処理する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:37:58 GMT)
Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning [53.6]
大規模言語モデル(LLM)は多くの自然言語タスクにおいて印象的な能力を示している。 LLMは多段階推論を行う際にエラー、幻覚、矛盾する文を生成する傾向がある。本稿では,LLMの復号化過程を検討計画で導くためのフレームワークであるQ*を紹介する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:01:49 GMT)
Stretching Each Dollar: Diffusion Training from Scratch on a Micro-Budget [53.3]
大規模T2I拡散変圧器モデルの低コスト化を実証する。我々は16億のパラメータスパーストランスをわずか1890ドルの経済的コストで訓練し、ゼロショット世代で12.7 FIDを達成する。我々は、マイクロ予算での大規模拡散モデルのトレーニングをさらに民主化するために、エンドツーエンドのトレーニングパイプラインをリリースすることを目指している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:23:28 GMT)
Exterior Penalty Policy Optimization with Penalty Metric Network under Constraints [52.4]
制約強化学習(CRL:Constrained Reinforcement Learning)では、エージェントが制約を満たしながら最適なポリシーを学習するために環境を探索する。我々は,刑罰科目ネットワーク(PMN)が生み出す適応的な罰則を持つ,理論的に保証された刑罰関数法(Exterior Penalty Policy Optimization (EPO))を提案する。 PMNは様々な制約違反に適切に対応し、効率的な制約満足度と安全な探索を可能にする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:57:32 GMT)
CLIP-Guided Networks for Transferable Targeted Attacks [52.3]
トランスファー可能な敵攻撃は、ブラックボックスのシナリオで敵が特定した予測を出力するモデルを誤解させることを目的としている。 textitsingle-target 生成攻撃は、高い転送可能な摂動を生成するために、各ターゲットクラスのジェネレータを訓練する。 textbfCLIP-guided textbfGenerative textbfNetwork with textbfCross-attention module (CGNC) to enhance multi-target attack。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:41:57 GMT)
A Survey on 3D Gaussian Splatting [52.0]
3D Gaussian splatting (GS) は、明示的なラディアンス場とコンピュータグラフィックスの領域において、トランスフォーメーション技術として登場した。本稿では,3D GSの領域における最近の発展と重要な貢献について,初めて体系的に概説する。前例のないレンダリング速度を実現することで、3D GSは、仮想現実からインタラクティブメディアなど、数多くのアプリケーションを開くことができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:13:49 GMT)
Learning Multi-modal Representations by Watching Hundreds of Surgical Video Lectures [51.8]
外科的コンピュータビジョンの最近の進歩は、言語意味論に欠ける視覚のみのモデルによって推進されている。本稿では,eラーニングプラットフォームからの手術ビデオ講義を活用し,効果的な視覚情報と言語監督信号を提供する。テキスト書き起こしのための複数自動音声認識システムを用いて,手術固有の言語課題に対処する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:12:10 GMT)
SlowFast-LLaVA: A Strong Training-Free Baseline for Video Large Language Models [51.7]
本研究では,空間的セマンティクスと長時間の時間的文脈を協調的にキャプチャできる学習自由ビデオ大言語モデル(LLM)を提案する。これは、ビデオLLMの入力の2ストリームSlowFast設計を用いて実現される。実験の結果, SF-LLaVAは, 既存のトレーニング不要の手法よりも広い範囲の映像タスクにおいて優れていた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:58:04 GMT)
Robust Mixture Learning when Outliers Overwhelm Small Groups [51.5]
敵が任意の外れ値を加える場合、適切に分離された混合の手段を推定する問題について検討する。本稿では,各混合平均値に対して,最小のリストサイズオーバーヘッドで順序-最適誤差を保証するアルゴリズムを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:51:05 GMT)
TreeSBA: Tree-Transformer for Self-Supervised Sequential Brick Assembly [51.3]
入力された多視点画像から連続的な組立動作を予測するために,クラスに依存しないツリー・トランスフォーマフレームワークを提案する。逐次レンガ組立作業の大きな課題は、ステップワイドアクションラベルが実際に入手するのに費用がかかり、面倒であることである。我々は、合成から現実への移行学習を活用することにより、この問題を緩和する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:05:27 GMT)
Enhancing Temporal Understanding in LLMs for Semi-structured Tables [50.6]
我々は、大規模言語モデル(LLM)の特定の限界を特定するために、時間的データセットの包括的な分析を行う。調査の結果,時間的時間的質問応答に特化したデータセットであるTempTabQAが強化された。我々は,この領域におけるLLM機能を強化するために,新しいアプローチC.L.E.A.R.を導入する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:13:10 GMT)
AssistantBench: Can Web Agents Solve Realistic and Time-Consuming Tasks? [50.4]
言語エージェントがWeb上で現実的で時間を要するタスクを実行できるかどうかを調査する。自動評価が可能な214の現実的なタスクからなる新しいベンチマークであるAssistantBenchを紹介する。我々は,AssistantBenchが,言語モデルや検索拡張言語モデルなど,現在のシステムの限界を明らかにすることを発見した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:18:45 GMT)
Graph Condensation: A Survey [49.4]
グラフデータの急速な成長は、ストレージ、送信、特にグラフニューラルネットワーク(GNN)のトレーニングにおいて大きな課題をもたらす。これらの課題に対処するために、グラフ凝縮(GC)が革新的な解決策として登場した。 GCはコンパクトだが非常に代表的なグラフに重点を置いており、トレーニングされたGNNが元の大きなグラフでトレーニングされたグラフに匹敵するパフォーマンスを達成することができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:39:21 GMT)
BotArtist: Generic approach for bot detection in Twitter via semi-automatic machine learning pipeline [47.6]
Twitterは、ボットや偽アカウントのターゲットとなり、偽情報や操作の拡散につながった。本稿では,機械学習モデル開発に関連する課題に対処するために,セミオートマチック機械学習パイプライン(SAMLP)を提案する。ユーザプロファイル機能に基づいたボット検出モデルBotArtistを開発した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:40:15 GMT)
Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.5]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。 EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:45:40 GMT)
Long-CLIP: Unlocking the Long-Text Capability of CLIP [47.1]
Long-CLIPはContrastive Language-Image Pre-trainingに代わるプラグインとプレイである。 Long-CLIPは、長文入力をサポートし、ゼロショットの一般化性を維持または超える。 CLIPをプラグイン・アンド・プレイで置き換えることで、詳細なテキスト記述から画像を生成する機能が強化されている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:10:41 GMT)
SyllabusQA: A Course Logistics Question Answering Dataset [45.9]
我々はSyllabusQAを紹介した。63のリアルコースシラビを持つオープンソースデータセットで、36のメジャーをカバーし、5,078のオープンエンドコース関連質問応答ペアを含む。我々は,大規模言語モデルから検索拡張生成まで,このタスクのいくつかの強力なベースラインをベンチマークする。従来のテキスト類似性の指標で人間に近づいたとしても、事実の正確さという点では、自動化アプローチと人間の間には大きなギャップが残っていることが分かっています。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:37:55 GMT)
Double Deep Learning-based Event Data Coding and Classification [45.8]
イベントカメラは、"イベント"と呼ばれる、画素ごとの非同期の明るさ変化をキャプチャする機能を持つ本稿では、イベントのポイントクラウドベースの表現を用いて、イベントデータ符号化と分類の両方のための新しいダブルディープラーニングベースのアーキテクチャを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:45:55 GMT)
Supercharging Federated Learning with Flower and NVIDIA FLARE [44.5]
FlowerやNVIDIA FLAREといったオープンソースシステムは近年開発されている。両フレームワークの初期の統合について述べ、FLエコシステム全体をスーパーチャージするためにどのように連携できるかを示します。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:01:48 GMT)
A Closer Look at GAN Priors: Exploiting Intermediate Features for Enhanced Model Inversion Attacks [44.0]
Model Inversion (MI)攻撃は、出力情報を利用して、リリースされたモデルからプライバシーに敏感なトレーニングデータを再構築することを目的としている。 GAN(Generative Adversarial Network)の最近の進歩は、MI攻撃の性能向上に大きく貢献している。本稿では,GAN構造を分解し,中間ブロック間の特徴を利用する中間特徴拡張生成モデル変換(IF-GMI)を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:58:19 GMT)
J-CHAT: Japanese Large-scale Spoken Dialogue Corpus for Spoken Dialogue Language Modeling [43.9]
音声対話は人間とAIの相互作用において重要な役割を担い、対話指向音声言語モデル(SLM)を必要とするヒッカ品質の音声生成を確実にするためには、データはWild内のデータのように自然に必要であり、ノイズを除去して音響的にクリーンでなければならない。本研究では,人間-AI対話のための日本語コーパス(J-CHAT)という,大規模音声対話コーパスの構築とリリースによって,このギャップに対処する。本稿では、コーパス構築のための言語に依存しない手法を提案し、J-CHATで訓練されたSLMを用いた対話生成実験について述べる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:46:50 GMT)
Scaling CS1 Support with Compiler-Integrated Conversational AI [43.8]
DCC Sidekickは、教育プログラムエラー説明を生成することで、既存のLLMベースのC/C++コンパイラを強化するWebベースのAIツールである。 959名の学生が11,222人のDCC Sidekickセッションに従事し、7週間で17,982件の誤りを報告した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:53:55 GMT)
Importance Sampling-Guided Meta-Training for Intelligent Agents in Highly Interactive Environments [43.1]
本研究では,高度にインタラクティブな運転シナリオをナビゲートするためのトレーニング分布を最適化するために,ガイド付きメタRLと重要サンプリング(IS)を統合した新しいトレーニングフレームワークを提案する。現実世界のデータセットから自然な分布を推定することにより、このフレームワークは、共通および極端な駆動シナリオ間のバランスのとれたフォーカスを保証する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:57:12 GMT)
Denoising Vision Transformers [43.0]
本稿では、DVT(Denoising Vision Transformers)と呼ばれる2段階のDenoisingアプローチを提案する。第1段階では、画像ごとのニューラルネットワークとの横断的な特徴整合を強制することにより、位置的アーティファクトによって汚染されたものからクリーンな特徴を分離する。第2段階では、クリーンな特徴を生のViT出力から予測するために軽量なトランスフォーマーブロックを訓練し、クリーンな特徴の導出推定を監督として活用する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:07:27 GMT)
Accelerating Pre-training of Multimodal LLMs via Chain-of-Sight [42.8]
Chain-of-Sightはマルチモーダル大規模言語モデル(MLLM)の事前学習を加速する視覚言語ブリッジモジュールである。提案手法では,様々な空間スケールで視覚的詳細をキャプチャする視覚的リサンプラーを用いている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:33:49 GMT)
Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability [42.5]
本稿では,高忠実度かつ多目的な制御性を有する一般化可能な運転世界モデルであるVistaを提案する。本稿では,移動インスタンスと構造情報の学習を促進するために,新たな2つの損失を提案する。動作制御性には,高レベルな意図から低レベルな操作に至るまで,多種多様な制御が組み込まれている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 01:20:07 GMT)
Efficient4D: Fast Dynamic 3D Object Generation from a Single-view Video [42.1]
本稿では,効率的な4Dオブジェクト生成フレームワークであるEfficient4Dを提案する。異なるカメラビューの下で高品質な時空一貫性の画像を生成し、ラベル付きデータとして使用する。合成ビデオと実ビデオの両方の実験によると、Efficient4Dのスピードは10倍に向上している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 04:14:11 GMT)
SoccerRAG: Multimodal Soccer Information Retrieval via Natural Queries [42.1]
SoccerRAGはRetrieval Augmented Generation(RAG)とLarge Language Models(LLM)のパワーを活用するために設計された革新的なフレームワークである。マルチモーダルデータセットを利用することで、動的クエリと自動データバリデーションをサポートする。評価の結果,従来の検索システムに比較して,複雑なクエリを効果的に処理できることが示唆された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:42:44 GMT)
Demo: Soccer Information Retrieval via Natural Queries using SoccerRAG [42.1]
SoccerRAGはRetrieval Augmented Generation(RAG)とLarge Language Models(LLM)のパワーを活用するために設計された革新的なフレームワークである。マルチモーダルデータセットを利用することで、動的クエリと自動データバリデーションをサポートする。コア機能を取り巻くChainlitフレームワークに基づいた,インタラクティブなユーザインターフェース(UI)を新たに提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:44:20 GMT)
LongVideoBench: A Benchmark for Long-context Interleaved Video-Language Understanding [41.9]
LongVideoBenchは質問に答えるベンチマークで、最大1時間までビデオ言語によるインターリーブされたインプットを特徴としている。私たちのベンチマークには、さまざまなテーマにまたがるサブタイトルを持つ3,763種類のウェブコレクトビデオが含まれています。我々は、推論を参照する新しいビデオ質問応答タスクを定式化する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:00:55 GMT)
MSSPlace: Multi-Sensor Place Recognition with Visual and Text Semantics [41.9]
マルチカメラのセットアップを活用し,マルチモーダル位置認識のための多様なデータソースを統合することの影響について検討する。提案手法は,複数のカメラ,LiDAR点雲,セマンティックセグメンテーションマスク,テキストアノテーションなどの画像を用いて,総合的な位置記述子を生成する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:24:56 GMT)
One Size Fits All for Semantic Shifts: Adaptive Prompt Tuning for Continual Learning [41.4]
本研究では,緩やかな変化と急激な変化が混在する度合いのセマンティックシフトに対応する適応的プロンプト手法を提案する。 AdaPromptCLは、プロンプトグループを動的に管理するアサイン・アンド・リファインなセマンティックグルーピングメカニズムを採用している。実験の結果、AdaPromptCLは既存のプロンプト法を最大21.3%上回った。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:11:28 GMT)
Psychometric Alignment: Capturing Human Knowledge Distributions via Language Models [41.3]
言語モデル(LM)は、人口の振る舞いを正確に模倣することで意思決定を導くシナリオにおいて、人間のような反応をシミュレートするためにますます使われる。本研究では,人間の知識分布の程度を計測する指標である「心理学的アライメント」を導入する。人格に基づくプロンプトを用いることでアライメントが向上するが, LMとヒトの集団の間には重大な不一致が生じる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:02:59 GMT)
Chatbot-Based Ontology Interaction Using Large Language Models and Domain-Specific Standards [41.2]
大規模言語モデル(LLM)は、SPARQLクエリ生成を強化するために使用される。システムはユーザーの問い合わせを正確なSPARQLクエリに変換する。確立されたドメイン固有の標準からの追加情報がインターフェースに統合される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:58:36 GMT)
FMDNN: A Fuzzy-guided Multi-granular Deep Neural Network for Histopathological Image Classification [40.9]
ファジィ誘導多粒性ディープニューラルネットワーク(FMDNN)を提案する。病理学者の多粒性診断アプローチに触発され, 粗さ, 培地, 微粒度における細胞構造の特徴抽出を行った。ファジィ誘導型クロスアテンションモジュールは、普遍的なファジィ特徴を多粒性特徴へ導く。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 00:46:15 GMT)
Multilingual Fine-Grained News Headline Hallucination Detection [40.6]
複数言語できめ細かなニュース見出しの幻覚検出データセットについて紹介する。このデータセットには5つの言語で1万以上のペアが含まれており、それぞれに専門家による詳細な幻覚タイプが注釈付けされている。本稿では,言語に依存した実演選択と粗粒化プロンプトという2つの新しい手法を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:37:53 GMT)
Cinemo: Consistent and Controllable Image Animation with Motion Diffusion Models [40.5]
我々は、より優れたモーション制御性を実現するための、新しいイメージアニメーションアプローチであるCinemoを紹介する。我々は,Cinemoのトレーニングと推論段階における3つの効果的な戦略を提案し,その目標を達成する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:00:03 GMT)
Refining Corpora from a Model Calibration Perspective for Chinese Spelling Correction [40.1]
チャイニーズ・スペルリング・コーパス(CSC)は通常、大規模な高品質コーパスを欠いている。 2つのデータ拡張手法が広く採用されている: (1) 混乱セットのガイダンス付きtextitRandom Replacement と (2) 文字誤用をシミュレートする textitOCR/ASR ベースジェネレーション。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:26:35 GMT)
A New Theoretical Perspective on Data Heterogeneity in Federated Optimization [39.8]
連邦学習(FL)において、データ不均一性は、既存の理論解析が収束率について悲観的である主な理由である。特に多くのFLアルゴリズムでは、局所的な更新数が大きくなると収束率が劇的に増加する。本稿では,理論的理解と実践的パフォーマンスのギャップを,新たな視点からの理論的分析を提供することによって埋めることを目的とする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:52:58 GMT)
WayEx: Waypoint Exploration using a Single Demonstration [39.7]
WayExは、複雑な目標条件のロボットタスクを単一のデモから学習する新しい方法だ。本手法は従来の強化学習法と比較してトレーニング時間を50%短縮する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:59:46 GMT)
Explore the LiDAR-Camera Dynamic Adjustment Fusion for 3D Object Detection [38.8]
カメラとLiDARは、正確で堅牢な自動運転システムの情報センサーとして機能する。これらのセンサーは、しばしば異質な性質を示し、分布のモダリティギャップをもたらす。モーダル分布の整合と効果的なモーダル表現の学習を目的とした動的調整技術を導入する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:42:15 GMT)
LLaST: Improved End-to-end Speech Translation System Leveraged by Large Language Models [38.6]
LLaSTは、高性能な大規模言語モデルに基づく音声テキスト翻訳システムを構築するためのフレームワークである。我々のアプローチには、LLMベースの音声翻訳アーキテクチャ設計、ASR強化トレーニング、多言語データ拡張、二重LoRA最適化が含まれる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:42:00 GMT)
Concept-Based Interpretable Reinforcement Learning with Limited to No Human Labels [38.1]
本稿では,RLアルゴリズムが概念ベースのポリシーを効率的に学習することのできる,新しい学習手法を提案する。我々のアルゴリズムであるlicORICEは、概念学習とRLトレーニングをインターリーブし、概念アンサンブルを使用して、ラベル付けのための情報的データポイントを積極的に選択する。 licORICEは,3つの環境において,手動ラベリングの取り組みを500以上のコンセプトラベルに減らすかを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:46:33 GMT)
Graph Signal Processing for Cross-Domain Recommendation [37.9]
クロスドメインレコメンデーション(CDR)は、高密度ドメインからのユーザ-イテムインタラクションを活用して、データ空間とコールドスタート問題を緩和することにより、従来のレコメンデーションシステムを拡張する。既存のCDR手法の多くは、重複するユーザの割合と、ソースドメインとターゲットドメインの固有の相違に敏感である。 GSPに基づく統一CDRフレームワークであるCGSPを提案し、ターゲットのみの類似性とソースブリッジの類似性を柔軟に組み合わせて構築されたクロスドメイン類似性グラフを利用する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 04:07:03 GMT)
Schema-Driven Information Extraction from Heterogeneous Tables [37.5]
本稿では、機械学習論文、化学文献、材料科学雑誌、ウェブページの4つの分野のテーブルからなるベンチマークを示す。我々の実験は、タスク固有のパイプラインやラベルを必要とせずに、驚くほど競争力のあるパフォーマンスが達成できることを示した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:22:08 GMT)
SS-SFR: Synthetic Scenes Spatial Frequency Response on Virtual KITTI and Degraded Automotive Simulations for Object Detection [37.1]
自動車シミュレーションにおける画像シャープネスに対するガウスのぼかしのバリエーションの適用効果について検討する。画像のシャープネス(MTF50)は平均0.245cy/pxから0.119cy/pxに低下するが、物体検出性能は0.58%の範囲でほぼ安定であることがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:03:29 GMT)
Developing a Reliable, General-Purpose Hallucination Detection and Mitigation Service: Insights and Lessons Learned [36.2]
大型言語モデル(LLM)における幻覚の発見と修正を目的とした信頼性の高い高速生産システムを提案する。我々のシステムは、名前付きエンティティ認識(NER)、自然言語推論(NLI)、スパンベース検出(SBD)を含む。フレームワークの中核となる要素を詳述し、応答時間、可用性、パフォーマンスメトリクスに関連する最重要課題を過小評価します。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:48:30 GMT)
A Benchmark Study of Deep-RL Methods for Maximum Coverage Problems over Graphs [36.1]
MCPとIMの5種類のDeep-RL法の有効性と有効性について検討した。その結果,様々なシナリオにおいて,Lazy GreedyアルゴリズムはMPPのDeep-RL法を常に上回っていることがわかった。 IMの場合、理論上IMMやOPIMのような健全なアルゴリズムは、ほとんどのシナリオでDeep-RL法よりも優れている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:03:26 GMT)
A Human-Inspired Reading Agent with Gist Memory of Very Long Contexts [35.7]
本実験では,有効文脈長を最大20倍に向上させるエージェントシステムであるReadAgentを提案する。人間が長い文書を対話的に読む方法に触発され、簡単なプロンプトシステムとしてReadAgentを実装した。本稿では,検索手法を用いてベースラインに対するReadAgentの評価を行い,元の長コンテキストを用いて,gistメモリを用いて評価する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:33:51 GMT)
Under-confidence Backdoors Are Resilient and Stealthy Backdoors [35.6]
バックドア攻撃は、被害者モデルが事前に設計されたバックドアで注入された任意の入力に対して設計された出力を生成することを目的としている。高攻撃成功率を達成するため、既存の攻撃手法のほとんどは、汚染されたサンプルのラベルをターゲットクラスに変更している。この慣行は、しばしば被害者モデルをバックドアに過度に適合させ、攻撃は出力制御に非常に効果的であるが、人間の検査や自動防御アルゴリズムによって容易に識別できる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:45:24 GMT)
Pre-Training and Prompting for Few-Shot Node Classification on Text-Attributed Graphs [35.4]
テキスト分散グラフ(英: Text-attributed graph、TAG)は、生のテキストに関連付けられた各ノードを持つ、現実世界の重要なグラフ構造化データの一種である。 TAGでは、従来の数発のノード分類手法が、事前処理されたノード機能で直接トレーニングを行う。 P2TAGは、グラフ事前学習とプロンプトを備えたTAG上の少数ショットノード分類のためのフレームワークである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:24:21 GMT)
Predicting the Best of N Visual Trackers [34.9]
すべてのトラッキング属性とデータセットの中で最高のパフォーマーは、シングルトラッカーが依然として存在しない。このギャップを埋めるために、BofNメタトラッカーと呼ばれる"Nトラッカーのベスト"を予測する。また、フレームレベルのBofNメタトラッカーを導入し、定期的に時間間隔で最高のパフォーマーを予測する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:17:09 GMT)
The Rlign Algorithm for Enhanced Electrocardiogram Analysis through R-Peak Alignment for Explainable Classification and Clustering [34.9]
我々は,サポートベクタマシンや主成分分析などの浅層学習技術をECG信号処理に再導入することを目指している。そこで我々は,ECG信号を完全に構造化されたフォーマットに効果的に再構成する変換を開発し,評価した。我々のアプローチは、特に限られたトレーニングデータを扱う場合、CNNよりも浅い機械学習手法に顕著な優位性を示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:34:47 GMT)
Is user feedback always informative? Retrieval Latent Defending for Semi-Supervised Domain Adaptation without Source Data [34.6]
本稿では,現実のアプリケーションで容易に利用できるユーザフィードバックを用いて,ソースモデルをターゲット環境に適用することを目的とする。負バイアスフィードバック(NBF)と呼ばれる新しい概念を用いて、この現象を解析する。スケーラブルな適応アプローチであるRetrieval Latent Defendingを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:15:41 GMT)
SemiSFL: Split Federated Learning on Unlabeled and Non-IID Data [34.5]
フェデレートラーニング(FL)は、複数のクライアントがネットワークエッジでプライベートデータ上で機械学習モデルを協調的にトレーニングできるようにするためのものだ。クラスタリング正規化を取り入れて,ラベルなしおよび非IIDクライアントデータでSFLを実行する,Semi-supervised SFLシステムを提案する。本システムは,訓練時間の3.8倍の高速化を実現し,目標精度を達成しつつ通信コストを約70.3%削減し,非IIDシナリオで最大5.8%の精度向上を実現する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:18:38 GMT)
Poisoning with A Pill: Circumventing Detection in Federated Learning [33.9]
本稿では,FLにおける検出に対する既存のFL中毒攻撃の有効性とステルス性を高めるために,汎用的かつ攻撃に依存しない拡張手法を提案する。具体的には、FLトレーニング中に、戦略的にピルを構築、生成、注入する3段階の方法論を用いており、それに従ってピル構築、ピル中毒およびピル注入と命名されている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:34:47 GMT)
The Ontoverse: Democratising Access to Knowledge Graph-based Data Through a Cartographic Interface [33.9]
我々は地理的視覚化と階層的に構造化されたドメイン知識に依存したデータナビゲーションにユニークなアプローチを開発した。提案手法は自然言語処理技術を用いて,基礎となるデータから名前付きエンティティを抽出し,関連する意味領域参照やナビゲーション構造に対して正規化する。これにより、エンドユーザは、ニーズに関連するエンティティを識別し、広範なグラフ分析にアクセスできるようになる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:29:25 GMT)
Vision-Based Power Line Cables and Pylons Detection for Low Flying Aircrafts [33.6]
電力線ケーブルとパイロンを共同で検出する深層学習手法を開発した。我々は,現代的畳み込み型アーキテクチャとトランスファーラーニング,カービリナー構造記述に適応した損失関数を組み合わせた。オンボードシステムに統合し、飛行中に動作させ、実験により、従来の遠隔ケーブル検出方法よりも優れていることを示した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:20:59 GMT)
Multiple importance sampling for stochastic gradient estimation [33.4]
勾配推定のためのミニバッチサンプルの効率的な重要サンプリングのための理論的および実用的枠組みを提案する。雑音の勾配に対処するため、我々のフレームワークは自己適応的計量を用いてトレーニング中の重要度分布を動的に進化させる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:28:56 GMT)
What is Dataset Distillation Learning? [33.0]
本研究では, 蒸留データの挙動, 代表性, ポイントワイド情報量について検討する。蒸留したデータは、トレーニング中に実際のデータに代わるものとしては役に立たない。蒸留データを解釈し、個別の蒸留データポイントが意味のある意味情報を含んでいることを示す枠組みを提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:11:04 GMT)
ThermalNeRF: Thermal Radiance Fields [32.9]
LWIRとRGB画像の集合からシーン再構築のための統一的なフレームワークを提案する。我々は、前処理のステップとして、RGBと赤外線カメラを互いに調整する。提案手法は,RGBや熱チャネルに隠された物体を視覚的に除去すると共に,超高分解能な熱分解能を有することを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:51:29 GMT)
All rivers run into the sea: Unified Modality Brain-like Emotional Central Mechanism [32.7]
UMBEnetは脳に似た統合型モーダル感情処理ネットワークである。 UMBEnetの基本設計は、プロンプトプールとスパースフィーチャーフュージョン(SFF)モジュールで固有のプロンプトを融合するデュアルストリーム(DS)構造である。 Dynamic Facial Expression Recognition (DFER)フィールドにおける最大のベンチマークデータセットの実験では、UMBEnetは現在の最先端メソッドよりも一貫して優れています。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:26:31 GMT)
Diffusion Model is a Good Pose Estimator from 3D RF-Vision [32.7]
無線周波数ビジョン(RF-vision)からのヒューマンポーズ推定(HPE)は、RF信号を用いて人間のセンシングを行う。 mmWaveレーダーは有望なRFビジョンセンサーとして登場し、RF信号を処理してレーダー点雲を提供する。本研究は,ノイズレーダデータに適した新しい拡散型ポーズ推定器mmDiffを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:27:30 GMT)
NPLMV-PS: Neural Point-Light Multi-View Photometric Stereo [32.4]
本稿では,新しい多視点測光ステレオ(MVPS)法を提案する。我々の研究は、現在最先端のマルチビューPS-NeRFやスーパーノーマルと異なり、ピクセルごとの強度レンダリングを明示的に活用しています。提案手法は,DiLiGenT-MVベンチマークで提案した古典的MVPS手法よりも優れていた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:52:47 GMT)
SelfSwapper: Self-Supervised Face Swapping via Shape Agnostic Masked AutoEncoder [32.1]
本稿では、ターゲット指向とソース指向の両方のアプローチの強みを組み合わせた、新しい自己教師型アプローチであるShape Agnostic Masked AutoEncoder(SAMAE)トレーニングスキームを紹介する。本モデルでは,識別情報の漏洩を効果的に軽減し,学習対象のアルベドや照明を不整合性や非同一性の特徴によって反映する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:32:36 GMT)
Automated Deterministic Auction Design with Objective Decomposition [31.9]
本稿では,VVCA(Virtual Valuations Combinatorial Auctions)の自動設計のための客観的分解手法であるOD-VVCAを紹介する。並列化可能な動的プログラミングアルゴリズムを用いて、VVCAの割り当てと収益の効率よく計算する。次に、収益目標関数を連続的かつ一括的に不連続なコンポーネントに分解し、それぞれを異なる手法で最適化する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:32:46 GMT)
In Search of Quantum Advantage: Estimating the Number of Shots in Quantum Kernel Methods [30.6]
本稿では,カーネル値の所望の精度を推定する手法を開発し,回路実行回数に変換する。我々は、量子カーネル法は、機械学習のパフォーマンスの観点からだけでなく、リソース消費の文脈からも考慮すべきである、と強調する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:29:35 GMT)
The Shadow of Fraud: The Emerging Danger of AI-powered Social Engineering and its Possible Cure [30.4]
社会工学(SE)攻撃は個人と組織双方にとって重大な脅威である。人工知能(AI)の進歩は、よりパーソナライズされ説得力のある攻撃を可能にすることによって、これらの脅威を強化する可能性がある。本研究は、SE攻撃機構を分類し、その進化を分析し、これらの脅威を測定する方法を探る。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:37:31 GMT)
Mobius: A High Efficient Spatial-Temporal Parallel Training Paradigm for Text-to-Video Generation Task [29.7]
多くの研究者がテキスト・トゥ・ビデオ(T2V)生成タスクに力を注いでいる。本稿では,T2Vタスクのための高効率な時空間並列訓練パラダイム Mobius を提案する。 Mobiusは24%のGPUメモリと12%のトレーニング時間を節約し、T2Vの微調整タスクを大幅に改善する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:51:07 GMT)
Differentiable Convex Polyhedra Optimization from Multi-view Images [29.7]
本稿では,凸多面体の微分可能レンダリングのための新しい手法を提案する。暗黙のフィールド監視に依存する最近の手法の限界に対処する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:53:29 GMT)
Face-voice Association in Multilingual Environments (FAME) Challenge 2024 Evaluation Plan [29.2]
フェース・ボイス・アソシエーション・イン・マルチ言語環境(FAME)チャレンジ2024は,多言語シナリオのユニークな条件下でのフェース・ボイス・アソシエーションの探求に焦点を当てている。本報告では、FAME Challengeの課題、データセット、ベースライン、タスクの詳細について説明する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:43:12 GMT)
Reconstructing Training Data From Real World Models Trained with Transfer Learning [29.0]
本稿では,高解像度画像上で訓練されたモデルに対して,現実的な設定でデータ再構成を可能にする新しい手法を提案する。本手法は実世界のシナリオに対してarXiv:2206.07758の再構成方式を適用する。そこで本研究では,数千の候補からの良好な復元を識別するためのクラスタリングに基づく新しい手法を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:59:10 GMT)
Unlocking the Potential: Benchmarking Large Language Models in Water Engineering and Research [29.0]
この研究は、様々な水工学および研究課題にまたがる大規模言語モデルの貢献を初めて評価した。我々は,水工学と研究に関連する973の課題を,「汚水処理」「環境復元」「水処理と分布の低下」「衛生」「嫌気性消化」に分類した。これらの課題に対して、7つのLCM(GPT-4, GPT-3.5, Gemini, GLM-4, ERNIE, QWEN, Llama3)の性能評価を行った。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:32:22 GMT)
On the Federated Learning Framework for Cooperative Perception [28.7]
フェデレーション学習は、コネクテッドおよび自律走行車間の認識、意思決定、計画において、データのプライバシ保護と協調的な拡張を可能にすることで、有望なソリューションを提供する。本研究では,FedDWAアルゴリズム(Federated dynamic weighted aggregate, FedDWA)と呼ばれる,CPのための特殊な統合学習フレームワークを提案する。このフレームワークは、動的クライアント重み付けをモデル収束の直接化に利用し、KLD(Kullback-Leibler divergence)を利用して非独立的かつ同一に分散された(Non-IID)データとアンバランスなデータの有害な影響を対処する新しい損失関数を統合する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:11:20 GMT)
The Dark Side of NFTs: A Large-Scale Empirical Study of Wash Trading [28.2]
我々は,2,701,883 NFTから8,717,031の転送イベントと3,830,141のセールイベントを分析した。 NFTの3種類の洗剤取引を識別し,識別アルゴリズムを提案する。また,マーケットプレース設計,収益性,NFTプロジェクト設計,支払トークン,ユーザ行動,NTTエコシステムといった6つの側面からの洞察も提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:08:04 GMT)
Decentralized Entropic Optimal Transport for Distributed Distribution Comparison [28.1]
本稿では,通信効率とプライバシ保護を両立させる分散型エントロピー最適輸送(DEOT)手法を提案する。特に,DOT距離を2倍に最適化するミニバッチランダム化ブロック座標降下法を設計する。提案手法は,エントロピックなGromov-Wasserstein距離にも適用可能であることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:06:22 GMT)
A Survey on Federated Analytics: Taxonomy, Enabling Techniques, Applications and Open Issues [28.1]
フェデレーション分析(FA)は、生データを集中することなく、多様なデータ所有者間で協調的なデータ分析をサポートする新興技術である。 FAの産業・アカデミックへの応用は広く行われているが、FAにおける既存の研究成果の総合的な調査は特に欠落している。この調査は、新たなFA技術に関する総合的な理解を提供し、プライバシ保護による分散データ処理の継続的な進化を促進することを目的としている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:52:46 GMT)
DriveDiTFit: Fine-tuning Diffusion Transformers for Autonomous Driving [27.9]
自律運転では、データセットは悪天候、照明条件、さまざまな移動物体を含む様々な運転シナリオをカバーすることが期待されている。 DriveDiTFitを提案する。Diffusion Transformer(DiT)を微調整することで、自律運転データを効率的に生成する新しい方法である。具体的には、DriveDiTFitはギャップ駆動変調技術を用いて、事前訓練されたソースデータと目標駆動データとの相違に応じて、DiT内のいくつかのパラメータを慎重に選択し、効率的に微調整する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:18:52 GMT)
Mélange: Cost Efficient Large Language Model Serving by Exploiting GPU Heterogeneity [27.9]
大規模言語モデル(LLM)はますます多くのオンラインサービスに統合されているが、デプロイにはコストがかかる。我々は,所与のLLMサービスに対して,最小コストのGPUアロケーションを自動かつ効率的に導出するフレームワークであるM'elangeを紹介する。 M'elangeは、会話設定で最大77%、ドキュメントベースの設定で33%、混合設定で51%のデプロイメントコストを削減する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:56:19 GMT)
TAPI: Towards Target-Specific and Adversarial Prompt Injection against Code LLMs [27.7]
本稿では,新たな攻撃パラダイム,すなわち,コードLLMに対するターゲット固有および対向的プロンプトインジェクション(TAPI)を提案する。 TAPIは悪意のある命令に関する情報を含む読めないコメントを生成し、それらを外部ソースコードのトリガーとして隠す。 CodeGeexやGithub Copilotなど、デプロイされたコード補完統合アプリケーションに対する攻撃に成功しました。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:19:23 GMT)
A Survey on Text-guided 3D Visual Grounding: Elements, Recent Advances, and Future Directions [27.5]
テキスト誘導型3D視覚接地(T-3DVG)は、複雑な3Dシーンからの言語クエリに対応する特定のオブジェクトを見つけることを目的としている。データ収集と3Dポイント・クラウド・ソース・プロセッシングの複雑さから、2Dビジュアル・グラウンドと比較すると、このタスクは現実世界に近づき、大きな可能性を秘めている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:21:27 GMT)
Robust Facial Reactions Generation: An Emotion-Aware Framework with Modality Compensation [27.3]
感情認識型モダリティ補償(EMC)フレームワークを提案する。我々のフレームワークは、欠落したモダリティデータに直面するときのレジリエンスを保証する。 Emotion-Aware Attention (EA)モジュールを通じて、より適切な感情認識反応を生成する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:00:02 GMT)
Diffusion for Out-of-Distribution Detection on Road Scenes and Beyond [27.2]
ADE20kデータセットをベースとしたADE-OoDベンチマークを導入し、セマンティック多様性の高いさまざまなドメインの画像を含む。また,Diffusion score matching for OoD Detection (DOoD) を用いた新しい手法を提案する。 DOoDは、トレーニングやデータドメインの仮定にアウトレーヤを使わずに、最先端よりも同等かそれ以上の性能を発揮する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:41:37 GMT)
MergeSFL: Split Federated Learning with Feature Merging and Batch Size Regulation [27.2]
フェデレートラーニング(Federated Learning, FL)は、エッジコンピューティング(EC)システムにおいて、エッジAIが貴重な知識をマイニングするための技術である。本稿では,機能統合とバッチサイズ制御をSFLに組み込んだ新しいSFLフレームワークMergeSFLを提案する。我々は,MergeSFLが最終モデルの精度を5.82%から26.22%向上し,ベースラインに比べて約1.74倍から4.14倍のスピードアップが可能であることを示した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:43:13 GMT)
A Simple and Optimal Policy Design with Safety against Heavy-Tailed Risk for Stochastic Bandits [27.1]
マルチアームバンディット問題について検討し,期待された後悔に対する最悪のケース最適性と,後悔の分布に対する軽微なリスクの両方を享受する新しいポリシーを設計する。経営的な観点から、我々の新しい政策設計は、より良い尾の分布をもたらし、祝福された政策よりも好まれることがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:45:09 GMT)
Craft: Cross-modal Aligned Features Improve Robustness of Prompt Tuning [26.9]
この問題に対処するために,textbfCross-modal textbfaligned textbffeature textbftuning (textbfCraft) 法を提案する。クロスモーダルアライメントは、まず代替ドメインからアンカーを選択し、選択されたアンカーに対する埋め込みの相対表現を導出することによって行われる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:51:16 GMT)
3D-GOI: 3D GAN Omni-Inversion for Multifaceted and Multi-object Editing [26.7]
複数オブジェクト上のアフィン情報の多面的編集を可能にする3D編集フレームワークである3D-GOIを提案する。 3D-GOIは、有名な3D GANであるGIRAFFEによって制御される属性コードの多さを反転させることで、複雑な編集機能を実現する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:19:23 GMT)
Perceptions of Linguistic Uncertainty by Language Models and Humans [26.7]
「おそらく」や「非常にありそうにない」といった不確かさの表現は、人間の言語に広まる。言語モデルが不確実性の言語表現を数値応答にどうマッピングするかを検討する。 10モデル中8モデルで不確実性表現を確率的応答に人間的な方法でマッピングできることが判明した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:26:12 GMT)
Odyssey: Empowering Agents with Open-World Skills [26.5]
我々は,大規模言語モデル(LLM)ベースのエージェントにオープンワールドスキルを付与し,Minecraftの世界を探索する新しいフレームワークODYSSEYを紹介する。 ODYSSEYは,(1)40のプリミティブスキルと183の作曲スキルからなるオープンワールドスキルライブラリを備えた対話型エージェント,(2)Minecraft Wikiから390k以上の指示文を入力した大規模質問文データセットを用いた微調整LLaMA-3モデル,(3)新しいオープンワールドベンチマークには,数千の長期計画タスク,数十の動的即時計画タスク,1つの自律性が含まれている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:06:59 GMT)
Explaining Decisions in ML Models: a Parameterized Complexity Analysis [26.4]
本稿では,機械学習(ML)モデルにおける説明問題のパラメータ化複雑性に関する理論的検討を行う。一般的なブラックボックスの知覚とは対照的に、我々は透明な内部機構を持つモデルに焦点を当てている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:37:48 GMT)
MedIAnomaly: A comparative study of anomaly detection in medical images [26.3]
異常検出(AD)は、期待される正常なパターンから逸脱する異常なサンプルを検出することを目的としている。医療用AD法は多岐にわたるが, 公平かつ包括的評価の欠如が指摘されている。本稿では,比較を統一したベンチマークを構築した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:24:52 GMT)
Low-Dimensional Gradient Helps Out-of-Distribution Detection [26.2]
OOD検出における勾配情報全体の活用を総合的に検討する。主な課題は、ネットワークパラメータの多さによる勾配の高次元性から生じる。指定された部分空間を用いて勾配の線形次元削減を行う。この革新的な手法により、情報損失を最小限に抑えた勾配の低次元表現が得られる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:59:23 GMT)
Text2Place: Affordance-aware Text Guided Human Placement [26.0]
この研究は、textbfSemantic Human Placementと呼ばれる背景シーンにおける現実的な人間の挿入の問題に取り組む。セマンティックマスクの学習には,テキストから画像への生成モデルから学習したリッチなオブジェクトシーンの先行情報を活用する。提案手法は,背景と被写体を保存しながら,リアルなシーン構成を生成することができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:00:06 GMT)
Leveraging LLM Reasoning Enhances Personalized Recommender Systems [25.8]
本稿では,レコメンデーションシステム (RecSys) におけるLarge Language Models (LLMs) の推論の適用が,大きな課題であることを示す。本研究では、RecSysの推論をよりよく理解し、タスク品質がどのように改善されるかを示すために、いくつかの側面について検討する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:18:50 GMT)
Merit-based Fair Combinatorial Semi-Bandit with Unrestricted Feedback Delays [25.8]
本研究では,有益性制約下での非制限フィードバック遅延を用いた半帯域問題について検討する。これはクラウドソーシングやオンライン広告などのアプリケーションによって動機付けられており、即時フィードバックはすぐには利用できない。我々は,その利点に基づいて,制限のないフィードバック遅延の下で腕を選択するための新しいバンディットアルゴリズムを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:36:27 GMT)
ELITR-Bench: A Meeting Assistant Benchmark for Long-Context Language Models [25.7]
本稿では,現実的な会議支援シナリオに基づく長期コンテキストモデルのための新しいベンチマークを提案する。 ELITR-Benchという名前のベンチマークでは、既存のERLITRコーパスの書き起こしを271の手作業による質問と、その真真正な回答で強化しています。以上の結果から,GPT-4の評価スコアは人間の判断値と相関するが,3つ以上の評価値と区別できる能力は限定的である可能性が示唆された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:24:14 GMT)
Towards Robust Recommendation via Decision Boundary-aware Graph Contrastive Learning [25.5]
グラフコントラスト学習(GCL)は、データ間隔によるバイアスの低減効果により、レコメンデータシステムにおいて注目を集めている。これらの手法は, 動的学習過程における意味的不変性と難易度とのバランスをとるのに苦慮していると論じる。本稿では,モデル能力の進化に伴い,コントラッシブペアのセマンティック不変性を効果的に維持し,動的に適応する新しいGCLベースのレコメンデーションフレームワークRGCLを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 01:10:52 GMT)
WebRPG: Automatic Web Rendering Parameters Generation for Visual Presentation [25.0]
ウェブレンダリングパラメータ生成(WebRPG, Web Rendering Parameters Generation)はHTMLコードに基づくWebページの視覚的表示の自動生成を目的とした新しいタスクである。 VAEを利用して多数の要素やレンダリングパラメータを管理するベースラインモデルと、HTMLから本質的なセマンティックおよび階層的な情報をキャプチャするためのカスタムHTML埋め込みを提示する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:35:43 GMT)
Empowering Agile-Based Generative Software Development through Human-AI Teamwork [24.7]
我々は、人間-AIチームワークによるアジャイルベースの生成ソフトウェア開発であるAgileGenを提案する。メモリプールメカニズムは、ユーザの意思決定シナリオを収集し、それらを新しいユーザに推奨するために使用される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:54:44 GMT)
Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models [24.6]
下流視覚質問応答(VQA)における表現学習に関する実証的研究を行った。我々はOCモデルと代替アプローチの利点とトレードオフを徹底的に検討する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:26:08 GMT)
Local Occupancy-Enhanced Object Grasping with Multiple Triplanar Projection [24.0]
本稿では,一般的な物体をロボットでつかむという課題に対処する。提案したモデルはまず、シーン内で最も可能性の高いいくつかの把握ポイントを提案する。各グリップポイントの周囲に、モジュールはその近傍にある任意のボクセルが空か、ある物体に占有されているかを推測するように設計されている。モデルはさらに、局所占有力向上した物体形状情報を利用して、6-DoFグリップポーズを推定する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:22:28 GMT)
Towards Robust Vision Transformer via Masked Adaptive Ensemble [24.0]
対戦訓練(AT)は、敵攻撃に対するビジョントランスフォーマー(ViT)の堅牢性を向上させるのに役立つ。本稿では,新たに開発した適応アンサンブルでブリッジされた検出器と分類器を含む新しいViTアーキテクチャを提案する。 CIFAR-10における我々のViTアーキテクチャは, それぞれ90.3%, 49.8%の正正正正正正正正正正正正正正正正正正正正正正正正正正正則を達成している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:28:29 GMT)
REVEAL-IT: REinforcement learning with Visibility of Evolving Agent poLicy for InTerpretability [23.8]
REVEAL-ITは複雑な環境下でのエージェントの学習過程を説明するための新しいフレームワークである。各種学習課題における政策構造とエージェントの学習過程を可視化する。 GNNベースの説明者は、ポリシーの最も重要な部分を強調することを学び、エージェントの学習プロセスについてより明確で堅牢な説明を提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:34:32 GMT)
Norface: Improving Facial Expression Analysis by Identity Normalization [23.8]
Norfaceは、AU(Action Unit)分析とFER(Facial Emotion Recognition)タスクの両方のための新しいフレームワークである。正規化ネットワークと分類ネットワークで構成されている。提案手法は,複数の表情解析タスクにおいて既存のSOTA法より優れる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:24:32 GMT)
Quantum Normalizing Flows for Anomaly Detection [23.3]
量子アーキテクチャのための正規化フローを導入し、そのようなフローをモデル化し最適化する方法を説明し、サンプルデータセット上でメソッドを評価する。提案モデルでは,従来の手法と比較して,異常検出の競合性能を示す。実験では, 森林の隔離, 局所降水率 (LOF) , 単一クラスSVMとの比較を行った。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:18:42 GMT)
Dissecting Multiplication in Transformers: Insights into LLMs [23.1]
本稿では,この領域における変圧器の不完全性を探索し,説明するために,典型的な算術的タスクである整数乗法に焦点を当てる。 n桁整数乗算を行うために訓練されたバニラ変圧器の包括的解析を行う。乗算タスクにおける変換器の性能向上のための改良を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 04:07:26 GMT)
TOM: A Development Platform For Wearable Intelligent Assistants [23.1]
本稿では,インテリジェントなウェアラブルアシスタントの開発を支援するコンセプトアーキテクチャとソフトウェアプラットフォームであるTOMを紹介する。 TOMは、ユーザインタラクションの記録と分析、新しいデバイスの統合、各種アクティビティへの支援の提供をサポートする。本稿では,概念実証支援サービスについて紹介し,そのようなサービス開発に関わる課題について論じる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:20:02 GMT)
PropTest: Automatic Property Testing for Improved Visual Programming [22.8]
PropTestは、LLMを使用して、提案されたソリューションの最初のラウンドで視覚特性をテストするコードを生成することで、ビジュアルプログラミングを改善する一般的な戦略である。 PropTestは、公開されているLLMを使用しながら、最先端のメソッドに匹敵する結果を得る。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 23:21:33 GMT)
FineSurE: Fine-grained Summarization Evaluation using LLMs [22.6]
FineSurEは,大規模言語モデル(LLM)を用いた要約タスクに適した,きめ細かい評価器である。また、忠実さに加えて完全性と簡潔さの基準を採用し、多次元評価を可能にしている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 04:45:11 GMT)
NOVUM: Neural Object Volumes for Robust Object Classification [22.4]
画像分類のためのディープネットワークに3D合成対象表現を明示的に組み込むことにより,配布外シナリオの一般化が大幅に向上することを示す。実験の結果, OURSはオブジェクト表現の3次元構成構造のため, 標準アーキテクチャよりも興味深い利点があることがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:21:12 GMT)
Reinforcement Learning Meets Visual Odometry [22.3]
我々は、ビジュアルオドメトリ(VO)を意思決定タスクとみなし、強化学習(RL)をVOプロセスの動的適応に適用する。このアプローチでは,VOパイプライン内のエージェントとして動作するニューラルネットワークを導入して,シーケンシャルおよびグリッドサイズ選択などの決定を行う。提案手法は,ポーズエラーや実行時,その他のメトリクスに基づいた報酬関数を用いて,選択への依存を最小限に抑える。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:37:55 GMT)
HIERVAR: A Hierarchical Feature Selection Method for Time Series Analysis [22.3]
時系列分類は、様々な領域にまたがる重要かつ複雑な課題である。本稿では,ANOVA分散解析による新しい階層的特徴選択法を提案する。本手法は精度を保ちながら,特徴量を94%以上削減する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:55:13 GMT)
LCA-on-the-Line: Benchmarking Out-of-Distribution Generalization with Class Taxonomies [22.1]
我々は,OODデータを必要とせず,内分布(ID)測定によるモデル外分布(OOD)性能の予測に挑戦する。本稿では,ラベルと予測との階層的距離を予め定義されたクラス階層内で測定するLCA(Lowest Common Ancestor)フレームワークを紹介する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:54:19 GMT)
SETTP: Style Extraction and Tunable Inference via Dual-level Transferable Prompt Learning [22.0]
デュアルレベルトランスファーブル・プロンプト学習によるスタイル抽出とチューナブル推論を提案する。 SETTPは、高リソーススタイル転送から基本スタイルの特徴を含むソーススタイルレベルのプロンプトを学習する。実験によると、SETTPは最先端の手法に匹敵するパフォーマンスを達成するためにデータボリュームの1/20しか必要としない。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:34:48 GMT)
Lynx: An Open Source Hallucination Evaluation Model [22.0]
LYNXは幻覚検出LLMであり、現実の幻覚に挑戦するシナリオについて高度な推論を行うことができる。 HaluBenchは、さまざまな現実世界のドメインから得られた15kサンプルからなる、包括的な幻覚評価ベンチマークである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:41:53 GMT)
T-MAE: Temporal Masked Autoencoders for Point Cloud Representation Learning [22.0]
本稿では,T-MAE (Temporal Masked Auto-Encoders) という,効果的な事前学習戦略を提案する。 T-MAEは、時間的隣接フレームとして入力を受け取り、時間的依存を学習する。我々のT-MAE事前学習戦略は、注釈付きデータに対する需要を軽減する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:30:53 GMT)
UF-HOBI at "Discharge Me!": A Hybrid Solution for Discharge Summary Generation Through Prompt-based Tuning of GatorTronGPT Models [22.0]
本稿では,BioNLP 2024 Shared Task における "Discharge Me!" Challenge への参加の一環として,放電サマリーセクションを生成するハイブリッドソリューションを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 04:02:45 GMT)
Learning to Manipulate Anywhere: A Visual Generalizable Framework For Reinforcement Learning [21.9]
視覚強化学習に適した一般化可能なフレームワークであるtextbfManiwhereを提案する。実験の結果,Maniwhereは既存の最先端手法を著しく上回っていることがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:29:02 GMT)
FDiff-Fusion:Denoising diffusion fusion network based on fuzzy learning for 3D medical image segmentation [21.9]
3次元医用画像分割のためのファジィ学習に基づく拡散融合ネットワーク(FDiff-Fusion)を提案する。従来のU-Netネットワークにデノナイズ拡散モデルを統合することにより、入力された医用画像からリッチなセマンティック情報を効果的に抽出することができる。その結果、FDiff-Fusionは2つのデータセット上でDiceスコアとHD95距離を大幅に改善することがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:27:01 GMT)
Semantic Diversity-aware Prototype-based Learning for Unbiased Scene Graph Generation [21.8]
シーングラフ生成(SGG)データセットでは、各対象物対に1つの述語をアノテートする。既存のSGGモデルは、各ペアについてのみ述語を予測できるように訓練されている。この結果、SGGモデルは述語に存在するかもしれない意味的多様性を見落としてしまう。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:53:46 GMT)
RepCodec: A Speech Representation Codec for Speech Tokenization [21.6]
RepCodecは意味的音声トークン化のための新しい表現である。 RepCodecは、音声認識と生成の両方において広く使われているk-meansクラスタリング手法よりも優れていることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:53:44 GMT)
Spatial-Temporal Cross-View Contrastive Pre-training for Check-in Sequence Representation Learning [21.6]
本稿では,チェックインシーケンス表現学習のための空間-時間的クロスビューコントラスト表現(ST CCR)フレームワークを提案する。 ST CCRは「空間的話題」と「時間的意図」の視点から自己スーパービジョンを採用し、意味レベルでの空間的情報と時間的情報の効果的な融合を促進する。実世界の3つのデータセット上でST CCRを広範囲に評価し、3つの下流タスクにおいて優れた性能を示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:20:34 GMT)
Efficient Multimodal Learning from Data-centric Perspective [21.4]
効率的なマルチモーダル学習のためのフレキシブルビジョンと言語バックボーンを備えた軽量MLLMのファミリであるBunnyを紹介する。実験の結果,Bunny-4B/8Bは複数のベンチマークで最先端の大規模MLLMよりも優れていた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:54:40 GMT)
$\forall$uto$\exists$val: Autonomous Assessment of LLMs in Formal Synthesis and Interpretation Tasks [21.1]
本稿では,形式構文を自然言語に翻訳する際のLLM評価のスケールアップ手法を提案する。我々は、文脈自由文法(CFG)を用いて、その場で配布外のデータセットを生成する。我々はまた、このパラダイムの実現可能性と拡張性を示すために、複数のSOTAクローズドおよびオープンソースLCMの評価を行う。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 00:41:38 GMT)
Learning at a Glance: Towards Interpretable Data-limited Continual Semantic Segmentation via Semantic-Invariance Modelling [21.1]
インクリメンタルラーニング(IL)に基づく連続意味セグメンテーション(CSS)は、人間のようなセグメンテーションモデルを開発する上で大きな取り組みである。現在のCSSアプローチでは、古い知識の保存と新しい知識の学習のトレードオフに直面する。我々は、CSSの効率的で堅牢で人間らしい、解釈可能なアプローチであるLearning at a Glance (LAG)を提示する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:17:52 GMT)
Fundamental Limits of Prompt Compression: A Rate-Distortion Framework for Black-Box Language Models [21.0]
大規模言語モデル(LLM)の即時圧縮問題について定式化する。ブラックボックスモデルのハードプロンプトを生成するトークンレベルのプロンプト圧縮手法を統合するためのフレームワークを提案する。本稿では,現在の高速圧縮法の性能と最適戦略との間に大きなギャップがあることを述べる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:40:13 GMT)
TokenPacker: Efficient Visual Projector for Multimodal LLM [20.9]
ビジュアルプロジェクタは、ビジュアルエンコーダとLarge Language Model(LLM)の間に必須のブリッジとして機能する。本稿では,密集した特徴を注入して凝縮した視覚トークンを生成するために,粗く細かなスキームを取り入れた新しいビジュアルプロジェクタを提案する。我々のアプローチでは、ビジュアルトークンを75%89%圧縮し、多様なベンチマークで同等またはさらに優れたパフォーマンスを実現しています。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:55:46 GMT)
Iterative Ensemble Training with Anti-Gradient Control for Mitigating Memorization in Diffusion Models [20.6]
拡散モデルは、新規で高品質なサンプルを生成できることで知られている。最近のメモリ緩和手法は、クロスモーダル生成タスクにおけるテキストモダリティ問題にのみ焦点をあてるか、あるいはデータ拡張戦略を利用するかのどちらかである。本稿では,視覚的モダリティの観点からの拡散モデルのための新しいトレーニングフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:19:30 GMT)
The Diversity Bonus: Learning from Dissimilar Distributed Clients in Personalized Federated Learning [20.3]
そこで我々は,各クライアントが多種多様なデータ分布を持つクライアントから学習できるDiversiFedを提案する。 DiversiFedは異種クライアントの恩恵を受けることができ、したがって最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:24:45 GMT)
LLMExplainer: Large Language Model based Bayesian Inference for Graph Explanation Generation [20.2]
最近の研究は、複数の教師なし学習モデルを通してグラフニューラルネットワーク(GNN)の解釈可能性を提供することを目指している。データセットが不足しているため、現在の手法ではバイアスの学習が困難になる。学習バイアス問題を回避するため,GNN説明ネットワークにLarge Language Model (LLM) を知識として組み込む。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:36:38 GMT)
Empowering Embodied Visual Tracking with Visual Foundation Models and Offline RL [19.8]
身体的視覚追跡は、エンボディードエージェントにとって不可欠で挑戦的なスキルである。既存の手法では、非効率なトレーニングや一般化の欠如に悩まされている。視覚基盤モデルとオフライン強化学習を組み合わせた新しいフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:13:32 GMT)
Region Guided Attention Network for Retinal Vessel Segmentation [19.6]
本稿では,領域誘導型アテンションを用いたエンコーダデコーダ機構に基づく軽量網膜血管セグメンテーションネットワークを提案する。 Dice Losは偽陽性と偽陰性を等しく解析し、モデルがより正確なセグメンテーションを生成するように促す。ベンチマークデータセットの実験では、最先端の手法と比較して、パフォーマンス(0.8285, 0.8098, 0.9677, 0.8166リコール、精度、精度、F1スコア)が向上した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 00:08:18 GMT)
Artist: Aesthetically Controllable Text-Driven Stylization without Training [19.6]
テキスト駆動型スタイリングのための事前学習拡散モデルのコンテンツとスタイル生成を審美的に制御する,トレーニング不要なアプローチである textbfArtist を導入する。私たちのキーとなる洞察は、コンテンツとスタイルを分離した拡散プロセスに分割し、情報を共有することです。本手法は, 審美レベルのスタイリゼーション要件の達成, コンテンツイメージの複雑な詳細の保存, スタイルプロンプトの整合性に優れる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:58:05 GMT)
Distilled Thompson Sampling: Practical and Efficient Thompson Sampling via Imitation Learning [19.4]
トンプソンサンプリング(TS)は文脈的包帯問題に対する堅牢な手法として登場した。我々は、新しい模倣学習に基づくアルゴリズムを提案することで、TSを運用する。提案アルゴリズムは,Meta用の複数のビデオアップロードシステムに実装されている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:30:05 GMT)
Watermarks in the Sand: Impossibility of Strong Watermarking for Generative Models [19.3]
強い透かし方式は、計算的に拘束された攻撃者が、大幅な品質劣化を引き起こすことなく、透かしを消去できない性質を満たす。我々は、明確に定義された自然な仮定の下で、強い透かしが達成できないことを証明した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:00:18 GMT)
dMel: Speech Tokenization made Simple [19.2]
メル-フィルターバンクチャネルを離散強度ビンに分割すると、単純な表現(dMel)が生成されることを示す。本結果は,dMelが統合されたフレームワーク内の両方のタスクにおいて高い性能を実現する上で有効であることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:51:53 GMT)
EVD4UAV: An Altitude-Sensitive Benchmark to Evade Vehicle Detection in UAV [19.1]
無人航空機(UAV)の撮影画像における車両検出は、航空写真やリモートセンシングに広く応用されている。近年の研究では、物体に対向パッチを加えることで、よく訓練されたディープニューラルネットワークベースの物体検出器を騙すことが示されている。 UAVにおける車両検出を回避するための高度感度ベンチマークとしてEVD4UAVという新しいデータセットを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:02:35 GMT)
Adversarial Style Augmentation via Large Language Model for Robust Fake News Detection [19.0]
本研究は, 偽ニュース検知器の訓練を行うために, 対向型拡張AdStyleを提案する。我々のモデルの主要なメカニズムは、LLMを慎重に使用して、多種多様なスタイル変換攻撃プロンプトを自動生成することである。実験により、我々の拡張戦略は、フェイクニュースベンチマークデータセットでテストした場合の堅牢性と検出性能を改善することが示された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:56:44 GMT)
Exploring and Addressing Reward Confusion in Offline Preference Learning [18.9]
報酬モデルのトレーニングデータにおけるすっきりとした相関は、人間からの強化学習が望ましい目標を特定し、望ましくない行動を引き起こすのを防ぐことができる。本稿では、特にオフラインデータに急激な相関が存在する場合、オフラインRLHFは、混乱に報いる可能性があることを示す。本研究では,グローバルな選好連鎖を構築しながら,嗜好の推移性を活用することで,報酬の混乱を著しく低減する手法を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:03:36 GMT)
LDConv: Linear deformable convolution for improving convolutional neural networks [18.8]
Linear Deformable Convolution (LDConv) は、ネットワーク性能を改善するために畳み込み操作を置き換えることができる、プラグアンドプレイの畳み込み操作である。 LDConvは、標準畳み込みと変形可能なConvのパラメータ数の成長傾向を線形成長に補正する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:46:46 GMT)
Uncertainty-aware transfer across tasks using hybrid model-based successor feature reinforcement learning [18.8]
各アクションの値の不確実性は、カルマンフィルタ(KF)ベースの多重モデル適応推定によって近似される。我々のアルゴリズムは、異なる遷移力学の知識を一般化し、スクラッチから始めるよりもはるかに少ないサンプルで下流タスクを学習し、既存のアプローチより優れています。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:47:09 GMT)
HaloQuest: A Visual Hallucination Dataset for Advancing Multimodal Reasoning [18.8]
この研究は、マルチモーダル幻覚の様々な側面を捉える新しい視覚的質問応答データセットであるHaloQuestを紹介した。現在のモデルはHaloQuestと競合し、すべてのオープンソースVLMは36%の精度で達成されている。 HaloQuestの微調整は、標準的な推論タスクのパフォーマンスを維持しながら幻覚率を大幅に低下させる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:49:51 GMT)
WTS: A Pedestrian-Centric Traffic Video Dataset for Fine-grained Spatial-Temporal Understanding [18.5]
我々はWTSデータセットを導入し、車両と歩行者の両方の詳細な振る舞いを、数百の交通シナリオにおける1.2万以上のビデオイベントにわたって強調した。 WTSは、車両とインフラの協調環境における車両エゴと固定オーバーヘッドカメラからの多様な視点を統合している。また、歩行者関連トラヒックビデオ5Kのアノテーションをプロビデントしています。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:29:22 GMT)
Towards Latent Masked Image Modeling for Self-Supervised Visual Representation Learning [18.4]
Masked Image Modeling (MIM) は、画像のマスク部分から失明画素を予測することで、ラベルのない画像データから視覚表現を導出するための有望な方法として登場した。有望だが実現不可能なフレームワークは、MIMの局所性と高レベルな目標を組み合わせ、潜在空間におけるマスク付き再構成を通して表現を学習することである。この研究は、このようなフレームワークの課題を徹底的に分析し、対処する最初の試みの一つであり、このフレームワークはLatent MIMと呼ばれている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:54:41 GMT)
DiarizationLM: Speaker Diarization Post-Processing with Large Language Models [18.3]
DiarizationLMは、大きな言語モデル(LLM)を利用して話者ダイアリゼーションシステムから出力を後処理するフレームワークである。このフレームワークは、市販のASRや話者ダイアリゼーションシステムにも容易に適用できる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 01:29:37 GMT)
Red-QAOA: Efficient Variational Optimization through Circuit Reduction [18.1]
本稿では,シミュレーショングラフによるエネルギーランドスケープ濃度の低減を目的としたRed-QAOAを提案する。 Red-QAOAは、元のグラフとほぼ同じパラメータを持つより小さな(蒸留された)グラフを生成する。最適化の最後に、Red-QAOAは原グラフ上の蒸留グラフからパラメータを使用し、原グラフ上のパラメータ探索を継続する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:39:10 GMT)
CLIP with Generative Latent Replay: a Strong Baseline for Incremental Learning [17.6]
VLMを適応させながら忘れを緩和する新しい手法であるインクリメンタル・プロンプトラーニングのための連続的生成訓練を提案する。ゼロショット能力を改善しつつ、新しいタスクに適応する上でのフレームワークの有効性を実証する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:51:28 GMT)
How to Shrink Confidence Sets for Many Equivalent Discrete Distributions? [17.5]
機械学習問題における置換等価性を利用する。信頼集合のサイズは$O/sqrtn_k)$と$O/max_kin K n_k)$で縮小することを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:19:19 GMT)
Unsupervised Robust Cross-Lingual Entity Alignment via Joint Modeling of Entity and Relation Texts [17.5]
言語間エンティティアライメント(EA)は、異なる言語間での複数の知識グラフ(KG)の統合を可能にする。既存の手法は、主に教師付きであり、ラベル付きエンティティペアを得る際の課題に直面している。 ERAlignは教師なしで堅牢な言語間EAフレームワークである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:25:48 GMT)
Compensate Quantization Errors+: Quantized Models Are Inquisitive Learners [17.4]
大規模言語モデル(LLM)は、優れた性能と堅牢な推論能力を示すが、その拡張サイズは、相当なリソース消費のために、デプロイメントを複雑にし、環境上の懸念を増す。我々は量子化LDMの性能を高める革新的な手法を開発した。我々の手法は、様々な量子化シナリオをまたいだ最先端の結果を一貫して提供し、量子化プロセスに関する深い理論的洞察を提供し、広く応用するための量子化モデルのポテンシャルを解明する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:45:16 GMT)
Diverse Image Harmonization [17.3]
本研究では, 地中反射率の誘導により, 高い性能が得られる反射率誘導型ハーモニゼーションネットワークを提案する。また,様々な反射率生成ネットワークを設計し,複数の可塑性前景反射率を予測し,複数の可塑性高調波化結果を得る。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:51:11 GMT)
Dynamic Identity-Guided Attention Network for Visible-Infrared Person Re-identification [17.3]
Visible-infrared person re-identification (VI-ReID) は、可視光と赤外線の同一性を持つ人物をマッチングすることを目的としている。既存の方法は一般的に、画像や特徴レベルでのクロスモーダルな違いを橋渡ししようとする。我々は、動的ID誘導型注意ネットワーク(DIAN)を導入し、アイデンティティ誘導型およびモダリティ一貫性のある埋め込みをマイニングする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:23:26 GMT)
An updated review on cross-correlation of m-sequences [17.2]
有限フィールド上の最大長列(m系列)は、原始特性を持つ線形フィードバックレジスタによって生成される。過去50年間に、同時代のm系列間の相互相関が集中的に研究されてきた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 22:14:53 GMT)
6DGS: 6D Pose Estimation from a Single Image and a 3D Gaussian Splatting Model [17.2]
シーンを表す3Dガウス・スティング(3DGS)モデルから,ターゲットRGB画像のカメラポーズを推定する6DGSを提案する。 6DGSは、分析バイシンセシス法で典型的な反復的なプロセスを避ける。実際のシーンでは、平均回転精度を12%改善し、翻訳精度を22%向上させることができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:55:46 GMT)
Walking in Others' Shoes: How Perspective-Taking Guides Large Language Models in Reducing Toxicity and Bias [16.9]
社会心理学の原則に触発されて, LLMに多様な人間の視点を取り入れ, 反応を自己制御させる, textscPeT という新しい戦略を提案する。 2つの商用LCMと3つのオープンソースLCMに対して厳密な評価およびアブレーション研究を行い、より有害な応答を生み出す上でのtextscPeT の優位性を明らかにした。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 04:25:01 GMT)
Score Normalization for Demographic Fairness in Face Recognition [16.4]
有名なサンプル中心スコア正規化技術であるZ-normとT-normは、高セキュリティ動作点の公平性を向上しない。標準Z/Tノルムを拡張し、正規化における人口統計情報を統合する。本手法は,5つの最先端の顔認識ネットワークの全体的な公正性を改善する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:59:10 GMT)
SAM2CLIP2SAM: Vision Language Model for Segmentation of 3D CT Scans for Covid-19 Detection [16.2]
本稿では,任意のモデルや手法に統合可能な画像の効果的セグメンテーションのための新しいアプローチを提案する。私たちのアプローチには、CTスキャンをセグメント化する視覚言語モデルの組み合わせが含まれています。提案手法をCTスキャンのセグメンテーションに用いた場合の性能向上を示す2つのCovid-19アノテートデータベースに対して実験を行った。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:31:18 GMT)
Rapid Switching and Multi-Adapter Fusion via Sparse High Rank Adapters [16.2]
本稿では,標準モデルの重量の1-2%を直接微調整し,その他をそのまま残すSparse High Rank Adapters (SHiRA)を提案する。この高分散性は、推論オーバーヘッドを発生させることなく、融合モードで直接切り替えることを可能にし、マルチアダプタ融合時の概念損失を著しく低減する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 22:46:36 GMT)
Reinforcement Learning With Sparse-Executing Actions via Sparsity Regularization [15.9]
強化学習(RL)は、具体的制御、自律運転、金融取引といった意思決定タスクにおいて、素晴らしいパフォーマンスを示している。多くの意思決定タスクでは、エージェントは限られた予算の下でアクションを実行するという問題に遭遇する。本稿では,行動空間における特定の行動が限られた時間しか実行できないスパース行動マルコフ決定プロセス(SA-MDP)としてこの問題を定式化する。本稿では,ポリシー最適化アルゴリズムであるAction Sparsity Regularization (ASRE)を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:34:57 GMT)
Secure Inference for Vertically Partitioned Data Using Multiparty Homomorphic Encryption [15.9]
本稿では,単一サーバノードと複数のクライアントノードを含む分散環境でのセキュアな推論プロトコルを提案する。深層学習モデルがサーバノードにある間、観測されたデータベクトルは複数のクライアントノードに分割されていると仮定する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:17:43 GMT)
Towards Open-World Object-based Anomaly Detection via Self-Supervised Outlier Synthesis [15.7]
この研究は、オープンワールドオブジェクト検出器とOoD検出器を仮想外周で活用することでギャップを埋めることを目的としている。提案手法では,オブジェクト検出アーキテクチャ全体を拡張して,クラスラベルに依存することなく,異常に認識された特徴表現を学習する。提案手法は,オブジェクトレベルの異常検出における最先端性能を確立し,自然画像の平均リコールスコアを5.4%以上向上させる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:16:38 GMT)
LLMmap: Fingerprinting For Large Language Models [15.7]
LLM 統合アプリケーションを対象とした第1世代の指紋認証攻撃 LLMmap を紹介する。わずか8つの相互作用で、LLMmapは95%以上の精度でLSMを正確に識別できる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:59:45 GMT)
Sparse Prior Is Not All You Need: When Differential Directionality Meets Saliency Coherence for Infrared Small Target Detection [15.6]
本研究では,Sparse Differential Directionality prior (SDD)フレームワークを提案する。我々は、ターゲットの異なる方向特性を活用して、それらを背景と区別する。さらに、サリエンシ・コヒーレンス・ストラテジーにより、目標検出性をさらに強化する。近似交互最小化法(PAM)アルゴリズムは,提案したモデルを効率的に解く。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 04:32:43 GMT)
Key-Point-Driven Mathematical Reasoning Distillation of Large Language Model [15.5]
KPDD(Key-Point-Driven Mathematical Reasoning Distillation)を提案する。 KPDDは、問題解決プロセスを3段階に分割することで、SLMの推論性能を向上させる。実験により、KPDD-CoTは推論能力を大幅に向上し、KPDD-PoTは数学的推論タスクにおける最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:26:23 GMT)
MILAN: Milli-Annotations for Lidar Semantic Segmentation [15.5]
近年の自己監督型ライダースキャン表現の品質は,アノテーションのコストを大幅に削減できることを示す。自己教師付き表現は,高度に情報のあるライダースキャンを簡易かつ直接選択してアノテートすることができることを示す。第2のステップでは、同じ自己教師付き表現を、選択したスキャンのクラスタポイントに利用します。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:59:49 GMT)
Foundation Models for Autonomous Robots in Unstructured Environments [15.5]
この研究は、ロボットと非構造環境の2つの分野における基礎モデルの応用を体系的にレビューした。 LLMの言語能力は、人間とロボットの相互作用の知覚を改善するために、他の特徴よりも利用されてきた。 LLMの使用は、プロジェクトの管理と建設における安全性、災害管理における自然災害検出により多くの応用を実証した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:55:26 GMT)
Integrating IP Broadcasting with Audio Tags- Workflow and Challenges [15.5]
放送業界はIP技術を採用しており、生放送と録画されたコンテンツ制作の両方に革命をもたらしている。考えられる1つのツールは、ライブオーディオタグの使用であり、コンテンツの生産に多くの用途がある。本稿では、複数の異なるネットワーク構成に統合可能な、小さな分離コードモジュールであるマイクロサービスにオーディオタグモデルをコンテナ化するプロセスについて述べる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:00:21 GMT)
Resource-Efficient Federated Multimodal Learning via Layer-wise and Progressive Training [15.5]
マルチモーダル学習と、フェデレートラーニング(FL)のようなプライバシー保護トレーニングアプローチを統合することが不可欠である。 LW-FedMMLはレイヤワイドなマルチモーダル学習手法であり,学習プロセスを複数のステップに分割する。提案手法の有効性を検証するため,様々なFLシナリオとマルチモーダル学習環境の広範な実験を行った。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:06:17 GMT)
CP-Prompt: Composition-Based Cross-modal Prompting for Domain-Incremental Continual Learning [15.4]
クロスモーダルドメイン増分学習(DIL)の主な課題は、学習モデルが新しいデータから継続的に学習できるようにすることである。本稿では,制約パラメータをトレーニングし,事前学習したモデルに新しいドメインを学習させる,シンプルで効果的なフレームワークCP-Promptを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 04:07:12 GMT)
Decomposition of Neural Discrete Representations for Large-Scale 3D Mapping [15.1]
分解型ニューラルマッピング(DNMap)について紹介する。 DNMapはストレージ効率のよい大規模3Dマッピング手法である。我々は、小さなストレージ空間を必要とする低解像度の連続的な埋め込みを学習する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:32:33 GMT)
Taxonomy Driven Fast Adversarial Training [15.0]
逆行訓練(AT)は、ニューラルネットワークの堅牢性を高めるために、勾配に基づく攻撃に対する効果的な防御方法である。ここでは、敵対例の分類がCOの真理を明らかにするという驚くべき発見を提示する。本稿では,ニューラルネットワークの堅牢性を向上し,誤分類例の影響を緩和し,トレーニング過程におけるCOの防止を可能にする,シングルステップATの新たなパラダイムを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:56:27 GMT)
DP-DyLoRA: Fine-Tuning Transformer-Based Models On-Device under Differentially Private Federated Learning using Dynamic Low-Rank Adaptation [15.0]
フェデレートラーニング(FL)は、クライアントがローカルデータをサーバと共有することなく、グローバルモデルを協調的にトレーニングすることを可能にする。差分プライバシ(DP)は、クライアントのコントリビューションにランダム性を加えるメカニズムを備えた、正式なプライバシ保証を提供することによって、そのようなリークに対処する。差分プライバシーと組み合わせてDP-DyLoRAと呼ぶ適応手法を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:21:49 GMT)
MoRSE: Bridging the Gap in Cybersecurity Expertise with Retrieval Augmented Generation [15.0]
MoRSEは、サイバーセキュリティに関する包括的で完全な知識を提供することを目指している。 MoRSEは従来のRAGと異なり、並列レトリバーを使用してセマンティック関連情報を検索する。 MoRSEは知識ベースへのリアルタイムアップデートの恩恵を受けており、トレーニングをリトレーニングすることなく、継続的な知識の充実を可能にする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:53:27 GMT)
Attention Is All You Need But You Don't Need All Of It For Inference of Large Language Models [15.0]
ドライパー注意層を落とせば、性能はわずかに低下するが、最高のスピードアップにつながる。また、後者の層以外の層をスキップすることは、注意層をスキップする以外は、より多くの層をスキップする性能を低下させる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:09:05 GMT)
Robustness of Speech Separation Models for Similar-pitch Speakers [14.9]
単一チャンネル音声分離は,マルチスピーカ環境における音声認識システムを強化する上で重要な課題である。本稿では,話者間のピッチ差が最小限である場合における最先端ニューラルネットワークモデルのロバスト性について検討する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:55:08 GMT)
AdaCLIP: Adapting CLIP with Hybrid Learnable Prompts for Zero-Shot Anomaly Detection [14.9]
本研究では,事前学習型視覚言語モデル(VLM)であるCLIPを利用して,ZSADタスクのためのAdaCLIPを提案する。 AdaCLIPは学習可能なプロンプトをCLIPに組み込み、補助的な注釈付き異常検出データのトレーニングを通じて最適化する。 AdaCLIPは他のZSAD法よりも優れていることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:52:37 GMT)
MuTT: A Multimodal Trajectory Transformer for Robot Skills [14.8]
MuTTは、ロボットスキルの環境対応実行を予測するために設計された、新しいエンコーダ・デコーダ変換アーキテクチャである。我々は、視覚と軌跡の融合を開拓し、新しい軌跡投影を導入した。このアプローチは,現実的な実行を必要とせずに,現状環境におけるロボットスキルパラメータの最適化を容易にする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:18:52 GMT)
Visual-Semantic Decomposition and Partial Alignment for Document-based Zero-Shot Learning [14.8]
本稿では,文書や画像から多視点セマンティック概念を抽出し,概念全体ではなくマッチングを整合させる新しいネットワークを提案する。我々は、文書ベースのゼロショット学習のための3つの標準ベンチマークにおいて、2つの文書ソースにおける最先端の手法を一貫して上回ります。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:15:04 GMT)
Sketch-Guided Constrained Decoding for Boosting Blackbox Large Language Models without Logit Access [14.3]
我々は,ブラックボックス大言語モデル(LLM)の制約付き復号法として,スケッチガイド付き制約付き復号法(SGCD)を導入する。 SGCDはブラックボックスLSMのロジットにアクセスすることなく動作する。閉情報抽出および選挙区解析における実験によるSGCDの有効性を実証する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 01:05:29 GMT)
X-Recon: Learning-based Patient-specific High-Resolution CT Reconstruction from Orthogonal X-Ray Images [14.0]
X-Reconは、左右胸部X線画像に基づく再構成ネットワークである。 PTX-Segはゼロショット気胸セグメンテーションアルゴリズムである。再現度はピーク信号対雑音比を含むいくつかの指標で最先端の性能を達成した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:55:36 GMT)
A Solution toward Transparent and Practical AI Regulation: Privacy Nutrition Labels for Open-source Generative AI-based Applications [14.0]
本稿では、規制駆動型GAIプライバシーラベルを提案し、これらのラベルを自動生成する新しいフレームワークであるRepo2Labelを紹介する。ユーザ調査は,提案したGAIプライバシーラベルフォーマットの共通支持を示す。 Repo2Labelは、ベンチマークデータセットに基づいて精度0.81、リコール0.88、F1スコア0.84を達成している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:24:13 GMT)
Probing Fine-Grained Action Understanding and Cross-View Generalization of Foundation Models [14.0]
ファンデーションモデル(FM)は、広いデータセットでトレーニングされた大規模なニューラルネットワークである。ビデオにおける人間の活動認識は、異なるアーキテクチャ間の競争によって駆動されるFMによって進歩している。本稿では,視線変化が人体活動認識の微粒化における異なるFMに与える影響を実験的に評価する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:59:57 GMT)
A Multimodal Knowledge-enhanced Whole-slide Pathology Foundation Model [14.0]
スライド画像全体のH&E診断と関連する病理報告とRNA-Seqデータからなる最大マルチモーダルデータセットをキュレートした。そこで,本論文では,病的FMにマルチモーダルな知識を注入する新パラダイムを提案する。提案したパラダイムはCPathの事前トレーニングのワークフローに革命をもたらす。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 04:09:27 GMT)
MODRL-TA:A Multi-Objective Deep Reinforcement Learning Framework for Traffic Allocation in E-Commerce Search [13.9]
本稿では、多目的Q-ラーニング(MOQ)と、クロスエントロピー法(CEM)に基づく決定融合アルゴリズム(DFM)と、プログレッシブデータ拡張システム(PDA)からなる多目的深層強化学習フレームワークを提案する。実世界のオンラインeコマースシステムの実験は、MODRL-TAの大幅な改善を実証している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:40:27 GMT)
Large Language Models Powered Context-aware Motion Prediction [13.9]
我々はLarge Language Models (LLMs) を用いて、動き予測タスクのグローバルトラフィックコンテキスト理解を強化する。 LLMに関連するコストを考慮すると、コスト効率のよいデプロイメント戦略を提案する。我々の研究は、LLMの交通シーンの理解と自動運転の動作予測性能を高めるための貴重な洞察を提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:11:29 GMT)
Exploring connections of spectral analysis and transfer learning in medical imaging [13.8]
自然画像と医用画像で事前学習したモデル間での学習優先順位の顕著な相違について検討した。モデルの学習優先度がアーティファクトのパワースペクトル密度と一致した場合、そのアーティファクトに過度に適合する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:04:25 GMT)
Enhancing Cognitive Workload Classification Using Integrated LSTM Layers and CNNs for fNIRS Data Analysis [13.7]
本稿では、ディープラーニングモデルにおける畳み込みニューラルネットワーク(CNN)の有効性に対する長期記憶層の影響について検討する。 LSTMレイヤを統合することで、モデルがfNIRSデータ内の時間的依存関係をキャプチャし、認知状態をより包括的に理解することが可能になる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:28:34 GMT)
Two Stacks Are Better Than One: A Comparison of Language Modeling and Translation as Multilingual Pretraining Objectives [13.6]
プレトレーニング言語モデル(PLM)は優れたパフォーマンスを示し、NLPコミュニティの注目を集めている。本稿では,制御された方法論環境における多言語事前学習目標の比較を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:16:30 GMT)
Enhancing Transferability of Targeted Adversarial Examples: A Self-Universal Perspective [13.6]
ブラックボックスディープニューラルネットワーク(DNN)に対するトランスファーベースの敵攻撃は、未ターゲットの攻撃よりもはるかに難しいことが証明されている。生成方法である現在のSOTAの印象的な転送性は、大量の追加データを必要とするコストと、ターゲットラベルごとに時間のかかるトレーニングが伴う。私たちは、この目標を追求する際の入力変換の大きな可能性を明らかにする、自己普遍的な視点を提供します。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:51:28 GMT)
Annealed Multiple Choice Learning: Overcoming limitations of Winner-takes-all with annealing [13.3]
シミュレーションアニーリングとMCLを組み合わせたAnnealed Multiple Choice Learning(aMCL)を提案する。 MCLは、不明瞭なタスクを扱う学習フレームワークであり、仮説の小さなセットを予測している。提案アルゴリズムは, 合成データセット, 標準UCIベンチマーク, 音声分離に関する広範な実験によって検証される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:16:56 GMT)
Towards Efficient Transferable Preemptive Adversarial Defense [13.3]
深層学習技術は摂動に敏感なため、信頼できないものになっている。我々は攻撃される前にメッセージを「攻撃」する戦略を考案した。私たちのFast Preemptionフレームワークはわずか3ステップで、ベンチマークのトレーニング時間、テスト時間、プリエンプティブの敵防御よりも優れています。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:23:44 GMT)
Imposter.AI: Adversarial Attacks with Hidden Intentions towards Aligned Large Language Models [13.2]
本研究では,大規模言語モデルから有害情報を抽出するために,人間の会話戦略を活かした攻撃機構を明らかにする。明示的な悪意のある応答をターゲットとする従来の手法とは異なり、我々のアプローチは応答で提供される情報の性質を深く掘り下げている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:04:29 GMT)
Attention Beats Linear for Fast Implicit Neural Representation Generation [13.2]
本稿では,局所的注意層(LAL)と大域的表現ベクトルからなる注意型局所INR(ANR)を提案する。インスタンス固有の表現とインスタンスに依存しないANRパラメータにより、ターゲット信号は連続関数として十分に再構成される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:52:18 GMT)
360VFI: A Dataset and Benchmark for Omnidirectional Video Frame Interpolation [13.1]
我々は,Omnidirectional Video Frame Interpolationのためのベンチマークデータセットである360VFIを紹介する。本稿では,全方向ビデオの歪みをネットワークに導入し,歪みを変調する実用的な実装を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:50:55 GMT)
Targeted Latent Adversarial Training Improves Robustness to Persistent Harmful Behaviors in LLMs [13.0]
大きな言語モデル(LLM)は、しばしば望ましくない方法で振る舞うように、明示的に微調整されないようにすることができる。レッドチーム、モデル編集、解釈可能性に関する最近の研究は、この課題が(逆境的な)微調整が望ましくない能力を排除するのではなく、いかに抑制するかに起因していることを示唆している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:19:14 GMT)
Enhancement of 3D Gaussian Splatting using Raw Mesh for Photorealistic Recreation of Architectures [13.0]
本研究では,3次元ガウスモデルを用いて建物の基本形状を抽出する手法を提案する。この調査は,建築設計分野における3次元再構築技術の有効性を向上する新たな可能性を開くものである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:29:38 GMT)
A Semi-Supervised Approach for Power System Event Identification [12.9]
本稿では,既存の事象識別手法を強化するために,未ラベルの事象識別サンプルを組み込むことの有効性を評価するための,新しい半教師付きフレームワークを提案する。提案手法は,合成事象PMUデータのモーダル解析から抽出した物理的解釈可能な特徴を用いた事象の特徴付けである。我々は,データ生成,特徴抽出,限定ラベル付きイベント識別という3つの側面からなる包括的イベント識別パッケージを開発し,公開している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:01:37 GMT)
Machine Learning Assisted Adjustment Boosts Efficiency of Exact Inference in Randomized Controlled Trials [12.7]
提案手法は,I型誤差を頑健に制御し,ランダム化制御試験(RCT)の統計的効率を高めることができることを示す。その応用は、第III相臨床試験のような、RCTの必要なサンプルサイズとコストを著しく削減する可能性がある。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:57:56 GMT)
Interpretable Concept-Based Memory Reasoning [12.6]
コンセプトベースのメモリリゾナー(CMR)は、人間に理解でき、検証可能なタスク予測プロセスを提供するために設計された新しいCBMである。 CMRは最先端のCBMと同等の精度で解釈可能性のトレードオフを達成し、基礎的な真実と整合した論理規則を発見し、規則の介入を可能にし、事前デプロイ検証を可能にする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:32:48 GMT)
Biometrics and Behavior Analysis for Detecting Distractions in e-Learning [12.5]
本稿では,eラーニングセッション中に異常な頭部ポーズを検出するコンピュータビジョンアプローチについて検討する。本稿では,学習者のセッションで観測された平均値から頭部姿勢の偏差を検出するためのアプローチを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:37:36 GMT)
DiffX: Guide Your Layout to Cross-Modal Generative Modeling [12.5]
DiffXと呼ばれる一般的なレイアウト誘導型RGB+X生成のための新しい拡散モデルを提案する。画像キャプションにLLaVAモデルを用いたテキスト記述を用いたクロスモーダル画像データセットを構築し,手作業による補正を行った。広範な実験を通じて、DiffXは3つのRGB+Xデータセットにわたるクロスモーダル生成の堅牢性と柔軟性を示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:05:16 GMT)
Multi-Modality Co-Learning for Efficient Skeleton-based Action Recognition [12.4]
本稿では,効率的な骨格に基づく行動認識のための多モード協調学習(MMCL)フレームワークを提案する。 MMCLフレームワークは,トレーニング期間中に多要素協調学習を行い,推論に簡潔な骨格のみを用いることで効率を向上する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:16:47 GMT)
Do Large Language Models Have Compositional Ability? An Investigation into Limitations and Scalability [12.3]
大規模言語モデル(LLM)は多くのAI問題に対する強力なツールとして登場した。また、ICL(In-context Learning)機能も備えている。どのように複合タスクにアプローチするかは、オープンな質問であり、ほとんど理解されていない。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:22:34 GMT)
TextureCrop: Enhancing Synthetic Image Detection through Texture-based Cropping [12.3]
合成画像検出(SID)は、AIが生成する有害なコンテンツを防御するための重要なツールである。現在のSID法は、通常、入力画像を一定の解像度にリサイズするか、計算上の問題によりセンタークロッピングを行う。本稿では,新しい画像前処理技術であるTextureCropを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:31:30 GMT)
Chronologically Accurate Retrieval for Temporal Grounding of Motion-Language Models [12.2]
本研究では,動作言語モデルの時系列的理解を評価するために,時間的精度の高い検索手法を提案する。テキスト記述をイベントに分解し、複合動作記述におけるイベントの順序をシャッフルすることで、負のテキストサンプルを作成する。次に、動作言語モデルのための簡単なタスクを設計し、より可能性の高いテキストを、真実と時系列的にシャッフルされたバージョンから検索する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:25:21 GMT)
Mitigating Entity-Level Hallucination in Large Language Models [11.9]
本稿では,大規模言語モデル(LLM)における幻覚の検出・緩和手法として,幻覚検出(DRAD)に基づく動的検索拡張を提案する。実験の結果,LDMにおける幻覚の検出と緩和の両面において,DRADは優れた性能を示した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:28:05 GMT)
RazorAttention: Efficient KV Cache Compression Through Retrieval Heads [11.7]
トークン情報を全て保存するキーバリューキャッシュのための新しい圧縮手法を提案する。 RazorAttentionは、パフォーマンスに顕著な影響を与えずに、KVキャッシュサイズを70%以上削減する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 01:12:23 GMT)
Counter Turing Test ($CT^2$): Investigating AI-Generated Text Detection for Hindi -- Ranking LLMs based on Hindi AI Detectability Index ($ADI_{hi}$) [11.7]
AI生成テキストは、すでに研究で注目を集めているトピックとして現れている。ヒンディー語におけるAI-Generated Text Detection (AGTD) について報告する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:00:23 GMT)
Hierarchical Homogeneity-Based Superpixel Segmentation: Application to Hyperspectral Image Analysis [11.6]
ハイパースペクトルデータの処理に有効なマルチスケールスーパーピクセル法を提案する。提案された階層的アプローチは、可変サイズの超画素を導くが、スペクトルの均一性は高い。評価のために、スペクトルアンミックスおよび分類タスクにおける前処理ステップとして、同質性に基づく階層法を適用した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 01:20:32 GMT)
One-dimensional quantum dot array integrated with charge sensors in an InAs nanowire [11.4]
InAsナノワイヤに2つの量子ドット電荷センサを統合した1次元量子ドットアレイを報告する。この装置は、アレイ内で連続的に形成された二重量子ドットを測定することによって研究される。 4次元ハミルトニアンに基づく理論シミュレーションにより、2つの二重量子ドット間の強い結合強度が確かめられる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:53:39 GMT)
MedRAT: Unpaired Medical Report Generation via Auxiliary Tasks [11.2]
本稿では、2つの異なるデータセットで利用可能な情報を活用する新しいモデルを提案する。我々のモデルはMedRATと呼ばれ、従来の最先端の手法を超越している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:49:34 GMT)
TaskGen: A Task-Based, Memory-Infused Agentic Framework using StrictJSON [11.1]
TaskGenはオープンソースのエージェントフレームワークで、エージェントを使用して任意のタスクをサブタスクに分解することで解決する。冗長性を減らすためにTaskGenは、LLM(Large Language Model)からの出力を保証するStrictJSONを使用する。 TaskGenの哲学の鍵は、必要な知識に基づいて情報/メモリを管理することである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:37:41 GMT)
Interrogating AI: Characterizing Emergent Playful Interactions with ChatGPT [10.9]
AIシステムとの遊び的なインタラクションは、ユーザがテクノロジーを理解するための重要な方法として自然に現れました。我々は、新興AI技術のユーザであるChatGPTが提示する遊び心のあるインタラクションを調査することによって、このギャップを狙う。また,ChatGPTサブレディット上での372件のユーザ生成記事のテーマ分析により,ユーザ談話の半数以上が遊び心のあるインタラクションを中心に展開していることがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:44:14 GMT)
Revisiting the Robust Alignment of Circuit Breakers [10.9]
サーキットブレーカーによるアライメントとロバスト性の向上」というロバスト性は過大評価される可能性がある。具体的には、スペースアタックの埋め込みにいくつかの簡単な変更を加えることで、サーキットブレーカモデルに対する100%のアタック成功率(ASR)を達成することを実証する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:53:48 GMT)
Bidirectional skip-frame prediction for video anomaly detection with intra-domain disparity-driven attention [10.8]
デュアルストリームオートエンコーダをベースとしたBidirectional Skip-frame Prediction (BiSP) ネットワークを提案する。 BiSPは、トレーニング段階でフレームをスキップし、それぞれ前方および後方のフレーム予測を行う。テストフェーズでは、双方向連続フレームを使用して、同一の中間フレームを共予測し、通常の事象と異常事象の相違度を拡大する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:01:50 GMT)
EgoLifter: Open-world 3D Segmentation for Egocentric Perception [10.7]
EgoLifterは、エゴセントリックなセンサーから撮影したシーンを自動的に分割して、個々の3Dオブジェクトの完全な分解を行うシステムである。このシステムはエゴセントリックなデータに特化して設計されており、シーンには自然(非走査)の動きから数百の物体が写っている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:27:01 GMT)
Knowledge Acquisition Disentanglement for Knowledge-based Visual Question Answering with Large Language Models [10.5]
KVQA (Knowledge-based Visual Question Answering) は、質問に答えるために、画像と世界の両方の知識を必要とする。現在の手法は、まず最初に元の複雑な質問で画像と外部知識ベースから知識を取得し、次にLarge Language Models (LLM)で回答を生成する。 DKA: LLMフィードバックからの解答知識獲得(DKA: Disentangled Knowledge Acquisition)を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:05:32 GMT)
MACM: Utilizing a Multi-Agent System for Condition Mining in Solving Complex Mathematical Problems [10.5]
本稿では,条件マイニングのためのtextitMulti-Agent システム (textbfMACM) を提案する。複雑な数学的問題を解き、様々な数学的文脈にまたがる強力な一般化能力を示す。 MACMの助けを借りて、GPT-4 Turboの精度は、MATHデータセットの最も難しい5つの数学的な問題を、$mathbf54.68%テキストからmathbf76.73%$へと引き上げた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 22:37:40 GMT)
Understanding Physical Dynamics with Counterfactual World Modeling [10.5]
我々は、動的理解のための視覚構造抽出にCWM(Counterfactual World Modeling)を用いる。 CWMは、アノテーションなしでビデオデータのマスキング予測に時間分解マスキングポリシーを使用する。これらの構造は物理力学の理解に有用であることを示し、CWMがPhilonベンチマークの最先端性能を達成できることを示した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:51:25 GMT)
FDWST: Fingerphoto Deblurring using Wavelet Style Transfer [10.4]
本稿では,Wavelet Style Transfer (FDWST) を用いた指紋除去アーキテクチャを提案する。本モデルでは, 生成した指紋の画質を原画像と比較して劇的に向上させ, ピークマッチング精度0.9907を達成できた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:26:43 GMT)
Improving Minimum Bayes Risk Decoding with Multi-Prompt [10.4]
提案するマルチプロンプト復号法では,多くの候補が推論時にプロンプトバンクから復号される。候補をアンサンブルするために、最小ベイズリスク(MBR)デコーディングを使用し、トレーニングされた値メトリックを使用して最終的な出力を選択する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:57:10 GMT)
AICircuit: A Multi-Level Dataset and Benchmark for AI-Driven Analog Integrated Circuit Design [10.4]
本稿では,アナログ回路設計における機械学習アルゴリズムの開発と評価のためのベンチマークであるAICircuitを提案する。回路設計における機械学習のパワーを支える大きな障害は、汎用的で多様なデータセットが利用できることである。設計仕様から所望の回路パラメータへのマッピング学習におけるMLアルゴリズムの可能性を明らかにする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:32:16 GMT)
Disentangling spatio-temporal knowledge for weakly supervised object detection and segmentation in surgical video [10.3]
本稿では,セミデカップリング型時間的知識蒸留を用いて,高品質なクラスアクティベーションマップ(CAM)の予測を行うために,VDST-Net(Video Spatio-Temporal Disment Networks)を導入している。提案するフレームワークは,一般的な参照データセットや,オブジェクトが平均60%未満の注釈付きフレームに存在する,より困難な手術用ビデオデータセット上で有効であることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:52:32 GMT)
Generalizing Denoising to Non-Equilibrium Structures Improves Equivariant Force Fields [10.3]
本稿では,非平衡構造(DeNS)を補助的タスクとして活用し,トレーニングデータの活用と性能向上を提案する。 DeNSを用いたトレーニングでは,まず3次元座標にノイズを加え,そのノイズを予測することで3次元構造を破損させた。 OC20,OC22,MD17データセット上で,DeNSを用いた同変ネットワークのトレーニングの有効性を検討した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:22:09 GMT)
LabObf: A Label Protection Scheme for Vertical Federated Learning Through Label Obfuscation [10.2]
Split Neural Networkは、プライバシー保護の特性から業界で人気がある。悪意のある参加者は、アップロードされた埋め込みからラベル情報を推測するかもしれない。本稿では,各整数値ラベルを複数の実数値ソフトラベルにランダムにマッピングする,LabObf'と呼ばれる新しいラベル難読化防衛戦略を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:25:54 GMT)
RoadPainter: Points Are Ideal Navigators for Topology transformER [10.2]
トポロジ推論は、道路シーンの正確な理解を提供することを目的としており、自律システムは安全かつ効率的なルートを特定できる。多視点画像を用いた車線中心線のトポロジの検出と推論のための革新的なアプローチであるRoadPainterを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:23:35 GMT)
Diffusion Model Based Resource Allocation Strategy in Ultra-Reliable Wireless Networked Control Systems [10.2]
拡散モデルは、複雑なデータ分散をキャプチャするその能力を活用することによって、生成AIで大いに利用されている。本稿では,無線ネットワーク制御システムのための新しい拡散モデルに基づく資源配分手法を提案する。提案手法は,従来提案されていたDeep Reinforcement Learning (DRL) ベースの手法よりも高い性能を示し,全消費電力に関する最適性能を示した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:44:57 GMT)
Sharp Convergence Rates for Matching Pursuit [10.1]
目的関数を辞書から$f_n$ of $n$要素で近似するために,マッチング追従の限界,あるいは純粋欲求アルゴリズムについて検討する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:54:38 GMT)
Differentiable Product Quantization for Memory Efficient Camera Relocalization [10.0]
我々は,記述子量子化-復号化を行う軽量シーン固有オートエンコーダネットワークをエンドツーエンドの微分可能な方法で訓練する。その結果,1MBのローカルディスクリプタメモリでは,提案したネットワークとマップ圧縮の相乗的組み合わせが最高の性能を発揮することがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:05:58 GMT)
ALLaM: Large Language Models for Arabic and English [9.9]
アラビア語技術(ALT)のエコシステムを支える一連の大規模言語モデルであるアラビア大言語モデル(ALaM: Arabic Large Language Model)を提示する。我々の自己回帰デコーダのみのアーキテクチャモデルは、語彙拡張と事前訓練による第二言語習得が、原語(英語)で破滅的な忘れをすることなく、新しい言語(アラビア語)へのモデルを操る方法を示している。人間の嗜好と広範囲なアライメントは,品質アライメントの低い大規模モデルと比較して言語モデルの性能を著しく向上させることができることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:35:17 GMT)
Logical Reasoning with Relation Network for Inductive Knowledge Graph Completion [9.8]
帰納的KG完了のための新しいiNfOmax RelAtion Network(NORAN)を提案する。我々のフレームワークは最先端のKGC手法よりも大幅に優れています。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:42:42 GMT)
Improving the Accuracy-Robustness Trade-Off of Classifiers via Adaptive Smoothing [9.6]
正誤例に対する頑健な基本分類器の信頼性差が,この改良の鍵となることを示す。逆入力検出器を2つのベースモデルの混合を適応的に調整する混合ネットワークに適応させる。提案したフレキシブルな手法は「適応的平滑化(adaptive smoothing)」と呼ばれ、クリーンな精度、堅牢性、あるいは敵検出を改善する既存のあるいは将来の方法と連携して機能する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:41:03 GMT)
Stability of Quantum Systems beyond Canonical Typicality [9.6]
熱浴と強く結合した量子系の統計分布を解析する。系分布の安定性は系の相互作用強度に大きく影響される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:59:04 GMT)
Universal Spectral Transfer with Physical Prior-Informed Deep Generative Learning [9.6]
本稿では、スペクトルシグネチャを生成するための新しい物理的事前情報深層生成モデルであるSpectroGenを紹介する。結果,99%の相関と0.01の根平均二乗誤差が得られた基底真理スペクトルよりも優れた分解能を示した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 23:31:10 GMT)
Parallel Split Learning with Global Sampling [9.6]
並列分割学習(PSL)は、リソース制約のあるデバイスでの分散学習に適している。 PSLは、大きな有効バッチサイズ、非IIDデータ分散、ストラグラー効果など、いくつかの障害に直面している。クライアント数から有効バッチサイズを分離し,非IID設定におけるミニバッチ偏差を低減するために,Uniform Global Sampling (UGS) 方式を導入する。シミュレーションの結果,提案手法は非IID環境でのモデル精度を最大34.1%向上し,ストラグラー存在下でのトレーニング時間を最大62%短縮することがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:41:23 GMT)
Semi-Supervised Learning for Anomaly Detection in Blockchain-based Supply Chains [9.5]
提案モデルでは,ネットワーク層やコンセンサス層など,さまざまなレベルのサイバー攻撃を検出することができる。次に、教師なし学習と教師なし学習の利点を組み合わせた半教師付きDAE-MLP(Deep AutoEncoder-Multilayer Perceptron)を提案する。実験の結果,BSC内の異常検出に対する本モデルの有効性が示され,96.5%の精度が得られた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:57:54 GMT)
EcoFollower: An Environment-Friendly Car Following Model Considering Fuel Consumption [9.4]
本研究では,自動車追従シナリオにおける燃料消費を最適化するために強化学習(RL)を用いて開発された新しいエコカー追従モデルであるEcoFollowerを紹介する。このモデルは燃料消費を大幅に削減し、実際の運転シナリオと比較して10.42%削減した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:48:37 GMT)
Explorative Imitation Learning: A Path Signature Approach for Continuous Environments [9.4]
CILO(Continuous Imitation Learning from Observation)は、模倣学習を2つの重要な特徴で強化する新しい方法である。 CILO探索は、より多様な状態遷移を可能にし、専門家のトラジェクトリを少なくし、トレーニングのイテレーションを少なくする。すべての環境において、すべての模倣学習手法の全体的なパフォーマンスが最も優れており、2つの環境において専門家よりも優れています。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:32:50 GMT)
TTSDS -- Text-to-Speech Distribution Score [9.4]
最近発表されたText-to-Speech (TTS) システムは、実際の音声に近い音声を生成する。本稿では,韻律,話者識別,知性といった複数の要因を組み合わせた合成音声の質を評価することを提案する。 2008年から2024年にかけて開発された35のTTSシステムをベンチマークし, 評価値の非重み付き平均値として計算した結果が人体評価と強く相関していることを示した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:08:35 GMT)
Detecting Brittle Decisions for Free: Leveraging Margin Consistency in Deep Robust Classifiers [9.1]
ディープラーニングモデルの意思決定は、知覚できない摂動に敏感である。敵攻撃を使用してインスタンス単位でモデルの脆弱性を評価することは、リアルタイムのデプロイメントシナリオには計算集約的であり、適さない。本稿では,脆弱な試料の効率的な検出のためのマージン整合性の概念を紹介する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:52:19 GMT)
SocialQuotes: Learning Contextual Roles of Social Media Quotes on the Web [9.1]
我々は、ソーシャルメディアの埋め込みを引用に例え、ページコンテキストを構造化された自然言語信号として形式化し、ページコンテキスト内の引用に対する役割の分類を識別する。われわれはSocialQuotesをリリースした。SocialQuotesは3200万以上のソーシャル引用と8.3kのクラウドソースによる引用アノテーションからなるCommon Crawlから構築された新しいデータセットだ。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:21:01 GMT)
Fully Test-Time rPPG Estimation via Synthetic Signal-Guided Feature Learning [8.9]
多くのリモート光胸腺撮影(r)推定モデルは、トレーニング領域で有望なパフォーマンスを達成したが、テスト領域での生理的信号や心拍数(HR)の測定に失敗することが多い。 r推定問題では、適応モデルは通常、様々なドメイン情報を用いてターゲットデータを推定する課題に直面します。 Test Time-Time Adaptation (TTA)は、ソースデータを参照せずにラベルなしのターゲットデータにオンライン適応することで、さまざまな未確認領域のr信号を適応的に推定することを可能にする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:47:36 GMT)
Semantic Communication for Cooperative Multi-Task Processing over Wireless Networks [8.8]
一つの観察から複数の意味論的解釈を可能にする「意味源」の概念を導入する。通信チャネルを考慮したエンドツーエンド最適化問題を定式化した。この結果から,協調型マルチタスキングが必ずしも有用であるとは限らないことが示唆された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:30:21 GMT)
Beyond Boundaries: efficient Projected Entangled Pair States methods for periodic quantum systems [8.8]
射影絡み合ったペア状態(PEPS)は、2次元量子多体系を探索するための強力なツールとして認識されている。我々は,PEPSを開放境界条件 (OBC) に重畳して周期境界条件 (PBC) を扱う戦略を開発した。このアプローチは、それらの変換不変性とハイゼンベルクモデルに対するベンチマークと$J$-J$モデルを維持しながら、そのようなシステムの計算複雑性を著しく低減する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:37:29 GMT)
Link Polarity Prediction from Sparse and Noisy Labels via Multiscale Social Balance [8.6]
署名付きグラフニューラルネットワーク(SGNN)は,最近,署名付きネットワーク上での学習タスクに有効なツールとして注目されている。これらのタスクの1つは、ネットワーク構造やその他の利用可能な極性から、この情報が欠落しているリンクの極性を予測することである。本研究では,リンクの極性予測を改善するために,新しい社会バランスの概念を基盤として,半教師付き学習フレームワークを考案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:02:28 GMT)
Utilizing probabilistic entanglement between sensors in quantum networks [8.6]
量子ネットワークの最も有望な応用の1つは、絡み合い支援センシングである。この研究は、いつ、どのように絡み合うか、いつ保存するか、いつ蒸留する必要があるかを概説している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:12:30 GMT)
Learning Non-Vacuous Generalization Bounds from Optimization [8.3]
最適化の観点からは、単純だが空でない一般化を示す。我々は、勾配アルゴリズムによってアクセスされた仮説セットが本質的にフラクタル的であることを利用して、この目標を達成する。数値解析により,現代のニューラルネットワークにおいて,本手法が有意な一般化を保証することが実証された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:47:46 GMT)
Analyzing the Generalization and Reliability of Steering Vectors [8.3]
ステアリングベクトルは分布内および分布外の両方にかなりの制限があることを示す。分散において、ステアビリティは異なる入力間で高度に変動する。アウト・オブ・ディストリビューション(out-of-distribution)、ステアリングベクトル(steering vector)はよく一般化されるが、いくつかの概念はプロンプトの合理的な変化に対して脆弱である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:28:31 GMT)
No Dimensional Sampling Coresets for Classification [8.2]
我々は、感度サンプリングフレームワークを用いて、分類問題に対するコアセットについて知られていることを洗練し、一般化する。我々の分析は、最初の非次元コアセットを提供するので、サイズは次元に依存しない。私たちが開発している重要なツールは、主要な感度サンプリングアプローチのRadamacher複雑性バージョンです。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:12:31 GMT)
Three-dimensional fracton topological orders with boundary Toeplitz braiding [8.2]
本研究では, (z) 方向に沿って2次元ツイスト(mathbbZ_N) 層を積み重ねて形成した3次元フラクトントポロジカル秩序について検討した。開境界条件 (OBC) を (z) に沿って持つと、(K)-行列の特定の選択は、エキゾチック境界Toeplitz Braiding' を示す。我々は非自明な(K)-行列を2つの異なるタイプに分類する。それぞれのタイプ-Iは2つの境界ゼロモードを持ち、一方、タイプ-IIは1つの境界ゼロモードを持つ。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:58:24 GMT)
Pavement Fatigue Crack Detection and Severity Classification Based on Convolutional Neural Network [8.2]
疲労き裂、またはアリゲーターき裂( alligator cracking)はアスファルト舗装の一般的な苦難の1つである。 2つの目的を達成できる新しい深層畳み込みニューラルネットワークを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:56:03 GMT)
An Empirical Study of Retrieval Augmented Generation with Chain-of-Thought [8.2]
本稿では,RAFT(Retrieval Augmented Fine-Tuning)法の有効性について述べる。 RAFT法を複数のデータセットにまたがって評価し,その性能を様々な推論タスクで解析した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:55:14 GMT)
A Survey on Video Prediction: From Deterministic to Generative Approaches [8.1]
コンピュータビジョンの基本課題である映像予測は、モデルが既存の映像コンテンツに基づいて将来のフレームのシーケンスを生成することを可能にすることを目的としている。我々は、この分野で最も広く使われているデータセットとアルゴリズムを含む、歴史と現代の両方を包括的に調査する。本稿では,ビデオ予測アルゴリズムの性質に着目した新しい分類法を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:18:26 GMT)
Cascaded two-stage feature clustering and selection via separability and consistency in fuzzy decision systems [8.0]
特徴選択は、計算複雑性を減らし、モデルパフォーマンスを改善し、オーバーフィッティングのリスクを軽減することができるため、機械学習において重要なテクニックである。本稿では,ファジィ決定システムのための2段階特徴クラスタリングと選択アルゴリズムを提案する。提案アルゴリズムの有効性を18の公開データセットと現実世界の統合失調症データセットを用いて評価した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:44:32 GMT)
Multi-label Image Classification using Adaptive Graph Convolutional Networks: from a Single Domain to Multiple Domains [8.0]
本稿では,マルチラベル画像分類のための適応的なグラフベースアプローチを提案する。注意に基づくメカニズムと類似性保存戦略を統合することで実現される。提案するフレームワークは,複数のドメインに拡張し,対戦型トレーニングスキームを用いて拡張する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:16:26 GMT)
Tackling Selfish Clients in Federated Learning [8.0]
Federated Learning (FL) は分散機械学習パラダイムである。一部のインテリジェントクライアントは、標準的なトレーニングプロセスから意図的に逸脱し、グローバルモデルをローカルモデルに傾けることができる。本稿では,FLサーバのロバスト集約戦略を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:08:13 GMT)
Word Closure-Based Metamorphic Testing for Machine Translation [8.0]
本稿では,既存の機械翻訳システム(MTS)MT手法の限界に対処するため,単語クロージャに基づく出力比較手法を提案する。本手法は, 精度の向上とリコールにより, 既存の不正識別の精度を著しく向上させる。また、翻訳エラーのF1スコアを35.9%向上させるのに役立つ。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:17:09 GMT)
RADA: Robust and Accurate Feature Learning with Domain Adaptation [7.9]
本稿では、2つの重要な要素を組み込んだ多層機能集約ネットワークを導入し、堅牢で正確な特徴の学習を容易にする。提案手法は,画像マッチング,カメラポーズ推定,視覚的ローカライゼーションタスクにおいて優れた結果が得られる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:49:58 GMT)
Iterative approach to reconstructing neural disparity fields from light-field data [7.8]
本研究では,シーンの相違を暗黙的に連続的に表現するニューラル・ディパリティ・フィールド(NDF)を提案する。 NDFは3次元シーンにおける相違点のシームレスかつ高精度な特徴付けを可能にする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:06:06 GMT)
LiNR: Model Based Neural Retrieval on GPUs at LinkedIn [7.8]
LiNRはLinkedInの大規模GPUベースの検索システムである。大規模なインデックスに対して,フルスキャンと効率的なフィルタリングを取り入れたシステム拡張について述べる。我々は、LiNRが業界初のLive-updated model-based search indexの1つであると考えている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:33:25 GMT)
Breaking the Global North Stereotype: A Global South-centric Benchmark Dataset for Auditing and Mitigating Biases in Facial Recognition Systems [7.8]
本研究では,世界8カ国の男女6,579名からなる顔データセットを提案する。データセットの50%以上がグローバル・サウス諸国の個人であり、人口統計学的に多様である。敵対的監査と堅牢なモデルトレーニングを支援するため、各画像は4つの敵的変種を持ち、合計4万枚以上の画像がある。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:22:04 GMT)
Query-OPT: Optimizing Inference of Large Language Models via Multi-Query Instructions in Meeting Summarization [7.7]
我々は,同一の入力コンテキストに対するクエリを1つのプロンプトで組み合わせて,繰り返し呼び出しを最小限に抑える方法が,要約の達成に有効かどうかを検討する。予測フォーマットでの応答生成における100%の信頼性は、通常、特定のクローズドソース LLM に制限される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:53:32 GMT)
A Survey on Continual Semantic Segmentation: Theory, Challenge, Method and Application [7.6]
継続的学習は、漸進的学習または生涯学習としても知られ、ディープラーニングとAIシステムの最前線にある。本稿では,連続的セマンティックセグメンテーション(CSS)について概説する。現在のCSSモデルを、データ再生とデータフリーセットを含む2つのメインブランチに分類し、分類する。また、多様なアプリケーションシナリオと開発傾向を持つ4つのCSS特長も導入しています。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:04:04 GMT)
S3E: A Large-scale Multimodal Dataset for Collaborative SLAM [7.5]
拡張型マルチモーダルデータセットであるS3Eを紹介する。 S3Eは4つの異なる共同軌道パラダイムを横断する無人地上車両群によって捕獲され、13の屋外および5つの屋内シーケンスを含んでいる。これらのシーケンスは、360度LiDAR点雲、高分解能ステレオ画像、高周波慣性測定ユニット(IMU)、UWB(Ultra-wideband)の相対観測を含む、細心の同期と空間的に校正されたデータストリームを特徴としている。我々のデータセットは、スケール、シーンの多様性、データの複雑度に関する過去の取り組みを上回るだけでなく、協調的なSLAM方法論と個別のSLAM方法論の徹底的な分析とベンチマークも提供しています。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 00:31:30 GMT)
SpotDiffusion: A Fast Approach For Seamless Panorama Generation Over Time [7.5]
生成モデルを用いて高解像度画像を生成する新しい手法を提案する。提案手法は,時間とともに重なりのないデノベーションウィンドウをシフトさせ,一段階のシームが次回修正されるようにする。提案手法は計算効率の向上や推論時間の高速化など,いくつかの重要な利点を提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:44:35 GMT)
PDiscoFormer: Relaxing Part Discovery Constraints with Vision Transformers [7.5]
自己教師型DINOv2 ViTのような事前学習型トランスフォーマーベース視覚モデルにより制約緩和が可能となることを示す。特に、任意の大きさの複数の接続されたコンポーネントを利用できる全変動(TV)が、以前の作業よりも大幅に優れていたことが判明した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:41:39 GMT)
General-Purpose Retrieval-Enhanced Medical Prediction Model Using Near-Infinite History [7.4]
検索強化医療予測モデル(REMed) REMedは、基本的に無制限の医療イベントを評価し、関連するイベントを選択し、予測する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:01:54 GMT)
YOLO-pdd: A Novel Multi-scale PCB Defect Detection Method Using Deep Representations with Sequential Images [7.4]
本稿では,CNNに基づくPCB欠陥検出のための高精度で堅牢でリアルタイムなエンドツーエンド手法を提案する。本稿では, YOLOv5とマルチスケールモジュールを組み合わせた階層的残差接続手法を提案する。大規模PCBデータセットの実験では、既存の手法と比較して精度、リコール、F1スコアが大幅に改善された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:08:22 GMT)
Weights Shuffling for Improving DPSGD in Transformer-based Models [7.4]
本研究は,DPSGD(differially-Private Gradient Descent)における革新的なシャッフル機構を導入し,非シャッフルケースと同じプライバシ保証で大規模モデルの実用性を向上する。順列化は理論上はDPSGDのプライバシー保証を改善するが、シャッフルモデル上での正確なプライバシー損失の追跡は特に困難である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:41:59 GMT)
MAPLE: Multilingual Evaluation of Parameter Efficient Finetuning of Large Language Models [7.3]
ファインチューニングは、膨大なリソースと計算を必要とせずに、言語モデルの性能を向上させることができる。 LLama-2-7B モデルと Mistral-7B モデルを2つの合成多言語命令チューニングデータセット上で微調整し、モデル性能に与える影響を判定する。小型のオープンソースモデルのPEFTは、これらのモデルとより大きなモデルの間のギャップを埋めることがあるが、英語のパフォーマンスは打撃を受ける可能性がある。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:13:54 GMT)
FAIntbench: A Holistic and Precise Benchmark for Bias Evaluation in Text-to-Image Models [7.3]
FAIntbenchは、テキスト・トゥ・イメージ(T2I)モデルにおけるバイアスの総合的かつ正確なベンチマークである。我々はFAIntbenchを7種類の大規模T2Iモデルの評価に適用し,人間による評価を行った。その結果, FAIntbenchが種々のバイアスの同定に有効であった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:38:07 GMT)
On the Automated Processing of User Feedback [7.2]
ユーザフィードバックは、要件エンジニアリング、ユーザインターフェース設計、ソフトウェアエンジニアリングにとって、ますます重要な情報ソースとなります。フィードバックの可能性を最大限に活用するためには、解決すべき主な課題が2つあります。ベンダーは大量のフィードバックデータに対処しなければならない。第二に、ベンダーはさまざまなフィードバックの質に対処しなければならない。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:13:13 GMT)
ShortcutsBench: A Large-Scale Real-world Benchmark for API-based Agents [7.2]
我々は、APIベースのエージェントの包括的な評価のための大規模なベンチマークであるtextscShortcutsBenchを紹介する。 textscShortcutsBenchには、Apple Inc.のオペレーティングシステムから多くの真のAPIが含まれている。評価の結果,APIの選択やパラメータの充足,システムやユーザからの必要な情報要求など,複雑なクエリを扱う上での重大な制限が明らかになった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:57:58 GMT)
Fisher-Rao Gradient Flow: Geodesic Convexity and Functional Inequalities [7.1]
最小仮定下でのフィッシャー・ラオ勾配流の関数的不等式とそれに関連する測地的凸性について検討する。得られた機能的不等式の特徴は、ターゲット分布の対数凹度や対数ソボレフ定数に依存しない点である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:00:14 GMT)
Estimating Distributional Treatment Effects in Randomized Experiments: Machine Learning for Variance Reduction [6.9]
ランダム化実験における分散処理効果パラメータを推定するための新しい回帰調整法を提案する。提案手法では,事前処理による協調処理を分散回帰フレームワークに組み込み,機械学習技術を用いて分散処理効果推定器の精度を向上させる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:28:29 GMT)
Efficient Multi-disparity Transformer for Light Field Image Super-resolution [6.8]
本稿では,光フィールド画像超解像(LFSR)に適した新しい変圧器であるMulti-scale Disparity Transformer(MDT)を提案する。 MDTは、サブアパーチャ画像の不特定処理による計算冗長性と不均一な絡み合いの問題に対処する。このアーキテクチャに基づいて,効率的なLFSRネットワークLF-MDTNetを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:23:09 GMT)
MidiCaps: A large-scale MIDI dataset with text captions [6.8]
本研究の目的は,LLMとシンボリック音楽を組み合わせることで,テキストキャプションを付加した最初の大規模MIDIデータセットを提示することである。近年のキャプション技術の発展に触発されて,テキスト記述付き168kのMIDIファイルをキュレートしたデータセットを提示する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:34:46 GMT)
SLVideo: A Sign Language Video Moment Retrieval Framework [6.8]
SLVideoは手話ビデオのためのビデオモーメント検索ソフトウェアである。ビデオフレームから手と顔のサインの埋め込み表現を抽出する。ユーザーはテキストクエリで特定の手話ビデオセグメントを検索できる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:29:36 GMT)
Zero-Shot Embeddings Inform Learning and Forgetting with Vision-Language Encoders [6.7]
IMM(Inter-Intra Modal Measure)は、微調整によるパフォーマンス変化の強力な予測器として機能する。 IIMMスコアの高いタスクの微調整はドメイン内のパフォーマンス向上をもたらすが、ドメイン外のパフォーマンス低下も引き起こす。ターゲットデータの1つのフォワードパスだけで、実践者は、この重要な洞察を利用して、モデルが微調整後の改善を期待できる程度を評価することができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:35:09 GMT)
Empirical Capacity Model for Self-Attention Neural Networks [6.7]
数十億のパラメータを持つ可能性のある大規模なトランスフォーマーモデルは、理論上、コンテンツを記憶する大きな能力を持っている。本稿では,一般的なトレーニングアルゴリズムと合成トレーニングデータを用いて得られたモデルのメモリ容量に着目した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:02:15 GMT)
On the Matrix Form of the Quaternion Fourier Transform and Quaternion Convolution [6.6]
フーリエ変換および畳み込み演算の四元数版行列形式について検討する。四元数(英語版)は強力な表現単位を提供するが、それらは四元数乗算の非可換性から最も遠ざかるそれらの使用の困難に関係している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:29:58 GMT)
NeuralLabeling: A versatile toolset for labeling vision datasets using Neural Radiance Fields [6.5]
我々は、バウンディングボックスまたはメッシュを使用して3DシーンにアノテートするためのラベリングアプローチとツールセットであるNeuralLabelingを紹介する。皿洗い機に置かれた透明な物体を83.3%の精度で把握するロボットアプリケーションにNeuralLabelingを組み込む方法を示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 01:39:19 GMT)
Enhancing GPU-acceleration in the Python-based Simulations of Chemistry Framework [6.4]
我々は、既存のオープンソースGPU4PySCFプロジェクトへの産業利害関係者として、当社の貢献を説明します。我々は、密度汎関数理論(DFT)を含む他のPySCF機能にGPUアクセラレーションを統合した。 GPU4PySCFは32コアのCPUノード上で30倍のスピードアップを実現し、ほとんどのDFTタスクで約90%のコスト削減を実現している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:02:34 GMT)
GraphScale: A Framework to Enable Machine Learning over Billion-node Graphs [6.4]
本研究では,大規模グラフデータを分散的に保存・処理するための,教師付き学習と教師なし学習の両方のための統一的なフレームワークを提案する。私たちの設計における重要な洞察は、データを保存する労働者とトレーニングを行う労働者の分離です。実験の結果,GraphScaleはGNNとノード埋め込みの両方の分散トレーニングにおいて,最先端の手法よりも優れていることがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:09:36 GMT)
Context-Aware Indoor Point Cloud Object Generation through User Instructions [6.4]
本稿では,その周辺環境とシームレスに統合された点雲オブジェクトを生成することができる,新しいエンドツーエンドのマルチモーダルディープニューラルネットワークを提案する。我々のモデルは、これまで見えなかったオブジェクトレイアウトで新しい環境を作成できるようにすることで、シーン修正に革命をもたらす。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:52:46 GMT)
Honeybee: Decentralized Peer Sampling with Verifiable Random Walks for Blockchain Data Sharding [6.1]
シャーディングを実装する上で重要な課題は、ブロックのデータ全体がネットワークで利用可能かどうかを検証することである。本稿では,ランダムノードを用いた提案ノードに対するプリミティブサンプリングアルゴリズムを提案する。我々は,Honeybeeによって得られる品質が,最先端のサンプリングアルゴリズムと比較して有意に優れていることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 22:33:07 GMT)
FUTURE-AI: Guiding Principles and Consensus Recommendations for Trustworthy Artificial Intelligence in Medical Imaging [6.1]
Future-AIフレームワークは、医療におけるAIの信頼性、安全性、採用を促進するための原則を導いてくれる。我々は、Future-AIの一般的な医療原則を、医療画像コミュニティのニーズに合わせて、簡潔で具体的なAI実装ガイドに変換する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:39:53 GMT)
Semantic Constraint Inference for Web Form Test Generation [6.1]
我々は、Webフォームの自動テスト生成のためのFormNexusと呼ばれる革新的なアプローチを導入する。 FormNexusは、個々のフォーム要素とそれらの関係から意味的な洞察を導き出すことを強調している。 GPT-4と組み合わされたFormNexusは,フォームサブミッション状態において89%のカバレッジを実現していることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:58:51 GMT)
Flow-guided Motion Prediction with Semantics and Dynamic Occupancy Grid Maps [6.0]
OGM(Occupancy Grid Maps)は、一般的にシーン予測に使用される。近年,OGMと深層学習を併用してシーンの進化を予測する手法が研究されている。我々は,動的なOGMとセマンティック情報を利用して,将来の車両セマンティックグリッドとシーンの将来の流れを予測できる新しいマルチタスクフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:42:34 GMT)
Unsupervised anomaly localization in high-resolution breast scans using deep pluralistic image completion [5.9]
デジタル乳房共生(DBT)における腫瘍自動検出は, 天然腫瘍の出現率, 乳房組織の変化, 高分解能のため難しい課題である。機械学習におけるほとんどの異常なローカライゼーション研究は、非医療的なデータセットに焦点を当てている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:41:11 GMT)
Differentially Private Multiway and $k$-Cut [5.9]
我々は,最小$k$カットおよびマルチウェイカット問題に対して,ほぼ最適な性能を実現する,エッジ微分プライベートアルゴリズムを導入する。最小$k$-cut問題に対して、我々のアルゴリズムは、近似$k$-cutの個数に対する既知のバウンダリを活用し、固定プライバシーパラメータに対して最適な加算誤差$O(klog n)$のプライベートアルゴリズムを実現する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:37:34 GMT)
On Feasibility of Intent Obfuscating Attacks [5.9]
対象検出器の逆例生成に意図難読化を導入することを提案する。別の重複しないオブジェクトを摂動してターゲットオブジェクトを妨害することで、攻撃者は意図したターゲットを隠す。対象物体の信頼度や摂動物体の大きさなど,意図的難読化攻撃を特徴付ける成功要因を解析する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:13:22 GMT)
Optimizing Circuit Reusing and its Application in Randomized Benchmarking [5.8]
量子学習タスクは、ランダムにサンプリングされた量子回路を利用して未知のシステムを特徴づける。回路再利用 (circuit reusing) と呼ばれる効率的な手法では、各回路を複数回実行することで、新しい回路を実装するよりもコストを削減できる。本研究では,所定の実験コストに対する測定結果の分散を最小化する最適再利用パラメータについて検討する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:18:12 GMT)
Regression under demographic parity constraints via unlabeled post-processing [5.8]
本稿では,人口統計値に合致する予測を生成する汎用ポストプロセッシングアルゴリズムを提案する。我々は凸関数の勾配ノルムを正確に制御する必要がある。提案アルゴリズムは有限サンプル解析と後処理バウンダリによって裏付けられ, 実験結果から理論的知見が得られた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:11:58 GMT)
Can Large Language Models Write Good Property-Based Tests? [5.7]
プロパティベースのテスト(PBT)は、現実世界のソフトウェアではいまだにあまり使われていない。 2つのプロンプト手法を用いて,近代言語モデルを用いてPSTを自動的に合成する。最適なモデルとプロンプトアプローチにより,有効かつ健全なPBTを平均2.4サンプルで合成できることが判明した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 01:28:38 GMT)
Examining Inequality in Park Quality for Promoting Health Across 35 Global Cities [5.6]
特定の公園スペースと健康を育むための要素の容量は、まだ過小評価されていない。このギャップに対処するために,公園における健康増進活動の6つのカテゴリからなる分類法を提案する。公園空間と要素を特定の健康増進活動と結び付けるレキシコンを確立することにより、35の都市における公園の容量を推計し、健康増進を図る。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:20:30 GMT)
U-learning for Prediction Inference via Combinatory Multi-Subsampling: With Applications to LASSO and Neural Networks [5.6]
エピジェネティックな老化時計は、DNAメチル化パターンを調べることによって、個人の生物学的年齢を推定する上で重要な役割を担っている。アンサンブル予測のためのマルチサブラーニングによる新しいUサンプリング手法を提案する。より具体的には、一般化されたU統計学の枠組みにおけるアンサンブル推定器を概念化する。提案手法はLassoとDeep Neural Network(DNN)の2つの一般的な予測アルゴリズムに適用し,広範囲な数値研究による推論の有効性を示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 00:03:51 GMT)
DStruct2Design: Data and Benchmarks for Data Structure Driven Generative Floor Plan Design [5.6]
フロアプラン生成のデータ構造定式化のための新しいデータセットを構築した。部分的あるいは完全な制約が与えられたフロアプラン生成の課題について検討する。数値制約を考慮したフロアプラン生成問題に対するフロアプランデータ構造LLMの適用可能性を示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:27:55 GMT)
Decentralized Personalized Federated Learning based on a Conditional Sparse-to-Sparser Scheme [5.5]
分散連邦学習(DFL)は、その堅牢性と集中的調整の回避によって人気を博している。本稿では, DA-DPFL という新しいテクスチャパース・ツー・スパーサー・トレーニング手法を提案する。実験の結果, DA-DPFLはDFLのベースラインの精度を大幅に上回り, エネルギーコストの最大5ドル削減を実現していることがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:58:05 GMT)
Revisiting Score Function Estimators for $k$-Subset Sampling [5.5]
離散フーリエ変換を用いて,$k$-subset分布のスコア関数を効率的に計算する方法を示す。得られた推定器は、正確なサンプルと偏りのない勾配推定の両方を提供する。特徴選択の実験は、仮定が弱いにもかかわらず、現在の手法と競合する結果を示している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:26:39 GMT)
GFE-Mamba: Mamba-based AD Multi-modal Progression Assessment via Generative Feature Extraction from MCI [5.4]
アルツハイマー病(英語: Alzheimer's Disease、AD)は、軽度認知障害(MCI)から進行する可逆性神経変性疾患である。生成特徴抽出(GFE)に基づく分類器GFE-Mambaを紹介する。評価尺度、MRI、PETのデータを統合し、より深いマルチモーダル融合を可能にする。 GFE-MambaモデルがMCIからADへの変換予測に有効であることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:22:33 GMT)
Text-to-Battery Recipe: A language modeling-based protocol for automatic battery recipe extraction and retrieval [5.3]
本稿では,エンド・ツー・エンドのバッテリレシピの自動抽出のための言語モデリングベースのプロトコルであるText-to-Battery Recipe (T2BR)を提案する。提案プロトコルは,バッテリ材料文献のレビューを著しく加速し,バッテリ設計・開発におけるイノベーションを触媒する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:15:02 GMT)
Hierarchical accompanying and inhibiting patterns on the spatial arrangement of taxis' local hotspots [5.3]
本研究は,中国武漢市と北京市において,タクシーの軌跡データを用いて,微粒な局部ホットスポットの空間配置を定量的に検討した。人気のホットスポットは一般的にあまり人気のないホットスポットに囲まれているが、人気のあるホットスポットが多い地域では人気が低いホットスポットの存在を妨げている。両方のパターンに触発されて、これらの関係を記述するためにKNNベースのモデルが開発され、最もポピュラーでないホットスポットの空間分布を再現することに成功した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:13:45 GMT)
Enhancing Quantum Machine Learning: The Power of Non-Linear Optical Reproducing Kernels [5.3]
KerrカーネルはデータをKerrコヒーレント状態の位相と振幅にエンコードする。本稿では,Kerrコヒーレント状態を用いた特徴空間を提案する。月から乳がん診断まで,さまざまなデータセットを分析した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:33:24 GMT)
Lower bound for simulation cost of open quantum systems: Lipschitz continuity approach [5.2]
量子マルコフ半群の広いクラスをシミュレートするための下界を計算するための一般的な枠組みを提案する。我々のフレームワークは、ユニタリおよび非ユニタリ量子力学の両方に適用できる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:57:41 GMT)
Increasing the Robustness of Model Predictions to Missing Sensors in Earth Observation [5.1]
入力センサドロップアウト(ISensD)とアンサンブルセンサ不変(ESensI)という,マルチセンサシナリオに適した2つの新しい手法について検討した。これらの手法は, モデル予測の頑健さを, センサの欠如に対して効果的に向上させることを示した。アンサンブル・マルチセンサー・モデルはセンサの欠如に対して最も頑丈であることが観察された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:58:29 GMT)
PAV: Personalized Head Avatar from Unstructured Video Collection [5.1]
任意の視点と表情下での人間の顔合成のためのPAV(Personalized Head Avatar)を提案する。動的に変形可能なニューラルラジアンス場(NeRF)を学習する手法を提案する。視覚的レンダリング品質の観点から,PAVがベースライン法より優れていることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 23:34:46 GMT)
Harmonizing Flows: Leveraging normalizing flows for unsupervised and source-free MRI harmonization [5.1]
本稿では,正規化フローを利用してMR画像を調整し,ソース領域の分布をエミュレートする非教師なしフレームワークを提案する。提案する戦略は3つの重要なステップから構成される。我々は、浅層ハーモナイザネットワークをトレーニングし、その拡張によるソースドメインからの画像を再構成する。推論中、ハーモニザネットワークを更新し、出力画像が学習したソース領域分布に適合することを保証する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:22:08 GMT)
Inverted Activations [5.1]
本稿では, ポイントワイド非線形層におけるアクティベーションテンソルの取扱いの変更を提案する。我々の方法は代わりに出力テンソルを節約し、後続の層が入力テンソルを節約するために必要なメモリを削減します。実験の結果,トレーニング精度に影響を与えることなくメモリ使用量を大幅に削減できることが確認された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:11:17 GMT)
Synthetic Image Learning: Preserving Performance and Preventing Membership Inference Attacks [5.0]
本稿では,下流分類器の学習のための合成データの生成と利用を最適化するパイプラインである知識リサイクル(KR)を紹介する。このパイプラインの核心は生成的知識蒸留(GKD)であり、情報の品質と有用性を大幅に向上させる技術が提案されている。その結果、実データと合成データでトレーニングされたモデルと、実データでトレーニングされたモデルとの性能差が著しく低下した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:31:07 GMT)
Customized Retrieval Augmented Generation and Benchmarking for EDA Tool Documentation QA [5.0]
検索拡張生成(RAG)は、外部データベースから事実情報を抽出することにより、生成AIモデルの精度と信頼性を高める。本稿では、EDAツールドキュメンテーションQAのための3つのドメイン固有のテクニックとともに、カスタマイズされたRAGフレームワークを提案する。我々は,高度なRTL-to-GDSII設計プラットフォームであるOpenROADのドキュメントQA評価ベンチマークであるORD-QAを開発し,リリースした。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:44:27 GMT)
Fully Passive Quantum Conference Key Agreement [5.0]
会議鍵協定(CKA)は、多人数通信のための安全な方法を提供する。近年開発された干渉型準備・測定量子CKAは、測定デバイス独立性の利点を有する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:12:50 GMT)
Sample-Efficient Linear Representation Learning from Non-IID Non-Isotropic Data [5.0]
コリンズとナイアーとヴァスワニによって提案された交互最小化・退化スキームの適応について紹介する。 iidにおいてもバニラ変動最小化降下は破滅的に失敗するが, 軽度に非等方性データは得られない。我々の分析は、事前の作業を統一し、一般化し、幅広いアプリケーションに柔軟なフレームワークを提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:36:50 GMT)
ACEGEN: Reinforcement learning of generative chemical agents for drug discovery [5.0]
ACEGENは、創薬設計のための包括的で合理化されたツールキットである。 TorchRLは、完全にテストされた再利用可能なコンポーネントを提供する、現代的なRLライブラリである。複数の薬物発見症例に応用されたACEGENの例を示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:48:37 GMT)
Generalizing Teacher Networks for Effective Knowledge Distillation Across Student Architectures [5.0]
Generic Teacher Network (GTN) は、知識を有限のアーキテクチャプールからサンプリングされた任意の学生モデルに効果的に伝達できる汎用的な教師を作成するための、一発のKD-awareトレーニングである。本手法は, 総合的なKD効果の向上と, プール内の生徒間での総合教師のトレーニングコストの最小化を両立させる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:34:00 GMT)
Data Processing Inequality for The Quantum Guesswork [5.0]
非直交量子状態は絶対確実性で区別できない。量子推測は、非直交量子状態の区別可能性を評価する上で重要な尺度として浮上している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:42:16 GMT)
StylusAI: Stylistic Adaptation for Robust German Handwritten Text Generation [4.9]
StylusAIは、ある言語の筆跡のスタイリスティックなニュアンスを他の言語に適応させ、統合するように設計されている。 StylusAIの開発と評価を支援するために,lqDeutscher Handschriften-Datensatzrq(DHSD)データセットを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:08:30 GMT)
ARCO:Adaptive Multi-Agent Reinforcement Learning-Based Hardware/Software Co-Optimization Compiler for Improved Performance in DNN Accelerator Design [4.8]
ARCOは適応型マルチエージェント強化学習(MARL)ベースの協調最適化コンパイルフレームワークである。このフレームワークには、MARL内に3つのアクター批判エージェントが含まれており、それぞれがコンパイル/最適化の異なる側面に特化している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:26:19 GMT)
CAD-Prompted Generative Models: A Pathway to Feasible and Novel Engineering Designs [4.8]
本稿では,実現可能なCAD画像の生成を促すことによって,設計の実現可能性を向上させる手法を提案する。その結果、CAD画像のプロンプトは、Stable Diffusion 2.1のようなテキストから画像への変換に有効であることが示されている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:49:45 GMT)
LLM experiments with simulation: Large Language Model Multi-Agent System for Simulation Model Parametrization in Digital Twins [4.8]
本稿では,大規模言語モデル(LLM)を適用し,デジタル双生児におけるシミュレーションモデルのパラメトリゼーションを自動化する新しいフレームワークを提案する。提案手法は,LLMの知識を取り入れたシミュレーションモデルのユーザビリティを向上させる。このシステムは、ユーザのフレンドリさを高め、人間のユーザの認知負荷を軽減する可能性がある。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:03:48 GMT)
FSboard: Over 3 million characters of ASL fingerspelling collected via smartphones [4.7]
本稿では,モバイルテキスト入力のユースケースにおいて,米国手話指スペルデータセットであるFSboardについて述べる。 FSboardは長さ300万文字、持続時間250時間で、これまでで最大10倍の速度で指で文字を認識できるデータセットである。 ByT5-Smallに30HzのMediaPipeのホロスティックなランドマークを刻み込み、ユニークなフレーズとシグナを持つテストセットで11.1%の文字誤り率(CER)を達成する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:20:22 GMT)
On shallow planning under partial observability [4.7]
本研究は,マルコフ決定過程の構造パラメータの偏差トレードオフに対する割引係数の影響について検討する。この結果は,特に部分観測可能性の下では,より短い計画的地平が有用である可能性が示唆された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:34:07 GMT)
Reversing Unknown Quantum Processes via Virtual Combs for Channels with Limited Information [4.7]
仮想コムはユニタリ操作を逆転させ、スロット番号とサンプリングオーバーヘッドの間のトレードオフを調べることができることを示す。また、仮想コムはユニタリ操作を普遍的に反転させ、スロット番号とサンプリングオーバーヘッドの間のトレードオフを調査できることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 04:51:28 GMT)
Test-Time Low Rank Adaptation via Confidence Maximization for Zero-Shot Generalization of Vision-Language Models [4.7]
本稿では,大規模視覚言語モデル(VLM)のゼロショット一般化のための高速チューニングの代替として,テスト時間低ランク適応(TTL)を提案する。 TTLは、予測信頼度を最大化することにより、変圧器の注意重みを更新するテスト時間効率適応手法を提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:59:19 GMT)
CarFormer: Self-Driving with Learned Object-Centric Representations [4.6]
我々は、BEVシーケンス上のスロットアテンションモデルを用いて、オブジェクトをスロットに配置することを学ぶ。これらのオブジェクト中心の表現に基づいて、トランスフォーマーを訓練し、運転を学び、他の車両の将来について推論する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:59:01 GMT)
Reducing Texture Bias of Deep Neural Networks via Edge Enhancing Diffusion [4.6]
セマンティックセグメンテーションにおけるCNNのテクスチャバイアスについて検討する。我々は、テクスチャバイアスを減らすために、テクスチャの少ない前処理画像にCNNを訓練する。我々はCNNの強いテクスチャ依存性と変換器の適度なテクスチャ依存性を観察する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:42:25 GMT)
Model editing for distribution shifts in uranium oxide morphological analysis [4.5]
我々はウラン鉱石濃縮(UOC)の合成条件を分類するために訓練された深層学習モデルを考える。この領域に共通する分布シフトへの一般化を改善するために,モデル編集が特に有効であることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:06:51 GMT)
Prompting for products: Investigating design space exploration strategies for text-to-image generative models [4.5]
本研究は, 実用性, 斬新, 美的な製品イメージの獲得に成功するデザイン空間探索戦略を実証的に検討する。重要な発見は、モノ対マルチ基準と、特定の設計目標を達成するためのプロンプトのゴールオリエンテーションが、時間とプロンプトの長さで重要な役割を担っていることを明らかにする。この研究は、グローバル編集における実現可能性と新規性のためのマルチクリテリアプロンプトの使用の優先順位付けを推奨し、一方、局所編集ではモノクリテリアプロンプトを推奨している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:42:04 GMT)
CHOSEN: Compilation to Hardware Optimization Stack for Efficient Vision Transformer Inference [4.5]
ビジョントランスフォーマー(ViT)は、コンピュータビジョンへの機械学習アプローチにおける画期的なシフトである。本稿では,これらの課題に対処するソフトウェアハードウェアの共同設計フレームワークであるCHOSENを紹介し,FPGA上にViTをデプロイするための自動フレームワークを提供する。 ChoSENはDeiT-SとDeiT-Bモデルのスループットを1.5倍と1.42倍改善した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:19:15 GMT)
Spin-orbit coupling mediated photon-like resonance for a single atom trapped in a symmetric double well [4.5]
我々は、スピン軌道結合原子のエネルギー準位間の共鳴遷移を誘導するために、ラマンレーザー強度のコヒーレント周期変調を含む手法を用いる。このような光子共鳴は、局所状態から2つの井戸間の原子ラビ振動への移行を誘導する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:02:11 GMT)
OMoS-QA: A Dataset for Cross-Lingual Extractive Question Answering in a German Migration Context [4.4]
OMoS-QAは、信頼できる文書と手動の注釈付き回答とを組み合わせた、ドイツ語と英語の質問のデータセットである。質問はオープンソースの大言語モデル(LLM)で自動的に生成され、回答文は群衆労働者によって選択される。回答文の選択には高精度で低中間のリコールがあり、これは誤解を招くユーザーを避けるための好都合なトレードオフである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:40:17 GMT)
SPVLoc: Semantic Panoramic Viewport Matching for 6D Camera Localization in Unseen Environments [4.3]
SPVLocは、クエリ画像の6Dカメラポーズを正確に決定するグローバル屋内ローカライズ手法である。本手法では、視点カメラのビューポートをローカライズするために、新しいマッチング手法を用いる。技術手法と比較して位置決め精度が優れており、カメラのポーズの自由度も高いと推定される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:26:57 GMT)
Making LLMs Work for Enterprise Data Tasks [4.2]
大規模言語モデル(LLM)は、プライベートデータエコシステムにおけるエンタープライズデータベーステーブルについてほとんど知らない。 LLMのパフォーマンスはトレーニングデータと結びついているので、エンタープライズデータベースの管理と分析タスクを改善する上で、いかに有用かが重要な疑問である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:16:59 GMT)
RAD: A Comprehensive Dataset for Benchmarking the Robustness of Image Anomaly Detection [4.2]
本研究では,自由なビュー,不均一な照度,ぼやけたコレクションを備えたロバスト異常検出データセットを提案する。 RADは、ワーキングプラットフォーム上の異物を異常として識別することを目的としている。 RADを用いた非教師ありゼロショット法11点の評価と解析を行った。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:38:36 GMT)
GameBench: Evaluating Strategic Reasoning Abilities of LLM Agents [4.2]
大規模言語モデルの戦略的推論能力を評価するためのクロスドメインベンチマークであるGameBenchを紹介する。戦略的推論能力の向上を目的とした2つの足場フレームワークとともに,GPT-3とGPT-4をベースとして評価を行った。以上の結果から,試験対象モデルと人体性能は一致せず,GPT-4は無作為な動作よりも悪い結果が得られた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:32:33 GMT)
Large-scale Time-Varying Portfolio Optimisation using Graph Attention Networks [4.2]
これはリスクの高い企業を取り入れ、ポートフォリオの最適化に全企業を使う最初の研究だ。グラフ注意ネットワーク(GAT)を利用した新しい手法の提案と実証試験を行った。 GATは、ネットワークデータを利用して非線形関係を明らかにするディープラーニングベースのモデルである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:50:47 GMT)
The Contribution of XAI for the Safe Development and Certification of AI: An Expert-Based Analysis [4.1]
機械学習モデルのブラックボックスの性質は、複雑な技術システムの認証に対する従来のアプローチの使用を制限する。潜在的な解決策として、このブラックボックスに関する洞察を与える方法が考えられる。 XAIメソッドは安全なAI開発に役立つが、認証は技術システムに関する包括的で正確な情報に依存しているため、その影響は限定されると予想されている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:08:21 GMT)
Unextendible entanglement of quantum channels [4.1]
量子通信タスクを行う量子チャネルの能力について検討する。量子チャネルは、2つの側の間で非常に絡み合った状態を蒸留することができる。二つの超チャネルに対して$k$-extendibilityの形式を一般化する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:00:17 GMT)
AdaptEval: Evaluating Large Language Models on Domain Adaptation for Text Summarization [4.1]
本研究では,多言語モデル(LLM)のドメイン適応能力について,各ドメイン間の要約タスクで評価する。本稿では、最初のドメイン適応評価スイートであるAdaptEvalを紹介する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:47:08 GMT)
Evaluation of Reinforcement Learning for Autonomous Penetration Testing using A3C, Q-learning and DQN [4.0]
ネットワーク攻撃シミュレータ(NASim)は、3つの事前定義されたセキュリティシナリオを解決するために強化学習エージェントを訓練するための環境として使用された。 Q-learning、DQN、A3Cといったアルゴリズムが使われ、A3Cはすべてのシナリオを解き、一般化を実現した。トレーニングは比較的小さなシナリオで実施され, エージェントの状態と動作空間は小さいが, RLエージェントによる浸透試験を成功させることができた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:17:29 GMT)
UQA: Corpus for Urdu Question Answering [4.0]
本稿では,ウルドゥー語における質問応答とテキスト理解のための新しいデータセットであるUQAを紹介する。 UQAは、大規模な英語QAデータセットであるSQuAD2.0(Stanford Question Answering dataset)を翻訳することによって生成される。本稿では,Google TranslatorとSeamless M4Tの2つの候補の中から,最適な翻訳モデルを選択し,評価するプロセスについて述べる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:46:11 GMT)
MoXIchecker: An Extensible Model Checker for MoXI [3.9]
MoXIは2024年に導入された新しい中間検証言語である。我々はMoXI検証タスクを直接解決する最初のモデルチェッカーであるMoXIcheckerを紹介する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:26:04 GMT)
Unsupervised Mastoidectomy for Cochlear CT Mesh Reconstruction Using Highly Noisy Data [3.9]
術中CTスキャンのみでマストイドの容積を合成する方法を提案する。術式別では, 口径70.0%, 口径70.0%の乳頭切除術を施行した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:47:29 GMT)
MSegRNN:Enhanced SegRNN Model with Mamba for Long-Term Time Series Forecasting [3.9]
本研究では,微調整された単一層マンバ構造を用いて情報を前処理するSegRNNの変種を紹介する。暗黙のセグメンテーションと残留構造をモデルエンコーディングセクションに組み込んで、固有のデータ反復サイクルをさらに削減する。この変種はMSegRNNと呼ばれ、Mamba構造を用いて有用な情報を選択し、変換シーケンスを生成する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:26:41 GMT)
Investigating Benefits and Limitations of Migrating to a Micro-Frontends Architecture [3.8]
本研究では,実世界のアプリケーションをマイクロフロントエンドアーキテクチャに移行する際のメリットと限界について検討する。主なメリットは、テクノロジ選択の柔軟性の向上、開発チームのスケーラビリティ、テクノロジの段階的なマイグレーションなどだ。しかし、アーキテクチャの複雑さが増したことで、開発者の間で懸念が高まった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:47:05 GMT)
Uhlmann quench and geometric dynamic quantum phase transition of mixed states [3.8]
混合量子状態のクエンチダイナミクスに幾何学的位相を組み込むフォーマリズムを導入する。ウルマン・クエンチ(Uhlmann quench)は、混合状態における量子力学と幾何学的過程の間の相互作用を研究する方法である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:49:36 GMT)
AI-Driven Fast and Early Detection of IoT Botnet Threats: A Comprehensive Network Traffic Analysis Approach [3.8]
本研究は,IoTネットワークトラフィックを総合的に分析する手法を提案する。ネットワークトラフィックを表現し、良質なIoTトラフィックパターンを特徴付ける上で重要な、幅広いネットワーク機能について検討している。 IoT-23データセットによる広範な実験を通じて、さまざまな操作やボットの種類に対応するボットネットトラフィックの検出が可能であることを実証した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:54:40 GMT)
AIDE: Antithetical, Intent-based, and Diverse Example-Based Explanations [3.7]
AIDEは意図に基づく、不透明で複雑なモデルに対する多様な説明を提供するためのアプローチである。 AIDEは、正しい解釈、間違った調査、曖昧な予測の3つのタイプを区別する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:33:12 GMT)
BoostMVSNeRFs: Boosting MVS-based NeRFs to Generalizable View Synthesis in Large-scale Scenes [3.6]
本稿では,大規模シーンにおけるMVSベースのNeRFのレンダリング品質を高めるため,BoostMVSNeRFと呼ばれる新しい手法を提案する。 MVSベースのNeRF法では,入力ビューの制限によるカバレッジやアーティファクトの制限など,まず制限を識別する。本手法はトレーニングを必要とせず,フィードフォワード方式でMSVベースのNeRF手法に適応してレンダリング品質を向上させる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:59:46 GMT)
Residue imaginary velocity induces many-body delocalization [3.4]
余剰虚数(一部)ベロシティ $operatornameIm(v)$ に起因する新しい非局在化機構を発見する。この機構は、周期的境界条件下での非エルミート量子系の基底状態や低温状態に対して実現可能である。このような非局在化は、相関や絡み合いの挙動とともに、その多体の性質と有限温度と相互作用への一般化性を示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:10:18 GMT)
EfficientCD: A New Strategy For Change Detection Based With Bi-temporal Layers Exchanged [3.4]
本稿では,リモートセンシング画像変化検出のためのEfficientCDという新しいディープラーニングフレームワークを提案する。このフレームワークは機能抽出のバックボーンネットワークとしてEfficientNetを使用している。 EfficientCDは4つのリモートセンシングデータセットで実験的に検証されている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:11:50 GMT)
Inconsistencies in TeX-Produced Documents [3.3]
不整合は多種多様である。異なるバージョンのエンジンです流通この調査とは無関係に修正された2つの新しいバグと5つの既存のバグを特定しました。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:52:52 GMT)
A Life-long Learning Intrusion Detection System for 6G-Enabled IoV [3.2]
6G技術は、非常に高いデータレートとシームレスなネットワークカバレッジで、Internet of Vehicles(IoV)に革命をもたらすだろう。 6Gは、IoVのサイバー脅威に対する感受性を高めるだろう。本稿では,生涯学習のパラダイムを活用した新しい侵入検知システムを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:07:27 GMT)
Intersymbolic AI: Interlinking Symbolic AI and Subsymbolic AI [3.2]
シンボルAIは、シンボルAIとサブシンボルAIを組み合わせて、AIの有効性を高める。シンボルAIは、象徴AIの世界と、その構成的象徴的重要性と意味を結びつける。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:46:01 GMT)
Multi-Objective Latent Space Optimization of Generative Molecular Design Models [3.2]
生成分子設計(GMD)の性能を大幅に向上させる多目的潜在空間最適化(LSO)法を提案する。複数分子特性を共同最適化するための多目的GMD LSO法は, GMDの性能を著しく向上させることができることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 01:26:32 GMT)
Patch-based Intuitive Multimodal Prototypes Network (PIMPNet) for Alzheimer's Disease classification [3.1]
部分プロトタイプニューラルネットワークは、Deep Learning(DL)の計算上の利点を解釈可能な設計アーキテクチャに統合する。 PIMPNetは3D sMRIと患者の年齢からアルツハイマー病(AD)のバイナリ分類に適用された3D画像と人口統計の解釈可能な最初のマルチモーダルモデルである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:02:24 GMT)
Ridge Estimation with Nonlinear Transformations [3.1]
リッジ間の包含関係を示す: $cR(fcirc p)subseteq cR(p)$。また、$cR(fcirc p)$ と $cM$ の間のハウスドルフ距離が、$cR(p)$ と対応する射影の間のハウスドルフ距離よりも小さいことを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:48:36 GMT)
Score matching for bridges without time-reversals [3.1]
スコアマッチング手法を用いてブリッジ拡散過程を学習するための新しいアルゴリズムを提案する。本手法は,前処理のダイナミクスを逆転させ,これを用いてスコア関数を学習することに依存する。従来の方法とは対照的に、我々はスコア項 $nabla_x log p(t, x; T, y)$, for given $t, Y$ を直接学習する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:13:13 GMT)
Robust personalized pricing under uncertainty of purchase probabilities [2.9]
予測された購入確率の不確実性を考慮したパーソナライズ価格のロバストな最適化モデルを提案する。また、線形探索と組み合わせたラグランジアン分解アルゴリズムを開発し、大規模最適化問題に対する高品質な解を効率的に見つける。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:36:19 GMT)
From Black Boxes to Conversations: Incorporating XAI in a Conversational Agent [2.9]
社会科学の研究は、説明は人間と人間の説明と同様、会話的であるべきだと述べている。エージェントの標準設計を用いて,XAIを対話エージェントに組み込む方法を示す。我々は、品質管理されたパラフレーズによって拡張されたXAI質問銀行を構築し、ユーザの情報ニーズを理解する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:10:34 GMT)
Machine-learning-based particle identification with missing data [2.9]
本研究では,CERNにおけるALICE実験の範囲内での粒子同定(PID)の新たな手法を提案する。提案手法は,全粒子種に対して選択された試料のPID純度と効率を向上する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:33:25 GMT)
PIPNet3D: Interpretable Detection of Alzheimer in MRI Scans [2.8]
Part-Prototype Neural Network (PP-NN) は標準ブラックボックスモデルの代替品である。ボリューム画像のためのプロトタイプPP-NNであるPIPNet3Dを提案する。構造型磁気共鳴画像(sMRI)によるアルツハイマー病の臨床診断にPIPNet3Dを適用した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:04:33 GMT)
Off-the-grid prediction and testing for linear combination of translated features [2.8]
付加的なガウス雑音過程で信号(離散あるいは連続)が観測されるモデルを考える。我々は,スケールパラメータが変化する可能性を考慮して,オフ・ザ・グリッド推定器の過去の予測結果を拡張した。本稿では,観測信号の特徴が与えられた有限集合に属するか否かを検証する手法を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:36:19 GMT)
In-Context Learning Improves Compositional Understanding of Vision-Language Models [2.8]
合成画像理解は、トレーニングデータに存在する物体バイアスのため、かなり難しい課題である。コントラストモデルと生成モデルを比較し、アーキテクチャの違い、事前学習データ、トレーニングタスクと損失を分析します。提案手法は,複数の構成的理解データセットにまたがるベースラインモデルより優れている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:03:29 GMT)
Planning behavior in a recurrent neural network that plays Sokoban [2.8]
モデルレス強化学習でソコバンを再生するために、リカレントニューラルネットワーク(RNN)を訓練する。テスト時にエピソードの開始に余分なステップを追加することで、RNNの成功率が向上することがわかった。我々の結果は、段階ごとの罰則にもかかわらず、RNNはペアリングによる思考に時間がかかることを学習していることを示唆している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:57:34 GMT)
Efficient Retrieval with Learned Similarities [2.7]
最先端の検索アルゴリズムは、学習された類似点に移行した。筆者らは,Mixture-of-Logits (MoL) が普遍近似であり,学習された類似度関数を全て表現できることを示した。 MoLはレコメンデーション検索タスクに新たな最先端結果を設定し、学習した類似性を持つ近似トップk検索は、最大2桁のレイテンシでベースラインを上回ります。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:19:34 GMT)
Tree-Based versus Hybrid Graphical-Textual Model Editors: An Empirical Study of Testing Specifications [2.7]
ツリーベースのモデルエディタとハイブリッドなグラフィカルテキストモデルエディタは、ドメインモデルを編集する際の利点と制限がある。データは木ベースのモデルエディタに階層的に表示されるが、ハイブリッドなグラフィカルテキストモデルエディタは高レベルのドメイン概念をグラフィカルにキャプチャする。ハイブリッド表記が優れているというシステムモデラーの暗黙の仮定を評価するため,22名の参加者を対象に実験を行った。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:59:33 GMT)
SwinSF: Image Reconstruction from Spatial-Temporal Spike Streams [2.6]
スパイクストリームからの動的シーン再構築のための新しいモデルであるSwin Spikeformer(SwinSF)を紹介する。 SwinSFは、シフトしたウィンドウの自己注意と時間的スパイクアテンションを組み合わせ、包括的な特徴抽出を保証する。我々は、最新のスパイクカメラの解像度と一致するスパイク画像再構成のための新しい合成データセットを構築した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:17:39 GMT)
Distance-based mutual congestion feature selection with genetic algorithm for high-dimensional medical datasets [2.6]
あらゆるデータ分布に適用可能な、普遍的に最適な特徴選択方法はありません。本稿では, 応答変数の特徴値と観測値の分布を考慮したフィルタ手法として, 距離に基づくMutual Congestion (DMC)を提案する。ハイブリッドDMC-GAwARはバイナリ分類データセットに適用でき、最近の研究よりもその優位性を示す実験結果が得られた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:08:50 GMT)
Efficient and generalizable prediction of molecular alterations in multiple cancer cohorts using H&E whole slide images [2.6]
標的となるバイオマーカーの腫瘍サンプルの分子検査は、標準化の欠如によって制限される。低頻度のターゲット可能な変更は、ルーチンでテストできない。 H&E画像からDNAの変化を予測するアルゴリズムは、確認分子検査のためにサンプルを優先順位付けすることができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:31:57 GMT)
StreamTinyNet: video streaming analysis with spatial-temporal TinyML [2.6]
ビデオストリーミング分析(VSA)はTinyMLの最も興味深いタスクの1つである。マルチフレームVSAを実行する最初のTinyMLアーキテクチャであるStreamTinyNetを紹介します。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:08:03 GMT)
Gyroscopic stability for nanoparticles in Stern-Gerlach Interferometry and spin contrast [2.6]
物質波干渉計における回転の役割について検討し, 欠陥方向に沿って角運動量を与えるとスピンコントラストが増大することを示した。与えられた角運動量は、ほぼ2倍の係数で空間重畳を高め、ナノダイアモンド中の潜在的な永久双極子を平均化することができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:24:27 GMT)
Verifying the analogy between transversely coupled spin-1/2 systems and inductively-coupled fluxoniums [2.6]
誘導結合型超伝導フラクソニウム量子ビットの詳細な特性を報告する。我々の回路は2つの横結合スピン-1/2系の場合と非常に密接に振る舞う。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:07:35 GMT)
24 days-stable CNOT-gate on fluxonium qubits with over 99.9% fidelity [2.6]
誘導結合された2つのフラクソニウム量子ビット上で60ns直接CNOTゲートを実現する。我々のデータは、ゲート操作中の非デコヒーレンス関連エラーの調査を、2倍の10-4$まで下げる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:44:36 GMT)
SoftCVI: contrastive variational inference with self-generated soft labels [2.5]
ソフトコントラスト変動推論(SoftCVI)を導入し、コントラスト推定フレームワークを用いて変動対象のファミリーを導出する。ソフトCVIの目標は、しばしば他のよく使われる変分目標よりも優れている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:54:12 GMT)
Future-Proofing Mobile Networks: A Digital Twin Approach to Multi-Signal Management [2.5]
デジタルツイン(DT)は、将来の無線ネットワークにおいて重要な技術となることが期待されている。我々のフレームワークは多様なデータソースを統合し、ネットワーク性能と環境センシングに関するリアルタイムで総合的な洞察を提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 10:13:46 GMT)
YOLOv10 for Automated Fracture Detection in Pediatric Wrist Trauma X-rays [2.5]
本研究は, 小児手首骨折の診断成績を評価するために, 様々なYOLOv10変異体を初めて評価したものである。モデル複雑性の変化、アーキテクチャのスケーリング、デュアルラベル割り当て戦略の実装によって検出性能が向上する方法について検討する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:54:51 GMT)
Deep Learning for Economists [2.4]
ディープラーニングは、大規模で非構造化のテキストや画像データセットから構造化情報をインプットする強力な方法を提供する。このレビューでは、分類器、回帰モデル、生成AI、埋め込みモデルなど、ディープニューラルネットワークについて紹介する。適切な方法を使用する場合、ディープラーニングモデルはチューニングが安く、数百万から数十億のデータポイントに関わる問題に十分対応できる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:53:18 GMT)
PLayerTV: Advanced Player Tracking and Identification for Automatic Soccer Highlight Clips [2.4]
PlayerTVは、サッカービデオの自動プレーヤー追跡と識別に最先端のAI技術を活用する革新的なフレームワークである。オブジェクトの検出と追跡、光学文字認識(OCR)、色解析を統合することで、PlayerTVはプレイヤー固有のハイライトクリップの生成を容易にする。ノルウェーのエリテセリエンリーグのデータセットでテストしたコアパイプラインの評価から得られた予備的な結果は、PlayerTVがチームや選手を正確にかつ効率的に識別できることを示唆している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 22:27:57 GMT)
Generating Sample-Based Musical Instruments Using Neural Audio Codec Language Models [2.4]
サンプルベース楽器の自動生成のためのニューラルオーディオ言語モデルを提案する。提案手法は,88キーのスペクトル,速度,テキスト/オーディオの埋め込みを併用した音声合成フレームワークを拡張した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:59:58 GMT)
Thoughts on Learning Human and Programming Languages [2.3]
これはJeff氏が最初のUS-RSEカンファレンス(US-RSE'23)で行った講演に基づいている。 Dan氏はカンファレンスでJeff氏と議論し、この議論は非同期であり、このコラムは議論の記録である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:01:05 GMT)
ElectionRumors2022: A Dataset of Election Rumors on Twitter During the 2022 US Midterms [2.3]
我々は、中間選挙期間中にオンラインに広まった135の異なる噂に対応する1億81100万件のTwitter投稿のデータセットを提示、分析した。我々はまた、アリゾナの選挙に関する3つの異なる噂、特に2022年の選挙噂の顕著な焦点について、混同分析を行いました。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:02:26 GMT)
A Neurosymbolic Framework for Bias Correction in CNNs [2.2]
我々は、訓練されたCNNにおいて、バイアス補正のためのNeSyBiCorと呼ばれるニューロシンボリックフレームワークを導入する。そこで本研究では,PlacesデータセットのクラスサブセットでトレーニングしたCNNのバイアスの修正に成功した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:16:25 GMT)
Decoding BACnet Packets: A Large Language Model Approach for Packet Interpretation [2.2]
セキュリティオペレーションセンター(SOC)のアナリストは、ネットワークの活動やセキュリティインシデントを監視し、解釈し、対処する。従来の監視ツールや技術は、ICS固有のコミュニケーションの性質と意図を明確に理解するのに苦労することが多い。大規模言語モデル(LLM)を利用したソフトウェアソリューションを提案する。このソフトウェアは、ネットワークアクティビティの明確で一貫性があり、理解しやすい要約を提供しており、SOCアナリストは制御システムの現在の状態をよりよく評価することができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:15:49 GMT)
Low Rank Field-Weighted Factorization Machines for Low Latency Item Recommendation [2.2]
ファクトリゼーションマシン(FM)の変種は、厳格なスループットとレイテンシ要求の下で動作するレコメンデーションシステムで広く使われている。対角および対称低ランク分解を用いたFwFMにおけるプルーニングの代替法を提案する。攻撃的なランク低下は、精度と項目推薦速度の両方において、同様にアグレッシブプルーニングに優れることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:08:37 GMT)
Using Explainable AI for EEG-based Reduced Montage Neonatal Seizure Detection [2.2]
新生児発作検出のゴールドスタンダードは、現在連続したビデオEEGモニタリングに依存している。脳波モンタージュを低減した新生児発作検出プロセスを自動化するための新しい説明可能な深層学習モデルを提案する。提案したモデルは、それぞれ曲線下面積(AUC)とリコールにおける8.31%と42.86%の絶対的な改善を達成している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:57:42 GMT)
Versioned Analysis of Software Quality Indicators and Self-admitted Technical Debt in Ethereum Smart Contracts with Ethstractor [2.1]
本稿では、バージョン管理されたスマートコントラクトのデータセットを収集する最初のスマートコントラクト収集ツールであるEthstractorを提案する。収集されたデータセットは、スマートコントラクトの脆弱性の指標として、コードメトリクスの信頼性を評価するために使用される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:27:29 GMT)
Geometric Analysis of Unconstrained Feature Models with $d=K$ [2.0]
2つの人気の制約のない特徴モデルが厳密なサドル関数であり、すべての臨界点が大域的最小点か、負の曲率で退避できる厳密なサドル点であることを示す。主要な発見は、前回の記事における制約のない特徴モデルに関する予想を確定的に裏付けるものである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:09:46 GMT)
IG-CFAT: An Improved GAN-Based Framework for Effectively Exploiting Transformers in Real-World Image Super-Resolution [2.0]
本稿では,CFATモデルをIG-CFATと呼ばれる改良型GANモデルに拡張する。 IG-CFATはセマンティック・アウェア・ディスクリミネーターを組み込んで細部をより正確に再構築する。提案手法は,GANを用いた超解像モデルにおける従来の損失関数にウェーブレット損失を加え,より効率的に高周波の詳細を復元する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:50:09 GMT)
Wisdom of the Silicon Crowd: LLM Ensemble Prediction Capabilities Rival Human Crowd Accuracy [2.0]
我々は12大言語モデル(LLM)の群集からなるアンサンブルアプローチを使用する。我々は,31の2進数質問に対するLLM予測を,3ヶ月の予測トーナメントにおける人的予測者の群集の予測と比較した。両モデルの予測精度は、中央値の人間の予測を情報として暴露することで得られる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:50:27 GMT)
Quasi-classical Trajectory Calculations on a Two-state Potential Energy Surface Including Nonadiabatic Coupling Terms as Friction for D+ + H2 Collisions [2.0]
D++H2衝突の摩擦項としての非断熱結合項を含む2状態ab初期ポテンシャルエネルギー表面のダイナミクスを実行する。結果として生じるダイナミクスは、非反応性電荷移動、反応性非電荷移動および反応性電荷移動過程を正しく説明する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:48:51 GMT)
NV-Retriever: Improving text embedding models with effective hard-negative mining [1.8]
そこで我々は,より効果的な偽陰性除去のために,正の関連性スコアを利用する正の認識マイニング手法のファミリーを提案する。 NV-Retriever-v1 モデルを導入することで提案手法の有効性を実証し,MTEB Retrieval ベンチマークで 60.9 点,従来の手法より 0.65 点高い値を示した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:50:31 GMT)
RadioRAG: Factual Large Language Models for Enhanced Diagnostics in Radiology Using Dynamic Retrieval Augmented Generation [1.8]
大規模言語モデル(LLM)は、医学における人工知能(AI)の分野を進歩させた。 LLMは静的なトレーニングデータセットに基づいて、古い情報や不正確な情報を生成することが多い。我々は、信頼できるラジオロジックオンラインソースからデータをリアルタイムで取得するエンドツーエンドフレームワークとして、Radiology RAG(RadioRAG)を開発した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:29:56 GMT)
Benchmarking of quantum fidelity kernels for Gaussian process regression [1.7]
量子コンピューティングアルゴリズムは、機械学習の分類問題に対して性能の高い量子カーネルを生成することが示されている。量子カーネルは、回帰問題に対して古典的カーネルと同じ表現性が得られるが、あまり良くない。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:19:48 GMT)
Surrogate Neural Networks Local Stability for Aircraft Predictive Maintenance [1.7]
サロゲートニューラルネットワークは、計算的に要求されるエンジニアリングシミュレーションの代用として、産業で日常的に使用されている。性能と時間効率のため、これらのサロゲートモデルは安全クリティカルなアプリケーションでの使用のために開発されている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:19:50 GMT)
An Empirical Comparison of Video Frame Sampling Methods for Multi-Modal RAG Retrieval [1.7]
自然言語質問を用いたビデオ・フレーム検索におけるフレームサンプリング手法のトレードオフについて検討する。本稿では,ビデオRAGパターンが必要とするベクトルデータベース内の画像データ(ビデオフレーム)の保存と検索に焦点を当てた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:44:08 GMT)
Dynamic Structural Causal Models [1.7]
微分方程式(SDE)の系をDSCMで適切に表現できることを示す。この構成の直接的な結果は、SDEのシステムに対するグラフィカルなマルコフ特性である。また、離散時間DSCMを返却し、サブサンプリング時間列の数学的解析に使用できるサブサンプリング演算を定義する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:26:10 GMT)
A Survey of AI Reliance [1.6]
この文献の現在の欠点には、AI依存への不明確な影響、外部の妥当性の欠如、信頼度を測定するための矛盾したアプローチ、時間による依存度の変化を無視することなどがある。結論として,AI依存研究のガイドとなる形態的ボックスを提示する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:34:58 GMT)
Inferring turbulent velocity and temperature fields and their statistics from Lagrangian velocity measurements using physics-informed Kolmogorov-Arnold Networks [1.6]
実験乱流速度データから隠れた温度場を推定するためのAIVT法を提案する。具体的には、AIVTは物理インフォームされたコルモゴロフ・アルノルドネットワーク(ニューラルネットワークではない)に基づいており、複合損失関数の最適化によって訓練されている。乱流の直接数値シミュレーション (DNS) に匹敵する忠実度でスパース実験データから連続的, 即時的な速度場と温度場を再構成し, 推定できることを実証した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:30:21 GMT)
Integrated Mode-Hop-Free Tunable Lasers at 780 nm for Chip-Scale Classical and Quantum Photonic Applications [1.5]
ヘテロジニアスガリウム-オンシリコン窒化物(GaAs-on-SiN)プラットフォームにおける連続波長可変レーザーレーザーは780nm付近の遠赤外放射スペクトルに放出され、20nmのチューニング範囲、6kHzの固有線幅、40dBのサイドモード抑制比を持つ。提案された統合レーザーは、可視領域における古典的および量子的応用の幅広いスペクトルを約束する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:33:34 GMT)
Complexity of geometrically local stoquastic Hamiltonians [1.5]
局所ハミルトニアン問題のQMA完全性は、ハミルトニアン複雑性の分野の画期的な結果である。 2次元および1次元の幾何学的局所的な類似物は、高いクディット次元を持つMAハードのままであることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:27:25 GMT)
HandDGP: Camera-Space Hand Mesh Prediction with Differentiable Global Positioning [1.5]
本稿では,2D-3D対応問題に対処するエンドツーエンドソリューションを提案する。このソリューションは、新しい差別化可能なグローバル位置決めモジュールを通じて、カメラ空間出力からネットワークの他の部分へのバックプロパゲーションを可能にする。いくつかのベースラインと最先端のアプローチに対する評価において、我々のフレームワークの有効性を検証する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:59:01 GMT)
Data driven weather forecasts trained and initialised directly from observations [1.4]
Skilful Machine Learned weather forecasts has challenged our approach to numerical weather prediction。データ駆動システムは、過去の気象の長い歴史記録から学ぶことによって、将来の天気を予測するために訓練されている。そこで我々は,ニューラルネットワークをトレーニングし,過去の観測から将来の天気を予測する新しい手法を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:23:26 GMT)
Agile Minds, Innovative Solutions, and Industry-Academia Collaboration: Lean R&D Meets Problem-Based Learning in Software Engineering Education [1.4]
この記事では、ビジネスとソフトウェア開発のシナジーを強調しながら、リーンR&Dをスキル原則で拡張することを目的としています。実際の課題に取り組んでいた40人のパートタイム学生が講義や指導を受けていた。学生は知識能力の向上を報告し、実際の問題に取り組むことは学習に最も貢献していると認識した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:47:14 GMT)
Polynomial decompositions with invariance and positivity inspired by tensors [1.4]
このフレームワークは、特に量子多体系において、テンソル分解のために最近導入された。我々は、構造、近似、実数に対する決定不可能性の不変分解を定義する。私たちの仕事は、足場をテンソルで均等な足場に置き、このフレームワークを他の製品構造に拡張する扉を開くことで、足場に新たな光を当てます。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:28:16 GMT)
ImPress: Securing DRAM Against Data-Disturbance Errors via Implicit Row-Press Mitigation [1.4]
DRAM細胞はDDE(Data-Disturbance Errors)に感受性がある Rowhammerは、行が繰り返しアクティベートされたときに発生するよく知られたDDE脆弱性である。 Row-Press(RP)は、行を長時間開いているときに発生する新しいDDE脆弱性である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:20:14 GMT)
Spectrum-Aware Debiasing: A Modern Inference Framework with Applications to Principal Components Regression [1.3]
本稿では,高次元回帰のための新しい手法であるSpectrumAware Debiasingを紹介する。我々のアプローチは、構造的、重く、低ランクな構造に関する問題に適用できる。シミュレーションおよび実データ実験により本手法を実証する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:00:13 GMT)
Towards Complex Ontology Alignment using Large Language Models [1.3]
オントロジーアライメント(オントロジーアライメント)は、異なるラベルとコンテンツ間の関係を検出するWebにおける重要なプロセスである。近年のLarge Language Models (LLMs) の進歩は,工学的実践の強化に新たな機会をもたらす。本稿では,LLM技術の複雑なアライメント問題への取り組みについて検討する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:07:33 GMT)
Harnessing Quantum Support Vector Machines for Cross-Domain Classification of Quantum States [1.3]
クロスドメイン分類は、絡み合いと分離性パラダイムの解釈に使用される。 2ビット混合状態の効率的分類を,絡み合ったクラスと分離可能なクラスに分類する。本研究は,量子状態の分類のための量子支援ベクトルマシンの可能性を示すものである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:06:22 GMT)
Optimal Defender Strategies for CAGE-2 using Causal Modeling and Tree Search [1.3]
本稿では,CAGE-2の形式的(因果的)モデルと,証明可能な最適なディフェンダー戦略を生成する手法を提案する。 C-POMCPは、有効性に関して最先端の性能を達成し、最も近い競合手法よりも計算時間で2桁効率が良い。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:08:31 GMT)
A Survey of Explainable Artificial Intelligence (XAI) in Financial Time Series Forecasting [1.3]
eXplainable AI(XAI)の分野は、AIモデルをより理解しやすくすることを目指している。本稿では、金融時系列を予測するXAIアプローチを分類する。金融におけるXAIの現在の役割を包括的に把握している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:06:19 GMT)
Personality Analysis for Social Media Users using Arabic language and its Effect on Sentiment Analysis [1.3]
本研究は、Twitter上でのアラビア語の使用と性格特性と感情分析への影響の相関について検討した。本研究では、プロフィール活動から抽出した情報と、ツイートの内容に基づいて、ユーザの性格特性を示す。その結果,人格がソーシャルメディアの感情に影響を及ぼすことが明らかとなった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:27:20 GMT)
Inequalities in Computational Thinking Among Incoming Students in an STEM Chilean University [1.3]
本稿では、チリの大学に入学する学生の計算思考能力の特徴を、STEMの規律に強く焦点をあてて紹介する。この研究は500以上の回答に基づいて、性別、学校の種類(プライベートかノーか)、および事前のプログラミング知識における計算思考における有意な不平等の証拠を提供する。同様の状況に直面した国で、学生がSTEMの学位を取得するための、より公平な分野を作るための、今後の研究努力と定式化戦略を啓蒙することができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:51:15 GMT)
IWISDM: Assessing instruction following in multimodal models at scale [1.2]
我々は,視覚言語タスクの無制限な配列を生成するために,指示された仮想VISual Decision Making (iWISDM)環境を紹介する。 iWISDMを用いて,様々な複雑性レベルにわたる視覚課題に追従する命令の3つの異なるベンチマークをコンパイルした。本研究は,既存のマルチモーダルモデルと創発的マルチモーダルモデルの両方の命令順守性を評価するための頑健なベンチマークとしてiWISDMを確立した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:25:19 GMT)
Beyond Size and Class Balance: Alpha as a New Dataset Quality Metric for Deep Learning [1.2]
我々は、シャノンエントロピーのようなよく知られた量を一般化する、生態学で開発された多様性尺度の包括的枠組みを導入する。超音波、X線、CT、病理画像を表す7つの医学データセットから数千のサブセットを解析した結果、最高の相関関係はサイズやクラスバランスではないことがわかった。本稿では,医用画像における深層学習の性能向上のための新しい手法として,$A$を最大化することを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:28:51 GMT)
Advancing TTP Analysis: Harnessing the Power of Large Language Models with Retrieval Augmented Generation [1.2]
大規模言語モデル(LLM)が、サイバーセキュリティなどの重要なドメインに対して正確な応答を提供するために、効率的かつ適切な方法でどのように使用できるかは、不明である。この研究は、デコーダのみのLLMに対するエンコーダのみのLLM(Retrieval Augmented Generation, RAG)に対する教師付き微調整(SFT)の使用について研究し、比較する。本研究では,RAGを用いたデコーダのみのLLMが,SFTを用いたエンコーダのみのモデルよりも優れた性能を示すことを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:51:05 GMT)
A Decentralised Digital Token Architecture for Public Transport [1.2]
本研究の目的は,プライバシ向上型デジタルトークン管理サービスの公共交通機関への適用の可能性を確立することにある。概念実証実装が開発され、Goodell と Aste が提案した設計に基づいている。デモされたスループットとレイテンシは、システムが現在使用されているソリューションと競合できることを示している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:40:40 GMT)
DropKAN: Regularizing KANs by masking post-activations [1.2]
コルモゴロフ・アルノルドネットワーク(KAN)における活性化関数重みの共適応を防止する正規化手法を提案する。 DropKanは、Kansグラフ内のポストアクティベーションの一部をランダムにマスキングし、保持されたポストアクティベーションをスケールアップする。その結果,DropKANは標準のDropout with Kansよりも優れた代替手段であり,kansの一般化性能を向上させることが示唆された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:12:39 GMT)
Investigating the Indirect Object Identification circuit in Mamba [1.2]
我々は,マンバ前技法をマンバに適用し,間接物体識別(IOI)タスクに責任を持つ回路を部分的にリバースエンジニアリングする。コントリビューションは,回路ベースの機械的解釈可能性ツールがMambaアーキテクチャに有効であることを示す最初の証拠を提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:13:58 GMT)
Uncertainty Quantification and Propagation in Surrogate-based Bayesian Inference [1.1]
代理モデルはより複雑なシミュレーションモデルに対する概念近似である。代理体の不確かさを定量化し、伝播することは、通常、特別な分析ケースに限られる。本稿では,測定データを用いた代理モデルを用いたベイズ推定の3つの手法を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:37:44 GMT)
Memory Management for Real-Time Appearance-Based Loop Closure Detection [1.1]
本稿では,大規模・長期SLAMのための新しいリアルタイムループ閉鎖検出手法を提案する。本手法は,各観測時間を一定時間内に保持するメモリ管理手法に基づく。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 00:24:12 GMT)
Appearance-Based Loop Closure Detection for Online Large-Scale and Long-Term Operation [1.1]
外見に基づくローカライゼーションとマッピングでは、ループクロージャ検出(ループクロージャ検出)は、現在の観測が以前に訪れた場所や新しい場所から来ている場合、その検出に使用されるプロセスである。本稿では,大規模・長期運用におけるオンラインループ閉鎖検出手法を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 00:13:00 GMT)
Towards Effective Collaboration between Software Engineers and Data Scientists developing Machine Learning-Enabled Systems [1.1]
機械学習(ML)対応システムの開発には、いくつかの社会的および技術的な課題が含まれている。本稿は,これらのシステム構築における2つの重要なアクター – ソフトウェアエンジニアとデータサイエンティスト – のコラボレーションを強化する方法を理解することを目的としている。我々の研究は、これらのアクター間のコラボレーションが、ML対応システムを効果的に開発する上で重要であることを発見した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:35:18 GMT)
Can GPT-4 learn to analyze moves in research article abstracts? [1.1]
我々は、自然言語のプロンプトを用いてアノテーションプロセスを自動化するため、GPT-4の余裕を生かしている。 8ショットのプロンプトは2つを用いた場合よりも有効であり、可変性の領域を示す例を含めることで、単一の文で複数の動きを認識できるGPT-4の能力を高めることが確認された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:14:27 GMT)
Benchmarking Emerging Cavity-Mediated Quantum Interconnect Technologies for Modular Quantum Computers [1.1]
本研究は, キャビティを介する相互接続技術の比較分析を行った。キャビティ, 原子崩壊速度, および効率しきい値を満たすクビット-キャビティ結合強度に関する構成を同定する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:11:20 GMT)
A Diffusion Model for Simulation Ready Coronary Anatomy with Morpho-skeletal Control [1.1]
仮想的介入研究のために,潜在拡散モデルを用いて冠状動脈解剖学をカスタムに合成する方法を検討する。われわれのフレームワークは、冠動脈解剖学を制御可能な方法で生成・編集することを可能にし、デバイス設計者が機械的洞察を導き出すことを可能にする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:44:06 GMT)
MINT: Securely Mitigating Rowhammer with a Minimalist In-DRAM Tracker [1.0]
本稿では,Rowhammer(RH)を緩和するセキュアな低コストインDRAMトラッカーについて検討する。既存の低コストのDRAMトラッカーは、銀行当たり数百から数千のエントリの非現実的なオーバーヘッドを必要とする。単一エントリでセキュアな緩和を実現するミニマリストIn-DRAMトラッカー(MINT)を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:29:56 GMT)
A Multi-Level Corroborative Approach for Verification and Validation of Autonomous Robotic Swarms [1.0]
本稿では,自律型ロボット群を形式的に検証し,検証するための総合的マルチレベルモデリング手法を提案する。検証に用いた我々の形式的マクロモデルでは,実際のシミュレーションから得られたデータによって特徴付けられる。我々の研究は、実際のロボットを含む実験的な検証とフォーマルな検証を組み合わせる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:40:05 GMT)
Enhanced quantum emission from a topological Floquet resonance [1.0]
絡み合いは量子情報技術において貴重な資源である。非磁性および異常なフロケ絶縁体によって達成された絡み合った光子対の生成について述べる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:36:50 GMT)
Industrial Practices of Requirements Engineering for ML-Enabled Systems in Brazil [0.9]
ブラジルの企業の41%は、ある程度機械学習(ML)を使用している。しかし、ML問題仕様の非現実的な顧客期待とあいまいさが報告されている。本研究は,ブラジルにおけるML対応システム開発における要件工学の適用性を検討することを目的とする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:25:27 GMT)
Wallcamera: Reinventing the Wheel? [0.9]
We show that the key insights behind the Wallcamera is that the prototype of differential imaging forensics (DIF)。 DIFは、写真家の個人識別可能な情報の回復を含む、多くの法医学に応用されている。 Wallcameraの実際のイノベーションは、DIFが示したよりも細かい粒度でアクティビティ認識を達成することです。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:46:27 GMT)
LLM4ED: Large Language Models for Automatic Equation Discovery [0.9]
我々は、自然言語に基づくプロンプトを利用して、データから支配方程式を自動的にマイニングする大規模言語モデルをガイドする新しいフレームワークを導入する。具体的には、まずLLMの生成能力を利用して、文字列形式で様々な方程式を生成し、次に観測に基づいて生成された方程式を評価する。実験は偏微分方程式と常微分方程式の両方で広範囲に行われる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:13:18 GMT)
Dynamical System Identification, Model Selection and Model Uncertainty Quantification by Bayesian Inference [0.8]
本研究では,時系列データから動的システム同定を行うためのMAPフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:51:59 GMT)
Socially Integrated Navigation: A Social Acting Robot with Deep Reinforcement Learning [0.8]
移動ロボットは様々な混み合った状況で大規模に使われており、私たちの社会の一部になっている。個人を考慮した移動ロボットの社会的に許容されるナビゲーション行動は、スケーラブルなアプリケーションと人間の受容にとって必須の要件である。本稿では,ロボットの社会行動が適応的であり,人間との相互作用から生じる,社会統合型ナビゲーション手法を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:48:50 GMT)
Multimodal Explainability via Latent Shift applied to COVID-19 stratification [0.8]
本稿では,モダリティの再構築とサンプル分類を共同で学習するディープアーキテクチャを提案する。 AIforCOVIDデータセットを使用して、COVID-19パンデミックの文脈でのアプローチを検証する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:02:58 GMT)
Code Linting using Language Models [0.8]
コードリンタは高品質なソフトウェアシステムの開発において重要な役割を担います。それらの利点にもかかわらず、コードリンタは言語固有のもので、特定のタイプの問題に焦点を合わせており、偽陽性になりがちである。本稿では,大規模言語モデルを用いて,より汎用的なコードlinterを開発できるかどうかについて検討する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:01:10 GMT)
Predictive Coding Networks and Inference Learning: Tutorial and Survey [0.8]
予測符号化ネットワーク(PCN)は、予測符号化の神経科学的な枠組みに基づいている。バックプロパゲーション(BP)で訓練された従来のニューラルネットワークとは異なり、PCNは推論学習(IL)を利用する。本質的に確率的(グラフィック的)潜在変数モデルとして、PCNは教師付き学習と教師なし(生成的)モデリングの両方に汎用的なフレームワークを提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:56:46 GMT)
Controlling nonlocality of bipartite qubit states via quantum channels [0.7]
これはベルの非局所性条件を満たす2量子循環状態に対応するキュービットチャネルに焦点を当てている。この研究は、量子チャネルの興味深い幾何学的性質を明らかにし、量子非局所性の分野に寄与する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:21:26 GMT)
Multimodal Input Aids a Bayesian Model of Phonetic Learning [0.7]
本稿では,既存の音声コーパスのための高品質な音声合成ビデオを作成する方法を提案する。我々の学習モデルは、オーディオ視覚入力の訓練と試験の両方を行うと、音素識別電池の8.1%の相対的な改善が達成される。視覚情報は特にノイズの多いオーディオ環境において有益である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:00:11 GMT)
Restarts subject to approximate sharpness: A parameter-free and optimal scheme for first-order methods [0.7]
シャープネス(Sharpness)は、目的関数の準最適性によってミニマからの距離を束縛する連続最適化における仮定である。シャープネスは、通常不明な問題固有の定数を伴い、再起動スキームは通常収束率を減少させる。対象関数の誤差に未知の定数摂動を組み込んだシャープネスの一般化である近似シャープネスの仮定を考察する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:29:18 GMT)
Personalization of Dataset Retrieval Results using a Metadata-based Data Valuation Method [0.6]
アイルランドのナショナル・マッピング・エージェンシーにおいて,データセット検索のための新しいデータ評価手法を提案する。メタデータとユーザの好みを利用して、各データセットの個人価値を推定する。データセットの利害関係者のランキングに対して、データバリューベースのランキングを検証しました。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:13:07 GMT)
Left-Right Swapping and Upper-Lower Limb Pairing for Robust Multi-Wearable Workout Activity Detection [0.6]
この研究は、2024年のHASCA WEARチャレンジのためのSignal Sleuthsチームのソリューションを提示します。この課題は、4つのウェアラブルから加速度計データを使用して18のワークアウトアクティビティを検出することに焦点を当てている。データ分析により、参加者内および参加者間でのウェアラブル指向の不整合が明らかになった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:21:39 GMT)
Sustainable broadcasting in Blockchain Network with Reinforcement Learning [0.6]
推定では、Bitcoinの二酸化炭素排出量は年間平均6600万トンから2600万トンと見積もられている。ブロックチェーンネットワークにおけるブロックブロードキャスト方式を改善する強化学習に基づく効率的な手法を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:24:08 GMT)
Learning deep illumination-robust features from multispectral filter array images [0.5]
マルチスペクトル(MS)スナップショットカメラは、1枚のショットで複数のスペクトルバンドをキャプチャし、各ピクセルが1つのチャネル値しか持たない生画像を生成する。完全定義MS画像のトレーニングは、特にディープニューラルネットワーク(DNN)を用いて、計算集約的に行うことができる本稿では,原画像から識別・照度特性を学習するための独自のアプローチを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:35:41 GMT)
Artificial Intelligence-based Decision Support Systems for Precision and Digital Health [0.5]
我々は、AIによって提供される機会、具体的には強化学習から現在のヘルスケアのトレンドまでについて論じる。我々は適応的な介入の分野に焦点を当てる。この記事は匿名レビューを受けており、"Frontiers of Statistics and Data Science"の巻の書籍章として意図されている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:39:34 GMT)
Towards diffusion models for large-scale sea-ice modelling [0.4]
データ空間におけるガウス分布を検閲して、潜伏拡散モデルを海氷物理学に調整し、モデル化された変数の物理的境界に従うデータを生成する。我々の潜伏拡散モデルは、データ空間で訓練された拡散モデルと同様のスコアに達するが、潜伏写像によって生成されたフィールドは滑らかである。大規模地球系モデリングでは、スムース化の重要な障壁を解決することができる場合、遅延拡散モデルはデータ空間の拡散に比べて多くの利点を持つ。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:35:36 GMT)
No-cloning theorem for 2WQC and postselection [0.4]
2方向量子コンピュータ (2WQC) は標準1WQCの拡張提案である。元の証明を拡張して、この定理がまだ 2WQC とポストセレクションに対して成り立つことを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:35:47 GMT)
KWT-Tiny: RISC-V Accelerated, Embedded Keyword Spotting Transformer [0.4]
本稿では, RISC-V プラットフォーム上での ARM Keyword Transformer (KWT) モデルの量子化とハードウェアアクセラレーションにより, エッジデバイスに対する Transformer モデルの適用について検討する。モデルは369倍小さく、出力クラスを35から2に減らして精度を10%低下させるしかなかった。その結果,Transformerベースのモデルを低消費電力IoTデバイスに移植し,高速化するための有効な方法が示された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:07:21 GMT)
Piecemeal Quantum Telescope: Exponential Precision with Super Robustness and Efficiency [0.4]
ビット・バイ・ビット・イテレーションによる駒型量子望遠鏡。統計的誤差に対する耐障害性は、恒星の角を検出するために少数の入射単光子しか要求しない。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:04:04 GMT)
Dark Side Augmentation: Generating Diverse Night Examples for Metric Learning [0.4]
我々は、GANベースの合成画像生成装置を訓練し、利用可能な日中の画像例を夜間画像に変換する。提案手法は,標準の東京24時間7日の検索ベンチマークにおいて,最先端の結果よりも改善されている。これは、昼と夜の画像に一致する画像のペアを訓練する必要がない。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:21:31 GMT)
ZZU-NLP at SIGHAN-2024 dimABSA Task: Aspect-Based Sentiment Analysis with Coarse-to-Fine In-context Learning [0.4]
DimABSAタスクはレストランレビューに微妙な感情強度予測を必要とする。そこで本稿では,DimABSAタスクに対するBaichuan2-7Bモデルに基づく大まかなインコンテクスト学習手法を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:54:46 GMT)
Multicell-Fold: geometric learning in folding multicellular life [0.3]
細胞群が特定の構造にどのように折り畳むかは、生物がどのように形成されるかを定義する生物学の中心的な問題である。マルチセルの折り畳みや胚発生を予測できる幾何学的深層学習モデルを提案する。我々は,4次元形態素配列アライメントの解釈と局所的な細胞再構成の予測という,2つの重要な課題を達成するために,我々のモデルをうまく利用した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:59:15 GMT)
Pauli path simulations of noisy quantum circuits beyond average case [0.3]
深さ$n$ qubitsのランダム量子回路では、パウリパス法を用いて出力状態からのサンプリングを効率よく行うことができる。我々は、Tゲートであるゲートの分数とノイズ率の相似性について十分な条件を導出し、ノイズがより速い速度で導入された場合、シミュレーションは古典的に容易になることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:58:37 GMT)
Einstein-Podolsky-Rosen-Bohm experiments: a discrete data driven approach [0.3]
実験データから数学的モデルへの一方通行橋の構築は、議論を避けるための別の方法であると考える。まず、アインシュタイン-ポドルスキー-ローゼン-ボーム実験により得られた4つの相関の値に制約を与えるベル型不等式を新たに証明する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:33:52 GMT)
Can foreign exchange rates violate Bell inequalities? [0.3]
経験的データによるベル型不等式の違反は、宇宙が数学的モデルの規則に従って作用していると信じない限り、何の意味も持たない。モデル自由不等式による経験データの解析は、経験データによるベル型不等式違反は、宇宙が数学的モデルの規則に従って機能していると信じない限り、何の意味も持たないという結論を導いた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:48:39 GMT)
MLRegTest: A Benchmark for the Machine Learning of Regular Languages [0.3]
本稿では,MLRegTestと呼ばれるシーケンス分類に基づく機械学習システムのための新しいベンチマークを提案する。これには1,800の正規言語からのトレーニング、開発、テストセットが含まれている。異なる形式言語は、異なる種類の長距離依存を表す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 00:40:17 GMT)
Lieb-Robinson bounds in the continuum via localized frames [0.3]
連続体における相互作用するフェルミオンのダイナミクスについて検討する。まず、局所相互作用の一般クラスに有効であるリーブ・ロビンソン境界を証明する。次に、(フラクタル)量子ホール効果に関連する物理的状況に目を向ける。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:29:06 GMT)
Violating Bell's inequality in gate-defined quantum dots [0.3]
我々は、ゲート定義量子ドットの絡み合いを達成するために、シリコン中のスピン量子ビットの高度なプロトコルを用いる。我々は、読み出し誤差を補正することなく97.17%のベル状態忠実度を示し、2sqrt2の理論的最大値に近いS = 2.731のベル信号でベルの不等式に違反した。測定値は, 温度1.1K, エンタングルメント寿命100mにおいても, 古典的限界を超えている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:31:00 GMT)
Thyroidiomics: An Automated Pipeline for Segmentation and Classification of Thyroid Pathologies from Scintigraphy Images [0.2]
本研究の目的は,甲状腺シンチグラフィー画像を用いた甲状腺疾患分類を向上する自動パイプラインを開発することである。 2,643人の甲状腺シンチグラフィー画像を収集し,DG(diffuse goiter),MNG(multinodal goiter),甲状腺炎(TH)に分類した。パイプラインは、さまざまなクラスにわたるいくつかの分類指標で、医師のセグメンテーションに匹敵するパフォーマンスを示した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:39:07 GMT)
Subthalamic Nucleus segmentation in high-field Magnetic Resonance data. Is space normalization by template co-registration necessary? [0.2]
High-field Magnetic Resonance Imaging (MRI) は視床下核(STN)を低磁場画像よりも詳細に捉える能力の向上を証明している。本稿では,2つの異なるDeep Learning(DL)自動セグメンテーションアーキテクチャの性能の比較を行う。評価結果から, 自然空間におけるセグメンテーションの性能はSTNセグメンテーションよりも優れていた。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:57:19 GMT)
Mamba meets crack segmentation [0.2]
亀裂はインフラに安全リスクをもたらし、見落としられない。 CNNはグローバルなモデリング能力に欠けており、ひび割れの特徴全体の表現を妨げる。本研究では,マンバの特徴を分解する表現能力について検討する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:21:35 GMT)
An instructional lab apparatus for quantum experiments with single nitrogen-vacancy centers in diamond [0.1]
ダイヤモンド中における窒素空孔(NV)中心の量子実験を行う実験装置を提案する。我々は,NV中心の基礎物理を解説し,この装置で実施できる可能性実験の例を示す。ここで説明する装置は、学生が典型的な実験コースの1学期以内で、実験的な制御とデータ分析ソフトウェアをスクラッチから作成することを可能にする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:10:59 GMT)
Coca4ai: checking energy behaviors on AI data centers [0.1]
本稿では,データセンター全体の規模でのエネルギー挙動の簡易かつ軽量なモニタリングという概念の実証について述べる。結果は、効率性の観点から興味深い可能性があり、ユーザーエンゲージメントを生み出すための議論を提供することを示している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:33:10 GMT)
Modeling and Harmonic Balance Analysis of Parametric Amplifiers for Qubit Read-out [0.1]
超伝導ジョセフソン接合の組み合わせに基づく非線形インダクタを商用回路シミュレータでモデル化する方法を示す。また、増幅器性能の信頼性予測にハーモニックバランス(HB)がどのように使用されるかを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:13:39 GMT)
Enhancing Cell Instance Segmentation in Scanning Electron Microscopy Images via a Deep Contour Closing Operator [0.0]
そこで本研究では,SEM画像のインスタンスベースセルセグメンテーションを改善するために,境界線を精製するAI駆動方式を提案する。 CNN COp-Netは、細胞輪郭のギャップに対処するために導入され、不十分な情報や欠落した情報のある領域で効果的に満たされる。 PDX肝芽腫組織からのプライベートSEM画像と公開画像データセットの両方を用いて,細胞境界の精度を高めるためのアプローチの有効性を示した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:32:06 GMT)
g-factor symmetry and topology in semiconductor band states [0.0]
テンソルは、応用磁場に対するクラマーズ縮退状態の反応を決定する。シリコン,ゲルマニウム,フッ化ガリウムにおいて,$bfg_L+bfg_S$の新しい対称性とトポロジー特性を示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:23:12 GMT)
Who Shares Fake News? Uncovering Insights from Social Media Users' Post Histories [0.0]
本稿では,ソーシャルメディア利用者の投稿履歴が,偽ニュース共有の研究にあまり使われていないことを提案する。偽ニュースの共有者を識別し、最も偽ニュースを共有する可能性が最も高いものを予測し、介入を構築するための有望な構成物を特定する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:46:59 GMT)
Virtual Reality and Augmented Reality Security: A Reconnaissance and Vulnerability Assessment Approach [0.0]
様々な業界が、生産性とユーザエクスペリエンスを向上させるために、VR(Virtual Reality)とAR(Augmented Reality)テクノロジーを広く採用している。この体系的な文献レビューは、ARおよびVR技術で使用されるデバイスを特定し、関連する脆弱性を特定することに焦点を当てている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:51:59 GMT)
Universality of the thermodynamics of a quantum-mechanically radiating black hole departing from thermality [0.0]
マチュールとメフタは2023年の重力研究財団エッセイコンクールで3位を獲得した。彼らは、ECOが事象の地平線を持つか否かにかかわらず、任意の極小物体(ECO)が同じBH熱力学特性を持つ必要があることを示した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:22:01 GMT)
Unipa-GPT: Large Language Models for university-oriented QA in Italian [0.0]
Unipa-GPTは、パレルモ大学で学士課程と修士課程を選択する学生を支援するために開発された。実験では,RAG(Retrieval Augmented Generation)アプローチと微調整を併用してシステムを開発した。 Unipa-GPTのアーキテクチャ全体を示し、RAGと微調整システムを比較し、その性能に関する簡単な議論を報告する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:22:30 GMT)
Turing's Test, a Beautiful Thought Experiment [0.0]
チューリング試験とその価値に関する主張と疑問が復活した。もしAIが量子物理学なら、現在までに数匹の"Schr"odinger's"猫が殺されただろう。本稿では, チューリングの1950年版に関するいくつかのオープンな疑問に対して, 新たな考古学的根拠を含む, 豊富な証拠を提示する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:29:32 GMT)
Transformer-based Capacity Prediction for Lithium-ion Batteries with Data Augmentation [0.0]
リチウムイオン電池は、輸送、電子機器、クリーンエネルギー貯蔵の技術の進歩に欠かせない。キャパシティを推定する現在の方法は、キー変数の長期的な時間的依存関係を適切に説明できない。本研究では,電池データにおける長期パターンと短期パターンの両方を考慮した変圧器ベースの電池容量予測モデルを構築した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:21:40 GMT)
Towards an Engineering Discipline for Resilient Cyber-Physical Systems [0.0]
レジリエンスという用語は、正しいサービスを提供しながら予期せぬ入力に対処する能力を指す。私の論文は、レジリエントなサイバー物理システムのためのエンジニアリングの分野を開拓することを目的としています。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:50:01 GMT)
Towards Relational Quantum Field Theory [0.0]
我々は、正の作用素値測度(量子フレーム)に対する作用素値関数(量子場)に対する一般積分理論を開発する。不定時間性の形式は、関係フレームバンドルの文脈における量子状態から生じる。これは一般相対論的および量子物理学の原理を整合する問題に関する新しい視点を提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:24:34 GMT)
TokenSHAP: Interpreting Large Language Models with Monte Carlo Shapley Value Estimation [0.0]
TokenSHAPは、大規模言語モデルを解釈する新しい方法である。これは、協調ゲーム理論から自然言語処理へのシェープリー値の適応である。トークンの重要性を解釈可能で定量的に測定する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:59:07 GMT)
Time correlations in atmospheric quantum channels [0.0]
リモートパーティ間での量子情報の効率的な転送は、大気チャネル上での量子通信にとって重要な課題である。チャネル透過率のランダム変動は、その実践上の大きな障害要因である。本研究では,異なるタイミングでチャネル透過率の相関について検討し,二つの伝送プロトコルに着目した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:13:47 GMT)
The syzygy distinguisher [0.0]
我々は,コード長の複雑さを減らした交代符号とゴッパ符号の区別器を新たに提案する。 McEliece暗号系の解析が指数障壁を破るのはこれが初めてである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:42:06 GMT)
The Efficacy of Conversational Artificial Intelligence in Rectifying the Theory of Mind and Autonomy Biases: Comparative Analysis [0.0]
メンタルヘルス介入における会話型人工知能(CAI)の展開の増加は、認知バイアスの是正と人間とAIの相互作用に対する影響の認識において、その効果を評価する必要がある。本研究の目的は、認知バイアスの同定と修正およびユーザインタラクションへの影響認識における汎用言語モデル(GPT-3.5, GPT-4, Gemini Pro)に対する治療用チャットボットの有効性を評価することである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:38:16 GMT)
The Development of a Comprehensive Spanish Dictionary for Phonetic and Lexical Tagging in Socio-phonetic Research (ESPADA) [0.0]
スペイン語の方言の変種の大部分で使用可能な、スペイン語の包括的な発音辞書(ESPADA)の作成について紹介する。 ESPADAは16か国の単語を表わす628,000以上のエントリを持つ最も完全な辞書である。これは、スペイン語の社会音声学の枠組みにおける方言研究を強化する完全なオープンソースツールを社会音声学研究者に提供することを目的としている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 04:51:33 GMT)
T-count optimization of approximate quantum Fourier transform [0.0]
Toffoliゲートと量子加算器を用いた誤りO(varepsilon)に近似した新しいn-qubit QFT回路を提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:25:59 GMT)
Suppression of noise in separation estimation of optical sources with spatial-mode demultiplexing [0.0]
空間モード分解による超解像は急速に劣化する。本稿では,騒音の破壊的影響を抑制するための公式な手順を提案する。これにより、変位演算子によって生成される特別な種類のノイズに対する超解像の回復が可能となる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:06:37 GMT)
Supporting the Digital Autonomy of Elders Through LLM Assistance [0.0]
我々は、デジタルディビジョンによって分離された高齢者がデジタル自律性を安全に達成するのを助けるための、単純だが未解決のアイデアを提案し、試行する。 LLMは、デジタルディビジョンによって分離された高齢者がデジタル自律性を安全に達成できるよう、必要な支援を提供することができるだろうか?
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:01:45 GMT)
Stronger Entanglement Criteria Based on Quantum Fisher Information [0.0]
局所正規直交可観測(LOO)と対称情報完備正作用素値測度(SIC-POVM)の2つのクラスを考える。 SIC-POVMはエンタングルメント検出においてLOOよりも優れており、量子情報処理におけるSIC-POVMの一般的な優位性を示唆している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:41:52 GMT)
Stochastic parameter optimization analysis of dynamical quantum critical phenomena in long-range transverse-field Ising chain [0.0]
一次元長次元逆場イジングモデルの量子相転移について検討する。シミュレーションでは, 臨界点と普遍性に関する事前知識がなくても, サンプリング対象のパラメータを自動的に決定する。我々は、力学指数に基づいて、後者の2つの普遍性境界を (sigma = 7/4) として決定することに成功した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:45:33 GMT)
State dependence of tunneling processes and thermonuclear fusion [0.0]
量子状態の初期準備に対するトンネルプロセスの感度について論じる。通常の平面波動近似は, 制御エネルギー生産における実用的関係の温度範囲において, 核融合反応を桁違いに過小評価する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:23:58 GMT)
Spontaneous disentanglement of indistinguishable particles [0.0]
ゆがみを生じさせる非線形項について検討する。ボソンとフェルミオンの両方で、非絡み合いは量子相転移を引き起こす。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:54:21 GMT)
Speed-accuracy trade-off for the diffusion models: Wisdom from nonequilibrium thermodynamics and optimal transport [0.0]
拡散モデルと呼ばれる生成モデルとフォッカー・プランク方程式の非平衡熱力学の関連について論じる。拡散モデルにおけるデータ生成の速度と精度のトレードオフ関係である拡散モデルの速度-精度トレードオフを導出する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:19:24 GMT)
Sparks of Quantum Advantage and Rapid Retraining in Machine Learning [0.0]
我々はAdiabatic quantum computer を利用してKolmogorov-Arnold Networks を最適化する。トレーニングサンプルの数とは無関係に、固定サイズのソリューションスペースを作成します。私たちのアプローチは、古典よりも速いトレーニング時間を通じて、量子的優位性を生み出します。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:55:44 GMT)
Slow Light through Brillouin Scattering in Continuum Quantum Optomechanics [0.0]
我々は, 刺激されたブリルアン散乱を利用して, ナノファイバー内部の単一光子のレベルにおいて, 遅い信号場を実現する可能性について検討した。遅い信号は、信号よりも高い周波数のポンプ磁場に対して顕著に増幅され、低いポンプ周波数に対して減衰される。ブリルアン光力学による光の減速は、光量子情報処理とナノフォトニック構造内の量子通信にとって重要なツールとなる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:05:53 GMT)
Simulation-Based Inference with Quantile Regression [0.0]
条件付き量子化回帰に基づく新しいシミュレーションベース推論(SBI)手法であるニューラル量子化推定(NQE)を提案する。 NQEは、各後次元の個々の1次元量子を自己回帰的に学習し、データとそれ以前の後次元に条件付けする。我々はNQEが様々なベンチマーク問題に対して最先端の性能を達成することを実証する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:37:39 GMT)
Self-driving lab discovers principles for steering spontaneous emission [0.0]
放射の制御は、照明、熱放射工学、リモートセンシングにおけるクリーンエネルギーの解決に不可欠である。ここでは、発光中表面から遠距離放射プロファイルを予測するための支配方程式を発見し、この問題に対処する自動運転ラボプラットフォームを提案する。局所屈折率の空間勾配(グレーティング様)と曲率(レンズ様)の両方が自然放出を操る重要な要因であることがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 23:04:49 GMT)
Self-Ordering, Cooling and Lasing in an Ensemble of Clock Atoms [0.0]
アクティブ原子時計は、典型的なフィードバックベースの光学原子時計よりも短期的な安定性と熱ゆらぎに対する堅牢性を提供すると予測されている。光共振器内のクロック原子の逆駆動アンサンブルにおける空間自己組織化とキャビティからのコヒーレント発光について検討した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:54:03 GMT)
Secure quantum-enhanced measurements on a network of sensors [0.0]
サードパーティーのセキュアな量子リモートセンシング(SQRS)プロトコルは、盗聴者に対するセキュリティを保証するリモートロケーションでの量子強調測定を可能にする。このアイデアは、ひとつのパーティが絡み合った状態を使用して、異なるノードのパラメータの関数を直接測定できるノードのネットワークにまで拡張することができる。ここでは,任意の大きさのネットワーク上で量子強度の測定精度とセキュリティを達成するために,絡み合った状態と分離可能な状態の両方を利用するハイブリッドプロトコルにおいて,この問題が克服可能であることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:40:41 GMT)
Retrieval Augmented Deep Anomaly Detection for Tabular Data [0.0]
研究は、このギャップに対処するために、検索強化モデルを導入した。本稿では,変圧器モデルを用いてテクスチャ正規サンプルのマスク特徴を再構成する再構成手法を提案する。 31データセットのベンチマークでの実験では、この再構成に基づく異常検出手法をサンプルサンプル依存で拡張することで、検索モジュールによるパフォーマンスが大幅に向上することが示された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:23:02 GMT)
Removing Spurious Concepts from Neural Network Representations via Joint Subspace Estimation [0.0]
ニューラルネットワークにおけるアウト・オブ・ディストリビューションの一般化は、しばしば素早い相関によって妨げられる。既存の概念除去手法は、モデルの主要なタスクに関連する機能を不注意に排除することで、過熱する傾向にある。本稿では,ニューラルネットワーク表現における2つの低次元部分空間を共同で同定することにより,主タスク概念から突発性を分離する反復アルゴリズムを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:40:55 GMT)
Random Survival Forest for Censored Functional Data [0.0]
本稿では,機能データに対するランダム生存林(RSF)手法を提案する。焦点は、特に、新しい機能的データ構造、CFD(Censored Functional Data)の定義に焦点を当てている。このアプローチにより、機能的生存軌道の正確なモデリングが可能となり、異なるグループ間での生存動態の解釈と予測が改善される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:54:06 GMT)
Ramsey interferometry of nuclear spins in diamond using stimulated Raman adiabatic passage [0.0]
ダイヤモンド中の窒素空孔(NV)色中心における14ドルNの核スピン遷移におけるラマン断熱路(STIRAP)の実験的実験を行った。本研究は,ジャイロスコープや周波数標準などのダイヤモンド系センサの長期安定性向上の道を開くものである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:24:54 GMT)
Qubit-efficient quantum combinatorial optimization solver [0.0]
そこで我々は,候補ビット解をより少ない量子ビットの絡み合った波動関数にマッピングすることで,制限を克服する量子ビット効率のアルゴリズムを開発した。このアプローチは、短期的な中間スケールと将来のフォールトトレラントな小規模量子デバイスに有効である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:02:13 GMT)
Quantum optimization using a 127-qubit gate-model IBM quantum computer can outperform quantum annealers for nontrivial binary optimization problems [0.0]
ゲートモデル量子コンピュータにおける二項最適化問題に対する量子解法を提案する。最大127キュービットの問題の正しい解を一貫して提供する。我々はこの解法をIBM量子コンピュータ上でベンチマークする。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:25:16 GMT)
Quantum LDPC codes from intersecting subsets [0.0]
本稿では,コンポーネントCSSコードとサブセットの2つのコレクションから,CSSコードの量子構成を紹介する。結果として得られた符号は、並列化可能なエンコーディングとシンドローム測定回路を持ち、シンドローム測定に冗長性が組み込まれている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:56:56 GMT)
Quantum Detection of Recurrent Dynamics [0.0]
このような近似的再帰を検出するための簡単な量子アルゴリズムについて述べる。隠れたテンソル構造は、演算子レベルの自発的対称性の破れの高エネルギー文脈で両方現れることが観察されている。我々は,これらの構造を探索し,関連するスペクトル情報を検出することの難しさについて,いくつかの知見を収集する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:13:45 GMT)
Quantum Computing for Phonon Scattering Effects on Thermal Conductivity [0.0]
近年の研究では、マルチフォノン散乱過程が材料の熱伝導率に大きく影響していることが示されている。本研究では、ノイズ中間スケール量子時代(NISQ)量子計算能力を利用して、これらの課題に対処するための量子シミュレーションの可能性を検討する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:20:51 GMT)
Quantum Circuits for the heat equation with physical boundary conditions via Schrodingerisation [0.0]
本稿では、物理境界条件を持つ偏微分方程式(PDE)の量子シミュレーションのための量子回路の明示的設計について検討する。時間依存的物理的境界条件から生じる不均一項を扱うための2つの方法を提案する。次に、[CJL23]から量子シミュレーション手法を適用し、結果の非自律系を1次元の自律系に変換する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:52:14 GMT)
Quantifying nonclassicality of mixed Fock states [0.0]
ボソニックモードの非古典的状態は、量子化技術にとって重要な資源である。操作資源理論 (ORT) 測定により, 混合フォック状態におけるボソニックモードの非古典性を定量化する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:48:51 GMT)
Public Perception of AI: Sentiment and Opportunity [0.0]
我々は、世界中の4大陸10カ国で1万人の回答者を対象に行われた調査から、AIに対する大衆の認識の結果を提示する。その結果、現在AIが世界を変えると信じている回答者の同じ割合が、私たちが知っているように、AIを厳しく規制する必要があると信じていることがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:11:28 GMT)
Process tensor distinguishability measures [0.0]
量子コムの一般用途でよく用いられる2種類の識別可能性尺度を解析する。第1級はChoi divergencesと呼ばれ、重要なデータ処理の不等式を満足していないのに対し、第2級は一般発散(Generalized divergences)と呼ぶ。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:19:36 GMT)
Problems in AI, their roots in philosophy, and implications for science and society [0.0]
AI技術とその利用の哲学的側面にもっと注意を払わなければならない。この欠陥は一般的に、知識の成長に関する哲学的誤解と結びついていると論じられている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:38:54 GMT)
Perturbation theory for nonlinear Schrodinger equations [0.0]
このパワー系列は、非線形項の強度を表すパラメータが閾値よりも絶対値が低いときに収束することが証明される。これは非線形シュロディンガー方程式に対する定常解を与える。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:40:59 GMT)
Optimization of breeding program design through stochastic simulation with evolutionary algorithms [0.0]
本研究では,カーネルレグレッションの概念に基づく最適化フレームワークを提案する。鍵となる考え方は、育種プログラムの潜在的なパラメータ化のセットを検討し、シミュレーションに基づいてそれらの性能を評価し、これらの出力を使用して新しいパラメータ化を導出することである。進化的アルゴリズムはSnakemakeパイプラインで実装され、大規模分散コンピューティングプラットフォームでの効率的なスケーリングを可能にした。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:10:20 GMT)
Optimization complexity and resource minimization of emitter-based photonic graph state generation protocols [0.0]
フォトニックグラフ状態は、測定と融合に基づく量子コンピューティング、量子ネットワーク、センシングに重要である。我々は局所的にエンタングゲートの数を最小化し、中程度の大きさのランダムグラフに対する単純スキームと比較して75$%まで削減する。任意の大きさのリピータグラフ状態の未符号化および符号化を行うために最適なエミッションオーダと回路が見つかる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:29:52 GMT)
Optimal Layout Synthesis for Deep Quantum Circuits on NISQ Processors with 100+ Qubits [0.0]
スケーラブルなレイアウト合成は、NISQプロセッサにとって非常に重要である。本稿では,1つのSWAPとCNOTのグループを各ステップで適用する並列計画に基づくSAT符号化を提案する。初めて、8, 14, 16量子ビット回路を最大17個のSWAPを持つ54, 80, 127量子ビットプラットフォームに最適にマッピングできる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:00:02 GMT)
On Strong Bounds for Trotter and Zeno Product Formulas with Bosonic Applications [0.0]
バナッハ空間上の強作用素位相において量的境界が証明できる仮定について議論する。我々は、オルンシュタイン・ウレンベック半群や多光子駆動散逸を含む自然ボソニックな例を提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:07:51 GMT)
Non-relativistic tachyons: a new representation of the Galilei group [0.0]
我々はガリレイ群の一貫した非標準表現に到達する。対応する量子(および古典)理論は、その基本となる相対論的理論と共通している。新しい表現によって記述されるタキオンオブジェクトは、標準的な意味ではローカライズできない。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:26:40 GMT)
Non-Hermitian Origin of Wannier Localizability and Detachable Topological Boundary States [0.0]
非エルミート境界状態を分離可能な位相境界状態とみなす。固有非エルミート位相が必然性スペクトルフローをもたらすことを示す。この接続と$K$-理論に基づいて、ワニエローカライザビリティと分離可能な位相境界状態の分類を完成させる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:25:40 GMT)
Non-Abelian Hopf-Euler insulators [0.0]
3次元の非アベリアトポロジカル絶縁体は、インスレータ(mathcalPT$)反転対称性によって保護された単一のバルクホップ指数を持つ。このような系は自然に3次元ブリルアンゾーンの結節構造を実現する。これらのシステムのバンド間のギャップを開くことで、完全なフラグの位相が得られ、3バンドのマルチギャップポントリャーギン不変量を示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:51:21 GMT)
Multiparty Spohn's theorem for a combination of local Markovian and non-Markovian quantum dynamics [0.0]
我々はマルコフ熱浴と非マルコフ熱浴の組み合わせに局所的に連結された2つ以上の量子系に対するゴリーニ・コサコフスキー・スダルシャン・リンドブラッドのようなマスター方程式を得る。マルコフ熱浴と非マルコフ熱浴を混合した複数の量子系を包含するように拡張する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 21:28:54 GMT)
Modelling brain connectomes networks: Solv is a worthy competitor to hyperbolic geometry! [0.0]
我々は、Euclidean、Spherical、Hyperbolic、Solv、Nil、および製品ジオメトリにコネクトームを埋め込むことができるSimulating Annealingに基づく埋め込みアルゴリズムを提案する。以上の結果から,3次元双曲型埋め込みは多くの場合,最良の結果をもたらすが,Solv埋め込みは合理的に機能することが示唆された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 22:36:04 GMT)
Meta-Learning and representation learner: A short theoretical note [0.0]
メタ学習は機械学習のサブフィールドであり、目標は様々なタスクから学習できるモデルとアルゴリズムを開発することである。特定のタスクを学習することに焦点を当てた従来の機械学習手法とは異なり、メタラーニングは、過去のタスクからの経験を活用して将来の学習を強化することを目的としている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:45:22 GMT)
Memory in quantum processes with indefinite time direction and causal order [0.0]
時間方向と因果順序が不確定な量子過程における動的メモリ効果の出現について検討する。量子時間反転も量子スイッチも、考慮された位相共変チャネルのメモリを誘導できないことを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:35:39 GMT)
Measuring a "Probability" $> 1$ [0.0]
量子測度理論(QMT)は、量子干渉を組み込むために確率測度の概念を一般化する。ここでは,QMTの文脈における2サイトホッパーについて検討する。光学実験では,アンシラに基づくイベントフィルタリング方式を用いて,特定のホッパーイベントの測定を行う。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:09:47 GMT)
Measurement-device agnostic quantum tomography [0.0]
本研究では,実測値と推定値とのミスマッチが,この特性の精度を制限していることを示す。これらのアーティファクトを使用して、ミスマッチを検出し、定量化し、実際の測定演算子に関する情報を得る。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:39:22 GMT)
Magic transition in measurement-only circuits [0.0]
我々は、クリフォードと非クリフォード測定の競合するタイプの量子回路を用いて、測定専用量子回路においてマジックを研究する。我々は,この回路における魔法の遷移を,大規模数値シミュレーションを用いて検討した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:00:07 GMT)
Localization Driven Quantum Sensing [0.0]
量子行列体(QMB)系における非局在化-局在化遷移は、パラメータ推定における量子強調感度を達成するための魅力的な量子資源であることを示す。我々は、パラメータシフトに対する近遷移QMB状態の脆弱性を利用して、効率的なセンシングツールを考案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 03:23:32 GMT)
Leveraging Large Language Models to Geolocate Linguistic Variations in Social Media Posts [0.0]
大きな言語モデル(LLM)を活用することで、イタリア語で書かれたツイートをジオローカライズするという課題に対処する。我々のアプローチは、これらの地理的局在化の側面を同時に予測するために、訓練済みのLLMを微調整することである。この研究は、バーティノロ国際スプリングスクール2024のLarge Language Modelsコースの一部として実施されている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:54:35 GMT)
Landauer principle and the second law in a relativistic communication scenario [0.0]
ランダウアーの原理と熱力学の第二法則は相対論的コミュニケーションタスクに適用される。我々は、ボブがそもそもその情報を得るために費やさなければならないエネルギーの限界を確立する。この境界は時空計量と通信チャネルの性質の関数である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:56:35 GMT)
KANQAS: Kolmogorov-Arnold Network for Quantum Architecture Search [0.0]
量子状態準備と量子化学におけるコルモゴロフ・アルノルドネットワーク(KAN)の実用性を評価する。量子状態の準備において、我々の結果は、ノイズのないシナリオにおいて、マルチキュービットの最大絡み合う状態を生成する最適量子回路構成の確率は、マルチレイア知覚(MLP)よりも2〜5倍高いことを示している。量子化学問題に対処するために,従来の構造ではなく,KAN(Curriculum Reinforcement Learning)とKAN構造を統合することで,最近提案されたQASアルゴリズムを強化する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:00:43 GMT)
InLUT3D: Challenging real indoor dataset for point cloud analysis [0.0]
本稿では,屋内環境におけるシーン理解の分野を推し進めるための総合的なリソースであるInLUT3Dポイントクラウドデータセットを紹介する。このデータセットは、高解像度レーザーベースの点雲と手動ラベリングを特徴とするロドス工科大学のW7学部ビル内の様々な空間をカバーしている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:56:31 GMT)
Improving probabilistic forecasts of extreme wind speeds by training statistical post-processing models with weighted scoring rules [0.0]
閾値重み付き連続ランク確率スコア(twCRPS)を用いたトレーニングは、後処理モデルの極端なイベント性能を向上させる。極端事象の確率論的予測の性能が向上し,分布物体の予測性能が低下する分布体テールトレードオフが発見された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:07:52 GMT)
Impacts of Anthropomorphizing Large Language Models in Learning Environments [0.0]
大きな言語モデル(LLM)は、学習環境において、学習仲間として、あるいは家庭教師として、教育をサポートするために、ますます使われている。本研究の目的は,学習環境におけるLLMの人為的形態化が教育理論に与える影響について考察することである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:28:54 GMT)
Image Synthesis with Graph Conditioning: CLIP-Guided Diffusion Models for Scene Graphs [0.0]
シーングラフから画像を生成する新しい手法を提案する。トレーニング済みのテキスト・ツー・イメージ拡散モデルとCLIPガイダンスを利用して、グラフ知識を画像に変換する。実験により,本手法は標準ベンチマークにおける既存手法よりも優れていることがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 07:38:19 GMT)
ILiAD: An Interactive Corpus for Linguistic Annotated Data from Twitter Posts [0.0]
英語のTwitter投稿から言語コーパスの開発と展開について述べる。主な目標は、言語分析のための完全な注釈付き英語コーパスを作ることであった。形態や構文に関する情報に加えて,トークン化やレムマ,n-gramなどのNLP機能も含んでいます。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 04:48:04 GMT)
High-Fidelity Electron Spin Gates in a Scalable Diamond Quantum Register [0.0]
我々は、ダイヤモンド中のNVスピン間の絡み合いゲートを堅牢で容易に実装する。環境条件下では,F=(96.0 pm 2.5)=%のレコードゲート忠実度を示す。我々の支配的誤差の同定は、誤差補正しきい値を超えたNV-NVゲートへの道を開く。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:47:33 GMT)
Ground state of a mixture of SU($3$) fermions and scalar bosons [0.0]
一次元のスカラーボソンとSU($3$)フェルミオンからなる系を探索する。局所的な種内相互作用と種間相互作用のみを考慮すると、この系はボース・フェルミ・ハバード・ハミルトンによって記述される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:00:02 GMT)
Fever Detection with Infrared Thermography: Enhancing Accuracy through Machine Learning Techniques [0.0]
赤外線サーモグラフィー(IRT)は体温を測定するための重要な非接触法であることが証明されている。従来の非接触赤外線温度計(NCIT)は、読書において大きな変動を示すことが多い。そこで我々は,温度測定の精度と信頼性を高めるために,機械学習アルゴリズムをIRTと統合した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 00:05:31 GMT)
Fast computation of 2-isogenies in dimension 4 and cryptographic applications [0.0]
次元 $ggeq 1$ のアーベル多様体とレベル $n=2$ のtheta-coordinates の間の 2$-isogenies の連鎖を計算するアルゴリズムを提案する。開始曲線の自己準同型環が、ラップトップ上で数秒以内に未知である場合には、SIDHに対して完全なキーリカバリ攻撃を実行することができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:19:20 GMT)
Fast and Effective Weight Update for Pruned Large Language Models [0.0]
大きな言語モデル(LLMs)のプルーニングは、その巨大なサイズのため、難しい作業である。最近のアプローチでは、微調整を完全に無視するか、レイヤワイド更新を試みた。乗算器の交互方向法に基づく切削層に対する高速かつ効率的な重み更新アルゴリズムを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:34:04 GMT)
FAIR evaluation of ten widely used chemical datasets: Lessons learned and recommendations [0.0]
この文書は、北米とヨーロッパ(EU)市場で見つかった(有害な)物質に関するデータを拡散するデータベースに焦点を当てている。目標は、これらの物質に関する公開データのFAIRnessを分析することである。手動と自動の2つの補完的なアプローチを実装している。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:26:41 GMT)
Extracting Structured Insights from Financial News: An Augmented LLM Driven Approach [0.0]
本稿では,Large Language Models(LLMs)を活用した財務情報処理手法を提案する。本稿では,関連企業チッカーを生のニュース記事コンテンツから抽出し,企業レベルで感情分析を行い,要約を生成するシステムを提案する。当社は、ニュース記事から詳細な企業ごとの感情分析を提供し、市場参加者に利用可能な情報の深みを高めた最初のデータ提供者です。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:47:31 GMT)
Extensive Long-Range Entanglement at Finite Temperatures from a Nonequilibrium Bias [0.0]
一般電荷およびエネルギー保存不純物を含む一次元格子上の自由フェルミオンの絡み合い特性について検討する。これらの測定値は,各サブシステム間の重なり合いと,他方のミラー画像との重なり合いによって線形にスケールすることを示す。負性率とR'enyi版の相互情報の単純な比例関係は、0温度で保持することが観察されるが、有限温度で分解される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 19:31:17 GMT)
Estimating Probability Densities with Transformer and Denoising Diffusion [0.0]
本研究では,トランスフォーマー上の拡散ヘッドを用いた確率モデルのトレーニングにより,確率密度の推定が妥当であることを示す。当社のTransformer+Denoising Diffusionモデルについて、天文学的な観測と、銀河内の恒星のラベル測定の大規模なデータセットでトレーニングすることで説明します。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:10:41 GMT)
Error correction for encoded quantum annealing revisited [0.0]
パリティ符号化されたスピン系は、Sourlas-Lechner-Hauke-Zoller (SLHZ) と呼ばれるもので、誤り訂正能力を示す。本稿では,SLHZシステムの読み出しにおける誤りを除去する,非常に単純な復号アルゴリズムを提案する。我々の新しいアルゴリズムはLDPC符号のビットフリップアルゴリズムと考えることができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:47:00 GMT)
Entanglement in quenched extended Su-Schrieffer-Heeger model with anomalous dynamical quantum phase transitions [0.0]
焼成拡大Su-Schrieffer-Heeger(SSH)モデルにおける動的量子相転移(DQPT)について検討した。臨界モータの数が前焼成相と後焼成相の巻成数差を超える異常DQPTが観察される。平衡モデルの位相を2つのクラスに分類し、この2つのクラス内および横断的なクエンチを含む絡み合いの時間的進化の特徴的な特徴を同定した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 02:35:34 GMT)
Entanglement Generation and Stabilization by Coherent Collisions [0.0]
反復電子による繰り返し衝突は、2つのリモートスピン量子ビットを絡み合った状態に散逸的に駆動することができる。どちらのクビットとのコヒーレントスピン交換は絡み合いの発生を促進する。我々のモデルは単一電子源を用いて実験的に実装できる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:12:28 GMT)
Enhancing Mass Customization Manufacturing: Multiobjective Metaheuristic Algorithms for flow shop Production in Smart Industry [0.0]
本研究は,工場生産計画における必要な適応に焦点を当てたものである。フローホップに対処するための効率的な進化的アルゴリズムを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:13:23 GMT)
Emulating quantum computing with optical matrix multiplication [0.0]
光コンピューティングは光の速度を利用してベクトル行列演算を効率的に行う。量子力学原理を用いてフォトニック行列乗法を定式化する。我々はよく知られたアルゴリズム、すなわちDeutsch-Jozsaのアルゴリズムを実証する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:08:56 GMT)
Early Recognition of Parkinson's Disease Through Acoustic Analysis and Machine Learning [0.0]
パーキンソン病(英: Parkinson's Disease、PD)は、音声を含む運動機能と非運動機能の両方に大きな影響を及ぼす進行性神経変性疾患である。本稿では,音声データを用いたPD認識手法の総合的なレビューを行い,機械学習とデータ駆動アプローチの進歩を強調した。ロジスティック回帰、SVM、ニューラルネットワークなど、さまざまな分類アルゴリズムが検討されている。以上の結果から,特定の音響特性と高度な機械学習技術は,PDと健常者の間で効果的に区別できることが示唆された。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 23:24:02 GMT)
Dynamics of Ideological Biases of Social Media Users [0.0]
オンラインプラットフォーム全体の世論グループの進化は,世論を抱きたいという欲求に支えられていることを示す。われわれはTwitterとParlerという2つのソーシャルメディアに焦点を当て、ユーザーの政治的偏見を追跡した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 16:08:22 GMT)
Dressed to Gamble: How Poker Drives the Dynamics of Wearables and Visits on Decentraland's Social Virtual World [0.0]
Decentralandはブロックチェーンベースのソーシャルバーチャルワールドで、コミュニティが所有するクリエイティブなスペースだと言われている。ユーザーは、アバターをカスタマイズするためのウェアラブル、仮想衣料品を作成して公開することができる。 Decentral Games(DG)は、世界で有名なカジノを2つ所有する単一のプロジェクトだが、これまでで最大のウェアラブル製品だ。そこで本研究では,DGとICEポーカーが分散ウェアラブルの全体的ダイナミクスや世界訪問にどのように影響するかを総合的に調査する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:37:53 GMT)
Dirac Theory as a Relativistic Flow [0.0]
電荷ポテンシャル流の流体力学ラグランジアンからシュル・オーディンガー方程式を導出する方法を示す。量子的振る舞いは、古典ラグランジアンに追加されたフィッシャー情報項に由来する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 12:38:21 GMT)
Development of Multistage Machine Learning Classifier using Decision Trees and Boosting Algorithms over Darknet Network Traffic [0.0]
本研究では,ネットワークトラフィック分類のためのロバストな解を提案する。 AdaBoostやGradient Boostingといったブースティングアルゴリズムを決定木と組み合わせることで,ネットワークトラフィック分類のための堅牢なソリューションを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:10:26 GMT)
Container Morphisms for Composable Interactive Systems [0.0]
私は依存型を使ってリクエスト/レスポンスが一致することを保証し、このアイデアがコンテナのより広いコンテキストとそれらの射にどのように適合するかを示しています。コンテナのカテゴリとそのモノノイド製品を使って、関数型プログラミングを模倣するコンテナ上のモナドを定義し、Kleeneスターを使って、同じシステムでステートフルなプロトコルを記述します。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 23:42:43 GMT)
Concurrent VQE for Simulating Excited States of the Schwinger Model [0.0]
本研究では, 同時変動量子固有解法(cVQE)のシュウィンガーモデルの励起状態の計算への応用について検討する。本研究は,1,2,3個のアシラリー量子ビットを持つ最小2,4,8個の固有状態を,背景電界の消滅と消滅の両方のために効率的に取得する方法を示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 13:42:02 GMT)
Comprehensive Study on Performance Evaluation and Optimization of Model Compression: Bridging Traditional Deep Learning and Large Language Models [0.0]
世界中のコネクテッドデバイスの数の増加は、計算能力の低いローカルデバイスに容易に展開できる圧縮モデルを保証する。画像分類,オブジェクト検出,言語モデル,生成モデルに基づく問題文に使用される一般的なディープラーニングモデルに対して,量子化とプルーニングの両方を実装した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:20:53 GMT)
Comprehensive Overview of Reward Engineering and Shaping in Advancing Reinforcement Learning Applications [0.0]
本稿では,強化学習アルゴリズムの効率性と有効性を高めるために,報酬工学と報酬形成の重要性を強調する。強化学習の大幅な進歩にもかかわらず、いくつかの制限が続いた。主要な課題の1つは、多くの現実世界のシナリオにおける報酬のまばらで遅れた性質である。実世界の環境を正確にモデル化することの複雑さと強化学習アルゴリズムの計算要求は、依然としてかなりの障害である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:28:12 GMT)
Comparing Algorithms for Loading Classical Datasets into Quantum Memory [0.0]
古典的データセットを量子メモリにロードするアルゴリズムを比較した。 5つの属性に基づく状態準備アルゴリズムの評価を行った。また、視覚的に3つの指標(回路深度、キュービット数、古典ランタイム)を比較する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:43:18 GMT)
Clustering of conditional mutual information and quantum Markov structure at arbitrary temperatures [0.0]
最近の研究では、単純な二部相関関数によって特徴づけられるエキゾチックな量子相が明らかにされている。これらの相では、三部構造相関から生じる長距離の絡み合いが中心的な役割を果たす。また, 低温でも, 広範囲に分布する三部体の絡み合いは, 長距離体制では生じないことが明らかとなった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:20:47 GMT)
Closed-form expressions for smeared bi-distributions of a massless scalar field: non-perturbative and asymptotic results in relativistic quantum information [0.0]
時空領域の量子場と相互作用する局所量子系について検討する。ガウス時空領域で相互作用するプローブによって得られる絡み合いを見つける。 2つの隙間のない検出器の場合を再検討し、相互作用領域間に2つのスミアドウェイ信号が存在する場合、検出器が絡み合うことができることを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:09:22 GMT)
Classification and reconstruction for single-pixel imaging with classical and quantum neural networks [0.0]
本研究では,ハダマール基底パターンを用いた1画素イメージング実験を行った。これらの測定値に基づいて画像の分類と再構成を行うアルゴリズムを開発した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:56:07 GMT)
Capacity of entanglement and volume law [0.0]
絡み合いの容量エントロピーが広範囲になる一定の設定では容積法に従う我々は,この量の体積法スケーリングに関する解析的および数値的な証拠を,異なる設定で提示する。本研究は,モデルに対する一貫したホログラフィック双対の存在について,本研究の結果のいくつかの意味について論じる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:10:06 GMT)
Breadth-first graph traversal union-find decoder [0.0]
我々はその実装を単純化し、潜在的な復号速度の利点を提供するUnion-findデコーダの変種を開発する。これらの手法が、非トポロジカル量子低密度パリティチェック符号のデコードにどのように適用できるかを示す。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:54:45 GMT)
Automated Road Safety: Enhancing Sign and Surface Damage Detection with AI [0.0]
近年のAIの進歩により,道路面や道路標識の異常を検知できる高度監視システムの開発が可能となった。本稿では,高度深層学習技術を用いた交通標識と道路表面損傷の検出・分類による道路安全向上のための革新的なアプローチを提案する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 06:22:36 GMT)
An Exponential Mixing Condition for Quantum Channels [0.0]
量子チャネルのマルコフ・ドブルシン定数がゼロを超えると指数混合挙動を示すことが証明される。また、ユニタリ作用素の有限群に付随する混合ユニタリチャネル群のエルゴード性も解析する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 20:18:44 GMT)
An Experimental Study on the Rashomon Effect of Balancing Methods in Imbalanced Classification [0.0]
本稿では,ラショモン効果を用いた予測多重度に及ぼすバランス法の影響について検討する。データ中心のAIにおける盲点モデル選択は、ほぼ同じ精度のモデルのセットからリスクが高いため、非常に重要です。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:25:39 GMT)
An Ad-hoc graph node vector embedding algorithm for general knowledge graphs using Kinetica-Graph [0.0]
本稿では,知識グラフ表現から一般的なグラフノードの埋め込みを生成する方法について論じる。埋め込み空間は、局所親和性とリモート構造関連性の両方を模倣するいくつかのサブ機能から構成される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:43:10 GMT)
Algebraic quantum field theory: objectives, methods, and results [0.0]
代数量子場理論は相対論的量子物理学の一般的な数学的枠組みである。その枠組みでは、粒子の任意の配置上の真空から熱平衡状態や非平衡状態まで、理論の全体状態空間がカバーされている。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 11:27:35 GMT)
Algebraic anti-unification [0.0]
抽象は人間や人工知能にとって鍵であり、他の異なる物体や状況で共通の構造を見ることができる。アンチ・ユニフィケーション(英: anti-unification、あるいは generalization)は、理論計算機科学とAIによる抽象研究のテキストである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 09:49:46 GMT)
Affordance Labeling and Exploration: A Manifold-Based Approach [0.0]
本研究は,対象分類データセットに基づいて訓練された既存ネットワークを用いて,対象物価の探索に焦点をあてる。訓練済みのネットワークを使用して、特別な層を必要とせず、手頃なラベルを識別する。サブスペースクラスタリングおよび多様体曲率法は、アベイランスラベルの認識において明確な視点を提供するために試験される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 08:46:20 GMT)
Adaptive Extensions of Unbiased Risk Estimators for Unsupervised Magnetic Resonance Image Denoising [0.0]
ディープニューラルネットワーク(DNN)のイメージデノナイジングへの応用は、従来のデノナイジング手法に挑戦している。本稿では,ガウスノイズとポアソンノイズの関連したMRIデータに対して,これらの手法を包括的に評価する。我々の主な貢献は、SURE、eSURE、特に医療画像のためのePUREフレームワークの効果的適応と実装である。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:04:21 GMT)
AI for Handball: predicting and explaining the 2024 Olympic Games tournament with Deep Learning and Large Language Models [0.0]
深層学習モデルを用いて,2024年オリンピックのハンドボールトーナメントの結果を予測する。このモデルは、説明可能なAI(xAI)技術と組み合わせて、各マッチの結果に影響を及ぼす主要な要因に関する洞察力のある情報を抽出することができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 18:54:06 GMT)
A spatiotemporal deep learning framework for prediction of crack dynamics in heterogeneous solids: efficient mapping of concrete microstructures to its fracture properties [0.0]
深層学習フレームワークは, コンクリートメソ構造中のフラクチャーの2次元フルフィールド予測を行うことができる。メソ構造の平均応力-ひずみ曲線を予測できる畳み込みニューラルネットワークを開発した。 UNetモデリングフレームワークは、スキップ接続を持つエンコーダ-デコーダセクションで構成され、ディープラーニングサロゲートモデルとして使用される。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 14:28:46 GMT)
A simple and fast C++ thread pool implementation capable of running task graphs [0.0]
筆者らは,タスクグラフの実行が可能な,シンプルで高速なC++スレッドプールの実装を提案する。実装はGitHubで公開されており、https://github.com/dpuyda/scheduling.comを参照してほしい。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:18:26 GMT)
A novel translationally invariant supersymmetric chain with inverse-square interactions: partition function, thermodynamics and criticality [0.0]
我々は、ルート系に直接関連しない長距離相互作用を持つ翻訳不変su$(m|n)$スピン鎖の新しい族を導入する。我々はこれらのモデルの対称性を研究し、この種のシステムのボソン-フェルミオン双対性特性の存在を確立した。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:25:57 GMT)
A frame-bundle formulation of quantum reference frames: from superposition of perspectives to superposition of geometries [0.0]
我々は、量子参照フレーム(QRF)のコアアイデアの完全な幾何学的定式化を可能にする。 QRFは、各時空点における観測者の時間と空間に対する認識について不確実性を符号化する。 QRFは局所的に、セクション全体ではなくイベントのベースに振幅をもたらすことができる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:21:38 GMT)
A backgate for enhanced tunability of holes in planar germanium [0.0]
平面半導体ヘテロ構造は多用途デバイス設計を提供し、スケーラブルな量子コンピューティングの候補として有望である。平面系は、閉じ込めポテンシャルの形状が密度に直接関係しているという事実によって依然として制限されている。平面ゲルマニウムヘテロ構造に対するバックゲートの実装を成功させる。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 15:29:17 GMT)
A Network Analysis Approach to Conlang Research Literature [0.0]
本稿では,コンラング研究に関する文献を総合的に理解することを目的としている。 1927年から2022年までの2300以上の学術出版物を分析したところ、エスペラントは最も文書化されたコンラングであることがわかった。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 04:40:45 GMT)
A Nanomechanical Atomic Force Qubit [0.0]
原子間力を用いたシリコンナノメカニカル量子ビットの実現について提案する。提案したqubitは60MHzで動作し、シングルフォノンレベルのアンハーモニシティは5MHzである。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 05:30:44 GMT)
A Mechanism for Optimizing Media Recommender Systems [0.0]
メディアソースがコスト関数におけるオーバーリーチの影響を考慮すると、最適な解決策が得られます。各消費者に最適な分布を生成するための実用的なアルゴリズムを提供する。
論文参考訳（メタデータ） (Mon, 22 Jul 2024 17:20:14 GMT)