xGen-MM (BLIP-3): A Family of Open Large Multimodal Models [157.4] 本稿では,LMM(Large Multimodal Models)を開発するためのフレームワークであるxGen-MMを紹介する。
このフレームワークは、慎重にキュレートされたデータセット、トレーニングレシピ、モデルアーキテクチャ、結果のLMMスイートで構成されている。
私たちのモデルは、シングルイメージとマルチイメージのベンチマークを含む、さまざまなタスクにわたって厳格な評価を受けています。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 05:03:34 GMT)
AIM 2024 Challenge on Compressed Video Quality Assessment: Methods and Results [132.2] 本稿では,ECCV 2024における画像操作の進歩(AIM)ワークショップと共同で開催されている圧縮映像品質評価の課題について述べる。
この課題は、様々な圧縮標準の14コーデックで符号化された459本の動画の多様なデータセット上で、VQA法の性能を評価することであった。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:01:16 GMT)
RecurrentGemma: Moving Past Transformers for Efficient Open Language Models [103.6] Googleの新しいGriffinアーキテクチャを使ったオープン言語モデルのファミリーであるRecurrentGemmaを紹介する。
Griffinは、言語における優れたパフォーマンスを達成するために、線形反復と局所的な注意を組み合わせる。
2Bパラメーターと9Bパラメーターを含むモデルのサイズを2つ提供し、両方のモデルに対して事前訓練および命令チューニングのバリエーションを提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:05:42 GMT)
When ControlNet Meets Inexplicit Masks: A Case Study of ControlNet on its Contour-following Ability [93.2] ControlNetは、ユーザーが提供するマスクの正確な輪郭と密に一致したコンテンツを作成するのに長けている。
これらのマスクがノイズを含む場合、非専門家で頻繁に発生するため、出力には不要なアーティファクトが含まれる。
筆者らはまず, 深部分析により, 種々の劣化レベルを有する非説明マスクの影響を抑える上で重要な役割について述べる。
不特定マスクによる制御性を高めるため、劣化推定器と形状優先変調ブロックからなる高度な形状認識制御ネットを考案した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:11:40 GMT)
Eagle: Exploring The Design Space for Multimodal LLMs with Mixture of Encoders [89.4] 本研究では,視覚エンコーダと解像度の混合を用いたマルチモーダル大言語モデル(MLLM)の設計空間について検討する。
我々の発見は、様々な既存の戦略に共通するいくつかの基本原則を明らかにし、合理化されているが効果的な設計アプローチへと繋がる。
その結果生まれたMLLMのファミリーであるEagleは、MLLMベンチマークで他の主要なオープンソースモデルを上回っている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:59:31 GMT)
LogicGame: Benchmarking Rule-Based Reasoning Abilities of Large Language Models [87.5] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な能力を示し、複雑な問題解決能力を示している。
LLMの包括的なルール理解、実行、計画能力を評価するために設計された新しいベンチマークであるLogicGameを紹介する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:16:41 GMT)
Flextron: Many-in-One Flexible Large Language Model [85.9] 我々は,フレキシブルモデル展開をサポートするネットワークアーキテクチャとポストトレーニングモデル最適化フレームワークであるFlextronを紹介する。
本稿では,既存の学習用LDMをFlextronモデルに変換するための,サンプル効率のよいトレーニング手法と関連するルーティングアルゴリズムを提案する。
我々は、複数のエンドツーエンドトレーニングされた変種や他の最先端の弾性ネットワークよりも優れた性能を示し、これらは全て、オリジナルの事前訓練と比較してわずか7.63%のトークンを消費する単一の事前訓練ランで実現している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:26:03 GMT)
CTRQNets & LQNets: Continuous Time Recurrent and Liquid Quantum Neural Networks [76.5] Liquid Quantum Neural Network (LQNet) とContinuous Time Recurrent Quantum Neural Network (CTRQNet) を開発した。
LQNetとCTRQNetは、バイナリ分類によってCIFAR 10で40%の精度向上を実現している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 00:56:03 GMT)
Brain3D: Generating 3D Objects from fMRI [76.4] 被験者のfMRIデータを入力として利用する新しい3Dオブジェクト表現学習手法であるBrain3Dを設計する。
我々は,人間の視覚系の各領域の異なる機能的特徴を,我々のモデルが捉えていることを示す。
予備評価は、Brain3Dがシミュレーションシナリオで障害した脳領域を正常に識別できることを示唆している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:07:06 GMT)
LLaVA-VSD: Large Language-and-Vision Assistant for Visual Spatial Description [73.8] ビジュアル空間記述は、画像内のオブジェクト間の空間的関係を記述するテキストを生成することを目的としている。
LLaVA-VSDは視覚空間関係の分類、記述、オープンな記述のために設計されている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:05:01 GMT)
Uniformly Safe RL with Objective Suppression for Multi-Constraint Safety-Critical Applications [73.6] 広く採用されているCMDPモデルは予測のリスクを制約しており、長い尾の州で危険な行動を起こす余地がある。
安全クリティカルな領域では、そのような行動は破滅的な結果をもたらす可能性がある。
本稿では,目標を最大化するタスク報酬を適応的に抑制する新しい手法であるObjective Suppressionを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:13:43 GMT)
Research on the Spatial Data Intelligent Foundation Model [70.5] 本報告では、これらのモデルの原理、手法、最先端の応用を探求する、空間データインテリジェントな大規模モデルに焦点を当てる。
これは、空間データインテリジェントな大規模モデルの定義、開発履歴、現状、およびトレンドに関する詳細な議論を提供する。
本報告では, 都市環境, 航空宇宙リモートセンシング, 地理, 交通, その他のシナリオにおける空間データ知能大規模モデルの重要技術とその応用を体系的に解明する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:05:41 GMT)
Performance of Cascade and LDPC-codes for Information Reconciliation on Industrial Quantum Key Distribution Systems [69.5] 我々は、情報再構成に使用される2つの一般的なアルゴリズムの性能を分析し、シミュレーションし、最適化し、比較する。
我々は,現実的かつアプリケーションクローズな環境での運用において,実用的および工業的環境における適用性に焦点をあてる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:51:03 GMT)
Data Formulator 2: Iteratively Creating Rich Visualizations with AI [65.5] これらの課題に対処するためのLCMを利用した可視化システムであるData Formulator 2を提案する。
Data Formulator 2では、ユーザはUIと自然言語をブレンドして視覚化の意図を記述し、データ変換はAIに委譲される。
イテレーションをサポートするため、Data Formulator 2では、ユーザがイテレーション履歴をナビゲートし、以前の設計を新しい設計に再利用することで、毎回スクラッチから始める必要がない。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:12:17 GMT)
SimpleSpeech 2: Towards Simple and Efficient Text-to-Speech with Flow-based Scalar Latent Transformer Diffusion Models [64.4] 我々は、SimpleSpeech 2.0と呼ばれるシンプルで効率的な非自己回帰(NAR)TSフレームワークを実装することで、過去の出版物の上に構築した。
SimpleSpeech 2は、自己回帰(AR)法と非自己回帰(NAR)法の両方の長所を効果的に組み合わせている。
我々は,従来の作業と他の大規模TSモデル(SOTA)と比較して,生成性能と生成速度が大幅に向上したことを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:16:37 GMT)
Heat Death of Generative Models in Closed-Loop Learning [63.8] 本研究では、独自の学習データセットに加えて、生成したコンテンツをフィードバックする生成モデルの学習ダイナミクスについて検討する。
各イテレーションで十分な量の外部データが導入されない限り、非自明な温度がモデルを退化させることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 22:54:15 GMT)
DiffAge3D: Diffusion-based 3D-aware Face Aging [61.3] 本稿では,DiffAge3Dを提案する。DiffAge3Dは3D設定で忠実な老化とアイデンティティ保存を行う最初の3D対応高齢化フレームワークである。
我々のフレームワークは、トレーニング済みの3D GANを利用して、堅牢な3D対応老化データセット生成パイプラインを含む。
DiffAge3Dは既存の手法、特にマルチビューの老朽化や細部保存において優れることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:36:09 GMT)
Classification Matters: Improving Video Action Detection with Class-Specific Attention [61.1] ビデオアクション検出(VAD)は、アクターを検出し、そのアクションをビデオで分類することを目的としている。
一般的な手法が、分類のための特徴をどう形成するかを分析し、アクター領域の優先順位付けを行う。
本稿では,アクターに対する偏見を減らし,各アクションクラスに関連する文脈に注意を払うことを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 04:41:09 GMT)
Unveiling the Statistical Foundations of Chain-of-Thought Prompting Methods [59.8] CoT(Chain-of-Thought)の促進とその変種は、多段階推論問題を解決する効果的な方法として人気を集めている。
統計的推定の観点からCoTのプロンプトを解析し,その複雑さを包括的に評価する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:13:41 GMT)
RoboSense: Large-scale Dataset and Benchmark for Multi-sensor Low-speed Autonomous Driving [59.7] 大規模マルチセンサーデータセットであるRoboSenseは、ニアフィールドシーン理解を容易にするために構築されている。
RoboSenseには133K以上の同期データと1.4Mの3DバウンディングボックスとIDが含まれている。
270ドル(約2万2000円)と18ドル(約1万2000円)です。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:17:40 GMT)
TEDRA: Text-based Editing of Dynamic and Photoreal Actors [59.5] TEDRAはアバターのテキストベースの編集を可能にする最初の方法である。
我々は、実際の俳優の制御可能で高忠実なデジタルレプリカを作成するためにモデルを訓練する。
提供されるテキストプロンプトに基づいて動的アバターを変更する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:59:02 GMT)
Convergent Differential Privacy Analysis for General Federated Learning: the f-DP Perspective [57.4] フェデレートラーニング(Federated Learning, FL)は、局所的なプライバシー保護に焦点を当てた効率的な協調学習パラダイムである。
差分プライバシー漏洩(DP)は、ローカルプライバシーの信頼性を捕捉し、確実にするための古典的なアプローチである。
ノイズの多いFL-DPの既存の分析は、主に構成に依存しており、プライバシー上の課題を厳格に定量化することはできない。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:22:21 GMT)
Divide, Conquer and Combine: A Training-Free Framework for High-Resolution Image Perception in Multimodal Large Language Models [57.3] マルチモーダル大言語モデル(MLLM)は、高解像度(HR)画像の複雑な詳細を認識し解釈するのに苦労する。
HR-Benchは、4K&8K画像上でMLLMの性能を厳格に評価する最初の意図的に設計されたベンチマークである。
HR画像のMLLM知覚を高めるための新しいトレーニングフリーフレームワークであるDivide, Conquer and Combine (DC$2$)を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:09:02 GMT)
SIaM: Self-Improving Code-Assisted Mathematical Reasoning of Large Language Models [54.8] 本稿では,コードに基づく批判モデルを用いて,質問コードデータ構築,品質管理,補完的評価などのステップをガイドする新しいパラダイムを提案する。
英語と中国語におけるドメイン内ベンチマークとドメイン外ベンチマークの両方の実験は、提案したパラダイムの有効性を実証している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:33:03 GMT)
Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.4] 本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:07:17 GMT)
Training-Free Action Recognition and Goal Inference with Dynamic Frame Selection [51.0] VidTFSはトレーニング不要でオープンなビデオ目標とアクション推論フレームワークである。
提案するフレーム選択モジュールは,フレームワークの性能を大幅に向上させることを示す。
提案したVidTFSの性能を,広範に使用されている4つのビデオデータセット上で検証する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:48:24 GMT)
ReMamba: Equip Mamba with Effective Long-Sequence Modeling [50.5] 本研究では,長い文脈の理解能力を高めるReMambaを提案する。
ReMambaは2段階のプロセスで選択的圧縮と適応のテクニックを取り入れている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 02:47:27 GMT)
Knowledge Navigator: LLM-guided Browsing Framework for Exploratory Search in Scientific Literature [48.6] 本稿では,探索探索能力の向上を目的とした知識ナビゲータを提案する。
検索された文書を、名前と記述の科学トピックとサブトピックの、ナビゲート可能な2段階の階層に整理する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:48:37 GMT)
Customize-A-Video: One-Shot Motion Customization of Text-to-Video Diffusion Models [48.6] 本研究では,単一参照ビデオからの動作をモデル化し,空間的・時間的変化のある新しい主題やシーンに適応するCustomize-A-Videoを提案する。
提案するモジュールは、ステージ化されたパイプラインでトレーニングされ、プラグイン・アンド・プレイ方式で推論され、様々な下流タスクへの容易に拡張できる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 01:13:44 GMT)
Exploring Selective Layer Fine-Tuning in Federated Learning [48.5] フェデレートラーニング(FL)は,分散データを用いた基礎モデルの微調整のための,有望なパラダイムとして登場した。
FLにおける選択的層微調整について検討し、クライアントがローカルデータやリソースに応じて選択した層を調整できるフレキシブルなアプローチを強調した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:48:39 GMT)
SCP: Soft Conditional Prompt Learning for Aerial Video Action Recognition [48.5] 本研究では,航空映像行動認識において,迅速な学習の強みを生かした新しい学習手法であるSoft Conditional Prompt Learning(SCP)を提案する。
本手法は,航空機/ロボットの視覚知覚のための入力ビデオにおける動作に関する記述や指示に,モデルが焦点を当てることによって,各エージェントの動作を予測するように設計されている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:56:02 GMT)
Automated Label Unification for Multi-Dataset Semantic Segmentation with GNNs [48.4] 本稿では,グラフニューラルネットワークを用いて,複数のデータセットにまたがる統一ラベル空間を自動構築する手法を提案する。
従来の手法と異なり,本手法は手動の注釈や分類の調整を必要とせず,シームレスな訓練を容易にする。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:12:35 GMT)
DeepMIF: Deep Monotonic Implicit Fields for Large-Scale LiDAR 3D Mapping [46.8] 最近の学習ベース手法は,3次元シーンの表面を近似するために,ニューラル暗黙表現と最適化可能な特徴グリッドを統合している。
この作業では、LiDARデータを正確にフィッティングすることから離れ、代わりにネットワークが3D空間で定義された非メトリックモノトニック暗黙フィールドを最適化する。
提案アルゴリズムは,Mai City, Newer College, KITTIベンチマークで得られた複数の量的および知覚的測定値と視覚的結果を用いて,高品質な高密度3Dマッピング性能を実現する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:52:32 GMT)
StyleRemix: Interpretable Authorship Obfuscation via Distillation and Perturbation of Style Elements [46.2] 著者の難読化は、著者のアイデンティティを意図的に曖昧にするためにテキストを書き直すことは重要だが、難しい作業である。
大規模言語モデル(LLM)を用いた現在の手法では、解釈可能性や制御性が欠如している。
入力テキストの特定のきめ細かいスタイル要素を摂動する適応的かつ解釈可能な難読化手法であるStyleRemixを開発した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:35:15 GMT)
Deciphering the Impact of Pretraining Data on Large Language Models through Machine Unlearning [46.0] 大規模言語モデルの事前学習データの5つの主要なカテゴリから,48のデータセットが与える影響を系統的に分析した。
本研究は,LLMの性能に対する複数コーパスの寄与に関する実証的な結果を提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:39:11 GMT)
Free Lunch in the Forest: Functionally-Identical Pruning of Boosted Tree Ensembles [46.0] 木アンサンブルを原モデルと「機能的に同一」な縮小版にプルークする方法を提案する。
我々は,アンサンブル上での機能的同一プルーニングの問題を形式化し,正確な最適化モデルを導入し,大規模なアンサンブルをプルーする高速かつ高効率な方法を提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 23:15:46 GMT)
Improving Generalization of Speech Separation in Real-World Scenarios: Strategies in Simulation, Optimization, and Evaluation [45.8] 本研究では,様々な環境やコンテンツから多様なトレーニングデータを生成する新しいデータシミュレーションパイプラインを提案する。
一般的な音声分離モデルの品質向上のための新しい訓練パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:26:34 GMT)
Str-L Pose: Integrating Point and Structured Line for Relative Pose Estimation in Dual-Graph [45.1] ロボットや自律運転など、さまざまなコンピュータビジョンアプリケーションにおいて、相対的なポーズ推定が不可欠である。
本稿では,余分な構造線セグメントと点特徴を統合した幾何対応グラフニューラルネットワークを提案する。
この整合点と線分の統合は、幾何学的制約をさらに活用し、異なる環境におけるモデル性能を向上させる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:33:26 GMT)
Geometric interpretation of timelike entanglement entropy [45.0] 境界部分領域が時間的な方向に沿って広がるホログラフィックエンタングルメントエントロピーの解析的継続は、新しい時間中心の時空プローブの約束をもたらした。
このホログラフィック時型エンタングルメントエントロピーのバルクキャリアは、ホログラフィック時空の複雑な座標への解析的連続性を示す境界アンコール面である。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:36:34 GMT)
CMTA: Cross-Modal Temporal Alignment for Event-guided Video Deblurring [44.3] ビデオデブロアリングは、隣接するビデオフレームから情報を集めることで、モーションレッドビデオの復元結果の品質を高めることを目的としている。
1) フレーム内機能拡張は, 単一のぼやけたフレームの露出時間内で動作し, 2) フレーム間時間的特徴アライメントは, 重要な長期時間情報を対象のフレームに収集する。
提案手法は, 合成および実世界のデブロアリングデータセットを用いた広範囲な実験により, 最先端のフレームベースおよびイベントベース動作デブロアリング法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:50:00 GMT)
Secret Collusion among Generative AI Agents [43.5] 近年の大規模言語モデル(LLM)では,コミュニケーション生成AIエージェントのグループによる共同作業の解決が試みられている。
これは、未承認の情報共有に関するプライバシーとセキュリティ上の問題を引き起こす。
現代のステガノグラフィー技術は、そのようなダイナミクスを検出しにくくする。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:53:04 GMT)
WebPilot: A Versatile and Autonomous Multi-Agent System for Web Task Execution with Strategic Exploration [42.9] 既存のLLMベースのWebエージェントは、特定の州や行動に特有の厳格で専門家が設計したポリシーに依存している。
人間は未知を探索し、戦略を継続的に順応し、探索を通じてあいまいさを解消することで優れる。
我々は,モンテカルロ木探索(MCTS)を改良し,複雑なWeb環境をよりよく扱うマルチエージェントシステムであるWebPilotを開発した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:49:29 GMT)
Quantized Thouless pumps protected by interactions in dimerized Rydberg tweezer arrays [41.9] 非相互作用の場合、量子化されたThoulessポンプは、位相特異点が断熱的に包囲されているときにのみ発生する。
相互作用の存在下では、そのようなトポロジカル輸送は、システムが相互作用しない特異点に任意に近づくエキゾチックな経路でも持続することができる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:54:34 GMT)
AutoInst: Automatic Instance-Based Segmentation of LiDAR 3D Scans [41.2] 3D環境を理解するには、きめ細かい風景を理解する必要がある。
教師なしの方法で3次元シーンのインスタンスセグメンテーションを予測することを提案する。
平均精度は13.3%,F1スコアは9.1%向上した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 21:07:49 GMT)
DocLayLLM: An Efficient and Effective Multi-modal Extension of Large Language Models for Text-rich Document Understanding [40.4] テキストリッチドキュメント理解(テキストリッチドキュメント理解、TDU)とは、テキストコンテンツを含む文書を分析し、解釈することである。
TDU用に特別に設計された大規模言語モデル(LLM)の効率的かつ効果的なマルチモーダル拡張であるDocLayLLMを紹介する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:32:44 GMT)
Leveraging Open Knowledge for Advancing Task Expertise in Large Language Models [40.4] オープンな知識を持つ大規模言語モデルのタスク専門性を向上させるために,人手によるサンプル(Kショット)を少数導入する。
複数の専門家の間で個別のyet-complementaryな知識を最大限に活用するために、Mixix-of-expert (MoE)システムを構築している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:28:07 GMT)
DualAnoDiff: Dual-Interrelated Diffusion Model for Few-Shot Anomaly Image Generation [40.3] 製造業における異常検査の性能は異常データの不足によって制約される。
既存の異常発生法は、生成した異常の多様性が限られている。
本稿では,新しい拡散型少数ショット画像生成モデルであるDualAnoDiffを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:53:46 GMT)
LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge Distillation [38.8] LLaVA-MoDは、小規模マルチモーダル言語モデルの効率的なトレーニングを可能にするために設計されたフレームワークである。
スパースミキサーアーキテクチャを言語モデルに統合することにより、s-MLLMのネットワーク構造を最適化する。
また,包括的知識移動を確保するために,先進的な知識移動戦略を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:52:23 GMT)
Observing Time-Dependent Energy Level Renormalisation in an Ultrastrongly Coupled Open System [37.7] オープン量子系のエネルギーレベルに強い結合とメモリ効果がどのような影響を及ぼすかを示す。
測定結果によると、システムのエネルギーレベルは、素系の周波数の15%まで変化している。
本研究は, 強結合開量子系における動的エネルギー準位再正規化の直接的証拠を提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:40:55 GMT)
Empowering Database Learning Through Remote Educational Escape Rooms [37.7] 本研究では,4つの高等教育コースにおけるデータベース教育のための遠隔教育避難室について分析した。
遠隔で実施した教育避難室は,データベースの教育に有効かつ効果的であることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:08:44 GMT)
TokenPacker: Efficient Visual Projector for Multimodal LLM [37.1] ビジュアルプロジェクタは、ビジュアルエンコーダとLarge Language Model(LLM)の間に必須のブリッジとして機能する。
本稿では,密集した特徴を注入して凝縮した視覚トークンを生成するために,粗く細かなスキームを取り入れた新しいビジュアルプロジェクタを提案する。
我々のアプローチでは、ビジュアルトークンを75%89%圧縮し、多様なベンチマークで同等またはさらに優れたパフォーマンスを実現しています。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:49:57 GMT)
MODULI: Unlocking Preference Generalization via Diffusion Models for Offline Multi-Objective Reinforcement Learning [36.2] 多目的強化学習(MORL)は、複数の対立する目標を同時に最適化する政策の開発を目指している。
オフラインMORLは、事前コンパイルされたデータセットをトレーニングして、デプロイ時の任意の好みに一般化することで、有望なソリューションを提供する。
既存のオフラインMORLアルゴリズムは、OOD選好の一般化が不十分であり、結果として、選好と一致しないポリシーが生じる。
本稿では,様々な嗜好に整合した軌道を生成するためのプランナーとして,嗜好条件付き拡散モデルを用いたMODULIを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:10:45 GMT)
Multi-weather Cross-view Geo-localization Using Denoising Diffusion Models [35.9] クロスビュージオローカライゼーションは、ドローンビュー画像と、大きなギャラリーからの正確なジオタグ付き衛星ビュー画像とをマッチングすることにより、未知の場所を決定することを目的としている。
近年の研究では、特定の気象条件下での識別的画像表現の学習が、性能を著しく向上させることが示されている。
本稿では,気象条件に適応する多天候クロスビュージオローカライゼーションフレームワークであるMCGFを紹介する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 02:53:22 GMT)
An Investigation of Warning Erroneous Chat Translations in Cross-lingual Communication [35.7] 本研究は, チャット翻訳のための多次元品質指標(MQM-Chat)を提案する。
各モデルが何らかの根本的な誤りを発生させるのに対し,各モデルには欠落,曖昧なソース内容の過度な修正,バズワード問題といった欠点がある。
本研究は,チャット翻訳評価におけるMQM-Chatの有効性を実証し,今後の研究における文体化コンテンツの重要性と対話の整合性を強調した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 05:36:25 GMT)
SGNet: Salient Geometric Network for Point Cloud Registration [35.5] ポイントクラウド登録(PCR)はコンピュータビジョンにおいて重要かつ困難なタスクである。
従来の手法では,パッチブロック間の類似性により不明瞭なマッチングが問題視されていた。
いくつかの新しい手法を含む新しい枠組みを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:39:10 GMT)
LLM-Based Multi-Hop Question Answering with Knowledge Graph Integration in Evolving Environments [35.4] 本稿では,大規模言語モデル(GMeLLo)のためのグラフメモリベースの編集について述べる。
GMeLLoは、知識グラフの明示的な知識表現と、大規模言語モデルの言語的柔軟性を融合する。
以上の結果から,GMeLLoはマルチホップ質問応答ベンチマークであるMQuAKEにおいて,最先端の知識編集手法をはるかに上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:15:45 GMT)
Modular variable laser cooling for efficient entropy extraction [34.8] スピン状態に依存した変位の列とスピン応答に基づく発振器のレーザ冷却法を示す。
本手法は, イオンを捕捉した単一イオンの内部状態と運動状態を用いて実験的に実証する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:28:21 GMT)
Kangaroo: A Powerful Video-Language Model Supporting Long-context Video Input [34.5] Kangarooは、長いビデオを処理するという課題に対処するための強力なビデオLMMである。
データキュレーションシステムは、視覚言語による事前学習と命令チューニングのための高品質なアノテーションを備えた大規模データセットを構築する。
長いビデオに対応するための解像度と入力フレームの数を徐々に増やしたカリキュラムトレーニングパイプライン。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 05:34:14 GMT)
Dynamic compensation for pump-induced frequency shift in Kerr-cat qubit initialization [34.5] ノイズバイアスのKerr-cat量子ビットは、フォールトトレラント量子計算の魅力的な候補である。
本稿では,PIFSの効果を緩和する動的補償法を提案し,実証する。
安定化Kerr-cat量子ビットを実現し,動的補償法の利点を検証した。
この研究は、Kerr-cat量子ビットのバイアス保存特性を利用するスケーラブル量子プロセッサの道を開いた。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:35:12 GMT)
ModalityMirror: Improving Audio Classification in Modality Heterogeneity Federated Learning with Multimodal Distillation [34.3] 本稿では,音声視覚フェデレーション学習モデルからの知識蒸留を活用して,音質モデルの性能を向上させるためのModalityMirrorを提案する。
以上の結果から,ModalityMirrorは最先端のFL法に比べて音声分類を大幅に改善することが示された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:56:22 GMT)
A Survey on Facial Expression Recognition of Static and Dynamic Emotions [34.3] 表情認識(FER)は、静的画像と動的シーケンスから感情状態を分析することを目的としている。
本稿では、画像ベース静的FER(SFER)法とビデオベース動的FER(DFER)法の両方について包括的調査を行う。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:15:25 GMT)
Lightweight High-Speed Photography Built on Coded Exposure and Implicit Neural Representation of Videos [34.2] 高速シーンを高解像度で記録できるコンパクトカメラの需要は着実に増加している。
しかし、そのような能力を達成するには、しばしば高帯域幅の要求が伴うため、低容量のプラットフォームには不適当で重いシステムになる。
本稿では,ビデオの暗黙的表現と古典的符号化露光画像技術を組み合わせることで,これらの課題に対処する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:15:04 GMT)
Unlocking Global Optimality in Bilevel Optimization: A Pilot Study [34.0] バイレベル最適化は、機械学習アプリケーションにおける重要な役割を中心に、関心の復活を目撃している。
近年,多くの点や局所データを持つ効率的な手法を証明可能な表現で保証する手法が研究されている。
本稿では,地球環境における二段階最適化理論の確立に向けた課題について考察する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:34:54 GMT)
Causality-Aware Spatiotemporal Graph Neural Networks for Spatiotemporal Time Series Imputation [33.9] 時系列を解析するためには、欠落値の計算が不可欠である。
新しい因果性対応時空間グラフニューラルネット(Casper)は、新しいPrompt Decoder(PBD)とStemporal Causal Attention(SCA)を含んでいる
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:48:43 GMT)
Merging and Splitting Diffusion Paths for Semantically Coherent Panoramas [33.3] 本稿では,Merge-Attend-Diffuse演算子を提案する。
具体的には、拡散経路をマージし、自己および横断的意図をプログラムし、集約された潜在空間で操作する。
提案手法は,生成した画像の入力プロンプトと視覚的品質との整合性を維持しつつ,セマンティック・コヒーレンスを増大させる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:22:32 GMT)
Perceive-IR: Learning to Perceive Degradation Better for All-in-One Image Restoration [33.2] Perceive-IRは、微細な画質制御を実現するために設計されたオールインワン画像復元装置である。
素早い学習の段階では、素早い学習を活用し、3段階の品質レベルを識別できるきめ細かい品質知覚器を得る。
修復段階では,修復プロセスをさらに促進するために,意味的誘導モジュールとコンパクトな特徴抽出を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:58:54 GMT)
MMDRFuse: Distilled Mini-Model with Dynamic Refresh for Multi-Modality Image Fusion [32.4] この目的を達成するために,動的リフレッシュ戦略(MMDRFuse)を用いた軽量蒸留ミニモデルを提案する。
モデルパシモニーを追求するために、合計で113のトレーニング可能なパラメータ(0.44KB)を持つ非常に小さな畳み込みネットワークを得る。
いくつかの公開データセットの実験により,本手法はモデル効率と複雑性の点で有望な優位性を示すことが示された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:52:33 GMT)
Are Pose Estimators Ready for the Open World? STAGE: Synthetic Data Generation Toolkit for Auditing 3D Human Pose Estimators [32.1] 本稿では3次元ポーズ推定器を監査するGenAIデータツールキットSTAGEを提案する。
我々は、性別、民族性、年齢、衣服、場所、天候などの属性に対する人気のポーズ推定者の感度を評価するためのベンチマークを生成する。
その結果,このような自然発生属性の存在は,ポーズ推定器の性能を著しく低下させる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:15:30 GMT)
Towards Realistic Example-based Modeling via 3D Gaussian Stitching [31.7] サンプル誘導合成を用いた点ベース表現における複数のガウス場を組み合わせた例に基づくモデリング手法を提案する。
具体的には、構成について、複数のフィールドをリアルタイムでセグメント化し変換するGUIを作成し、意味論的に意味のあるモデルの合成を容易に得る。
テクスチャブレンディングでは、3DGSの離散的および不規則な性質のため、SeamlssNeRFがサポートされないため、直接勾配伝播を適用する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:13:27 GMT)
Unleashing the Temporal-Spatial Reasoning Capacity of GPT for Training-Free Audio and Language Referenced Video Object Segmentation [31.4] 本稿では,AVS と RVOS タスクという,オーディオおよび言語参照オブジェクトセグメンテーションのトレーニングフリーパラダイムを探求する。
トレーニング不要のAL-Ref-SAM 2パイプラインは、完全に教師された微調整手法に匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:47:32 GMT)
Conan-embedding: General Text Embedding with More and Better Negative Samples [30.6] より高品質な負例の利用を最大化するコナン埋め込みモデルを提案する。
当社のアプローチは,現在,Massiveテキスト埋め込みベンチマークの中国リーダーボードにランクインしている,埋め込みモデルの能力を効果的に向上させる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:18:06 GMT)
Hand1000: Generating Realistic Hands from Text with Only 1,000 Images [29.6] 本論文では,目標ジェスチャーによる現実的な手動画像の生成を可能にするHand1000という新しい手法を提案する。
Hand1000の訓練は3つの段階に分けられ、第1段階はモデルによる手解剖学の理解を高めることを目的としている。
テキスト・ツー・ハンド画像生成に特化して設計された最初の公開データセットを構築した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 00:54:51 GMT)
Leveraging Large Language Models for Wireless Symbol Detection via In-Context Learning [29.3] 本稿では,大規模言語モデル(LLM)の文脈内学習能力(即ち,プロンプト)を活用して,学習や微調整をすることなく,低データ体制下での無線タスクを解決することを提案する。
この結果から,ICL法によるLCMはシンボル復調作業において従来のDNNよりも優れていたことが判明した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:19:20 GMT)
Integrating Quantum Computing Resources into Scientific HPC Ecosystems [29.1] 量子コンピューティングは、量子化学、最適化、人工知能といった分野における科学的な発見を促進する大きな可能性を秘めている。
QCは、ノイズの多い中間スケールの量子時代の固有の外部ノイズ問題のために、課題に直面している。
本稿では,新たな計算可能性の解き放つ計画の概要を述べる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 22:44:54 GMT)
PhysPart: Physically Plausible Part Completion for Interactable Objects [28.9] 我々は、相互作用可能なオブジェクトに対する物理的に妥当な部分補完の問題に取り組む。
幾何学的条件付けを利用した拡散型部分生成モデルを提案する。
また、3Dプリンティング、ロボット操作、シーケンシャル部分生成にも応用しています。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:09:49 GMT)
PDSR: A Privacy-Preserving Diversified Service Recommendation Method on Distributed Data [28.7] 協調フィルタリングは、サービスレコメンデーションの最も一般的な方法の1つであり、既存の提案の多くは、レコメンデーションの正確性を改善することに焦点を当てている。
そこで我々は,新しい精度多様性尺度を提案し,精度多様性尺度を最大化して推奨する$K$サービスを選択するために2ドル近似を設計する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:25:36 GMT)
FAST-LIVO2: Fast, Direct LiDAR-Inertial-Visual Odometry [28.6] 我々は,SLAMタスクにおける高精度かつ堅牢な状態推定を実現するために,高速かつ直接的LiDAR慣性・視覚的オドメトリーフレームワークであるFAST-LIVO2を提案する。
FAST-LIVO2はIMU、LiDAR、画像計測を逐次更新戦略で効率的に融合する。
本稿では,FAST-LIVO2のリアルタイムナビゲーション,空中マッピング,3次元モデルレンダリングの3つの応用例を示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:03:50 GMT)
Hierarchical Visual Categories Modeling: A Joint Representation Learning and Density Estimation Framework for Out-of-Distribution Detection [28.4] 本稿では,分布外データと分布内データとを分離する階層型視覚カテゴリーモデリング手法を提案する。
我々は、CIFAR、iNaturalist、SUN、Places、Textures、ImageNet-O、OpenImage-Oを含む7つの人気のあるベンチマーク実験を行った。
我々の視覚表現は古典的手法で学習した特徴と比較して競争力がある。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:05:46 GMT)
WildFeedback: Aligning LLMs With In-situ User Interactions And Feedback [28.3] WildFeedbackは、リアルタイムのin-situユーザーインタラクションを活用して、より正確に人間の価値観を反映した好みデータセットを作成する新しいフレームワークである。
我々は,このフレームワークをユーザとLLMの会話の大規模なコーパスに適用し,実際のユーザの好みを反映したリッチな嗜好データセットを実現する。
実験により,WildFeedbackを微調整したLCMは,ユーザの好みに合わせて大幅に改善されていることが示された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 05:53:46 GMT)
Mamba or Transformer for Time Series Forecasting? Mixture of Universals (MoU) Is All You Need [28.3] 時系列予測には、正確な予測のために短期と長期の依存関係のバランスが必要である。
変換器は長期依存のモデリングに優れているが、2次計算コストで批判されている。
Mambaは、ほぼ直線的な代替手段を提供するが、潜在的な情報損失のため、時系列の長期予測では効果が低いと報告されている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:59:27 GMT)
A Statistical Framework of Watermarks for Large Language Models: Pivot, Detection Efficiency and Optimal Rules [27.7] 我々は,透かしの統計的効率と強力な検出規則を推論するための枠組みを導入する。
枠組みに基づく透かしの最適検出規則を導出する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:01:04 GMT)
Large Language Model Sentinel: LLM Agent for Adversarial Purification [27.5] 大規模言語モデル(LLM)は、よく設計されたテキストの摂動による敵攻撃に対して脆弱である。
LLAMOS(Large LAnguage Model Sentinel)と呼ばれる新しい防御技術を導入し,LLMの対角的堅牢性を高める。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:46:17 GMT)
Quantum-machine-assisted Drug Discovery: Survey and Perspective [26.9] 従来のコンピュータ支援ドラッグデザイン(CADD)は、このプロセスの加速に大きな進歩をもたらした。
量子コンピューティングの本質的な能力を活用することで、新しい薬を市場に投入する際の時間とコストを削減できるかもしれません。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 00:19:50 GMT)
TagOOD: A Novel Approach to Out-of-Distribution Detection via Vision-Language Representations and Class Center Learning [26.4] 視覚言語表現を用いたOOD検出のための新しいアプローチである textbfTagOOD を提案する。
TagOODは、抽出されたオブジェクトの特徴に基づいて軽量なネットワークをトレーニングし、代表的なクラスセンターを学習する。
これらの中心は、OOD検出における無関係な画像特徴の影響を最小限に抑え、INDオブジェクトクラスの中心的な傾向を捉えている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:37:59 GMT)
Look Before You Leap: Towards Decision-Aware and Generalizable Tool-Usage for Large Language Models [26.3] 意思決定・汎用ツール・ユース・フレームワーク(DEER)を提案する。
具体的には、まず、自動生成パイプラインを介して、複数の決定ブランチを持つツール使用サンプルを構築します。
提案するDEERは, 各種データセットのベースラインよりも効果的で, 著しく優れる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:54:11 GMT)
EPO: Hierarchical LLM Agents with Environment Preference Optimization [25.7] 本稿では,複雑なタスクを管理可能なサブゴールに分解する階層的フレームワークを提案する。
注釈のないデータセットのためのトレーニング信号を作成するという課題に対処するため,マルチモーダル環境フィードバックを利用して報酬信号を自動的に生成する報酬モデルを開発した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:44:02 GMT)
Meta-Learn Unimodal Signals with Weak Supervision for Multimodal Sentiment Analysis [25.7] 上記の問題に対処する新しいメタユニラベル生成(MUG)フレームワークを提案する。
まず,一様表現と多様表現のギャップを埋めるために,コントラッシブ・ベース・プロジェクション・モジュールを設計する。
次に,両レベル最適化戦略を用いて,MUCNを明示的な監督で訓練するための一助多モーダル・マルチモーダル・Denoisingタスクを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:43:01 GMT)
In-Context Imitation Learning via Next-Token Prediction [25.6] In-Context Robot Transformer (ICRT) は、言語データや報酬関数に頼ることなく、感覚運動の軌道上で自己回帰予測を行う。
ICRTは、プロンプトとトレーニングデータの両方とは異なる環境設定であっても、プロンプトによって指定された新しいタスクに適応することができる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:50:19 GMT)
Structural Attention: Rethinking Transformer for Unpaired Medical Image Synthesis [25.5] Transformerベースのモデルは、長距離依存関係をキャプチャする機能のおかげで、画像翻訳タスクに優れています。
本稿では,強い帰納バイアスを欠くトランスフォーマーが,ペアデータがない場合に最適でない解に収束できることを実証的に示す。
UNet Structured Transformer (UNest) は, 医用画像合成のための構造的帰納バイアスを取り入れた新しいアーキテクチャである。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 05:40:55 GMT)
AI-native Memory: A Pathway from LLMs Towards AGI [25.2] 大規模言語モデル(LLM)は、人工知能(AGI)の火花で世界を実証した。
我々は,メモリ統合によるLLMからAGIへの経路を構想する。
中間段階として、メモリは自然言語記述の形式になる可能性が高い。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:07:49 GMT)
BELT-2: Bootstrapping EEG-to-Language representation alignment for multi-task brain decoding [24.5] 本稿では,脳波信号からの符号化性能と復号性能の両立を目的としたマルチタスクモデルであるBELT-2を紹介する。
BELT-2は、1)バイトペア符号化(BPE)レベルのEEG言語アライメントを採用し、2)マルチタスクトレーニングとデコーディングをEEGドメインに統合する最初の試みである。
これらの革新的な試みによりBELT-2は先駆的なブレークスルーとなり、非侵襲的な脳信号からコヒーレントで読みやすい文を復号できる分野における最初の作品となった。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:30:22 GMT)
User-level Social Multimedia Traffic Anomaly Detection with Meta-Learning [24.2] ユーザレベルのソーシャルマルチメディアトラフィック異常検出のためのメタラーニング手法である textitMeta-UAD を提案する。
提案手法を2つの公開データセット上で評価し,Meta-UADの優位性をさらに証明した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 02:20:35 GMT)
Evidential Deep Partial Multi-View Classification With Discount Fusion [24.1] Evidential Deep partial Multi-View Classification (EDP-MVC) と呼ばれる新しいフレームワークを提案する。
欠落したビューに対処するためにK-means命令を使用し、マルチビューデータの完全なセットを作成します。
この暗示されたデータ内の潜在的な衝突や不確実性は、下流の推論の信頼性に影響を与える可能性がある。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:18:00 GMT)
CAPER: Enhancing Career Trajectory Prediction using Temporal Knowledge Graph and Ternary Relationship [23.8] 本稿では,高度な時間的知識グラフ(TKG)モデリングによる課題を解決する新しい解法であるCAPERを提案する。
グラフ構造化知識ベースを豊かな表現力で活用し、仕事の動きパターンの変化を効果的に保存する。
実世界のキャリアトラジェクトリデータセットの実験では、CAPERが一貫して、4つのベースラインをはるかに上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:21:56 GMT)
Feedback-Driven Automated Whole Bug Report Reproduction for Android Apps [23.5] ReBLは、Androidのバグレポートを再現するための、フィードバック駆動のアプローチである。
従来のステップバイステップのエンティティマッチングアプローチよりも柔軟でコンテキスト対応です。
非クラッシュな機能的なバグレポートを処理できる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:52:57 GMT)
Drone Referring Localization: An Efficient Heterogeneous Spatial Feature Interaction Method For UAV Self-Localization [22.9] 我々は、Drone Referring Localization(DRL)と呼ばれる、効率的な異種空間特徴相互作用法を提案する。
異なるデータソースを分離して扱う従来の方法とは異なり、DRLは異種特徴の学習可能な相互作用を促進する。
従来のIR法と比較して、DRLはより優れたローカライズ精度(MA@20 + 9.4%)を実現し、計算時間(1/7)とストレージオーバーヘッド(2/3)を大幅に削減した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 04:36:23 GMT)
Wireless Channel Aware Data Augmentation Methods for Deep Learning-Based Indoor Localization [22.8] 本稿では,無線伝搬チャネルやデバイスに関するドメイン知識を活用する手法を提案する。
低データ体制では、ローカライゼーション精度は50%まで上昇し、高データ体制における非増大した結果と一致することを示す。
提案手法は,測定データ量の1/4しか使用せず,最大で33%のハイデータ性能を達成できる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 01:46:48 GMT)
Legilimens: Practical and Unified Content Moderation for Large Language Model Services [22.8] 大規模言語モデル(LLM)のための実践的で統一的なコンテンツモデレーションフレームワークを提案する。
チャット指向のLLMから概念的特徴を抽出することにより、効果的で効率的なコンテンツモデレーションを実現することができることを示す。
我々は,5つのLLM,17のデータセット,9つのジェイルブレイク法を用いて,レジリメンの有効性,効率,堅牢性を検証した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 02:27:07 GMT)
More Text, Less Point: Towards 3D Data-Efficient Point-Language Understanding [22.8] GreenPLMは、最小限の3Dポイントクラウドとテキストデータペアで堅牢な3Dオブジェクト理解を可能にすることを目的としている。
画像とテキストのアライメントにCLIPにインスパイアされた我々は、トレーニング済みのクラウドテキストエンコーダを使用して、3Dポイントクラウド空間をテキスト空間にマッピングする。
3Dオブジェクトのフリーテキスト記述を6M生成し、3段階のトレーニング戦略を設計し、LLMが様々なモダリティ間の本質的な接続をよりよく探索できるようにする。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:38:44 GMT)
Language Adaptation on a Tight Academic Compute Budget: Tokenizer Swapping Works and Pure bfloat16 Is Enough [22.5] 我々は、Mistral-7Bをドイツ語やアラビア語に適応させることに重点を置いており、この設定における効率と有効性を改善するためにいくつかの手法を評価している。
我々のドイツのモデルは、この厳格な計算予算をMistral-7Bのベースと比較すると性能が劣る一方、アラビアのモデルはいくつかのベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:37:07 GMT)
NOVUM: Neural Object Volumes for Robust Object Classification [22.4] 画像分類のためのディープネットワークに3D合成対象表現を明示的に組み込むことにより,配布外シナリオの一般化が大幅に向上することを示す。
特に,対象対象クラス毎に特徴抽出器とニューラルオブジェクト容積からなる,NOVUMと呼ばれる新しいアーキテクチャを導入する。
実験の結果,NOVUMはオブジェクト表現の3次元構成構造のため,標準アーキテクチャよりも興味深い利点があることがわかった。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:28:15 GMT)
Unrecognizable Yet Identifiable: Image Distortion with Preserved Embeddings [22.3] 本稿では,ニューラルネットワークモデルによる顔画像の識別性を保ちながら,目に対して認識不能な顔画像を描画する,革新的な画像変換手法を提案する。
提案手法は、様々な人工知能アプリケーションにおいて、視覚データを歪曲し、派生した特徴を近接に保つために使用することができる。
同一の認識精度を維持しつつ、画像内容が70%以上変化する歪みを構築することができることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:42:44 GMT)
HC3 Plus: A Semantic-Invariant Human ChatGPT Comparison Corpus [22.3] ChatGPTはその素晴らしいパフォーマンスのために大きな関心を集めている。
その潜在的なリスクについて懸念が高まっている。
ChatGPT生成テキストを検出するために使用される現在のデータセットは、主に質問応答タスクに焦点を当てている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:40:22 GMT)
SciLitLLM: How to Adapt LLMs for Scientific Literature Understanding [21.6] 大言語モデルの成功にもかかわらず、科学文献理解の課題に直面している。
連続事前学習(CPT)と教師付き微調整(SFT)を統合したハイブリッド戦略を提案する。
我々は科学文献理解に特化したLLMスイートSciLitLLMを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 05:41:52 GMT)
VLM4Bio: A Benchmark Dataset to Evaluate Pretrained Vision-Language Models for Trait Discovery from Biological Images [21.5] 生物生物学分野における12種類のSOTA(State-of-the-art)VLMsの有効性を,新しいデータセットであるVLM4Bioを用いて評価した。
また,幻覚を推論するためのプロンプト技術やテストの適用がVLMの性能に及ぼす影響についても検討した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 23:53:57 GMT)
Convergence and sample complexity of natural policy gradient primal-dual methods for constrained MDPs [21.3] 我々は、割引された最適レート問題を解くために、自然政策勾配法を用いる。
また、2つのサンプルベースNPG-PDアルゴリズムに対して収束と有限サンプル保証を提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 21:17:28 GMT)
Improving the Prediction of Individual Engagement in Recommendations Using Cognitive Models [21.2] 本稿では、インスタンスベース学習理論に基づく認知モデルが、既存の純粋計算アプローチをどのように拡張するかを示す。
この結果から,一般時系列予測器(LSTMなど)と比較して,ILBモデルは個人の状態のダイナミクスをよりよく予測できることがわかった。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 21:28:45 GMT)
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts) [20.5] この第2回説明可能なAI for the Arts(XAIxArts)に関する国際ワークショップは、HCI、インタラクションデザイン、AI、説明可能なAI(XAI)、デジタルアートの研究者のコミュニティを集めて、XAI for the Artsの役割を探求した。
第16回 ACM Conference on Creativity and Cognition (C&C 2024) でワークショップを開催した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:08:55 GMT)
PASH at TREC 2021 Deep Learning Track: Generative Enhanced Model for Multi-stage Ranking [20.3] 本稿では,TREC 2021 Deep Learning TrackにおけるPASHの参加について述べる。
リコール段階ではスパース法と高密度検索法を組み合わせたスキームを採用する。
多段階ランキングフェーズでは、ポイントワイドとペアワイドランキング戦略が使用される。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:51:57 GMT)
ConsistencyTrack: A Robust Multi-Object Tracker with a Generation Strategy of Consistency Model [20.3] マルチオブジェクトトラッキング(MOT)は、コンピュータビジョンにおいて重要な技術であり、ビデオシーケンス内の複数のターゲットを検出し、各ターゲットにフレーム毎にユニークなIDを割り当てるように設計されている。
既存のMOTメソッドは、様々なシナリオでリアルタイムで複数のオブジェクトを正確に追跡する。
本稿では,境界ボックス上の拡散過程として検出と関連を定式化するための新しいConsistencyTrack, Joint Detection and Tracking (JDT) フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 05:53:30 GMT)
Distribution Backtracking Builds A Faster Convergence Trajectory for One-step Diffusion Distillation [19.9] 本研究では, 学生生成物を蒸留するための分散追跡蒸留(DisBack)を提案する。
DisBackは、既存の蒸留法よりも高速でより良い収束を実現し、同等な生成性能を達成する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:58:17 GMT)
Towards Human-Level Text Coding with LLMs: The Case of Fatherhood Roles in Public Policy Documents [19.7] 大きな言語モデル(LLM)は、より良い結果と少ないプログラミングで自動化を約束します。
本研究では,政治科学の現場で遭遇する典型的複雑度を含む3つのプログラミング課題についてLLMを評価した。
もっとも優れたプロンプト戦略は、人間のプログラマに提供されるような、詳細なコードブックをLLMに提供することにある。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:26:16 GMT)
Stick to your Role! Stability of Personal Values Expressed in Large Language Models [19.5] 異なる文脈における値表現の安定性に関するケーススタディを提案する。
心理学的手法を用いて,人口のランク順安定性について検討した。
モデルおよびモデルファミリーの安定性における一貫した傾向を観察する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:04:05 GMT)
AnomalyLLM: Few-shot Anomaly Edge Detection for Dynamic Graphs using Large Language Models [19.4] AnomalyLLMは、いくつかのラベル付きサンプルの情報を統合して、数発の異常検出を実現する、コンテキスト内学習フレームワークである。
4つのデータセットの実験により、AnomalyLLMは、数発の異常検出のパフォーマンスを著しく改善できるだけでなく、モデルパラメータを更新することなく、新しい異常に対して優れた結果を得ることができることが明らかになった。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:18:28 GMT)
Efficient LLM Scheduling by Learning to Rank [19.3] そこで本研究では,要求の集合における出力長の相対的なランクを,学習者によるランク付けによって予測可能であることを示す。
我々は,LLM推論のための新しいスケジューラを開発し,SJFスケジュールを既存手法よりも高速に近似する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:35:54 GMT)
FedMCP: Parameter-Efficient Federated Learning with Model-Contrastive Personalization [19.3] FedMCPはFLのためのモデルコントラストパーソナライゼーションを用いたパラメータ効率の高いファインチューニング手法である。
我々は,PLMの最先端FLファインチューニング手法に対して,FedMCPが大幅な性能改善を実現していることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 04:19:47 GMT)
SkyScript-100M: 1,000,000,000 Pairs of Scripts and Shooting Scripts for Short Drama [18.7] 我々はインターネットから6,660の人気の短編ドラマを収集し、それぞれ平均で100の短編エピソードを収集し、合計で約80,000の短編エピソードを収録する。
我々は各エピソードの抽出とアノテーションを行い、約1万の撮影スクリプトを入手した。
これにより、1000,000,000のスクリプトと、SkyScript-100Mと呼ばれるショートドラマ用のシューティングスクリプトを含むデータセットが生成される。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:34:37 GMT)
EMP: Enhance Memory in Data Pruning [18.5] 近年,大規模言語と視覚モデルの性能は高いが,事前学習と微調整のコストが高いため,データセットプルーニングによる学習の高速化に向けた研究が進んでいる。
従来の手法では、サンプルの損失を評価基準として用い、トレーニングに最も「難しい」サンプルを選択することを目的としていた。
本稿では,データのメモリを増大させ,その性能を向上させることにより,高プルーニングレート下でのメモリ不足問題に対処するエンハンスメモリ・プルーニング(EMP)を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:29:52 GMT)
Fine-Grained Building Function Recognition from Street-View Images via Geometry-Aware Semi-Supervised Learning [18.4] 本稿では,細粒度建物機能認識のための幾何学的半教師付き手法を提案する。
この手法は多ソースデータ間の幾何学的関係を利用して擬似ラベルの精度を向上させる。
提案手法は, 建築物のきめ細かい機能認識において, 優れた性能を示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:29:42 GMT)
Graphical vs. Deep Generative Models: Measuring the Impact of Differentially Private Mechanisms and Budgets on Utility [18.2] 私たちはグラフィカルモデルと深層生成モデルを比較し、プライバシー予算の支出に寄与する重要な要素に注目します。
グラフィカルモデルでは,プライバシ予算を水平方向に分散させることで,一定のトレーニング時間において比較的広いデータセットを処理できないことがわかった。
深層生成モデルはイテレーション毎に予算を消費するので、その振る舞いはさまざまなデータセットの次元で予測できない。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 22:22:29 GMT)
Contextual Bandit with Herding Effects: Algorithms and Recommendation Applications [17.9] ハーディングエフェクト」は、ユーザのフィードバックを歴史的評価に偏り、文脈的包帯に固有の偏りのないフィードバックの仮定を分解する。
本報告では, 群れ効果によるフィードバックバイアスに対処するために, 文脈的包帯の新たな変種を考案する。
TS-Confは,遺伝効果の負の影響を効果的に軽減し,学習の高速化と推奨精度の向上を図った。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:39:57 GMT)
Gen-Swarms: Adapting Deep Generative Models to Swarms of Drones [17.7] Gen-Swarmsは、ドローンショーの制作を自動化するために、深層生成モデルとリアクティブナビゲーションアルゴリズムを活用し、組み合わせる革新的な方法である。
我々の実験は、このアプローチがドローンショーに特に適しており、実現可能な軌道を提供し、代表的な最終形を作成し、ドローンショー生成全体の性能を大幅に向上させることを実証している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:12:28 GMT)
CardBench: A Benchmark for Learned Cardinality Estimation in Relational Databases [17.5] データベースにおける高いクエリパフォーマンスを実現するには、心臓病推定が不可欠である。
研究者が新しい学習アプローチによる進捗を評価することができるような、体系的なベンチマークやデータセットは存在しない。
我々は,20の異なる実世界のデータベースに数千のクエリを格納したベンチマークを,学習された濃度推定のためにリリースした。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 23:25:25 GMT)
Auxiliary Input in Training: Incorporating Catheter Features into Deep Learning Models for ECG-Free Dynamic Coronary Roadmapping [17.5] ダイナミック冠のロードマップ作成は、X線アンギオグラフィーのオフライン画像シーケンスから抽出した血管マップ(「ロードマップ」)をリアルタイムでX線フルオロスコープのライブストリームにオーバーレイする技術である。
コントラスト剤注入の繰り返しを必要とせず、介入手術のナビゲーションガイダンスを提供することを目標とし、放射線曝露や腎不全に伴うリスクを低減することを目的としている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:05:38 GMT)
u-LLaVA: Unifying Multi-Modal Tasks via Large Language Model [17.4] u-LLaVAは、MLLMの知覚能力を改善するためにピクセル、地域、グローバル機能を統合する革新的な統合マルチタスクフレームワークである。
この研究は、277Kサンプルからなるマスクベースの新しいマルチタスクデータセットに貢献し、MLLMの微粒化知覚能力に挑戦し評価する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:26:07 GMT)
CoGen: Learning from Feedback with Coupled Comprehension and Generation [17.2] 本研究は、ユーザとのインタラクションから継続的に学習することに焦点を当てた理解と生成の結合について研究する。
我々は2人のプレイヤーの参照ゲームで研究を行い、何千ものユーザーとの対話のために様々なモデルをデプロイした。
我々は時間とともに性能が劇的に向上し、包括的世代結合は絶対的に26%まで性能が向上することを示した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:58:39 GMT)
Temporal Attention for Cross-View Sequential Image Localization [17.1] 本稿では,1つの衛星画像パッチ内でのストリートビュー画像の微粒化とシーケンシャルなローカライゼーションに着目し,クロスビューのローカライゼーションを強化する新しいアプローチを提案する。
逐次的な画像の微粒化に拡張することにより、新しい時間的注意モジュール(TAM)を備えるモデルでは、文脈情報を活用して、シーケンシャルな画像の局所化精度を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:53:08 GMT)
InstanSeg: an embedding-based instance segmentation algorithm optimized for accurate, efficient and portable cell segmentation [16.9] InstanSegは、顕微鏡画像中の細胞と核を特定するために設計された、新しい埋め込みベースのインスタンスセグメンテーションパイプラインである。
InstanSegは最も広く使われている代替手法と比較して精度が大幅に向上することを示した。
我々はPythonでのInstanSegのオープンソース実装と、Javaで書かれた推論のためのユーザフレンドリでインタラクティブなQuPath拡張を提供しています。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:14:21 GMT)
IICPilot: An Intelligent Integrated Circuit Backend Design Framework Using Open EDA [16.3] IICPilotはLLM技術に基づくインテリジェントICバックエンド設計システムである。
LangChainのマルチエージェントフレームワークは、異なる設計タスクを効率的に処理する。
IICPilotはバックエンド設計ワークフローを、特定のオープンソースEDAツールから分離する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:15:10 GMT)
Adapting Segment Anything Model to Multi-modal Salient Object Detection with Semantic Feature Fusion Guidance [15.4] マルチモーダル・サリアン・オブジェクト検出(SOD)のためのSegment Anything Model(SAM)の強力な特徴表現とゼロショット一般化能力を探求し活用するための新しいフレームワークを提案する。
アンダーラインSAMとサブラインマンティックファウンダリナールファウンダリナールグダンクンダリナール(サマン)を併用して開発する。
画像エンコーダでは,マルチモーダルSAMをマルチモーダル情報に適用するためのマルチモーダルアダプタが提案されている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:28:50 GMT)
RIDE: Boosting 3D Object Detection for LiDAR Point Clouds via Rotation-Invariant Analysis [15.4] RIDEは3D LiDAR-point-based object DEtectorの回転不変性の先駆的な探索である。
回転に敏感ではあるが幾何をよく保持できる2機能抽出器と、幾何情報をある程度失うが回転に頑健な回転不変特徴を抽出する。
我々のRIDEは互換性があり、既存の1段と2段の3D検出器に簡単に接続でき、検出性能と回転ロバスト性の両方を高めることができる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:53:33 GMT)
BattleAgentBench: A Benchmark for Evaluating Cooperation and Competition Capabilities of Language Models in Multi-Agent Systems [15.2] 大規模言語モデル(LLM)はますます強力になり、複雑なタスクを処理できるようになる。
シングルエージェントと比較して、マルチエージェントシステムは言語モデルの協調機能により高い要求がある。
我々は,3つの難易度の7つのサブステージを定義したBattleAgentBenchというベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:43:55 GMT)
Ray-Distance Volume Rendering for Neural Scene Reconstruction [15.1] ニューラルシーン再構築における既存の手法は、SDF(Signed Distance Function)を用いて密度関数をモデル化する。
室内のシーンでは、サンプリングされた点に対するSDFから計算された密度は、ボリュームレンダリングにおいてその真の重要性を常に反映していないかもしれない。
本研究は,信号線距離関数(SRDF)を用いて密度関数をパラメータ化する屋内シーン再構築手法を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 04:19:14 GMT)
AlphaForge: A Framework to Mine and Dynamically Combine Formulaic Alpha Factors [14.8] 本稿では,アルファ因子マイニングと因子組み合わせのための2段階のアルファ生成フレームワークAlphaForgeを提案する。
実世界のデータセットを用いて行った実験により,我々の提案したモデルは,定式的アルファファクターマイニングにおいて,同時代のベンチマークより優れていることが示された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:21:57 GMT)
A Deep Learning Based Resource Allocator for Communication Systems with Dynamic User Utility Demands [14.7] 本稿では,DL ベースのリソースアロケータ (ALCOR) を導入し,ユーザによるユーティリティ要求の調整を自由に行えるようにした。
ALCORは、時間共有問題におけるポリシーとしてディープニューラルネットワーク(DNN)を使用している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:46:39 GMT)
Geo-Llama: Leveraging LLMs for Human Mobility Trajectory Generation with Spatiotemporal Constraints [14.6] Geo-Llamaは、人間の移動データからリアルな軌道を生成する新しいフレームワークである。
文脈的コヒーレントな方法で、明示的な訪問制約を持つ軌道上で、事前訓練されたLLMを微調整する。
実世界のデータセットと合成データセットに関する大規模な実験は、幅広い制約を扱う上で、その汎用性と堅牢性を示している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:16:42 GMT)
Statistical QoS Provision in Business-Centric Networks [14.6] Business-Centric Network(BCN)は、アプリケーション、トランスポートパラメータ、チャネルの関係をキャプチャするクロスレイヤフレームワークである。
電力と帯域幅の割り当て、送信パラメータ、APネットワークトポロジを共同で検討することにより、重み付けされた資源効率を最適化する。
トレーニングを加速し、報酬を高めるために、新しいマルチスレッド体験共有機構を導入する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:03:04 GMT)
A Simple Baseline with Single-encoder for Referring Image Segmentation [14.5] 本稿では,単一エンコーダ(BEiT-3)を用いたRIS法を提案する。
単一エンコーダによる単純なベースラインは、RISベンチマークデータセット上で優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 04:14:01 GMT)
DQFormer: Towards Unified LiDAR Panoptic Segmentation with Decoupled Queries [14.4] 本稿では,統合ワークフローにセマンティックとインスタンスセグメンテーションを実装するDQFormerという新しいフレームワークを提案する。
具体的には,セマンティクスを用いた情報的クエリを局所化して提案する,疎結合なクエリジェネレータを設計する。
また、クエリ指向マスクデコーダを導入し、対応するセグメンテーションマスクをデコードする。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:14:33 GMT)
Uncertainty Modeling in Graph Neural Networks via Stochastic Differential Equations [14.4] ブラウン運動によってランダム性を埋め込んで不確実性を定量化することでGNODEを増強するLatent Graph Neural Differential Equations (LGNSDE)を導入する。
我々は,LGNSDEの理論的保証を提供し,不確実性定量化における性能を実証的に示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 19:59:58 GMT)
Certified Causal Defense with Generalizable Robustness [14.2] 本稿では,認証防衛における一般化問題に因果的視点を取り入れた新しい認証防衛フレームワークGLEANを提案する。
本フレームワークは,因果関係と入力とラベル間の素因果関係を乱すために,認証因果関係学習コンポーネントを統合する。
そこで我々は,潜在因果的要因に対する敵対的攻撃に対処するために,因果的に認証された防衛戦略を設計する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 00:14:09 GMT)
Geometry-guided Feature Learning and Fusion for Indoor Scene Reconstruction [14.2] 本稿では3次元シーン再構成のための新しい幾何学的統合機構を提案する。
提案手法は,特徴学習,特徴融合,ネットワーク監視という3段階の3次元幾何学を取り入れている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:02:47 GMT)
Towards reliable respiratory disease diagnosis based on cough sounds and vision transformers [14.1] 本稿では,大規模コークスデータセットを用いた自己教師型学習と教師型学習を併用したコークス病分類手法を提案する。
提案手法は、新型コロナウイルスの診断のための2つのベンチマークデータセットと、AUROC 92.5% の COPD/non-COPD 分類のためのプロプライエタリデータセットにおいて、先行技術よりも一貫して優れていることを示す実験結果を得た。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:40:40 GMT)
AeroVerse: UAV-Agent Benchmark Suite for Simulating, Pre-training, Finetuning, and Evaluating Aerospace Embodied World Models [14.1] 航空宇宙インテリジェンス(Aerospace embodied intelligence)は、無人航空機(UAV)による自律的な認識、認識、行動の実現を目的としている。
AerialAgent-Ego10kという大規模な実世界の画像テキスト事前学習データセットを構築。
また,空域埋め込み世界モデルの事前学習を容易にするために,仮想画像テキストアライメントデータセットであるCyberAgent Ego500kを作成している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:47:45 GMT)
eRST: A Signaled Graph Theory of Discourse Relations and Organization [14.1] RST(Rhetorical Structure Theory)の拡張に基づく計算談話分析のための新しい理論枠組みを提案する。
このフレームワークは、木を破る、非計画的、並行的な関係を持つ談話関係グラフと、分析に説明可能な合理性を与える暗黙的、明示的な信号を含む。
我々は,200K以上のトークンを持つ12の話し言葉および書き言葉のジャンルを含む,アノテートされた英語の無料コーパスを,我々の枠組みに従って提示し,評価する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:45:57 GMT)
CoRe: Context-Regularized Text Embedding Learning for Text-to-Image Personalization [14.0] コンテクスト規則化(CoRe)を導入し、コンテクストトークンをプロンプトに正規化することで、新しい概念のテキスト埋め込みの学習を強化する。
CoReは、対応する画像の生成を必要とせずに任意のプロンプトに適用することができる。
包括的実験により,本手法は識別保存法とテキストアライメント法の両方において,いくつかの基本的手法より優れていることが示された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:27:58 GMT)
Misspecification-robust likelihood-free inference in high dimensions [13.9] 本稿では,ベイズ最適化に基づく近似離散関数の確率的手法による拡張を提案する。
提案手法は,高次元パラメータ空間に対する計算スケーラビリティを,各パラメータの別個の取得関数と相違点を用いて達成する。
本手法は,100次元空間における標準例による計算効率のよい推論を成功させ,既存のモジュール化ABC法と比較した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:44:23 GMT)
Q-MRS: A Deep Learning Framework for Quantitative Magnetic Resonance Spectra Analysis [13.8] 本研究では,トランスファーラーニングを用いたディープラーニング(DL)フレームワークを導入し,シミュレーションデータセット上でモデルを事前学習し,生体内データの微調整を行う。
提案したフレームワークは,BIG GABAレポジトリのPhilipsデータセットに適用した場合,有望なパフォーマンスを示した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:05:53 GMT)
A Lot of Talk and a Badge: An Exploratory Analysis of Personal Achievements in GitHub [13.6] GitHubは、個人的成果を通じて新しい要素を導入し、バッジをアンロックし、開発者自身のプロフィールページに表示し、開発活動を認識した。
GitHubにおける個人バッジの拡散を研究するために,混合手法を用いた探索分析を行った。
ほとんどの開発者は少なくともバッジをサンプルにしているが、プロフィールを非公開にし、バッジを表示することをオプトアウトするユーザーの増加も観察している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:06:35 GMT)
Auxiliary-Loss-Free Load Balancing Strategy for Mixture-of-Experts [13.4] 不均衡な専門家の負荷は、ルーティングの崩壊や計算オーバーヘッドの増加につながる。
本稿では,ロバストな負荷分散戦略を特徴とするロスフリーバランシングを提案する。
最大200Bトークンでトレーニングされた最大3Bパラメータを持つMoEモデル上でのロスフリーバランシングの性能を検証する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:31:09 GMT)
Spatio-Temporal Context Prompting for Zero-Shot Action Detection [13.2] 本稿では,視覚言語モデルの豊富な知識を効果的に活用し,対人インタラクションを実現する手法を提案する。
同時に複数の人物による異なる行動を認識するという課題に対処するために,興味あるトークンスポッティング機構を設計する。
提案手法は,従来の手法に比べて優れた結果を得ることができ,さらにマルチアクションビデオに拡張することができる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:59:05 GMT)
WildfireGPT: Tailored Large Language Model for Wildfire Analysis [12.9] WildfireGPTは、ユーザクエリを、山火事のリスクに関する実行可能な洞察に変換するために設計されたプロトタイプエージェントである。
我々は、WildfireGPTに気候予測や科学文献などの追加のコンテキストを提供することで、その情報が現在、関連性、科学的に正確であることを保証する。
これによってWildfireGPTは,さまざまなエンドユーザをサポートするために,山火事のリスクに関する詳細なユーザ特有の洞察を提供する上で,効果的なツールになります。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 19:01:23 GMT)
Interactive Agents: Simulating Counselor-Client Psychological Counseling via Role-Playing LLM-to-LLM Interactions [12.5] 本稿では,カウンセラーとクライアントの相互作用をシミュレートするためのロールプレイングを通じて,2つの大きな言語モデル(LLM)を利用するフレームワークを提案する。
我々のフレームワークは2つのLCMで構成され、1つは特定の実生活のユーザープロファイルを備えたクライアントとして機能し、もう1つは経験豊富なカウンセラーとして機能する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:29:59 GMT)
Generating Binary Species Range Maps [12.3] 種分散モデル(SDM)や、より最近では、ディープラーニングベースの変種が、潜在的な自動化された代替手段を提供する。
深層学習に基づくSDMは、特定の場所における種の存在を予測した確率を連続的に生成する。
本研究では,プレゼンスのみのデータを用いたレンジマップのバイナライズのための最適しきい値の自動同定手法について検討した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:17:20 GMT)
wav2pos: Sound Source Localization using Masked Autoencoders [12.3] 本稿では,分散アドホックマイクロホンアレイの3次元音源定位タスクに対して,それをセット・ツー・セット回帰問題として定式化し,新しい手法を提案する。
このような定式化は,入力に隠された座標を再構成することにより,音源の正確な位置決めを可能にすることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:09:20 GMT)
FRAME: A Modular Framework for Autonomous Map Merging: Advancements in the Field [12.2] 本稿では,エゴセントリックなマルチロボット探査における3次元点雲マップの融合について述べる。
提案手法は、最先端の場所認識と学習記述子を利用して、地図間の重複を効率的に検出する。
提案手法の有効性は,ロボット探査の複数のフィールドミッションを通じて実証された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:43:26 GMT)
Activation function optimization method: Learnable series linear units (LSLUs) [12.1] LSLU (Learnable Series Linear Units) と呼ばれる直列学習可能なac-tivation関数を提案する。
この方法は、精度を向上しつつ、ディープラーニングネットワークを単純化する。
CIFAR10, CIFAR100および特定のタスクデータセット(例えばSilkworm)上でのLSLUの性能を評価する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:12:27 GMT)
TempoFormer: A Transformer for Temporally-aware Representations in Change Detection [12.1] 現在のアプローチは、通常時間的に非依存な事前訓練された表現を通じて、コンテキストをモデル化する。
本稿では,動的表現学習のためのFistタスク非依存型トランスフォーマーと時間認識型モデルであるTempoFormerを紹介する。
本手法はコンテキスト間の動的および内部的力学を共同で訓練し,回転位置埋め込みの時間的変化を新たに導入する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:25:53 GMT)
Interpretable Image Emotion Recognition: A Domain Adaptation Approach Using Facial Expressions [11.8] 本稿では,ジェネリックイメージ中の感情を識別するための特徴に基づくドメイン適応手法を提案する。
これは、事前訓練されたモデルと、画像感情認識(IER)のための十分に注釈付けされたデータセットの限られた可用性の課題に対処する。
提案されたIERシステムは、IAPSaデータセットの60.98%、ArtPhotoデータセットの58.86%、FIデータセットの69.13%、EMOTICデータセットの58.06%の感情分類精度を示した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 22:05:07 GMT)
ES-PTAM: Event-based Stereo Parallel Tracking and Mapping [11.8] イベントカメラは、標準的なカメラの限界を克服する利点を提供する。
2つのアイデアを組み合わせたイベントベースステレオVOシステムを提案する。
実世界の5つのデータセットからシステムを評価する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:56:28 GMT)
Skills Regularized Task Decomposition for Multi-task Offline Reinforcement Learning [11.8] 多様なオフラインデータセットを持つ強化学習(RL)は、複数のタスクの関係を活用する利点がある。
異なる品質の行動ポリシーによって生成される異種データセットに対して,スキルベースのマルチタスクRL手法を提案する。
我々のマルチタスクオフラインRLアプローチは、異なる品質データセットの混合構成に対して堅牢であることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:36:20 GMT)
Provable Probabilistic Imaging using Score-Based Generative Priors [11.6] 一般逆問題に対する可能性空間を特徴付けるための原理的枠組みとして, プラグアンドプレイ型モンテカルロ(PMC)を提案する。
PMCは、高画質の画像再構成のために、表現力のあるスコアベースの生成先を組み込むことができ、また後方サンプリングによる不確実な定量化を行うことができる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:29:17 GMT)
A Survey on Evaluation of Multimodal Large Language Models [11.6] マルチモーダル大規模言語モデル(MLLM)は、強力な大規模言語モデル(LLM)を統合することで、人間の知覚と推論システムを模倣する
この枠組みはMLLMに人間のような能力を与え、人工知能(AGI)の実現への潜在的経路を示唆している。
GPT-4V や Gemini のような全周MLLM の出現に伴い,様々な次元にわたってその能力を評価するための評価手法が開発されている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:05:55 GMT)
Lipschitz-regularized gradient flows and generative particle algorithms for high-dimensional scarce data [11.4] 我々は、潜在的に少ない高次元データから任意の目標分布を効率的に学習することのできる、新しい生成アルゴリズムのクラスを構築する。
これらの生成アルゴリズムは粒子ベースであり、Lipschitz-regularized Kullback-Leiblerなどの$f$-divergencesの勾配流として構築される。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 01:37:40 GMT)
Language-specific Calibration for Pruning Multilingual Language Models [11.4] 様々なタスク,モデル,最先端のプルーニング技術にまたがる多言語モデルのプルーニングのためのキャリブレーション言語を比較した。
対象言語のキャリブレーションは,主に流布やコヒーレンスに関連する言語固有の特徴の保存に寄与するが,言語理解や推論といった言語に依存しない特徴の獲得には寄与しないと考えられる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:03:54 GMT)
A Comprehensive Review of 3D Object Detection in Autonomous Driving: Technological Advances and Future Directions [11.1] 3次元物体認識は、自律運転システムの開発において重要な要素となっている。
本稿では,カメラベース,LiDARベース,核融合検出技術を中心に,従来の3次元物体検出手法を概説する。
本稿では、時間知覚、占有グリッド、エンドツーエンド学習フレームワークなどの精度向上手法を含む今後の方向性について論じる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 01:08:33 GMT)
CSAD: Unsupervised Component Segmentation for Logical Anomaly Detection [10.7] 我々は,人間のラベル付けを伴わない軽量セグメンテーションネットワークのためのトレーニングラベルを生成する,教師なしコンポーネントセグメンテーション手法を開発した。
我々は,従来のSOTA法を超越したMVTec LOCO ADデータセットにおいて,95.3%のAUROC検出を実現する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:27:41 GMT)
TeFF: Tracking-enhanced Forgetting-free Few-shot 3D LiDAR Semantic Segmentation [10.6] 本稿では,LiDARデータの時間的連続性を利用して,現在の数ショットセマンティックセマンティックセマンティクスの限界に対処する。
追跡モデルを用いて、LiDARフレームのシーケンスから擬似地下構造を生成し、新しいクラスで学習するデータセットの能力を向上する。
トレーニング可能なパラメータの数を減らし,新しいクラスへの適応性を向上しつつ,ベースクラス上でのモデル性能を保留するテクニックであるLoRAを取り入れた。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:18:36 GMT)
Inferring Individual Direct Causal Effects Under Heterogeneous Peer Influence [10.6] ネットワークにおける因果推論は、ユニットの結果がピアの治療や結果に影響された場合に発生する干渉を考慮に入れなければならない。
本稿では,ネットワーク構造,干渉条件,因果依存性に関する様々な仮定を捉えることができるネットワークの構造因果モデルを提案する。
因果モデルを用いて、潜在的な異種コンテキストを見つけ、個別の因果効果を推定する新しいグラフニューラルネットワークに基づく推定器を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:27:25 GMT)
Software Solutions for Newcomers' Onboarding in Software Projects: A Systematic Literature Review [10.5] 本研究の目的は,新規参入者を対象とした最先端ソフトウェアソリューションの同定である。
我々は新参者向けのソフトウェアソリューションに関する32の研究を分析した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:55:17 GMT)
SpineMamba: Enhancing 3D Spinal Segmentation in Clinical Imaging through Residual Visual Mamba Layers and Shape Priors [10.4] 本研究では,3次元脊髄データの深部意味的特徴と長距離空間依存性をモデル化するための残留視覚的マンバ層を提案する。
また, 医療画像から脊椎の解剖学的情報を抽出する新規な脊髄形状先行モジュールを提案する。
SpineMambaはセグメンテーション性能が優れており、最大2ポイントを超える。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:59:40 GMT)
WeKnow-RAG: An Adaptive Approach for Retrieval-Augmented Generation Integrating Web Search and Knowledge Graphs [10.4] 本稿では,Web検索と知識グラフを統合したWeKnow-RAGを提案する。
まず,知識グラフの構造化表現と高次ベクトル検索の柔軟性を組み合わせることで,LLM応答の精度と信頼性を向上させる。
提案手法は,情報検索の効率と精度を効果的にバランスさせ,全体の検索プロセスを改善する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:47:28 GMT)
Shot Segmentation Based on Von Neumann Entropy for Key Frame Extraction [10.1] Von Neumannエントロピーを用いたショットセグメンテーションに基づくビデオ鍵フレーム抽出アルゴリズムを提案する。
抽出されたキーフレームは、繰り返しフレーム数を最小化しつつ、元のビデオ内容を完全にかつ正確に表現することができる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:04:52 GMT)
Dolphin: Long Context as a New Modality for Energy-Efficient On-Device Language Models [9.9] Dolphinは、言語モデルにおける長いコンテキストのエネルギー効率の高い処理のための新しいデコーダデコーダアーキテクチャである。
弊社のアプローチは、デバイス上のモデルに固有の、エネルギー消費とレイテンシの問題に対処する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 04:06:14 GMT)
Function-Space MCMC for Bayesian Wide Neural Networks [9.9] 本研究では,プレコンディション付きクランク・ニコソン法とそのランゲヴィン法を用いて,重みの分離後分布の標本化を行った。
提案手法の受容確率は,ネットワークの幅が大きくなるにつれて1に近づく。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:17:18 GMT)
Boost Your NeRF: A Model-Agnostic Mixture of Experts Framework for High Quality and Efficient Rendering [9.9] 本研究では,Sparsely-Gated Mixture of Expertsにインスパイアされたモデル非依存のフレームワークを導入し,計算複雑性を増大させることなくレンダリング品質を向上させる。
本稿では,専門家の能力を最大化するために設計された新しいゲートの定式化と,空間を効果的に誘導し,シーンを分解する解像度ベースのルーティング手法を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:49:14 GMT)
Multi-modal Adversarial Training for Zero-Shot Voice Cloning [9.8] 実音声特徴と生成音声特徴を条件付きで識別するトランスフォーマーエンコーダデコーダアーキテクチャを提案する。
我々は、FastSpeech2音響モデルに適用し、大規模マルチスピーカーデータセットであるLibriheavyのトレーニングを行うことにより、新しい対角訓練手法を導入する。
本モデルは,音声品質と話者類似度の観点から,ベースラインに対する改善を実現する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:30:41 GMT)
Phase Matching for Out-of-Distribution Generalization [9.8] 本稿では,ドメイン一般化(DG)と周波数成分の関係を明らかにすることを目的とした。
我々は、DG問題に対処するPhaMaと呼ばれる位相マッチング手法を提案する。
複数のベンチマーク実験により,提案手法が最先端性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:45:08 GMT)
FADE: Towards Fairness-aware Augmentation for Domain Generalization via Classifier-Guided Score-based Diffusion Models [9.7] FairDG(Fairness-Aware Domain Generalization)は、信頼できるAIシステムを展開する上で重要な課題である。
フェアネスに対処する伝統的な手法は、分布シフトに対する考慮の欠如により、領域一般化において失敗している。
フェアネスを意識したスコアガイド拡散モデル(FADE)をFairDG問題に効果的に対処するための新しいアプローチとして提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:46:28 GMT)
Transfer Learning from Simulated to Real Scenes for Monocular 3D Object Detection [9.7] 本稿では,これらの課題に対処するための2段階のトレーニング戦略を紹介する。
当社のアプローチでは,大規模合成データセットであるRoadSense3Dのモデルをトレーニングしています。
実世界のデータセットの組み合わせでモデルを微調整し、実用条件への適応性を高める。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:44:58 GMT)
Evaluation of Quantum Annealing-based algorithms for flexible job shop scheduling [9.7] フレキシブルなジョブショップスケジューリング問題(FJSSP)は、複雑な最適化タスクを提供する。
近似法は、ソリューションが許容される時間枠内にあることを保証するために使用される。
量子力学的効果を利用したメタヒューリスティックな量子アナリングは、短時間で優れた解品質を示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:52:14 GMT)
An Empirical Study of API Misuses of Data-Centric Libraries [9.7] 本稿では,データ処理,数値計算,機械学習,可視化などの分野をカバーする5つのデータ中心ライブラリのAPI誤用に関する実証的研究を行う。
Stack OverflowとGitHubのデータを分析することで、これらのライブラリの誤用を特定します。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:15:52 GMT)
On the Benefits of Visual Stabilization for Frame- and Event-based Perception [9.6] 本稿では,カメラの回転運動を補償する処理ベース安定化手法を提案する。
特徴追跡とカメラのエゴモーションの翻訳成分の推定という,2つの認識応用における安定化の利点を評価する。
安定度は、それぞれ27.37%と34.82%で特徴追跡とカメラのエゴモーション推定の精度を向上できることを示した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:49:30 GMT)
An Artificial Neural Network for Image Classification Inspired by Aversive Olfactory Learning Circuits in Caenorhabditis Elegans [9.6] 本研究では,線虫Caenorhabditis elegans(C. elegans)の逆嗅覚学習回路に触発された画像分類タスクのためのニューラルネットワーク(ANN)を提案する。
さまざまなタスクにおけるANNの顕著なパフォーマンスにもかかわらず、過度なパラメータ化、高いトレーニングコスト、限られた一般化能力といった課題に直面している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 02:59:13 GMT)
Imperceptible Protection against Style Imitation from Diffusion Models [9.5] 保護機能を保ちながら視覚的に改善された保護方法を提案する。
我々は,人間の目に敏感な領域に注目する知覚マップを考案した。
また,アートワークがどれだけの強度を保護・動的に調整することが難しいかを予測し,難易度に配慮した保護も導入した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:13:45 GMT)
MR-Adopt: Automatic Deduction of Input Transformation Function for Metamorphic Testing [9.5] 本稿では,ハードコードされたソースから入力変換と追従入力を自動的に推定するMR-Adoptを提案する。
MR-Adopt生成の入力変換を組み込むことで、符号化されたMRベースのテストケースは、テスト精度を効果的に向上させることができる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:24:48 GMT)
Novel ground states and emergent quantum many-body scars in a two-species Rydberg atom array [9.5] ライドバーグ原子配列は量子シミュレーションと量子計算のための魅力的なプラットフォームとして確立されている。
光学的ツイーザーアレイを用いた2種の原子のトラップと制御の最近の発展により、より複雑な相互作用がもたらされた。
従来のコールド原子プラットフォームには存在しない新しい量子状態がいくつか見つかる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:36:10 GMT)
CGRA4ML: A Framework to Implement Modern Neural Networks for Scientific Edge Computing [9.4] CGRA4MLは、ニューラルネットワークモデルの複雑さと極端なパフォーマンス要件の間のギャップを埋めるために設計された、オープンソースのモジュラーフレームワークである。
HLS4MLとは異なり、CGRA4MLはSystemVerilog RTLを生成しており、ASICやFPGAの設計フローをターゲットにするのに適している。
CGRA4MLのPython API、SystemVerilogハードウェア、Tclツールフロー、Cランタイムの最小限のモジュラーインフラストラクチャは、統合と実験を容易にする。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:24:13 GMT)
Thinner Latent Spaces: Detecting dimension and imposing invariance through autoencoder gradient constraints [9.4] ネットワークの潜在層内の直交関係を利用して、非線形多様体データセットの内在次元性を推定できることを示す。
微分幾何学に依拠する関係理論を概説し、対応する勾配偏光最適化アルゴリズムについて述べる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:56:35 GMT)
Explicit Modelling of Theory of Mind for Belief Prediction in Nonverbal Social Interactions [9.3] マルチモーダル入力から人間の社会的相互作用における信念とそのダイナミクスを予測するための、心の理論(ToM)ニューラルネットワークであるMToMnetを提案する。
MToMnetはコンテキストキューを符号化し、個人固有のキュー(人間の視線とボディランゲージ)を、それぞれ個別のMindNetに統合する。
以上の結果から,MToMnetは既存の手法をはるかに上回り,同時にパラメータも大幅に少なくなることが明らかとなった。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:26:06 GMT)
3D Reconstruction with Spatial Memory [9.3] 本稿では,順序付きあるいは順序なしの画像コレクションから高密度な3次元再構成を行う新しいアプローチであるSpann3Rを提案する。
DUSt3Rパラダイムに基づいて構築されたSpann3Rは、トランスフォーマーベースのアーキテクチャを使用して、シーンやカメラパラメータに関する事前の知識を必要とせずに、画像から直接ポイントマップを回帰する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:01:00 GMT)
How Physics and Background Attributes Impact Video Transformers in Robotic Manipulation: A Case Study on Planar Pushing [8.4] 本稿では,物理特性と背景特性が映像変換器の性能に与える影響について検討する。
提案するCloudGripper-Push-1Kは,大規模なビジョンベースロボットのプッシュデータセットである。
また,ビデオ・オクルージョン・トランスフォーマ (VOT) を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:34:33 GMT)
Avoiding Generative Model Writer's Block With Embedding Nudging [8.3] 我々は、遅延拡散画像生成モデルと、それらがオーバーヘッドに制限された類似画像を生成しながら、それらが特定の画像を生成するのを防ぐ方法に焦点をあてる。
本手法は,修正されていないモデルと同等の画質と関連性を保ちながら,記憶されたトレーニング画像の生成を効果的に防止する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 00:07:51 GMT)
Research Advances and New Paradigms for Biology-inspired Spiking Neural Networks [8.3] スパイキングニューラルネットワーク(SNN)は、計算シミュレーションと人工知能の分野で人気を集めている。
本稿では,SNNの歴史的発展を考察し,これら2つの分野が相互に交わり,急速に融合していることを結論する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:28:57 GMT)
Addressing the challenges of loop detection in agricultural environments [8.2] オープンフィールドにおけるロバストループ検出への道を開く新しい手法を提案する。
提案手法は, 中央値15cmの誤差で, 常に良好なループ検出を実現する。
オープンフィールドをループ検出のための新しい環境として特徴付け,それを扱う際の限界や問題を理解することを目的としている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:56:00 GMT)
Grand canonical generative diffusion model for crystalline phases and grain boundaries [8.2] 拡散モデルは、材料科学のための原子構造を生成する強力なツールとして登場した。
この研究は、原子を点雲として表す現在の粒子ベースの拡散モデルが欠如していることに注意を向けている。
粒子の固定個数ではなく連続的なボクセルに基づく別の表現を取り入れた解、グランドカノニカル拡散モデルを開発した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:49:29 GMT)
QEDCartographer: Automating Formal Verification Using Reward-Free Reinforcement Learning [8.1] QEDCartographerは、教師付きと強化学習を組み合わせた自動証明合成ツールである。
オープンソースCoqプロジェクトの68.5K定理のCoqGymベンチマークを用いて,QEDCartographerを評価した。
本研究は,強化学習が証明合成ツールの探索機構を改善するための実りある研究方向であることを実証する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:10:40 GMT)
Field-of-View Extension for Brain Diffusion MRI via Deep Generative Models [8.1] 本研究の目的は,不完全な視野を持つ既存のdMRIスキャンから直接,欠落したスライスを出力する手法を開発することである。
不完全なFOVを用いたdMRIスキャンにおいて、欠損脳領域を推定する深層生成モデルに基づくフレームワークを提案する。
提案手法はより正確で完全かつ拡張されたFOVで全脳トラクトグラフィーを施行し,アルツハイマー病関連結束解析における不確かさを低減した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:29:12 GMT)
Can Visual Language Models Replace OCR-Based Visual Question Answering Pipelines in Production? A Case Study in Retail [8.0] 本稿では,視覚質問応答タスクにおける視覚言語モデル(VLM)の性能と限界について分析する。
我々は、Retail-786kデータセットから得られたデータを用いて、事前訓練されたVLMの能力を調べ、画像内の広告商品に関する詳細な質問に答える。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:25:41 GMT)
Boosting Lossless Speculative Decoding via Feature Sampling and Partial Alignment Distillation [8.0] 損失のない投機的復号化は、ターゲットとする大言語モデル推論を加速する。
FSPAD (Feature Sampling and partial Alignment Distillation for Lossless Speculative Decoding) を提案する。
我々の実験は、ヴィクナ級数とLLaMA3-インストラクト級数で最大かつ最小のモデルにおいて、欲求と非欲求デコーディングの両方を含む。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:28:01 GMT)
Raising AI Ethics Awareness through an AI Ethics Quiz for Software Practitioners [7.9] 研究は、AI倫理と倫理原則に対する実践者の認識と知識に重大なギャップがあることを示唆している。
我々は、ソフトウェア実践者間の認知を高め、AI倫理の知識を高めるための、ソフトウェアベースのツールであるAI Ethics Quizを開発した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 23:36:13 GMT)
Variational-Cartan Quantum Dynamics Simulations of Excitation Dynamics [7.9] 量子力学シミュレーション(QDS)は、量子コンピューティングの最も期待されている応用の1つである。
ハミルトンシミュレーションアルゴリズムを実装するための量子回路深さは、一般に時間に依存する。
本研究は, 時間依存システムと変分ハミルトンシミュレーションを組み合わせることで, 時間依存システムを研究するためのCDベースのハミルトンシミュレーションアルゴリズムを一般化する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:01:38 GMT)
Enhancing Quantitative Image Synthesis through Pretraining and Resolution Scaling for Bone Mineral Density Estimation from a Plain X-ray Image [7.8] 本研究の目的は、事前学習と画像分解能のスケーリングを探索することで、定量的画像合成(QIS)を改善することである。
原X線画像からのQISに基づく骨密度推定のタスクを用いて,プレトレーニング性能を評価するためのベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:40:18 GMT)
Defending Text-to-image Diffusion Models: Surprising Efficacy of Textual Perturbations Against Backdoor Attacks [7.8] テキスト間拡散モデルに対する最先端のバックドア攻撃は、驚くほど単純な防御戦略であるテキスト摂動によって効果的に軽減できることを示す。
実験により、テキストによる摂動は、最先端のバックドア攻撃に対する防御に有効であり、生成品質に対する犠牲は最小限であることが示された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:36:43 GMT)
When Multi-Task Learning Meets Partial Supervision: A Computer Vision Review [7.8] マルチタスク学習(MTL)は,相互関係を利用して複数のタスクを同時に学習することを目的としている。
このレビューは、これらの課題に対処するために、異なる部分的な監視設定の下でMTLをどのように活用するかに焦点を当てる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:30:36 GMT)
Enhancing and Accelerating Large Language Models via Instruction-Aware Contextual Compression [7.7] 大規模言語モデルに無関係なコンテキストを提供すると、応答が低下し、推論遅延が増加し、コストが上昇する。
本稿では,少ない情報内容のフィルタリングを行うインストラクション・アウェア・コンテクスト圧縮手法を提案する。
Instruction-Aware Contextual Compressionはメモリ消費を著しく減らし、生成遅延を最小化する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 02:31:15 GMT)
TrafficGamer: Reliable and Flexible Traffic Simulation for Safety-Critical Scenarios with Game-Theoretic Oracles [7.6] 本稿では,一般的な道路運転をマルチエージェントゲームとして見ることにより,ゲーム理論的な交通シミュレーションを容易にするTrafficGamerを紹介する。
実世界のさまざまなデータセットにおける経験的パフォーマンスの評価において、TrafficGamerはシミュレートされたシナリオの忠実性と悪用性の両方を保証する。
結果は、TrafficGamerが様々なコンテキストにまたがって非常に柔軟なシミュレーションをしていることを示している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 05:11:16 GMT)
Deep Learning to Predict Late-Onset Breast Cancer Metastasis: the Single Hyperparameter Grid Search (SHGS) Strategy for Meta Tuning Concerning Deep Feed-forward Neural Network [7.3] n年前から乳がんの転移を予測できるDFNNモデルの構築に取り組んできた。
この課題は、時間とリソースの制約を考慮して、グリッドサーチによって最適なハイパーパラメータ値を効率的に特定することにある。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:00:43 GMT)
Airfoil Diffusion: Denoising Diffusion Model For Conditional Airfoil Generation [7.1] 拡散モデルを用いた翼生成のためのデータ駆動手法を提案する。
我々のモデルは、既存の翼のデータセットに基づいて訓練され、ランダムなベクトルから任意の数の新しい翼を生成することができる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:12:16 GMT)
Easy, Interpretable, Effective: openSMILE for voice deepfake detection [6.9] ASVspoof5は、音声認証とディープフェイク検出の分野で事実上の標準である。
非常に単純な特徴の小さなサブセットを用いて、攻撃を驚くほどの精度で識別できることが示される。
これらの特徴の一般化能力を探求し、それらのうちのいくつかが攻撃間で効果的に転送されていることを発見した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:14:18 GMT)
Structural Optimization of Lightweight Bipedal Robot via SERL [6.8] 本稿では,移動課題の強化学習と進化アルゴリズムを組み合わせたSERL(Structure Evolution Reinforcement Learning)アルゴリズムを提案する。
We designed a bipedal robot called Wow Orin, where the optimal leg length are obtained through optimization based on body structure and motor Turk。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:34:05 GMT)
Large Language Models Understand Layout [6.7] 大規模言語モデル(LLM)は、幅広い自然言語処理(NLP)タスクにおいて異常な能力を示す。
テキスト理解能力以外にも,空間マーカーで表されるテキストレイアウトをLLMで処理できることが示されている。
レイアウト理解能力は,視覚的質問応答(VQA)システム構築に有用であることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 02:04:24 GMT)
Synthetic Forehead-creases Biometric Generation for Reliable User Verification [6.6] 本稿では,前頭葉画像データを一意性やリアリズムといった重要な特徴を維持しつつ合成する新しい枠組みを提案する。
Fr'echet Inception Distance (FID) と構造類似度指数測定 (SSIM) を用いて、生成された額部画像の多様性と現実性を評価する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:33:00 GMT)
Generalization Capabilities of Neural Cellular Automata for Medical Image Segmentation: A Robust and Lightweight Approach [6.5] U-Netは、トレーニング分布から逸脱したデータでテストすると、パフォーマンスが大幅に低下する。
本稿では,従来のU-Netに比べて3桁の規模(すなわちx1000)のモデルを活用することの意味について検討する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:18:55 GMT)
Exploring the possibility of a complex-valued non-Gaussianity measure for quantum states of light [6.5] ウィグナー関数とそのガウス対応の間の微分相対エントロピーを導入し、そのポテンシャルを非ガウス性測度として検討する。
提案した位相空間に基づく非ガウス性測度は複素数値であり、その虚部はウィグナー関数の負体積の物理的意味を持つ。
同時に、この測度の実部は余分な情報層を提供し、複素数値を非ガウス性の測度とする。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:52:24 GMT)
3-in-1: 2D Rotary Adaptation for Efficient Finetuning, Efficient Batching and Composability [6.5] 大規模言語モデル (LLM) に適応するために, 簡単な2次元回転を用いた新しい手法RoAdを導入する。
RoAdはパラメータ効率が非常に高く、8つの常識推論タスク、4つの算術推論タスクと0.1%のトレーニング可能なパラメータを提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:45:29 GMT)
Decentralized Online Learning for Random Inverse Problems Over Graphs [6.4] ヒルベルト空間におけるアルゴリズムの安定性の収束性は、$_$-bounded martingale difference 項で表される。
ネットワークグラフが連結され、フォワード演算子の列が励起条件の無限次元時間持続性を満たすなら、全てのノードの推定は平均平方である。
非定常オンラインデータに基づく分散オンライン学習アルゴリズムをRKHSで提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 00:28:46 GMT)
Halfway Escape Optimization: A Quantum-Inspired Solution for General Optimization Problems [6.4] 本稿ではまず,高次収束率で高次元の地形を特徴とする一般最適化問題に対処するために,量子インスパイアされたメタヒューリスティックであるHalfway Escape Optimization (HEO)アルゴリズムを提案する。
本研究では,粒子群最適化 (PSO), 遺伝的アルゴリズム (GA), 人工魚群アルゴリズム (AFSA), グレイウルフ (GWO), 量子行動群最適化 (QPSO) など,確立された最適化アルゴリズムに対するHEOの性能を総合的に比較した。
圧力容器設計におけるHEOの有効性と実時間応用の可能性
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:19:27 GMT)
Evaluating Computational Representations of Character: An Austen Character Similarity Benchmark [6.3] 本稿では,ジェーン・オーステンの小説におけるキャラクター類似性のベンチマークスイートであるAustinAlikeを紹介する。
我々のベンチマークは、構造的に定義された類似性の概念、社会的に定義された類似性の概念、文学的批判から抽出された専門家定義セットの3つの概念に基づく。
我々は、4種類の特徴から文字表現を構築し、3つのAustinAlikeベンチマークとGPT-4類似度ランキングと比較する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:36:35 GMT)
Quasi-Lindblad pseudomode theory for open quantum systems [6.2] ガウス浴を線形結合した開量子系の力学を研究するための新しい枠組みを導入する。
提案手法は, 連続浴を擬似モードの補助的な離散集合と散逸ダイナミクスに置き換える。
この準Lindblad擬モードの定式化は、複素指数の複素重み付き和の観点から、入浴相関関数の表現につながることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 04:26:13 GMT)
GenDDS: Generating Diverse Driving Video Scenarios with Prompt-to-Video Generative Model [6.1] GenDDSは、自律運転システムの運転シナリオを生成するための新しいアプローチである。
我々は、実際の運転ビデオを含むKITTIデータセットを使用して、モデルをトレーニングする。
実世界の運転シナリオの複雑さと変動性を密に再現した高品質な運転映像を,我々のモデルで生成できることを実証した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:37:44 GMT)
Life Histories of Taboo Knowledge Artifacts [6.1] このプロジェクトは、Wikipediaのタブートピックに関する以前の研究に基づいている。
我々は,タブー記事の生活を物語的に表現する。
タブー知識アーティファクトの開発における6つのテーマを特定し,記述する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 19:06:29 GMT)
Nexus: Specialization meets Adaptability for Efficiently Training Mixture of Experts [6.1] 我々は、高度専門家モデルをMoEに"アップサイクル"することに集中し、特殊化を改善しつつ、新しいタスクに容易に適応できる機能を追加することを目的としています。
適応的なルーティングを備えた拡張MoEアーキテクチャであるNexusを導入し、ドメイン表現から専門家の埋め込みをプロジェクト化する。
実験の結果,Nexusは初回サイクルのベースラインよりも最大2.1%向上し,また,限られた微調整データを用いてMoEを新たな専門家で拡張する相対的なゲインが18.8%向上していることがわかった。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:12:55 GMT)
Segmentation-guided Layer-wise Image Vectorization with Gradient Fills [6.0] そこで本稿では,画像を勾配を埋め込んだ簡潔なベクトルグラフに変換するためのセグメンテーション誘導ベクトル化フレームワークを提案する。
組込み勾配認識セグメンテーションの指導により, 段階的に勾配を埋め込んだB'ezierパスを出力に付加する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:08:25 GMT)
A New Method for Cross-Lingual-based Semantic Role Labeling [6.0] 英語とペルシア語のセマンティック・ロール・ラベリングを訓練するためのディープラーニングアルゴリズムが提案されている。
その結果,Niksirt et al.のモデルと比較すると,有意な改善が認められた。
セマンティックロールラベリングのための言語間メソッドの開発は、約束を守る。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:06:12 GMT)
Scaling Up Diffusion and Flow-based XGBoost Models [5.9] 本稿では,XGBoostを拡散・流れマッチングモデルにおける関数近似器として利用するための最近の提案について検討する。
より優れた実装では、以前よりも370倍大きなデータセットにスケールできる。
我々は,Fast Calorimeter Simulation Challengeの一環として,大規模科学的データセットについて報告する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:00:00 GMT)
LLM-assisted Labeling Function Generation for Semantic Type Detection [5.9] ラベル付け機能を利用した意味型検出のためのトレーニングデータのアノテートを支援するために弱い監視手法を提案する。
このプロセスの課題の1つは、データレイクテーブルデータセットの大量かつ低品質のため、ラベル付け関数を手作業で記述することの難しさである。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 23:39:50 GMT)
ANVIL: Anomaly-based Vulnerability Identification without Labelled Training Data [5.9] 教師付き学習ベースのソフトウェア脆弱性検出装置は、ラベル付きトレーニングデータの不十分な可用性のために、しばしば不足する。
本稿では,脆弱性検出を異常検出の1つとして再検討する。
我々のアプローチは、ラインレベルの脆弱性検出タスクにおいて、1.62times$から2.18times$より優れたトップ5アキュラシー、1.02times$から1.29times$より優れたROCスコアを達成する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:28:17 GMT)
Corner Charge Fluctuations and Many-Body Quantum Geometry [5.8] U(1)大域対称性を持つ多体系では、部分領域の電荷ゆらぎは絡みや他の大域的性質に関する重要な洞察を示す。
この単純な式は、複合フェルミ液体を含む電荷絶縁体には不十分であることを示す。
我々は、未投射パートン状態や複合フェルミ波動関数を含む広い種類の量子ホール波動関数が境界を飽和させることを発見した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:00:28 GMT)
Evaluating Model Robustness Using Adaptive Sparse L0 Regularization [5.8] 敵の例は、機能の最小限のサブセットを変更することで、既存の防御に挑戦します。
現在のL0標準攻撃手法は、精度と効率のトレードオフに直面している。
本稿では,L0ノルムを基準として,新たな,スケーラブルで効果的な逆例生成手法を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:02:23 GMT)
ClimDetect: A Benchmark Dataset for Climate Change Detection and Attribution [5.7] ClimDetectは、毎日816万の気候スナップショットを標準化したデータセットです。
ClimDetectは、過去の研究で使われた様々な入力変数とターゲット変数を統合し、一貫性を確保する。
私たちのオープンアクセスデータとコードは、モデル評価の改善を通じて気候科学を進化させるためのベンチマークとして役立ちます。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:58:53 GMT)
Alternating Direction Method of Multipliers for Negative Binomial Model with The Weighted Difference of Anisotropic and Isotropic Total Variation [5.5] 過分散ポアソン雑音による画像の復元のための最適化手法を提案する。
数値実験により提案手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:05:36 GMT)
Articulation Work and Tinkering for Fairness in Machine Learning [5.5] 本稿では,コンピュータ科学と学際研究(SOI)の公正なAI分野における緊張関係について検討する。
公正なAIの場合、有効な研究に必要なタスク、リソース、アクターを分析します。
CS研究者はある程度SOI研究に携わるが、組織的条件、調音作業、社会世界のあいまいさはSOI研究の実施可能性を制限する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:20:42 GMT)
Brant-X: A Unified Physiological Signal Alignment Framework [5.5] 特に、脳が生命活動の制御中心としての役割を考えると、脳波(EEG)は他の生理的信号と有意な相関を示す。
脳波と他の信号との相関をモデル化するための統合された生理学的信号アライメントフレームワークであるBrant-Xを提案する。
本手法は脳波基礎モデルを用いて脳波の豊富な知識を他の生理的信号にデータ効率よく伝達し,(2)脳波と他の信号のセマンティクスを完全に整合させる2段階のアライメントを導入する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:26:42 GMT)
A Neural Material Point Method for Particle-based Simulations [5.4] 本稿では,粒子シミュレーションのためのニューラルネットワークエミュレーションフレームワークNeuralMPMを提案する。
NeuralMPMは、ラグランジュ粒子を固定サイズグリッドに補間し、イメージ・ツー・イメージニューラルネットワークを使用してグリッドノードの更新を計算し、粒子に補間する。
流体力学や流体-固体相互作用など,いくつかのデータセット上でのNeuralMPMの利点を実証する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:39:51 GMT)
GINN-KAN: Interpretability pipelining with applications in Physics Informed Neural Networks [5.3] 本稿では,解釈可能性パイプラインの概念を導入し,複数の解釈可能性技術を導入し,各手法の精度を向上する。
我々は、標準的なニューラルネットワークアーキテクチャに解釈可能性を導入する可能性のために選択された2つの最近のモデルを評価する。
両モデルの利点を合成する新しい解釈可能なニューラルネットワークGINN-KANを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:48:31 GMT)
Beyond Levenshtein: Leveraging Multiple Algorithms for Robust Word Error Rate Computations And Granular Error Classifications [5.3] 単語誤り率(WER)は自動音声認識(ASR)の精度の一般的な尺度である
本稿では,ロバストな WER を計算するために,拡張Levenshtein 距離アルゴリズムを用いた非破壊的トークンベース手法を提案する。
我々はまた、句読点誤り率などの派生したユースケースの例分析や、実装のインタラクティブな使用と可視化のためのWebアプリケーションも提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:14:51 GMT)
Harnessing the Intrinsic Knowledge of Pretrained Language Models for Challenging Text Classification Settings [5.3] この論文は、事前学習された言語モデル(PLM)の本質的な知識を活用することによって、テキスト分類における3つの挑戦的な設定を探求する。
本研究では, PLMの文脈表現に基づく特徴量を利用したモデルを構築し, 人間の精度に匹敵する, あるいは超越する性能を実現する。
最後に、実効的な実演を選択することで、大規模言語モデルの文脈内学習プロンプトに対する感受性に取り組む。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:07:30 GMT)
Continual-learning-based framework for structural damage recognition [5.2] 鉄筋コンクリート構造物では多損傷が一般的であり、多数のニューラルネットワーク、パラメータ、データストレージが要求される。
本研究では,連続学習法を忘れずに学習を統合する連続学習に基づく損傷認識モデル(CLDRM)を提案する。
4つの認識タスクの3つの実験は、CLDRMフレームワークの有効性と有効性を検証するために設計された。
その結果,CLDRMフレームワークは適切な精度と有効性で損傷認識と分類に成功していることがわかった。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:50:04 GMT)
Towards Fully Autonomous Research Powered by LLMs: Case Study on Simulations [5.0] 本研究では,大規模言語モデルを用いた自律型シミュレーションエージェントの実現可能性について検討する。
高分子鎖配座のシミュレーション問題をケーススタディとして, 異なるLLMを用いたASAの性能評価を行った。
その結果,ASA-GPT-4oは指定された研究ミッションでほぼ不当に実行された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:48:05 GMT)
Infusion: internal diffusion for inpainting of dynamic textures and complex motion [4.9] ビデオの塗装は、ビデオ内の領域を視覚的に説得力のある方法で埋める作業である。
拡散モデルは、画像やビデオを含む複雑なデータ分散をモデル化する際、印象的な結果を示している。
ビデオインペイントの場合,ビデオの自己相似性が高いため,拡散モデルのトレーニングデータは入力ビデオに制限され,満足な結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:23:19 GMT)
Structured Event Reasoning with Large Language Models [4.9] 現実の出来事に対する推論は、AIとNLPの統一的な課題である。
私は、エンド・ツー・エンドのLLMが複雑なイベントを体系的に推論できないことを示しています。
イベントの構造化表現と合わせてLLMを使用するための3つの一般的なアプローチを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 19:03:41 GMT)
DeepDelveAI: Identifying AI Related Documents in Large Scale Literature Data [4.9] データセットは、バイナリ分類タスクに基づいてトレーニングされた高度なLong Short-Term Memory(LSTM)モデルを使用して作成された。
モデルはトレーニングされ、膨大なデータセットで検証され、高精度、精度、リコール、F1スコアが達成された。
結果として得られたDeepDelveAIデータセットは、1956年から2024年までのダートマス会議以来、940万以上のAI関連論文で構成されている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:30:28 GMT)
Evaluating Large Language Models on Spatial Tasks: A Multi-Task Benchmarking Study [4.8] 本研究では,新しいマルチタスク空間評価データセットを提案する。
データセットは、空間的理解と経路計画を含む12の異なるタスクタイプを含む。
この研究は、特定のタスクにおけるモデルパフォーマンスに対する迅速な戦略の影響を強調している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:19:36 GMT)
Chop Chop: Byzantine Atomic Broadcast to the Network Limit [4.7] Chop Chopは、ビザンティンの原子放送システムで、認証されたメモリプールを使用して、メッセージの順序付け、認証、復号化のコストを償却する。
蒸留されたバッチは、認証、復号化、順序付けが高速なメッセージの集合である。
64台の中規模サーバの地理的分散デプロイメントでは、Chop Chopは平均レイテンシ3.6秒で毎秒43,600,000メッセージを処理する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:05:46 GMT)
ConCSE: Unified Contrastive Learning and Augmentation for Code-Switched Embeddings [4.7] 本稿では、2つの言語が1つの発話の中で交わるコードスイッチング(CS)現象について検討する。
我々は、他の言語におけるCSの現在の等価制約(EC)理論は、部分的にしか英語と韓国のCSの複雑さを捉えていないことを強調した。
我々は,このような課題を緩和するために,英語と韓国のCSシナリオに適した新しいKoglishデータセットを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:27:21 GMT)
Beating the Ramsey limit on sensing with deterministic qubit control [4.6] 本稿では,デコヒーレンスの存在下でのキュービットの周波数測定の感度を高めるためのプロトコルを提案する。
我々は, 超伝導量子ビット上でのプロトコルの実証を行い, 1.65$times$でSNR, 1.09$times$でSNRを向上した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:40:01 GMT)
microYOLO: Towards Single-Shot Object Detection on Microcontrollers [4.6] 我々は,OpenMV H7 R2 などの Cortex-M ベースのマイクロコントローラで使用可能なマイクロYOLOを提案する。
microYOLOは、800KBのFlashと350KBのRAMを使用して、128x128のRGB画像を分類する際に約3.5FPSを達成する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:29:27 GMT)
MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition [4.5] MolNexTRは、ConvNextとVision-TRansformerの強みを融合させる、新しい画像からグラフまでのディープラーニングモデルである。
同時に原子と結合を予測し、それらのレイアウトルールを理解することができる。
テストセットでは, MolNexTR が優れた性能を示し,81~97% の精度を達成した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:57:26 GMT)
Single-Photon 3D Imaging with Equi-Depth Photon Histograms [4.4] 単一光子3Dカメラは、検出された光子タイムスタンプの等幅(EW)ヒストグラムを形成することにより、レーザーパルスのラウンドトリップ時間を推定する。
EWヒストグラムは高い帯域幅と画素内メモリを必要とするため、SPCはリソース制限された設定では魅力的ではない。
等深度(ED)ヒストグラムに基づく3次元センシング手法を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 22:02:38 GMT)
On-Device Training of Fully Quantized Deep Neural Networks on Cortex-M Microcontrollers [4.4] 本稿では,完全量子化トレーニング(FQT)と動的部分勾配更新を用いて,MCU上でDNNの効率的なトレーニングを可能にする手法を提案する。
マルチビジョンと時系列データセットに対するアプローチの実現可能性を示し、トレーニング精度、メモリオーバーヘッド、エネルギ、実際のハードウェアでのレイテンシのトレードオフに関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:36:08 GMT)
Latent Relationship Mining of Glaucoma Biomarkers: a TRI-LSTM based Deep Learning [4.4] 我々は認知科学の概念から学び、眼科医が緑内障の検出をどう判断するかを研究する。
本稿では,バイオマーカー指向機械学習モデルに基づく階層的意思決定システムを提案する。
本モデルは緑内障バイオマーカーの内在的な関係を探究する最初の試みの一つである。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:08:46 GMT)
A Survey of Large Language Models for European Languages [4.3] 大規模言語モデル(LLM)は、多岐にわたる自然言語処理における高い性能のため、大きな注目を集めている。
LLaMA, PaLM, GPT, MoE など LLM ファミリーの概要を報告する。
大規模言語モデルの事前学習に使用される共通単言語および多言語データセットの包括的要約を提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:56:37 GMT)
Correlation recurrent units: A novel neural architecture for improving the predictive performance of time-series data [4.2] 我々は,ニューラルネットワーク内で時系列分解を行うことができる相関再帰ユニット(CRU)と呼ばれる新しいニューラルアーキテクチャを提案する。
その結果,長期・短期予測性能は10%以上向上した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:17:44 GMT)
EmoAttack: Utilizing Emotional Voice Conversion for Speech Backdoor Attacks on Deep Speech Classification Models [4.2] 音声バックドア攻撃は、音声に固有の高レベルの主観的知覚特性である感情に戦略的に焦点を合わせることができる。
エモアタック法は、衝撃的なトリガー効果と、その顕著な攻撃成功率と精度のばらつきを保有する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:36:43 GMT)
Emulating Brain-like Rapid Learning in Neuromorphic Edge Computing [3.7] デジタルニューロモルフィック技術は、学習の2段階を用いて脳の神経とシナプスの過程をシミュレートする。
イベント駆動型視覚センサデータとIntel Loihiニューロモルフィックプロセッサの塑性ダイナミクスを用いたアプローチを実証する。
提案手法は任意の可塑性モデルで展開可能であり,学習の迅速化と適応を要求される状況に適用可能である。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:51:52 GMT)
Depth-Weighted Detection of Behaviours of Risk in People with Dementia using Cameras [3.7] 認知症の行動・心理的症状、例えば扇動や攻撃といった症状は、在宅ケアの環境において重大な健康・安全リスクを生じさせる。
医療施設は公共空間のデジタル監視のためにビデオカメラを設置しており、リスク検出システムの自動動作を開発するために利用することができる。
前回の研究では、カメラの近くで起きている活動による視界の妨害による誤報の存在が課題であった。
我々は、カメラの近距離および遠距離の両方で発生する事象に匹敵する重要性を示すために、カスタマイズされた畳み込みオートエンコーダを訓練するための新しい深度重み付き損失関数を提案した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 04:12:07 GMT)
Logic-Enhanced Language Model Agents for Trustworthy Social Simulations [3.5] 本研究では,人間のインタラクションモデルとしてのゲーム理論シナリオにおける意思決定に焦点を当てた。
本稿では,社会シミュレーションの信頼性を高める新しいアプローチである論理強化言語モデルエージェント(LELMA)フレームワークを紹介する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:25:35 GMT)
Large-Scale Demand Prediction in Urban Rail using Multi-Graph Inductive Representation Learning [3.5] 本稿では,大規模URTネットワークを対象としたMulti-Graph Inductive Representation Learning(mGraphSAGE)と呼ばれるOrigin-Destination(OD)需要予測モデルを提案する。
本稿では,日常業務の需要予測において,列車の遅延やキャンセルなどの運用上の不確実性を入力として含めることの重要性を示す。
実験の結果,mGraphSAGEは大規模URTネットワークにおけるOD需要予測に特に適しており,参照機械学習手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:20:05 GMT)
Multi-view Pose Fusion for Occlusion-Aware 3D Human Pose Estimation [3.4] 本稿では,人間とロボットのコラボレーションの文脈におけるロバストな3次元ポーズ推定手法を提案する。
提案手法は,最先端の多視点人間のポーズ推定手法より優れている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:10:57 GMT)
Network transferability of adversarial patches in real-time object detection [3.2] コンピュータビジョンにおける逆パッチは、ディープニューラルネットワークを騙し、意思決定プロセスを操作するために使用することができる。
本稿では,多数のオブジェクト検出器アーキテクチャ間の転送可能性について検討する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:47:34 GMT)
CodeSift: An LLM-Based Reference-Less Framework for Automatic Code Validation [3.2] 大規模言語モデル(LLM)はコード生成を大いに促進してきたが、生成されたコードの機能的正確性を保証することは依然として課題である。
従来のバリデーション手法は、多くの場合、大量のコードに対して時間がかかり、エラーが発生し、実用的ではない。
コード検証のファーストラインフィルタとしてLLMを活用する新しいフレームワークであるCodeSiftを紹介します。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:32:21 GMT)
Measuring the Reliability of Causal Probing Methods: Tradeoffs, Limitations, and the Plight of Nullifying Interventions [3.2] 因果探索は、大きな言語モデルのような基礎モデルを理解するためのアプローチである。
本稿では、因果探索介入の信頼性を評価するための一般的な実証分析フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:45:49 GMT)
Enhancing Intrusion Detection in IoT Environments: An Advanced Ensemble Approach Using Kolmogorov-Arnold Networks [3.1] 本稿では,KAN(Kolmogorov-Arnold Networks)とXGBoostアルゴリズムを組み合わせたハイブリッド侵入検知システムを提案する。
提案したIDSは,学習可能なアクティベーション関数を用いてデータ内の複雑な関係をモデル化し,XGBoostの強力なアンサンブル学習手法と併用する。
実験により,我々のハイブリッドIDSは,良性行動と悪意行動の区別において,99%以上の精度で検出できることがわかった。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:58:49 GMT)
Improving Lagarias-Odlyzko Algorithm For Average-Case Subset Sum: Modular Arithmetic Approach [3.0] サブセット Sum 問題にモジュラー算術的アプローチを導入する。
本研究では,LLL削減基底ベクトルの長さを解析することにより,密度保証を向上できることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 19:32:14 GMT)
HER2 and FISH Status Prediction in Breast Biopsy H&E-Stained Images Using Deep Learning [3.0] ヘマトキシリンとエオシン(H&E)の腫瘍染色はより広く利用可能である。
H&EによるHER2状態の正確な予測は、コスト削減と治療選択の迅速化を可能にする。
H&Eのためのディープラーニングアルゴリズムは、様々ながんの特徴と臨床結果を予測するのに有効である。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:19:34 GMT)
AI, Climate, and Transparency: Operationalizing and Improving the AI Act [2.9] 本稿では、気候関連透明性に関するAI法の規定を批判的に検討する。
AI推論におけるエネルギー消費の排除を含む、重要な欠点を特定します。
本稿では,提案法の範囲内での推論関連エネルギー利用を復活させる新しい解釈を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:57:39 GMT)
Domain-decoupled Physics-informed Neural Networks with Closed-form Gradients for Fast Model Learning of Dynamical Systems [2.9] 物理インフォームドニューラルネットワーク(PINN)は、物理方程式を用いて訓練され、データから学習することで、モデル化されていない効果を組み込むことができる。
本稿では、大規模で複雑な非線形力学系を扱う場合のPINCの現在の限界に対処するために、ドメイン分離された物理情報ニューラルネットワーク(DD-PINN)を導入する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:08:11 GMT)
Robust Statistical Scaling of Outlier Scores: Improving the Quality of Outlier Probabilities for Outliers (Extended Version) [2.9] 外乱検出アルゴリズムは通常、データセット内の各観測値に外乱スコアを割り当て、観測値が外乱値である度合いを示す。
本論文は, 統計的スケーリングは, 文献でよく用いられるように, 外れ値に対して等しく良い確率を生じるものではないことを論じる。
本稿では,ロバストな統計的スケーリングを提案し,ロバストな推定器を用いてアウトレーヤの確率を向上する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:44:34 GMT)
Geometric Neural Network based on Phase Space for BCI-EEG decoding [2.8] ディープラーニングアルゴリズムの脳信号解析への統合は、まだ初期段階にある。
EEGは、非侵襲的で費用効果の高い性質と時間分解能に優れたため、BCIシステムを設計するための広く採用されている選択である。
本稿では、位相SPDNetアーキテクチャを提案し、その性能と結果の解釈可能性について分析する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:39:45 GMT)
Advanced POD-Based Performance Evaluation of Classifiers Applied to Human Driver Lane Changing Prediction [2.8] 本稿では、機械学習アルゴリズムの信頼性を評価するために、修正された検出の確率を用いる。
PODに対するヒット/ミスアプローチの信頼性を高めるという利点を生かして、平均的な保守的な振る舞いを提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:39:24 GMT)
A quantitative model of takeover request time budget for conditionally automated driving [2.8] テイクオーバ要求後の運転再開に必要な時間予算は、状況や異なるテイクオーバ変数によって異なる。
提案式は, 個別刺激応答時間, 運転経験, シナリオ固有の要件を統合し, テイクオーバー操作の安全性を高める。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:12:44 GMT)
Downstream bias mitigation is all you need [2.8] 本稿では,大規模言語モデル(LLM)による事前学習および微調整後のタスク固有行動におけるバイアスの程度について検討する。
事前トレーニングが重要であることは分かっていますが、モデルが事前トレーニングされた後、微調整データセットにおける共起率のわずかな変化でさえ、モデルのバイアスに大きな影響を及ぼします。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:59:31 GMT)
Using Backbone Foundation Model for Evaluating Fairness in Chest Radiography Without Demographic Data [2.7] 本研究の目的は,基礎モデルのバックボーンを埋め込み抽出器として用いることの有効性を検討することである。
我々は,これらのグループを,前処理,内処理,評価など,様々な段階のバイアス軽減に活用することを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:35:38 GMT)
Adaptive Traffic Signal Control Using Reinforcement Learning [2.7] 本稿では,強化学習を用いた交通渋滞の解決法を提案する。
我々は2つのRLアルゴリズムを開発した: ターンベースエージェントは交差点側の信号に高いトラフィックを優先し、タイムベースエージェントは固定位相サイクルに固執し、交通条件に基づいて位相時間を調整する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:35:56 GMT)
PersonalizedUS: Interpretable Breast Cancer Risk Assessment with Local Coverage Uncertainty Quantification [2.7] 現在の「ゴールドスタンダード」は、臨床医による手動のBI-RADSスコアに依存しており、しばしば不必要な生検や、患者とその家族に対する精神的な負担を伴っている。
我々は、直列予測の最近の進歩を活用して、正確でパーソナライズされたリスク推定を提供する、パーソナライズされた機械学習システムであるPersonalizedUSを紹介する。
具体的な臨床効果としては、BI-RADS 4aと4bの病変のうち、要求された生検を最大で65%減らし、がんの再発は最小限である。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 00:47:55 GMT)
Stability of Primal-Dual Gradient Flow Dynamics for Multi-Block Convex Optimization Problems [2.7] 提案された力学はラグランジアンの近位拡大に基づいている。
我々は、グローバル(指数)収束保証を確立するために、様々な構造的特性を利用する。
我々の仮定は、様々な原始双対力学の(指数的な)安定性を証明するために必要なものよりもはるかに弱い。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:43:18 GMT)
Implicit Regularization Paths of Weighted Neural Representations [2.7] 事前訓練した特徴の観測(観察)によって誘発される暗黙の正則化効果について検討した。
有界ノルムの試験ベクトルに対して、同じ経路に沿って重み付けされた特徴を訓練したリッジ推定器が無限に等価であることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:26:36 GMT)
A Novel Denoising Technique and Deep Learning Based Hybrid Wind Speed Forecasting Model for Variable Terrain Conditions [2.5] 本稿では,風速の短期予測のための新しい適応モデルを提案する。
単純な地形条件と複雑な地形条件の予測精度の0.70%において、最も低いばらつきを達成している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:07:58 GMT)
Purity and construction of arbitrary dimensional $k$-uniform mixed states [2.5] k-一様混合状態(k-一様混合状態、k-一様混合状態、k-一様混合状態、k-一様混合状態、k-一様混合状態)は、最大混合状態である。
可能な限り高い純度でk-一様混合状態を構築するための新しい手法が構築されている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 04:02:46 GMT)
Systematic Evaluation of Synthetic Data Augmentation for Multi-class NetFlow Traffic [2.5] マルチクラス分類モデルは特定のタイプの攻撃を識別し、より標的的で効果的なインシデント応答を可能にする。
最近の進歩は、生成モデルがデータの増大を補助し、不均衡なデータセットに対して優れたソリューションを提供すると主張することを示唆している。
本実験は,トレーニングデータのバランスをとる再サンプリング手法が,分類性能を確実に向上させるものではないことを示唆している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:44:07 GMT)
ChartEye: A Deep Learning Framework for Chart Information Extraction [2.5] 本研究では,グラフ情報抽出パイプラインにおける重要なステップに対するソリューションを提供する,ディープラーニングベースのフレームワークを提案する。
提案フレームワークは階層型視覚変換器をグラフ型およびテキストロール分類のタスクに用い,YOLOv7はテキスト検出に用いた。
提案手法は,F1スコアが0.97,テキストロール分類が0.91,テキスト検出が平均0.95,各段階において優れた性能を実現している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:22:39 GMT)
Leveraging Persistent Homology for Differential Diagnosis of Mild Cognitive Impairment [2.5] 軽度認知障害(MCI)は、認知機能の微妙な変化が特徴であり、しばしば脳の接続の混乱と関連している。
本研究では,6種類の被験者の脳ネットワークに関連する神経変性のトポロジカルな変化を調べるための,新しい微粒化分析法を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:01:55 GMT)
VFLIP: A Backdoor Defense for Vertical Federated Learning via Identification and Purification [2.5] VFLIP (Vertical Federated Learning) を専門とする最初のバックドアディフェンスについて紹介する。
VFLIPは推論段階で動作する識別と浄化技術を採用し、バックドア攻撃に対する堅牢性を大幅に向上させる。
我々は, CIFAR10, CINIC10, Imagenette, NUS-WIDE, BankMarketingで広範囲にわたる実験を行い, VFLIPがVFLのバックドア攻撃を効果的に軽減できることを実証した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:31:32 GMT)
Sigma Flows for Image and Data Labeling and Learning Structured Prediction [2.5] 本稿では,リーマン多様体上で観測されたデータの構造化ラベル付け予測のためのシグマフローモデルを提案する。
このアプローチは、約25年前にSochen、Kimmel、Malladiが導入したイメージデノナイズとエンハンスメントのためのLaplace-Beltramiフレームワークと、著者らが導入し研究した代入フローアプローチを組み合わせたものだ。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:04:56 GMT)
Modeling and Analyzing the Influence of Non-Item Pages on Sequential Next-Item Prediction [2.5] 非イテムページと興味のある項目との間には,実際に関係があることが示されている。
我々は、CNN、RNN、トランスフォーマーベースのアーキテクチャをカバーする8つの一般的なシーケンシャルレコメンデータモデルを適用し、非イテムページを統合する。
結果から,非イテムページは貴重な情報ソースであることがわかったが,そのようなページをうまく表現することが有効に活用するための鍵である。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:12:01 GMT)
Trustworthy and Responsible AI for Human-Centric Autonomous Decision-Making Systems [2.4] 我々は、AIバイアス、定義、検出と緩和の方法、およびバイアスを評価するメトリクスの複雑さをレビューし、議論する。
また、人間中心の意思決定のさまざまな領域におけるAIの信頼性と広範な適用に関して、オープンな課題についても論じる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:04:25 GMT)
FERGI: Automatic Annotation of User Preferences for Text-to-Image Generation from Spontaneous Facial Expression Reaction [2.4] 生成した画像に対する自然表情反応からユーザの嗜好を自動的に評価する手法を開発し,テストする。
生成画像に対する表情反応(FERGI)のデータセットを収集し,複数の顔行動単位(AU)の活性化が生成画像のユーザ評価と高い相関性を示す。
我々は,AU推定モデルから入力を受け取るFAU-Net(Facial Action Units Neural Network)を開発し,テキスト・画像生成のためのユーザの好みを自動的に評価する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:00:01 GMT)
Efficient Slice Anomaly Detection Network for 3D Brain MRI Volume [2.4] 現在の異常検出法は, 基準産業データより優れているが, 「正常」 と「異常」の定義の相違により, 医療データに苦慮している。
我々は,ImageNet上で事前学習し,MRIデータセットを2次元スライス特徴抽出器として微調整したモデルを用いたSimple Slice-based Network (SimpleSliceNet) というフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:20:56 GMT)
An Evaluation of Sindhi Word Embedding in Semantic Analogies and Downstream Tasks [2.4] 我々は,複数のWebリソースから6100万以上の単語をクロールする新しい単語埋め込み型コーパスを提案する。
クロールデータから不要なテキストをフィルタリングするための前処理パイプラインを設計する。
クリーニングされた語彙は、最先端の連続バグ・オブ・ワード、スキップグラム、GloVeワード埋め込みアルゴリズムに供給される。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:36:29 GMT)
Object Detection for Vehicle Dashcams using Transformers [2.3] トランスを用いたダッシュカムにおける物体検出のための新しい手法を提案する。
我々のシステムは、最先端検出TRansformer (DETR) に基づいている。
以上の結果から,変圧器によるインテリジェントな自動化は,ダッシュカムシステムの能力を大幅に向上させる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:08:24 GMT)
Does Data-Efficient Generalization Exacerbate Bias in Foundation Models? [2.3] ファンデーションモデルは、様々なドメインでラベル効率を持つ堅牢なモデルとして登場した。
事前学習中に機密属性の存在に偏った大量のラベル付きデータを使用することが、モデルの公平性に影響を与えるかどうかは不明である。
本研究は,ブラジルの多ラベル眼科学データセットを微調整する際のファンデーションモデルのバイアスについて検討する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 22:14:44 GMT)
AnomalousPatchCore: Exploring the Use of Anomalous Samples in Industrial Anomaly Detection [2.3] 視覚検査(英: visual inspection)または産業異常検出(英: industrial anomaly detection)は、製造業において最も一般的な品質管理タイプの一つである。
ほとんどの異常検出法は、通常のサンプルからのみ知識を利用でき、しばしば利用可能な異常サンプルからの情報を活用することができない。
そこで本研究では,異常検出システムであるAnomalousPatchCore(APC)を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:31:42 GMT)
Atari-GPT: Investigating the Capabilities of Multimodal Large Language Models as Low-Level Policies for Atari Games [2.3] 本稿では,マルチモーダル大言語モデル(LLM)をAtariビデオゲームの分野における低レベルコントローラとして応用することを検討する。
従来の強化学習(RL)や模倣学習(IL)とは異なり、これらのLLMは既存のマルチモーダル知識を利用してゲーム環境に直接関与する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:08:56 GMT)
Urdu Digital Text Word Optical Character Recognition Using Permuted Auto Regressive Sequence Modeling [2.2] 本稿では,デジタルウルドゥー文字に特化して開発された新しい単語レベル光学文字認識(OCR)モデルを提案する。
このモデルはトランスフォーマーベースのアーキテクチャとアテンションメカニズムを利用して、Urduスクリプトを認識するというユニークな課題に対処する。
このモデルは0.178の文字誤り率(CER)を達成し、実世界の応用におけるその有効性と精度を強調している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:11:55 GMT)
MambaPlace:Text-to-Point-Cloud Cross-Modal Place Recognition with Attention Mamba Mechanisms [2.2] 視覚言語位置認識(VLVPR)は、画像から自然言語記述を組み込むことで、ロボットのローカライズ性能を向上させる。
言語情報を利用することで、VLVPRはロボットの位置マッチングを指示し、視覚のみに依存する制約を克服する。
本稿では,MambaPlace と呼ばれる相互接続型位置認識フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:06:11 GMT)
LM-PUB-QUIZ: A Comprehensive Framework for Zero-Shot Evaluation of Relational Knowledge in Language Models [2.1] 知識探索は、言語モデル(LM)が事前学習期間中に関係知識を取得する程度を評価する。
提案するLM-PUB-QUIZは,BEAR探索機構を中心に構築されたPythonフレームワークとリーダボードである。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:44:52 GMT)
Variational Mode Decomposition and Linear Embeddings are What You Need For Time-Series Forecasting [2.1] 変動モード分解(VMD)は、データを異なるモードに分解することでボラティリティを緩和する有望な手法として登場した。
ETTm2,Windbine,M4,および東南アジア各都市における10の大気質データセットを含む13の多様なデータセットについて評価を行った。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:22:09 GMT)
Lyrically Speaking: Exploring the Link Between Lyrical Emotions, Themes and Depression Risk [2.1] 特定の歌詞のテーマや感情は、リスナーの既存の否定状態を強化する可能性がある。
うつ病のリスクのある人は、低い原子価と低い覚醒に関連する歌詞の歌を好む。
本研究は、個人のデジタルフットプリントからうつ病リスクを評価するアプローチの可能性を明らかにする。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:00:19 GMT)
Disentangled Diffusion Autoencoder for Harmonization of Multi-site Neuroimaging Data [2.0] 本稿では、画像の特定の側面を制御するために設計された新しい拡散モデルDDAEを紹介する。
従来の手法に比べて高分解能・高調波2次元MR画像の生成におけるDDAEの優位性を示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:03:18 GMT)
Red Team Redemption: A Structured Comparison of Open-Source Tools for Adversary Emulation [2.0] 赤チームは敵をシミュレートし、前もって使用した戦術について知らせることなく、防御者に対する洗練された攻撃を行う。
これらのインタラクティブなサイバー演習は、組織のセキュリティ姿勢を評価し改善し、脆弱性を検出し、従業員を訓練するのに非常に有益である。
敵のエミュレーションツールは、部分的に攻撃行為を自動化し、レッドチーム経験が不足している場合でも、高速で連続的で繰り返し可能なセキュリティテストを可能にする。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:00:31 GMT)
Circuit Implementation of Discrete-Time Quantum Walks on Complex Networks [2.0] 量子ウォークは、様々なグラフベースのアプリケーションのための強力なツールである。
本稿では,複雑なネットワーク上での離散時間量子ウォークを実装する回路設計について述べる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:11:47 GMT)
A Framework to Model ML Engineering Processes [2.0] 機械学習(ML)ベースのシステムの開発は複雑で、多様なスキルセットを持つ複数の学際的なチームが必要である。
現在のプロセスモデリング言語は、そのようなシステムの開発を説明するには適していない。
ドメイン固有言語を中心に構築されたMLベースのソフトウェア開発プロセスのモデリングフレームワークを紹介する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:12:22 GMT)
Pixels to Prose: Understanding the art of Image Captioning [2.0] 画像キャプションにより、機械は視覚的コンテンツを解釈し、記述的なテキストを生成することができる。
レビューでは、画像キャプションモデルの進化を最新の最先端ソリューションに遡る。
医療領域における画像キャプションの適用についても検討した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:21:23 GMT)
SCARF: Securing Chips with a Robust Framework against Fabrication-time Hardware Trojans [1.9] ハードウェアトロイの木馬 (HT) はIC製造中に導入される。
設計のフロントエンドからバックエンドステージへのICセキュリティ向上のための包括的アプローチを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:04:25 GMT)
MetaGFN: Exploring Distant Modes with Adapted Metadynamics for Continuous GFlowNets [1.9] 本稿では,連続ドメイン上の任意のブラックボックス報酬関数に適用可能なメタ力学の変種であるAdapted Metadynamicsを紹介する。
結果のアルゴリズムであるMetaGFNは、目標分布への収束を加速し、GFlowNetsの以前のオフポリティクス探索戦略よりも遠い報酬モードを発見する3つの連続領域を示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:19:35 GMT)
VHAKG: A Multi-modal Knowledge Graph Based on Synchronized Multi-view Videos of Daily Activities [1.9] 我々は,日常活動の同期型マルチビューシミュレートビデオに基づくMMKGを構築した。
私たちのMMKGには、ビデオフレーム内のボックスのバウンディングなど、フレームごとのきめ細かい変更が含まれています。
アプリケーション例として、MMKGが視覚言語モデルのベンチマークを容易にすることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 01:56:33 GMT)
Signatures of a Spin-Active Interface and Locally Enhanced Zeeman field in a Superconductor-Chiral Material Heterostructure [1.8] 局在したゼーマン場は、スピントロニクスや非伝統的な超伝導体を含む広い領域において重要な役割を果たす可能性がある。
本研究では,高貴金属表面における超伝導体,すなわち誘導超伝導体を用いてスピン活性界面を探索する。
その結果,バルク超電導ペアリングを保ちながら,超伝導ギャップを選択的に閉じる拡張界面ゼーマン場が明らかになった。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 21:28:11 GMT)
Form and meaning co-determine the realization of tone in Taiwan Mandarin spontaneous speech: the case of Tone 3 sandhi [1.8] 標準中国語ではトーン3(ディッピング音)がトーン2(トリッピング音)となり、次に別のトーン3が続く。
以前の研究では、このサンジー過程は完全なものではなく、同化トーン3が真のトーン2とはいまだに異なっていることを指摘している。
本研究では,台湾・マンダリン自発会話におけるT2-T3およびT3-T3音調パターンを用いた2文字単語のピッチパターンについて検討した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:25:45 GMT)
Navigating the Future of Education: Educators' Insights on AI Integration and Challenges in Greece, Hungary, Latvia, Ireland and Armenia [1.7] 本稿は,教師が現在AIをどのように活用し,その教育プロセスを強化するかを検討することを目的とする。
我々はギリシャ、ハンガリー、ラトビア、アイルランド、アルメニアにまたがる全国的な調査を行い、1754人の教育者を調査した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:22:05 GMT)
Verification methods for international AI agreements [1.7] 潜在的な2種類の違反を検出できる10の検証方法を検討した。
各検証手法について, 記述, 過去の事例, 回避技術について述べる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:15:19 GMT)
The two-spin enigma: from the helium atom to quantum ontology [1.7] 実証的な証拠に完全に適合し、物理的リアリズムを諦めることなく維持できることを示します。
物理的事実を分析し、説明するために実験に基づく証拠から始め、古典的から量子的記述へ慎重に移動し、それらを混ぜることなく説明する。
全体像は、プランクとアインシュタインが最初に示したように、顕微鏡システムの物理的性質は量子化され、それらは文脈的でもある。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:47:59 GMT)
Can SAR improve RSVQA performance? [1.6] 合成開口レーダ(SAR)画像がこの分野で有用かどうかを検討する。
SARのみの分類結果について検討し、SARデータから情報を抽出する最善の方法を検討する。
最後の段階では、光学画像のみを用いた手法と比較して、SAR画像と異なるモードの組み合わせがRSVQAでどのように振る舞うかを検討する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:53:20 GMT)
MMASD+: A Novel Dataset for Privacy-Preserving Behavior Analysis of Children with Autism Spectrum Disorder [1.6] MMASD+は、Multimodal ASD(MMASD)と呼ばれる新しいオープンソースデータセットの拡張版である。
MMASD+は3D-Skeleton、3D Body Mesh、OCRデータを含む多様なデータモダリティで構成されている。
11種類のアクションタイプとASDの存在を予測するために,マルチモーダルトランスフォーマーフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:30:29 GMT)
Navigating Design Science Research in mHealth Applications: A Guide to Best Practices [1.5] デザインサイエンスリサーチ(DSR)は、現実世界の問題を解決する革新的な人工物を作成し、評価することを目的としている。
本稿では,mHealth アプリケーションプロジェクトにおける DSR 活用の枠組みについて述べる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:56:39 GMT)
Improving Thompson Sampling via Information Relaxation for Budgeted Multi-armed Bandits [1.5] 我々は、各アームが選択時に異なるリソースを消費する、$Kの武器付きバンディット問題を考える。
我々はトンプソンサンプリングのようにランダム化される一連のアルゴリズムを提案するが、予算制約に関してより慎重に決定を最適化する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 04:56:06 GMT)
An Empirical Study on Self-correcting Large Language Models for Data Science Code Generation [1.3] 大規模言語モデル(LLM)は最近、ソフトウェア工学のタスクに多くの応用を進歩させた。
CoT-SelfEvolveは、自己修正プロセスを通じて、反復的かつ自動的にコードを洗練する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:19:09 GMT)
Comparing diversity, negativity, and stereotypes in Chinese-language AI technologies: a case study on Baidu, Ernie and Qwen [1.3] 我々は、中国の主要検索エンジンBaiduに埋め込まれた社会的偏見を調査し、中国ベースのツールを調査した。
上記のツールにエンコードされた30万以上のビューを,そのようなグループを記述した候補語に誘導することで収集する。
言語モデルは検索エンジンに比べて多種多様な組込みビューを示すが、BaiduとQwenはErnieよりもネガティブなコンテンツを生成することが多い。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:51:18 GMT)
Realigned Softmax Warping for Deep Metric Learning [1.3] 本稿では,ユークリッド領域内で機能する新たな損失関数のクラスを提案する。
これらのコンパクト性と分離性の力は、ワープ関数を用いることで、自由に制御された位置で強化または緩和することができる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:17:25 GMT)
Mining Field Data for Tree Species Recognition at Scale [1.3] 本研究では,森林目録データから種ラベルを自動的に抽出する手法を提案する。
空中画像のツリーインスタンスを識別し,人間による関与がほとんどないフィールドデータと照合する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:25:35 GMT)
SoK: Identifying Limitations and Bridging Gaps of Cybersecurity Capability Maturity Models (CCMMs) [1.2] サイバーセキュリティ能力成熟モデル(CCMM)は、組織のサイバーセキュリティ姿勢を強化する重要なツールとして出現する。
CCMMは、組織が現在のサイバーセキュリティ能力を評価し、重大なギャップを特定し、改善を優先するための構造化されたフレームワークを提供する。
しかし、CCMMの潜在能力は、実装や採用プロセスで遭遇したモデルや課題に固有の制限があるため、実現されないことが多い。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 21:00:20 GMT)
A Deep Learning Approach to Localizing Multi-level Airway Collapse Based on Snoring Sounds [1.2] 閉塞型睡眠時無呼吸症候群(OSA)患者における上気道の異なるレベルの刺激音の分類にマシン/ディープ学習の適用について検討した。
39名を対象に,Vellum,Oropharynx,Tongue Base,Epiglottis (VOTE) 分類システムを用いて,聴力評価を行った。
畳み込みニューラルネットワーク(CNN)であるResNet-50は、いびき音の分類において、最高の全体的な性能を示した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:30:20 GMT)
Constant-depth preparation of matrix product states with adaptive quantum circuits [1.1] マトリックス積状態(MPS)は多体絡み合い状態の重要なクラスを構成する。
我々は,一定深さ適応量子回路を用いて,多種多様なMPSを正確に作成可能であることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:20:23 GMT)
An Extremely Data-efficient and Generative LLM-based Reinforcement Learning Agent for Recommenders [1.0] 強化学習(RL)アルゴリズムは、長期顧客満足度を最大化し、産業レコメンデーションシステムにおける短期的、筋電図的目標を回避するために有効である。
目標は、RLエージェントをトレーニングして購入報酬を最大化することである。
本報告では, 生成的軌跡を用いて訓練したRL剤についても検討した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:31:50 GMT)
Biomedical Image Segmentation: A Systematic Literature Review of Deep Learning Based Object Detection Methods [1.0] 深層学習に基づく物体検出法は、バイオメディカルイメージセグメンテーションに一般的に用いられている。
既存の調査では、標準化されたアプローチやより広範なセグメンテーション技術に重点を置いていないことが多い。
これらの手法を批判的に分析し,課題を特定し,今後の方向性について考察した。
このSLRは、研究コミュニティにこれらのセグメンテーションモデルについて素早く深く理解することを目的としています。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 19:56:19 GMT)
Procedural Adherence and Interpretability Through Neuro-Symbolic Generative Agents [1.0] 本稿では,形式論理に基づくプログラム合成とLCMコンテンツ生成を組み合わせることで,生成エージェントの動作に対する手続き的順守と解釈可能性の保証を実現する。
手続き的付着と解釈可能性の利点を説明するために,エージェントに解釈可能な高レベル時間構造を強制するオートマトンを生成するためにテンポラルストリーム論理(TSL)を用いる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 02:37:08 GMT)
GANs Conditioning Methods: A Survey [1.0] GAN(Generative Adversarial Networks)は、様々な分野で広く普及している。
多くの実用的な応用では、生成した出力を正確に制御する必要があるため、条件付きGAN(cGAN)の開発につながっている。
本稿では,GANの条件付け手法を概説し,各手法の特徴を探求し,その特異なメカニズムと理論的基礎を明らかにする。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:52:14 GMT)
Solid Waste Detection, Monitoring and Mapping in Remote Sensing Images: A Survey [0.8] 不適切に管理された埋立地は、浸透雨水を介して土壌と地下水を汚染し、動物と人間の両方に脅威を与える。
現場検査のような伝統的な埋立地識別アプローチは、時間と費用がかかる。
地球観測衛星(EO)は、センサーと撮像機能を備えた衛星で、数十年にわたって高解像度のデータを提供してきた。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:01:37 GMT)
From Data Creator to Data Reuser: Distance Matters [0.8] オープンサイエンスの政策は再利用よりもデータ共有に重点を置いている。
データ再利用の価値は、クリエータと再利用者の関係にあります。
我々は,データ作成者とデータ再使用者の間の距離の理論的構成を開発する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:53:17 GMT)
Physics-Informed Neural Network for Concrete Manufacturing Process Optimization [0.8] 本稿では、PINN(Physics Informed Neural Networks)が与えられた状況でどのように役立つかを明らかにする。
この研究の結果は、PINNがデータセットを減らしてもどれだけうまく機能したかを強調している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:22:53 GMT)
Identification of Prognostic Biomarkers for Stage III Non-Small Cell Lung Carcinoma in Female Nonsmokers Using Machine Learning [0.8] 肺がんは、世界中でがん関連の死亡の原因となっている。
本研究は,非喫煙女性におけるNSCLC関連重要なバイオマーカーを遺伝子発現プロファイリングを用いて同定することを目的とした。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:08:11 GMT)
LRP4RAG: Detecting Hallucinations in Retrieval-Augmented Generation via Layer-wise Relevance Propagation [0.8] 本稿では,大規模言語モデル(LLM)における幻覚検出手法であるLPP4RAGを提案する。
我々の知る限り、RAG幻覚の検出にLPPを用いたのは今回が初めてです。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 04:44:43 GMT)
Uncertainty-aware segmentation for rainfall prediction post processing [0.8] 日次累積降水量の予測を後処理するための不確実性を考慮した深層学習モデルについて検討する。
本研究では,様々な最先端モデルを比較し,よく知られたSDE-Netの変種を提案する。
その結果,すべてのディープラーニングモデルは,平均的ベースラインNWPソリューションよりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:31:40 GMT)
Comparison of Model Predictive Control and Proximal Policy Optimization for a 1-DOF Helicopter System [0.7] 本研究は,Quanser Aero 2システムに適用された深層強化学習(DRL)アルゴリズムであるモデル予測制御(MPC)とPPOの比較分析を行う。
PPOは上昇時間と適応性に優れており、迅速な応答と適応性を必要とするアプリケーションには有望なアプローチである。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:35:34 GMT)
Embedded FPGA Developments in 130nm and 28nm CMOS for Machine Learning in Particle Detector Readout [0.7] フィールドプログラマブルゲートアレイ(eFPGA)技術は、アプリケーション固有の集積回路(ASIC)の設計における再構成可能なロジックの実装を可能にする
FABulous"と呼ばれるオープンソースのフレームワークは、130nmと28nmのCMOS技術ノードを用いたeFPGAの設計に使用された。
ソースにおけるセンサデータの削減のために設計された機械学習ベースの分類器を合成し、eFPGA上に構成した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:47:35 GMT)
Guaranteed Coverage Prediction Intervals with Gaussian Process Regression [0.7] 本稿では,CP(Conformal Prediction)と呼ばれる機械学習フレームワークに基づくGPRの拡張を提案する。
この拡張により、モデルを完全に不特定であっても、必要なカバレッジでPIの生成が保証される。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:00:32 GMT)
Efficient $k$-NN Search in IoT Data: Overlap Optimization in Tree-Based Indexing Structures [0.7] IoT(Internet of Things)における相互接続デバイスの普及は、データの指数的な増加につながった。
この異種データの効率的な検索には、効果的な組織のための堅牢な索引付け機構が必要である。
データ空間分割の重複を定量化し、戦略的に低減する3つの革新的手法を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:16:55 GMT)
LeMON: Learning to Learn Multi-Operator Networks [0.7] シングルオペレータ学習では、特定のオペレータを学ぶために、ディープニューラルネットワークをトレーニングする。
マルチオペレータ学習における最近の研究は、演算子埋め込み構造を使用して、複数の演算子のデータ上で単一のニューラルネットワークをトレーニングしている。
マルチオペレータ学習を用いてPDEを解くための事前学習および微調整戦略を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 23:20:03 GMT)
Quantum Kernel Principal Components Analysis for Compact Readout of Chemiresistive Sensor Arrays [0.6] 量子主成分分析(qPCA)を情報保持性を高めるための優れた代替手段として提案する。
これらの結果から,qPCAは様々な機械学習モデルタスクにおいて,cPCAよりも優れていた。
その結果、実世界のIoTアプリケーションでデータ処理に革命をもたらすため、ノイズの多い中間スケール量子コンピュータ(NISQ)の可能性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 04:07:40 GMT)
Benchmarking foundation models as feature extractors for weakly-supervised computational pathology [0.6] 肺・大腸癌・胃癌・乳癌の13例を対象に, 病理組織学的基盤モデルを10例, 6,791例, 9,493例に比較検討した。
視覚言語基礎モデルであるCONCHは,視覚のみの基礎モデルと比較して,タスクの42%で最高の性能を示した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:34:45 GMT)
Deep Learning for Computer Vision based Activity Recognition and Fall Detection of the Elderly: a Systematic Review [0.6] AAL(Ambient Assisted Living)システムに関する多くの研究が出版されており、高齢者の自立生活による偏見を減らすのに役立っている。
本研究では,高齢者の転倒検出とHAR(Human Activity Recognition)について,文献の体系的レビューを行った。
この2つの課題を遂行する現在の傾向に対処するため,コンピュータビジョンデータに対するディープラーニング(DL)に基づくアプローチの活用に焦点をあてた。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:09:34 GMT)
Generative Bayesian Computation for Maximum Expected Utility [0.6] 本稿では,量子化の限界として期待効用を自然に計算する,量子化に基づく密度のない生成法を提案する。
提案手法では, 分散ユーティリティを直接推定するために, ディープ量子化ニューラル推定器を用いる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 19:09:23 GMT)
Enhanced Quantum Metrology with Non-Phase-Covariant Noise [0.6] 非位相共変(NPC)ノイズはパラメータ推定を向上する可能性があり, 位相共変(PC)ノイズは劣化するか, 中性かのどちらかを示す。
これは、非エルミート量子センサが、知覚性能の点でハーミート量子センサよりも優れていることを示唆している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:01:24 GMT)
On the (In)security of optimized Stern-like signature schemes [0.6] スターンのシグネチャスキームの重要な最適化は、ランダムではなく擬ランダムベクトルと置換を生成することである。
いくつかのパラメータに対して、この最適化を悪用し、時間内にそのスキームを壊す攻撃が存在することを示す。
0,12lambda$に$saltをスキームに追加し、擬似ランダム文字列の生成方法を少し変更することで、我々の攻撃が機能しないだけでなく、どんな攻撃に対しても、このスキームは$lambda$ bitsのセキュリティを保持することを証明します。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:03:38 GMT)
Unveiling the Human-like Similarities of Automatic Facial Expression Recognition: An Empirical Exploration through Explainable AI [0.6] 本研究は,12種類の異なるネットワークを比較し,ディープニューラルネットワークと人間の知覚の類似性を検討することを目的とする。
我々は、革新的なグローバルな説明可能なAI手法を用いて、熱マップを生成し、6つの表情で訓練された12のネットワークにとって重要な顔領域を明らかにする。
発見は、人間とAIの表情認識が限定的に一致していることを示し、ネットワークアーキテクチャが類似性に影響を与えることを示唆している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:38:43 GMT)
FRANC: A Lightweight Framework for High-Quality Code Generation [0.6] FRANCは、トランスフォーマーベースのコード生成モデルから派生した、よりセキュアで高品質なソースコードを推奨するフレームワークである。
生成したコードをスニペットでコンパイル可能にする静的フィルタと、品質スコアに基づいてコードをソートする品質対応のローダが含まれている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:47:24 GMT)
Entanglement Entropy of ($\mathbf{2+1}$)-Dimensional SU(2) Lattice Gauge Theory on Plaquette Chains [0.6] 線形ラケット鎖上の2+1$次元におけるハミルトンSU(2)格子ゲージ理論の絡み合いエントロピーについて検討する。
ヒルベルト空間に存在しているスペクトルの中央にある量子多体傷は、高次の電場表現がヒルベルト空間基底に含まれると消滅する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:31:39 GMT)
Eigenstate Thermalization in 2+1 dimensional SU(2) Lattice Gauge Theory [0.6] 格子上で離散化されたハミルトニアンSU(2)ゲージ理論が固有状態熱化仮説(ETH)に従うという仮説の予備的な数値的証拠を示す。
3つの研究事例のそれぞれにおいて、まず固有エネルギースペクトルにおけるランダム行列理論(RMT)の振る舞いを確認し、次に対角線を解析する。
我々は、(b) と (c) で十分小さい周波数窓において、電気エネルギー演算子の対角行列要素がRTTの挙動を示すことを発見した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:23:01 GMT)
Hierarchical Blockmodelling for Knowledge Graphs [0.6] 知識グラフ上の階層的なエンティティクラスタリングのためにブロックモデルを使用します。
Nested Chinese Restaurant ProcessとStick Breaking Processを生成モデルに統合することで、階層的なクラスタリングの誘導が可能になる。
我々は、合成および実世界のデータセット上でモデルを評価し、ベンチマークモデルと定量的に比較した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:04:15 GMT)
Ethical AI Governance: Methods for Evaluating Trustworthy AI [0.6] 信頼できる人工知能(TAI)は、人間の価値観に沿った倫理を統合する。
TAI評価は、AI開発と使用における倫理的基準と安全性を保証することを目的としている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:25:50 GMT)
The Fault in our Stars: Quality Assessment of Code Generation Benchmarks [0.5] 我々は、異なるコード生成モデルの性能を比較するために使用されるベンチマークの中で、プロンプトの品質について、第一種研究を行う。
9つのコード生成ベンチマークから3,566のプロンプトを分析し、その中の品質問題を特定した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:38:51 GMT)
Matmul or No Matmal in the Era of 1-bit LLMs [0.5] 1ビットの大規模言語モデル(LLM)が注目され、新たな研究機会が開かれた。
しかし、1ビット LLM は射影層に極端な量子化を適用することで、少数のモデルを改善するのみである。
本研究では, 1 ビット LLM コンテキストに適した Amdahl's Law の適応について述べる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 19:51:04 GMT)
SurGen: Text-Guided Diffusion Model for Surgical Video Generation [0.5] SurGenは、外科用ビデオ合成に適したテキスト誘導拡散モデルである。
標準画像およびビデオ生成指標を用いて,出力の視覚的および時間的品質を検証する。
本研究は, 外科研修生に有用な教育ツールとして, 拡散モデルが有用であることを示すものである。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:06:50 GMT)
Ionospheric Scintillation Forecasting Using Machine Learning [0.4] この研究は、振幅シンチレーションの強度を予測できる機械学習(ML)モデルの開発に焦点を当てている。
XGBoostモデルは最も効果的なモデルとして登場し、バランスの取れたデータセットでトレーニングした場合、顕著な77%の予測精度を示した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:21:01 GMT)
Protecting Privacy in Federated Time Series Analysis: A Pragmatic Technology Review for Application Developers [0.4] 本研究では,選択した実世界のユースケースに基づいて定性的な要件抽出を行う。
得られた要件カテゴリは、利用可能な技術が提供する機能や保証と一致します。
各技術について、市場における標準化と可用性の状況を含め、成熟度の評価も行います。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:41:31 GMT)
Dynamical Casimir Effects: The Need for Nonlocality in Time-Varying Dispersive Nanophotonics [0.4] 時間変化周波数分散ナノフォトニクス系におけるカシミール効果における物質非局在性の役割について論じる。
局所モデルは、絡み合ったポラリトン対の放出速度のばらつきなど、非物理的予測につながる可能性があることを示す。
我々の研究は、ナノフォトニクスの新しいフロンティアにおける非局所的な効果の重要性に光を当てている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:20:35 GMT)
Extracting Universal Corner Entanglement Entropy during the Quantum Monte Carlo Simulation [0.4] 量子臨界点(QCP)の普遍的特性を明らかにするために、エンタングルメントエントロピー(EE)における下降角対数補正が不可欠である
我々は計算コストを抑えてEEのコーナーコントリビューションを直接測定する新しい手法を開発した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:38:57 GMT)
Using Large Language Models to Create AI Personas for Replication and Prediction of Media Effects: An Empirical Test of 133 Published Experimental Research Findings [0.4] 本稿では,大規模言語モデル(LLM)がメッセージ効果研究の正確な複製を高速化する可能性について分析する。
The Journal of Marketingに掲載された45の最近の研究を含む14の論文から133の実験結果を再現し,LSMを用いた参加者を試験した。
LLMの複製は、元のメインエフェクトの76%(111点中84点)を再現し、メディア刺激に反応する研究のAIによる複製の可能性を示した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:14:39 GMT)
Different Facets for Different Experts: A Framework for Streamlining The Integration of Qualitative Insights into ABM Development [0.4] エージェントベースのシミュレーションの鍵となる問題は、複数の専門分野の専門家からの質的な洞察を統合することが極めて難しいことである。
本稿では,エージェントのプログラムされた機能を,能力の獲得と表示行動から切り離すツールのアーキテクチャについて報告する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:43:14 GMT)
Nonlinear Quantum Optics at a Topological Interface Enabled by Defect Engineering [0.4] トポロジーのフォトニクスへの統合は、ロバストで一方向の導波路を構築するための新しい設計枠組みを生み出した。
我々は、量子ドット(QD)のような量子放出体をバレー・ハル(VH)トポロジカル導波路にうまく統合する上での現在の障壁を克服する。
VH-フォトニック結晶の欠陥にQDを組み込むことで、トポロジカル導波路界面における単一光子共鳴蛍光と量子エミッタの共鳴透過分光の最初の例を示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:24:25 GMT)
Potential Enabling Technologies for 7G Networks: Survey [0.3] 6Gと7Gのイノベーションの第2のクラスでは、高度なMLとAI全般の最適な統合に重点を置いています。
量子技術を導入することで、7Gはネット上の計算プロセスを高速化し、ネットワークセキュリティを強化し、分散QCを可能にする。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:03:34 GMT)
Examining Pathological Bias in a Generative Adversarial Network Discriminator: A Case Study on a StyleGAN3 Model [0.3] GAN(Generative Adversarial Network)は、実際の顔から人間に区別できない、フォトリアリスティックな顔を生成する。
事前学習したStyleGAN3-rモデルの判別器において,病理内部色と輝度バイアスが認められた。
また、判別器は、画像レベルと顔レベルの両方の品質でスコアを体系的に階層化し、不均等に性別、人種、その他のカテゴリーのイメージに影響を及ぼすことも見出した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:48:06 GMT)
Remove Symmetries to Control Model Expressivity [0.3] 損失関数に対称性が存在する場合、モデルが「崩壊」と呼ばれる低容量状態に閉じ込められる可能性があることを示す。
ニューラルネットワークにおける対称性誘起低容量状態のほとんどをすべて除去する,単純で理論的に正当化されたアルゴリズムであるsyreを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 02:45:41 GMT)
ARSecure: A Novel End-to-End Encryption Messaging System Using Augmented Reality [0.3] 拡張現実メガネを利用した新しいエンドツーエンド暗号化メッセージングソリューションであるARSecureを紹介する。
ARSecureでは、携帯電話端末に到達する前にメッセージを暗号化し、復号化することが可能で、E2EEシステムにおけるCSS技術に効果的に対抗できる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:39:43 GMT)
Scaling Up Summarization: Leveraging Large Language Models for Long Text Extractive Summarization [0.3] 本稿では,Large Language Models (LLM) を利用した抽出要約フレームワークであるEYEGLAXSを紹介する。
EYEGLAXSは、事実的および文法的整合性を保証するために抽出的な要約に焦点を当てている。
このシステムはPubMedやArXivといった有名なデータセットに新しいパフォーマンスベンチマークを設定する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:52:19 GMT)
LLMSecCode: Evaluating Large Language Models for Secure Coding [0.2] 本研究の目的は、セキュアコーディング(SC)を促進するのに適した大規模言語モデル(LLM)の選択プロセスを改善することである。
SC機能を客観的に評価するために設計されたオープンソースの評価フレームワークであるLLMSecCodeを紹介する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 19:07:08 GMT)
Squeezed Thermal Reservoir Engineering via Linear Interactions [0.2] 本稿では,量子システムのための多用途熱貯留層構築法を提案する。
通常の熱環境において, システムと損失モードを結合することにより, 圧縮された貯留層の効果をエミュレートすることができる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:00:01 GMT)
Visual Prompt Engineering for Medical Vision Language Models in Radiology [0.2] ビジョン言語モデル(VLP)は、ゼロショットパフォーマンスの分類を改善するために学習を活用することで、有望なソリューションを提供する。
本稿では,視覚的プロンプト工学の可能性を探究し,重要な領域への潜在的関心を高める。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:53:27 GMT)
Responsible AI for Test Equity and Quality: The Duolingo English Test as a Case Study [0.1] この章では、AIを利用したハイテイクな英語アセスメントであるDuolingo English Test (DET)を用いて、ケーススタディを提示している。
DET RAI標準、その開発、およびドメインに依存しないRAI原則との関係について論じる。
これらのプラクティスは、妥当性と信頼性、公平性、プライバシとセキュリティ、透明性と説明責任の基準という倫理的原則にどのように対処するかを示している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:39:20 GMT)
Symmetries, correlation functions, and entanglement of general quantum Motzkin spin-chains [0.0] モツキンスピンチェインは、'colorless' (整数スピン$s=1$) や 'colorful'$s geq 2$) の変種を含む、1次元(1D) 局所整数スピンモデルである。
我々はこれらのモデルのいくつかのユニークな性質を解析的に発見し、低エネルギー物理学の新しい相関クラスを示唆する可能性がある。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:10:16 GMT)
chemtrain: Learning Deep Potential Models via Automatic Differentiation and Statistical Physics [0.0] ニューラルネットワーク(NN)は分子動力学の精度を改善するための有望なモデルである。
Chemtrainは、カスタマイズ可能なトレーニングルーチンと高度なトレーニングアルゴリズムを通じて、洗練されたNNポテンシャルモデルを学ぶためのフレームワークである。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:14:58 GMT)
What is YOLOv8: An In-Depth Exploration of the Internal Features of the Next-Generation Object Detector [0.0] 本研究では, YOLOv8オブジェクト検出モデルの詳細解析を行った。
YOLOv5のような以前のイテレーションよりもアーキテクチャ、トレーニングテクニック、パフォーマンスの改善に重点を置いている。
論文では、Microsoft COCOやRoboflow 100のようなベンチマークにおけるYOLOv8のパフォーマンスをレビューし、その高精度でリアルタイムな機能を強調している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:18:46 GMT)
What Machine Learning Tells Us About the Mathematical Structure of Concepts [0.0] この研究は、各フレームワークがどのようにモデリング概念に対して明確な数学的視点を提供するかを強調している。
この研究は、人間の認知と人工知能の複雑な関係の理解を深めることを目的として、学際対話の重要性を強調している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 03:30:22 GMT)
Tutorial: projector approach to master equations for open quantum systems [0.0] このチュートリアルは、効果的量子力学を導出する自己完結した実用的なツールボックスで、複数の分野にわたって量子理論を提供することを目的としている。
我々は, ブラウン方程式, ボルン・マルコフ方程式, 断熱方程式の3つの共通効用方程式が, 中島・ズワンツィヒ方程式の異なる摂動展開から導出されることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:01:00 GMT)
Trade-off between Gradient Measurement Efficiency and Expressivity in Deep Quantum Neural Networks [0.0] 量子ニューラルネットワーク(QNN)は、実用的な量子優位性を達成するために効率的なトレーニングアルゴリズムを必要とする。
一般的なQNNには効率的な勾配測定アルゴリズムが欠けており、スケーラブルなQNNを実現するための基本的で実践的な課題となっている。
本稿では, 安定器-論理積アンサッツ (SLPA) と呼ばれる一般QNNアンサッツを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:42:58 GMT)
The Role of Fibration Symmetries in Geometric Deep Learning [0.0] Geometric Deep Learning (GDL)は、対称性の観点から機械学習技術の幅広いクラスを統一する。
我々はGDLを緩和し、局所対称性、特にグラフのフィブレーション対称性が現実的なインスタンスの規則性を利用することを可能にすることを提案する。
GNNは、フィブレーション対称性の誘導バイアスを適用し、その表現力に対してより強い上限を導出する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:04:40 GMT)
Studies of the Fermi-Hubbard Model Using Quantum Computing [0.0] この研究は、小さな格子の基底状態エネルギーを計算する方法を確立した。
1x4, 2x2, 2x4, 3x4の半充填格子について検討した。
2x4格子では、クーロン反発のない真のエネルギーは0.18%以内で一致した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 23:48:29 GMT)
Strongly interacting fermions are non-trivial yet non-glassy [0.0] 我々は、スピンとは異なり、低温で強く相互作用するフェルミオンが古典的に非自明で量子的に容易な位相に属することを示した。
この結果は、スピンとは異なり、低温で強く相互作用するフェルミオンが古典的に非自明で量子的に容易な相に属することを示唆している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:53:51 GMT)
Statistical modeling of quantum error propagation [0.0] 広く使われている$CNOT$回路では、分散のシフトは$fracn27$で制限され、$n$は物理量子ビットの数である。
このフレームワークをランダム回路に適用すると、回路が大域接続を持つ場合、非有界なエラー伝搬が存在することが分かる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 00:49:52 GMT)
Started Off Local, Now We're in the Cloud: Forensic Examination of the Amazon Echo Show 15 Smart Display [0.0] われわれは、Fire OSで動作するAmazon最大のスマートディスプレイ、Echo Show 15を初めて法医学的に検証した。
検索された製品、ストリーミングされた映画、訪問したウェブサイト、写真やビデオのメタデータなど、さまざまなローカル利用成果物を識別する。
Echo Show 15にセキュアに格納されたトークンを使用して、Amazonのクラウド内のリモートユーザアーティファクトへのアクセスを取得します。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:01:16 GMT)
Small Object Detection for Indoor Assistance to the Blind using YOLO NAS Small and Super Gradients [0.0] 本稿では,小物体検出の課題に対処して,視覚障害者に対する屋内支援のための新しいアプローチを提案する。
軽量で効率的なオブジェクト検出モデルであるYOLO NAS Smallアーキテクチャを,Super Gradientsトレーニングフレームワークを用いて最適化する手法を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 05:38:20 GMT)
Simulating realistic short tandem repeat capillary electrophoretic signal using a generative adversarial network [0.0] 我々は,この課題を達成するために,画素GANから修正した生成逆数ネットワークであるGANを開発した。
1078のDNAプロファイルで、私たちはGANを訓練し、DNAプロファイル情報をシミュレートする能力を達成する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 23:20:17 GMT)
Sampling from high-dimensional, multimodal distributions using automatically tuned, tempered Hamiltonian Monte Carlo [0.0] ハミルトニアン・モンテカルロ (HMC) は確率密度が比例的に知られている高次元対象分布のサンプリングに広く用いられている。
伝統的テンパリング法は、特に高次元においてチューニングが困難である。
本研究では,高次元の強いマルチモーダル分布からの効率的なサンプリングを可能にするため,テンパリング戦略をハミルトンモンテカルロと組み合わせる手法を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:38:10 GMT)
Retrieval-Augmented Instruction Tuning for Automated Process Engineering Calculations : A Tool-Chaining Problem-Solving Framework with Attributable Reflection [0.0] オープンでカスタマイズ可能な小型コード言語モデル(SLM)を強化するためにRAIT(Retrieval-Augmented Instruction-Tuning)を活用する新しい自律エージェントフレームワークを提案する。
命令チューニングされたコードSLMと外部ツールを使用してRACG(Retrieval-Augmented Code Generation)を組み合わせることで、エージェントは自然言語仕様からコードを生成し、デバッグし、最適化する。
我々のアプローチは、専門的なプロセスエンジニアリングタスクのための基礎的AIモデルの欠如の限界に対処し、説明可能性、知識編集、費用対効果の利点を提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:33:47 GMT)
Rabi oscillations and entanglement between two atoms interacting by the Rydberg blockade and with a quantized radiation field studied by the Jaynes-Cummings Model [0.0] Rydberg原子は、2量子ビットゲートと原子光量子インターフェースのためのビルディングブロックを約束している。
我々は、リドベルク封鎖と量子化された放射場によって相互作用する2つのリドベルク原子間の相互作用を研究する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 04:16:12 GMT)
RAIN: Reinforcement Algorithms for Improving Numerical Weather and Climate Models [0.0] 現在の気候モデルは、サブグリッドスケールのプロセスを表現するために複雑な数学的パラメータ化に依存している。
本研究は,重要なパラメータ化課題に対処するために,強化学習と理想的な気候モデルを統合することを検討する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:10:46 GMT)
Quantum tunneling in a quintessence background and the role of GUP [0.0] 我々は、シュワルツシルトブラックホールに関連する質量素粒子と質量粒子の量子トンネルの研究を行った。
クインテッセンスのシナリオでは、圧力とエネルギー密度の比である$w$の2つの特定のケースを検討した。
それぞれの温度分布の解析および比較研究を行った。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:19:42 GMT)
Quantum delocalization on correlation landscape: The key to exponentially fast multipartite entanglement generation [0.0] 量子力学の目印であるエンタングルメントは、量子技術にとって重要な資源である。
我々はハミルトン系における絡み合い生成ダイナミクスを理解するための新しい枠組みを公表する。
この結果から,複雑な量子系における急激な絡み合い生成の理解と活用のための変換ツールが提供される。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:46:36 GMT)
Quantum Unitary Matrix Representation of Lattice Boltzmann Method for Fluid Flow Simulation [0.0] 本研究は,初期状態の準備において,アシラクビットの状態を制御する必要があることを示す。
テストケースの2量子制御NOT (CNOT) と1量子Uゲートの計9~12量子ビット, グリッドサイズは24~216点であった。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:33:28 GMT)
Quantum Algorithm for Shortest Vector Problems with Folded Spectrum Method [0.0] 本稿では,最短ベクトル問題を解くために,代替符号化と代替量子アルゴリズムを提案する。
本研究では,量子コンピューティングフレームワークにおけるSVPの適用可能性について検討した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:01:22 GMT)
Predictive maintenance solution for industrial systems -- an unsupervised approach based on log periodic power law [0.0] 再正規化グループアプローチに基づく教師なし予測保守分析手法。
往復圧縮機システムから収集した産業データの予測保守解析のための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:40:21 GMT)
Persuasion Games using Large Language Models [0.0] 大型言語モデル (LLM) は、人間のような文章を解釈し、生成することのできる、恐ろしい道具として登場した。
本稿では,LLMの可能性を探り,人間の視点を形作り,その決定が特定のタスクに与える影響について考察する。
この機能は、投資、クレジットカード、保険など、さまざまな分野のアプリケーションを見つける。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:50:41 GMT)
Optimally generating $\mathfrak{su}(2^N)$ using Pauli strings [0.0] 我々は、$mathfraksu (2N)$を生成する最小のそのような集合が、2N+1$要素を含むことを示す。
また,任意のパウリ回転に対応する回転列を生成するアルゴリズムも提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:13:26 GMT)
Optimal and exact recovery on general non-uniform Hypergraph Stochastic Block Model [0.0] 非一様ハイパーグラフ化ブロックモデル(HSBM)に基づくランダムハイパーグラフにおけるコミュニティ検出問題の検討
文献ではじめて、この一様でないケース下での正確な回復のための鋭いしきい値が、小さな制約の下で確立された。
しきい値を超えると正確な回復を達成でき、正確な回復が不可能な場合には最小の確率で達成できる2つの効率的なアルゴリズムを提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 00:10:13 GMT)
Optimal Tree Tensor Network Operators for Tensor Network Simulations: Applications to Open Quantum Systems [0.0] ツリーテンソルネットワーク状態(TTNS)は、システムの波動関数を低ランクテンソルの積に分解する。
本稿では,任意の積和シンボル量子演算子に対して,最適かつ正確なツリーテンソルネットワーク演算子(TTNO)を自動構築するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:18:30 GMT)
Optical Spring Tracking for Enhancing Quantum-Limited Interferometers [0.0] LIGO干渉計は、放射圧とショットノイズからなる量子ノイズによって制限される感度を持つ。
ここでは、光バネを用いた目標信号の動的追跡を実演し、信号対雑音比(SNR)を増大させる。
静的な構成に比べてSNRが最大40倍に増加することを報告した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 23:26:30 GMT)
Online pre-training with long-form videos [0.0] 事前学習の3つの方法(マスクド画像モデリング、コントラスト学習、知識蒸留)について検討する。
コントラスト学習によるオンライン事前学習は、下流タスクで最高のパフォーマンスを示した。
以上の結果から,長ビデオからの学習は,短ビデオを用いた行動認識に有用であることが示唆された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:07:40 GMT)
New constructive counterexamples to additivity of minimum output Rényi p-entropy of quantum channels [0.0] 我々は、対応する最小出力 R'enyi $p$-エントロピーが加法的でない新しい量子チャネルの族を示す。
我々の写本は Grudka et al., J. Phys. A: Math. Theor. 43 425304 の成果によって動機付けられている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:19:41 GMT)
Modelling of planar germanium hole qubits in electric and magnetic fields [0.0] 歪んだ平面ゲルマニウム量子井戸のホールベースのスピン量子ビットは、かなりの注目を集めている。
我々はこれらのホールスピン量子ビットをホストするヘテロ構造のシミュレーションを行う。
平面外磁界に対するスイートスポット, 電荷ノイズの影響を受けにくい操作点が, 急激な大きさの電場にシフトしていることが判明した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:29:14 GMT)
Mid-infrared characterization of NbTiN superconducting nanowire single-photon detectors on silicon-on-insulator [0.0] 超伝導ナノワイヤ単光子検出器は、紫外線から近赤外域までの様々な波長で個々の光子を検出するために広く用いられている。
我々は、U字型NbTiN系超伝導ナノワイヤ単光子検出器のスペクトル検出能力を、中赤外域に拡張する取り組みについて述べる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:25:20 GMT)
Marked Neural Spatio-Temporal Point Process Involving a Dynamic Graph Neural Network [0.0] 時間的ポイントプロセス(TPP)は近年,グラフデータの動的学習においてますます興味深いものになりつつある。
TPPは、イベントストリームの有意義な特徴と、将来のイベントの予測メカニズムを提供する。
我々は,属性や空間データを処理し,グラフストリーム内の任意の事象をモデル化・予測するTPPを学習するために,マーク付きニューラルネットワーク時空間点過程(MNSTPP)を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:34:13 GMT)
Magic of the Heisenberg Picture [0.0] 我々は演算子に対する魔法の資源理論を研究し、これは状態を記述するものと双対である。
作用素空間における安定化器 R'enyi エントロピーアナログは、通常の条件を満たす優れたマジックモノトンである。
この効率よく計算可能な演算子マジックモノトンは、多体マジック生成の構造特性を明らかにする。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:00:01 GMT)
Macroscopic Thermalization for Highly Degenerate Hamiltonians [0.0] 純粋な状態 $psi$ の孤立したマクロ量子系について、$psi$ がヒルベルト空間の適当な部分空間 $mathcalH_eq$ の内か近くにある場合、それはマクロ熱平衡であると言う。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:47:18 GMT)
Machine Learning of Nonlinear Dynamical Systems with Control Parameters Using Feedforward Neural Networks [0.0] フィードフォワードニューラルネットワークは,大域的に結合したスチュアート・ランダウ方程式において,ロジスティクスマップの分岐図と同期遷移を再現可能であることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 05:31:09 GMT)
Local Descriptors Weighted Adaptive Threshold Filtering For Few-Shot Learning [0.0] 画像の分類はほとんどないが、機械学習の分野では難しい課題だ。
本稿では,局所記述子に対する革新的な重み付け適応しきい値フィルタリング(WATF)戦略を提案する。
本手法は、学習可能なパラメータを追加せずに、シンプルで軽量な設計哲学を維持している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:36:23 GMT)
Is Personality Prediction Possible Based on Reddit Comments? [0.0] 本研究では,人物の性格型と書いた文章の関連性について検討する。
これを実現するため、著者のMyers-Briggs Type Indicator (MBTI)にラベル付けされたRedditコメントのデータセットを集約し、BERTに基づいて異なる教師付き分類器を構築し、著者の性格をテキストで予測しようとした。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:43:07 GMT)
Influence of noise in entanglement-based quantum networks [0.0] 絡み合ったリソース状態が分散され、ノード間で格納される、絡み合いに基づく量子ネットワークについて考察する。
この過程におけるノイズの影響について検討し, 状態準備, 記憶, 測定における不完全性について考察する。
大規模ネットワークでは、高次元のクラスター状態が好適であり、ターゲット状態の忠実度が著しく高くなる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:54:11 GMT)
Improving the forecast accuracy of wind power by leveraging multiple hierarchical structure [0.0] 和解による階層予測の最近の進歩は,短期的な風力エネルギー予測の質を著しく向上させた。
本研究では,風力発電所におけるタービンの断面的・時間的階層構造を活用し,その統合された断面的・時間的次元が,風力発電所における予測精度にどのように価値をもたらすかを検討する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:18:00 GMT)
From Complexity to Clarity: How AI Enhances Perceptions of Scientists and the Public's Understanding of Science [0.0] 本稿では, 科学コミュニケーションを簡素化し, 一般の科学理解を高めるために, 生成型AIの有効性を評価した。
研究1aは、PNAS要約(科学要約)と重要文(レイ要約)の簡易性について分析した。
研究2は、単純なGPT要約が科学者のより好ましい認識を促進することを実験的に実証した。
実験3では、参加者は単純なGPT要約を読めば、科学的文章の理解が良くなることを示した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 15:29:10 GMT)
Forecasting Intraday Power Output by a Set of PV Systems using Recurrent Neural Networks and Physical Covariates [0.0] PhotoVoltaic(PV)システムによる出力の正確な予測は、エネルギー分配グリッドの動作を改善するために重要である。
このような日内予測の実現を目的とした神経自己回帰モデルについて述べる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 12:11:46 GMT)
Flow of non-classical correlations in cluster states due to projective measurements [0.0] 3つのキュービットのうちの2つが残りのキュービットで測定されるとき、古典的でない相関を計算する。
3つの量子ビットを除くすべての値が測定された後、それらのうち2つの間に発達した非古典的相関は、はしごの長さとより強くなる傾向を示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:44:54 GMT)
Fast quantum interconnects via constant-rate entanglement distillation [0.0] 量子配線のための定レートエンタングルメント蒸留法を開発した。
提案手法は期待値が一定であり, 数値的に最適化することで, 実用化上のオーバーヘッドの低減を図っている。
最適化されたスキームは、既存の計算効率のよい量子相互接続スキームよりも、関連するレシエーションにおいて桁違いに優れている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:54:54 GMT)
Fall Detection for Smart Living using YOLOv5 [0.0] 本研究は,平均平均精度0.995のYOLOv5muモデルを用いた転倒検出システムを提案する。
このモデルは様々な条件にまたがって大きな堅牢性と適応性を示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:14:51 GMT)
Fairness, Accuracy, and Unreliable Data [0.0] 本論文は,機械学習の信頼性向上を目的とした3つの領域,機械学習の公正性,戦略的分類,アルゴリズム的堅牢性について考察する。
この論文全体のテーマは、古典的な学習理論の仮定と、野生におけるデータ分布の特定の性質とのミスマッチのため、平易な経験的リスク最小化アルゴリズムが誤解を招くか、効果がないかという方法を考えることである。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:44:08 GMT)
FRACTURED-SORRY-Bench: Framework for Revealing Attacks in Conversational Turns Undermining Refusal Efficacy and Defenses over SORRY-Bench [0.0] 本稿では,有害なクエリを一見無害なサブクエストに分解することで,敵のプロンプトを生成する手法を提案する。
提案手法は, GPT-4, GPT-4o, GPT-4o-mini, GPT-3.5-Turbo モデルに対して, 攻撃成功率 (ASR) を最大で+46.22%向上させる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 22:51:29 GMT)
Evaluating Named Entity Recognition Using Few-Shot Prompting with Large Language Models [0.0] Few-Shot PromptingやIn-context Learningは、モデルが最小限の例でエンティティを認識できるようにする。
NERタスクにおけるGPT-4のような最先端モデルの評価を行い、その数ショットのパフォーマンスと完全に教師付きベンチマークを比較した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:42:28 GMT)
Evading AI-Generated Content Detectors using Homoglyphs [0.0] ホモグリフベースの攻撃は、最先端のAI生成テキスト検出器を効果的に回避することができる。
以上の結果から,ホモグリフによる攻撃が,最先端の検出器を効果的に回避できることが示唆された。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:10:59 GMT)
Ethical Hacking and its role in Cybersecurity [0.0] 本稿では,現代のサイバーセキュリティにおける倫理的ハッキングの多様な機能について検討する。
倫理的ハッキング技術の進歩、脆弱性の特定と侵入テストの実行、組織のセキュリティ強化への影響を分析します。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:06:17 GMT)
Estimating QSVT angles for matrix inversion with large condition numbers [0.0] 量子特異値変換(Quantum Singular Value Transformation、QSVT)は、行列の逆変換に使用できる最先端の準最適量子アルゴリズムである。
大規模条件数に対するQSVT角推定のための数値計算手法を提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 00:26:35 GMT)
Energy conservation and quantum backreaction in Bose-Einstein condensates [0.0] 1次元凝縮体のバックリアクション問題はエネルギーと運動量保存の観点から考察される。
ボゴリューボフ理論の妥当性を仮定することにより、バック反応方程式は量子ゆらぎと凝縮補正から生じる系のエネルギーと運動量への寄与を特定するために用いられる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 00:29:57 GMT)
Dynamic Reconstruction from Neuromorphic Data [0.0] ニューロモルフィックセンサーは、変化が非同期に起こっているピクセルにのみ変化を登録する。
これにより、ニューロモルフィックセンサーはマイクロ秒単位でサンプリングし、ダイナミクスを効率的に捉えることができる。
著者らが最近導入したものを含む既存のアプローチでは、従来の画像とニューロモルフィックイベントデータを組み合わせて再構築を行っている。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 01:06:19 GMT)
Direct sum theorems beyond query complexity [0.0] 古典的/量子的クエリの複雑さを拡張する新しいフレームワークを導入する。
この枠組みの中で、いくつかの基本的な直和定理を確立する。
関数 $f: 0, 1k to 0, 1$ と小さなエラー $varepsilon > 0$ が存在して、$n$インスタンスを同時に解決するには、クエリの複雑さが $tildeO(nsqrtk)$ である。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:53:29 GMT)
Development of a cyber risk assessment tool for Irish small business owners [0.0] 中小企業は、限られた資源とサイバーセキュリティの専門知識のために、サイバー脅威に対してますます脆弱になっている。
本研究は,国家リスク評価ツールの開発により,中小企業のサイバーレジリエンスを向上させることを目的とする。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:25:07 GMT)
Determining non-Hermitian parent Hamiltonian from a single eigenstate [0.0] 我々は、一方の右あるいは左固有状態から非エルミート的ハミルトニアンを決定するのに十分であることを示す。
我々のスキームは、実験量子系における非エルミート的ハミルトン学習を好んでいる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:23:47 GMT)
Designs via Free Probability [0.0] ユニタリデザインは、均一なハールアンサンブルの統計を近似するため、擬似ランダム性を調査するための重要なツールとなっている。
量子情報における中心的な役割にもかかわらず、量子カオス進化、特に固有状態熱化仮説(ETH)との関係はいまだに議論の的となっている。
この研究は、自由確率理論を通じて後者と$k$-Designsの間の橋渡しを提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:04:08 GMT)
Cross-Cultural Communication in the Digital Age: An Analysis of Cultural Representation and Inclusivity in Emojis [0.0] 絵文字はデジタル世界で普遍的な言語となり、ユーザーは様々な文化的文脈で感情、アイデア、アイデンティティを表現できるようになった。
本研究の目的は、絵文字における異なる文化の表現を分析し、絵文字が異文化間のコミュニケーションをどのように促進し、傾向を促進するかを調べ、異なる文化文脈における理解と解釈に対する絵文字の影響を探ることである。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 10:24:54 GMT)
Critical analysis of multiple reentrant localization in an antiferromagnetic helix with transverse electric field: Hopping dimerization-free scenario [0.0] Reentrant Localization (RL) は近年顕著な現象である。
本研究は, ホッピング二量体化がRLを実現する重要な要因ではないことを示す。
反強磁性秩序を持つヘリカル磁気系を考慮し、スピン依存RLを複数のエネルギー領域で発見する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 06:42:44 GMT)
Component reusability evaluation and requirement tracing for agent-based cyber-physical-simulated systems [0.0] 本稿では,SysMLに基づくシミュレート・物理システムモデリング言語(SPSysML)を紹介する。
サイバー物理システムにおけるコンポーネント再利用性を評価するために使われるドメイン仕様言語である。
SPSysMLに基づく定量的評価により,シミュレーションおよび物理部分の整合性を改善した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:29:04 GMT)
CLPNets: Coupled Lie-Poisson Neural Networks for Multi-Part Hamiltonian Systems with Symmetries [0.0] 本研究では,ハミルトニアン系のデータベース計算と完全位相空間学習の新たな手法を開発した。
結合システムのためのニューラルネットワークに構築された新しいマッピング方式を導出する。
本手法は次元の呪いに対して優れた抵抗性を示し,研究対象となるデータポイントは数千点に過ぎなかった。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 22:45:15 GMT)
CBF-LLM: Safe Control for LLM Alignment [0.0] 本稿では,制御障壁関数(CBF)を利用した大規模言語モデル(LLM)の整合化のための制御ベースフレームワークを提案する。
提案フレームワークは、CBFに基づいて設計された安全フィルタを、生成されたテキストに介入することを目的としたベースラインLLMの出力生成に適用する。
この実験は、ユーザ特定アライメントタスクに必要な介入回数を減らすための制御能力と有効性を示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 08:25:22 GMT)
Bias in LLMs as Annotators: The Effect of Party Cues on Labelling Decision by Large Language Models [0.0] 我々は、Large Language Models (LLMs) において同様のバイアスをアノテーションとしてテストする。
人間とは違い、極端に左派や右派からの発言を誘発しても、LSMは顕著な偏見を呈する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:05:20 GMT)
Bayesian optimization of atomic structures with prior probabilities from universal interatomic potentials [0.0] GOFEE/BEACONフレームワークのベイズ的アプローチと、普遍的な機械学習ポテンシャルの強みを組み合わせた新しいアプローチを提案する。
多様なシステムを対象とした比較分析により,本手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 07:26:30 GMT)
Autoregressive model path dependence near Ising criticality [0.0] 2次元イジングモデルにおける臨界相関の再構成について検討した。
有限サイズ2次元格子に課される多数の異なる1次元自己回帰列のトレーニング性能を比較した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:21:33 GMT)
Automatic Library Migration Using Large Language Models: First Results [0.0] API移行タスクをサポートするためにChatGPTの利用を検討している研究の最初の成果を報告する。
一番良い結果はワンショットのプロンプトで達成され、次に思考の連鎖が続くことを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 22:03:54 GMT)
Automatic Differential Diagnosis using Transformer-Based Multi-Label Sequence Classification [0.0] 本稿では,患者の年齢,性別,医療歴,症状に基づく鑑別診断のためのトランスフォーマーベースのアプローチを提案する。
DDXPlus データセットを用いて,49 種類の疾患を鑑別し,鑑別診断情報を提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:40:15 GMT)
Automated Real-World Sustainability Data Generation from Images of Buildings [0.0] そこで本研究では,適切な迅速なエンジニアリングとドメイン知識を備えた大規模言語モデルを用いて,サステナビリティ計算に関係のあるビルディング特性を推定できることを示す。
提案手法を,47の集合住宅の実際の建物データからなる地上真実と比較し,その精度を人間よりも向上させる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:41:34 GMT)
Automated Mixture Analysis via Structural Evaluation [0.0] 本稿では,機械学習の分子埋め込み手法とグラフベースのランキングシステムを組み合わせることで,混合系に存在する分子の可能性を判定する。
混合成分を極めて高い精度 (>97%) で効率よく同定できることを実証した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 14:32:24 GMT)
Asymmetry Amplification by a Nonadiabatic Passage through a Critical Point [0.0] 弱対称性破壊相互作用の存在下での量子二階相転移による動的通過の最小モデルの提案と解法を行った。
この進化は、たとえ対称性の破れ項がどれほど弱いとしても、最終的に高度に非対称状態をもたらす。
これは、ほぼ同じ特性を持つ粒子の生成において強い非対称性のポテンシャル機構が示唆される。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 16:06:56 GMT)
Analysis of Diagnostics (Part II): Prevalence, Linear Independence, and Unsupervised Learning [0.0] 私は教師あり機械学習(ML)の文脈を考える
パートIIでは、これらの結果を教師なし学習のタスクに拡張できる範囲について検討している。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:39:57 GMT)
Analysis of Diagnostics (Part I): Prevalence, Uncertainty Quantification, and Machine Learning [0.0] この写本は、分類理論と有病率のより深い関係を研究する二部作の最初のものである。
そこで本稿では,有病率重み付き経験誤差を最小化することにより,Bstar (q)$を推定する数値ホモトピーアルゴリズムを提案する。
合成データとSARS-CoV-2酵素結合免疫測定法(ELISA)を用いて本法の有効性を検証した。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:32:43 GMT)
An Enhanced Hybrid HHL Algorithm [0.0] 2ビットの精度しか持たない固有値推定により,HHLと比較してHHLの誤差境界が厳密になることを示す。
我々の拡張は、2x2系の代表サンプルに対する理想量子プロセッサにおけるHHLの誤差を平均57%削減する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:35:07 GMT)
All-fiber microendoscopic polarization sensing at single-photon level aided by deep-learning [0.0] 実時間偏光測定法を1光子レベルまで精度良く導入する。
生体試料の偏光構造を可視化し, アプローチを検証する。
本手法は,低光環境下でのリアルタイム偏光センシングとマイクロ内視鏡のための効率的で信頼性の高いソリューションを提供する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:59:08 GMT)
Ain't How You Deploy: An Analysis of BGP Security Policies Performance Against Various Attack Scenarios with Differing Deployment Strategies [0.0] 本稿では,BGP(Border Gateway Protocol)のセキュリティポリシを,異なるデプロイメント戦略を用いて複数の攻撃シナリオに対して適用する方法について検討する。
広範囲なシミュレーションを通じて、異なるAS配置タイプにわたるROV(Root Origin Validation)、ASPA(Autonomous System Provider Authorization)、PeerROV(PeerROV)などの防御メカニズムの有効性を評価する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:43:21 GMT)
A transition state resonance radically reshapes angular distributions of the F + H2 -> F H(vf = 3) + H reaction in the 62.09-101.67 meV energy range [0.0] ベンチマーク F + H(vi = 0) -> F H(vf = 3) + H 反応の反応角分布は、小さな散乱角に対して異常な確率を示す。
複素エネルギー極への変換により、この効果は遷移状態共鳴にのみ寄与する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 20:51:19 GMT)
A quantum random access memory (QRAM) using a polynomial encoding of binary strings [0.0] 量子ランダムアクセスメモリ(QRAM)は量子オラクルを実現するための有望なアーキテクチャである。
我々はQRAMの新しい設計を開発し、Clifford+T回路で実装する。
我々は、Tカウントを減らし、クォービット数を同じにしながら、T深度を指数的に改善する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 18:39:56 GMT)
A nudge to the truth: atom conservation as a hard constraint in models of atmospheric composition using an uncertainty-weighted correction [0.0] 本稿では,任意の数値モデルからの予測を物理的に一貫した制約に固定する手法を提案する。
この閉形式モデル非依存補正は、予測された濃度を最小に摂動させるために単一の行列演算を使用する。
非物理的予測に対する不確実性重み付き補正の適用は、全体的な精度をわずかに向上させる。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 19:32:28 GMT)
A graduate laboratory experiment to set up a photon-counting detector using MKIDs [0.0] 本稿では,マイクロ波の低温における応用に関する知識と専門知識の育成を目的とした新しい研究室活動について述べる。
マイクロ波動インダクタンス検出器(MKID)による赤外線光子検出に焦点をあてた経験
論文参考訳(メタデータ) (Wed, 28 Aug 2024 09:48:10 GMT)
A Platform-Agnostic Deep Reinforcement Learning Framework for Effective Sim2Real Transfer towards Autonomous Driving [0.0] 深層強化学習(DRL)は複雑なタスクの解決に顕著な成功を収めた。
シミュレーションと現実の間に大きな違いがあるため、DRLエージェントを現実世界に転送することは依然として困難である。
本稿では、プラットフォームに依存した認識モジュールを利用してタスク関連情報を抽出する頑健なDRLフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 11:18:26 GMT)
A Metric-based Principal Curve Approach for Learning One-dimensional Manifold [0.0] 空間データの1次元多様体を学習する新しい計量ベース主曲線(MPC)法を提案する。
MNISTデータセットを用いた実応用により,本手法は形状の観点から一次元多様体をよく学習できることを示す。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 13:48:07 GMT)
1+1d SPT phases with fusion category symmetry: interface modes and non-abelian Thouless pump [0.0] 1+1d の有限非可逆対称性を持つ $mathcalC$-SPT 位相を考える。
我々は、$mathcalC$-SPTの異なるフェーズ間に退化インターフェースモードが必要であることを示す。
我々の不変量は、Thoulessチャージポンプの非アーベル一般化と同一視される。
論文参考訳(メタデータ) (Wed, 28 Aug 2024 17:26:18 GMT)