Fugu-MT: arxivの論文翻訳(概要)

Qwen2 Technical Report [141.1]
本稿では,我々の大規模言語モデルと大規模マルチモーダルモデルへの最新の追加であるQwen2シリーズを紹介する。 Qwen2は、前身のQwen1.5を含む、これまでのほとんどのオープンウェイトモデルを超え、プロプライエタリモデルと比較して競争力のある性能を示している。 Qwen2は、英語、中国語、スペイン語、フランス語、ドイツ語、アラビア語、ロシア語、韓国語、日本語、タイ語、ベトナム語など、約30の言語で熟練した堅牢な多言語機能を示している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:39:24 GMT)
Any Image Restoration with Efficient Automatic Degradation Adaptation [132.8]
本研究は, 各種劣化の相似性を有効かつ包括的修復に活用し, 共同埋設を実現する統一的な方法を提案する。我々のネットワークは、モデルの複雑さをトレーニング可能なパラメータで約82%、FLOPで約85%削減しつつ、新しいSOTAレコードを設定している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:26:53 GMT)
LinSATNet: The Positive Linear Satisfiability Neural Networks [116.7]
本稿では,ニューラルネットワークに人気の高い正の線形満足度を導入する方法について検討する。本稿では,古典的なシンクホーンアルゴリズムを拡張し,複数の辺分布の集合を共同で符号化する,最初の微分可能満足層を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:05:21 GMT)
Are Large Language Models Capable of Generating Human-Level Narratives? [114.3]
本稿ではストーリーテリングにおけるLLMの能力について考察し,物語の展開とプロットの進行に着目した。本稿では,3つの談話レベルの側面から物語を分析するための新しい計算フレームワークを提案する。談話機能の明示的な統合は、ニューラルストーリーテリングの40%以上の改善によって示されるように、ストーリーテリングを促進することができることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:02:49 GMT)
Real-time 3D-aware Portrait Editing from a Single Image [111.3]
3DPEは、参照画像やテキスト記述など、与えられたプロンプトに従って顔画像を編集することができる。軽量モジュールは、3Dポートレートジェネレータとテキスト・ツー・イメージ・モデルから蒸留される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:43:41 GMT)
PixelLM: Pixel Reasoning with Large Multimodal Model [110.5]
PixelLMはピクセルレベルの推論と理解のための効率的かつ効率的なLMMである。コードブックトークンの隠された埋め込みからマスクを生成し、詳細なターゲット関連情報をエンコードする。 PixelLMは、さまざまなピクセルレベルの画像推論と理解タスクを網羅し、複数のベンチマークで確立されたメソッドよりも優れています。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:18:36 GMT)
MER 2024: Semi-Supervised Learning, Noise Robustness, and Open-Vocabulary Multimodal Emotion Recognition [102.8]
我々は、この分野の発展を促進するために、MERシリーズのコンペティションを組織する。昨年、私たちはMER2023を立ち上げ、マルチラベル学習、ノイズの堅牢性、半教師付き学習という3つの興味深いトピックに焦点を当てました。今年は、データセットのサイズの拡大に加えて、オープン語彙の感情認識に関する新たなトラックを導入しました。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:23:25 GMT)
MVSplat: Efficient 3D Gaussian Splatting from Sparse Multi-View Images [102.8]
入力としてスパースなマルチビュー画像を与えられたMVSplatは、クリーンなフィードフォワード3Dガウスを予測できる。大規模RealEstate10KとACIDベンチマークでは、MVSplatは高速フィードフォワード推論速度(22fps)で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:10:22 GMT)
On Learning to Summarize with Large Language Models as References [101.8]
大型言語モデル (LLM) は、一般的な要約データセットにおける元の参照要約よりも人間のアノテーションに好まれる。より小さなテキスト要約モデルに対するLLM-as-reference学習設定について検討し,その性能が大幅に向上するかどうかを検討する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:23:59 GMT)
Realistic Unsupervised CLIP Fine-tuning with Universal Entropy Optimization [101.1]
本稿では,未知のクラスにおける配布外サンプルの存在を考慮し,教師なしの微調整シナリオについて考察する。特に,分布外検出と既知のクラスに関連するインスタンスの認識を同時に強化することに注力する。我々はUniversal Entropy Optimization(UEO)と呼ばれるシンプルで効率的で効果的なアプローチを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:14:13 GMT)
Jailbreaking Black Box Large Language Models in Twenty Queries [97.3]
大規模言語モデル(LLM)は、敵のジェイルブレイクに対して脆弱である。 LLMへのブラックボックスアクセスのみのセマンティックジェイルブレイクを生成するアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:24:57 GMT)
ODMixer: Fine-grained Spatial-temporal MLP for Metro Origin-Destination Prediction [89.5]
具体的には、ODMixerは二重分岐構造を持ち、Channel Mixer、Multi-view Mixer、Bidirectional Trend Learnerが関与する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:30:17 GMT)
Efficient Image Pre-Training with Siamese Cropped Masked Autoencoders [89.1]
そこで我々は,SiamMAE が導入した Siamese プレトレーニングの代替手法である CropMAE を提案する。本手法では, ビデオから抽出した従来のフレームの対から切り離して, 同一画像から抽出した画像の対を別々に抽出する。 CropMAEは、これまでで最も高いマスキング比(98.5%)を達成し、2つの目に見えるパッチのみを使用して画像の再構成を可能にする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:56:11 GMT)
Privacy Side Channels in Machine Learning Systems [87.5]
プライバシサイドチャネルは、システムレベルのコンポーネントを利用してプライベート情報を抽出する攻撃である。例えば、差分プライベートなトレーニングを適用する前にトレーニングデータを重複させることで、保証可能なプライバシ保証を完全に無効にするサイドチャネルが生成されることを示す。さらに,学習データセットに含まれる秘密鍵を抽出するために,言語モデルを学習データ再生からブロックするシステムを利用することを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:12:46 GMT)
WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal Research [82.4]
約400kの音声クリップとペアキャプションを組み合わせた,大規模な音声キャプションデータセットであるWavCapsを紹介した。オンラインハーベストな生の記述は非常にうるさいし、自動音声キャプションなどのタスクで直接使うには適さない。本稿では,大規模な言語モデルであるChatGPTを用いて,ノイズの多いデータをフィルタリングし,高品質なキャプションを生成するための3段階処理パイプラインを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:20:31 GMT)
Correcting the Mythos of KL-Regularization: Direct Alignment without Overparameterization via Chi-squared Preference Optimization [78.8]
新たなオフラインアライメントアルゴリズムである$chi2$-Preference Optimization(chi$PO)を提案する。 $chi$POは、正規化による不確実性に直面して悲観主義の原理を実装している。過度な最適化には確実に堅牢であり、単一政治の集中性に基づいたサンプル複雑度保証を実現する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:08:40 GMT)
GraphRCG: Self-Conditioned Graph Generation [78.7]
本稿では,グラフ分布を明示的にモデル化する自己条件付きグラフ生成フレームワークを提案する。本フレームワークは, 既存のグラフ生成手法に比べて, 学習データに対するグラフ品質と忠実度において優れた性能を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:05:58 GMT)
Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI [78.6]
人工知能(Embodied AI)は、人工知能(AGI)の実現に不可欠である MLMとWMは、その顕著な知覚、相互作用、推論能力のために、大きな注目を集めている。本調査では,Embodied AIの最近の進歩を包括的に調査する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:41:12 GMT)
Modeling and Driving Human Body Soundfields through Acoustic Primitives [76.1]
本研究では,人体が生成する全3次元音場をレンダリングし,高品質な空間オーディオ生成を実現するフレームワークを提案する。我々は,3次元空間の任意の点において,全音響シーンを効率よく,正確にレンダリングできることを実証した。我々の音響プリミティブは、従来の手法に比べて、音場表現が桁違い小さくなり、近接場レンダリングの欠陥を克服する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:05:13 GMT)
FuLG: 150B Romanian Corpus for Language Model Pretraining [76.1]
我々は,CommonCrawlから抽出した100,500万トンものルーマニア製コーパスであるFuLGを紹介する。本稿では,既存のルーマニアのコーパスに対するアブレーション研究を通じてFuLGをフィルタリングし,比較する手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:32:48 GMT)
Physics-guided Active Sample Reweighting for Urban Flow Prediction [75.2]
都市フロー予測は、バス、タクシー、ライド駆動モデルといった交通サービスのスループットを見積もる、微妙な時間的モデリングである。最近の予測解は、物理学誘導機械学習(PGML)の概念による改善をもたらす。我々は、PN(atized Physics-guided Network)を開発し、P-GASR(Physical-guided Active Sample Reweighting)を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:44:23 GMT)
Diffusion-Refined VQA Annotations for Semi-Supervised Gaze Following [74.3]
訓練用視線モデルには、人間のアノテータによって注釈付けされた視線目標座標を持つ多数の画像が必要である。タスクに2つの新しい前処理を導入することで、視線追跡のための最初の半教師付き手法を提案する。提案手法は,GazeFollow画像データセットに基づく単純な擬似アノテーション生成ベースラインよりも優れている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:59:08 GMT)
Deep Time Series Models: A Comprehensive Survey and Benchmark [74.3]
時系列データは、現実世界のシナリオにおいて非常に重要である。近年、時系列コミュニティで顕著なブレークスルーが見られた。多様な分析タスクのためのディープ時系列モデルの公正なベンチマークとして、時系列ライブラリ(TSLib)をリリースします。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:31:55 GMT)
PALM: Predicting Actions through Language Models [74.1]
本稿では,長期的行動予測の課題に取り組むアプローチであるPALMを紹介する。本手法は,従来の行動系列を追跡する行動認識モデルと,関連する環境の詳細を記述するための視覚言語モデルを含む。実験の結果,PALMは長期的な行動予測作業において最先端の手法を超越していることがわかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:31:53 GMT)
LogoSticker: Inserting Logos into Diffusion Models for Customized Generation [73.6]
テキスト・ツー・イメージ・モデルにロゴを挿入する作業を導入する。我々の目標は、ロゴのアイデンティティを拡散モデルに挿入し、様々な状況下でシームレスに合成できるようにすることです。この課題に対処するために,新しい2相パイプラインLogoStickerを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:54:49 GMT)
Random Latent Exploration for Deep Reinforcement Learning [71.9]
本稿ではRLE(Random Latent Exploration)と呼ばれる新しい探査手法を紹介する。 RLEはボーナスベースとノイズベース(ディープRLを効果的に探索するための2つの一般的なアプローチ)の強みを組み合わせたものである。 AtariとIsaacGymのベンチマークで評価し、RLEは他の手法よりも全タスクの総合スコアが高いことを示した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:55:22 GMT)
Continual Forgetting for Pre-trained Vision Models [70.5]
現実のシナリオでは、選択的な情報は事前訓練されたモデルから継続的に取り除かれることが期待される。効率的な削除のためのグループスパースロラ(GS-LoRA)を提案する。我々は,顔認識,物体検出,画像分類に関する広範な実験を行い,GS-LoRAが他のクラスに最小限の影響で,特定のクラスを忘れることが実証された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:23:36 GMT)
Evaluating and Analyzing Relationship Hallucinations in Large Vision-Language Models [69.8]
視覚関係の幻覚を評価するための新しいベンチマークであるR-Benchを紹介する。 R-Benchは、関係の存在に焦点を当てたイメージレベルの質問と、局所的な視覚的理解を評価するインスタンスレベルの質問を特徴としている。我々は,関係関連性,主観関連性,関係対象性という,幻覚につながる3つの関係共起関係を同定する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:39:29 GMT)
WiNet: Wavelet-based Incremental Learning for Efficient Medical Image Registration [68.3]
深部画像登録は異常な精度と高速な推測を示した。近年の進歩は、粗大から粗大の方法で密度変形場を推定するために、複数のカスケードまたはピラミッドアーキテクチャを採用している。本稿では,様々なスケールにわたる変位/速度場に対して,スケールワイブレット係数を漸進的に推定するモデル駆動WiNetを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:51:01 GMT)
Open Vocabulary 3D Scene Understanding via Geometry Guided Self-Distillation [67.4]
2次元事前学習モデルから優れた3次元表現を学習するための幾何学ガイド自己蒸留(GGSD)を提案する。 3D表現の利点により、蒸留した3D学生モデルの性能は2D教師モデルよりも大幅に上回ることができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:13:56 GMT)
GroupMamba: Parameter-Efficient and Accurate Group Visual State Space Model [66.4]
状態空間モデル(SSM)は、二次的複雑性を伴う長距離依存のモデリングにおいて効果的な性能を示した。しかし、純粋なSSMベースのモデルは、コンピュータビジョンタスクにおける安定性と最適性能の達成に関連する課題に直面している。本稿では,コンピュータビジョンのためのSSMベースのモデルをスケールする上での課題,特に大規模モデルの不安定性と非効率性について論じる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:59:58 GMT)
V-IRL: Grounding Virtual Intelligence in Real Life [65.9]
V-IRLは、エージェントが仮想的で現実的な環境で現実世界と対話することを可能にするプラットフォームである。私たちのプラットフォームは、様々な実践的なタスクを達成できるエージェントを開発するための遊び場として役立ちます。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:08:29 GMT)
Towards Zero-Shot Multimodal Machine Translation [64.9]
本稿では,マルチモーダル機械翻訳システムの学習において,完全教師付きデータの必要性を回避する手法を提案する。我々の手法はZeroMMTと呼ばれ、2つの目的の混合で学習することで、強いテキストのみの機械翻訳(MT)モデルを適応させることである。本手法が完全に教師付きトレーニングデータを持たない言語に一般化されることを証明するため,CoMMuTE評価データセットをアラビア語,ロシア語,中国語の3言語に拡張した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:20:31 GMT)
Understand What LLM Needs: Dual Preference Alignment for Retrieval-Augmented Generation [64.8]
Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)の幻覚化問題を緩和する効果を実証している。本稿では,RAGシステム内での多様な知識嗜好の整合を図った汎用フレームワークであるDPA-RAGを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:28:09 GMT)
An Intrinsic Vector Heat Network [64.6]
本稿では,3次元に埋め込まれた接ベクトル場を学習するためのニューラルネットワークアーキテクチャを提案する。本研究では, ベクトル値の特徴データを空間的に伝播させるために, トレーニング可能なベクトル熱拡散モジュールを提案する。また,四面体メッシュ生成の産業的有用性に対する本手法の有効性を実証した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:31:20 GMT)
LLM-Empowered State Representation for Reinforcement Learning [64.3]
強化学習における状態表現はしばしば重要なタスク関連の詳細を省略する。 LLMを用いたタスク関連状態表現を自律的に生成する新しい手法であるLESR(LLM-Empowered State Representation)を提案する。 LESRは高いサンプル効率を示し、ムジョコタスクの累積報酬の29%、ジム・ロボティクスタスクの成功率の30%で最先端のベースラインを上回っている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:47:51 GMT)
NCL++: Nested Collaborative Learning for Long-Tailed Visual Recognition [63.9]
本研究では,Nested Collaborative Learning (NCL++)を提案する。長期学習における協調学習を実現するために,バランスの取れたオンライン蒸留を提案する。混乱するカテゴリにおける細かな識別能力を改善するために,さらにハードカテゴリーマイニングを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:38:49 GMT)
PersLLM: A Personified Training Approach for Large Language Models [63.8]
社会実践, 一貫性, 動的発達という, 心理学に根ざした個性の原則を統合したPersLLMを提案する。モデルパラメータに直接パーソナリティ特性を組み込み、誘導に対するモデルの抵抗性を高め、一貫性を高め、パーソナリティの動的進化を支援する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:18:43 GMT)
LaMI-DETR: Open-Vocabulary Detection with Language Model Instruction [63.7]
既存の手法は、視覚言語モデル(VLM)の頑健なオープン語彙認識機能を活用することにより、オープン語彙オブジェクト検出を強化している。本稿では,視覚的概念間の関係を生かしたLanguage Model Instruction(LaMI)戦略を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:52:52 GMT)
AccDiffusion: An Accurate Method for Higher-Resolution Image Generation [63.5]
AccDiffusionは、パッチワイドの高解像度画像生成をトレーニングなしで正確に行う方法である。本稿では,異なるパッチに対する同一のテキストプロンプトが繰り返しオブジェクト生成を引き起こすことを明らかにする。私たちのAccDiffusionは、初めて、バニラ画像認識プロンプトをパッチコンテンツ認識プロンプトのセットに分離することを提案しています。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:19:53 GMT)
Understanding Reinforcement Learning-Based Fine-Tuning of Diffusion Models: A Tutorial and Review [63.3]
このチュートリアルは、下流の報酬関数を最適化するための微調整拡散モデルのための方法を網羅的に調査する。 PPO,微分可能最適化,報酬重み付きMLE,値重み付きサンプリング,経路整合性学習など,様々なRLアルゴリズムの適用について説明する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:35:32 GMT)
Visual Haystacks: Answering Harder Questions About Sets of Images [63.3]
本稿では,Multi-Image Visual Question Answering(MIQA)の課題について検討する。大量の画像と自然言語クエリが与えられたら、そのタスクは関連性があり、接地された応答を生成することだ。大規模マルチモーダルモデル(LMM)に適した新しい検索/QAフレームワークであるMIRAGEを紹介する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:59:30 GMT)
SegPoint: Segment Any Point Cloud via Large Language Model [62.7]
我々は,多種多様なタスクにまたがるポイントワイドセグメンテーションマスクを生成するSegPointと呼ばれるモデルを提案する。 SegPointは、単一のフレームワーク内でさまざまなセグメンテーションタスクに対処する最初のモデルである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:58:03 GMT)
HazeCLIP: Towards Language Guided Real-World Image Dehazing [62.4]
既存の手法は、特に合成データセットにおいて、単一画像のデハージングにおいて顕著な性能を達成した。本稿では,事前学習型デハジングネットワークの性能向上を目的とした言語誘導適応フレームワークHazeCLIPを紹介する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:18:25 GMT)
General Geometry-aware Weakly Supervised 3D Object Detection [62.3]
RGB画像と関連する2Dボックスから3Dオブジェクト検出器を学習するための統合フレームワークを開発した。 KITTIとSUN-RGBDデータセットの実験により,本手法は驚くほど高品質な3次元境界ボックスを2次元アノテーションで生成することを示した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:52:08 GMT)
Streetscapes: Large-scale Consistent Street View Generation Using Autoregressive Video Diffusion [61.9]
そこで本研究では,街並みを連続的に合成した街並みの景観を再現する手法を提案する。我々の手法は、視覚的品質と一貫性を維持しつつ、複数の都市ブロックにまたがる、はるかに長い範囲のカメラ軌道にスケールすることができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:56:30 GMT)
PYRA: Parallel Yielding Re-Activation for Training-Inference Efficient Task Adaptation [61.6]
本稿では, PYRA(Parallel Yielding Re-Activation)法を提案する。 PYRAは低圧縮率と高圧縮率の両方で競合する全ての手法より優れている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:25:59 GMT)
Learning Camouflaged Object Detection from Noisy Pseudo Label [60.9]
本稿では,まず,弱い半教師付きカモフラージュオブジェクト検出(COD)法を提案する。予算効率が高く高精度なカモフラージュされたオブジェクトセグメンテーションを目標とし、完全にラベル付けされた画像が極めて限られている。本稿では,早期の学習段階において,モデルが正しい画素の学習を容易にするノイズ補正損失を提案する。完全ラベル付きデータの20%しか使用しない場合,本手法は最先端の手法よりも優れた性能を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:53:51 GMT)
Large Language Models as Reliable Knowledge Bases? [60.3]
大きな言語モデル(LLM)は潜在的な知識ベース(KB)と見なすことができる。本研究は、信頼性の高いLLM-as-KBが満たすべき基準を定義し、事実性と一貫性に焦点をあてる。 ICLや微調整のような戦略は、LLMをより良くKBにするには失敗している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:20:18 GMT)
Audio-driven Talking Face Generation with Stabilized Synchronization Loss [60.0]
トーキング・フェイスジェネレーションは、正確な唇の同期と高い視覚的品質でリアルなビデオを作成することを目的としている。まずサイレント・リップ・ジェネレータを導入することでリップリーク問題に対処する。実験の結果,我々のモデルは視覚的品質と唇の同期の両方において最先端の手法よりも優れていた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:51:27 GMT)
ManiGaussian: Dynamic Gaussian Splatting for Multi-task Robotic Manipulation [58.6]
従来のロボット操作法は通常、予測のための観察の意味表現を学ぶ。マルチ時間ロボット操作のための動的ガウス分割法ManiGaussianを提案する。我々のフレームワークは、最先端の手法を平均的な成功率で13.1%上回ることができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:45:47 GMT)
Hyp2Nav: Hyperbolic Planning and Curiosity for Crowd Navigation [58.6]
我々は,群集ナビゲーションを実現するための双曲学習を提唱し,Hyp2Navを紹介した。 Hyp2Navは双曲幾何学の本質的な性質を活用し、ナビゲーションタスクにおける意思決定プロセスの階層的性質をよりよく符号化する。本稿では, 効果的なソーシャルナビゲーション, 最高の成功率, 複数シミュレーション設定におけるリターンをもたらす, 双曲型ポリシーモデルと双曲型好奇性モジュールを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:40:33 GMT)
Towards AI-Powered Video Assistant Referee System (VARS) for Association Football [58.0]
Video Assistant Referee (VAR)は、バックステージの審判が複数の視点からピッチ上のインシデントをレビューできるようにするイノベーションである。 VARは現在、高価なインフラと世界中の審判の欠如のために、プロリーグに限られている。マルチビュービデオ解析における最新の知見を活用する半自動ビデオアシスタント参照システム(VARS)を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:18:23 GMT)
On Pretraining Data Diversity for Self-Supervised Learning [57.9]
我々は、より多様なデータセットを用いたトレーニングが、固定された計算予算の下での自己教師付き学習(SSL)のパフォーマンスに与える影響について検討する。以上の結果から,事前学習データの多様性の増大はSSL性能を向上させるが,下流データへの分布距離が最小である場合に限る。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:15:00 GMT)
BEVWorld: A Multimodal World Model for Autonomous Driving via Unified BEV Latent Space [57.7]
BEVWorldは,マルチモーダルセンサの入力を,環境モデリングのための統一的でコンパクトなBird's Eye View潜在空間にトークン化する手法である。実験は、自律走行タスクにおけるBEVWorldの有効性を示し、将来のシーンを生成する能力を示し、知覚や動き予測のような下流タスクに恩恵を与える。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:33:43 GMT)
NeRF-MAE: Masked AutoEncoders for Self-Supervised 3D Representation Learning for Neural Radiance Fields [57.6]
提案手法は,RGB画像から有効な3D表現を生成する方法を示す。我々は、この表現を、提案した擬似RGBデータに基づいて、180万枚以上の画像で事前訓練する。我々は,NeRFの自己教師型プレトレーニングであるNeRF-MAE(NeRF-MAE)を目覚ましいスケールで実施し,様々な3Dタスクの性能向上を実現した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:59:48 GMT)
FANTAstic SEquences and Where to Find Them: Faithful and Efficient API Call Generation through State-tracked Constrained Decoding and Reranking [57.5]
APIコール生成は、大規模言語モデルのツール使用能力の基盤となっている。既存の教師付きおよびコンテキスト内学習アプローチは、高いトレーニングコスト、低いデータ効率、APIドキュメントとユーザの要求に反する生成APIコールに悩まされる。本稿では,これらの制約に対処するため,FANTASEと呼ばれる出力側最適化手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 23:44:02 GMT)
Less Peaky and More Accurate CTC Forced Alignment by Label Priors [57.5]
接続性時間分類(CTC)モデルはピーク出力分布を持つことが知られている。本稿では, CTCのピーク動作を緩和し, 強制アライメント生成への適合性を向上させることを目的とする。我々のCTCモデルはピーク後部を減らし、トークンのオフセットをより正確に予測することができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:28:45 GMT)
SynthCLIP: Are We Ready for a Fully Synthetic CLIP Training? [57.4]
完全合成テキストイメージペアに基づいてトレーニングされたCLIPモデルであるSynthCLIPを提案する。我々は人間の介入なしに画像と対応するキャプションの合成データセットを大規模に生成する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:21:29 GMT)
Open-Vocabulary 3D Semantic Segmentation with Text-to-Image Diffusion Models [57.4]
Diff2Sceneは、テキスト画像生成モデルからの凍結表現と、サルエント・アウェアと幾何学的アウェアマスクを併用して、オープンな3次元セマンティックセマンティックセグメンテーションと視覚的グラウンドニングタスクに活用する。競争ベースラインを上回り、最先端の手法よりも大幅に改善されていることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:20:56 GMT)
OE-BevSeg: An Object Informed and Environment Aware Multimodal Framework for Bird's-eye-view Vehicle Semantic Segmentation [57.2]
Bird's-eye-view (BEV)セマンティックセマンティックセグメンテーションは自律運転システムにおいて重要である。本稿では,BEVセグメンテーション性能を向上させるエンドツーエンドマルチモーダルフレームワークであるOE-BevSegを提案する。提案手法は,車両セグメンテーションのためのnuScenesデータセットにおいて,最先端の成果を大きなマージンで達成する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:48:22 GMT)
Handling Numeric Expressions in Automatic Speech Recognition [57.0]
数値表現の認識と形式化のためのケースドとエンド・ツー・エンドのアプローチを比較した。その結果,適応型エンドツーエンドモデルでは,低レイテンシと推論コストの利点を生かして,競争性能が向上することがわかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:46:19 GMT)
One Thousand and One Pairs: A "novel" challenge for long-context language models [56.6]
NoChaは、67冊の架空の書籍に関する1,001対の真偽の主張のデータセットである。当社のアノテータは、NoChaにおけるペアの最大シェアは、本全体に対するグローバルな推論を必要としていることを確認しています。平均的なモデルでは、文レベルの検索しか必要としないペアの方が、グローバルな推論よりもはるかに優れています。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:47:24 GMT)
Improved motif-scaffolding with SE(3) flow matching [56.5]
タンパク質のバックボーン生成のためのSE(3)フローマッチングモデルであるFrameFlowを拡張し,2つの相補的なアプローチでモチーフ・スキャフォールディングを行う。 1つ目はモチーフ・アモーティゼーション(motif amortization)で、FrameFlowはデータ拡張戦略を使用してモチーフを入力としてトレーニングする。 2つ目はモチーフガイダンスで、追加のトレーニングなしでFrameFlowから条件スコアを推定して足場化を行う。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:17:05 GMT)
Pyramid Diffusion for Fine 3D Large Scene Generation [56.0]
拡散モデルは2次元画像と小型3次元オブジェクトの生成において顕著な結果を示した。大規模な3Dシーンの合成への応用はめったに研究されていない。本稿では,大規模拡散モデルを用いて,高品質な屋外シーンを段階的に生成するフレームワークであるPraamid Discrete Diffusion Model (PDD)を紹介する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:04:19 GMT)
When Do We Not Need Larger Vision Models? [56.0]
視覚モデルのサイズを拡大することが、より強力な視覚表現を得るためのデファクトスタンダードとなっている。 S$2のScaling on Scales(スケーリング・オン・スケール)のパワーを実演します。 1行のコードで任意のビジョンモデルにS$2$を適用可能なPythonパッケージをリリースします。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:54:35 GMT)
Spontaneous Style Text-to-Speech Synthesis with Controllable Spontaneous Behaviors Based on Language Models [55.9]
本稿では,言語モデルに基づく新たな自然音声合成システムを提案する。自発音声における微妙な韻律変化を捉えるモデルの能力を高めるために, きめ細かい韻律モデリングを導入する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:42:38 GMT)
NeuroPictor: Refining fMRI-to-Image Reconstruction via Multi-individual Pretraining and Multi-level Modulation [55.5]
本稿では,fMRI信号を用いた拡散モデル生成過程を直接変調することを提案する。様々な個人から約67,000 fMRI-imageペアのトレーニングを行うことで,fMRI-to-imageデコーディング能力に優れたモデルが得られた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:22:37 GMT)
Efficient Training for Multilingual Visual Speech Recognition: Pre-training with Discretized Visual Speech Representation [55.2]
本稿では,1つの訓練されたモデルで異なる言語を認識可能な文レベル多言語視覚音声認識(VSR)について検討する。視覚音声単位を用いた新しい学習手法を提案する。我々は、従来の言語固有のVSRモデルに匹敵する性能を達成し、最先端の多言語VSRのパフォーマンスを新たに設定した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:01:51 GMT)
AWQ: Activation-aware Weight Quantization for LLM Compression and Acceleration [54.7]
LLM低ビット量のみの量子化のためのハードウェアフレンドリーなアプローチであるActivation-Aware Weight Quantization (AWQ)を提案する。 AWQ は 1% の正重みしか保護せず,命令調整型 LM とマルチモーダル LM の量子化性能に優れる。また,4ビットオンデバイスLLM/VLMに適した,効率的なフレキシブルな推論フレームワークであるTinyChatを実装した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:51:33 GMT)
Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models [54.1]
トレーニングデータを自動的に生成する最初のスケーラブルで信頼性の高いAutoIFを導入する。 AutoIFは命令追従データ品質の検証をコード検証に変換する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:00:23 GMT)
Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.8]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:36:10 GMT)
Overcoming Distribution Mismatch in Quantizing Image Super-Resolution Networks [53.2]
量子化は画像超解像(SR)ネットワークの精度を低下させる。既存の作業は、テスト時間中に量子化範囲を動的に適応することで、この分散ミスマッチ問題に対処する。本稿では,SRネットワークにおける分散ミスマッチ問題を効果的に克服する量子化対応学習手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:37:08 GMT)
Feedback Efficient Online Fine-Tuning of Diffusion Models [52.2]
提案手法は, 実現可能なサンプルの多様体上で効率的に探索できる新しい強化学習手法である。本稿では,3つの領域にまたがる実証的検証とともに,後悔の保証を提供する理論的解析を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:21:54 GMT)
View-Consistent Hierarchical 3D Segmentation Using Ultrametric Feature Fields [52.1]
我々は3次元シーンを表すニューラル・レージアンス・フィールド(NeRF)内の新しい特徴場を学習する。本手法は、ビュー一貫性の多粒性2Dセグメンテーションを入力とし、3D一貫性のセグメンテーションの階層構造を出力として生成する。提案手法と,多視点画像と多粒性セグメンテーションを用いた合成データセットのベースラインの評価を行い,精度と視点整合性を向上したことを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:28:14 GMT)
Multiobjective Vehicle Routing Optimization with Time Windows: A Hybrid Approach Using Deep Reinforcement Learning and NSGA-II [52.1]
本稿では、時間窓を用いた多目的車両ルーティング問題(MOVRPTW)に対処するために、ウェイト・アウェア・ディープ・強化学習(WADRL)手法を提案する。 WADRLの結果を最適化するために非支配的ソート遺伝的アルゴリズム-II (NSGA-II) 法を用いる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:46:06 GMT)
SRPose: Two-view Relative Pose Estimation with Sparse Keypoints [51.5]
SRPoseは、カメラ・トゥ・ワールドおよびオブジェクト・トゥ・カメラシナリオにおける2ビュー相対ポーズ推定のためのスパースキーポイントベースのフレームワークである。精度と速度の点で最先端の手法と比較して、競争力や優れた性能を達成する。さまざまな画像サイズやカメラ固有の機能に対して堅牢であり、低コンピューティングリソースでデプロイすることができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:25:05 GMT)
A Closer Look at Benchmarking Self-Supervised Pre-training with Image Classification [51.4]
自己教師付き学習(SSL)は、データ自体が監視を提供する機械学習アプローチであり、外部ラベルの必要性を排除している。 SSLの分類に基づく評価プロトコルがどのように相関し、異なるデータセットのダウンストリーム性能を予測するかを検討する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 00:18:44 GMT)
PointSeg: A Training-Free Paradigm for 3D Scene Segmentation via Foundation Models [51.2]
我々は、市販の視覚基盤モデルを利用して、3Dシーン認識タスクに対処する学習自由パラダイムであるPointSegを提案する。 PointSegは正確な3Dプロンプトを取得してフレーム間で対応するピクセルを調整することで、任意の3Dシーンを分割することができる。 ScanNet、ScanNet++、KITTI-360データセット上の14.1$%、12.3$%、12.6$%のmAPは、最先端のトレーニングフリーモデルを大きく上回っている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:09:10 GMT)
Do Prompts Really Prompt? Exploring the Prompt Understanding Capability of Whisper [51.1]
本研究は,ハイパフォーマンス音声認識モデルであるWhisperとプロンプトの情報がどのように相互作用するかを考察する。結果から,Whisperは人為的に文章のプロンプトを理解できない可能性が示唆された。また、英語のプロンプトが両方の言語のデータセットで一般的にマンダリンよりも優れていることも指摘されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:21:34 GMT)
A Survey of Artificial Intelligence in Gait-Based Neurodegenerative Disease Diagnosis [51.1]
神経変性疾患(神経変性疾患、ND)は、伝統的に医学的診断とモニタリングのために広範囲の医療資源と人的努力を必要とする。重要な疾患関連運動症状として、ヒトの歩行を利用して異なるNDを特徴づけることができる。人工知能(AI)モデルの現在の進歩は、NDの識別と分類のための自動歩行分析を可能にする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:12:08 GMT)
Shape of Motion: 4D Reconstruction from a Single Video [51.0]
本稿では,全列長3D動作を特徴とする汎用動的シーンを再構築する手法を提案する。シーン動作をコンパクトなSE3モーションベースで表現することで,3次元動作の低次元構造を利用する。本手法は,3D/2Dの長距離動き推定と動的シーンにおける新しいビュー合成の両面において,最先端の性能を実現する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:59:08 GMT)
Aligning Sight and Sound: Advanced Sound Source Localization Through Audio-Visual Alignment [50.9]
相互モーダルな相互作用は、意味的に一致した、あるいは不一致した音声視覚イベントを理解するのに不可欠である。新しいベンチマークと評価指標は、音源定位研究でこれまで見過ごされていた問題を明らかにする。この研究は、これまでで最も包括的な音源定位解析を提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:51:15 GMT)
ROAST: Review-level Opinion Aspect Sentiment Target Joint Detection for ABSA [50.9]
本研究は新たな課題であるROAST(Review-Level Opinion Aspect Sentiment Target)を提示する。 ROASTは、文章レベルのABSAとテキストレベルのABSAのギャップを埋めようとしている。利用可能なデータセットを拡張してROASTを有効にし、以前の研究で指摘された欠点に対処します。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:05:04 GMT)
Understanding Reference Policies in Direct Preference Optimization [50.7]
DPO(Direct Preference Optimization)は、大規模言語モデル(LLM)の微調整のための訓練手法として広く使われている。この研究は、参照モデルやポリシーに依存しているDPOの未検討の側面を探求する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:08:10 GMT)
MinD-3D: Reconstruct High-quality 3D objects in Human Brain [50.5]
Recon3DMindは、fMRI(Functional Magnetic Resonance Imaging)信号から3次元視覚を再構成するための革新的なタスクである。このデータセットは14人の参加者のデータを含み、3Dオブジェクトの360度ビデオが特徴である。我々は,脳の3次元視覚情報をfMRI信号から復号化するための,新規で効果的な3段階フレームワークMinD-3Dを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:31:40 GMT)
Auditing for Racial Discrimination in the Delivery of Education Ads [50.4]
本稿では,教育機会のための広告配信において,人種的偏見を評価できる新たな第三者監査手法を提案する。メタのアルゴリズムによる教育機会の広告配信における人種差別の証拠を見つけ、法的および倫理的懸念を訴える。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:12:25 GMT)
KFD-NeRF: Rethinking Dynamic NeRF with Kalman Filter [49.9]
KFD-NeRFは,Kalmanフィルタに基づく効率的かつ高品質な運動再構成フレームワークと統合された,新しい動的ニューラル放射場である。我々のキーとなる考え方は、動的放射場を、観測と予測という2つの知識源に基づいて時間的に異なる状態が推定される動的システムとしてモデル化することである。我々のKFD-NeRFは、同等の計算時間と最先端の視線合成性能で、徹底的な訓練を施した類似または優れた性能を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:48:24 GMT)
MaRINeR: Enhancing Novel Views by Matching Rendered Images with Nearby References [49.7]
MaRINeRは、近くのマッピング画像の情報を活用して、ターゲット視点のレンダリングを改善する方法である。暗黙のシーン表現と暗黙のシーン表現の両方から、定量的な指標と定性的な例のレンダリングの改善を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:50:03 GMT)
Reshaping the Online Data Buffering and Organizing Mechanism for Continual Test-Time Adaptation [49.5]
継続的なテスト時間適応は、訓練済みのソースモデルを適用して、教師なしのターゲットドメインを継続的に変更する。我々は、オンライン環境、教師なしの自然、エラー蓄積や破滅的な忘れのリスクなど、このタスクの課題を分析する。教師なしシングルパスデータストリームから重要サンプルを高い確実性で識別・集約する不確実性を考慮したバッファリング手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:05:01 GMT)
X-Former: Unifying Contrastive and Reconstruction Learning for MLLMs [49.3]
X-FormerはCLとMIMの相補的な強度を利用するために設計された軽量トランスフォーマーモジュールである。 X-Formerは、2つの凍結した視覚エンコーダから視覚言語表現学習とマルチモーダル・マルチモーダル生成学習をブートストラップする。さらに、凍結したLLMから視覚から言語への生成学習をブートストラップし、X-Formerの視覚的特徴をLLMで解釈できるようにする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:39:54 GMT)
Quantum One-Wayness of the Single-Round Sponge with Invertible Permutations [49.2]
スポンジハッシュは、広く使われている暗号ハッシュアルゴリズムのクラスである。これまでのところ、不規則な置換は根本的なオープンな問題のままである。ランダムな2n$-bit置換でゼロペアを見つけるには、少なくとも$Omega(2n/2)$多くのクエリが必要である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:37:24 GMT)
I Can't Believe It's Not Scene Flow! [49.1]
現在のシーンフロー法では、小さな物体の動きを記述できない。我々は,クラス認識と速度正規化が可能な新しい評価プロトコル,Bucket Normalized EPEを提案する。評価コードはhttps://github.com/kylevedder/BucketedSceneFlowEval.comで公開しています。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:49:12 GMT)
ViLLa: Video Reasoning Segmentation with Large Language Model [48.8]
そこで我々は,新しいビデオセグメンテーションタスクであるビデオ推論セグメンテーションを提案する。このタスクは、複雑な入力テキストクエリが与えられたセグメンテーションマスクのトラックレットを出力するように設計されている。 ViLLa: 大規模言語モデルを用いたビデオ推論セグメンテーションを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:59:17 GMT)
On the Viability of Monocular Depth Pre-training for Semantic Segmentation [48.3]
本研究は,意味的タスクへの下流移動において,幾何学的タスクの事前学習が有効かどうかを考察する。単分子深度は意味的セグメンテーションのための事前学習の実行可能な形式であり、共通ベースラインの改善によって検証される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:36:22 GMT)
NNsight and NDIF: Democratizing Access to Foundation Model Internals [48.3]
NNsightはオープンソースのPythonパッケージで、グラフを構築することで任意のPyTorchモデルの介入を表現できるシンプルなフレキシブルなAPIを備えている。 NDIFは、NNsight APIを通じて基礎的なLLMへのアクセスを提供する共同研究プラットフォームである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:59:01 GMT)
Multi-Label Continual Learning for the Medical Domain: A Novel Benchmark [47.5]
一つのフレームワークにおける新しいクラス到着とドメインシフトの課題を組み合わせた新しいベンチマークを提案する。本ベンチマークは,医療画像における多ラベル分類問題に対する現実的なCL設定をモデル化することを目的とする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:00:42 GMT)
A Survey of Multimodal Large Language Model from A Data-centric Perspective [46.6]
マルチモーダル大言語モデル(MLLM)は、複数のモーダルからのデータの統合と処理によって、標準的な大言語モデルの能力を高める。データはこれらのモデルの開発と改良において重要な役割を担います。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:01:52 GMT)
Scaling Laws with Vocabulary: Larger Models Deserve Larger Vocabularies [46.4]
大きな語彙は、少ないトークンで文を表現することでより効率的なトークン化を可能にするが、希少トークンに不適合な表現のリスクも増大させる。計算-最適語彙サイズを予測するための3つの手法を提案する。本研究は,効率的なスケーリングのために,モデルパラメータと語彙サイズを共同で検討する必要があることを強調する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:58:54 GMT)
Model-based Policy Optimization using Symbolic World Model [46.4]
ロボット工学における学習に基づく制御手法の適用は、大きな課題を呈している。 1つは、モデルなし強化学習アルゴリズムがサンプル効率の低い観測データを使用することである。シンボリック回帰によって生成されるシンボリック表現による遷移ダイナミクスの近似を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:49:21 GMT)
Multi-sentence Video Grounding for Long Video Generation [46.4]
長大映像生成のための多文ビデオグラウンドの勇敢で新しいアイデアを提案する。提案手法は,画像・ビデオ編集,ビデオモーフィング,パーソナライズド生成,ビデオグラウンドニングの発達を,長いビデオ生成にシームレスに拡張する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:05:05 GMT)
From Words to Worlds: Compositionality for Cognitive Architectures [45.3]
大規模言語モデル(LLM)は非常に高性能なコネクショナリストシステムであるが、より構成性が高いか? 以下に紹介するタスクを含む,4つのLLMファミリーと3つのタスクカテゴリにまたがる経験的分析について述べる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:42:13 GMT)
PM-LLM-Benchmark: Evaluating Large Language Models on Process Mining Tasks [45.1]
大規模言語モデル(LLM)は、プロセスマイニング(PM)分析を半自動化する可能性がある。ドメイン知識に着目したPMの総合ベンチマークであるPM-LLM-Benchmarkを提案する。検討対象のLLMのほとんどは, 良好なレベルでプロセスマイニング作業を行うことができるが, エッジデバイス上で実行される小さなモデルはまだ不十分である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:57:31 GMT)
Combining Constraint Programming Reasoning with Large Language Model Predictions [45.0]
制約プログラミング(CP)と機械学習(ML)は、テキスト生成において課題に直面します。本稿では,Large Language Model (LLM) をCPに組み込んだ手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:15:55 GMT)
GlobalPointer: Large-Scale Plane Adjustment with Bi-Convex Relaxation [45.0]
平面調整は多くの3次元アプリケーションにおいて重要であり、同時にポーズ推定と平面の回復を伴う。本稿では,平面修正問題,すなわちtextitGlobalPointer と textitGlobalPointer++ の2つのアルゴリズム変種を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:09:03 GMT)
BIMCV-R: A Landmark Dataset for 3D CT Text-Image Retrieval [44.9]
我々は,200万枚以上のスライスを含む8,069個の3次元CTボリュームのデータセットを,それぞれの放射線学的報告と組み合わせて提示する。次に、大規模な言語モデルの可能性を活用した検索戦略であるMedFinderを構築します。これは、テキスト・トゥ・イメージ、画像・トゥ・テキスト、キーワードベースの検索タスクを容易に行えるシステムを開発するための予備的なステップである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:56:03 GMT)
GLAD: Improving Latent Graph Generative Modeling with Simple Quantization [44.9]
本稿では,単純かつ効果的な離散潜在グラフ拡散生成モデルを提案する。我々のモデル、すなわちGLADは、既存の潜伏アプローチの欠点を克服するだけでなく、グラフ空間に適用される拡散法に固有の問題を緩和する。分子ベンチマークデータセット上で生成モデルを検証し、最先端のベースラインと比較して競合性能を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:50:18 GMT)
A Closer Look at GAN Priors: Exploiting Intermediate Features for Enhanced Model Inversion Attacks [44.0]
Model Inversion (MI)攻撃は、出力情報を利用して、リリースされたモデルからプライバシーに敏感なトレーニングデータを再構築することを目的としている。 GAN(Generative Adversarial Network)の最近の進歩は、MI攻撃の性能向上に大きく貢献している。本稿では,GAN構造を分解し,中間ブロック間の特徴を利用する中間特徴拡張生成モデル変換(IF-GMI)を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:16:22 GMT)
UMBRAE: Unified Multimodal Brain Decoding [43.6]
脳信号のマルチモーダルデコードであるUMBRAEを提案する。マルチモーダル脳アライメントのための効率的なユニバーサル脳エンコーダを提案する。また,対象物固有の特徴を共通の特徴空間にマッピングするクロスオブジェクトトレーニング戦略も導入する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:30:48 GMT)
SOMONITOR: Explainable Marketing Data Processing and Analysis with Large Language Models [43.3]
説明可能なAIフレームワークであるSoMonitorを紹介します。 SoMonitorは、人間の直感とAIベースの効率の相乗効果を目指している。マーケティングのあらゆる段階におけるマーケターを助ける。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:55:52 GMT)
Image Inpainting Models are Effective Tools for Instruction-guided Image Editing [42.6]
CVPR2024 GenAI Media Generation Challenge Workshop's Instruction-guided Image Editing Trackの優勝作品である。 4段階のプロセスIIIE (Inpainting-based Instruction-Guided Image Editing): カテゴリ分類、主編集対象識別、編集マスク取得、画像インパインティング。その結果,言語モデルと画像インパインティングモデルの適切な組み合わせによって,パイプラインは視覚的品質を満足して高い成功率を達成することができた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:55:33 GMT)
Translate-and-Revise: Boosting Large Language Models for Constrained Translation [42.4]
制約付き翻訳には,大規模言語モデル(LLM)の機能を利用する。 LLMは、翻訳命令や制約をプロンプトとして取り込むことで、このタスクに容易に適応できる。標準LLMよりも制約に基づく翻訳精度が15%向上したことを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:08:09 GMT)
Unmasking Social Bots: How Confident Are We? [41.9]
本稿では,ボット検出と不確実性の定量化の両方に対処することを提案する。この二重焦点は、各予測の定量化の不確実性に関連する追加情報を活用することができるため、非常に重要である。具体的には,予測を高い信頼性で行う場合のボットに対する標的的介入を促進するとともに,予測が不確実な場合の警告(例えば,より多くのデータ収集)を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:33:52 GMT)
Noninterference Analysis of Reversible Systems: An Approach Based on Branching Bisimilarity [41.9]
非干渉に対する古典的同値性に基づくアプローチは、主に弱いバイシミュレーションのセマンティクスに依存している。本手法は,可逆計算の存在下での隠蔽チャネルの同定に十分でないことを示す。バック・アンド・フォース計算の効果を捉えるためには、より表現力のある意味論に切り替える必要がある。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:40:00 GMT)
RoT: Enhancing Large Language Models with Reflection on Search Trees [41.7]
本稿では,木探索に基づくプロンプト手法の性能向上を目的としたLLMリフレクションフレームワークであるリフレクション・オン・サーチ・ツリー(RoT)について紹介する。強力なLLMを使用して、以前の木探索経験からガイドラインを要約し、弱いLLMの能力を高める。本稿では,RoTがより具体的で意味のあるガイドラインを生成するのを支援するために,歴史的検索プロセスから重要な情報を識別する新しい状態選択法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:44:25 GMT)
DiffuX2CT: Diffusion Learning to Reconstruct CT Images from Biplanar X-Rays [41.4]
条件拡散過程として超スパースX線からのCT再構成をモデル化したDiffuX2CTを提案する。これにより、DiffuX2CTは2次元X線から3次元構造情報を復元できる構造制御可能な再構成を実現する。コントリビューションとして,LumbarVと呼ばれる実世界の腰椎CTデータセットを新しいベンチマークとして収集し,X線からのCT再構成の臨床的意義と性能を検証した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:20:04 GMT)
Geometric Active Exploration in Markov Decision Processes: the Benefit of Abstraction [41.2]
我々は、MDP準同型形式を用いて、既知の幾何学的構造を抽象化によって活用する方法を示す。また、サンプル効率のホモモルフィズムによる抽象化の利点を正式に把握する最初の分析も提示する。本研究では, 科学的発見の課題に起因した環境において, 理論的, 実験的に解析するGeometric Active Exploration (GAE) アルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:15:51 GMT)
Make a Strong Teacher with Label Assistance: A Novel Knowledge Distillation Approach for Semantic Segmentation [40.8]
セマンティックセグメンテーションタスクのための新しい知識蒸留手法を提案する。教師モデルトレーニングでは,ラベルをノイズにし,それをインプットに組み込み,軽量教師のパフォーマンスを効果的に向上させることを提案する。本手法は,知識蒸留の有効性を高めるだけでなく,教師モデルや学生モデルを選択する際の柔軟性も向上させる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:08:04 GMT)
Robust Multivariate Time Series Forecasting against Intra- and Inter-Series Transitional Shift [40.7]
本稿では,時系列内/時系列間の相関関係を統合的に把握し,時変遷移分布をモデル化するための統一確率グラフモデルを提案する。 6つの高定常MTSデータセットに対する広範囲な実験により、JointPGMの有効性と効率を検証した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:16:03 GMT)
In Search of Lost Online Test-time Adaptation: A Survey [40.7]
本稿では,オンラインテスト時間適応(OTTA)に関する総合的な調査を紹介する。我々はOTTAテクニックを3つの主要なカテゴリに分類し、それらをモダンなバックボーンであるビジョントランスフォーマー(ViT)を用いてベンチマークする。以上の結果から,トランスフォーマーは多彩なドメインシフトに対するレジリエンスを高めていることが明らかとなった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:58:02 GMT)
Powerful and Flexible: Personalized Text-to-Image Generation via Reinforcement Learning [40.1]
個人化されたテキスト・画像生成のための新しい強化学習フレームワークを提案する。提案手法は、テキストアライメントを維持しながら、視覚的忠実度に大きな差で既存の最先端手法よりも優れている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:34:04 GMT)
Power Variable Projection for Initialization-Free Large-Scale Bundle Adjustment [40.0]
小型のバンドル調整問題を解決するために,電力可変射影(PoVar)を導入する。提案手法は, 精度, 速度, 精度の両面から, 最先端の結果が得られたことを実験的に実証する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:26:05 GMT)
Variational-quantum-eigensolver-inspired optimization for spin-chain work extraction [39.6]
量子源からのエネルギー抽出は、量子電池のような新しい量子デバイスを開発するための重要なタスクである。量子源からエネルギーを完全に抽出する主な問題は、任意のユニタリ演算をシステム上で行うことができるという仮定である。本稿では,変分量子固有解法(VQE)アルゴリズムにインスパイアされた抽出可能エネルギーの最適化手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:03:03 GMT)
Many Perception Tasks are Highly Redundant Functions of their Input Data [39.6]
視覚認識からセマンティックセグメンテーションに至るまで、多くの知覚タスクが、入力データの非常に冗長な機能であることを示す。異なる部分空間に投影された画像や分光図は、データが最も変化する最上位部分空間であるかどうかに関わらず、これらのタスクを著しくうまく解決することができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:24:25 GMT)
Breakdown of Measurement-Induced Phase Transitions Under Information Loss [39.4]
量子マンボディシステムは、測定誘起相転移(MIPT)を特徴付けることができる MIPTは、平均的な観測器を通しては明らかにできないが、それぞれの軌道を別々に識別する能力が必要である。観測者の各測定結果の識別能力の低下の下でMIPTの運命を探究する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:10:52 GMT)
The role of slicing in test-driven development [39.0]
テスト駆動開発(TDD)は広く使われているアジャイルプラクティスです。 TDDの理論的枠組みとして,次のような特徴を持つフレームワークを提案する。業界で実施されたコントロールされた実験を使用して、TDD、契約、スライス間の接続をチェックしました。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:10:38 GMT)
MeshFeat: Multi-Resolution Features for Neural Fields on Meshes [38.9]
パラメトリック特徴格子符号化は、ニューラルネットワークの符号化手法として注目されている。 Euclidean空間のマルチレゾリューション機能グリッドの考え方を適応させるために,メッシュ用に調整されたパラメトリック機能であるMeshFeatを提案する。テクスチャ再構築とBRDF表現に匹敵する再現品質を維持しつつ, 従来の表現と比較して, 大幅な高速化を示した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:29:48 GMT)
Making Reasoning Matter: Measuring and Improving Faithfulness of Chain-of-Thought Reasoning [38.6]
大きな言語モデル(LLM)は、質問に答える前にステップバイステップの推論を求めると、よりよいパフォーマンスを示すことが示されている。モデルの最終回答がどの程度、説明された推論ステップに忠実であるかは定かではない。 FRODOは、小さなLMを調整して正しい推論ステップを生成し、これらのステップに対して堅牢な推論を行うためのフレームワークである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:49:56 GMT)
On the Discriminability of Self-Supervised Representation Learning [38.6]
自己教師付き学習(SSL)は、最近、下流の視覚タスクで大きな成功を収めた。特に複雑な下流タスクにおいて、SSLと教師あり学習(SL)の間には、注目すべきギャップがまだ残っている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:18:03 GMT)
Context-Guided Spatial Feature Reconstruction for Efficient Semantic Segmentation [38.4]
CGRSegは文脈誘導空間特徴再構成に基づく効率的かつ競争性の高いセグメンテーションフレームワークである。 ADE20K、COCO-Stuff、Pascal Contextベンチマークで広く評価され、最先端のセマンティックパフォーマンスを実現する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:52:18 GMT)
Adapt PointFormer: 3D Point Cloud Analysis via Adapting 2D Visual Transformers [38.1]
本稿では,3次元ポイントクラウド解析の課題を達成するために,2次元事前知識を持つ事前学習モデルの活用を試みる。本稿では,適応ポイントフォーマー (APF) を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:32:45 GMT)
PairEval: Open-domain Dialogue Evaluation with Pairwise Comparison [38.0]
PairEvalは、異なる会話における応答と品質を比較して応答を評価するための、新しい対話評価指標である。 PairEvalは基準値よりも人間の判断と高い相関を示すことを示す。また,提案手法は,オープンドメイン対話システムからの共通障害の検出において,より堅牢であることがわかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:00:41 GMT)
Open-Canopy: A Country-Scale Benchmark for Canopy Height Estimation at Very High Resolution [38.0]
超高解像度(1.5m)キャノピー高さ推定のための最初のオープンアクセスおよびカントリースケールのベンチマークであるOpen-Canopyを紹介する。また、異なる年に撮影された2つの画像間の天蓋の高さ変化検出のための最初のベンチマークであるOpen-Canopy-$Delta$を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:03:59 GMT)
SciCode: A Research Coding Benchmark Curated by Scientists [37.9]
言語モデル(LM)は、多くの挑戦的なタスクにおいて平均的な人間よりも優れており、挑戦的で高品質で現実的な評価を開発することはますます困難になっている。このベンチマークには数学、物理学、化学、生物学、材料科学といった問題が含まれています。クロード3.5-ソネット(Claude3.5-Sonnet)は、最も現実的な環境では、問題の4.6%しか解決できない。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:15:24 GMT)
Adjusting Logit in Gaussian Form for Long-Tailed Visual Recognition [37.6]
特徴レベルの観点から、長い尾の視覚認識の問題について検討する。 2つの新しいロジット調整法が提案され,計算オーバーヘッドの緩やかなモデル性能が向上した。ベンチマークデータセットを用いて行った実験は,提案手法の最先端手法よりも優れた性能を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:33:49 GMT)
Enhancing Source-Free Domain Adaptive Object Detection with Low-confidence Pseudo Label Distillation [37.6]
Source-Free Domain Adaptive Object Detection (SFOD)は、トレーニング済みの検出器を新しい未ラベルのドメインにデプロイするための有望な戦略である。本稿では,低信頼 Pseudo Label Distillation (LPLD) の損失を平均教師に基づくSFODフレームワークに導入する。本手法は,4つのクロスドメインオブジェクト検出ベンチマークにおいて,従来のSFOD法よりも優れていた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:58:42 GMT)
Understanding and Improving Transfer Learning of Deep Models via Neural Collapse [37.5]
分類問題に対する神経崩壊(NC)と伝達学習の関係について検討する。機能崩壊と下流のパフォーマンスには強い相関関係がある。提案手法は, 微調整パラメータを90%以上削減しつつ, 優れた性能を実現する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:07:44 GMT)
CodeV: Empowering LLMs for Verilog Generation through Multi-Level Summarization [37.4]
本稿では,オープンソースの命令調整型Verilog生成用LLMであるCodeVを紹介する。 CodeVは以前のオープンソースSOTAを14.4%(VerilogEvalのBetterV)と11.3%(RTLCoder in RTLLM)で相対的に上回っている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:43:08 GMT)
Scaling Granite Code Models to 128K Context [37.3]
本稿では,最大128Kトークンの効率的なコンテキストウィンドウをサポートする長文グラナイト符号モデルを提案する。 2K/4Kから128KまでのGranite 3B/8B符号モデルのコンテキスト長のスケーリングソリューションは、軽量な継続事前トレーニングで構成されている。私たちは、研究と商用の両方のために、Apache 2.0ライセンスの下で、長いコンテキストのGraniteコードモデルをリリースします。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:46:02 GMT)
Fully Sparse 3D Occupancy Prediction [37.3]
運転予測は自動運転において重要な役割を果たす。従来の手法は通常、密集した3Dボリュームを構築し、シーン固有の空間を無視し、高い計算コストを被る。我々は,SparseOccと呼ばれる,完全スパース占有ネットワークを新たに導入した。 SparseOccは最初、カメラのみの入力からスパース3D表現を再構築し、その後スパースクエリによって3Dスパース表現からセマンティック/インスタンス占有を予測する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:47:38 GMT)
CoD, Towards an Interpretable Medical Agent using Chain of Diagnosis [36.3]
CoD(Chain-of-Diagnosis)は、診断過程を医師の思考過程を反映した診断連鎖に変換する。 CoDは、意思決定における透明性を確保するために、病気の信頼性分布を出力する。診断GPTは9604の疾患を診断することができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:06:27 GMT)
Information Complexity of Stochastic Convex Optimization: Applications to Generalization and Memorization [36.3]
我々は,円錐曲線最適化(SCO)の文脈における記憶と学習の相互作用について検討する。我々は,Steinke と Zakynthinou が提唱した条件付き相互情報(CMI)の枠組みを用いた記憶の定量化(2020年) L2$ Lipschitz-bounded set and under strong convexity, every learner with a excess error have CMI bounded by $Omega (1/varepsilon2)$ and $Omega (1/varepsilon)$。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:37:59 GMT)
Comparing Pre-trained Human Language Models: Is it Better with Human Context as Groups, Individual Traits, or Both? [36.0]
人間中心の自然言語処理には、人間のコンテキストを言語モデルに組み込む必要がある。現在、1)グループワイド属性(例:45歳以上)での事前トレーニング、または2)個々の特性の2つの方法が存在する。事前学習モデルと,1)グループ属性,2)個人属性,3)ユーザレベルと文書レベルの5つのタスクに対する複合アプローチによる人間コンテキストとの比較を行った。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:57:20 GMT)
SPAMming Labels: Efficient Annotations for the Trackers of Tomorrow [35.8]
SPAMは、人間の介入を最小限に抑えた高品質なラベルを提供するビデオラベルエンジンである。我々は統合グラフの定式化を用いて、トラックの検知と同一性関連の両方のアノテーションに時間をかけて対処する。我々はSPAMラベルでトレーニングされたトラッカーが人間のアノテーションでトレーニングされたトラッカーに匹敵する性能を発揮することを示した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:58:19 GMT)
FREST: Feature RESToration for Semantic Segmentation under Multiple Adverse Conditions [35.2]
FRESTは、セマンティックセグメンテーションのソースフリードメイン適応(SFDA)を悪条件に適応するための、新しい機能回復フレームワークである。 FRESTは、FDAの有害な状態に対する2つの公開ベンチマークで、最先端の技術を達成している。目に見えないデータセットに対して優れた一般化能力を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:07:02 GMT)
A Security Assessment tool for Quantum Threat Analysis [34.9]
量子コンピューティングの急速な進歩は、セキュアな通信、デジタル認証、情報暗号化に使われる多くの現在のセキュリティアルゴリズムに重大な脅威をもたらす。十分に強力な量子コンピュータは、これらのアルゴリズムの脆弱性を悪用し、安全でないトランジットでデータをレンダリングする可能性がある。この研究は、企業のための量子アセスメントツールを開発し、セキュリティプロトコルをポスト量子世界へ移行するための適切なレコメンデーションを提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:58:34 GMT)
Non-native Quantum Generative Optimization with Adversarial Autoencoders [34.8]
本稿では、大規模最適化問題を既存の量子サンプリングにマッピングするために使用できる逆量子オートエンコーダモデル(AQAM)を紹介する。従来のマルコフ・チェインモンテカルロ試料と比較すると,AQAMはレニイ偏差が低く,スペクトルギャップが大きくなることが示されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:03:18 GMT)
Identifying Smart Contract Security Issues in Code Snippets from Stack Overflow [34.8]
SOCheckerは、不完全なSOスマートコントラクトコードスニペットの潜在的な脆弱性を特定するツールである。その結果、SOCheckerのF1スコアは68.2%で、GPT-3.5とGPT-4を大きく上回った。この結果から,Q&A Webサイトのコードスニペットのセキュリティ向上の必要性が浮き彫りになった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:25:16 GMT)
Implicit Filtering for Learning Neural Signed Distance Functions from 3D Point Clouds [34.8]
幾何学的詳細を保存しながら暗黙の場を滑らかにする非線形暗黙フィルタを提案する。我々の新規性は、符号付き距離場の勾配で隣接する入力点によって曲面(ゼロレベル集合)をフィルタリングできることにある。入力された原点雲を勾配に沿って移動させることで、提案した暗黙のフィルタリングを非ゼロレベル集合に拡張することができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:40:24 GMT)
Advancing Large Multi-modal Models with Explicit Chain-of-Reasoning and Visual Question Generation [34.5]
本稿では,大規模視覚・言語モデル(VLM)の開発に向けた新しいアプローチを提案する。本稿では,質問に対して必要な知識を習得し,推論プロセスの堅牢性と説明可能性を高めるシステムを提案する。データセットは、キャプション生成のような一般的なタスクから、専門家の知識を必要とする専門的なVQAタスクまで、さまざまなタスクをカバーする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:35:30 GMT)
FSP-Laplace: Function-Space Priors for the Laplace Approximation in Bayesian Deep Learning [34.3]
我々は事前関数空間を用いて不確実性推定を伴うディープネットワークを実現する。深層ネットワークの一般化を可能にする暗黙の帰納バイアスを利用する。我々の手法は、事前知識が豊富であるような改善された結果を提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:08:58 GMT)
Learning from the Web: Language Drives Weakly-Supervised Incremental Learning for Semantic Segmentation [34.0]
我々は、新しいクラスを学習するためにも、広く利用可能なWebイメージを考えることができると論じている。我々の知る限り、これは新しい概念の学習と既に学んだ概念の保存の両方のために、Webイメージにのみ依存する最初の作品である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:14:49 GMT)
STS MICCAI 2023 Challenge: Grand challenge on 2D and 3D semi-supervised tooth segmentation [33.3]
MICCAI 2023 Challenge on the Alibaba Tianchi Platformの一部として、Semi-supervised Teeth (STS) Challengeが開催された。この課題は, 歯学の分野を前進させるために, 効果的な半教師付き歯のセグメンテーションアルゴリズムを検討することである。 2次元パノラマX線像と3次元CBCT歯量を含む2つのモダリティを提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:00:08 GMT)
Weak-to-Strong Reasoning [33.2]
我々は、強力なモデルを自律的に訓練データを洗練させるプログレッシブラーニングフレームワークを導入する。 3つの弱いモデルを用いてLlama2-70bの推論能力を大幅に向上させる。この作業は、AI推論能力を強化するための、よりスケーラブルで洗練された戦略の道を開くものだ。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:25:17 GMT)
Open-Source Conversational AI with SpeechBrain 1.0 [33.0]
SpeechBrainはオープンソースのConversational AIツールキットで、PyTorchをベースとしている。事前トレーニングされたモデルと、トレーニングに必要なコードとアルゴリズムの完全な“レシピ”の両方をリリースすることで、透明性と複製性を促進する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:26:57 GMT)
An Application of Large Language Models to Coding Negotiation Transcripts [33.0]
大規模言語モデル(LLM)は、自然言語処理(NLP)の分野で印象的な能力を示している。本稿では,Vanderbilt AI Negotiation Lab による交渉テキスト解析における LLM の適用について検討する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:05:59 GMT)
PAS: Data-Efficient Plug-and-Play Prompt Augmentation System [32.7]
大型言語モデル(LLM)は、プラグアンドプレイAIシステムへの需要を増大させた。 LLMベースのプラグアンドプレイ自動プロンプトエンジニアリング(APE)システムであるPASを提案する。 PAS は従来の APE モデルと比較して、平均 6.09 ポイントの改善を達成している。 PASは人間の評価に優れており、ユーザのためのプラグインとしての適合性を強調している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:46:34 GMT)
Connecting Consistency Distillation to Score Distillation for Text-to-3D Generation [32.5]
本研究では, 整合蒸留理論とスコア蒸留理論を結合させることにより, 現行のスコア蒸留法を解析した。本稿では,これらの問題を緩和するための最適化フレームワークであるGCS( Guided Consistency Sampling)を3D Gaussian Splatting (3DGS)と統合して提案する。本稿では,この問題を緩和するために,BEG方式を3DGSレンダリングに導入する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:25:41 GMT)
Using LLMs to Investigate Correlations of Conversational Follow-up Queries with User Satisfaction [32.3]
そこで本稿では,会話検索エンジンNaver Cueから18人のユーザのフォローアップクエリパターンの分類法を提案する。クエリ修正に関する既存の文献と比較して、フォローアップクエリの背後にある新たなモチベーションとアクションが明らかになった。最初の結果から,Clarifying Queries, Excluding Condition, Substitutioning Condition with follow-up queryなど,いくつかの不満のシグナルが示唆された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:10:35 GMT)
Heteroscedastic Uncertainty Estimation Framework for Unsupervised Registration [32.1]
本稿では,異種画像の不確実性推定のためのフレームワークを提案する。教師なし登録時の不確実性の高い領域の影響を適応的に低減することができる。提案手法は, ベースラインを常に上回り, 有意な不確実性推定を導出する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:32:25 GMT)
Temporal Representation Learning for Stock Similarities and Its Applications in Investment Management [32.0]
SimStockは、財務時系列データの堅牢で情報的な表現を学ぶための時間的自己教師型学習フレームワークである。我々は、何千ものストックを持つ現実世界の4つのデータセットで実験を行い、SimStockが類似のストックを見つけるのに有効であることを実証し、既存の手法より優れています。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:54:13 GMT)
Thought-Like-Pro: Enhancing Reasoning of Large Language Models through Self-Driven Prolog-based Chain-of-Though [32.0]
大規模言語モデル(LLM)は汎用アシスタントとして非常に優れた性能を示している。多様な推論タスクにおける学習と一般化を容易にする新しい学習フレームワークTHOUGHT-LIKE-PROを導入する。実験結果から,本手法はLLMの推論能力を大幅に向上させる可能性が示唆された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:52:10 GMT)
Benchmarking Vision Language Models for Cultural Understanding [31.9]
本稿では,視覚言語モデル(VLM)の評価を目的とした視覚的質問応答ベンチマークであるCulturalVQAを紹介する。我々は,5大陸11カ国の文化を表わす質問毎の回答が1～5である2,378枚の画像検索ペアのコレクションをキュレートした。質問は、衣服、食べ物、飲み物、儀式、伝統など、様々な文化の側面の理解を調査する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:49:16 GMT)
Simple Graph Condensation [30.9]
グラフ凝縮(Graph condensation)は、グラフニューラルネットワーク(GNN)を小さな凝縮グラフにチューニングし、大規模なオリジナルグラフで使用する。本稿では,SimGC(Simple Graph Condensation)フレームワークについて紹介する。 SimGCは既存のグラフ凝縮法に比べて最大10倍の高速化を実現している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:34:50 GMT)
Motif-Consistent Counterfactuals with Adversarial Refinement for Graph-Level Anomaly Detection [30.6]
本稿では,グラフレベルの異常検出のための新しい手法Motif-consistent Counterfactuals with Adversarial Refinement (MotifCAR)を提案する。このモデルは、あるグラフのモチーフと、識別(カテゴリ)情報を含むコアサブグラフと、別のグラフのコンテキストサブグラフを組み合わせて、生の反事実グラフを生成する。 MotifCARは高品質な反ファクトグラフを生成することができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:04:57 GMT)
A Dataset and Benchmark for Shape Completion of Fruits for Agricultural Robotics [30.5]
本稿では,農業用視覚システムのための3次元形状補完データセットを提案する。果実の3次元形状を推定するためのRGB-Dデータセットを提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:07:23 GMT)
Realizable $H$-Consistent and Bayes-Consistent Loss Functions for Learning to Defer [30.4]
非増加関数の$Psi$によってパラメータ化され、穏やかな条件下で実現可能な$H$一貫性を確立する。分類誤差に基づくコスト関数の場合、これらの損失は仮説集合が対称かつ完全であるときに$H$一貫性境界を持つことを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:35:03 GMT)
Multi-Label Learning with Stronger Consistency Guarantees [30.4]
本稿では,複数ラベル学習におけるサロゲート損失とアルゴリズムについて詳細に検討し,その差分を$H$-consistency boundsで表す。本稿では,ラベルに依存しない$H$一貫性境界の利点とラベル相関を考慮に入れた新しい代理損失,多ラベルロジスティック損失を導入する。我々は、このサロゲート損失の族が、一般的なマルチラベル損失よりも、$H$一貫性境界、すなわちベイズ一貫性から恩恵を受けていることを証明した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:51:02 GMT)
Enhanced $H$-Consistency Bounds [30.4]
条件付き後悔に関するより一般的な不等式に基づく拡張された$H$一貫性境界を確立するための枠組みを提案する。我々の定理は、既存の結果を特別な場合とみなすが、様々なシナリオにおいてより好ましい境界の導出を可能にする。これには、標準のマルチクラス分類、Tsybakovノイズ条件下でのバイナリクラスとマルチクラス分類、二部分類が含まれる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:22:40 GMT)
Learning From Correctness Without Prompting Makes LLM Efficient Reasoner [30.2]
大規模言語モデル(LLM)は様々なタスクで優れた性能を示してきたが、幻覚、不誠実な推論、有害な内容などの制限がまだ残っている。人間のフィードバックや外部ツール,手工芸のプロンプトを不要にする,本質的な自己修正推論フレームワークをLLMに導入する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:53:22 GMT)
RoboGolf: Mastering Real-World Minigolf with a Reflective Multi-Modality Vision-Language Model [30.1]
ミニゴルフ(Minigolf)は、エンボディインテリジェンスを調べるための模範的な現実世界ゲームである。本稿では、デュアルカメラ認識と閉ループ動作改善を組み合わせたVLMベースのフレームワークであるRoboGolfを紹介する。オフラインの推論設定でフレームワークの機能を解析し、記録されたトラジェクトリの広範なセットに依存する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:40:13 GMT)
Multimodal Label Relevance Ranking via Reinforcement Learning [30.0]
LRtextsuperscript2PPO (Rabel Relevance Ranking with Proximal Policy Optimization) という,マルチモーダルラベル関連ランキングの新しい手法を提案する。 LRtextsuperscript2PPOはまずターゲットドメインの部分順序ペアを使用して報酬モデルをトレーニングする。 LRtextsuperscript2PPOにより、ラベル関連ランキングモデルの性能を向上させることができるように、ランキングタスクに適した状態表現とポリシー損失を慎重に設計する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:06:49 GMT)
ProtoSAM: One-Shot Medical Image Segmentation With Foundational Models [29.8]
ProtoSAMは、ワンショットの医療画像セグメンテーションのための新しいフレームワークである。これは、数ショットセグメンテーションで知られているプロトタイプネットワークと、自然画像基盤モデルSAMの併用である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:58:11 GMT)
Omni-Recon: Harnessing Image-based Rendering for General-Purpose Neural Radiance Fields [29.6]
Omni-Reconと呼ばれるフレームワークは、(1)一般化可能な3D再構成とゼロショットマルチタスクシーン理解、(2)リアルタイムレンダリングやシーン編集といった様々な下流3Dアプリケーションへの適応性を実現する。具体的には、Omni-Reconは2つの分離枝を持つ画像ベースレンダリングを用いた汎用NeRFモデルを備えている。この設計は、ゼロショットマルチタスクシーン理解のために、様々なタスクで再利用可能なブレンディングウェイトを用いて、最先端(SOTA)の一般化可能な3次元表面再構成品質を実現する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:21:15 GMT)
DeepClair: Utilizing Market Forecasts for Effective Portfolio Selection [29.4]
ポートフォリオ選択のための新しいフレームワークであるDeepClairを紹介します。 DeepClairは、トランスフォーマーベースの時系列予測モデルを活用して、市場のトレンドを予測する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:51:03 GMT)
Learning Visual Grounding from Generative Vision and Language Model [29.3]
ビジュアルグラウンドタスクは、自然言語参照に基づいて画像領域をローカライズすることを目的としている。生成的VLMには基底知識がすでに存在しており、適切なプロンプトによって引き起こすことができる。本研究は,実世界における視覚的接地を拡大するための生成型VLMの可能性を実証するものである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:29:49 GMT)
Differential Privacy Mechanisms in Neural Tangent Kernel Regression [29.2]
ニューラルタンジェントカーネル(NTK)回帰設定における差分プライバシー(DP)について検討する。 NTKレグレッションの差分プライバシとテスト精度の両面で証明可能な保証を示す。我々の知る限り、NTKレグレッションに対するDP保証を提供する最初の取り組みである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:57:55 GMT)
Training-free Composite Scene Generation for Layout-to-Image Synthesis [29.2]
本稿では,拡散条件下での対角的意味交叉を克服するために,新しい学習自由アプローチを提案する。本稿では,(1)トークン競合を解消し,正確な概念合成を保証するためのトークン間制約,2)画素間関係を改善する自己注意制約,という2つの革新的な制約を提案する。本評価では,拡散過程の導出にレイアウト情報を活用することで,忠実度と複雑さを向上したコンテンツリッチな画像を生成することの有効性を確認した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:48:07 GMT)
Out-of-Distribution Detection through Soft Clustering with Non-Negative Kernel Regression [28.8]
非負のカーネル回帰に基づくOOD検出のためのソフトクラスタリング手法を提案する。提案手法は計算と空間の複雑さを大幅に減らし(推論時間の最大11倍改善とストレージ要求の87%削減)、4つのベンチマークで最大4つのAUROCポイントを上回ります。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:57:08 GMT)
Enhancing Biomedical Knowledge Discovery for Diseases: An End-To-End Open-Source Framework [28.7]
原文から直接特定の疾患に関する知識を構築するために設計されたオープンソースのフレームワークを紹介する。疾患関連知識発見の研究を容易にするために、Rett症候群とアルツハイマー病に焦点を当てた2つの注釈付きデータセットを作成しました。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:20:53 GMT)
UCIP: A Universal Framework for Compressed Image Super-Resolution using Dynamic Prompt [28.7]
圧縮画像スーパーレゾリューション(CSR)は、圧縮された画像を同時に超解き、圧縮によるハイブリッド歪みに対処することを目的としている。そこで我々はUCIPと呼ばれる,動的プロンプト学習を用いた初の汎用CSRフレームワークを提案する。 UCIPの普遍的CSRタスクにおける一貫した性能と優れた性能を示す実験を行った。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:36:39 GMT)
Reconfigurable Intelligent Surface Aided Vehicular Edge Computing: Joint Phase-shift Optimization and Multi-User Power Allocation [28.5]
本稿では、車載通信を支援するための代替通信経路を提供するRIS(Reconfigurable Intelligent Surfaces)について紹介する。本稿では、RIS位相シフト係数を最適化するDeep Deterministic Policy Gradient(DDPG)アルゴリズムと、車両ユーザ(VU)の電力配分を最適化するMulti-Agent Deep Deterministic Policy Gradient(MADDPG)アルゴリズムを組み合わせたDRLフレームワークを提案する。シミュレーションの結果,提案手法は従来の集中型DDPG, Twin Delayed Deep Deterministic Policy Gradient (TD3) およびいくつかの典型的なスキームよりも優れていた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:18:59 GMT)
Mechanistically Interpreting a Transformer-based 2-SAT Solver: An Axiomatic Approach [28.3]
機械的解釈可能性(Mechanistic Interpretability)は、内部コンポーネントの観点からニューラルネットワークが実行する計算をリバースエンジニアリングすることを目的としている。解析対象のニューラルネットワークのセマンティクスを概ね捉えた記述として,機械的解釈を形式的に特徴づける公理の集合を与える。解析モデルの機械論的解釈が、実際に記述された公理を満たすことを裏付ける証拠を提示する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:32:44 GMT)
MeshSegmenter: Zero-Shot Mesh Semantic Segmentation via Texture Synthesis [27.7]
MeshSegmenterは、ゼロショット3Dセマンティックセグメンテーション用に設計されたフレームワークである。さまざまなメッシュとセグメント記述の正確な3Dセグメンテーションを提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:50:59 GMT)
AgentDojo: A Dynamic Environment to Evaluate Attacks and Defenses for LLM Agents [27.7]
我々は、信頼できないデータ上でツールを実行するエージェントの評価フレームワークであるAgentDojoを紹介した。 AgentDojoは静的テストスイートではなく、新しいエージェントタスク、ディフェンス、アダプティブアタックを設計、評価するための環境である。 AgentDojoには97の現実的なタスク、629のセキュリティテストケースと、文献からのさまざまな攻撃および防御パラダイムが組み込まれています。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:37:28 GMT)
HORAE: A Domain-Agnostic Modeling Language for Automating Multimodal Service Regulation [27.0]
この研究は、マルチモーダル規則をモデル化するための統一仕様言語であるHORAEの設計原則を提示する。 HORAEは、HORAEという名前の細調整された大規模言語モデルをさらに活用することで、インテリジェントなサービス規制パイプラインを促進する方法を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:04:24 GMT)
SkyMask: Attack-agnostic Robust Federated Learning with Fine-grained Learnable Masks [26.9]
フェデレートラーニング(FL)は、分散データを活用し、データのプライバシを保存するための一般的なパラダイムである。分散特性のため、FLシステムはクライアントを危険にさらしたビザンティン攻撃に対して脆弱である。そこで我々は,悪質なモデル更新を識別するために,きめ細かな学習可能なマスクを利用する,攻撃非依存の堅牢なFLシステムSkyMaskを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:35:01 GMT)
Research on Tibetan Tourism Viewpoints information generation system based on LLM [26.9]
本研究は,チベット観光観光地における情報格差の影響について考察する。 LLM(Large Language Model)評価基準の確立という課題に対処する。これは、教師付き微調整技術を採用した革新的なアプローチであるDualGen Bridge AIシステムを導入している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:31:53 GMT)
LIDIA: Precise Liver Tumor Diagnosis on Multi-Phase Contrast-Enhanced CT via Iterative Fusion and Asymmetric Contrastive Learning [26.6]
LIDIAと命名された多相造影CTを用いたLIver腫瘍DIAgnosisネットワークを現実シナリオとして提案する。症例は1,921例,8,138例であった。 LIDIAは8種類の病変に対して平均93.6%のAUCを達成し、その効果を実証している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:00:23 GMT)
INDIC QA BENCHMARK: A Multilingual Benchmark to Evaluate Question Answering capability of LLMs for Indic Languages [26.1]
Indic-QAは、2つの言語ファミリーから11の主要なインドの言語に対して、公開可能なコンテキストベース質問答えデータセットとして最大である。我々は、Geminiモデルを用いて合成データセットを生成し、パスを与えられた質問応答ペアを作成し、品質保証のために手作業で検証する。様々な多言語大言語モデルと,その命令を微調整した変種をベンチマークで評価し,その性能,特に低リソース言語について検討した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:57:16 GMT)
MO-EMT-NAS: Multi-Objective Continuous Transfer of Architectural Knowledge Between Tasks from Different Datasets [26.0]
本研究では,NAS(MO-EMT-NAS)のための多目的マルチタスクフレームワークを提案する。我々は,MO-EMT-NASがモデル性能と複雑性のトレードオフを柔軟に実現しつつ,最小限の分類誤差を改善することを示す。 MO-EMT-NASのランタイムは、対応する多目的シングルタスクアプローチと比較して59.7%から77.7%に削減されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:12:35 GMT)
SkipcrossNets: Adaptive Skip-cross Fusion for Road Detection [25.9]
マルチモーダル・フュージョンは、自動運転タスクにますます利用されている。本研究では,Skip-cross Networks (SkipcrossNets) と呼ばれる新しい融合アーキテクチャを提案する。スキップクロス融合戦略の利点は、KITTIとA2D2データセットへの適用を通じて示される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:13:24 GMT)
Misspecified $Q$-Learning with Sparse Linear Function Approximation: Tight Bounds on Approximation Error [25.8]
我々は、$Oleft(Hepsilonright)$-optimal Policyを得ることができることを示す新しい除去アルゴリズムを示す。我々は上界を$widetildeOmegaleft(Hepsilonright)$-optimality lower boundで補い、この問題の完全な図面を与える。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:58:04 GMT)
Risk-Aware Vehicle Trajectory Prediction Under Safety-Critical Scenarios [25.2]
本稿では,安全クリティカルシナリオに適したリスク対応軌道予測フレームワークを提案する。安全クリティカルな軌道予測データセットと調整された評価指標を導入する。その結果,モデルの性能が向上し,ほとんどの指標が大幅に改善した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:00:01 GMT)
Retrieval-Augmented Generation for Natural Language Processing: A Survey [25.1]
検索強化生成(RAG)は、外部知識データベースを利用して大きな言語モデルを拡張する。本稿では,RAGの重要技術,特に検索器と検索融合について概説する。 RAGは、自然言語処理のタスクや産業シナリオで使われる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:06:53 GMT)
FairDomain: Achieving Fairness in Cross-Domain Medical Image Segmentation and Classification [25.0]
本稿では,ドメインシフト下での公平性に関する先駆的なシステム研究について述べる。我々は医学的セグメンテーションと分類作業の両方に最先端領域適応(DA)と一般化(DG)アルゴリズムを用いる。また,様々なDAアルゴリズムやDGアルゴリズムに適応して,自己注意を用いて人口統計特性を調整し,公平性を向上する,新規なプラグイン・アンド・プレイ・アイデンティティ・フェアアテンション(FIA)モジュールも導入する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:30:28 GMT)
Boosting Online 3D Multi-Object Tracking through Camera-Radar Cross Check [24.8]
CRAFTBoosterは、追跡段階におけるレーダーカメラの融合を強化する先駆的な取り組みであり、3D MOT精度の向上に貢献している。 IDF1追跡性能向上の5-6%を示すK-Radaarデータセットの優れた実験結果は、自律走行における効果的なセンサ融合の可能性を検証する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 23:32:27 GMT)
Robust Multi-Task Learning with Excess Risks [24.7]
マルチタスク学習(MTL)は、全てのタスク損失の凸結合を最適化することにより、複数のタスクのジョイントモデルを学ぶことを検討する。既存の方法は適応的な重み更新方式を用いており、各損失に基づいてタスク重みを動的に調整し、困難なタスクを優先順位付けする。本稿では,過度リスクに基づくタスクバランス手法であるMulti-Task Learning with Excess Risks (ExcessMTL)を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:43:26 GMT)
Receler: Reliable Concept Erasing of Text-to-Image Diffusion Models via Lightweight Erasers [24.6]
テキストから画像への拡散モデルにおける概念消去は、対象概念に関連する画像の生成から事前学習された拡散モデルを無効にすることを目的としている。軽量エローザ(レセラー)による信頼性概念消去の提案
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:23:03 GMT)
Training-Free Large Model Priors for Multiple-in-One Image Restoration [24.2]
大型モデル駆動画像復元フレームワーク(LMDIR) 我々のアーキテクチャは、グローバルな劣化知識を注入するクエリベースのプロンプトエンコーダ、分解対応トランスフォーマーブロックで構成されている。この設計は、自動修復とユーザガイド修復の両方をサポートしながら、様々な劣化に対処するためのシングルステージトレーニングパラダイムを促進する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:40:32 GMT)
SlimFlow: Training Smaller One-Step Diffusion Models with Rectified Flow [24.2]
我々は, 強力な整流フローフレームワークに基づく, 小型かつ効率的な1ステップ拡散モデルを構築した。我々は、FIDが5.02と15.7Mの1ステップ拡散モデルを訓練し、従来の最先端1ステップ拡散モデルよりも優れている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:23:13 GMT)
Tree semantic segmentation from aerial image time series [24.1]
1年以上にわたる空中データセット画像を用いて,樹木のセマンティックセグメンテーションを行う。単体画像で訓練したモデルと時系列で訓練したモデルを比較し,木表現学がセグメンテーション性能に与える影響を評価する。樹種分類の階層構造を,種,属,高水準の3つのレベルで予測を洗練させるカスタム・ロス・ファンクションを取り入れることで活用する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:19:57 GMT)
AnyControl: Create Your Artwork with Versatile Control on Text-to-Image Generation [24.1]
言語制御は効果的なコンテンツ生成を可能にするが、画像生成のきめ細かい制御に苦慮する。 AnyControlは、生成プロセスのガイドとして、統一されたマルチモーダル埋め込みを抽出する、新しいマルチControlフレームワークを開発している。このアプローチは、ユーザ入力の全体的理解を可能にし、汎用的な制御信号の下で高品質で忠実な結果を生成する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:06:09 GMT)
Which Model Generated This Image? A Model-Agnostic Approach for Origin Attribution [24.0]
本研究では,生成した画像の起点属性を現実的に検討する。ゴールは、ある画像がソースモデルによって生成されるかどうかを確認することである。 OCC-CLIPはCLIPをベースとしたワンクラス分類のためのフレームワークである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:25:04 GMT)
Model Provenance via Model DNA [23.9]
本稿では,機械学習モデルの特徴を表現した新しいモデルDNAについて紹介する。本研究では,対象モデルの事前学習モデルであるかどうかを識別できるモデル証明同定のための効率的なフレームワークを開発する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:53:10 GMT)
Towards AI-Architecture Liberty: A Comprehensive Survey on Design and Generation of Virtual Architecture by Deep Learning [23.6]
ディープラーニングを活用した3D形状生成技術は、コンピュータビジョンとアーキテクチャデザインコミュニティの両方から大きな関心を集めている。建築設計, 3次元形状技術, 仮想環境に関する149の関連記事について概説する。深層学習支援アーキテクチャ生成における没入型システムとのユビキタスインタラクションの4つの重要な実現方法を強調した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:49:58 GMT)
Reconstruct the Pruned Model without Any Retraining [23.2]
本稿では,線形補間に基づく適応再構成(LIAR)フレームワークを提案する。 LIARはバックプロパゲーションや再トレーニングを必要とせず、様々なプルーニング基準やモジュールと互換性がある。 GLUE, SQuAD, WikiText, 常識推論などのベンチマークによる評価の結果, LIARはパラメータの50%を除去しても, 98%の精度でBERTモデルを維持できることがわかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:30:44 GMT)
PG-Attack: A Precision-Guided Adversarial Attack Framework Against Vision Foundation Models for Autonomous Driving [23.1]
ビジョンファウンデーションモデルは、高度な能力のため、自律運転システムにますます採用されている。これらのモデルは敵の攻撃を受けやすいため、自動運転車の信頼性と安全性に大きなリスクが生じる。本稿では, 高精度マスク摂動攻撃と知覚テキストパッチ攻撃の2つの手法を組み合わせた, 高精度誘導逆攻撃フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:39:31 GMT)
SUSTechGAN: Image Generation for Object Recognition in Adverse Conditions of Autonomous Driving [23.0]
本稿では,2つの注意モジュールとマルチスケールジェネレータを備えた新しいSUSTechGANを提案する。我々は、SUSTechGANと既存のよく知られたGANを用いて、雨と夜の悪天候下で駆動画像を生成し、生成した画像をオブジェクト認識ネットワークの再トレーニングに適用する。実験の結果,SUSTechGANで生成した運転画像は,降雨時のヨロブ5の再学習性能を有意に向上した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:32:25 GMT)
All Roads Lead to Rome? Exploring Representational Similarities Between Latent Spaces of Generative Image Models [22.4]
VAE、GAN、正規化フロー(NF)、拡散モデル(DM)の4つの生成画像モデルの潜時空間類似度を測定する。我々の手法は、凍結された潜在空間間の線型写像を任意のエンコーダとデコーダのペアの「スティッチ」に訓練することを含む。主な知見は,潜時空間間の線形写像が,潜時サイズの違いがあっても,ほとんどの視覚情報を保存できることである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:23:57 GMT)
PoseCrafter: One-Shot Personalized Video Synthesis Following Flexible Pose Control [22.3]
PoseCrafterは、フレキシブルポーズのコントロールに続くパーソナライズされたビデオ生成のためのワンショット方式である。安定拡散と制御ネットに基づいて、我々は、高品質なビデオを生成するための推論プロセスを慎重に設計する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:50:45 GMT)
Personalized Federated Domain-Incremental Learning based on Adaptive Knowledge Matching [22.2]
適応型知識マッチングに基づくパーソナライズFDILアプローチ(pFedDIL)を提案する。 pFedDILでは、各クライアントが適切な漸進的なタスク学習戦略を利用できる。 pFedDILは、すべてのタスクの平均精度において、最先端のメソッドよりも14.35%高い性能を示すことを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:37:49 GMT)
Labeled Data Selection for Category Discovery [22.2]
カテゴリー発見手法は、ラベルのない視覚データに新しいカテゴリを見つけることを目的としている。ラベル付けされた集合に存在するカテゴリを変更することは、ラベル付けされていない集合で最終的に発見されるものに大きな影響を与える。本稿では,ラベル付きデータとラベルなしデータとの類似性に基づいて,最適なラベル付きデータを自動的に選択する2つの新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:25:32 GMT)
Optimal high-precision shadow estimation [22.0]
正式には、未知の混合状態$rhoinmathbbCdtimes d$のコピーを$O(log(m)/epsilon2)$に測定するプロトコルを提供します。次元還元により、$epsilon$と$d$を再スケールして、$epsilon le O(d-1/2)$の政権に還元できることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:42:49 GMT)
Semantic Residual Prompts for Continual Learning [22.0]
提案手法は,最先端CLアプローチとゼロショットCLIPテストの両方で有意に優れていた。我々の発見は、バックボーンモデルの事前学習知識に相当な領域ギャップを持つデータセットにも当てはまる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:09:06 GMT)
E(n) Equivariant Message Passing Cellular Networks [22.0]
E(n)同変メッセージパッシングセルネットワーク(EMPCN)を導入する。 EMPCNは、E(n)同変グラフネットワークからCW-複素体への拡張である。 EMPCNは, ステアビリティを必要とせずに, 複数のタスクにおける最先端性能を達成可能であることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:21:34 GMT)
Learned HDR Image Compression for Perceptually Optimal Storage and Display [21.8]
高ダイナミックレンジのキャプチャと表示は、技術の進歩と優れた画像品質に対する消費者の需要の増加により、人気が著しく上昇している。その結果、HDR画像圧縮は、大きなファイルサイズと非効率なデータハンドリングに悩まされることなく、HDR画像の利点を十分に実現するために重要である。本研究では,エンド・ツー・エンドで最適化されたHDR画像圧縮を,知覚的に最適な記憶・表示に活用するための取り組みを開始する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:35:57 GMT)
GPSFormer: A Global Perception and Local Structure Fitting-based Transformer for Point Cloud Understanding [21.7]
GPSFormerはGlobal Perception and Local Structure Fitting-based Transformerである。 GPSFormerは、目立った精度で点雲から詳細な形状情報を学ぶ。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:53:15 GMT)
Bridging Sensor Gaps via Attention Gated Tuning for Hyperspectral Image Classification [21.5]
HSI分類法は高品質なラベル付きHSIを必要とするが、しばしば入手するのにコストがかかる。本稿では,3重構造トランスモデルであるTri-Formerを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:45:12 GMT)
Decision Focused Causal Learning for Direct Counterfactual Marketing Optimization [21.3]
決定集中学習(DFL)は機械学習(ML)と最適化をエンドツーエンドフレームワークに統合する。しかし、DFLをマーケティングに展開するのは、複数の技術的課題のために簡単ではない。本稿では,直接対物マーケティングのための意思決定型因果学習フレームワーク(DFCL)を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:39:44 GMT)
An Empirical Study and Analysis of Text-to-Image Generation Using Large Language Model-Powered Textual Representation [21.2]
既存のメソッドは、入力プロンプトを表現するためにCLIPモデルのテキストエンコーダを利用する。大規模言語モデル(LLM)は多言語入力を提供し、より長いコンテキストに対応し、優れたテキスト表現を実現する。 LLMのテキスト表現を用いたテキスト・ツー・イメージモデルの高速な訓練を可能にする軽量なアダプタを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:14:19 GMT)
FairEM360: A Suite for Responsible Entity Matching [21.1]
このデモでは、エンティティマーカの出力を監査するフレームワークであるFairEM360が紹介されている。 EMパイプラインの評価において,FairEM360がフェアネスの優先順位付けに寄与することを期待している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:23:19 GMT)
RingID: Rethinking Tree-Ring Watermarking for Enhanced Multi-Key Identification [21.1]
ツリーリング透かしは,近年の拡散モデル透かし手法であり,様々な攻撃に対して強い堅牢性を示す。詳細な研究を行い、透かしによって意図せず導入された分布変化が、その例外的な強靭性に寄与することを明らかにする。我々の調査は、オリジナルの設計、特に複数の異なるキーを識別する能力に固有の欠陥をさらに明らかにしている。マルチキー識別のためのRingIDを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:10:02 GMT)
Black-Box Opinion Manipulation Attacks to Retrieval-Augmented Generation of Large Language Models [21.0]
我々は、意見操作のためのブラックボックス攻撃に直面した場合、検索強化生成(RAG)モデルの脆弱性を明らかにする。このような攻撃がユーザの認知と意思決定に与える影響について検討する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:55:55 GMT)
Masked Autoencoders are Efficient Continual Federated Learners [20.9]
継続的な学習は、クライアント間で共有される表現の教師なしの学習に基礎を置くべきです。分布推定のためのマスク付きオートエンコーダはこの設定に特に適している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:22:21 GMT)
BEAF: Observing BEfore-AFter Changes to Evaluate Hallucination in Vision-language Models [20.7]
視覚言語モデル(VLM)は、視覚エンコーダと大型言語モデル(LLM)を組み合わせて世界を認識する。近年の研究では、VLMは幻覚に弱いことが示されている。我々は、True Understanding (TU)、IGnorance (IG)、StuBbornness (SB)、InDecision (ID)といった新しいメトリクスを紹介します。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:11:12 GMT)
Information-Theoretic Foundations for Machine Learning [20.6]
本稿では,洞窟外に存在する問題に答えようとする理論的枠組みを提案する。我々はベイズ統計とシャノンの情報理論に根ざしたフレームワークを提供し、機械学習における多くの現象の分析を統一するのに十分一般的なものである。我々は、不特定アルゴリズムの性能を特徴付けるセクションを締めくくる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:35:39 GMT)
Audio-visual Generalized Zero-shot Learning the Easy Way [20.6]
本稿では,EZ-AVGZLについて述べる。我々は,VGGSound-GZSL,UCF-GZSL,ActivityNet-GZSLベンチマークについて広範な実験を行った。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:57:16 GMT)
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts) [20.5]
この第2回説明可能なAI for the Arts(XAIxArts)に関する国際ワークショップは、HCI、インタラクションデザイン、AI、説明可能なAI(XAI)、デジタルアートの研究者のコミュニティを集めて、XAI for the Artsの役割を探求した。第16回 ACM Conference on Creativity and Cognition (C&C 2024) でワークショップを開催した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:01:56 GMT)
Adaptive Foundation Models for Online Decisions: HyperAgent with Fast Incremental Uncertainty Estimation [20.5]
GPT-HyperAgentは,GPTとHyperAgentを併用した拡張手法である。我々はHyperAgentが$tildeO(log T)$ per-step計算複雑性を用いて高速なインクリメンタル不確実性推定を実現することを証明した。解析により,HyperAgentの遺残順序は線形文脈帯域における正確なトンプソンサンプリングと一致することが示された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:16:09 GMT)
Convex mixed-integer optimization with Frank-Wolfe methods [20.4]
混合整数非線形最適化は理論的および計算的課題を示す。本稿では,凸ノード緩和を用いた分岐結合アルゴリズムに基づいて,これらの問題の解法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:10:11 GMT)
Safe-SD: Safe and Traceable Stable Diffusion with Text Prompt Trigger for Invisible Generative Watermarking [20.3]
安定拡散(SD)モデルは一般的に画像合成とパーソナライズされた編集の分野で栄えている。 AIが作成したコンテンツを公開プラットフォームに公開することで、法的および倫理的リスクが高まる可能性がある。本研究では,透かしを認識不能な構造に適応させる,安全かつ高追従性安定拡散フレームワーク(SafeSD)を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:53:17 GMT)
RT-Pose: A 4D Radar Tensor-based 3D Human Pose Estimation and Localization Benchmark [20.2]
本稿では,Radarベースのヒューマンポーズ(RT-Pose)データセットとオープンソースのベンチマークフレームワークを提案する。 RT-Poseデータセットは、4Dレーダテンソル、LiDARポイントクラウド、RGBイメージで構成されており、6つの複雑さレベルアクションを持つ240のシーケンスにわたる合計72kフレームに対して収集される。 RGB画像とLiDAR点雲を用いて3次元人間の骨格を正確にラベル付けするアノテーションプロセスを開発する。さらに,3次元空間における4次元レーダーテンソルの高分解能表現を抽出し,人間のキーポイント推定を支援する最初の単一ステージアーキテクチャであるHRRadarPoseを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:46:35 GMT)
VFusion3D: Learning Scalable 3D Generative Models from Video Diffusion Models [20.1]
本稿では,事前学習ビデオ拡散モデルを用いたスケーラブルな3次元生成モデル構築手法を提案する。微調整により多視点生成能力を解放することにより、大規模な合成多視点データセットを生成し、フィードフォワード3D生成モデルを訓練する。提案したモデルであるVFusion3Dは、ほぼ3Mの合成マルチビューデータに基づいて訓練され、単一の画像から数秒で3Dアセットを生成することができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:22:49 GMT)
Three-State Information Hiding: Provably Secure Asymmetric Steganography [19.9]
言語モデルを実行するには、強力な計算プラットフォームが必要です。従来の安全なステガノグラフィー手法は、この低リソースのシナリオには適用できない。低リソース方式で実用化された新しいステガノグラフィーフレームワークを設計することを目的としている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:32:00 GMT)
HHGT: Hierarchical Heterogeneous Graph Transformer for Heterogeneous Graph Representation Learning [19.7]
K,t)-ring neighborhoodと呼ばれる革新的な構造を開発し、ノードはまずその距離によって構成され、各距離ごとに異なる非重なり合うk-ring neighborhoodを形成する。各 k-環構造の中で、ノードはそれらのタイプによってさらに異なるグループに分類されるので、HINにおける距離と型の両方の不均一性を自然に強調する。 HHGTの14ベースラインに対する優位性を検証するために、下流タスクで実験が行われ、ノードクラスタリングタスクでは、NMIが24.75%、ARIが29.25%まで改善された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:58:27 GMT)
MoLA: Motion Generation and Editing with Latent Diffusion Enhanced by Adversarial Training [19.6]
高速かつ高品質なモーション生成を実現し,複数の編集タスクをひとつのフレームワークで処理可能なMoLAを提案する。高品質かつ高速な生成には,変分オートエンコーダと潜時拡散モデルを用い,対向訓練による性能向上を図る。本研究では,テキスト・ツー・モーション生成における対人学習の有効性を定量的に示すとともに,動作領域における複数の編集タスクに対する編集フレームワークの適用性を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:45:54 GMT)
Private Aggregation in Hierarchical Wireless Federated Learning with Partial and Full Collusion [19.6]
連合学習において、フェデレーターは、複数の参加するクライアントが保持する個人所有データ上で、モデルのトレーニングを調整する。本稿では,クライアントを基地局に接続する階層型無線システムアーキテクチャについて考察する。我々は,情報理論的プライバシの下でのコミュニケーションコストに,異なる共謀仮定による根本的な制限を導出する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:12:20 GMT)
ToDA: Target-oriented Diffusion Attacker against Recommendation System [19.5]
レコメンデーションシステム(RS)は、敵がユーザープロファイルを操作できる悪意のある攻撃を受けやすいため、バイアスのあるレコメンデーションにつながる。最近の研究は、しばしばこれらの偽りのユーザープロファイルを作成するために生成モデルを使って追加のモジュールを統合する。ターゲット指向拡散攻撃モデル(ToDA)を提案する。ユーザープロファイルを高次元空間に変換し、ToDAのコアコンポーネントであるLatent Diffusion Attacker(LDA)と組み合わせる、事前訓練されたオートエンコーダが組み込まれている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:51:34 GMT)
From 2015 to 2023: How Machine Learning Aids Natural Product Analysis [19.5]
本稿では, 天然物分析に利用可能な計算戦略のスペクトルを考察し, 質的および定量的な化学問題の両方を研究するための研究枠組みを構築した。我々の目的は、機械学習と化学の共生に関する新しい視点を提示することであり、天然物分析の分野での変革を触媒する可能性がある。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:52:30 GMT)
BAM-DETR: Boundary-Aligned Moment Detection Transformer for Temporal Sentence Grounding in Videos [19.3]
時間文の接頭辞は、言語記述に関連するモーメントをローカライズすることを目的としている。境界指向モーメントの新たな定式化を提案する。提案手法の有効性を3つのベンチマークで検証した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:01:46 GMT)
Rethinking Video-Text Understanding: Retrieval from Counterfactually Augmented Data [19.2]
本稿では,映像テキスト理解のための新しい評価タスク,すなわち,対実的拡張データ(RCAD)と新しいFeint6Kデータセットを提案する。新しい評価タスクを成功させるためには、モデルはクロスフレーム推論からビデオの包括的理解を導き出さなければならない。提案手法は,複数のビデオテキストモデルに適用した場合に,より識別的な動作埋め込みを学習し,Feint6Kの結果を改善する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:55:48 GMT)
TrialDura: Hierarchical Attention Transformer for Interpretable Clinical Trial Duration Prediction [19.1]
マルチモーダルデータを用いて臨床試験期間を推定する機械学習に基づくTrialDuraを提案する。バイオメディカルコンテキストに特化されたBio-BERT埋め込みにエンコードして,より深く,より関連するセマンティック理解を提供する。提案モデルでは, 平均絶対誤差(MAE)が1.04年, 根平均二乗誤差(RMSE)が1.39年であった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:45:06 GMT)
Sparse and geometry-aware generalisation of the mutual information for joint discriminative clustering and feature selection [19.1]
GEMINIと呼ばれる相互情報の幾何を考慮した一般化を最大化しようとする識別クラスタリングモデルを導入する。このアルゴリズムは,特徴探索の負担を回避し,識別クラスタリングモデルのみを設計しながら,高次元データや大量のサンプルに対して容易にスケーラブルである。以上の結果から,Sparse GEMINIは競合アルゴリズムであり,関連基準や事前仮説を使わずに,クラスタリングに関して変数の関連するサブセットを選択することができることがわかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:44:18 GMT)
Multi-modal vision-language model for generalizable annotation-free pathology localization and clinical diagnosis [19.0]
医療画像から病理を自動的に定義することは、疾患の出現と進展を理解するのに役立つ。既存のディープラーニングモデルは専門家のアノテーションに大きく依存しており、オープンな臨床環境での一般化機能が欠如している。視覚言語モデルを提案する。 lingering-free pathology (AFLOC) AFLocは病理学や分類学における最先端の手法を超越し、また5つの異なる病理の特定においてヒトのベンチマークよりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:08:52 GMT)
LLMs as Function Approximators: Terminology, Taxonomy, and Questions for Evaluation [18.3]
本稿では,これらのモデルモデルにおける明瞭さの喪失が,「人工的な一般知性」などのメタファーにつながることを論じる。この提案は、自然言語仕様に基づいて専門関数を近似する能力において、それらの一般化と潜在的な価値を見出すことである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:49:56 GMT)
Qalam : A Multimodal LLM for Arabic Optical Character and Handwriting Recognition [18.3]
本研究はアラビア語 OCR と HWR 向けに設計された新しい基礎モデルである Qalam を紹介する。提案手法は,HWRタスクが0.80%,OCRタスクが1.18%のワード誤り率(WER)を達成し,既存の手法よりも優れていた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:31:09 GMT)
FADE: A Task-Agnostic Upsampling Operator for Encoder-Decoder Architectures [18.2]
FADEは、新しくて、プラグアンドプレイで、軽量で、タスクに依存しないアップサンプリングオペレータである。 FADEはタスク非依存であり,多くの密集予測タスクにおいて一貫した性能向上を示す。リージョンとディテールに敏感なタスクの両方で,ロバストな機能アップサンプリングを初めて実施しました。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:32:36 GMT)
Simultaneous Localization and Affordance Prediction for Tasks in Egocentric Video [18.1]
本稿では,視覚的インプットとタスク記述を結びつけるために,空間的局所化されたエゴセントリックビデオのトレーニングを行うシステムを提案する。提案手法は,VLMを用いてタスク記述の類似性を位置タグ付き画像にマッピングする手法よりも優れていることを示す。このシステムは、ロボットがエゴセントリックな感覚を使って、自然言語で指定された新しいタスクの物理的な場所をナビゲートすることを可能にする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:55:56 GMT)
Sparse Beats Dense: Rethinking Supervision in Radar-Camera Depth Completion [18.1]
本稿では,従来の高密度LiDAR監督法を精度と速度の両方で上回る,疎LiDAR監督法を提案する。また, 粗いLiDAR監督下では, 重要ストライプ状アーティファクトを含む深度マップを出力することが多い。本研究のフレームワークは,平均絶対誤差(MAE)が11.6%,フレームパー秒(FPS)が1.6倍向上し,最先端の高密度監視手法よりも優れていた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:05:55 GMT)
Unveiling Structural Memorization: Structural Membership Inference Attack for Text-to-Image Diffusion Models [17.9]
メンバー推論攻撃(MIA)は、プライバシ保護のためのツールとして機能するよう提案されている。テキストから画像への拡散モデルに適した,シンプルで効果的なMIA手法を提案する。我々の手法は、最先端の性能を達成するだけでなく、様々な歪みに対して顕著な堅牢性を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:07:28 GMT)
CogniVoice: Multimodal and Multilingual Fusion Networks for Mild Cognitive Impairment Assessment from Spontaneous Speech [17.9]
音声データとそのテキストの書き起こしを分析し,MMSE(Mini-Mental State Examination)スコアの検出と推定を行う新しいフレームワークであるCogniVoiceを紹介した。 TAUKADIALチャレンジから英語と中国語の両方を含む包括的なデータセットを使用して、CogniVoiceはMCI分類とMMSE回帰タスクにおける最高のパフォーマンスベースラインモデルより優れている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:38:24 GMT)
On Causally Disentangled State Representation Learning for Reinforcement Learning based Recommender Systems [17.8]
Reinforcement Learning-based Recommender Systems (RLRS)では、ユーザインタラクションの複雑さとダイナミズムは高次元でノイズの多い状態空間をもたらすことが多い。状態を分解し、textbfCausal-textbfIntextbfDispensable textbfState Representationsを抽出するための革新的な因果的アプローチを導入する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:41:05 GMT)
Learn to Memorize and to Forget: A Continual Learning Perspective of Dynamic SLAM [17.7]
暗黙的な神経表現を伴う同時局所化とマッピング(SLAM)が注目されている。動的環境のための新しいSLAMフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:35:48 GMT)
How Generalizable Is My Behavior Cloning Policy? A Statistical Approach to Trustworthy Performance Evaluation [17.6]
行動クローニングポリシーは、人間のデモンストレーションから学ぶことで複雑なタスクを解決することに成功している。本稿では,任意の環境下でのロボット性能について,より低バウンドなフレームワークを提案する。実験では,シミュレーションとハードウェアの両方におけるビジュモータ操作のポリシーを評価する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:45:25 GMT)
GeometrySticker: Enabling Ownership Claim of Recolorized Neural Radiance Fields [17.6]
ニューラルラジアンスフィールド(NeRF)の再色化は、NeRFの色属性の変更プロセスを単純化した。悪意のあるユーザーがNeRFモデルの色を変えて、その色を変えたバージョンを自称するのではないか、という懸念もあります。我々は、NeRFモデルにバイナリメッセージをシームレスに統合するGeometryStickerを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:57:29 GMT)
Robust Calibration of Large Vision-Language Adapters [17.6]
本稿では,CLIPに基づくモデル適応における誤校正の重大な問題に対処する。実験により,0ショットベースラインのキャリブレーション能力を大幅に低下させる,Adapters,Prompt Learning,Test-Time Adaptationなどの一般的なCLIP適応アプローチを実証した。これらの観測により、各試料の対数範囲をゼロショット予測ロジットに拡大することにより、誤校正を緩和するための単純でモデルに依存しない解が提示される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:27:56 GMT)
Exposure Completing for Temporally Consistent Neural High Dynamic Range Video Rendering [17.4]
本稿では,不在な露光情報を完成させることで,HDRフレームを描画する新しいパラダイムを提案する。提案手法では, 隣接LDRフレームを時間次元で補間し, 露出の欠如に対してLDRフレームを再構成する。これにより、HDR結果の融合プロセスの恩恵を受け、ノイズやゴーストを低減し、時間的一貫性を向上させることができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:13:08 GMT)
Linear-Complexity Self-Supervised Learning for Speech Processing [17.4]
自己教師付き学習(SSL)モデルは、通常、数十のハイエンドGPUで数週間の事前トレーニングを必要とする。本稿では,SSLのための線形複雑コンテキストエンコーダを初めて検討する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:34:33 GMT)
A Framework for Efficient Model Evaluation through Stratification, Sampling, and Estimation [17.4]
本稿では,階層化,サンプリング,推定を含むモデル評価のためのフレームワークを提案する。モデル性能の正確な予測に基づいて,k平均クラスタリングによる成層化を行うことで,効率的に推定できることを示す。また、データセットのラベル付けされていない部分におけるモデル精度の予測を利用するモデル支援推定器は、一般的に従来の推定値よりも効率的であることがわかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:43:12 GMT)
QestOptPOVM: An iterative algorithm to find optimal measurements for quantum parameter estimation [17.3]
最適正の演算子検定(POVM)を直接同定するアルゴリズム「QestPOVM」を導入する。量子状態の複数コピー(最大6コピー)の厳密な試行を通じて,提案アルゴリズムの有効性と精度を実証した。提案アルゴリズムは,最適なPOVMの明示的な形式を解明するためのツールとして機能し,量子パラメータ推定手法の理解を深める。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:23:33 GMT)
Analyzing and Bridging the Gap between Maximizing Total Reward and Discounted Reward in Deep Reinforcement Learning [17.2]
深層強化学習では、全報酬を最大化するのではなく、割引報酬の最大化がしばしば用いられる。我々は,全報酬を最大化する政策に関連して,割引報酬を最大化することで得られる政策の最適度を分析した。そこで我々は,強化学習アルゴリズムの性能向上を図るため,ある状況下で2つの目的の最適ポリシーを整合させる手法を開発した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:33:10 GMT)
Microservices-based Software Systems Reengineering: State-of-the-Art and Future Directions [17.1]
クラウドベースのマイクロサービスアーキテクチャ(MSA)と互換性のあるソフトウェアを設計することは、パフォーマンス、スケーラビリティ、可用性の制限のために不可欠である。我々は、静的、動的、ハイブリッドなアプローチが検討されているように再デプロイ可能なシステム内のサービスを特定する方法に関する、現在の研究を包括的に調査する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:59:05 GMT)
Enhancing Thermal Infrared Tracking with Natural Language Modeling and Coordinate Sequence Generation [16.9]
本研究では,座標情報と時間情報の利用性を高めるNLMTrackという新しいモデルを提案する。実験により、NLMTrackは複数のベンチマークで最先端のパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:53:00 GMT)
HSEmotion Team at the 7th ABAW Challenge: Multi-Task Learning and Compound Facial Expression Recognition [16.9]
HSEmotionチームは,第7回ABAW(Affective Behavior Analysis in-the-wild)コンペティションの2つの課題について報告する。マルチタスク設定で事前学習したフレームレベルの顔特徴抽出器に基づく効率的なパイプラインを提案する。ニューラルネットワークの軽量アーキテクチャを利用することで、私たちのテクニックのプライバシ意識を確保する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:47:49 GMT)
Improving Out-of-Distribution Generalization of Trajectory Prediction for Autonomous Driving via Polynomial Representations [16.9]
本稿では,2つの大規模動作データセット間でデータセットと予測タスクを均質化するOoDテストプロトコルを提案する。モデルのサイズ、トレーニングの労力、推論時間を大幅に小さくすることで、IDテストのSotAに近いパフォーマンスに達し、OoDテストの堅牢性を大幅に向上します。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:00:32 GMT)
Evaluating the Elementary Multilingual Capabilities of Large Language Models with MultiQ [16.6]
大規模言語モデル(LLM)は、世界中の英語話者の大多数を含むすべての人にサービスを提供する必要がある。近年の研究では、意図した用途に制限があるにもかかわらず、多くの言語でLSMを促すことが示されている。我々は、27.4kのテスト質問に答える基本的なオープンエンド質問のための新しい銀標準ベンチマークであるMultiQを紹介する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:31:58 GMT)
Instance Selection for Dynamic Algorithm Configuration with Reinforcement Learning: Improving Generalization [16.5]
動的アルゴリズム構成(DAC)は、多様なインスタンスに対してアルゴリズムのハイパーパラメータを動的に設定するという課題に対処する。 Deep Reinforcement Learning (RL)でトレーニングされたエージェントは、そのような設定を解決するための経路を提供する。我々は、過剰表現を克服するためにトレーニングインスタンスの代表的なサブセットを選択して、このサブセット上のエージェントを再訓練し、一般化性能を向上させることで、この問題を軽減するための一歩を踏み出した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:44:43 GMT)
Recent Advances of Continual Learning in Computer Vision: An Overview [16.5]
継続的な学習は、異なる時間ステップでやってくる新しい知識を学習し、融合し、蓄積する能力を持つ人間の学習プロセスと似ている。本稿では,コンピュータビジョンにおける連続学習の最近の進歩を概観する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:27:05 GMT)
FocusDiffuser: Perceiving Local Disparities for Camouflaged Object Detection [16.4]
本研究では,カモフラージュされた物体の検出と解釈を,生成モデルがいかに向上させるかを検討するために,新しい拡散モデルであるFocusDiffuserを提案する。提案実験により,FocusDiffuserは生成的視点から,カモフラージュされた物体検出の課題に効果的に対処できることを示した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:45:12 GMT)
Effective Illicit Account Detection on Large Cryptocurrency MultiGraphs [16.3]
暗号通貨関連の不正行為の増加は、ユーザーにとって大きな損失をもたらした。現在の検出方法は、主に機能工学に依存しているか、あるいは暗号取引ネットワーク内の複雑な情報を活用するのに不十分である。本稿では,有意なエッジを持つ有向多重グラフによってモデル化された暗号取引ネットワークにおける不正なアカウントを検出する効果的な方法であるDIAMを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:59:52 GMT)
VLG-CBM: Training Concept Bottleneck Models with Vision-Language Guidance [16.2]
概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の理解可能な概念を符号化してモデルの決定を説明する中間概念ボトルネック層 (Concept Bottleneck Layer, CBL) を導入することで、解釈可能な予測を提供する。近年、LLM(Large Language Models)とVLM(Valge-Language Models)を併用してCBMのトレーニングを自動化し、よりスケーラブルで自動化する研究が提案されている。本稿では,VLG-CBM(Vision-Language-Guided Concept Bottleneck Model)を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:44:44 GMT)
TrialEnroll: Predicting Clinical Trial Enrollment Success with Deep & Cross Network and Large Language Models [16.0]
本稿では,大規模言語モデル(LLM)を付加した新しいディープ・アンド・クロスネットワークを開発した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:50:40 GMT)
TP2O: Creative Text Pair-to-Object Generation using Balance Swap-Sampling [15.9]
本稿では,2つのテキスト埋め込みの要素をランダムに交換することで,新しいオブジェクト画像を生成するスワッピング機構を提案する。また、新たに生成された画像集合から小さなサブセットを効率的にサンプリングするためのバランススワップ領域も導入する。私たちの研究結果は、カエルブロッコリーのような人間のアーティストとさえ競合しています。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:57:36 GMT)
BRSR-OpGAN: Blind Radar Signal Restoration using Operational Generative Adversarial Network [15.9]
現実世界のレーダー信号は、望ましくないエコー、センサーノイズ、意図的な妨害、干渉など、人工物が混ざり合っているため、しばしば破損する。 BRSR-OpGAN(Operational Generative Adversarial Network)を用いたブラインドレーダ信号復元の検討このアプローチは、破壊の多様性や強度に関わらず、レーダ信号の品質を向上させるように設計されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 23:55:48 GMT)
Robust ASR Error Correction with Conservative Data Filtering [15.8]
大規模言語モデルに基づく誤り訂正(EC)は,自動音声認識(ASR)システムの性能を向上させる新しい技術である。本稿では,ECトレーニングデータが満足すべき2つの基本的な基準を提案する。低品質のECペアを特定し、そのようなケースでは修正を行わないようにモデルを訓練する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:05:49 GMT)
Similarity over Factuality: Are we making progress on multimodal out-of-context misinformation detection? [15.7]
アウト・オブ・コンテクスト(OOC)の誤報は、マルチモーダルな事実チェックにおいて重大な課題となる。証拠に基づくOOC検出の最近の研究は、ますます複雑なアーキテクチャへと向かっている。画像テキスト対と外部画像とテキストエビデンスとの類似性を評価する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:08:55 GMT)
Improved Esophageal Varices Assessment from Non-Contrast CT Scans [15.6]
食道静脈瘤(EV)は門脈圧亢進による重篤な健康上の問題である。非造影CT(non-contrast Computed Tomography, NC-CT)は, 安価で非侵襲的な画像モダリティであるにもかかわらず, EV評価のための主要な臨床診断ツールとして完全には受け入れられていない。我々は,NC-CTスキャンにおける重要な臓器機能の解析を改良し,EVを効果的に評価するMulti-Organ-cOhesion-Network(MOON)を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:49:10 GMT)
Large Language Model Enhanced Knowledge Representation Learning: A Survey [15.6]
言語モデルと知識表現学習(KRL)の統合は、人工知能(AI)分野における大きな進歩を示している。 LLMによるKRLの強化に関する研究が増えているにもかかわらず、これらの強化されたモデルのプロセスを分析する徹底的な調査は、顕著に欠落している。 3つの異なるトランスフォーマーアーキテクチャに基づいてこれらのモデルを分類し、様々なKRL下流タスクからの実験データを解析し、それぞれのアプローチの長所と短所を評価することで、この問題に対処する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:19:34 GMT)
Benchmark Agreement Testing Done Right: A Guide for LLM Benchmark Evaluation [15.6]
過度に見落とされた方法論的選択がベンチマークコンセンサステスト(BAT)の結果にどのように影響するかを示す。我々は、BAT用のピソンパッケージであるBenchBenchを紹介し、ベンチマークを仲間を使って評価するためのメタベンチマークであるBenchBench- Leaderboardをリリースする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:00:23 GMT)
Teaching Code LLMs to Use Autocompletion Tools in Repository-Level Code Generation [15.5]
コード大言語モデル(LLM)は、リポジトリレベルの依存関係に対する認識の欠如により、リポジトリレベルのコード生成の制限に直面します。 ToolGenは、自動補完ツールをコードLLM生成プロセスに統合し、これらの依存関係に対処するアプローチです。 ToolGenは、Trigger InsertionとModel Fine-tuning(Offline)とツール統合コード生成(Online)の2つの主要なフェーズで構成されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:04:38 GMT)
Enhancing Out-of-Vocabulary Performance of Indian TTS Systems for Practical Applications through Low-Effort Data Strategies [15.3]
低リソース言語用の公開TTSデータセットは一般的に10～20時間のデータを格納し、語彙のカバレッジが低くなる。いくつかの実世界のアプリケーションからのOOV単語を含むベンチマークを作成する。このような安価なデータを用いることで、音声品質やドメイン内性能に影響を与えず、OOV語の性能が向上することを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:03:14 GMT)
Transferable Adversarial Facial Images for Privacy Protection [15.2]
視覚的品質を維持しつつ、転送性を改善した新しい顔プライバシー保護方式を提案する。生成モデルの潜在空間をトラバースするために,まずグローバルな逆潜時探索を利用する。次に、視覚的アイデンティティ情報を保存するための重要なランドマーク正規化モジュールを導入する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:16:11 GMT)
Let Occ Flow: Self-Supervised 3D Occupancy Flow Prediction [14.9]
Occ Flowは、カメラ入力のみを使用して、関節の3D占有率と占有率の予測を行う最初の自己教師型作業である。提案手法では,動的オブジェクト依存を捉えるために,後向きの時間的アテンションモジュールを組み込んでおり,次いで3次元洗練されたボリューム表現を行う。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:00:10 GMT)
$μ$Drive: User-Controlled Autonomous Driving [14.9]
$mu$Driveは、自動運転車の振る舞いを特定するために設計されたイベントベースのドメイン特化言語(Specific)である。 $mu$Driveは、コンテキストイベントによって引き起こされるルールを通じて、ユーザが好みを表現できるようにする。以上の結果から,Apolloの計画に$mu$Driveで効果的に影響を及ぼし,ADSによる交通規制の遵守改善を支援することが示唆された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:36:33 GMT)
ROLeR: Effective Reward Shaping in Offline Reinforcement Learning for Recommender Systems [14.7]
オフライン強化学習(RL)は,実世界のレコメンデーションシステムに有効なツールである。本稿では,リコメンダシステムのためのオフライン強化学習における報酬と不確実性評価のためのモデルベースReward Shapingを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:07:11 GMT)
TransCAD: A Hierarchical Transformer for CAD Sequence Inference from Point Clouds [14.6]
物理物体の3次元スキャンによりCADモデルを推定する3次元リバースエンジニアリングは、有望な研究方向である。本稿では,ポイントクラウドからCADシーケンスを予測するエンドツーエンドトランスフォーマーアーキテクチャであるTransCADを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:27:36 GMT)
Fast Registration of Photorealistic Avatars for VR Facial Animation [14.6]
我々は,アバター画像とHMC画像の領域ギャップが,最も困難であることを示す。提案するシステムでは,ドメイン内の入力を反復的に処理するモジュールと,現在の推定値に条件付きアバター誘導画像-画像間ドメイン転送モジュールの2つに分割する。本システムでは,オフラインでのオフライン最適化の必要性を排除し,直接回帰法よりも高い品質のオンライン登録を行う。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:39:33 GMT)
Beyond Chinchilla-Optimal: Accounting for Inference in Language Model Scaling Laws [14.5]
我々は,所与の品質と予測要求のモデルをトレーニングし,展開するために,最適LLMパラメータ数と事前学習データサイズを計算するために,Chinchillaスケーリング法を変更した。我々は,パラメータ単位のトークンを極端な範囲にスケールするにつれて,モデルの品質が向上し続けることを確認するために,さまざまなサイズとパラメータ数の47モデルを訓練する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:23:29 GMT)
Data-Algorithm-Architecture Co-Optimization for Fair Neural Networks on Skin Lesion Dataset [14.5]
本稿では,皮膚病変のデータセット解析において,良好な結果を得るために設計された新しいフレームワークであるBiaslessNASを紹介する。実験の結果, BiaslessNASは従来のNAS法に比べて2.55%の精度向上と65.50%の公平性向上を実現していることがわかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:49:57 GMT)
Addressing Imbalance for Class Incremental Learning in Medical Image Classification [14.2]
不均衡の悪影響を軽減するために2つのプラグイン法を導入する。まず、多数派に対する分類バイアスを軽減するために、CILバランスの取れた分類損失を提案する。第2に,組込み空間におけるクラス間重複を緩和するだけでなく,クラス内コンパクト性も緩和する分布マージン損失を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:59:44 GMT)
Auditing Local Explanations is Hard [14.2]
本研究では,第三者監査官やユーザ集団が健全性検査を行う監査フレームワークについて検討する。監査人がこのフレームワーク内で成功するために必要なクエリの量について、上位と下位のバウンダリを証明します。以上の結果から,複雑な高次元設定では,ポイントワイドな予測と説明が不十分である可能性が示唆された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:34:05 GMT)
Enhancing Temporal Action Localization: Advanced S6 Modeling with Recurrent Mechanism [14.1]
TALはビデオ分析において重要なタスクであり、アクションの開始と終了の正確な時間を特定する。選択状態空間モデル(S6)を利用した新しいtalアーキテクチャを提案する。提案手法は,特徴集約型Bi-S6ブロック,デュアルBi-S6構造,時間的およびチャネル的依存性モデリングを強化するための繰り返し機構を統合する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 00:57:37 GMT)
Localizing Anomalies via Multiscale Score Matching Analysis [13.9]
本稿では,脳MRIにおける異常局所化のための新しい教師なし手法であるSpatial-MSMAを紹介する。パッチ位置とグローバル画像の特徴を条件としたフレキシブルな正規化フローモデルを用いて、パッチワイド異常スコアを推定する。この方法は、通常発達している幼児の1,650T1およびT2重み付き脳MRIのデータセットで評価される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:07:17 GMT)
Robots Can Multitask Too: Integrating a Memory Architecture and LLMs for Enhanced Cross-Task Robot Action Generation [13.8]
大規模言語モデル(LLM)は、ロボットの知覚と身体能力による常識推論の基盤となるロボット応用に最近使用されている。本稿では,タスク間を効果的に切り替える一方で,タスク間動作を生成するためのLLMをメモリプロセスに組み込むことに対処する。その結果,5つのロボットタスクのベースラインよりも性能が大幅に向上し,ロボットの動作と適応タスク実行の知覚を組み合わせたLLMにメモリを統合する可能性が示された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:38:21 GMT)
APS-USCT: Ultrasound Computed Tomography on Sparse Data via AI-Physic Synergy [13.8]
超音波CT(USCT)は優れた医用画像再構成技術である。その利点にもかかわらず、高品質のUSCT再構成は多数のトランスデューサによる広範なデータ取得に依存している。 APS-USCTと呼ばれる,スパースデータによる撮像を容易にする新しいUSCT手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:30:41 GMT)
Fundamental Scaling Laws of Covert Communication in the Presence of Block Fading [13.8]
無線通信システムにおいて,信号フェードのようなチャネル障害は,隠蔽通信システムの効果的な実装と解析において課題となる。本稿では,ブロックフェーディングチャネルで使用した$n$チャネルで隠蔽送信可能なビット数について,その計算結果を考慮し,カバート通信分野における初期処理を一般化する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:56:53 GMT)
The Art of Imitation: Learning Long-Horizon Manipulation Tasks from Few Demonstrations [13.7]
TP-GMMの適用にはいくつかのオープンな課題がある。我々はロボットのエンドエフェクター速度を方向と大きさに分解する。次に、複雑な実証軌道からセグメントとシーケンスのスキルを抽出する。私たちのアプローチでは,5つのデモから複雑な操作タスクを学習することが可能です。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:01:09 GMT)
SGOOD: Substructure-enhanced Graph-Level Out-of-Distribution Detection [13.7]
グラフレベルのOOD検出フレームワークであるSGOODを提案する。我々は,IDグラフとOODグラフのサブ構造差が一般的であること,および,OOD検出に有効なタスク非依存のサブ構造を符号化する一連の手法を用いてSGOODを設計することを発見した。多数のグラフデータセット上の11の競合相手に対する実験は、SGOODの優位性を実証している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:12:41 GMT)
CC-DCNet: Dynamic Convolutional Neural Network with Contrastive Constraints for Identifying Lung Cancer Subtypes on Multi-modality Images [13.7]
肺がんサブタイプを多次元・多モード画像で正確に分類するための新しい深層学習ネットワークを提案する。提案モデルの強みは, 対のCT-病理画像セットと独立のCT画像セットの両方を動的に処理できることにある。また,ネットワーク学習を通じてモダリティ関係を定量的にマッピングするコントラスト制約モジュールも開発した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:42:00 GMT)
SAM-Driven Weakly Supervised Nodule Segmentation with Uncertainty-Aware Cross Teaching [13.6]
自動結節分割は超音波画像におけるコンピュータ支援診断に不可欠である。近年、SAMのようなセグメンテーション基礎モデルは、自然画像に顕著な一般化性を示している。本研究では, セグメンテーション基盤モデルを利用して擬似ラベルを生成する, 弱教師付きフレームワークを考案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:27:54 GMT)
Common Sense Reasoning for Deepfake Detection [13.5]
最先端のディープフェイク検出アプローチは、ニューラルネットワークを介して抽出された画像ベースの機能に依存している。我々は,Deepfake Detection VQA (DD-VQA) タスクとしてディープフェイク検出を行い,人間の直感をモデル化した。我々は、新しい注釈付きデータセットを導入し、DD-VQAタスクのためのビジョン・アンド・ランゲージ・トランスフォーマーベースのフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:59:36 GMT)
ScatterFormer: Efficient Voxel Transformer with Scattered Linear Attention [13.4]
ウィンドウベースのトランスフォーマーは、安価な注意計算でコンテキスト認識表現をキャプチャすることで、大規模クラウド理解において優れている。既存のメソッドは、ウィンドウ内のボクセルを広範囲のソートとパディング操作を通じて固定長のシーケンスにグループ化する。 ScatterFormerは、異なるウィンドウにまたがるvoxelに直接、単一のシーケンスとして注意を向ける最初の方法です。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:02:45 GMT)
Unsupervised Video Highlight Detection by Learning from Audio and Visual Recurrence [13.3]
手動のアノテーションを不要にしながら、教師なしのビデオハイライト検出に重点を置いている。クラスタリング手法により、ビデオの擬似カテゴリを特定し、各ビデオの擬似ハイライトスコアを計算する。また、視覚的特徴を用いて、各ビデオの視覚的擬似ハイライトスコアも計算する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 23:09:14 GMT)
Language-Driven 6-DoF Grasp Detection Using Negative Prompt Guidance [13.2]
乱れ点雲における言語駆動型6-DoFグリップ検出のための新しい手法を提案する。提案した負のプロンプト戦略は、望ましくない物体から遠ざかりながら、検出プロセスを所望の物体に向ける。そこで本手法では,ロボットに自然言語で目的の物体を把握できるように指示するエンド・ツー・エンド・エンドのフレームワークを実現する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:24:51 GMT)
Improving the Accuracy of Transaction-Based Ponzi Detection on Ethereum [13.2]
昔ながらの詐欺であるPonziスキームが、ブロックチェーンで人気になった。ほとんどのPonzi検出方法は、そのスマートコントラクトソースコードに基づいてPonziスキームを検出する。我々は、マシンラーニングアルゴリズムが最大30%高いF1スコアを達成することができる85の新機能(22のアカウントベース、63の新しい時系列機能)を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:05:50 GMT)
Cabin: Confining Untrusted Programs within Confidential VMs [13.0]
機密コンピューティングは、信頼できないクラウドから機密性の高い計算を保護します。 CVMは大規模で脆弱なオペレーティングシステムカーネルを伴い、カーネルの弱点を悪用する攻撃を受けやすい。本研究では、最新のAMD SEV-SNP技術を利用したゲストVM内での独立した実行フレームワークであるCabinを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:37:07 GMT)
Mechanics-Informed Autoencoder Enables Automated Detection and Localization of Unforeseen Structural Damage [12.9]
MIDASは、構造物の損傷の自動検出と位置決めのための"deploy-and-forget"アプローチである。これは、安価なセンサー、データ圧縮、およびメカニックインフォームドオートエンコーダから完全に受動的に計測される相乗的な統合である。わずか3時間のデータから学んだMIDASは、さまざまな種類の予期せぬ損傷を自律的に検出し、ローカライズすることができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:29:37 GMT)
Memory-Efficient Fine-Tuning for Quantized Diffusion Model [12.9]
本稿では,量子化拡散モデルのためのメモリ効率の良い微調整手法であるTuneQDMを紹介する。提案手法は, 単目的/多目的の両方の世代において, ベースラインを一貫して上回る。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:38:17 GMT)
Layerwise complexity-matched learning yields an improved model of cortical area V2 [12.9]
ディープニューラルネットワークは、人間の能力にアプローチするオブジェクト認識のためのエンドツーエンドを訓練した。我々は,連続する層に独立して機能する自己指導型トレーニング手法を開発した。本モデルは, 霊長類領域V2における選択性特性と神経活動に適合していることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 23:41:24 GMT)
Lightweight Uncertainty Quantification with Simplex Semantic Segmentation for Terrain Traversability [12.8]
本稿では,任意の事前学習画像分割モデルに接続可能な,シンプルで軽量なモジュールを提案する。我々のモジュールは、それぞれのプロトタイプベクトルによるセグメント化クラスを最大限に分離することに基づいている。地形分割におけるモジュールの有効性を実証する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:00:49 GMT)
Enhancing Computation Efficiency in Large Language Models through Weight and Activation Quantization [12.7]
本稿では,Large Language Models(LLMs)における後学習量子化(PTQ)に焦点を当てる。本稿では,アクティベーション量子化対応スケーリング(AQAS)とシーケンス長対応キャリブレーション(SLAC)の2つの革新的な手法を提案する。我々の技術はタスクの精度を大幅に向上させ、完全精度モデルに匹敵するレベルまで向上することを示した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:35:17 GMT)
PICASSO: A Feed-Forward Framework for Parametric Inference of CAD Sketches via Rendering Self-Supervision [12.6]
CADスケッチを描画すると、提案フレームワークはCADソフトウェアにインポート可能なパラメトリックプリミティブに変換する。 PICASSOは、精密または手書きのスケッチ画像からパラメトリックCADスケッチの学習を可能にする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:02:52 GMT)
Revolutionizing Genomics with Reinforcement Learning Techniques [12.6]
強化学習(Reinforcement Learning, RL)は、幅広い問題を解決する強力なツールとして登場した。 RLアルゴリズムは、最小限の人間の監督で経験から学ぶことができる。 RLを使用する大きなメリットの1つは、ラベル付きトレーニングデータ収集に伴うコスト削減である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:29:50 GMT)
A Coarse-to-Fine Place Recognition Approach using Attention-guided Descriptors and Overlap Estimation [12.6]
位置認識のための新しい粗大なアプローチを提案する。粗い段階では、注意誘導ネットワークを用いて注意誘導記述子を生成する。次に、素早い親和性に基づく候補選択プロセスを用いて、Top-Kの最も類似した候補を特定する。細かな段階では、狭められた場所候補同士のペアの重複を推定し、最終一致を決定する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:12:57 GMT)
Attention Based Simple Primitives for Open World Compositional Zero-Shot Learning [12.6]
合成ゼロショット学習(CZSL)は属性とオブジェクトペアからなる未知の合成を予測することを目的としている。この研究では、私たちのテストスペースが属性とオブジェクトの潜在的な組み合わせをすべて包含するオープンワールド構成ゼロショット学習(OW-CZSL)を探求しています。提案手法では, 属性とオブジェクト間の自己認識機構を利用して, 目に見えるものから見えないものまで, より優れた一般化を実現する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:11:29 GMT)
Prover-Verifier Games improve legibility of LLM outputs [12.5]
小学校数学の問題を解く上での妥当性について検討する。本稿では,Anil et al の Prover-Verifier Game にヒントを得たトレーニングアルゴリズムを提案する。本研究は,解の正当性を検証することを目的とした,時間制約のある人間への正当性訓練の伝達を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:58:18 GMT)
Measuring Stochastic Data Complexity with Boltzmann Influence Functions [12.5]
テストポイントにおけるモデルの予測の不確かさを推定することは、分散シフトの下で信頼性とキャリブレーションを確保する重要な要素である。温度スケールボルツマンの影響関数でモデルを線形化するpNML分布のスケーラブルかつ効率的な近似であるIF-COMPを提案する。 IF-COMPは不確実性の校正、誤ラベル検出、OOD検出のタスクに対して実験により検証され、そこでは強いベースライン法と一貫した一致または打ち負かされる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:16:59 GMT)
Leveraging Near-Field Lighting for Monocular Depth Estimation from Endoscopy Videos [12.5]
内視鏡ビデオにおける単眼深度推定は、補助手術やロボット手術により、臓器のより良いカバレッジと様々な健康問題の検出が可能になる。主流の自然画像深度推定では有望な進歩があったが、内視鏡画像では技術が不十分であった。本稿では, 内視鏡から放射される光を表面から反射する光学的手がかりを用いて, 単分子深度推定を改善する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:27:38 GMT)
Low-Resourced Speech Recognition for Iu Mien Language via Weakly-Supervised Phoneme-based Multilingual Pre-training [12.5]
本研究は,10時間未満のIu Mien言語を用いて,Iu Mien音声認識における3つのアプローチについて検討・比較する。その結果,音素の監督はサブワードの監督や自己監督よりも優れた結果が得られることがわかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:46:47 GMT)
Graph Attention with Random Rewiring [12.4]
本稿では,3つのパラダイムの利点を組み合わせた新しいGNNアーキテクチャであるGraph-Rewiring Attention with Structures (GRASS)を紹介する。 GRASSは、ランダムな正規グラフを重畳して入力グラフをリワイヤし、長距離情報伝搬を強化する。また、グラフ構造化データに適したユニークな付加的なアテンション機構を採用し、計算効率を保ちながらグラフ帰納バイアスを提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:30:43 GMT)
CellularLint: A Systematic Approach to Identify Inconsistent Behavior in Cellular Network Specifications [12.4]
4G と 5G の標準内での不整合検出のための半自動フレームワークを導入する。提案手法は,ドメイン適応型大規模言語モデルに対して,改良された数ショット学習機構を用いる。調査では,Non-Access Stratum (NAS)と4Gおよび5Gネットワークのセキュリティ仕様に注目し,最終的に82.67%の精度で157の矛盾を発見した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:48:46 GMT)
AMUSE: Adaptive Multi-Segment Encoding for Dataset Watermarking [12.2]
透かし技術は、所有情報(すなわち透かし)を個々の画像サンプルに格納するために用いられる。透かし全体をすべてのサンプルに埋め込むと、埋め込まれた情報にかなりの冗長性が生じる。データセット透かしのためのマルチセグメント符号化復号法(AMUSE)を提案する。次に、デコーダを使用して、抽出したサブメッセージから元のメッセージを再構築する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:00:38 GMT)
FBChain: A Blockchain-based Federated Learning Model with Efficiency and Secure Communication [12.2]
本稿では、上記の2つの問題を克服するフェデレートラーニング(FBChain)モデルを提案する。まず、ブロックチェーンの不変性を利用して、ローカルモデルパラメータのグローバルモデルとハッシュ値を格納する。第二に、Proof of Weighted Link Speed (PoWLS)コンセンサスアルゴリズムは、より重み付きリンク速度の高いノードを包括的に選択し、グローバルモデルとパッケージブロックを集約する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:41:28 GMT)
Differentiated Federated Reinforcement Learning Based Traffic Offloading on Space-Air-Ground Integrated Networks [12.1]
本稿では,SAGINにおけるトラヒックオフロード問題を解決するために,DFRL(differated federated reinforcement learning)を用いることを提案する。 SAGINの各領域の異なる特性を考慮すると、DFRLはトラフィックオフロードポリシー最適化プロセスをモデル化する。本稿では,この問題を解決するために,新たな微分型フェデレート・ソフト・アクター・クリティカル (DFSAC) アルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:18:10 GMT)
AID-AppEAL: Automatic Image Dataset and Algorithm for Content Appeal Enhancement and Assessment Labeling [12.0]
Image Content Appeal Assessment (ICAA) は、画像のコンテンツが視聴者に対して生成する肯定的な関心のレベルを定量化する新しいメトリクスである。 ICAAは、画像の芸術的品質を判断する伝統的な画像美学評価(IAA)とは異なる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:51:31 GMT)
Towards Dynamic Feature Acquisition on Medical Time Series by Maximizing Conditional Mutual Information [11.9]
医療やウェアラブルにおいて、どの時系列を計測し、いつ測定するかを知ることが重要な課題だ。条件付き相互情報から着想を得て,下流損失のみを用いてエンド・ツー・エンドの学習者へのアプローチを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:54:34 GMT)
Baba Is AI: Break the Rules to Beat the Benchmark [11.8]
ババ・イズ・ユー(Baba Is You)というゲームに基づく新しいベンチマークを開発し、エージェントが環境とルールの両方を操作し、その上で単語が書かれた可動タイルで表現し、特定のゴールに到達してゲームに勝つ。我々は、最先端の3つの大規模言語モデル(OpenAI GPT-4o、Google Gemini-1.5-Pro、Gemini-1.5-Flash)を検証し、ゲームのルールを操作・組み合わせなければならない場合、それらが劇的に失敗することを発見した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:30:48 GMT)
Mixture of Experts based Multi-task Supervise Learning from Crowds [11.8]
本稿では,群衆からのマルチタスク指導型学習の新たなパラダイムを提案する。このパラダイム内では,Mixture of Experts をベースとしたマルチタスク監視学習(Multi-task Supervised Learning from Crowds)と呼ばれる,アイテム機能レベルでの作業行動モデルを提案する。 MMLCには2つの真理推論戦略が提案されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:21:31 GMT)
LLM Factoscope: Uncovering LLMs' Factual Discernment through Inner States Analysis [11.7]
大規模言語モデル(LLM)は、現実と異なる出力を生成する。この現象は特に、医療相談や法的な助言といった繊細な応用に関係している。本稿では,LCMの内部状態を実測に活用した,新しいシームズネットワークベースモデルであるLCMファクトスコープを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:41:50 GMT)
Phi-3 Safety Post-Training: Aligning Language Models with a "Break-Fix" Cycle [11.6]
スマートフォン上で動作可能な小型の高性能モデルを作成することが可能である。人間の嗜好や安全に配慮していることを保証することが重要である。本稿では,Phi-3シリーズの言語モデルの安全性向上のための手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:06:59 GMT)
Attention-based Class-Conditioned Alignment for Multi-Source Domain Adaptation of Object Detectors [11.6]
オブジェクト検出(OD)のドメイン適応手法は、ソースドメインとターゲットドメイン間の特徴調整を促進することによって、分散シフトの影響を軽減する。 ODのための最先端MSDA手法の多くは、クラスに依存しない方法で特徴アライメントを実行する。ドメイン間で各オブジェクトカテゴリのインスタンスをアライメントするMSDAのための注目型クラス条件アライメント手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:12:05 GMT)
Feature-Aware Noise Contrastive Learning for Unsupervised Red Panda Re-Identification [11.6]
教師なし学習ソリューションを探索するために,FANCL(Feature-Aware Noise Contrastive Learning)法を提案する。 FANCLは、重要な特徴を隠蔽するノイズ画像を生成し、損失を計算するために2つの対照的な学習モジュールを使用している。一組のレッドパンダ画像の実験結果から、FANCLはいくつかの関連する最先端の教師なし手法より優れていることが証明された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:00:44 GMT)
Krait: A Backdoor Attack Against Graph Prompt Tuning [11.5]
グラフプロンプトチューニングは、事前訓練されたモデルから下流タスクへグラフの知識を効果的に伝達する、有望なパラダイムとして登場した。このような脆弱性を調査するための最初の研究を行い、バックドアが良性グラフのプロンプトを偽装し、検出を回避できることを示した。本稿では,新しいグラフプロンプトであるKraitについて紹介する。具体的には,選択候補に準同型であるラベル非一様性という,単純で効果的なモデルに依存しない指標を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 00:25:49 GMT)
Self-Adapting Large Visual-Language Models to Edge Devices across Visual Modalities [11.5]
近年のVision-Language(VL)モデルの進歩は、エッジデバイスへの展開への関心を喚起している。 We introduced EdgeVL, a novel framework that seamlessly integrates dual-modality knowledge distillation and Quantization-aware contrastive learning。私たちの研究は、エッジデプロイメントに大規模なVLモデルを適応するための最初の体系的な取り組みであり、複数のデータセットで最大15.4%の精度向上と、最大93倍のモデルサイズ削減を示している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:13:41 GMT)
Unified-EGformer: Exposure Guided Lightweight Transformer for Mixed-Exposure Image Enhancement [11.3]
We introduce the Unified-Exposure Guided Transformer (Unified-EGformer) 提案手法は,局所的な画素レベルの精細化と,色補正のためのグローバルな精細化ブロックと画像ワイド調整を備えた,高度なトランスフォーマーアーキテクチャを基盤として構築されている。 U-EGformerは、メモリフットプリント(ピークメモリ)がわずか$1134 MB (0.1 Millionパラメータ)で、推論時間は95 ms (9.61倍)で、監視や自律ナビゲーションなどのリアルタイムアプリケーションでは実行可能な選択肢である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:18:43 GMT)
Charting the Landscape of Nefarious Uses of Generative Artificial Intelligence for Online Election Interference [11.3]
Generative Artificial Intelligence (GenAI) と Large Language Models (LLMs) は、特にオンライン選挙干渉の領域において大きなリスクをもたらす。本稿では、GenAIの悪用を探求し、ディープフェイク、ボットネット、偽情報キャンペーン、合成IDを通じて民主的プロセスを破壊できる可能性を明らかにする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:40:21 GMT)
Can dissipation induce a transition between many-body localized and thermal states? [11.2]
熱状態と多体局在(MBL)状態とを分離するエネルギーの多体移動エッジ(MBME)は、多体系において批判的だが議論を呼んでいる概念である。本研究では, 定常密度行列を計算し, 輸送挙動を解析することにより, 各種の結合散逸が多体系に与える影響について検討する。以上の結果から, 放散は熱状態とMBL状態の遷移を誘導し, MBMEの存在を実験的に決定する新たなアプローチをもたらすことが示唆された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:30:45 GMT)
EarthMarker: A Visual Prompt Learning Framework for Region-level and Point-level Remote Sensing Imagery Comprehension [11.1]
EarthMarkerという新しいビジュアルプロンプトモデルが提案されている。画像レベル、領域レベル、ポイントレベルRSの解釈に優れる。提案されたEarthMarkerの競争性能を実証するために実験が行われた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:35:00 GMT)
SpAtten: Efficient Sparse Attention Architecture with Cascade Token and Head Pruning [11.0]
本稿では,トークンの空白度,頭部の空白度,量子化の機会を利用して注意計算やメモリアクセスを減らす,効率的なアルゴリズムアーキテクチャの共同設計であるSpAttenを提案する。 30のベンチマークでの実験では、SpAttenはDRAMアクセスを10.0xの精度で削減し、1.6x, 3.0x, 162x, 347xのスピードアップと1,4x, 3.2x, 1193x, 4059xの省エネを実現している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:48:38 GMT)
Learning Goal-Conditioned Representations for Language Reward Models [10.9]
対照的な$textitgoal-conditioned$でトレーニング報酬モデル(RM)を提案する。 RM表現のこのトレーニング方法により、textitsteerability$が向上し、特定の目標状態を達成するアクションの可能性を評価することができる。さらに、これらの表現は、希望する将来の目標状態に条件付けすることで、きめ細かい制御を行うことができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:23:11 GMT)
Motion-Oriented Compositional Neural Radiance Fields for Monocular Dynamic Human Modeling [10.9]
本稿では,MoCo-NeRF(MoCo-NeRF)について述べる。 MoCo-NeRFはモノクロビデオのフリービューポイントレンダリングを実現するために設計されたフレームワークである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:44:16 GMT)
Event-Triggered Reinforcement Learning Based Joint Resource Allocation for Ultra-Reliable Low-Latency V2X Communications [10.9]
6G対応車載ネットワークは、安全クリティカルな情報をタイムリーに提供するための低遅延通信(URLLC)を確保するという課題に直面している。車両間通信システム(V2X)の従来のリソース割り当てスキームは、従来の復号法に基づくアルゴリズムに依存している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 23:55:07 GMT)
Data-driven Forecasting of Deep Learning Performance on GPUs [10.7]
NeuSightは、トレーニングと推論の両方のために、実際の実行を必要とせずに、見えないGPU上で、さまざまなディープラーニングモデルのパフォーマンスを予測するフレームワークである。 NeuSightは、単一のディープラーニングカーネル予測をタイルと呼ばれる小さなワーキングセットに分解し、GPU上で独立して実行される。 GPT3モデルのトレーニングとH100での推論の遅延を予測して、198%と19.7%から3.8%に減少する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:47:52 GMT)
Energy-Calibrated VAE with Test Time Free Lunch [10.7]
可変オートエンコーダ(VAE)の強化のための条件付きエネルギーベースモデル(EBM)を提案する。 VAEは、生成方向に生成されたサンプルの調整されたトレーニングが欠如しているため、しばしばぼやけた生成サンプルに悩まされる。我々は,EC-VAEの校正アイデアを変分学習と正規化フローに拡張し,ニューラルトランスポートとレンジヌル理論によるゼロショット画像復元にEC-VAEを適用した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:24:04 GMT)
FreeStyle: Free Lunch for Text-guided Style Transfer using Diffusion Models [10.6]
FreeStyleは、事前訓練された大きな拡散モデルに基づいて構築された革新的なスタイル転送手法である。本手法は,所望のスタイルのテキスト記述を通じてのみ,スタイルの転送を可能にする。トレーニングを必要とする最先端の手法と比較して、FreeStyleのアプローチでは、計算負荷を数千回削減しています。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:41:29 GMT)
E(n) Equivariant Topological Neural Networks [10.6]
グラフニューラルネットワークはペアインタラクションのモデリングに優れていますが、高階インタラクションや機能に柔軟に対応できません。トポロジカルディープラーニング(TDL)がこの問題に対処するための有望なツールとして最近登場した。本稿では, グラフ, ハイパーグラフ, 単純オブジェクト, パス, セルコンプレックス上で動作するE(n)-同変ネットワークであるETNNを紹介する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:35:54 GMT)
Not Just Change the Labels, Learn the Features: Watermarking Deep Neural Networks with Multi-View Data [10.6]
DNN内に効率よく透かしを埋め込むため,Multi-view dATa をベースとした新しい透かし手法 MAT を提案する。提案手法を様々なベンチマークで検証し,モデル抽出攻撃に対する防御効果を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:10:07 GMT)
Entropic uncertainty relations in Schwarzschild space-time [10.6]
多部系における任意の多可観測性に対する一般化エントロピー不確実性関係を提案する。シュワルツシルト時空の文脈における不確実性関係と量子コヒーレンスについて論じる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:26:21 GMT)
Explicit-NeRF-QA: A Quality Assessment Database for Explicit NeRF Model Compression [10.5]
我々は、NeRF圧縮研究の課題に対処するため、Explicit-NeRF-QAと呼ばれる新しいデータセットを構築した。 4つの典型的なNeRFモデルをトレーニングするために,22個の3Dオブジェクトを多様なジオメトリ,テクスチャ,材料複雑度で使用しています。実験室環境における主観的な実験を行い、21人の視聴者から主観的なスコアを収集する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:52:26 GMT)
Turning Generative Models Degenerate: The Power of Data Poisoning Attacks [10.4]
悪意のある俳優は、毒殺攻撃を通じてバックドアを導入し、望ましくないアウトプットを発生させることができる。本研究では,大規模言語モデルの微調整段階を標的とした多種多様な中毒技術について,PEFT(Efficient Fine-Tuning)法を用いて検討する。本研究は,PEFTによる微調整中にNLGタスクを標的とした毒殺攻撃を理解するための最初の体系的アプローチである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:52:35 GMT)
Pronunciation Assessment with Multi-modal Large Language Models [10.4]
大規模言語モデル(LLM)に基づくスコアリングシステムを提案する。音声エンコーダは、まず学習者の音声を文脈的特徴にマッピングする。アダプタ層は、これらの機能を潜在空間に埋め込まれたテキストに合わせるように変換する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:09:20 GMT)
Improving Malware Detection with Adversarial Domain Adaptation and Control Flow Graphs [10.4]
戦闘コンセプトの既存のソリューションは、アクティブラーニングを使用する。グラフニューラルネットワークを利用してマルウェア制御後のフローグラフの保持情報を学習する手法を提案する。提案手法は,バイナリ分類タスクにおける未知のマルウェアファミリーの予測と,マルチクラス環境でのドリフトされたマルウェアファミリーの予測において,大幅な向上を示すものである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:06:20 GMT)
Collective Variable Free Transition Path Sampling with Generative Flow Network [10.2]
我々は,集団変数(CV)に頼ることなく,生成フローネットワーク(GFlowNets)を用いて遷移経路のサンプルを作成することを提案する。本研究では, 目標分布と生成器の2乗対数比を最小化することにより, 遷移経路上での償却エネルギーベースサンプリングとして問題を再構築し, 神経バイアス電位を訓練する。 TPS-GFNと呼ばれる我々の手法は、従来のCVフリー機械学習手法よりも現実的で多様な遷移経路を生成する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:04:46 GMT)
QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead [10.1]
LLMをシリアル化するには、KVキャッシュにキーバリューの埋め込みを格納する必要があるため、かなりのメモリを必要とする。従来の量子化法は、量子化定数を保存する必要があるため、大きなメモリオーバーヘッドに直面している。ジョンソン-リンデンシュトラウス変換とサインビット量子化を組み合わせた新しい量子化手法であるQJLを導入する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:31:29 GMT)
Validity of the Lieb-Schultz-Mattis Theorem in Long-Range Interacting Systems [10.0]
リーブ・シュルツ・マティスの定理(LSM)に対する長距離相互作用の影響は未解決の問題である。長距離相互作用は、リドベルク原子、双極子量子ガス、極性分子、光学キャビティ、閉じ込められたイオンなどの実験プラットフォームでよく見られる。一次元の LSM 定理を長距離相互作用系に拡張し、LSM 定理が崩壊指数 $alpha > 2$ と指数関数的あるいはパワーローな二体相互作用に対して成り立つことを発見した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:44:47 GMT)
Characterizing and Understanding HGNN Training on GPUs [10.0]
ヘテロジニアスグラフニューラルネットワーク(HGNN)は、レコメンデーションシステムや医療分析など、多くの現実世界の領域で広く採用されている。 HGNNトレーニングの効率を高めるためには、トレーニングプロセス内の実行セマンティクスとパターンを特徴づけて分析し、パフォーマンスボトルネックを特定することが不可欠である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 00:50:49 GMT)
Continual Distillation Learning [9.9]
継続学習(CL)における知識蒸留(KD)を考慮した連続蒸留学習(CDL)の問題について検討する。教師モデルと学生モデルは一連の課題を学習し、生徒モデルを改善するために教師モデルに関する知識を学生に蒸留する。 CDL-Promptという新しい手法を導入し,教師-学生モデルの構築にアクセプティブベースの連続学習モデルを用いた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:52:57 GMT)
Per-Gaussian Embedding-Based Deformation for Deformable 3D Gaussian Splatting [9.9]
3D Gaussian Splatting (3DGS)は、高速で高品質な新規ビュー合成を提供する。標準的な3DGSを動的シーンを表現するために複数のフレームに変形させる自然な拡張である。以前の作品は複雑な動的シーンを正確に再構築することができなかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:08:29 GMT)
AI-Assisted SQL Authoring at Industry Scale [9.6]
SqlComposeは、生成AIを使用してデータ分析タスクを支援するツールである。これは宣言的であり、形式的なテーブルスキーマを持ち、しばしば非線形で書かれる、という課題に対処する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:33:39 GMT)
An Agile Adaptation Method for Multi-mode Vehicle Communication Networks [9.6]
意思決定プロセスと強化学習を適用して、アジャイル適応機構を確立する。 Q-learningは、アジャイル適応強化学習モデルをトレーニングし、トレーニングされたモデルを出力するために使用される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:04:34 GMT)
SpaDiT: Diffusion Transformer for Spatial Gene Expression Prediction using scRNA-seq [9.6]
SpaDiTは、検出されていない遺伝子の予測のために、scRNA-seqとSTデータを統合したディープラーニング手法である。本研究では,SpaDiTの有効性を,Seqベースおよび画像ベースSTデータの両方で広範な実験により実証した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:40:50 GMT)
Not All Frequencies Are Created Equal:Towards a Dynamic Fusion of Frequencies in Time-Series Forecasting [9.6]
時系列予測手法は、異なるシナリオに適用する場合、柔軟であるべきです。本稿では、各フーリエ成分を個別に予測し、異なる周波数の出力を動的に融合する周波数動的融合(FreDF)を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:27:25 GMT)
Higher-order Spatio-temporal Physics-incorporated Graph Neural Network for Multivariate Time Series Imputation [9.5]
欠落値は、複雑な潜時相関と時系列の動的性質のために必須だが難しい問題である。この問題に対処するために,高次時空間物理を組み込んだグラフニューラルネットワーク(HSPGNN)を提案する。 HSPGNNは従来のデータ駆動型モデルよりも優れた動的解析と説明を提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:29:44 GMT)
SERPENT-VLM : Self-Refining Radiology Report Generation Using Vision Language Models [9.4]
放射線学報告生成(R2Gen)は、マルチモーダル大言語モデル(MLLM)が正確で一貫性のある放射線学レポートの作成をいかに自動化できるかを示す。既存の方法は、しばしば画像内容を正確に反映しないテキストベースのレポートで詳細を幻覚させる。本稿では,自己修復機構をMLLMフレームワークに統合することにより,R2Genタスクを改善する新しい戦略を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:03:18 GMT)
PriPL-Tree: Accurate Range Query for Arbitrary Distribution under Local Differential Privacy [9.4]
階層木構造と断片線形関数を組み合わせた新しいデータ構造であるPriPL-Treeを紹介する。 PriPL-Treeは、いくつかの行セグメントで基礎となるデータ分散を正確にモデル化し、レンジクエリのより正確な結果をもたらす。新たなデータ対応アダプティブグリッドを用いた多次元ケースに拡張する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:05:35 GMT)
A data-flow oriented software architecture for heterogeneous marine data streams [9.3]
様々な公共団体が過去10年間に海底のデータを収集し、管理し、公開してきた。システムのエンジニアリングにおけるデータ品質の影響について、明確な理解はありません。本稿では,海洋データストリームの主設計決定とデータフロー指向コンポーネントとコネクタビューを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:40:19 GMT)
The Language of Infographics: Toward Understanding Conceptual Metaphor Use in Scientific Storytelling [9.3]
我々は概念メタファー(CMT)を可視化領域にマッピングし、科学インフォグラフィックでよく使われる視覚概念メタファーのパターンに対処する。本分析は, 概念翻訳において, 存在論的, 配向的概念的メタファーが最も広く応用されていることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:39:50 GMT)
Adaptive Correspondence Scoring for Unsupervised Medical Image Registration [9.3]
既存の手法では、画像再構成を主要な監視信号として用いている。そこで本研究では,学習中の誤り残差を対応スコアマップで再重み付けする適応フレームワークを提案する。我々のフレームワークは、量的にも質的にも、他の手法よりも一貫して優れています。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:26:42 GMT)
TXL-PBC: a freely accessible labeled peripheral blood cell dataset [9.2]
我々は、TXL-PBCと名付けた高品質でサンプルバランスのよい新しいデータセットを作成しました。データセットには、1008個の血液トレーニングセット、288個の血液トレーニングセット、144個のテストセットが含まれている。この研究は、血液細胞データセットの品質を高めるだけでなく、細胞標的細胞の検出モデルの改善にも研究者を支援している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:54:49 GMT)
Benchmarking Robust Self-Supervised Learning Across Diverse Downstream Tasks [9.2]
複数の下流タスクにまたがる自己監督型視覚エンコーダの対向ロバスト性に関する包括的実証評価を行った。我々の攻撃はエンコーダの埋め込みスペースと下流タスク出力レベルで動作する。基礎モデルの目的は一度に複数のアプリケーションに対応することであるため,より広範にエンコーダの堅牢性を高める必要性が明らかとなった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:55:33 GMT)
Hardware-Efficient Stabilization of Entanglement via Engineered Dissipation in Superconducting Circuits [9.2]
そこで,本研究では,メインストリームの超伝導量子回路で容易に実装可能な安定化プロトコルを提案し,実験的に実証する。このプロトコルは2キュービットのベル状態を90.7%の忠実度で安定化させ、固体プラットフォームで最も高い価値が報告されている。この戦略を3つの量子ビットを含むように拡張することにより、絡み合った$W$状態が86.2%の忠実度で達成されるが、これはこれまで実験的に研究されていない。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:21:58 GMT)
Synthetic Counterfactual Faces [9.1]
我々は、ターゲットとなる、対実的で高品質な合成顔データを構築するための生成AIフレームワークを構築します。私たちのパイプラインには、顔認識システム感度評価や画像理解システムプローブなど、多くのユースケースがあります。商用ビジョンモデルにおける顔生成パイプラインの有効性を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:22:49 GMT)
Mask2Map: Vectorized HD Map Construction Using Bird's Eye View Segmentation Masks [9.1]
本稿では,自動運転アプリケーション用に設計された,新しいエンドツーエンドのオンラインHDマップ構築手法であるMask2Mapを紹介する。このアプローチでは、シーン内のマップインスタンスのクラスと順序付けられたポイントセットを予測することに重点を置いています。 Mask2Mapは、従来の最先端メソッドよりも優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:48:52 GMT)
Improving Conversational Abilities of Quantized Large Language Models via Direct Preference Alignment [8.9]
量子化対応直接選好最適化(QDPO)は、量子化大言語モデル(LLM)の会話能力を改善する各種言語における2つの命令調整LDMにおいて,QDPOは,既存のPTQや知識蒸留細調整技術と比較して,会話能力の向上に優れた性能を示した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:21:23 GMT)
Fully Test-Time rPPG Estimation via Synthetic Signal-Guided Feature Learning [8.9]
多くのリモート光胸腺撮影(r)推定モデルは、トレーニング領域で有望なパフォーマンスを達成したが、テスト領域での生理的信号や心拍数(HR)の測定に失敗することが多い。 r推定問題では、適応モデルは通常、様々なドメイン情報を用いてターゲットデータを推定する課題に直面します。 Test Time-Time Adaptation (TTA)は、ソースデータを参照せずにラベルなしのターゲットデータにオンライン適応することで、さまざまな未確認領域のr信号を適応的に推定することを可能にする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:22:40 GMT)
MSPipe: Efficient Temporal GNN Training via Staleness-Aware Pipeline [8.9]
メモリベースの時間グラフニューラルネットワーク(MTGNN)は、ノードメモリモジュールを使用して長期の時間依存を捕捉し保持する時間グラフニューラルネットワークのクラスである。トレーニングパラダイム、モデルアーキテクチャ、メモリモジュールの欠如などにより、既存の静的GNNの最適化はMTGNNに直接適用できない。モデル精度を維持しながらトレーニングスループットを最大化するMTGNNのための汎用的で効率的なフレームワークであるMSPipeを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:26:40 GMT)
Underwater Acoustic Signal Denoising Algorithms: A Survey of the State-of-the-art [8.9]
この分野でかなりの進歩があったにもかかわらず、水中環境の複雑な性質は、デノナイジング過程を複雑にする固有の課題を生んでいる。まず, 水中音響信号処理に関する基本的な課題について概説し, 信号減衰, ノイズ変動, 環境要因の影響について概説する。このレビューは、従来の、分解ベース、学習ベースのテクニックなど、さまざまな分類アルゴリズムを体系的に分類し、議論し、それらの応用、利点、限界を強調している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:14:59 GMT)
EaDeblur-GS: Event assisted 3D Deblur Reconstruction with Gaussian Splatting [8.8]
ガウススプラッティング(EaDeblur-GS)を用いたイベント支援3次元デブロア再構成について述べる。イベントカメラデータを統合して、3DGSの動作のぼかしに対する堅牢性を高める。高速な3D再構成をリアルタイムで実現し、最先端の手法に匹敵する性能を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:55:54 GMT)
IDs for AI Systems [8.8]
本稿では,AIシステムのインスタンスにIDを付加するフレームワークを提案する。我々は、重要なアクターからのIDに対する大きな需要があるかもしれないと論じている。さらなる研究により、IDはAIシステムが社会に浸透する世界を管理するのに役立つかもしれない。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:54:20 GMT)
Conformalized Link Prediction on Graph Neural Networks [8.8]
グラフニューラルネットワーク(GNN)は様々なタスクに優れていますが、高い領域でのその応用は信頼性の低い予測によって妨げられます。本稿では,GNNに基づくリンク予測の統計的保証を伴う予測区間を構築するために,分布自由かつモデルに依存しない不確実性定量化手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:06:38 GMT)
Research on Image Super-Resolution Reconstruction Mechanism based on Convolutional Neural Network [8.7]
超解像アルゴリズムは、同一シーンから撮影された1つ以上の低解像度画像を高解像度画像に変換する。再構成過程における画像の特徴抽出と非線形マッピング手法は,既存のアルゴリズムでは依然として困難である。目的は、高解像度の画像から高品質で高解像度の画像を復元することである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:50:39 GMT)
Distributionally and Adversarially Robust Logistic Regression via Intersecting Wasserstein Balls [8.7]
実証的なリスク最小化は、テストデータにおける敵攻撃に対して堅牢性を提供するのに失敗することが多い。補助的データセットを利用することで,この問題の保守性を低下させる枠組みを開発する。本稿では,提案手法が実世界のデータセットのベンチマーク手法より一貫して優れていることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:59:37 GMT)
Real-Time 3D Occupancy Prediction via Geometric-Semantic Disentanglement [8.6]
運転予測は自律運転(AD)において重要な役割を担っている既存の手法はしばしば高い計算コストを発生させるが、これはADのリアルタイム要求と矛盾する。ハイブリッドBEV-Voxel表現を用いた幾何学的意味的デュアルブランチネットワーク(GSDBN)を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:46:13 GMT)
Evaluating Large Language Models for Anxiety and Depression Classification using Counseling and Psychotherapy Transcripts [8.5]
トランスモデルの確立と,機能工学によるサポートベクトルマシンの訓練を行った。従来の機械学習手法と比較して,最先端のモデルでは分類結果の強化に失敗する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:26:09 GMT)
Multi-Objective Neural Architecture Search by Learning Search Space Partitions [8.5]
ニューラルアーキテクチャ探索(NAS)タスクにLaMOOと呼ばれる新しいメタアルゴリズムを実装した。 LaMOOは、観測されたサンプルからモデルを学び、検索空間を分割し、将来性のある領域に集中することによって、検索プロセスを高速化する。現実世界のタスクでは、LaMOOの精度は97.36%、CIFAR10の#Paramsはわずか600のサンプルで1.62万である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:53:35 GMT)
Universal framework for simultaneous tomography of quantum states and SPAM noise [8.4]
本稿では,量子状態と測定ノイズの同時トモグラフィーを行うアルゴリズムを提案する。本手法は、ユニタリ演算によって誘導される線形作用素空間の特性の解析に基づく。一般の場合、このゲージ自由度は避けられないが、状態やノイズ特性に関する事前の知識を用いて、この縮退性を破ることができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:21:53 GMT)
CE-NAS: An End-to-End Carbon-Efficient Neural Architecture Search Framework [8.3]
本研究は,モデル設計プロセスにおける炭素効率の向上を目的とした,ニューラルアーキテクチャ探索(NAS)に対する新しいアプローチを提案する。提案したフレームワークCE-NASは、NASアルゴリズムのエネルギーの炭素放出変化とエネルギー差を探索することにより、NASに関連する高炭素コストの鍵となる課題に対処する。 NASタスクとオープンドメインNASタスクのSOTA結果を達成しつつ, CE-NASの炭素排出量低減効果を実証した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:44:44 GMT)
Probabilistic Image-Driven Traffic Modeling via Remote Sensing [8.2]
都市交通モデルの構築に使用できるマルチモーダル・マルチタスクトランスフォーマーに基づくセグメンテーションアーキテクチャを提案する。そこで我々は,Dynamic Traffic Speedsベンチマークデータセットを用いて提案手法を広範囲に評価し,現状を著しく改善した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:35:23 GMT)
Fermi-Bose Machine achieves both generalization and adversarial robustness [8.2]
意味的に意味のある表現学習を提案し,同じラベルを持つ入力の表現を隠蔽層に縮小し,異なるラベルの表現を退避させる(フェルミオンに限る)。この階層的な学習は自然界において局所的であり、生物学的に妥当である。この局所的コントラスト学習をMNISTベンチマークデータセットに適用することにより、標準パーセプトロンの敵的脆弱性を大幅に軽減できることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:55:46 GMT)
Policy Optimization for Personalized Interventions in Behavioral Health [8.1]
デジタルプラットフォームを通じて提供される行動的健康介入は、健康結果を大幅に改善する可能性がある。患者に対するパーソナライズされた介入を最適化して長期的効果を最大化する問題について検討した。患者システムの状態空間を個別のレベルに分解するDecompPIをダブする新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:34:33 GMT)
A Comparative Study on Automatic Coding of Medical Letters with Explainability [7.8]
本研究では,NLP(Natural Language Processing)と機械学習(ML)による医療用文字の自動符号化の実現について検討する。利用可能なMIMIC-IIIデータベースとHAN/HLANネットワークモデルをICDコード予測のために使用した。実験では、97.98%のコードに対して有用な情報を提供した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:12:47 GMT)
Barycentric bounds on the error exponents of quantum hypothesis exclusion [7.8]
量子状態排除の最適誤差確率を情報理論の観点から検討する。我々は分析を、量子チャネル排除のより複雑なタスクにまで拡張する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:27:36 GMT)
LiNR: Model Based Neural Retrieval on GPUs at LinkedIn [7.8]
LiNRはLinkedInの大規模GPUベースの検索システムである。大規模なインデックスに対して,フルスキャンと効率的なフィルタリングを取り入れたシステム拡張について述べる。我々は、LiNRが業界初のLive-updated model-based search indexの1つであると考えている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:04:33 GMT)
Should we be going MAD? A Look at Multi-Agent Debate Strategies for LLMs [7.7]
コスト、時間、正確性の間のトレードオフを探るため、さまざまな議論と戦略をベンチマークします。マルチエージェントの議論システムは、現在の形式では、他の提案されたプロンプト戦略を確実に上回っているわけではない。これらの結果に基づいて、エージェント合意レベルの調整など、議論戦略の改善に関する洞察を提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:18:14 GMT)
Integrated Hardware Architecture and Device Placement Search [7.6]
ディープラーニングトレーニングの分散実行には、ハードウェアアクセラレータアーキテクチャとデバイス配置戦略との動的相互作用が含まれる。これは、最適なアーキテクチャとデバイス配置戦略を決定するための協調最適化を探求する最初の試みである。提案手法は,最先端のTPUv4とSpotlightアクセラレーター検索フレームワークと比較して,大規模言語モデルにおいて高いスループットを実現する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:02:35 GMT)
SA-DVAE: Improving Zero-Shot Skeleton-Based Action Recognition by Disentangled Variational Autoencoders [7.6]
本稿では,分散変分オートエンコーダを用いたSA-DVAE-セマンティックアライメントを提案する。このアイデアは,一対のモダリティ特異的変分オートエンコーダと全補正ペナルティによって実現される。実験の結果,SA-DAVEは既存手法よりも性能が向上していることがわかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:35:46 GMT)
HPPP: Halpern-type Preconditioned Proximal Point Algorithms and Applications to Image Restoration [7.6]
Preconditioned Proximal Point (PPP)アルゴリズムは、画像復元におけるメソッド分割のための統一的なフレームワークを提供する。 PPPアルゴリズムは典型的には無限次元収束において退化し、不確実な解をもたらす。本稿では,Halpern型HPPPアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:58:06 GMT)
SWinGS: Sliding Windows for Dynamic 3D Gaussian Splatting [7.6]
我々は動的シーンを再構築するために3次元ガウススプラッティングを拡張した。我々は、競争力のある定量的性能を持つ一般的な動的シーンの高品質なレンダリングを作成する。我々の手法は動的インタラクティブなビューアでリアルタイムで見ることができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:18:51 GMT)
Dynamic Dimension Wrapping (DDW) Algorithm: A Novel Approach for Efficient Cross-Dimensional Search in Dynamic Multidimensional Spaces [7.4]
本研究では,新しい最適化アルゴリズム-動的次元ラッピング(DDW)アルゴリズムを提案する。 DDWは優れた探索効率を示し、実際の最適解に最も近い検索結果を提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:41:40 GMT)
Reducing Barriers to the Use of Marginalised Music Genres in AI [7.1]
このプロジェクトの目的は、AIモデルで疎外された音楽のジャンルを使用する際の障壁を減らすことに関連する、eXplainable AI(XAI)の課題と機会を探ることである。特定されたXAIの機会には、AIモデルの透明性とコントロールの改善、AIモデルの倫理とバイアスの説明、バイアスを減らすために小さなデータセットで大規模モデルの微調整、AIモデルによるスタイル移行の機会の説明などが含まれる。私たちは現在、グローバルなInternational Responsible AI Musicコミュニティをまとめて、私たちのネットワークへの参加を招待するために、このプロジェクトを構築しています。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:10:04 GMT)
Beyond Words: On Large Language Models Actionability in Mission-Critical Risk Analysis [7.1]
リスク分析の原則はコンテキストレスです。リスク分析には、国内外の規制や基準に関する膨大な知識が必要である。大規模な言語モデルは、人間よりも少ない時間で情報を素早く要約することができ、特定のタスクに微調整することができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:21:10 GMT)
Fusion of Movement and Naive Predictions for Point Forecasting in Univariate Random Walks [6.9]
本研究では, 動作予測(バイナリ分類)を, 正確な1ステップ先進予測のためのナイーブ予測と融合させる新しい手法を提案する。 0.55のような中程度の運動予測精度で、ナイーブ予測を確実に上回る。この方法は、正確な点予測が難しいが正確な運動予測が可能である場合に特に有利である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:19:49 GMT)
Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models [6.8]
我々は,変換器モデルによる前方及び後方信号のモーメントを管理する統一信号伝搬理論を開発し,公式を提供する。我々のフレームワークは、ハイアテンションスコアに関連する、消失/爆発の勾配、ランク崩壊、不安定性を理解し、緩和するために使用することができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:59:35 GMT)
Correlation inference attacks against machine learning models [6.8]
モデルが入力変数間の相関関係に関する情報を漏らすかどうか, 相関推論攻撃について検討する。私たちの結果は、モデルが何をし、トレーニングセットから覚えるべきかについて、根本的な疑問を投げかけます。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:02:56 GMT)
Enhancing Training Efficiency Using Packing with Flash Attention [6.7]
Hugging Face SFTトレーナーは、最大シーケンス長までの複数のトレーニング例を組み合わせるためにパッキングを使用するオプションを提供する。私たちは、各例の適切な注意マスクで、パッキングとFlashアテンションを有効化し、分析し、このトレーニングパラダイムの利点を示します。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:09:32 GMT)
DISCOVER: A Data-driven Interactive System for Comprehensive Observation, Visualization, and ExploRation of Human Behaviour [6.7]
我々は,人間行動分析のための計算駆動型データ探索を効率化するために,モジュール型でフレキシブルでユーザフレンドリなソフトウェアフレームワークを導入する。我々の主な目的は、高度な計算方法論へのアクセスを民主化することであり、これにより研究者は、広範囲の技術的熟練を必要とせずに、詳細な行動分析を行うことができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:28:52 GMT)
SCAPE: A Simple and Strong Category-Agnostic Pose Estimator [6.7]
Category-Agnostic Pose Estimation (CAPE) は、任意のカテゴリのオブジェクトにキーポイントをローカライズすることを目的としている。本稿では,グローバルな意味情報をキーポイントに注入するグローバルなキーポイント機能パーセプタと,キーポイント間のノード間相関を強化するキーポイントアテンションリファクタという2つのキーモジュールを紹介する。 SCAPEは1ショットと5ショット設定で2.2と1.3PCKで先行技術より優れ、推論速度が速く、モデルキャパシティも軽い。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:02:57 GMT)
Private Mean Estimation with Person-Level Differential Privacy [6.6]
複数のサンプルを持つ場合の個人レベルの個人別平均推定について検討した。特に、独立、ベクトル値、有界なモーメント変数の和の尾辺に関する我々の新しい境界は興味を持つかもしれない。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:22:29 GMT)
Performance Comparison of Session-based Recommendation Algorithms based on GNNs [6.6]
セッションベースのレコメンデーション設定では、リコメンダシステムは長期的なユーザプロファイルにアクセスできない。本稿では,GNNをベースとした8つの手法の評価結果について報告する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:02:16 GMT)
IPA-NeRF: Illusory Poisoning Attack Against Neural Radiance Fields [6.6]
Illusory Poisoning Attack against Neural Radiance Fields (IPA-NeRF)について紹介する。この攻撃では、隠れたバックドアビューをNeRFに埋め込み、所定の出力を生成する。我々の攻撃は、特定の位置でユーザーや下流のモデルを騙し、NeRFの異常が他の視点では検出できないことを確実にするように設計されています。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:10:19 GMT)
Retrieve, Summarize, Plan: Advancing Multi-hop Question Answering with an Iterative Approach [6.5]
二重機能要約器を備えたReSPと呼ばれる新しい反復RAG法を提案する。マルチホップ質問応答HotpotQAと2WikiMultihopQAの実験結果から,本手法が最先端技術よりも優れていることが示された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:19:00 GMT)
Conformal Performance Range Prediction for Segmentation Output Quality Control [6.5]
提案手法は,ユーザの特定確率に基底真理を含ませることの統計的保証を伴って,性能範囲を予測する新しい手法である。 FIVES網膜血管セグメンテーションデータセットへのアプローチを実証し、5つの一般的なサンプリングベース不確実性推定手法を比較した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:10:25 GMT)
PLANTS: A Novel Problem and Dataset for Summarization of Planning-Like (PL) Tasks [6.4]
我々は,新しい計画要約問題を導入し,データセットを提示し,PL要約を生成するベースライン手法を提供する。我々は、この新たな問題とデータセットが要約の研究を再活性化できると信じており、これは解決された問題であると考える者もいる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:36:02 GMT)
Mapping the Empirical Evidence of the GDPR (In-)Effectiveness: A Systematic Review [6.4]
経験的証拠の質素な体が生成されているが、広く散在し、検討されていない。そこで我々は,30年近くにわたる実証研究の総合的なレビューと合成を行う。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:53:58 GMT)
DFMSD: Dual Feature Masking Stage-wise Knowledge Distillation for Object Detection [6.4]
DFMSDと呼ばれる新しい二重特徴マスキングヘテロジニアス蒸留フレームワークがオブジェクト検出のために提案されている。マスキング強化戦略とステージワイズ学習を組み合わせて特徴マスキング再構築を改善する。オブジェクト検出タスクの実験は、我々のアプローチの可能性を実証する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:19:14 GMT)
Transformers with Stochastic Competition for Tabular Data Modelling [6.3]
本稿では,表型データに特化して設計された新しいディープラーニングモデルを提案する。このモデルは、広く使用されており、公開されているさまざまなデータセットで検証されている。これらの要素を組み込むことで、我々のモデルは高い性能が得られることを実証する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:48:48 GMT)
Beyond Dropout: Robust Convolutional Neural Networks Based on Local Feature Masking [6.2]
本研究では、畳み込みニューラルネットワーク(CNN)の性能向上を目的とした、革新的なローカル特徴マスキング(LFM)戦略を紹介する。トレーニング期間中、我々はCNNの浅い層にランダムな特徴マスキングを戦略的に組み込む。 LFMは、ある意味的特徴の欠如を補うために残りの特徴を活用することで、ネットワークを補完する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:25:16 GMT)
Quantum Natural Stochastic Pairwise Coordinate Descent [6.2]
近年,変分量子アルゴリズム(VQA)による量子機械学習が注目されている。本稿では,2QNSCD最適化法を提案する。ゲート複雑性を持つ量子回路をパラメータ化量子回路と単発量子計測の2倍の精度で用いた,新しい計量テンソルの疎い非バイアス推定器を開発した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:57:29 GMT)
LIMT: Language-Informed Multi-Task Visual World Models [6.1]
マルチタスク強化学習は、サンプルの複雑さの増加と、潜在的に矛盾するタスクの目的のため、非常に難しい。本稿では,事前学習した言語モデルを利用して意味のあるタスク表現を抽出し,マルチタスクのビジュアルワールドモデルを学習する手法を提案する。本結果は,世界モデルにおける言語駆動型タスク表現の利点と,より一般的なモデル自由パラダイムに対するモデルベースマルチタスク学習の明確な利点を強調した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:40:58 GMT)
Resilient Consensus Sustained Collaboratively [6.1]
初期のブロックチェーンプラットフォームは、Proof-of-Work(PoW)コンセンサスプロトコルに基づいて、台帳に追加すべきものを決定する。最近のブロックチェーンは、Proof-of-Stake(PoS)とMalicious Fault-Tolerant(MFT)コンセンサスプロトコルを通じてPoWを置き換えることを目指している。本稿では,既存のPoSおよびMFTブロックチェーンを長距離攻撃から保護する新しいPower-of-Collaborationプロトコルの設計を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:57:05 GMT)
Long Input Sequence Network for Long Time Series Forecasting [6.0]
短時間の固定長入力は、長い時系列予測タスクにおけるディープラーニング手法の主なボトルネックである。我々は,新しいシリーズ分解モジュール(MPSD)とマルチトークンパターン認識ニューラルネットワーク(MTPR)を導入する。トークンのサイズは、モデルがフォーカスするスケールとそれに対応するコンテキストサイズを決定するため、主にモデルの振る舞いを規定する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:43:12 GMT)
Training-Free Model Merging for Multi-target Domain Adaptation [6.0]
シーン理解モデルのマルチターゲット領域適応について検討する。私たちのソリューションはモデルパラメータのマージとモデルバッファのマージという2つのコンポーネントで構成されています。我々の手法は単純だが有効であり、データ組み合わせトレーニングベースラインと同等の性能を達成できる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:59:57 GMT)
Predictive Low Rank Matrix Learning under Partial Observations: Mixed-Projection ADMM [5.9]
低階仮定の下で部分的に観察された行列を学習する問題について検討する。この問題は、レコメンデーションシステム、信号処理、システム識別、画像デノイングといった応用で発生する。我々のアルゴリズムは、$n = 10000$行と$m = 10000$列を1分以内で解くことができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:33:14 GMT)
CoAPT: Context Attribute words for Prompt Tuning [5.8]
少数/ゼロショット画像分類のための新しいプロンプトチューニング手法であるCoAPTを提案する。中心となる動機は、属性は特定の概念に関する豊富な情報を持つ記述的な単語であるということである。 CoAPTは単語を学習可能なプロンプトチューニングに追加のプロンプトとして統合し、既存の様々なプロンプトチューニング手法に簡単に組み込むことができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:58:01 GMT)
PASTA: Controllable Part-Aware Shape Generation with Autoregressive Transformers [5.7]
PASTAは、高品質な3D形状を生成する自動回帰トランスフォーマーアーキテクチャである。我々のモデルは、既存のパートベースおよび非パートベース手法よりも現実的で多様な3D形状を生成する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:52:45 GMT)
Precision bounds for quantum phase estimation using two-mode squeezed Gaussian states [5.6]
2モードの圧縮真空状態が最適入力であり、対応する精度境界がハイゼンベルク極限よりも2。我々の研究は、実用的な量子力学への重要な、そして有望なステップを示すかもしれない。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:01:19 GMT)
A Comprehensive Review of Recommender Systems: Transitioning from Theory to Practice [5.6]
Recommender Systems(RS)は、パーソナライズされたアイテムの提案を提供することで、ユーザーエクスペリエンスを高める上で重要な役割を果たす。この調査は、2017年から2024年までのRSの進歩を包括的にレビューする。それは、eコマース、ヘルスケア、金融など、さまざまな分野の課題に対処する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:00:53 GMT)
With or Without Replacement? Improving Confidence in Fourier Imaging [5.5]
標準LASSOの性能を向上した重み付き再構成手法が, サンプリングと交換なしの遷移によってどのようにして実現されるかを示す。本稿では、この再加重サンプリングのアイデアが、デバイアス推定器をいかに改善するかを説明する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:15:19 GMT)
PARMESAN: Parameter-Free Memory Search and Transduction for Dense Prediction Tasks [5.5]
この研究は、トランスダクティブ推論によるディープラーニングの柔軟性に対処する。我々は,高密度予測タスクを解くためにメモリモジュールを活用するスケーラブルな手法であるPARMESANを提案する。提案手法は,一般的なアーキテクチャと互換性があり,標準で1D,2D,3Dグリッドベースのデータに転送する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:32:51 GMT)
MCU-Wide Timing Side Channels and Their Detection [5.5]
マイクロアーキテクチャーのタイミング側チャネルは、セキュリティの脅威として徹底的に研究されている。最近の活動は、このような特徴を持たないマイクロコントローラでも、この脅威は本物であることを示している。このギャップを埋めるための新しい形式的手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:06:00 GMT)
Pose-guided multi-task video transformer for driver action recognition [5.4]
本稿では,邪魔された動作とドライバのポーズの両方を予測するマルチタスクビデオトランスフォーマーを提案する。提案手法は,現行のビデオトランスフォーマーを用いた手法に比べて,運転者の行動認識に優れた効率性を示しながら,既存の最先端技術よりも優れている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:53:51 GMT)
Non-Asymptotic Uncertainty Quantification in High-Dimensional Learning [5.3]
不確かさの定量化は多くの高次元回帰や学習問題において決定的だが難しい課題である。我々は、古典的回帰アプローチとニューラルネットワークの両方に適用可能な、回帰におけるUQのための新しいデータ駆動アプローチを開発した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:42:10 GMT)
High-Dimensional Confidence Regions in Sparse MRI [5.3]
MRIの圧縮センシングのような医療画像の応用では、測定システムは複雑なフーリエ行列で表される。本研究の目的は,MR画像の各画素に対する信頼区間を構築するために,この手法をMRIケースに拡張することである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:18:02 GMT)
Fixed and Adaptive Simultaneous Machine Translation Strategies Using Adapters [5.3]
機械翻訳は、全入力を消費する前に翻訳を開始することで、リアルタイム翻訳の課題を解決することを目的としている。 wait-$k$ポリシーは、$k$ワードを消費した後、翻訳を開始することでソリューションを提供する。本稿では,複数のレイテンシレベルを満たす1つのモデルを構築するという課題に対処する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:42:45 GMT)
Enhancing Quantum Machine Learning: The Power of Non-Linear Optical Reproducing Kernels [5.3]
KerrカーネルはデータをKerrコヒーレント状態の位相と振幅にエンコードする。本稿では,Kerrコヒーレント状態を用いた特徴空間を提案する。月から乳がん診断まで,さまざまなデータセットを分析した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:23:22 GMT)
Transformer-based Single-Cell Language Model: A Survey [5.2]
変換器の構造と原理について詳述する。本稿では,単一セルデータ解析のための単一セル言語モデルと大規模言語モデルについて概説する。単一セル言語モデルの課題を論じ,将来性のある研究方向性を提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:43:12 GMT)
EvaluateXAI: A Framework to Evaluate the Reliability and Consistency of Rule-based XAI Techniques for Software Analytics Tasks [5.2]
PyExplainerとLIMEは、ソフトウェア分析タスクにおけるMLモデルの予測を説明するために使用されている。本稿では,これらの手法がMLモデルの信頼性と一貫した説明を生成する能力を評価する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:09:28 GMT)
CycleMix: Mixing Source Domains for Domain Generalization in Style-Dependent Data [5.1]
画像分類の場合、アルゴリズムが一般化に失敗する理由の1つは、トレーニングデータに存在する急激な相関に依存することである。これらの関連性は、目に見えないテストデータには存在せず、その効果が著しく低下する。本研究では,この領域一般化問題を,画像スタイルに起因する特徴を無視する頑健な特徴抽出器を訓練することにより緩和する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:43:26 GMT)
Dynamic Pricing in Securities Lending Market: Application in Revenue Optimization for an Agent Lender Portfolio [5.0]
証券貸出市場では,既存の文脈的バンディットの枠組みをうまく活用できることが示されている。我々は、文脈的バンディットアプローチが、生成した総収益の少なくとも15%以上の典型的なアプローチを一貫して上回ることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:42:37 GMT)
Exploring AI-enhanced Shared Control for an Assistive Robotic Arm [5.0]
特に,アートインテリジェンス(AI)を共有制御パラダイムに統合する方法について検討する。特に,人間とロボットのインターフェースの簡潔な要件に着目した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:25:08 GMT)
New Capability to Look Up an ASL Sign from a Video Example [5.0]
ASL符号のビデオの検索を可能にするために,Web上で公開された新しいシステムについて述べる。ユーザは分析のためにビデオを提出し、最も可能性の高い5つのサインマッチが提示される。このビデオ検索は、ASLビデオデータの言語アノテーションを容易にするために、最新のSignStreamソフトウェアに統合されています。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:14:35 GMT)
LeOCLR: Leveraging Original Images for Contrastive Learning of Visual Representations [4.7]
本稿では,新しいインスタンス識別手法と適応型損失関数を用いた表現学習における意味的特徴の解消を目的としたフレームワークであるLeOCLRを紹介する。我々のアプローチは、ベースラインモデルと比較して、異なるデータセット間の表現学習を一貫して改善します。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:55:51 GMT)
Deep Functional Factor Models: Forecasting High-Dimensional Functional Time Series via Bayesian Nonparametric Factorization [4.6]
ディープ・ファンクショナル・ファクター・モデル (DF2M) は、高次元関数時系列解析のために設計されたベイズ非パラメトリック・モデルである。 DF2Mは、ファクタモデルを構築し、カーネル関数にディープニューラルネットワークを統合することで、ニューラルネットワークを活用するための説明可能なアプローチを提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 23:01:50 GMT)
GDDS: A Single Domain Generalized Defect Detection Frame of Open World Scenario using Gather and Distribute Domain-shift Suppression Network [4.6]
我々はGDDS(Gather and Distribute Domain shift Suppression Network)を提案する。ベースラインネットワークとしてワンステージネットワークを使用すると、検出精度と速度のバランスをとる。 GDDSは、オープンワールドシナリオにおける欠陥検出に、他の最先端の方法よりも速く、より良く適応することができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:40:43 GMT)
MLSA4Rec: Mamba Combined with Low-Rank Decomposed Self-Attention for Sequential Recommendation [4.6]
本稿では,新しいハイブリッドレコメンデーションフレームワークであるMambaとLow-Rank Self-Attention for Sequential Recommendation (MLSA4Rec)を提案する。 MLSA4Recは、MambaとLSAモジュールによって洗練されたユーザの好み情報を組み合わせて、ユーザの次のインタラクションを正確に予測する。実験結果から,MLSA4Recは実世界の3つのデータセットの推薦精度において,既存の自己注意モデルとMambaベースのシーケンシャルレコメンデーションモデルよりも優れていた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:46:21 GMT)
CoDefeater: Using LLMs To Find Defeaters in Assurance Cases [4.4]
本稿では,大言語モデル (LLM) を利用して敗者を見つける自動化プロセスであるCoDefeaterを提案する。 2つのシステムの最初の結果は、LLMが安全アナリストを支援するために、既知の、予期せぬ破壊者を効率的に見つけることができることを示している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:16:35 GMT)
Geometry and Local Recovery of Global Minima of Two-layer Neural Networks at Overparameterization [4.4]
大域ミニマ付近の2層ニューラルネットワークにおける損失景観の幾何学について検討する。一般化誤差ゼロの大域的ミニマが、サンプルサイズが大きくなるにつれて、他の大域的ミニマと幾何的に分離されるかを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:09:59 GMT)
Enhancing Worldwide Image Geolocation by Ensembling Satellite-Based Ground-Level Attribute Predictors [4.4]
本稿では,推定位置分布の精度を計測する新しい指標であるリコール対エリア(RvA)を紹介する。 RvAは、文書検索と同様の画像位置情報を扱い、リコールを領域の関数として測定する。次に、複数のソースからの情報を組み込んでドメインシフトに対処する、グローバルな画像位置情報に対する単純なアンサンブルアプローチについて検討する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:15:52 GMT)
URCDM: Ultra-Resolution Image Synthesis in Histopathology [4.4]
Ultra-Resolution Cascaded Diffusion Models (URCDMs) は、すべての病理像を高分解能で合成することができる。本手法は脳,乳腺,腎臓の組織からなる3つの異なるデータセットを用いて評価した。 URCDMは、訓練された評価器が実際の画像と区別できない様々な解像度の出力を一貫して生成する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:31:55 GMT)
Certifying ground-state properties of quantum many-body systems [4.4]
我々は、基底状態にある観測可能な値の証明可能な境界を導出する方法を示す。我々は、考慮されたシステムの対称性と疎性を利用して、数百の粒子の大きさに達する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:57:38 GMT)
Capturing Style in Author and Document Representation [4.3]
著者と文書の埋め込みをスタイリスティックな制約で学習する新しいアーキテクチャを提案する。本稿では,Gutenbergプロジェクトから抽出した文芸コーパス,Blog Authorship,IMDb62の3つのデータセットについて評価を行った。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:01:09 GMT)
MVSBoost: An Efficient Point Cloud-based 3D Reconstruction [4.3]
拡張現実や仮想現実、医用画像、映画特殊効果など、様々な応用において、効率的で正確な3D再構成が不可欠である。従来のMulti-View Stereo (MVS) システムはこれらのアプリケーションには基本的だが、暗黙の3次元シーンモデリングは複雑なトポロジや連続面を扱う新しい可能性をもたらした。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:34:10 GMT)
Learning quantum phases via single-qubit disentanglement [4.3]
本稿では、強化学習最適化変分量子回路による解離を利用した、新しい、効率的な量子位相遷移を提案する。提案手法は, 分離回路の性能に基づく位相遷移を同定するだけでなく, 拡張性にも優れ, より大規模で複雑な量子システムへの応用が促進される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:16:16 GMT)
Discussion: Effective and Interpretable Outcome Prediction by Training Sparse Mixtures of Linear Experts [4.2]
我々は,ゲートと専門家のサブネットの両方がロジスティック回帰器である,スパースミクチャー・オブ・エキスパートを訓練することを提案する。このアンサンブルのようなモデルは、各サブネット内の入力機能のサブセットを自動的に選択しながら、エンドツーエンドで訓練される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:59:10 GMT)
COMCAT: Leveraging Human Judgment to Improve Automatic Documentation and Summarization [4.1]
COMCATは、専門知識のあるコンテキストで大規模言語モデルを拡張することで、コメント生成を自動化するアプローチである。 C/C++ファイルにコメントを付けるためのCOMCATパイプラインを開発し、(1)コメントを配置する適切な場所を自動的に識別し、(2)各場所について最も有用なタイプのコメントを予測し、(3)選択した場所とコメントタイプに基づいてコメントを生成する。被験者の87%に対して,COMCATが生成したコメントは,3つの指示的ソフトウェアエンジニアリングタスクにおける開発者のコード理解を最大12%向上させることを示した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:26:31 GMT)
Mean Teacher based SSL Framework for Indoor Localization Using Wi-Fi RSSI Fingerprinting [4.1]
Wi-Fiフィンガープリントは、Wi-Fiデバイスの普及により、屋内のローカライズに広く応用されている。従来の手法はスケーラビリティの問題のため、マルチビルドやマルチフロア環境には適していない。本稿では,無線アクセスポイント選択,ノイズ注入,平均教師モデルに基づくニューラルネットワークのための新しい半教師付き学習フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:07:20 GMT)
SpeciaLex: A Benchmark for In-Context Specialized Lexicon Learning [4.1]
SpeciaLexは、特殊レキシコンベースの制約に従う言語モデルの能力を評価するためのベンチマークである。オープンおよびクローズドソース LLM の実証評価を行った。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:56:02 GMT)
Network Traffic Analysis of Medical Devices [4.1]
本研究では,医療機器8台の交通特性を,デバイスレベルでも,デバイスの個々の機能レベルでも詳細に分析する。分析には、プロトコル、入出力トラフィックの量、DNSクエリ、トラフィック宛先の分析など、さまざまなメトリクスが含まれている。医療機器用のネットワークツールの開発に有用な,ユニークなネットワーク特性とBluetoothトラヒック特性が得られた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:57:13 GMT)
From A-to-Z Review of Clustering Validation Indices [4.1]
我々は、最も一般的なクラスタリングアルゴリズムを用いて、内部および外部クラスタリング検証指標の性能をレビューし、評価する。内部クラスタリング検証と外部クラスタリング検証の両方の機能を調べるための分類フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:52:02 GMT)
Automated and Holistic Co-design of Neural Networks and ASICs for Enabling In-Pixel Intelligence [4.1]
放射能検出のための可読ASICなどの極端エッジAIシステムは、厳密なハードウェア制約の下で動作しなければならない。理想的なソリューションを見つけることは、爆発的に拡張されたデザイン空間から最適なAIとASIC設計の選択を特定することを意味する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:58:05 GMT)
Optimistic Q-learning for average reward and episodic reinforcement learning [4.0]
平均報酬強化学習における後悔最小化のための楽観的なQ-ラーニングアルゴリズムを提案する。我々の設定は、エピソジックな設定を厳密に一般化し、有界打撃時間の仮定よりも著しく制限的でない。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:49:09 GMT)
Latent Causal Probing: A Formal Perspective on Probing with Causal Models of Data [4.0]
構造因果モデル(SCM)を用いた探索の形式的視点を開発する。我々は,合成グリッドワールドナビゲーションタスクの文脈において,最近のLMの研究を拡張した。本手法は,LMがテキストの根底にある因果的概念を学習できることを示す,堅牢な実証的証拠を提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:59:27 GMT)
CoxSE: Exploring the Potential of Self-Explaining Neural Networks with Cox Proportional Hazards Model for Survival Analysis [4.0]
生存分析のための自己説明型ニューラルネットワーク(SENN)の可能性を探る。我々は,局所線形対数ハザード関数を推定することにより,局所的に説明可能なCox比例ハザードモデル(CoxSE)を提案する。また,生成した説明の安定性と一貫性を制御できるSENN(CoxSENAM)を併用したニューラル加算モデル(NAM)の修正も提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:32:54 GMT)
Avoiding strict saddle points of nonconvex regularized problems [3.9]
第二項最適性条件は定常点の零点にのみ依存することを示す。本稿では,反復再重み付き$ell_1$を含む2つの繰り返し重み付きアルゴリズムを提案する。これらのアルゴリズムは、サドル点の性質が仮定されるときのみランダムに局所的なサドラーに収束することを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:59:47 GMT)
Search Engines, LLMs or Both? Evaluating Information Seeking Strategies for Answering Health Questions [3.9]
我々は,異なるWeb検索エンジン,LLM(Large Language Models)およびRAG(Research-augmented)アプローチを比較した。健康問題に対処する可能性のあるウェブページの品質は、ランキングを下方へ下るにつれて低下しない。評価の結果, Web エンジンは健康問題に対する正しい回答を見つける上で LLM よりも精度が低いことがわかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:11:09 GMT)
Hierarchical Stage-Wise Training of Linked Deep Neural Networks for Multi-Building and Multi-Floor Indoor Localization Based on Wi-Fi RSSI Fingerprinting [3.9]
本稿では,ニューラルネットワークを用いた大規模マルチビルディングとマルチフロア屋内ローカライゼーションの課題に対する新しい解を提案する。階層的なステージワイドトレーニングフレームワークは、もともとのステージワイドトレーニングフレームワークを、複数のリンクネットワークの場合に拡張する。提案したトレーニングフレームワークは、3次元の局所化誤差を11.78mから8.71mに著しく低減することができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:43:26 GMT)
Graph Expansions of Deep Neural Networks and their Universal Scaling Limits [3.8]
ニューラルネットワークのスケーリング限界を得るための統一的なアプローチを提案する。ランダム行列理論の属拡大手法を用いる。我々はジャコビアンの極限特異値分布のモーメントの公式を求める。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:33:35 GMT)
Learning-From-Mistakes Prompting for Indigenous Language Translation [3.8]
本稿では,低リソースの母国語翻訳を改善する手法を提案する。我々のアプローチは、限られた数の並列翻訳例からなるデータストアの使用に基礎を置いています。我々は、LLMをユニバーサルトランスレータとして使用するような設定において、LLMと文脈内学習技術のポテンシャルを利用する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:41:20 GMT)
General Vision Encoder Features as Guidance in Medical Image Registration [3.8]
医用画像登録における異種度指標において,一般的な視覚エンコーダの特徴がどの程度有効かを検討する。心血管MRIデータに関する広範な実験では、従来の指標の付加的なガイダンスとして機能を使用することで、登録品質が向上することが判明した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:13:34 GMT)
Blood Glucose Control Via Pre-trained Counterfactual Invertible Neural Networks [3.7]
対実的可逆ニューラルネットワーク(CINN)に基づくイントロスペクティブ強化学習(RL)を提案する。事前学習したCINNをRLエージェントのフリーズイントロスペクティブブロックとして使用し、フォワード予測と反ファクト推論を統合してポリシー更新を誘導する。本稿では,BG予測における事前学習CINNの精度と一般化能力を実験的に検証した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:54:04 GMT)
Waveflow: boundary-conditioned normalizing flows applied to fermionic wavefunctions [3.7]
本稿では,境界条件付き正規化フローを用いたフェルミオン波動関数の学習フレームワークであるWaveflowを紹介する。本研究では,ウェーブフローがトポロジ的ミスマッチを効果的に解決し,基底状態の波動関数を忠実に学習できることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:57:51 GMT)
Parameter Generation of Quantum Approximate Optimization Algorithm with Diffusion Model [3.7]
量子コンピューティングは確率最適化の分野に革命をもたらす可能性がある。本稿では,ハイブリッド量子古典アルゴリズムであるQuantum Approximate Optimization Algorithm (QAOA)を提案する。拡散モデルでは, 高い性能パラメータの分布を学習し, 最適パラメータに近い新しいパラメータを合成できることが示される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:19:55 GMT)
Decoherence without einselection [3.7]
電子選択は, 装置の非平衡力学から生じるアーティファクトであることを示す。本稿では,行列積分 (SMI) と呼ばれる,演算子ドレッシングの新しい形式法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:58:22 GMT)
Cross-Task Attack: A Self-Supervision Generative Framework Based on Attention Shift [3.6]
自己教師型クロスタスクアタックフレームワーク(CTA)を提案する。 CTAは、サンプルの注意領域をコアテンションマップから、アンチアテンションマップに近づけることで、クロスタスク摂動を生成する。本研究では,複数の視覚課題に対する広範囲な実験を行い,提案手法の有効性を検証した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:01:10 GMT)
Quantum Key Distribution Routing Protocol in Quantum Networks: Overview and Challenges [3.5]
本稿では,量子鍵分布の文脈で確立されたルーティング設計手法を活用する可能性について検討する。これらの手法の実装は、量子メモリのデコヒーレンス、キーレート生成、遅延遅延、量子システム固有のノイズ、限られた通信範囲、高度に専門化されたハードウェアの必要性など、重大な課題を提起する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:46:32 GMT)
Fast Scrambling at the Boundary [3.4]
カオス上の量子境界を飽和させる多体系は、幅広い分野の関心を集めている。非Fermi-Liquid物理を示す量子不純物モデルにおける多体量子カオスについて検討する。この結果は, 境界における強い相関関係と量子カオスの分数化により, 最大カオスとなる非秩序モデルという2つの新しい特徴を浮き彫りにしている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:55:44 GMT)
Werewolf Arena: A Case Study in LLM Evaluation via Social Deduction [3.4]
Werewolf Arenaは大規模言語モデル(LLM)を評価するためのフレームワークであるウェアウルフ・アリーナでは、LSMは互いに競い合っており、ゲームにおける詐欺、妄想、説得の複雑なダイナミクスをナビゲートしている。 Werewolf Arenaの実用性をGeminiとGPTモデルを備えたアリーナスタイルのトーナメントで実証する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 23:41:05 GMT)
Scalable Spatiotemporal Prediction with Bayesian Neural Fields [3.3]
BayesNFは、高容量関数推定のための新しいディープニューラルネットワークアーキテクチャである。気候および公衆衛生データセットからの統計的機械学習予測問題に対してベイズNFを評価した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:58:42 GMT)
Beyond Augmentation: Empowering Model Robustness under Extreme Capture Environments [3.3]
コンピュータビジョンにおける人物の再識別は、異なるカメラにまたがる個人を認識し追跡することを目的としている。様々な照明、カメラスタイル、角度、画像歪みを含む極端な条件は、データの分布と再ID精度に大きな影響を及ぼす可能性がある。極端条件下でのモデルのロバスト性を改善するために,マルチモード同期学習(MMSL)戦略を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:18:58 GMT)
Deterministic Trajectory Optimization through Probabilistic Optimal Control [3.3]
離散時間決定論的有限水平非線形最適制御問題に対する2つの新しいアルゴリズムを提案する。どちらのアルゴリズムも確率論的最適制御として知られる新しい理論パラダイムにインスパイアされている。このアルゴリズムの適用により、決定論的最適ポリシーに収束する確率的ポリシーの定点が得られることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:17:47 GMT)
Preset-Voice Matching for Privacy Regulated Speech-to-Speech Translation Systems [3.2]
この研究は、Preset-Voice Matching (PVM)と呼ばれる規制付きS2STフレームワークを提案する。 PVMは、まず入力音声と、ターゲット言語における類似の同意話者音声とをマッチングすることにより、S2STにおける言語間音声のクローニングを除去する。 PVMはマルチスピーカ環境下でのS2STシステム実行時間を大幅に改善できることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:42:01 GMT)
ANHALTEN: Cross-Lingual Transfer for German Token-Level Reference-Free Hallucination Detection [3.1]
本稿では、英語の幻覚検出データセットをドイツ語に拡張するデータセットであるANHALTENを紹介する。これはトークンレベルの参照なし幻覚検出のための言語間移動を探求する最初の研究である。サンプル効率の低い小ショット転送は,ほとんどの設定において最も効果的な手法であることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:01:38 GMT)
Unsupervised Domain Adaptive Lane Detection via Contextual Contrast and Aggregation [3.1]
既存の車線検出方法は、列車検出モデルに画素単位のクロスエントロピー損失を利用する。ドメイン間の知識伝達に不可欠なドメイン間コンテキスト依存性は、既存のレーン検出手法では探索されていない。本稿では,コンテキストコントラスト・アグリゲーション(DACCA)を用いた領域適応車線検出手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:29:02 GMT)
VeriQR: A Robustness Verification Tool for Quantum Machine Learning Models [3.0]
適応ノイズ攻撃は量子機械学習(QML)モデルに重大な脅威をもたらす。 textitVeriQRは,QMLモデルの堅牢性を形式的に検証し,改善する目的で設計された,最初のツールである。 textitVeriQRは、局所的およびグローバルな堅牢性検証のための正確な(音と完全)アルゴリズムをサポートする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:06:02 GMT)
Semantic Prototypes: Enhancing Transparency Without Black Boxes [3.0]
プロトタイプは、データに不可欠な特徴をカプセル化することによって、戦術的な意思決定を可能にし、透明性を高める洞察を提供する。伝統的なプロトタイプの手法は、しばしば準記号的な生データと不透明な潜伏空間に依存し、説明可能性の低減と誤解釈のリスクの増大を図っている。本稿では, セマンティック記述を用いてプロトタイプを定義し, 明確な説明を行う新しいフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:42:58 GMT)
Perturbation-based Non-perturbative Method [3.0]
本稿では固有確率を解くための非摂動的手法を提案する。これはほとんど全てのポテンシャルに適用され、あらゆるエネルギー準位に対する非摂動近似を与える。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:22:19 GMT)
Random covariant quantum channels [3.0]
量子チャネルに固有の群対称性は、しばしばそれらを引き付けることができる。共変量子チャネルに対する自然確率分布を導入する。正部分転位および絡み合い破壊特性のしきい値現象について検討する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:33:05 GMT)
Beyond Incompatibility: Trade-offs between Mutually Exclusive Fairness Criteria in Machine Learning and Law [3.0]
本稿では,3つのフェアネス基準を連続的に補間する新しいアルゴリズム(FAir Interpolation Method: FAIM)を提案する。我々は,合成データ,CompASデータセット,電子商取引部門による新たな実世界のデータセットに適用した場合のアルゴリズムの有効性を実証する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:49:55 GMT)
Accurate Mapping of RNNs on Neuromorphic Hardware with Adaptive Spiking Neurons [2.9]
我々は、SigmaDelta$-low-pass RNN(lpRNN)を、レートベースのRNNをスパイクニューラルネットワーク(SNN)にマッピングするために提示する。適応スパイキングニューロンモデルは、$SigmaDelta$-modulationを使って信号を符号化し、正確なマッピングを可能にする。我々は、Intelのニューロモルフィック研究チップLoihiにおけるlpRNNの実装を実演する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:06:07 GMT)
Reporting Risks in AI-based Assistive Technology Research: A Systematic Review [2.9]
視覚障害者のためのAIベースの支援技術に関する研究について,系統的な文献レビューを行った。本研究は, 実証可能なプロトタイプを用いたほとんどの技術が, 観光コミュニティのメンバーによる人間による研究では評価されていないことを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:28:33 GMT)
Reporting Risks in AI-based Assistive Technology Research: A Systematic Review [2.9]
視覚障害者のためのAIベースの支援技術に関する研究について,系統的な文献レビューを行った。本研究は, 実証可能なプロトタイプを用いたほとんどの技術が, 観光コミュニティのメンバーによる人間による研究では評価されていないことを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:28:33 GMT)
Quantum State Preparation via Free Binary Decision Diagram [2.9]
我々は、量子状態の古典的な記述が重み付きエッジを持つFBDDによって与えられるとき、QSPのための量子アルゴリズムを構築する。重み付きFBDDで表される任意の量子状態が、$O(N)$サイズの量子回路で作成可能であることを示す。また、$n=O(mathrmpoly(n))$ node, $O(n2)$ ancillary qubitsで重み付けされたFBDDで表現できる$n$-qubit状態の例を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:00:58 GMT)
AlcLaM: Arabic Dialectal Language Model [2.8]
ソーシャルメディアプラットフォームから収集した340万文からなるアラビア語方言コーパスを構築した。我々はこのコーパスを用いて語彙を拡大し、BERTベースのモデルをスクラッチから再訓練する。 AlcLaMという名前の私たちのモデルは、既存のモデルで使われているデータのごく一部を表す、わずか13GBのテキストで訓練された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:13:50 GMT)
Who Wins Ethereum Block Building Auctions and Why? [2.8]
MEV-Boostブロックオークションは全ブロックの約90%に貢献する。 2023年10月から2024年3月までの間に、3人の建設業者だけが80%を生産した。ビルダーがブロックを獲得して利益を得る能力において重要な役割を果たす特徴を特定します。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:49:37 GMT)
NODER: Image Sequence Regression Based on Neural Ordinary Differential Equations [2.7]
本稿では,ニューラル常微分方程式を利用して複雑な基礎となる力学を捉える,NODERという最適化に基づく新しいフレームワークを提案する。本モデルでは,特に臨床状況において,予測のために数枚の画像のみを必要とする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:50:46 GMT)
AI-Driven Guided Response for Security Operation Centers with Microsoft Copilot for Security [2.7]
Copilot Guided Response (CGR)は、業界規模のMLアーキテクチャで、セキュリティアナリストを3つの重要なタスクにガイドする。 CGRはMicrosoft Defender XDR製品に統合され、世界中でデプロイされ、数百万のレコメンデーションを生成する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 00:18:19 GMT)
EnergyDiff: Universal Time-Series Energy Data Generation using Diffusion Models [2.7]
高解像度時系列データはエネルギーシステムの運用と計画に不可欠である。データ収集コストとプライバシー上の懸念のため、そのようなデータはダウンストリームタスクでは利用できないか、あるいは不十分であることが多い。本稿では,エネルギー時系列データのための汎用データ生成フレームワークであるEnergyDiffを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:10:50 GMT)
Generative AI Augmented Induction-based Formal Verification [2.7]
生成人工知能(GenAI)は、人間の労力を大幅に削減する現在の世界でその能力を実証している。本稿では,GenAIがインダクションベースの形式検証でどのように使用できるかを示し,検証スループットを向上する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:36:41 GMT)
A review of handcrafted and deep radiomics in neurological diseases: transitioning from oncology to clinical neuroimaging [2.7]
ラジオミクス(Radiomics)は、画像データから定量的な情報を抽出する手法である。本稿では,臨床から見た放射線パイプラインについて概説する。神経画像診断における手技と深部放射線の応用について論じる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:12:07 GMT)
Crafting Efficient Fine-Tuning Strategies for Large Language Models [2.6]
200サンプル未満の細調整された大型言語モデル(LLM)は、製品属性抽出タスクにおいて、モデル精度を70%から88%に向上させることができる。トレーニング時間全体の20%のモデルを評価するベイズハイパーパラメータ最適化法は,最終的なモデル性能と強く相関する。このアプローチにより、独立したテストセットで評価すると、ベースラインモデルよりも精度が2%向上した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:36:00 GMT)
Data Alchemy: Mitigating Cross-Site Model Variability Through Test Time Data Calibration [2.6]
Data Alchemyは、テンプレート学習フレームワークによるテスト時間データキャリブレーションと組み合わせて、説明可能な染色正規化手法である。我々のフレームワークは、最小限の運用オーバーヘッドで精密医療を普及させることができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:03:59 GMT)
Multi-stage tomography based on eigenanalysis for high-dimensional dense unitary quantum processes [2.6]
量子プロセストモグラフィー (Quantum Process Tomography, QPT) は、量子過程を推定する手法である。我々は、孤立系に対応する一元的、おそらく密度の高いプロセス(すなわち、疎性制約のないプロセス)を考える。まず, 2段階法を提案し, 検討された状態空間次元とともに段数が増加する2段階法に拡張する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:18:23 GMT)
Spiking mode-based neural networks [2.6]
スパイキングニューラルネットワークは、脳のようなニューロモルフィック計算や神経回路の動作機構の研究において重要な役割を果たす。大規模なスパイクニューラルネットワークのトレーニングの欠点のひとつは、すべての重みを更新することは非常に高価であることだ。本稿では,3つの行列のホップフィールド的乗算として繰り返し重み行列を記述したスパイキングモードベースのトレーニングプロトコルを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:49:07 GMT)
Case-based reasoning approach for diagnostic screening of children with developmental delays [2.5]
年間7500件(発生遅延が疑われる)の疑わしい症例が中国安芸省白兵衛で発生していると推定されている。発達遅滞児の介入の最適期間は6歳未満であることが国際研究で示されている。本研究では,CNN-Transformerモデルとケースベース推論(CBR)を組み合わせたハイブリッドモデルを用いて,発達遅滞児のスクリーニング効率を向上させる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:28:52 GMT)
CCSRP: Robust Pruning of Spiking Neural Networks through Cooperative Coevolution [2.5]
スパイキングニューラルネットワーク(SNN)は、様々な動的視覚タスクにおいて有望であることを示しているが、現実的なデプロイメントの準備が整ったものは、リソース制限と安全クリティカルな設定に不可欠なコンパクト性と堅牢性を欠いていることが多い。我々は,協調的共進化を基盤としたSNNの革新的な頑健な刈り取り法であるCSRPを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:28:16 GMT)
Sortability of Time Series Data [2.5]
自己相関型定常時系列のデータセットにおいても、変数可能性などのデータセットの特定の特性が生じることを示す。最も驚くべき発見は、調査対象の現実世界のデータセットが高いバラエティと低いR2$ソータビリティを示していることです。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:15:39 GMT)
Using LLMs to Automate Threat Intelligence Analysis Workflows in Security Operation Centers [2.5]
このプロジェクトの目的は、CTIレポートの分析に関わる労働集約的な反復的なタスクを置き換えるAIエージェントの開発である。 LLM(例えばGPT-4)の革命的能力を利用するが、人間の介入は不要である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:42:42 GMT)
QuIIL at T3 challenge: Towards Automation in Life-Saving Intervention Procedures from First-Person View [2.4]
そこで我々は,Trauma THOMPSON (T3) Challengeにおける省力化介入手順における,多種多様な自動化タスクに対する解決策を提案する。動作認識と予測のために,複数の入力を1つの画像にサンプリング・縫合する前処理戦略を提案する。トレーニングのために,アクション辞書誘導型設計を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:55:26 GMT)
Reimagining Communities through Transnational Bengali Decolonial Discourse with YouTube Content Creators [2.4]
本研究は,ビデオによるデコロナール談話への人々のモチベーションと戦略を理解することを目的としている。本稿では,オンライン・デコロニアル・談話の社会物質性の可能性について論じる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:41:39 GMT)
Efficient Image Denoising by Low-Rank Singular Vector Approximations of Geodesics' Gramian Matrix [2.3]
画像の騒音汚染は、人々の間で準標準的期待をもたらす。画像のデノイングは、必要不可欠な前処理ステップです。本稿では,測地学のグラミアン行列の特異ベクトルを主に利用した多様体に基づくノイズフィルタリング法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:42:44 GMT)
Exploring the Evidence-Based Beliefs and Behaviors of LLM-Based Programming Assistants [2.3]
本研究では,大規模言語モデル(LLM)がソフトウェア開発タスクを支援するために使用する信念と行動について検討する。以上の結果から,LCMをベースとしたプログラミングアシスタントは,研究のクレームに関する曖昧な信念を持ち,回答を裏付ける信頼性のある証拠が欠如しており,実証的なSE研究による開発作業支援の実践は不可能であることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:06:39 GMT)
Long-Term 3D Point Tracking By Cost Volume Fusion [2.3]
テストタイムの微調整を必要とせず,新たなポイントやビデオに一般化する3Dの長期追跡のための,最初のディープラーニングフレームワークを提案する。モデルでは,複数過去の外観と動き情報をトランスフォーマーアーキテクチャで統合し,全体的なトラッキング性能を大幅に向上させる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:34:47 GMT)
SecureVAX: A Blockchain-Enabled Secure Vaccine Passport System [2.3]
ワクチンのパスポートは、パンデミックの間歩き回っている間、パスポート保有者により大きな自由を提供するドキュメンタリーの証拠として機能する。デジタルワクチンパスポートシステムで直面する主な課題は、パスポート偽造、不正なデータアクセス、ワクチンセンターが入力した不正確な情報である。我々のソリューションは、オフチェーンとオンチェーンの暗号計算を統合し、さまざまなエンティティ間のセキュアな通信を容易にする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:45:43 GMT)
PetFace: A Large-Scale Dataset and Benchmark for Animal Identification [2.3]
動物顔識別のための包括的リソースであるPetFaceデータセットを紹介する。 PetFaceには、13の動物科の257,484個体と、実験動物とペット動物の両方を含む319種の品種が含まれている。我々は、見知らぬ個人に対する再識別や、見つからない個人に対する検証を含むベンチマークを提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:28:31 GMT)
Shaded Route Planning Using Active Segmentation and Identification of Satellite Images [2.2]
脆弱なグループ、特に日光を浴びた歩道の歩行者やサイクリストは、ルート計画手法の開発を動機付けている。本稿では,衛星画像から日陰領域を抽出するセグメンテーション基礎モデルを用いたパイプラインを初めて導入する。これらのエリアは多層道路マップに統合され、ユーザーは距離と日陰の露出のバランスに基づいてルートをカスタマイズできる。このシステムは、すでにオンラインで実装されており、デモビデオが公開されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:57:11 GMT)
Training Foundation Models as Data Compression: On Information, Model Weights and Copyright Law [2.2]
本稿では,モデルの重みがトレーニングデータの圧縮表現を具現化する,トレーニング・アズ・圧縮の視点を紹介する。本稿では,基礎モデルによるアウトプットの著作権侵害から生じる技術的・法的課題について考察する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:23:16 GMT)
Data-Driven Estimation of Conditional Expectations, Application to Optimal Stopping and Reinforcement Learning [2.2]
所望の条件予測を直接推定する,単純で純粋にデータ駆動の手法を提案する。条件付き予測は、対応する最適解を用いた多くの最適化問題の記述に現れるため、データ駆動方式も適用範囲を広げる。強化学習における最適停止・最適行動政策に適用して方法論を検証した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:57:30 GMT)
The Files are in the Computer: On Copyright, Memorization, and Generative AI [2.1]
ニューヨーク・タイムズのOpenAIとマイクロソフトに対する著作権訴訟は、OpenAIのGPTモデルがNYTの記事を「記憶している」と主張している。これらの議論は「記憶」の性質に関する曖昧さによって曇っている。我々は、記憶の正確な定義を提供するために、技術的な文献を描きます。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:41:58 GMT)
CIC: Circular Image Compression [2.1]
閉ループ符号化とデコード要素を用いた円形画像圧縮(CIC)手法を提案する。提案したCICは非線形ループ方程式を確立し、再構成された画像と元の画像の定常誤差がタラー級数展開によってゼロに近いことを証明した。 5つの公開画像圧縮データセットの実験結果から、提案したCICは、復元能力において、最先端のSICアルゴリズムと競合する5つのオープンソースアルゴリズムより優れていることが示された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:53:51 GMT)
Configural processing as an optimized strategy for robust object recognition in neural networks [2.1]
構成的キューによるオブジェクトの処理は、局所的な工芸的キューと比較して、より堅牢な認識手段を提供することを示す。本研究は,タスクの緊急度に基づいて,構成処理がナレーションネットワークに現れるという神経計算的証拠を提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:39:14 GMT)
Deep Neural Crossover [2.0]
我々は、Deep Neural Crossover'(DNC)と呼ばれる、遺伝的アルゴリズム(GA)における新しいマルチペアクロスオーバー演算子を提案する。親遺伝子をランダムに選別する従来のGAクロスオーバー演算子とは異なり、DNCは深層強化学習(DRL)とエンコーダ・デコーダアーキテクチャ(encoder-decoder architecture)の能力を利用して遺伝子を選択する。 DNCはドメイン非依存であり、他の問題領域にも容易に適用できる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:11:44 GMT)
How to quantify an examination? Evidence from physics examinations via complex networks [1.9]
試験のナレッジポイントネットワーク(KPN)は、ナレッジポイント(概念、法律等)をノードとして表現し、これらのポイントが同じ質問に現れるとリンクを追加することにより構成される。構築されたKPNは、ほとんどの場合、強いアソシティと小さな世界効果を示すスケールフリーネットワークであることが判明した。 KPN内のコミュニティは明らかであり、キーノードは主に力学と電磁磁気に関係している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:06:18 GMT)
Scalable Optimization for Locally Relevant Geo-Location Privacy [1.9]
位置プライバシー保護機構(LPPM)としての地球難読化機能この技術は,サーバ側データ漏洩時のユーザの位置情報のプライバシを保護する。そこで我々は, LP を用いたジオ・オブファシケーションのための新しい LPPM である Locally Relevant Geo-obfuscation (LR-Geo) を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:25:08 GMT)
Predicting Star Scientists in the Field of Artificial Intelligence: A Machine Learning Approach [1.8]
本研究では、機械学習技術を用いて、人工知能の分野におけるスター科学者の予測モデルを提案する。上昇する星は、ほとんど全ての初期の特徴において、降着しない恒星と比べて異なるパターンを辿っていることがわかりました。ジェンダーと民族の多様性は科学的コラボレーションにおいて重要な役割を担い、著者のキャリアの発展と成功に大きな影響を与える。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:50:18 GMT)
No More Sliding-Windows: Dynamic Functional Connectivity Based On Random Convolutions Without Learning [1.8]
本稿では,動的機能接続(DFC)の計算手法であるRandConを提案する。 RandConは、学習することなくBOLD信号上で直接畳み込み操作を行い、機能的な接続機能を抽出する。実データから、この手法は、短時間のウィンドウ内で安定性を維持し、男女差をよりよく識別することを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:32:16 GMT)
Quantum Local Search for Traveling Salesman Problem with Path-Slicing Strategy [1.8]
我々は,トラベリングセールスマン問題(TSP)の解を最適化するために,量子局所探索と統合された新しいパススライシング戦略を提案する。我々は、TSPを管理可能なサブプロブレムに分割するために、k平均とアンチk平均クラスタリングを含む様々なパススライシング手法を探索する。これらは量子や古典的な解法を用いて解かれる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:55:01 GMT)
Simulating Noisy Variational Quantum Algorithms: A Polynomial Approach [1.8]
大規模変動量子アルゴリズムは量子優位性を達成するための潜在的な経路として広く認識されている。本稿では,可観測物のバックプロパゲーションの積分経路に基づく新しい$gammaPPP法を提案する。我々は,IBMの127量子ビットイーグルプロセッサにおけるゼロノード化実験結果の古典的シミュレーションを行う。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:54:20 GMT)
Why do you cite? An investigation on citation intents and decision-making classification processes [1.8]
本研究は,引用意図を信頼して分類することの重要性を強調する。本稿では,citation Intent Classification (CIC) のための高度なアンサンブル戦略を用いた研究について述べる。我々のモデルの1つは、SciCiteベンチマークで89.46%のマクロF1スコアを持つ新しい最先端(SOTA)として設定されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:29:33 GMT)
Injecting Hierarchical Biological Priors into Graph Neural Networks for Flow Cytometry Prediction [1.8]
本研究では、単一セルのマルチクラス分類のためのグラフニューラルネットワーク(GNN)に階層的な事前知識を注入することを検討する。本稿では,複数のGNNモデル,すなわちFCHC-GNNに適用可能な階層的なプラグイン手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:55:32 GMT)
A call for embodied AI [1.8]
我々は、人工知能の次の基本ステップとして、エンボディードAIを提案する。 Embodied AIの範囲を広げることで、認知アーキテクチャに基づく理論的枠組みを導入する。このフレームワークはFristonのアクティブな推論原則と一致しており、EAI開発に対する包括的なアプローチを提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:06:13 GMT)
Minimum tracking linear response Hubbard and Hund corrected Density Functional Theory in CP2K [1.7]
本稿では,CP2K スイートにおける Hubbard (U$) および Hund (J$) 補正密度汎関数理論 (DFT+$U$+J$) 機能の実装について述べる。また,最近提案された最小追従線形応答法の実装について述べる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:09:01 GMT)
Evaluating and Enhancing Trustworthiness of LLMs in Perception Tasks [1.7]
マルチモーダル大言語モデル(LLM)は、テキスト、画像、オーディオ、その他のデータ型を処理できる。本稿では,LLMの幻覚検出戦略を体系的に評価した。歩行者検出の例において,これらのLCMをビデオシーケンスに適用する際の幻覚検出手法の評価と拡張を行った。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:58:03 GMT)
Can Open-Source LLMs Compete with Commercial Models? Exploring the Few-Shot Performance of Current GPT Models in Biomedical Tasks [1.7]
GPT 3 Opus, GPT-3.5-turbo, Mixtral 8x7b, in-context learning (zero-shot, few-shot) and QLoRa fine-tuning。以上の結果から,RAGセットアップにおける商用モデルとオープンソースモデルのパフォーマンスギャップは主にゼロショット設定にあることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:43:01 GMT)
All-optical Loss-tolerant Distributed Quantum Sensing [1.6]
分散量子センシング(DQS)は、量子資源を活用して、ネットワーク化された量子センサの未知のグローバルな特性を推定する。次世代DQSシステムのための全光学的資源効率スキームを提案し,解析する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:30:36 GMT)
Zero and Finite Temperature Quantum Simulations Powered by Quantum Magic [1.6]
短期量子デバイス上での多体ハミルトニアンのキャラクタリゼーションを改善するために,量子情報理論に着想を得た手法を提案する。本稿では,デジタルおよびアナログ量子ハードウェア上でのゼロおよび有限温度自由エネルギー計算において,本プロトコルが大幅な性能向上をもたらすことを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:11:22 GMT)
DuoFormer: Leveraging Hierarchical Visual Representations by Local and Global Attention [1.6]
本稿では、畳み込みニューラルネットワーク(CNN)の特徴抽出機能と視覚変換器(ViT)の高度な表現可能性とを包括的に統合した新しい階層型トランスフォーマーモデルを提案する。インダクティブバイアスの欠如と、ViTの広範囲なトレーニングデータセットへの依存に対処するため、我々のモデルはCNNバックボーンを使用して階層的な視覚表現を生成する。これらの表現は、革新的なパッチトークン化を通じてトランスフォーマー入力に適合する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:15:35 GMT)
Classical product code constructions for quantum Calderbank-Shor-Steane codes [1.5]
古典的製品コードから量子コードへの自然な一般化である新しい製品コード構成を導入する。パリティチェックの組込み冗長性は、メタチェックと呼ばれる、シンドロームの読み出し誤りの訂正に有効であることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:33:47 GMT)
LADDER: Revisiting the Cosmic Distance Ladder with Deep Learning Approaches and Exploring its Applications [1.4]
LADDERはパンテオンIa型超新星の観測データに基づいて訓練されている。宇宙論的な文脈における我々の手法の応用を実証し、一貫性チェックのためのモデルに依存しないツールとして機能する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:31:24 GMT)
Fundamental Visual Navigation Algorithms: Indirect Sequential, Biased Diffusive, & Direct Pathing [1.4]
本研究では,生物が視覚空間ナビゲーションに利用できる情報処理アルゴリズムを探索するために,具体的ニューラルネットワークについて検討する。驚くべきことに、3つの異なるアルゴリズムのクラスが出現し、それぞれが独自のルールとトレードオフを持ち、それぞれが観測可能な生物学的ナビゲーション行動に非常に関連しているように見える。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:07:44 GMT)
Autonomous Navigation of Unmanned Vehicle Through Deep Reinforcement Learning [1.4]
本稿では,アッカーマンロボットのモデルとDDPGアルゴリズムの構造と応用について詳述する。その結果、DDPGアルゴリズムは経路計画タスクにおいて従来のディープQネットワーク(DQN)およびダブルディープQネットワーク(DDQN)アルゴリズムよりも優れていた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:18:59 GMT)
Can LLMs Patch Security Issues? [1.3]
LLM(Large Language Models)は、コード生成に優れた習熟度を示している。 LLMは人間と弱点を共有している。我々は、LLMが生成した脆弱性のあるコードを自動的に洗練するフィードバック駆動セキュリティパッチング(FDSP)を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:42:57 GMT)
Intelligo ut Confido: Understanding, Trust and User Experience in Verifiable Receipt-Free E-Voting (long version) [1.3]
本研究は,電子投票プロトコルSeleneにおけるレシートフリー化に関する有権者の経験を評価することを目的とした300人の参加者を対象にした調査である。実験では, ユーザビリティと信頼要因が低かったが, 信頼と理解の間に正の相関が認められた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:49:39 GMT)
Empirical Analysis of Sri Lankan Mobile Health Ecosystem: A Precursor to an Effective Stakeholder Engagement [1.3]
Sri Lankaは最近、健康を含む幅広い分野をカバーする最初のプライバシー法を成立させた。テスト対象システムの78%には、消費者に最小限の可視性を持つ機密性の高い健康データを受け取るサードパーティドメインがある。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:38:25 GMT)
Compressing Structured Tensor Algebra [1.3]
DASTACはテンソルが捕捉した高レベル構造を低レベルコード生成に伝達するフレームワークである。本手法は,最適なデータレイアウトを自動的に検出することでメモリフットプリントを削減する。 DASTACは、最先端のスパーステンソルコンパイラであるTACOと、最先端の構造化テンソル代数コンパイラであるStructTensorに対して、1～2桁の高速化を実現する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:25:17 GMT)
Experimental Sample-Efficient and Device-Independent GHZ State Certification [1.2]
量子資源の認証は、量子情報処理の開発において重要なツールである。 4ビットGHZ状態の単一コピーを効率よく,デバイスに依存しない認証を行う。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:01:42 GMT)
Optimal Mechanisms for Quantum Local Differential Privacy [1.1]
本稿では、量子局所微分プライバシー(QLDP)と呼ばれるフレームワークを紹介する。 QLDPはパラメータ$epsilon$を使用して、プライバシリークを管理し、個々の量子状態のプライバシを保証する。量子ノイズの導入は、古典的なシナリオと同様のプライバシー保護を提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:46:16 GMT)
Cracking the neural code for word recognition in convolutional neural networks [1.1]
学習スクリプトにおける単語認識のために,単位の小さなサブセットがどのように特殊化されるかを示す。これらのユニットは、単語の左または右の空白空間からの距離や特定の文字の識別に敏感であることを示す。提案したニューラルネットワークは,文字の同一性や位置に関する情報を抽出し,不変な単語認識を可能にするメカニズム的な知見を提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:32:50 GMT)
Real-time Dynamics of the Schwinger Model as an Open Quantum System with Neural Density Operators [1.1]
この研究は、ニューラルネットワークのパラメータによる正確な量子状態の近似の難しさを克服する機械学習アルゴリズムを開発する。 QCDのような理論における原理実証の証明として、1+1d格子シュウィンガーモデルにおけるリンドブラッド・マスター方程式を開量子系として解く方法が応用される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:30:28 GMT)
A Master-Follower Teleoperation System for Robotic Catheterization: Design, Characterization, and Tracking Control [1.0]
本稿では,ロボットカテーテル化のための3自由度マスターフォロワ遠隔操作システムの設計と開発について述べる。臨床医の手による介入と似ており、手術中にカテーテル座屈やねじれを除去するグリップインサート放出機構を備えている。システムの性能は、典型的な円形、無限大のような、スパイラルな経路上での接近経路と開ループ経路の追跡によって評価される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:06:48 GMT)
A Survey on Differential Privacy for SpatioTemporal Data in Transportation Research [1.0]
交通機関では、時空間データ収集が急増している。このようなデータにおける微分プライバシーの最近の発展は、応用プライバシーの研究につながっている。個人情報を公開することなく、研究や推論におけるこのようなデータの必要性に対処するために、重要な研究が提案されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:19:29 GMT)
Personal Data Transfers to Non-EEA Domains: A Tool for Citizens and An Analysis on Italian Public Administration Websites [0.9]
我々は、20000以上のイタリア公共行政機関(PA)から第三者への個人データ転送を分析する。データ転送の上位3つの目的地はAmazon、Google、Fonticonsで、悪いリクエストの70%を占めている。技術政策に関して、これらの結果はPAデジタルインフラを改善するための更なるインセンティブの必要性を強調している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:41:44 GMT)
LGDE: Local Graph-based Dictionary Expansion [0.9]
ローカルグラフベース辞書拡張(英: Local Graph-based Dictionary Expansion、LGDE)は、単語の意味的近傍をデータ駆動で発見する手法である。本稿では,LGDEが単語の類似性に基づくしきい値法よりもはるかに優れた性能で,キーワードのリストを充実させることを示す。実験結果と専門ユーザ評価の結果から,LGDEは,多様体学習に基づく類似性ネットワークにより,より有用なキーワードでシード辞書を拡張していることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:11:41 GMT)
Discovering governing equation in structural dynamics from acceleration-only measurements [0.9]
本稿では,加速度のみの測定から力学系の支配方程式を発見するための新しい方程式探索アルゴリズムを提案する。提案アルゴリズムは、方程式探索のためのライブラリベースのアプローチを採用し、擬似モデルを優先順位付けする。提案アルゴリズムの有効性を,線形力学系と非線形力学系の両方を含む4つの構造力学の例を用いて示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:04:14 GMT)
Comprehensive Performance Evaluation of YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments [0.9]
本研究は, 商業用果樹園における果肉検出のためのYOLOv8, YOLOv9, YOLOv10オブジェクト検出アルゴリズムのすべての構成の性能評価を行った。 YOLOv9 は mAP@50 で YOLOv10 と YOLOv8 を上回り、YOLOv10x は精度とリコールでテストされた 17 の構成で YOLOv10x を上回ります。 YOLOv8nはテストされた全ての構成の中で最も高い推論速度を示し、処理時間は4.1ミリ秒に達した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:58:57 GMT)
Time Synchronization of TESLA-enabled GNSS Receivers [0.9]
遅延可能な敵の下で,各アルゴリズムのセキュリティの証明を行う。本稿では,認証ケイデンスが異なる2つのTESLAインスタンスを同時に使用する認証方式の意義について論じる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:48:49 GMT)
Compressed models are NOT miniature versions of large models [0.9]
4つのモデル特性を用いて,圧縮モデルと対応する大きなニューラルモデルを比較した。全ての4つのモデル特性において、圧縮されたモデルはBERT大モデルと大きく異なる。大きなニューラルモデルを置き換えるために圧縮モデルを使用することによる大きな副作用がある。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:28:50 GMT)
Open-World Visual Reasoning by a Neuro-Symbolic Program of Zero-Shot Symbols [0.8]
この研究は、画像中の物体の空間的構成を見つけるために、ニューロシンボリックプログラミング(推論)と言語ビジョンモデル(学習)を組み合わせた最初のものである。床に捨てられた道具を見つけ, パイプを漏らすことにより, 有効性を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:40:22 GMT)
Lessons from a human-in-the-loop machine learning approach for identifying vacant, abandoned, and deteriorated properties in Savannah, Georgia [0.8]
VADecideと呼ばれるHuman-in-the-loop Machine Learning(HITLML)モデルを作成し、ジョージア州サバンナのパーセルレベルのケーススタディに適用する。その結果,人間の入力を伴わない機械学習モデルを用いた場合よりも,予測精度が高いことがわかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:31:57 GMT)
EarlyMalDetect: A Novel Approach for Early Windows Malware Detection Based on Sequences of API Calls [0.7]
API呼び出しのシーケンスに基づく早期Windowsマルウェア検出のための新しいアプローチであるEarlyMalDetectを提案する。 EarlyMalDetectは、マルウェアプログラムがターゲットシステムで実行される前に予測し、公開することができる。大規模な実験により,本手法はマルウェアの挙動を予測するのに極めて有効であることが示された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:54:33 GMT)
Evaluating the performance-deviation of itemKNN in RecBole and LensKit [0.7]
本研究では、RecBoleおよびLensKitレコメンダシステムライブラリにおけるアイテムベースk-Nearest Neighbors(ItemKNN)アルゴリズムの性能について検討する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:04:36 GMT)
LSD3K: A Benchmark for Smoke Removal from Laparoscopic Surgery Images [0.7]
腹腔鏡下手術で手術器具が生み出す煙は視野を曖昧にし、外科医が正確に安全に手術を行う能力を損なう。近年、腹腔鏡画像の喫煙が研究者の注目を集めているが、このタスクの開発を妨害する主要なボトルネックは、公開可能な高品質なベンチマークデータセットの欠如である。我々は, 3000対の合成非均一煙像からなる, LSD3Kと呼ばれる腹腔鏡下手術画像デスモーキングのための新しい高品質データセットを構築した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:42:16 GMT)
Streaming Technologies and Serialization Protocols: Empirical Performance Analysis [0.7]
リアルタイムデータ分析、可視化、AIおよび機械学習モデルのトレーニングには、高ボリュームデータのストリーミングが不可欠だ。様々なストリーミング技術とシリアライズプロトコルが、異なるストリーミングニーズを満たすために開発されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:24:08 GMT)
Non-Contact Breath Rate Classification Using SVM Model and mmWave Radar Sensor Data [0.7]
提案システムは、呼吸速度に依存するFMCWレーダを用いて、非接触でデータを収集する。様々なサポートベクターマシンカーネルを使用して、観測されたデータを正常な状態と異常な状態に分類する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:08:47 GMT)
Mixed-Curvature Decision Trees and Random Forests [0.7]
決定木とランダムフォレストアルゴリズムを積空間多様体に拡張する。本手法は積多様体の分類と回帰のための単純で表現力豊かな方法を実現する。実装と実験のコードはhttps://github.com/pchlenski/embedders.comで公開されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:11:39 GMT)
Attention Overflow: Language Model Input Blur during Long-Context Missing Items Recommendation [0.7]
大きな言語モデル(LLM)は、プロンプトにリストされた項目から欠落した要素を提案できる。しかし、そのパフォーマンスは、入力リストにすでに含まれているアイテムを提案し始めたため、あまりにも多くのアイテムを提示すると劣化する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:00:30 GMT)
Which objects help me to act effectively? Reasoning about physically-grounded affordances [0.6]
この理解の重要な側面は、オブジェクトの余裕を検出することである。提案手法は,大規模言語モデル (LLM) と視覚言語モデル (VLM) の対話を利用して,オープンワールドのアベイランス検出を実現する。我々のシステムを物理的世界に接地することで、ロボットの体現と、遭遇する物体の本質的な性質を説明できる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:08:57 GMT)
End-To-End Clinical Trial Matching with Large Language Models [0.6]
大言語モデル(LLM)を用いた臨床試験のためのエンドツーエンドパイプラインを提案する。本研究は,93.3%の症例において関連する候補試験を同定し,88.0%の予備的精度を達成している。私たちの完全なエンドツーエンドパイプラインは、自律的または人間の監督の下で運用することができ、オンコロジーに限定されません。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:36:26 GMT)
RISC-V RVV efficiency for ANN algorithms [0.6]
本研究では、一般的なANNアルゴリズムにRVVを適用することの有効性について検討する。アルゴリズムはRISC-Vに適応し、主要なボトルネックを特定した後、RVVを使用して最適化された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:26:07 GMT)
Emergence of Sound in a Tunable Fermi Fluid [0.6]
本研究では, 相互作用するフェルミガスの輸送特性について, 周期的外乱に対する密度応答の測定により検討した。音の出現を観測し,実験結果がFLの第一原理輸送方程式で定量的に理解されていることを確認する。本研究は、このシステムをランドウのFL理論を研究するためのクリーンなプラットフォームとして確立し、よりエキゾチックな条件に拡張する方法を舗装する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:59:52 GMT)
Detecting out-of-distribution text using topological features of transformer-based language models [0.6]
本稿では,トランスフォーマーに基づく言語モデルからの自己注意マップのトポロジ的特徴を利用して,入力テキストの分布外の検出を行う。 BERT に対する我々のアプローチを評価し,従来の OOD アプローチと比較した。以上の結果から,本手法はCLS埋め込みよりも優れており,ドメイン内分布サンプルとドメイン外分布サンプルを区別するが,ほぼ同一あるいは同一のデータセットと競合することを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:45:45 GMT)
Entanglement Entropy of ($\mathbf{2+1}$)-Dimensional SU(2) Lattice Gauge Theory on Plaquette Chains [0.6]
線形ラケット鎖上の2+1$次元におけるハミルトンSU(2)格子ゲージ理論の絡み合いエントロピーについて検討する。ヒルベルト空間に存在しているスペクトルの中央にある量子多体傷は、高次の電場表現がヒルベルト空間基底に含まれると消滅する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:27:27 GMT)
Simulation of chiral motion of excitation within the ground-state manifolds of neutral atoms [0.4]
中性原子中のレーザー誘起ゲージ場は磁場の効果を模倣する手段として用いられる。我々は中性原子基底状態多様体内の原子励起におけるキラル運動を生成する方法を提案する。提案手法は、ヘキサゴナル中性原子格子を実装するために容易に拡張することができ、ハルデンモデルを実現するための基本単位として機能する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:21:22 GMT)
Deep Reinforcement Learning for Multi-Objective Optimization: Enhancing Wind Turbine Energy Generation while Mitigating Noise Emissions [0.4]
風力タービンの深部強化学習を用いたトルクピッチ制御フレームワークを開発した。我々は、風力タービンパラメータの正確な制御を可能にするために、ブレード要素運動量解決器と組み合わされた二重深度Q-ラーニングを用いる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:21:51 GMT)
NeuroPlug: Plugging Side-Channel Leaks in NPUs using Space Filling Curves [0.4]
全ての公表された対策(CM)は、信号XにノイズNを付加する。本研究では,このノイズを,対象の計測値,統計的解析値,様々な種類の推定側情報を用いて除去することが容易であることを示す。我々はこれらの攻撃手法に免疫を持つ新しいCM NeuroPlugを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:40:41 GMT)
Neuromorphic Circuit Simulation with Memristors: Design and Evaluation Using MemTorch for MNIST and CIFAR [0.4]
本研究は,3つのデジタル畳み込みニューラルネットワークを構築し,訓練することにより,メモリ内処理にmemristorsを用いることの可能性を評価する。これらのネットワークをmemtorchシステムに変換する。シミュレーションは理想的な条件下で行われ、推論中に最小1%の精度の損失が得られた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:30:33 GMT)
Behind the Smile: Mental Health Implications of Mother-Infant Interactions Revealed Through Smile Analysis [0.4]
笑顔に反映された母性感情制御をモデル化し,母性感情状態を分析した。以上の結果から,母親の笑顔の時間動態と感情状態との相関が示唆された。この研究は、他人の利益のために自分の感情を管理するものとして定義される感情労働についての洞察を与える。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 23:22:57 GMT)
A reinforcement learning strategy to automate and accelerate h/p-multigrid solvers [0.4]
マルチグリッド法は非常に効率的であるが,各レベルのスムーズなスイープ数など,数値パラメータを微調整する必要がある。本稿では、近似ポリシー最適化アルゴリズムを用いて、マルチグリッドパラメータを自動的に調整する。以上の結果から,提案手法は定常状態シミュレーションの堅牢性を著しく向上させる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:26:28 GMT)
SecScale: A Scalable and Secure Trusted Execution Environment for Servers [0.4]
Intelは、第11世代と第12世代のプロセッサで、最も信頼できるエンクレーブであるSGXを非推奨にする計画だ。我々は、投機的実行を中心にした新しいアイデアを使用するSecScaleを提案する。私たちは、最も近い競合相手よりも10%高速です。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:14:36 GMT)
Enhancing TinyML Security: Study of Adversarial Attack Transferability [0.4]
この研究は、リソース制約の組込みハードウェア上でAIモデルの敵対的脆弱性を掘り下げるものである。以上の結果から,強力なホストマシンからの敵攻撃は,ESP32やRaspberry Piなど,より小型で安全性の低いデバイスに転送される可能性が示唆された。このことは、敵対的攻撃が小さなデバイスに拡張され、脆弱性が強調され、TinyMLデプロイメントにおける強化されたセキュリティ対策の必要性を強調していることを示している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:49:46 GMT)
Keypoint Aware Masked Image Modelling [0.3]
KAMIMは16.12%から33.97%に改善され、ImageNet-1Kデータセットで同じ数のエポックでトレーニングされた際には76.78%から77.3%まで微調整精度が向上した。また,KAMIMを用いて訓練したViT-Bの学習表現を解析し,その行動に関する対照的な学習と同様の行動を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:41:46 GMT)
Optimized Quantum Simulation Algorithms for Scalar Quantum Field Theories [0.3]
量子コンピュータ上でのスカラー場理論の実用的なシミュレーション手法を提案する。本手法はハミルトニアンの各種耐故障シミュレーションアルゴリズムを用いて実装する。どちらの場合も、バウンダリが物理的に意味のあるシミュレーションを4つの物理量子ビット(106ドル)と1012ドル(T$-gate)の順番で行うことを示唆している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:00:01 GMT)
Removing cloud shadows from ground-based solar imagery [0.3]
本稿では,U-Netアーキテクチャに基づくクラウドシャドウの除去手法を提案し,古典的監視と条件付きGANを比較した。我々は,実画像と合成雲の新しいデータセットを用いて,2つの異なる画像モダリティについて評価を行った。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:38:24 GMT)
A light-weight and efficient punctuation and word casing prediction model for on-device streaming ASR [0.3]
自動音声認識(ASR)における句読解と単語ケーシング予測の必要性本稿では,リアルタイムに句読解と単語ケーシングを共同で予測する軽量で効率的なモデルを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:01:12 GMT)
Neural Network Tire Force Modeling for Automated Drifting [0.3]
本稿では,物理に基づくアプローチの代替として,前輪横力を予測するニューラルネットワークアーキテクチャを提案する。我々はこれらのモデルを基準ドリフト軌跡を追跡するために調整された非線形モデル予測コントローラに展開する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:58:01 GMT)
Designing fault-tolerant circuits using detector error models [0.3]
本稿では,回路レベルでの耐故障性を完全に把握する検出誤差モデルの強力な形式性について検討する。フォールトトレラント回路設計の工学サイクルにおける3つの抽象化レベルにフォーマリズムを適用した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:00:05 GMT)
MetaSumPerceiver: Multimodal Multi-Document Evidence Summarization for Fact-Checking [0.3]
マルチモーダルデータセットからファクトチェックに有用なクレーム固有の要約を生成するために設計された要約モデルを提案する。任意の長さの複数のモードから入力を処理できる動的知覚モデルを提案する。提案手法は,MOCHEGデータセットのクレーム検証タスクにおいて,SOTAアプローチを4.6%向上させる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:33:20 GMT)
OAT: Object-Level Attention Transformer for Gaze Scanpath Prediction [0.3]
本稿では,OAT(Object-level Attention Transformer)を紹介する。 OATは人間のスキャンパスを予測し、散らかった邪魔者のシーンで対象物を検索する。我々は、Amazonの書籍カバーデータセットと、収集したビジュアル検索のための新しいデータセットに基づいて、OATを評価した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:33:17 GMT)
Are We Ready for Out-of-Distribution Detection in Digital Pathology? [0.3]
デジタル病理学におけるOOD検出のベンチマーク研究について述べる。我々は,適切な評価プロトコルの導入と,単一モデルとマルチモデルの両方における多様な検出器の比較について強調する。我々は新たな洞察とガイドラインを提供し、今後の研究と議論の道を開く。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:07:32 GMT)
Telling different unravelings apart via nonlinear quantum-trajectory averages [0.3]
ゴリーニ-コサコフスキー-スダルシャン-リンドブラッドマスター方程式は開量子系の密度行列を支配している。異なる測定シナリオにおいて同一のMEが生成する未発見物を,操作的に識別する手法を提案する。量子軌道平均分散は,これらの測定シナリオを識別できることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:13:21 GMT)
Decentralised Governance for Autonomous Cyber-Physical Systems [0.2]
本稿では,サイバー物理システムが分散的に管理される可能性について検討する。自律的な物理的空間を管理するための分散ガバナンスの考察と課題を強調することで、自律的なCPSのガバナンスにおける自律性は単なる技術的成果ではなく、機能的および社会的ダイナミクスの複雑なメッシュも含んでいることが明らかになった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:40:06 GMT)
Survey in Characterization of Semantic Change [0.1]
言葉の意味を理解することは、異なる文化からの文章を解釈するのに不可欠である。意味的変化は、計算言語学アルゴリズムの結果の品質に影響を与える可能性がある。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:28:27 GMT)
SignSpeak: Open-Source Time Series Classification for ASL Translation [0.1]
本稿では,低コストでリアルタイムなASL-to-Speech翻訳グローブと手話パターンの学習データセットを提案する。このデータセットを、LSTM、GRU、Transformersなどの教師付き学習モデルでベンチマークし、最高のモデルが92%の精度を達成した。当社のオープンソースデータセット、モデル、グローブデザインは、コスト効率を維持しつつ、正確かつ効率的なASLトランスレータを提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:36:03 GMT)
SignSpeak: Open-Source Time Series Classification for ASL Translation [0.1]
本稿では,低コストでリアルタイムなASL-to-Speech翻訳グローブと手話パターンの学習データセットを提案する。このデータセットを、LSTM、GRU、Transformersなどの教師付き学習モデルでベンチマークし、最高のモデルが92%の精度を達成した。当社のオープンソースデータセット、モデル、グローブデザインは、コスト効率を維持しつつ、正確かつ効率的なASLトランスレータを提供する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:36:03 GMT)
Opportunistic Sensor-Based Authentication Factors in and for the Internet of Things [0.1]
我々は、モノのインターネットにおいて、機会論的センサーベースの認証要素を構築するための新しいアイデアを提案する。センサは新たな認証要素を作成するために利用でき、既存のオブジェクト間認証機構を強化することができる。駐車場入場シナリオにおける実証実験を通じて,提案手法の有効性と有効性を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:02:07 GMT)
Sequency Hierarchy Truncation (SeqHT) for Adiabatic State Preparation and Time Evolution in Quantum Simulations [0.1]
本稿では、量子シミュレーションにおける状態準備と時間発展に必要なリソースを削減するために、SeqHT(Sequency Hierarchy Truncation)方式を提案する。これまで検討したシステムでは、周波数障害波動関数で計算されたオブザーバブルは、カットオフシークエンスの増加とともに、その正確な値に段階的に収束することが判明した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:08:40 GMT)
A Multi-Messenger Search for Exotic Field Emission with a Global Magnetometer Network [0.1]
本研究では,大エネルギーの天体物理現象で発生するエキゾチック低質量場(ELF)バーストを探索するための解析手法を提案する。関連する重力波や電磁信号は、磁気センサ内のフェルミオンのスピンとの結合を介して相互作用するELFバーストの到来を告げる。我々は、2020年3月11日にLIGO/Virgoによって検出された二元ブラックホール融合S200311bgと一致するGNOMEデータを用いて、この手法による最初の探索を行い、重要な事象は見つからなかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:11:12 GMT)
Attenuation-Aware Weighted Optical Flow with Medium Transmission Map for Learning-based Visual Odometry in Underwater terrain [0.0]
本稿では,水中環境における学習型単眼視計測(VO)の課題に対処する。自律型水中車両(AUV)におけるVOシステムの精度を高める新しいwflow-TartanVOの導入実世界の異なる水中データセットの評価は,ベースラインVO法におけるwflow-TartanVOの有効性を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:00:15 GMT)
dzStance at StanceEval2024: Arabic Stance Detection based on Sentence Transformers [0.0]
本研究では,TF-IDF(Term Frequency-Inverse Document Frequency)とSentence Transformerを比較し,著者の姿勢を検出する。本研究では,Sentence Transformer が TF-IDF 特性より優れていることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:43:27 GMT)
dzNLP at NADI 2024 Shared Task: Multi-Classifier Ensemble with Weighted Voting and TF-IDF Features [0.0]
本稿では,dzNLPチームのNADI 2024共有タスクへの貢献について述べる。我々のアプローチは、従来の機械学習技術に頼りながら、F1スコアと精度の点で競争性能を実証した。私たちのモデルは極めて正確でしたが、幅広い方言ラベルを思い出すのに苦労し、改善すべき重要な領域を強調しました。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:47:42 GMT)
dzFinNlp at AraFinNLP: Improving Intent Detection in Financial Conversational Agents [0.0]
本稿では、金融対話エージェントにおける意図検出へのdzFinNlpチームの貢献について述べる。我々の実験は有望な結果を示し、最良のモデルはArBanking77データセットで93.02%と67.21%のマイクロF1スコアを達成した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:37:20 GMT)
Zeno Effect Suppression of Gauge Drift in Quantum Simulations [0.0]
格子ゲージ理論は、物理空間よりも大きいヒルベルト空間を持つ。本研究は, このゲージドリフトをゼノ効果により抑制する方法を提案する。我々は、この手法を$mathbbZ$ゲージ理論玩具モデルで実証する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:37:01 GMT)
Vison condensation and spinon confinement in a kagome-lattice $\mathbb{Z}_2$ spin liquid: A numerical study of a quantum dimer model [0.0]
我々は,カゴメ格子上の$mathbbZ$ spin liquid(mathbbZ$SL)とボンドソリッド(VBS)の遷移について検討した。この遷移は、$mathbbZ$スピン液体のバイソン励起の凝縮によって引き起こされる。スピン液体とVBSの特徴を同時に示す興味深い状態が見つかる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:53:03 GMT)
Unruh-DeWitt Quantum Computing: Realizing Quantum Shannon Theory With Quantum Fields [0.0]
この論文では、ヘリカルルッティンガー液体のボゾン化がフェルミオン系のRQIチャネルを構築するためのペダゴジカルアリーナを提供するため、友長・ルッティンガー液体の理論に重点を置いている。複数の実験的な実システムを提案し,最大チャネル容量を確保するために設計制約を構築した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:00:49 GMT)
Uncovering Political Bias in Emotion Inference Models: Implications for sentiment analysis in social science research [0.0]
本稿では、社会科学研究における感情分析(SA)に使用される機械学習モデルにおける政治的バイアスの存在について検討する。ポーランドの感情分析モデルを用いた偏見調査を行った。以上の結果から, 人間のラテンダーによるアノテーションは, モデルの予測に政治的偏見を伝播させることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:31:07 GMT)
Uncertainty relations based on state-dependent norm of commutator [0.0]
我々は、B'ottcher-Wenzel不等式の一般化を利用して、通勤者の状態依存ノルムに基づく2つの不確実性関係を導入する。第1の関係は数学的に証明され、第2の関係は数値的な証拠によって強く支持される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 23:49:20 GMT)
Tsirelson inequalities: Detecting cheating and quantumness in a single framework [0.0]
ティレルソンの不等式は量子性を検出する量子理論の強力な道具として登場した。本稿では,古典的なシェルゲームにおける不正検出と空間的に分離されたシステムにおける量子性の探索という,Tsirelsonの不等式の有用性を活用する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:32:09 GMT)
The use of the symmetric finite difference in the local binary pattern (symmetric LBP) [0.0]
LBPの特徴の数は、対称LPPを用いることで256から16に削減される。顔検出および表情認識において, LBP定式化における対称有限差の利用について検討した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:34:02 GMT)
The Impact of School and Family Networks on COVID-19 Infections Among Dutch Students: A Study Using Population-Level Registry Data [0.0]
我々は、SARS-CoV-2送信に対する学校、家族、その他の社会接触の影響を調べるために、広範な登録データを用いている。以上の結果から,SARS-CoV-2の普及における家庭と家族の伝達の重要性が学校設定に比較して強調された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:49:01 GMT)
Temperature Distribution Prediction in Laser Powder Bed Fusion using Transferable and Scalable Graph Neural Networks [0.0]
本研究では, レーザ粉体融合プロセスにおける熱力学のシミュレーションにグラフニューラルネットワーク(GNN)を用いた新しい予測モデルを提案する。提案モデルでは,L-PBFにおける熱伝達過程の複雑さを計算コストを大幅に削減する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:14:47 GMT)
Systematic input scheme for many-boson Hamiltonians via quantum walk [0.0]
我々は、多ボソンハミルトニアンのための新しい体系的な入力スキームを開発する。この入力スキームの議論は、2次元の$phi 4$理論のライトフロントハミルトニアンに基づく。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:47:53 GMT)
Superresolving optical ruler based on spatial mode demultiplexing for systems evolving under Brownian motion [0.0]
任意の相対輝度を持つ2つの弱非コヒーレント源系の中心のブラウン運動が適応SPADE測定精度限界に及ぼす影響について検討した。レイリーの呪いはそのようなシナリオに存在するが、SPADE測定は完全な直接撮像より優れている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:23:14 GMT)
Studying the Performance of the Jellyfish Search Optimiser for the Application of Projection Pursuit [0.0]
プロジェクション追跡(PP)ガイド付きツアーは、PPインデックスとして知られる基準関数を対話的に最適化し、興味深いプロジェクションを明らかにすることで高次元データを探索する。 PPの最適化は非滑らかな関数を含む非自明なものであり、近距離からのみ検出できる小さなスキント角度のオプティマを含む。本研究では,最近導入されたSwarmベースのアルゴリズムであるJellyfish Search Optimiser (JSO)の性能について検討した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:39:01 GMT)
Social Capital and Persistence in Computer Science of Google's Computer Science Summer Institute (CSSI) Students [0.0]
本研究では,CS支援プログラムが首都建設における持続性に与える影響について検討する。私たちはGoogleのCSSIに注目し、大学院生にCSの3週間の紹介を提供しました。プログラムから2～5年経過した参加者へのインタビューを用いて、CSSIが社会資本と長期CS持続性に与える影響を研究する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:50:21 GMT)
Self-Supervised Learning with Generative Adversarial Networks for Electron Microscopy [0.0]
本稿では,自己教師付き事前学習が,下流タスクの高精度な微調整をいかに促進するかを示す。我々は、電子顕微鏡の文脈において、下流の様々なタスクにまたがる自己教師型事前学習の汎用性を実証する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:58:03 GMT)
Scikit-fingerprints: easy and efficient computation of molecular fingerprints in Python [0.0]
ケモインフォマティクスにおける分子指紋の計算のためのPythonパッケージであるtextitscikit-fingerprintsを提案する。私たちのライブラリは業界標準のScikit-learnインターフェースを提供しており、直感的な使用と機械学習パイプラインとの統合が容易です。また、柔軟性があり、非常に効率的で、完全にオープンソースです。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:45:14 GMT)
Revisiting Attention for Multivariate Time Series Forecasting [0.0]
本研究ではまず周波数領域空間に基づく新しい注意機構である周波数スペクトルアテンション(FSatten)を提案する。埋め込みにはフーリエ変換を使用し、従来のQとKの線形写像を置き換えるためにマルチヘッドスペクトルスケーリング(MSS)を導入している。我々はさらに、スケールド直交注意(SOatten)と呼ばれるより一般的な手法を設計する。実験の結果, FSatten と SOatten がSOTA を上回り, MTSF の基本的注意機構として優れていることがわかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 06:28:20 GMT)
Report on the Conference on Ethical and Responsible Design in the National AI Institutes: A Summary of Challenges [0.0]
2023年5月、ジョージア工科大学倫理・技術・ヒューマンインタラクションセンターは、国家AI研究所における倫理的・責任あるデザインに関する会議を組織した。カンファレンスは3つの質問に焦点を当てた。国家AI研究所がAIシステムの責任ある設計に関して直面している主な課題は何ですか? この文書は、出席中の研究所の代表者が強調した課題をまとめたものである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:30:08 GMT)
Qutrit and Qubit Circuits for Three-Flavor Collective Neutrino Oscillations [0.0]
我々は、高密度ニュートリノ系のフレーバーダイナミクスをシミュレートするためのクォートとキュービットの有用性を探求する。量子ビット型および量子ビット型プラットフォーム上での3フレーバーニュートリノ系をシミュレーションするための新しい量子回路を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:56:31 GMT)
Queue-based Eco-Driving at Roundabouts with Reinforcement Learning [0.0]
我々は、交通の流れと交通効率を高めるために、混在する交通のラウンドアバウンドでエコ運転に対処する。我々はルールベースと強化学習ベースのエコ自動運転システムという2つのアプローチを開発した。その結果、どちらのアプローチもベースラインを上回っていることがわかった。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:38:31 GMT)
Quantum statistical effects in one-particle densities: scattering and pair production [0.0]
非相互作用非相対論的粒子に作用する外部時間依存場によって生成される粒子-ホール対の時空間分解密度について検討した。少なくともいくつかのケースでは、密度はフェルミ・ディラックやボース・アインシュタイン統計の影響を受けず、多粒子系の初期状態によってのみ決定されることが示されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:34:11 GMT)
PyTreeNet: A Python Library for easy Utilisation of Tree Tensor Networks [0.0]
この作業はPythonライブラリPyTreeNetのユーザガイドです。ライブラリの機能を導入するためのコード例と演習が含まれている。主な焦点は量子系の時間発展である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:03:38 GMT)
Programmable adiabatic demagnetization for systems with trivial and topological excitations [0.0]
量子コンピュータや量子シミュレータ上で任意のハミルトニアンの低エネルギー状態を作成するためのプロトコルを提案する。このプロトコルは、固体システムを極低温に冷却するために使用される断熱脱磁性技術にインスパイアされている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:33:05 GMT)
Privacy-preserving gradient-based fair federated learning [0.0]
フェデレートラーニング(FL)スキームは、複数の参加者が基盤となるデータを共有することなく、ニューラルネットワークを協調的にトレーニングすることを可能にする。本稿では,本研究の成果に基づいて,新しい,公正かつプライバシ保護のFLスキームを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:56:39 GMT)
Postselection-free learning of measurement-induced quantum dynamics [0.0]
状態の計測後のアンサンブルの性質を推測するために,汎用的なスキームを導入する。即時的な応用として,実験における量子状態設計の出現を検証するために本手法が有用であることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:16:13 GMT)
Point-JEPA: A Joint Embedding Predictive Architecture for Self-Supervised Learning on Point Cloud [0.0]
我々は、ポイントクラウドデータに特化して設計された統合埋め込み予測アーキテクチャであるPoint-JEPAを紹介する。ターゲット選択やコンテキスト選択の際のインデックスに基づいて,トークンの近接を効率的に計算し,利用するために,ポイントクラウドトークンを順序付けするシーケンサを導入する。提案手法は,入力空間の再構成や追加のモダリティを回避しつつ,最先端の手法による競合的な結果を得る。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:09:13 GMT)
Particle detectors under chronological hazard [0.0]
我々は,CTCから因果的に切り離された時空領域に局所粒子検出器を配置することにより,時間マシンを特徴付ける閉時間曲線(CTC)の存在をいかに認識できるかを分析する。我々の研究は、検出器がCTCが存在するかどうかを判断できるだけでなく、検出器が幾何学的情報から位相的情報を分離し、CTCなしで周期的時空を区別できることを示している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:03:17 GMT)
PRAGyan -- Connecting the Dots in Tweets [0.0]
本研究では、ツイートデータセットの因果解析を行うために、知識グラフ(KG)とLarge Language Models(LLM)の統合について検討する。我々は、Neo4j(PRAGyan)データフォーマットに格納されたKGを利用して、因果推論に関連するコンテキストを検索する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:49:32 GMT)
PG-Rainbow: Using Distributional Reinforcement Learning in Policy Gradient Methods [0.0]
本稿では,分散強化学習フレームワークとポリシ勾配アルゴリズムを組み合わせた新しいアルゴリズムPG-Rainbowを紹介する。政策ネットワークに報酬分配情報を統合することで、政策エージェントが強化された能力を取得するという経験的結果を示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:18:52 GMT)
Optimality and Noise-Resilience of Critical Quantum Sensing [0.0]
臨界量子センシングと受動量子戦略を比較して周波数推定を行う。ユニタリの場合、どちらの戦略も光子数と精度2次スケーリングを達成するが、散逸の存在下では、これは批判的戦略にのみ当てはまる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:11:56 GMT)
Optimal Tree Tensor Network Operators for Tensor Network Simulations: Applications to Open Quantum Systems [0.0]
ツリーテンソルネットワーク状態(TTNS)は、システムの波動関数を低ランクテンソルの積に分解する。本稿では,任意の積和シンボル量子演算子に対して,最適かつ正確なツリーテンソルネットワーク演算子(TTNO)を自動構築するアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 02:15:52 GMT)
Network quantum steering enables randomness certification without seed randomness [0.0]
複数のソースを持つ量子ネットワークは、入力なしで量子非局所性の観測を可能にする。古典的に相関する可能性のある2つのソースを持つ2つのパーティでさえ、量子非局所性の形式を見ることができることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:20:51 GMT)
Multiscale Feature Learning Using Co-Tuplet Loss for Offline Handwritten Signature Verification [0.0]
我々は,マルチスケール署名特徴学習ネットワーク (MS-SigNet) を導入し,コタップレット損失と呼ばれる新しいメトリクス学習損失を導入した。 MS-SigNetは、複数の空間スケールからグローバルと地域両方の署名機能を学び、特徴の識別を強化する。また、堅牢なシステム開発をサポートする大規模な中国語署名データセットであるHanSigについても紹介する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:09:55 GMT)
Multipartite Entanglement versus Multiparticle Entanglement [0.0]
絡み合い(英: entanglement)とは、局所的な作用や古典的なコミュニケーションによって達成されるものを超える量子相関の存在である。自然拡大は真の多部絡み合い(GME)であり、分解を2つの分離可能な状態に非公害であると理解されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:49:09 GMT)
Methods to Measure the Broncho-Arterial Ratio and Wall Thickness in the Right Lower Lobe for Defining Radiographic Reversibility of Bronchiectasis [0.0]
気管支狭窄診断の要点は,BAR(Brencho-Arterial ratio)の上昇である(小児では0.8)。画像処理手法は、ローブやセグメントによるより高速な解釈と詳細な評価を容易にする。そこで本稿では,BARの気道と動脈領域の正確な計測と計測方法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 05:43:38 GMT)
Mechanical Self-replication [0.0]
本研究では,生体細胞内の生物学的過程にインスパイアされた自己複製機械系の理論的モデルを提案する。モデルは自己複製をコアコンポーネントに分解し、それぞれが基本ブロック型のセットから構築された単一のマシンによって実行される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:49:50 GMT)
Measuring kinetic inductance and superfluid stiffness of two-dimensional superconductors using high-quality transmission-line resonators [0.0]
本研究では, 高温超伝導共振器を用いた運動インダクタンス測定手法を提案する。等価回路モデルを用いて, 複素導電率の運動インダクタンス, 超硬度, 貫入深さ, 虚部および実部の比を抽出する。本手法は超伝導物理学,材料科学,量子センシングの分野の実践者にとって有用である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:25:15 GMT)
Krylov complexity of fermion chain in double-scaled SYK and power spectrum perspective [0.0]
有限温度2倍スケールSYK(DSSYK)モデルにおける複数のマヨラナフェルミオンからなるフェルミオン連鎖作用素のクリロフ複雑性について検討する。クリロフ複雑性が2点関数から計算可能であるという事実を利用して、2点関数が単純になる極限で解析を行う。極低温条件下でのクリロフ複雑性の指数的成長を確認した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:47:05 GMT)
Is the dynamical quantum Cheshire cat detectable? [0.0]
我々は、Aharonovらによって提案された動的量子チェシャー猫をどうやって検出するかを探る。実際には、小さな確率振幅を加算・減算することで初期状態に偏りがあることが示される。実験室でこれらの現象を実証する光学偏光実験を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:56:54 GMT)
Introduction to quantum entanglement in many-body systems [0.0]
この章の目的は、多部構成のシナリオに特に重点を置いて、このトピックについて教育的な紹介を行うことである。まず、絡み合い理論から必要な数学的ツールと基本的な概念を提供することから始める。次に、テンソル・ネットワーク状態や対称状態のような凝縮マター理論に有用な様々な絡み合い構造に着目する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:30:40 GMT)
Improved Membership Inference Attacks Against Language Classification Models [0.0]
分類モデルに対するメンバシップ推論攻撃を実行するための新しいフレームワークを提案する。本手法は,単一攻撃モデルやクラスラベル毎の攻撃モデルよりも精度が高いことを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 12:55:29 GMT)
Hybrid Deep Learning-Based for Enhanced Occlusion Segmentation in PICU Patient Monitoring [0.0]
本稿では,PICU内の遠隔監視アプリケーションで発生する共通閉塞を分割するハイブリッド手法を提案する。私たちのアプローチは、限られたトレーニングデータシナリオのためのディープラーニングパイプラインの作成に重点を置いています。提案したフレームワークは、92.5%の精度、93.8%のリコール、90.3%の精度、92.0%のF1スコアで全体的な分類性能が得られる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:37:55 GMT)
Hayden-Preskill recovery in chaotic and integrable unitary circuit dynamics [0.0]
本稿では,局所量子多体系におけるスクランブルの動的プローブとしてHayden-Preskillリカバリを用いた結果について述べる。驚くべきことに、ある種のカオス回路は完全な忠実さで情報を伝達する。この結果から,情報回復プロトコルはカオス的かつ統合的行動の区別に有効であることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:12:23 GMT)
HPix: Generating Vector Maps from Satellite Images [0.0]
衛星画像からベクトルタイルマップを生成するためにGAN(Generative Adversarial Networks)を改良したHPixと呼ばれる新しい手法を提案する。経験的評価を通じて,提案手法は高精度かつ視覚的に表現可能なベクトルタイルマップを作成する上での有効性を示す。さらに、道路交差点のマッピングや、その面積に基づいたフットプリントクラスタの構築など、我々の研究の応用を拡大する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:54:02 GMT)
Generative AI and the problem of existential risk [0.0]
ジェネレーティブAIは、AIの現実的リスクに対する懸念の焦点となっている。この章は、生成的AIに関連する存在的リスクの恐れを根底にしている重要な懸念を強調して、議論を軽視することを目的としている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:16:24 GMT)
General monogamy relations of the $S^{t}$ and $T^{t}_q$-entropy entanglement measures based on dual entropy [0.0]
新たに派生したモノガミーの不等式は,既存のものよりも厳密であることを示す。これらの一般単ガミー関係に基づき、$N$-qubit状態に対する多部交絡指標の集合を構築する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:49:38 GMT)
General Distribution Learning: A theoretical framework for Deep Learning [0.0]
本稿では,機械学習の統計的タスクに対処する新しい理論学習フレームワークである一般分布学習(GD Learning)を評価する。 GDラーニングは、推定の真の基礎となる確率を推定し、カテゴリに適合するモデルを使用することに焦点を当てる。本稿では,GD学習フレームワークにおける推定誤差,適合誤差,学習誤差の上限について検討する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:11:28 GMT)
From paintbrush to pixel: A review of deep neural networks in AI-generated art [0.0]
本稿では,AI生成技術開発に利用されてきた深層ニューラルネットワークアーキテクチャとモデルについて検討する。古典的畳み込みネットワークから最先端拡散モデルまで、この分野のキープレーヤーについて検討する。この論文は、AI生成技術の現状に関する技術的な説明と洞察の独特なブレンドによって、アートとコンピュータ科学の相互作用を実証する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:33:45 GMT)
Frequency dependence of nonsequential double ionization of atoms in strong laser fields [0.0]
完全な量子力学計算において、(非逐次)二重イオン化の周波数依存性を研究する。また,フィールドサイクル数の影響などの時間依存性の影響についても検討した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:43:28 GMT)
Framework for Curating Speech Datasets and Evaluating ASR Systems: A Case Study for Polish [0.0]
パブリックドメインで利用可能な音声データセットは、発見可能性と相互運用性の課題のために、しばしば利用されていない。利用可能な音声データセットを調査し、カタログ化し、キュレートするための包括的なフレームワークが設計されている。この研究は、ポーランド語における商用および無料のASRシステムの日付と比較して最も広範な比較である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:32:12 GMT)
Fermion determinants on a quantum computer [0.0]
このアルゴリズムは量子固有値変換と量子平均推定を使い、行列次元$V$で$O(Vlog(V))$のようにスケールするクエリ複雑性を与える。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:00:28 GMT)
Exploring Robot Trajectory Planning -- A Comparative Analysis of Algorithms And Software Implementations in Dynamic Environments [0.0]
軌道計画はModern & Advanced Roboticsにおいて重要な用語である。これは、ロボットが時間が経つにつれて、スムーズで実現可能な経路を生成する方法です。軌道計画は自動車産業ロボット、マニピュレータ、移動ロボットで広く使われている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:30:27 GMT)
Exploring Facial Biomarkers for Depression through Temporal Analysis of Action Units [0.0]
抑うつの有無で分類された被験者の映像データから表情を分析した。その結果,グループ間の悲しみと幸福に関連するAUの強度に有意な差が認められた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:55:01 GMT)
Exploring End-to-end Differentiable Neural Charged Particle Tracking -- A Loss Landscape Perspective [0.0]
粒子追跡のためのE2E差分型決定型学習手法を提案する。離散的な代入操作の微分可能なバリエーションは、効率的なネットワーク最適化を可能にすることを示す。 E2Eの微分性は、勾配情報の一般利用に加えて、予測不安定性を緩和するロバスト粒子追跡のための重要なツールである、と我々は主張する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:42:58 GMT)
Exploration to early universe by Josephson Junction Switching Current Detector [0.0]
ジョセフソンジャンクションスイッチング電流検出器(JJSCD)を用いた重力波背景探査法を提案する。シャーの感度は、現実的にはhsimeq 10-19$、10-21$、楽観的には10-24$に達する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:01:40 GMT)
Exploiting nonequilibrium phase transitions and strong symmetries for continuous measurement of collective observables [0.0]
非平衡相転移を伴う強い対称性が、集合多体観測可能量を測定するためのプロトコルを考案する方法について論じる。連続的に観測することで,時間積分した放射信号から直接全角運動量の値を推定できることが示される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:51:31 GMT)
Experimental certification of level dynamics in single-photon emitters [0.0]
単一光子のエミッタは、新興量子技術にとって不可欠な資源である。最も一般的に適用される試験は、エミッターエネルギーレベル構造を決定するためにハンベリー・ブラウン・アンド・ツイス(HBT)の装置を使用する。我々は、同じHBT設定で記録された検出と非検出イベントのすべての正規化一致に基づいて完全な解析を行い、発光したフォトニック状態の期待特性を証明した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:27:27 GMT)
Enhanced Denoising of OCT Images Using Residual U-Net: A Cross-Modality Approach on PSOCT and ASOCT for Clinical Diagnostics [0.0]
本稿では,雑音を効果的に低減し,画像の明瞭度を向上するResidual U-Netアーキテクチャを用いた拡張型復調モデルを提案する。ピーク信号ノイズ比(PSNR)はPS OCT画像に対して34.343$pm$1.113であり、構造類似度指数測定(SSIM)値は0.885$pm$0.030である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 01:35:03 GMT)
Emergence of phantom cold dark matter from spacetime diffusion [0.0]
幾何学を定量化せずに一般相対性理論と場の量子論を整合させる方法は、計量を進化的に要求することである。我々はその決定論的値から逸脱し、幻の冷たい暗黒物質(CDM)を発生させる空間計量の進化結果を見出した。この幻の冷暗黒物質のエネルギー密度は平均的に正であり、CDMの宇宙現象を再現するために必要な条件である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:00:02 GMT)
EggNet: An Evolving Graph-based Graph Attention Network for Particle Track Reconstruction [0.0]
我々は,一組のヒットから粒子トラックを直接再構成するワンショットOCアプローチを検討する。このアプローチは、グラフを反復的に更新し、各グラフを横断するメッセージをより容易にする。 TrackMLデータセットに関する予備研究は、固定された入力グラフを必要とする方法と比較して、トラック性能が向上したことを示している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:29:24 GMT)
Efficient and Device-Independent Active Quantum State Certification [0.0]
絡み合った量子状態は多くの量子技術にとって必須の要素であるが、それらを使用する前に検証する必要がある。既存のほとんどのアプローチは、名目上は同一かつ独立な(IID)量子状態のアンサンブルを作成し、その後、アンサンブルの各コピーを測定することに基づいている。量子状態認証(QSC)を実験的に実装し、アンサンブルのサブセットのみを測定し、残りの状態の忠実さを認証する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:54:13 GMT)
Efficient High-Dimensional Entangled State Analyzer with Linear Optics [0.0]
線形光干渉計と補助フォトニック状態を用いて, 効率的な高次元交絡状態解析器を実現する方法を示す。補助状態の絡み合いの度合いは、指数的に小さなシュミットランクによって定量化される以前のプロトコルよりもはるかに小さい。これは、現在のハードウェアで実験的なデモを行う道を開くものだ。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:40:53 GMT)
Dynamical heterogeneity and large deviations in the open quantum East glass model from tensor networks [0.0]
数値テンソルネットワークを用いた散逸量子東モデルの非平衡ダイナミクスについて検討する。我々は行列積状態を用いて、正確な対角化にアクセスできるものを超える大きさの量子ジャンプなき大きさの進化を表現する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:42:56 GMT)
Dynamic Sentiment Analysis with Local Large Language Models using Majority Voting: A Study on Factors Affecting Restaurant Evaluation [0.0]
本研究では,局所言語モデルを用いた感情分析モデルに多数決機構を導入する。レストラン評価に関するオンラインレビューの3つの分析により、複数の試みによる過半数投票は、一つの試みによる大規模なモデルよりも、より堅牢な結果をもたらすことを示した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 00:28:04 GMT)
Designing Software with Complex Configurations [0.0]
本稿では,ソフトウェアを複雑な構成で特定・検証するために,軽量な形式的手法をいかに利用できるかについて議論する。 TLA+ と Alloy の2つの一般的な形式的手法を簡潔に提示し、この文脈で両方の長所と短所について論じる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 16:06:38 GMT)
Correlation Hyperspectral Imaging [0.0]
ハイパースペクトルイメージングは、高解像度で光の空間分布とスペクトル分布の両方に関する情報を提供することを目的としている。従来のハイパースペクトル画像技術の典型的な欠点を克服できる光強度相関を利用して、この制限に対処する。空間・スペクトルの高分解能化,高速化,望ましくないスペクトル特性に対する感度化の両立は,ハイパースペクトルイメージング装置のパラダイム変更につながる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:54:44 GMT)
Computational Dualism and Objective Superintelligence [0.0]
性能に関する客観的な主張を行うためには、計算双対性を避ける必要がある。環境のあらゆる側面が既約状態間の関係であるパンコンピュテーションの代替案を提案する。これによって私たちは、インテリジェンスに関する客観的な主張を行うことができ、それは"一般化"し、原因を特定し、適応する能力である、と我々は主張する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:06:26 GMT)
Complexification of Quantum Signal Processing and its Ramifications [0.0]
単一周期でフロケ作用素を定義する回路と、リー代数 sl$(2,mathbbC)$ に対する時空双対定義 QSP 列との関係を示す。また、このQSP列のユニタリ表現は無限次元であり、ハイゼンベルク図形のボゾン作用素に対して定義される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:51:44 GMT)
Collaborative real-time vision-based device for olive oil production monitoring [0.0]
我々は,オリーブグラインダーの入力を監視し,異物が検出された場合,オペレータに即座に警告を行うコンピュータビジョンベースのシステムを開発した。本稿では,オリーブ油製造の品質管理の改善と,異物による機械の損傷防止のための革新的なアプローチを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:37:08 GMT)
Coherent errors in stabilizer codes caused by quasistatic phase damping [0.0]
本稿では,1/f雑音によるラーモア周波数変動の影響について,より微妙な誤差モデルである擬似位相減衰を導入する。擬似位相減衰と読み出し誤差の存在下で,誤差閾値の数値的証拠を提供する。スピン量子ビットおよび超伝導量子ビットに対する結果の影響について論じる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 07:09:57 GMT)
Characterization of Magnetic Labyrinthine Structures Through Junctions and Terminals Detection Using Template Matching and CNN [0.0]
ジャンクションと終端と呼ばれる磁気ラビリンチンパターンの欠陥は、関心のポイントとなる。本研究では,画像中の多数の小物体を検出するTM-CNNという新しい手法を提案する。 TM-CNNのF1スコアは0.991で、従来のテンプレートマッチングやCNNベースのオブジェクト検出アルゴリズムよりもはるかに優れていた。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 23:04:14 GMT)
Brick Wall Quantum Circuits with Global Fermionic Symmetry [0.0]
大域フェルミオン対称性を享受するレンガ壁量子回路について検討する。フェルミオン対称性は臨界点の曲面に$H_gamma$をピンするが、その対称性を破ると非自明な位相となる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:27:58 GMT)
Bootstrapping Classical Shadows for Neural Quantum State Tomography [0.0]
古典的影を用いたクロスエントロピー損失関数の最適化のための新しい推定器を提案する。この損失関数は、古典的な影の測定に基づいて訓練されたトランスフォーマーベースニューラルネットワークを用いて、GHZ状態の安定な再構成を実現するために利用できることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:29:13 GMT)
BiasDPO: Mitigating Bias in Language Models through Direct Preference Optimization [0.0]
大規模言語モデル(LLM)は、自然言語処理の進歩において重要な役割を担っているが、バイアスの持続可能性には重大な懸念がある。本稿では、英語テキストにおけるジェンダー、人種、宗教的偏見を緩和するために、DPO(Direct Preference Optimization)を用いた新しい枠組みを提案する。バイアスのある完了よりもバイアスの少ない損失関数を開発することで、我々のアプローチは敬意と非差別的な言語を好む。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:32:20 GMT)
Bayesian sequential design of computer experiments for quantile set inversion [0.0]
複素数値シミュレータのようなシステムを表現する未知の多変量関数を考える。我々の目的は、確率が与えられた閾値未満の出力につながる決定論的入力のセットを推定することである。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:21:58 GMT)
Ballistic conductance with and without disorder in a boundary-driven XXZ spin chain [0.0]
解析的手法と数値的手法を組み合わせた古典的変種について検討する。古典的モデルは量子結果を顕著に再現する。この現象学は結合障害を包含する上で極めて堅牢であることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:00:00 GMT)
Attention in SRAM on Tenstorrent Grayskull [0.0]
Tenstorrent Grayskullアーキテクチャは、コアの大きな分散グリッドを提供する。 Grayskull用の融合カーネルは、行列乗算、アテンションスケーリング、ソフトマックス演算を組み合わせたものである。 CPU実装と比較して、専用のSoftmaxカーネルの高速化は、最大10倍の価格である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 20:19:36 GMT)
Assurance of AI Systems From a Dependability Perspective [0.0]
リスクの高いコンピュータベースのシステムに対する古典的保証の原則を概説する。次に、人工知能(AI)と機械学習(ML)を用いたシステムへのこれらの原則の適用を検討する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 23:55:43 GMT)
Assessing LLMs Suitability for Knowledge Graph Completion [0.0]
大きな言語モデル(LLM)は知識グラフに関連するタスクを解決するために使用できる。 LLMは、答えを幻覚させることや、結果を非決定論的に出力することが知られている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:48:02 GMT)
Apparent delay of the Kibble-Zurek mechanism in quenched open systems [0.0]
クエンチ時間における新しい中間状態である$tau_q$を報告し、キブル・ズレック機構(KZM)の通常の妥当性を分離する。これは、システムが断熱的な体制に入るように見えるため、$tau_q$による遷移時間のゆるいスケーリングに現れます。この中間状態は、システムが衝動状態において凍結するのを防ぐ散逸によって出現する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 11:48:37 GMT)
Apparatus for Optical-Atomic System Integration & Calibration: 1 atm to 1$\times$10$^{-11}$ Torr in 24h [0.0]
本稿では,24時間以内で1時間10～11ドルTorrの排気,交換,避難が可能なロードロック装置を提案する。本システムでは,超低温原子を用いた様々なフォトニックデバイスの高速試験とベンチマークを行うことができる。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 03:38:46 GMT)
An Analysis of European Data and AI Regulations for Automotive Organizations [0.0]
本報告では、欧州連合の一連のデータおよびAI規制を要約し、自動車製造組織のマネージャに対して分析する。特に、以前の法律にルーツを見出す方法など、規制の関連する考え方を強調します。全体として、我々は欧州連合のデータ規制を、歴史的先例に根ざした波の集合として特徴づけ、自動車産業に重要な意味を持つ。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:38:13 GMT)
Algorithms for Non-Negative Matrix Factorization on Noisy Data With Negative Values [0.0]
非負行列分解(Non- negative matrix factorization, NMF)は, ノイズデータを解析するための次元還元法である。本稿では、入力データのノイズと導入された負性の両方を扱えるShift-NMFとNearly-NMFの2つのアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 21:36:01 GMT)
Agglomerative Hierarchical Clustering for Selecting Valid Instrumental Variables [0.0]
ここでは,IVs の最大群が有効であれば,本手法はオラクル特性を達成できることを示す。この方法は、移民が賃金に与える影響を推定するために適用される。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:35:40 GMT)
Affordance Perception by a Knowledge-Guided Vision-Language Model with Efficient Error Correction [0.0]
オープンワールド環境におけるロボットに対して,正確かつ行動可能な価格表現を提供する。我々は、この知識ベースを基礎となる視覚言語モデル(VLM)に接続し、VLMに、より広い種類の新しい、目に見えないオブジェクトを誘導する。空白表現,画像検出,ループ内の人間との混在は,ロボットが目標を達成するために対象を探索する上で有効である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 10:24:22 GMT)
Absence of barren plateaus and scaling of gradients in the energy optimization of isometric tensor network states [0.0]
広いハミルトンと有限範囲の相互作用を持つ量子多体系のエネルギー問題を考える。行列積状態,木テンソルネットワーク,およびマルチスケールエンタングル化再正規化アンサッツに対する変分最適化問題は,バレンプラトーを含まないことを証明した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 17:24:19 GMT)
AROhI: An Interactive Tool for Estimating ROI of Data Analytics [0.0]
データ分析を行う場合、Return On Investmentを検討することが重要です。この作業では、実証のための従来の高度なMLアプローチを提供する包括的なツールについて詳述する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:19:17 GMT)
AI-powered mechanisms as judges: Breaking ties in chess [0.0]
本稿では,AIによる客観的タイブレッシング機構を提案する。本手法は,強力なチェスエンジンによって提案される最適動作と比較することにより,選手の動きの質を評価する。このアプローチは、競争の公平性と完全性を高めるだけでなく、ゲームの高水準を維持している。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 13:58:34 GMT)
A time-parallel multiple-shooting method for large-scale quantum optimal control [0.0]
量子最適制御は、制御パルスを用いて量子システムを操り、論理ゲート変換を実現することにより、量子コンピューティングにおいて重要な役割を果たす。勾配法や勾配のない縮小空間法、フルスペースコロケーション法など、様々な手法が開発されている。本稿では,従来の手法の解の精度と計算効率のバランスをとることを目的とした,多重撮影に基づく中間的手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 23:57:26 GMT)
A novel translationally invariant supersymmetric chain with inverse-square interactions: partition function, thermodynamics and criticality [0.0]
我々は、ルート系に直接関連しない長距離相互作用を持つ翻訳不変su$(m|n)$スピン鎖の新しい族を導入する。我々はこれらのモデルの対称性を研究し、この種のシステムのボソン-フェルミオン双対性特性の存在を確立した。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 18:00:20 GMT)
A new approach towards quantum foundation and some consequences [0.0]
6つの仮定に基づく一般的な理論が紹介される。基本的な概念は、観測者または通信観測者のグループと関連付けられた理論変数である。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 19:54:58 GMT)
A new approach to delegate signing rights to proxy signers using isogeny-based cryptography [0.0]
CSI-PS(commutative supersingular isogeny proxy signature)を提案する。同種性に基づくグループアクション逆問題(IPGA)の硬度下では, uf-cmaが安全であることが証明された。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:19:19 GMT)
A deep latent variable model for semi-supervised multi-unit soft sensing in industrial processes [0.0]
半教師付きマルチユニットソフトセンシングのための潜時変動モデルを提案する。この階層的で生成的なモデルは、ラベル付きデータとラベルなしデータの両方から学習するだけでなく、異なるユニットを共同でモデル化することができる。半教師付き学習とマルチタスク学習を組み合わせることで,提案手法は優れた結果が得られることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 09:13:22 GMT)
A Labelled Dataset for Sentiment Analysis of Videos on YouTube, TikTok, and Other Sources about the 2024 Outbreak of Measles [0.0]
本稿では2024年1月1日から5月31日までに264のウェブサイトで公表された麻疹の流行に関する4011件のビデオデータを含むデータセットを提案する。 YouTubeとTikTokはそれぞれ48.6%と15.2%を占めている。これらのビデオのそれぞれについて、ビデオのURL、投稿のタイトル、投稿の説明、およびビデオの公開日をデータセット内の別の属性として提示する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 04:24:57 GMT)
A Foundation Model for Soccer [0.0]
提案するサッカーの基盤モデルでは,与えられたアクションの入力シーケンスから,サッカーの試合におけるその後のアクションを予測することができる。概念実証として,プロサッカーリーグの3シーズンのデータに対して,トランスフォーマーアーキテクチャをトレーニングする。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 15:42:08 GMT)
A Construction of Quantum Stabilizer Codes from Classical Codes and Butson Hadamard Matrices [0.0]
古典的線型符号 C が次元 k の F_qn の部分集合であれば、[[nm, ks, d]]_q 量子安定化符号は C と D によって決定される。一般正規化Butson Hadamard行列に対する量子符号の同じ構成を考察し、量子符号が安定化符号となる条件を探索する。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 14:00:38 GMT)
A BCS state formulation for the fermionic Tonks-Girardeau gas [0.0]
フェルミオン型トンクス・ジラルドーガスの基底状態波動関数の代替式を提案する。第二量子化の枠組みで提案された波動関数を表現することにより、フェルミオン型トンクス・ジラルドーガスの基底状態が数保存状態であることを示す。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 08:25:11 GMT)
"We're not all construction workers": Algorithmic Compression of Latinidad on TikTok [0.0]
ビデオ共有プラットフォームTikTokのアルゴリズムシステムについて,ラテックスの人々がどのように経験するかを検討した。 TikTokのラテン系ユーザーは、ポジティブなコンテンツフィードとアイデンティティーコンテンツフィードを積極的に利用しているが、これらのフィードはネガティブなコンテンツによって中断されている。
論文参考訳（メタデータ） (Thu, 18 Jul 2024 22:30:19 GMT)