Fugu-MT: arxivの論文翻訳(概要)

Technique Report of CVPR 2024 PBDL Challenges [211.8]
物理に基づくビジョンは、画像から形状、反射率、光の分布、中性などのシーン特性を復元する過程を反転させることを目的としている。深層学習は様々な視覚タスクに対して有望な改善を示しており、物理に基づく視覚と組み合わせることで、これらのアプローチは視覚システムの堅牢性と精度を高めることができる。 CVPR 2024ワークショップで行われたPBDL 2024チャレンジの結果を要約する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:31:25 GMT)
Benchmarking Generation and Evaluation Capabilities of Large Language Models for Instruction Controllable Summarization [132.3]
命令制御可能なテキスト要約の大規模言語モデル(LLM)をベンチマークする。本研究は,LLMにおいて,命令制御可能なテキスト要約が依然として困難な課題であることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:35:18 GMT)
OmniCorpus: A Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text [112.6]
我々は100億規模の画像テキストインターリーブデータセットであるOmniCorpusを紹介する。私たちのデータセットは、優れたデータ品質を維持しながら、15倍のスケールを持っています。これが将来のマルチモーダルモデル研究に確かなデータ基盤を提供することを期待しています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:54:51 GMT)
The Heterophilic Graph Learning Handbook: Benchmarks, Models, Theoretical Analysis, Applications and Challenges [101.8]
ホモフィリ原理では、同じラベルや類似属性を持つieノードが接続される可能性が高い。最近の研究で、GNNのパフォーマンスとNNのパフォーマンスが満足できない非自明なデータセットが特定されている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:04:32 GMT)
Compositional Structures in Neural Embedding and Interaction Decompositions [101.4]
ニューラルネットワークにおけるベクトル埋め込みにおける線形代数構造間の基本的な対応について述べる。相互作用分解」の観点から構成構造の特徴づけを導入する。モデルの表現の中にそのような構造が存在するためには、必要かつ十分な条件を確立する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:39:50 GMT)
SciEx: Benchmarking Large Language Models on Scientific Exams with Human Expert Grading and Automatic Grading [100.0]
LLM(Large Language Models)の一般的な用途は、科学的トピックに関するタスクを実行することである。そこで本稿では,大学生のこのような課題に対する評価方法に着想を得たSciExを提案する。我々は,新しいベンチマークを用いて,最先端のLLMの性能評価を行った。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:17:49 GMT)
Mobility VLA: Multimodal Instruction Navigation with Long-Context VLMs and Topological Graphs [95.8]
モビリティVLAは、環境理解と長文VLMの常識推論能力を組み合わせた、階層的なビジョン・ランゲージ・アクション(VLA)ナビゲーションポリシーである。従来未解決であったマルチモーダル命令に対して,モビリティVLAはエンドツーエンドの成功率が高いことを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:37:08 GMT)
ODMixer: Fine-grained Spatial-temporal MLP for Metro Origin-Destination Prediction [88.2]
具体的には、ODMixerは二重分岐構造を持ち、Channel Mixer、Multi-view Mixer、Bidirectional Trend Learnerが関与する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:01:46 GMT)
Can large language models explore in-context? [87.5]
単純なマルチアームバンディット環境において,エージェントとして大規模言語モデルをデプロイする。モデルが実質的な介入なしには、探索にしっかりと関わっていないことが分かっています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:52:49 GMT)
Robotic Control via Embodied Chain-of-Thought Reasoning [86.7]
学習したロボット制御ポリシーの鍵となる制限は、トレーニングデータの外部で一般化できないことである。視覚言語行動モデル(VLA)に関する最近の研究は、大規模なインターネット事前学習型視覚言語モデルを使用することで、その堅牢性と一般化能力を大幅に向上させることができることを示した。ロボットの動作を予測する前に、VLAに対して、計画、サブタスク、動作、視覚的接地機能について複数の推論を行うために、VLAに対してEmbodied Chain-of-Thought Reasoning (ECoT)を導入する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:19:34 GMT)
PredBench: Benchmarking Spatio-Temporal Prediction across Diverse Disciplines [86.4]
予測時間ネットワークの総合評価に適したベンチマークであるPredBenchを紹介する。このベンチマークでは、広く採用されている12のメソッドと、複数のアプリケーションドメインにまたがる多様なデータセットを統合する。その多次元評価フレームワークは、総合的なメトリクスセットで分析を広げる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:55:16 GMT)
SceneGraphLoc: Cross-Modal Coarse Visual Localization on 3D Scene Graphs [81.2]
SceneGraphLocはシーングラフ内の各ノード(つまりオブジェクトインスタンスを表す)に対する固定サイズの埋め込みを学習する。画像を利用する場合、SceneGraphLocは、大規模な画像データベースに依存する最先端技術に近いパフォーマンスを達成する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:00:03 GMT)
Jailbreaking as a Reward Misspecification Problem [80.5]
本稿では,この脆弱性をアライメントプロセス中に不特定性に対処する新たな視点を提案する。本稿では,報酬の誤特定の程度を定量化するための指標ReGapを紹介し,有害なバックドアプロンプトを検出する上での有効性とロバスト性を示す。 ReMissは、様々な目標に整列したLDMに対して対向的なプロンプトを生成する自動レッドチームリングシステムである。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:15:45 GMT)
Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI [78.6]
人工知能(Embodied AI)は、人工知能(AGI)の実現に不可欠である MLMとWMは、その顕著な知覚、相互作用、推論能力のために、大きな注目を集めている。本調査では,Embodied AIの最近の進歩を包括的に調査する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:48:00 GMT)
Stepwise Verification and Remediation of Student Reasoning Errors with Large Language Model Tutors [78.5]
大規模言語モデル(LLM)は、高品質なパーソナライズされた教育を全員に拡大する機会を提供する。 LLMは、学生のエラーを正確に検知し、これらのエラーに対するフィードバックを調整するのに苦労する。教師が学生の誤りを識別し、それに基づいて回答をカスタマイズする現実世界の教育実践に触発され、我々は学生ソリューションの検証に焦点をあてる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:11:40 GMT)
A Survey of Attacks on Large Vision-Language Models: Resources, Advances, and Future Trends [78.3]
LVLM(Large Vision-Language Models)は、多モーダルな理解と推論タスクにまたがる顕著な能力を示す。 LVLMの脆弱性は比較的過小評価されており、日々の使用において潜在的なセキュリティリスクを生じさせる。本稿では,既存のLVLM攻撃の様々な形態について概説する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:58:05 GMT)
Diversifying the Expert Knowledge for Task-Agnostic Pruning in Sparse Mixture-of-Experts [75.9]
そこで本研究では,モデルパラメータ効率を向上させるために,類似の専門家をグループ化し,グループ化する方法を提案する。本手法は,Mixtral-8x7BとMixtral-8x22Bの2種類のMoEモデルを用いて評価を行った。本手法は,様々な自然言語タスクにおいて,他のモデルプルーニング手法よりも優れる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:25:02 GMT)
Long-term drought prediction using deep neural networks based on geospatial weather data [75.4]
農業計画や保険には1年前から予測される高品質の干ばつが不可欠だ。私たちは、体系的なエンドツーエンドアプローチを採用するエンドツーエンドアプローチを導入することで、干ばつデータに取り組みます。主な発見は、TransformerモデルであるEarthFormerが、正確な短期(最大6ヶ月)の予測を行う際の例外的なパフォーマンスである。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:05:50 GMT)
ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.6]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:44:33 GMT)
Imaging Interiors: An Implicit Solution to Electromagnetic Inverse Scattering Problems [74.3]
EISP(Electromagnetic Inverse Scattering Problems)は、計算画像に広く応用されている。本稿では,EISPにおけるこれらの課題に,暗黙のアプローチで対処する。我々のアプローチは、標準ベンチマークデータセットにおける既存のメソッドよりも優れています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:25:54 GMT)
Bias and Fairness in Large Language Models: A Survey [73.9]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 20:29:57 GMT)
Towards Robust Temporal Reasoning of Large Language Models via a Multi-Hop QA Dataset and Pseudo-Instruction Tuning [73.5]
大規模言語モデル(LLM)には時間的知識の概念を理解することが不可欠である。本稿では,複数質問応答と複数ホップの時間的推論に焦点をあてた複雑な時間的質問応答データセットであるComplex-TRを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:37:14 GMT)
Real-time gravitational-wave inference for binary neutron stars using machine learning [71.3]
近似を行なわずに1秒で完全なBNS推論を行う機械学習アプローチを開発する。提案手法は, 最大1時間までの非常に長い信号にスケールし, 次世代地上・宇宙用検出器のデータ解析の青写真として機能する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:00:02 GMT)
Segment Any 4D Gaussians [69.5]
我々は,4次元ガウスアン(SA4D)をベースとした4次元デジタル世界において,任意の4次元ガウスアン(SA4D)をセグメンテーションすることを提案する。 SA4Dは4Dガウスで数秒以内の精度で高品質なセグメンテーションを実現し、高品質なマスクを取り除き、色を変え、構成し、レンダリングする能力を示している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:06:25 GMT)
Vision-Language Models as a Source of Rewards [68.5]
強化学習エージェントの報酬源として市販の視覚言語モデル(VLM)の有効性を検討する。様々な言語目標の視覚的達成に対する報酬は、CLIPファミリーのモデルから導き出すことができ、様々な言語目標を達成するためのRLエージェントの訓練に使用されることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:14:32 GMT)
Inference Optimization of Foundation Models on AI Accelerators [68.2]
トランスフォーマーアーキテクチャを備えた大規模言語モデル(LLM)を含む強力な基礎モデルは、ジェネレーティブAIの新たな時代を支えている。モデルパラメータの数が数十億に達すると、実際のシナリオにおける推論コストと高いレイテンシーが排除される。このチュートリアルでは、AIアクセラレータを用いた補完推論最適化テクニックに関する包括的な議論を行っている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:24:34 GMT)
On scalable oversight with weak LLMs judging strong LLMs [67.9]
我々は、2つのAIが1人の裁判官を納得させようとする議論、すなわち1人のAIが1人の裁判官を説得し、質問をする。大規模言語モデル(LLM)をAIエージェントと人間の判断のためのスタンドインの両方として使用し、判断モデルがエージェントモデルよりも弱いと判断する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:38:12 GMT)
Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments [67.8]
我々は,現在のLiDARに基づく3Dオブジェクト検出システムの限界に対処する。本稿では,3次元OVタスクに対する汎用textscFind n' Propagate アプローチを提案する。我々は、新しいオブジェクトクラスに対する平均精度(AP)を最大3.97倍に向上させる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:42:30 GMT)
Refuse Whenever You Feel Unsafe: Improving Safety in LLMs via Decoupled Refusal Training [67.3]
本研究では,Large Language Models (LLMs) の安全性チューニングにおける重要なギャップについて考察する。我々は,LLMに対して,いかなる応答位置においても有害なプロンプトへのコンプライアンスを拒否する権限を与える新しいアプローチであるDecoupled Refusal Training(DeRTa)を導入する。 DeRTaは、(1)安全応答の開始に有害な応答のセグメントを付加することにより、安全でないコンテンツを認識・回避するようモデルに訓練する、(1)有害応答前フィックスによる最大限の類似度推定、(2)有害応答の開始を通して潜在的害から安全拒絶へ継続的に移行する能力を持つ強化遷移最適化(RTO)という2つの新しいコンポーネントを組み込んでいる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:36:33 GMT)
EnvGen: Generating and Adapting Environments via LLMs for Training Embodied Agents [65.4]
トレーニング環境を適応的に作成するフレームワークであるEnvGenを提案する。我々は、LLM生成環境とLLM生成環境を混合した小さなRLエージェントを訓練する。我々は、EnvGenで訓練された小さなRLエージェントが、GPT-4エージェントを含むSOTAメソッドより優れており、長い水平タスクをかなり高速に学習できることを発見した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:39:19 GMT)
HiFi-123: Towards High-fidelity One Image to 3D Content Generation [64.8]
HiFi-123は高忠実で多視点で一貫した3D生成のために設計された手法である。本稿では,拡散型ゼロショットノベルビュー合成法の忠実度を大幅に向上する参照ガイド型新規ビュー拡張(RGNV)技術を提案する。また,新たにRGSD(Reference-Guided State Distillation)を施行した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:55:26 GMT)
Any-point Trajectory Modeling for Policy Learning [64.2]
我々は、ビデオフレーム内の任意の点の将来の軌跡を予測するために、ATM(Any-point Trajectory Modeling)を導入する。 ATMは、強力なビデオ事前トレーニングベースラインを平均80%上回っている。本研究では,人間の動画やビデオからの操作スキルを,異なるロボット形態から効果的に伝達する学習方法を示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:51:00 GMT)
VideoDirectorGPT: Consistent Multi-scene Video Generation via LLM-Guided Planning [62.5]
VideoDirectorGPTは、一貫したマルチシーンビデオ生成のための新しいフレームワークである。提案手法は,複数シーンのビデオ生成におけるレイアウトと移動制御を大幅に改善する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:03:29 GMT)
Asymmetric GANs for Image-to-Image Translation [62.5]
GAN(Generative Adversarial Networks)の既存のモデルは、サイクル一貫性損失を使用して、ソースドメインからターゲットドメインへのマッピングを学習する。非対称GANモデルを提案し、不等サイズと異なるパラメータ共有戦略の変換と再構成の両方を行う。 8つのデータセットを用いた教師付きおよび教師なし生成タスクの実験は、非対称GANが優れたモデルキャパシティとより良い生成性能を達成することを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:34:52 GMT)
Alternate Diverse Teaching for Semi-supervised Medical Image Segmentation [62.0]
そこで我々は,教師-学生の枠組みにおける多様な教育手法であるAD-MTを提案する。一人の生徒モデルと2つの訓練不可能な教師モデルがあり、それは定期的に、ランダムに、別の方法で、モーメントを更新する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:23:31 GMT)
One for All: Towards Training One Graph Model for All Classification Tasks [61.7]
様々なグラフタスクの統一モデルは、主にグラフ学習領域に固有の課題のために、まだ探索されていない。上記の課題に対処するために単一のグラフモデルを使用できる最初の汎用フレームワークである textbfOne for All (OFA) を提案する。 OFAは様々なタスクでうまく機能し、グラフ上の最初の汎用のクロスドメイン分類モデルとなる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 23:01:32 GMT)
Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering [59.1]
ビジュアルテキストレンダリングは、テキストから画像生成モデルにとって根本的な課題である。文字認識のBYT5エンコーダを微調整することで、一連のカスタマイズされたテキストエンコーダ、Glyph-ByT5を作成します。本稿では,Glyph-ByT5をSDXLに統合する方法を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:39:31 GMT)
Placing Objects in Context via Inpainting for Out-of-distribution Segmentation [59.0]
コンテキスト内のオブジェクトの配置(POC)は、イメージにオブジェクトを現実的に追加するためのパイプラインである。 POCは任意の数のオブジェクトで任意のデータセットを拡張するために使用することができる。本稿では,POC 生成データに基づく様々な異常セグメンテーションデータセットを提示し,最近の最先端の異常チューニング手法の性能向上を実証する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:19:19 GMT)
Conformal Inductive Graph Neural Networks [58.5]
コンフォーマル予測(CP)は、任意のモデルの出力を真のラベルを含むことが保証された予測セットに変換する。 CPは、有効な分布のないカバレッジを保証するために、i.d.仮定の緩和である交換可能性を必要とする。従来のCPは、新しいノードとのメッセージパッシングによって生じる(校正)スコアの暗黙的なシフトのため、誘導的な設定では適用できない。保証が予測時間(例えば、新しいノード/エッジの到着時や後続の瞬間)とは独立に成り立つことを証明します。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:12:49 GMT)
Facial Affective Behavior Analysis with Instruction Tuning [58.3]
顔の感情行動分析(FABA)は、画像から人間の精神状態を理解するために重要である。従来のアプローチでは、主に個別の感情カテゴリーを識別するためのモデルをデプロイし、複雑な顔の振る舞いに対する細かい粒度と推論能力が欠如している。本稿では,2つのFABAタスクに対する指示追従データセット,感情と行動の単位認識,および認識能力と生成能力の両方を考慮したベンチマークFABA-Benchを紹介する。また,顔構造知識と低ランク適応モジュールを事前学習MLLMに導入した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:52:03 GMT)
Dynamic neural network with memristive CIM and CAM for 2D and 3D vision [57.6]
本稿では,memristor を用いた意味記憶に基づく動的ニューラルネットワーク (DNN) を提案する。ネットワークは、受信したデータとセマンティックベクターとして格納された過去の経験を関連付ける。 MNISTとModelNetのデータセットから画像と3Dポイントを分類するために、ResNetとPointNet++の40nmのmemristorマクロを用いて、我々の共同設計を検証する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:55:57 GMT)
Divide and Fuse: Body Part Mesh Recovery from Partially Visible Human Images [57.5]
ディバイドとフューズ」戦略は、人体部分を融合する前に独立して再構築する。 Human Part Parametric Models (HPPM) は、いくつかの形状とグローバルな位置パラメータからメッシュを独立に再構築する。特別に設計された融合モジュールは、一部しか見えない場合でも、再建された部品をシームレスに統合する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:29:11 GMT)
Revisit Human-Scene Interaction via Space Occupancy [55.7]
HSI(Human-Scene Interaction)の生成は、さまざまな下流タスクに不可欠な課題である。本研究では,シーンとのインタラクションが,抽象的な物理的視点からシーンの空間占有と本質的に相互作用していることを論じる。純粋な動きシーケンスを、見えないシーン占有と相互作用する人間の記録として扱うことで、動きのみのデータを大規模にペア化された人間-占有相互作用データベースに集約することができる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:25:13 GMT)
HAC: Hash-grid Assisted Context for 3D Gaussian Splatting Compression [55.6]
3D Gaussian Splatting (3DGS) は、新しいビュー合成のための有望なフレームワークとして登場した。高速な3DGS表現のためのHash-grid Assisted Context (HAC) フレームワークを提案する。私たちの研究は、コンテキストベースの3DGS表現の圧縮を探求するパイオニアです。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:01:32 GMT)
SSIP: automated surgery with quantum LDPC codes [55.2]
クビットCSSコード間の手術を自動化するための,オープンソースの軽量PythonパッケージであるSSIP(Identifying Pushouts)による安全手術について述べる。ボンネットの下では、鎖複体の圏における普遍構成によって支配される$mathbbF$上の線型代数を実行する。高い符号距離を犠牲にすることなく,手術によって様々な論理的測定を安価に行うことができることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:50:01 GMT)
A Benchmark Environment for Offline Reinforcement Learning in Racing Games [54.8]
オフライン強化学習(英語: Offline Reinforcement Learning、ORL)は、従来の強化学習(RL)の高サンプリング複雑さを減らすための有望なアプローチである。本稿では,ORL研究のための新しい環境であるOfflineManiaを紹介する。 TrackManiaシリーズにインスパイアされ、Unity 3Dゲームエンジンで開発された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:44:03 GMT)
Introducing Routing Functions to Vision-Language Parameter-Efficient Fine-Tuning with Low-Rank Bottlenecks [54.3]
低ランクボトルネックにおける視覚言語(VL)アライメントを高めるために,ルーティング関数と呼ばれる操作群を提案する。様々なVL PEFT設定において、ルーティング機能は元のPEFT法の性能を大幅に改善する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:54:42 GMT)
ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.1]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。 PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。 PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:38:56 GMT)
LAKE-RED: Camouflaged Images Generation by Latent Background Knowledge Retrieval-Augmented Diffusion [54.0]
カモフラージュ画像生成のためのLAKE-RED(Latent background Retrieval-Augmented Diffusion)を提案する。本手法は,カモフラージュ生成のための解釈可能性を持つ知識検索拡張手法である。実験の結果,本手法は既存の手法よりも優れていることがわかった。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:28:46 GMT)
Robust Yet Efficient Conformal Prediction Sets [53.8]
コンフォーマル予測(CP)は、任意のモデルの出力を真のラベルを含むことが保証された予測セットに変換することができる。整合性スコアの最悪のケース変化をバウンドすることで、証明可能なロバストな集合を導出する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:59:44 GMT)
A Perspective on Foundation Models for the Electric Power Grid [53.0]
ファンデーションモデル(FM)がニュースの見出しを支配している。多様なグリッドデータやトポロジからFMを学習することで、トランスフォーメーション能力が解放されるのではないか、と私たちは主張する。本稿では,グラフニューラルネットワークに基づく電力グリッドFMの概念,すなわちGridFMについて論じる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:09:47 GMT)
NeuSDFusion: A Spatial-Aware Generative Model for 3D Shape Completion, Reconstruction, and Generation [52.8]
3D形状生成は、特定の条件や制約に固執する革新的な3Dコンテンツを作成することを目的としている。既存の方法は、しばしば3Dの形状を局所化されたコンポーネントの列に分解し、各要素を分離して扱う。本研究では2次元平面表現を利用した空間認識型3次元形状生成フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:30:00 GMT)
SimNP: Learning Self-Similarity Priors Between Neural Points [52.4]
SimNPはカテゴリーレベルの自己相似性を学ぶ方法である。我々は、SimNPが対称な見えない対象領域の再構成において、従来の手法より優れていることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:45:41 GMT)
MetaFood CVPR 2024 Challenge on Physically Informed 3D Food Reconstruction: Methods and Results [52.1]
私たちはMetaFood Workshopを主催し、物理的にインフォームドされた3Dフードレコンストラクションへの挑戦を行っている。本課題は,2次元画像から,視認性チェッカーボードをサイズ基準として,食品の容積正確な3次元モデルを再構築することに焦点を当てる。この課題で開発されたソリューションは、3D食品の復元において有望な成果を達成し、食事評価と栄養モニタリングのための部分推定の改善に有意な可能性を秘めている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:15:48 GMT)
A Fair Ranking and New Model for Panoptic Scene Graph Generation [51.8]
Decoupled SceneFormer(DSFormer)は、既存のすべてのシーングラフモデルよりも優れた2段階モデルである。基本設計原則として、DSFormerは被写体とオブジェクトマスクを直接特徴空間にエンコードする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:28:08 GMT)
Infinite Motion: Extended Motion Generation via Long Text Instructions [51.6]
『無限運動』は、長文を長文から拡張運動生成に活用する新しいアプローチである。我々のモデルの主な革新は、任意の長さのテキストを入力として受け入れることである。テキストのタイムスタンプ設計を取り入れ、生成されたシーケンス内のローカルセグメントの正確な編集を可能にする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:12:05 GMT)
Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning [51.5]
本稿では,HOP(Hierarchical Opponent Modeling and Planning)を提案する。 HOPは階層的に2つのモジュールから構成される: 相手の目標を推論し、対応する目標条件のポリシーを学ぶ、反対モデリングモジュール。 HOPは、さまざまな未確認エージェントと相互作用する際、優れた少数ショット適応能力を示し、セルフプレイのシナリオで優れている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:13:43 GMT)
Pre-training Point Cloud Compact Model with Partial-aware Reconstruction [51.4]
本稿では, 部分認識型textbfReconstruction を用いた, Point-CPR という事前学習型クラウド圧縮モデルを提案する。我々のモデルは様々なタスクにおいて強い性能を示し、特にパラメータの2%しか持たない主要なMPMベースモデルであるPointGPT-Bを上回っている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:18:14 GMT)
What an Elegant Bridge: Multilingual LLMs are Biased Similarly in Different Languages [51.0]
本稿では,Large Language Models (LLMs) の文法的ジェンダーのレンズによるバイアスについて検討する。様々な言語における形容詞を持つ名詞を記述するためのモデルを提案し,特に文法性のある言語に焦点を当てた。単純な分類器は、偶然以上の名詞の性別を予測できるだけでなく、言語間の移動可能性も示せる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 22:10:16 GMT)
Stephanie: Step-by-Step Dialogues for Mimicking Human Interactions in Social Conversations [50.7]
本研究では,人間の会話の動的な性質を模倣する新しいテキストbf-by-Step Dialogue Paradigm (Stephanie)を提案する。デュアルラーニング戦略と,さらに分割した後編集手法を用いて,高品質なステップバイステップ対話データセットを作成した。従来の単段階対話のパラダイムと比較して,その効果を評価するために,自動評価と人的評価を行った。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:15:10 GMT)
Distributed Backdoor Attacks on Federated Graph Learning and Certified Defenses [50.5]
我々は,FedGLに対する効果的な,ステルス的で永続的なバックドア攻撃を提案する。我々は,任意の位置において任意の形状のトリガに対して,バックドアのFedGLモデルに対する認証された防御を開発する。我々の攻撃結果は、ほぼ全てのデータセットで90%以上のバックドア精度が得られることを示している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:43:44 GMT)
PriRoAgg: Achieving Robust Model Aggregation with Minimum Privacy Leakage for Federated Learning [49.9]
フェデレートラーニング(FL)は、大規模分散ユーザデータを活用する可能性から、最近大きな勢いを増している。送信されたモデル更新は、センシティブなユーザ情報をリークする可能性があり、ローカルなトレーニングプロセスの集中的な制御の欠如は、モデル更新に対する悪意のある操作の影響を受けやすいグローバルモデルを残します。我々は、Lagrange符号化計算と分散ゼロ知識証明を利用した汎用フレームワークPriRoAggを開発し、集約されたプライバシを満たすとともに、幅広いロバストな集約アルゴリズムを実行する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:18:08 GMT)
TalkCLIP: Talking Head Generation with Text-Guided Expressive Speaking Styles [49.2]
本研究では,自然言語で表現を指定した発話ヘッドを生成可能なフレームワークであるTalkCLIPを提案する。テキストから表現へのマッピングをモデル化するために,まず,テキストとビデオのペアによる発話ヘッドデータセットを構築した。自然言語による記述を表現表現に投影するCLIPベースのスタイルエンコーダを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:55:40 GMT)
Adaptive Human Trajectory Prediction via Latent Corridors [49.1]
シーン固有の適応軌道予測の問題を定式化する。本稿では,潜伏回廊と呼ばれる即時チューニングにインスパイアされた新しい適応手法を提案する。 0.1%の追加モデルパラメータでは、MOTシンスシミュレーションデータの改善が23.9%、MOTおよびワイルドトラックにおけるADEが16.4%となる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:30:42 GMT)
Empowering Few-Shot Relation Extraction with The Integration of Traditional RE Methods and Large Language Models [48.8]
Few-Shot Relation extract (FSRE)は自然言語処理(NLP)の研究者にアピールする大規模言語モデル(LLM)の近年の出現により、多くの研究者が文脈学習(ICL)を通じてFSREを探求している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:31:11 GMT)
Skill-Critic: Refining Learned Skills for Hierarchical Reinforcement Learning [48.8]
そこで本研究では,高レベルのスキル選択とともに,低レベルのポリシーを微調整するSkill-Criticアルゴリズムを提案する。グラナ・トゥリストスポーツにおけるスパース・リワード自律レースタスクを含む,複数のスパース・リワード環境におけるスキル・クリティカルの検証を行った。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:59:00 GMT)
RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL [48.5]
文脈内学習を伴う大規模言語モデル(LLM)は、テキスト・ツー・タスクの性能を大幅に改善した。 In-context prompt Engineering のための新しい検索ベースフレームワーク RB- を提案する。実験により,我々のモデルは,公開データセットのBIRDとSpiderの競合ベースラインよりも優れた性能が得られることが示された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:24:12 GMT)
Hamba: Single-view 3D Hand Reconstruction with Graph-guided Bi-Scanning Mamba [48.5]
1枚のRGB画像からの3Dハンド再構成は、関節運動、自己閉塞、物体との相互作用により困難である。既存のSOTA法では、3Dハンドポーズと形状を学ぶためにアテンションベースのトランスフォーマーを採用している。本稿では,グラフ学習と状態空間モデリングを橋渡しするHambaというグラフ誘導型Mambaフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:04:58 GMT)
Unsupervised Anomaly Detection Using Diffusion Trend Analysis [48.2]
本稿では, 劣化度に応じて, 復元傾向の分析により異常を検出する手法を提案する。提案手法は,産業用異常検出のためのオープンデータセット上で検証される。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:50:07 GMT)
Towards More Trustworthy and Interpretable LLMs for Code through Syntax-Grounded Explanations [48.1]
ASTrustは、モデル信頼度とプログラミング言語の構文構造の関係に基づく説明を生成する。 ASTからの構文構造のシーケンス, 熱マップ, グラフに基づく可視化を重畳した, モデル信頼度スコアを自動可視化する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:38:28 GMT)
Internet of Federated Digital Twins (IoFDT): Connecting Twins Beyond Borders for Society 5.0 [47.6]
デジタルツイン(DT)の概念は将来の産業に革命をもたらすことが期待されており、将来のスマート社会、すなわち社会5.0のビジョンの中心に位置する。本稿では,異なる社会5.0 サービスを表す DT を全体統合した,インターネット・オブ・フェデレーション・デジタル・ツインズ (IoFDT) の新たな概念を思い起こさせる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:49:41 GMT)
A Neural Rewriting System to Solve Algorithmic Problems [47.1]
ネストされた数学的公式を解くための一般的な手順を学習するために設計されたモジュラーアーキテクチャを提案する。シンボリック人工知能の古典的なフレームワークである書き換えシステムに触発され、アーキテクチャには3つの専門的で対話的なモジュールが含まれます。我々は、系統的な一般化に特化した最近のモデルであるNeural Data Routerと、先進的なプロンプト戦略で探索された最先端の大規模言語モデル(GPT-4)とを比較した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:42:45 GMT)
Learning Neural Volumetric Pose Features for Camera Localization [47.1]
本稿では,PoseMapと呼ばれるニューラルボリュームポーズ機能を導入し,カメラのローカライゼーションを強化した。我々のフレームワークは、拡張されたNeRFモジュールとともにAPR(Absolute Pose Regression)アーキテクチャを活用している。室内および屋外のベンチマークシーンで平均14.28%, 20.51%の性能向上が得られた。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:32:19 GMT)
Detect, Investigate, Judge and Determine: A Novel LLM-based Framework for Few-shot Fake News Detection [47.0]
Few-Shot Fake News Detectionは、極めて低リソースのシナリオにおいて、不正確なニュースを実際のニュースと区別することを目的としている。ソーシャルメディア上でのフェイクニュースの拡散や有害な影響により、このタスクは注目を集めている。そこで本稿では,大規模言語モデルの拡張を目的としたDual-perspective Augmented Fake News Detectionモデルを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:15:01 GMT)
Glyph-ByT5-v2: A Strong Aesthetic Baseline for Accurate Multilingual Visual Text Rendering [46.3]
Glyph-ByT5はグラフィックデザイン画像における高精度な視覚テキストレンダリング性能を実現している。現在でも英語のみに特化しており、視覚的魅力の面では比較的貧弱である。 Glyph-ByT5-v2 と Glyph-SDXL-v2 は 10 言語で正確なビジュアルテキストレンダリングをサポートする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:26:40 GMT)
Convex Relaxations of ReLU Neural Networks Approximate Global Optima in Polynomial Time [45.7]
本稿では,2層ReLULUネットワーク間における重み減衰と凸緩和の最適性ギャップについて検討する。私たちの研究は、なぜローカルメソッドがうまく機能するのかを理解することに新たな光を当てています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:55:53 GMT)
Open Vocabulary Multi-Label Video Classification [45.7]
この問題をオープン語彙多ラベルビデオ分類として定式化し、CLIPなどの事前学習VLMを適用してこの問題を解決する方法を提案する。本稿では,LLMにCLIPテキストエンコーダのソフト属性を生成して,新しいクラスを認識できるようにする,エンドツーエンドのトレーニング可能なアーキテクチャを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:53:54 GMT)
Reshaping the Online Data Buffering and Organizing Mechanism for Continual Test-Time Adaptation [45.2]
継続的なテスト時間適応は、訓練済みのソースモデルを適用して、教師なしのターゲットドメインを継続的に変更する。我々は、オンライン環境、教師なしの自然、エラー蓄積や破滅的な忘れのリスクなど、このタスクの課題を分析する。本研究では,教師なしシングルパスデータストリームから重要なサンプルを高い確実性で識別する不確実性を考慮したバッファリング手法を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:48:40 GMT)
Generative Models for Synthetic Urban Mobility Data: A Systematic Literature Review [45.0]
この体系的なレビューは、この異質で活発な研究分野の現状に関する構造化された比較概要を提供する。レビューされたモデルの適用性に特に焦点が当てられている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:54:29 GMT)
Global-Local Collaborative Inference with LLM for Lidar-Based Open-Vocabulary Detection [44.9]
Open-Vocabulary Detection (OVD)は、事前に定義されたオブジェクトクラスなしで、あるシーンですべての興味深いオブジェクトを検出するタスクである。我々は,ライダーに基づくOVDタスクのためのグローバルローカル協調スキーム(GLIS)を提案する。グローバルなローカル情報では、Large Language Model (LLM) がチェーン・オブ・シント推論に適用される。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:34:11 GMT)
AirSketch: Generative Motion to Sketch [44.5]
本研究では,手の動きから直接忠実で視覚的に整合したスケッチを生成することを目的としたAirSketchの概念を紹介する。制御可能な画像拡散モデルにより、ノイズの多い手追跡画像から、きれいで美的なスケッチへの翻訳を学習することができる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:52:04 GMT)
A Spatio-temporal Aligned SUNet Model for Low-light Video Enhancement [44.2]
STA-SUNetモデルは、新しい完全に登録されたデータセット(BVI)に基づいて訓練される 3つのテストデータセット上で、他のさまざまなモデルに対して比較的分析されている。極端に低照度な条件下では特に有効であり、非常に良好な視覚化結果をもたらす。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:05:46 GMT)
ImageFlowNet: Forecasting Multiscale Trajectories of Disease Progression with Irregularly-Sampled Longitudinal Medical Images [44.1]
ImageFlowNetは、共同埋め込み空間におけるマルチスケール表現を進化させる潜在空間フローフィールドを学習する新しいフレームワークである。我々は、ODEの定式化を支援し、高レベルの視覚的特徴を含む正規化を動機付ける理論的洞察を提供する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:28:55 GMT)
SpreadsheetLLM: Encoding Spreadsheets for Large Language Models [44.1]
SpreadsheetLLMは、スプレッドシート上の大きな言語モデル(LLM)を解き放つために設計された効率的な符号化手法である。 LLMのスプレッドシートを効果的に圧縮する革新的な符号化フレームワークである SheetCompressor を開発した。 SheetCompressor による微調整 LLM の圧縮率は平均 25 倍であるが、最先端の 78.9% の F1 スコアを達成し、既存のモデルでは 12.3% を上回っている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:34:21 GMT)
Domain-adaptive Video Deblurring via Test-time Blurring [43.4]
未確認領域におけるデブロアリングモデルに対するテスト時間微調整を実現するために, ぼかしモデルに基づくドメイン適応方式を提案する。そこで本手法では, 対象領域の劣化モデルを校正するために, ドメイン適応型トレーニングペアを生成することができる。提案手法は,最先端の映像復号化手法を大幅に改善し,実世界の映像復号化データセットに対して最大7.54dBの性能向上を実現する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:28:01 GMT)
Robustness of Explainable Artificial Intelligence in Industrial Process Modelling [43.4]
我々は,地中真実シミュレーションと感度解析に基づいて,現在のXAI手法を評価する。モデル化された産業プロセスの真の感度を正確に予測する能力において,XAI法とXAI法の違いを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:46:26 GMT)
Molecule Language Model with Augmented Pairs and Expertise Transfer [43.3]
AMOLE は,(1) 構造的類似性を保った分子文対を増大させ,2) 分子間の専門知識を伝達する。様々な下流タスクに関する大規模な実験は、コンプレッション分子におけるAMOLEの優位性とその説明を実証している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:09:10 GMT)
SPIQA: A Dataset for Multimodal Question Answering on Scientific Papers [43.2]
SPIQAは、科学研究論文の文脈内で複雑な図形や表を解釈するために設計されたデータセットである。データセット作成には自動および手動のキュレーションを使用します。 SPIQAは270Kの質問をトレーニング、検証、3つの異なる評価分割に分割する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:37:59 GMT)
Deep Learning Safety Concerns in Automated Driving Perception [43.0]
本稿では、クロスファンクショナルなチームが共同で関心事に対処できるようにするとともに、理解を深めるための追加の分類を紹介します。近年のディープラーニング分野の進歩と認識のためのディープニューラルネットワーク(DNN)の性能向上により、自動走行(AD)システムへの需要が高まっている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:46:08 GMT)
PAIL: Performance based Adversarial Imitation Learning Engine for Carbon Neutral Optimization [42.9]
既存のDeep Reinforcement Learning (DRL) 手法では、それぞれのアクションが最終的な持続可能な開発目標に与える影響を評価するために、事前に定義された報酬関数が必要である。本研究では,PAIL(Performance Based Adversarial Learning)エンジンを提案する。これは、事前に定義されたアクション報酬を伴わずに、炭素中立性のための最適な操作ポリシーを取得するための新しい方法である。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:06:01 GMT)
LPViT: Low-Power Semi-structured Pruning for Vision Transformers [42.9]
画像解析タスクのための畳み込みニューラルネットワークの代替手段として、ビジョントランスフォーマー(ViT)が登場した。 ViTの重大な欠点の1つは、リソース集約性であり、メモリフットプリント、複雑性、消費電力が増加することである。我々は,ViTの資源集約的な問題に対処するため,新しいブロック構造プルーニングを導入し,精度とハードウェアアクセラレーションのバランスのとれたトレードオフを提供する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:55:07 GMT)
From MIDI to Rich Tablatures: an Automatic Generative System incorporating Lead Guitarists' Fingering and Stylistic choices [42.4]
簡単なMIDIメロディから,指や調音,表現技術に富んだタブを生成できるシステムを提案する。提案手法の質と高い構成性はいくつかの影響を及ぼす可能性がある。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:18:24 GMT)
Bayesian Learning-driven Prototypical Contrastive Loss for Class-Incremental Learning [42.1]
本稿では,クラス増分学習シナリオに特化して,ベイズ学習駆動型コントラスト損失(BLCL)を持つプロトタイプネットワークを提案する。提案手法は,ベイズ学習手法を用いて,クロスエントロピーとコントラスト損失関数のバランスを動的に適用する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:14:33 GMT)
Instruction Following with Goal-Conditioned Reinforcement Learning in Virtual Environments [42.1]
本稿では,大規模言語モデルの深い言語理解と強化学習エージェントの適応行動実行能力を組み合わせた階層型フレームワークを提案する。 IGLUではエージェントが構造を構築するように指示され、Crafterではエージェントがタスクを実行し、言語コマンドに従って周辺環境のオブジェクトと対話する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:19:36 GMT)
Multi-Token Joint Speculative Decoding for Accelerating Large Language Model Inference [41.9]
大規模言語モデル (LLM) は様々なタスクにおいてそのパワーを実証しているが、その推論にはかなりの時間とエネルギーコストがかかる。投機的復号法は、より小さなモデルを用いて1つのトークン列を提案し、その後ターゲットの大モデルによってバッチで検証される。自己回帰復号法と比較すると、投機的復号法は同じ数のトークンを生成し、大きなモデルの実行量は少ない。投機的復号化よりも出力の難易度と効率性が良いアルゴリズムは、実際より有用である。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 23:29:54 GMT)
From Easy to Hard: Learning Curricular Shape-aware Features for Robust Panoptic Scene Graph Generation [41.9]
パノプティック・シーングラフ生成(PSG)は、パノプティック・セグメンテーション・マスクに基づく総合的なグラフ構造表現を作成することを目的としている。そこで本研究では,PSG のためのモデルに依存しない shApe-aware feature (CAFE) 学習戦略を提案する。本稿では,人間の認識からインスピレーションを得た形状認識機能を,使い易い方法で統合することを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:48:33 GMT)
GAVEL: Generating Games Via Evolution and Language Models [40.9]
我々は,Ludiiゲーム記述言語における新規ゲームの生成について検討する。我々は、コードとして表現されたゲームやメカニクスをインテリジェントに変更し、再結合するモデルを訓練する。生成されたゲームのサンプルは、Ludiiポータルからオンラインでプレイすることができる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:08:44 GMT)
Improving Alignment and Robustness with Circuit Breakers [40.5]
本稿では,「サーキットブレーカー」による有害な出力に応答するモデルを中断する手法を提案する。トレーニングの拒絶と敵のトレーニングの代替として、サーキットブレーキングは有害なアウトプットの原因となる表現を直接制御する。我々は、我々のアプローチをAIエージェントに拡張し、攻撃されているときの有害な行動の率を大幅に低下させることを実証する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:51:07 GMT)
Self-Evolving GPT: A Lifelong Autonomous Experiential Learner [40.2]
大規模言語モデル(LLM)に基づく生涯の自律的経験学習フレームワークを設計する。自律的に学習し、経験の伝達と帰納を通じて経験を蓄積し、どのような種類の入力質問を分類し、どの蓄積された経験を雇用するかを選択する。 6つのNLPデータセットによる実験結果から,本フレームワークは各中間段階において確実に動作し,GPT-3.5およびGPT-4の性能を効果的に向上することが示された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:49:13 GMT)
Raising the Bar: Investigating the Values of Large Language Models via Generative Evolving Testing [39.9]
大きな言語モデル(LLM)は大きなブレークスルーを達成したが、生成された非倫理的コンテンツは潜在的なリスクをもたらしている。 LLMの価値アライメントを測定することは、その規制と責任あるデプロイメントにとって不可欠である。本稿では,LLMの根底にある道徳的基盤を動的に探索する新しい生成的進化テスト手法であるGAAを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:47:21 GMT)
HPC: Hierarchical Progressive Coding Framework for Volumetric Video [39.4]
ニューラルレージアンスフィールド(NeRF)に基づくボリュームビデオは、様々な3Dアプリケーションに対して大きな可能性を秘めている。現在のNeRF圧縮は、ビデオ品質を調整できる柔軟性に欠けており、様々なネットワークやデバイス能力のための単一のモデル内である。単一モデルを用いて可変性を実現する新しい階層型プログレッシブビデオ符号化フレームワークであるHPCを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:34:24 GMT)
PersonificationNet: Making customized subject act like a person [39.4]
本稿では,マンガのキャラクターやぬいぐるみなどの特定の主題を制御し,参照した人物のイメージと同じポーズをすることができるペルソナライズネットを提案する。第1に、カスタマイズされたブランチは、特定対象の外観を模倣し、第2に、ポーズ条件ブランチは、人から変種インスタンスへ身体構造情報を転送し、最後に、推測段階において、人と特定対象の間の構造ギャップを橋渡しする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:27:07 GMT)
LightenDiffusion: Unsupervised Low-Light Image Enhancement with Latent-Retinex Diffusion Models [39.3]
物理的に説明可能なRetinex理論を低照度画像強調のための拡散モデルに組み込んだ拡散に基づく教師なしフレームワークを提案する。公開されている実世界のベンチマークの実験では、提案されたLightenDiffusionは最先端の非監督的な競合より優れていることが示されている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:54:43 GMT)
FrePolad: Frequency-Rectified Point Latent Diffusion for Point Cloud Generation [39.3]
FrePoladは、生成タスクのポイントクラウド濃度において、高品質、多様性、柔軟性を同時に達成します。 FrePoladは、潜伏した形状分布上の条件として点のサンプリングを定式化することにより、変動点雲の濃度をサポートする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:29:11 GMT)
Pixel-wise Agricultural Image Time Series Classification: Comparisons and a Deformable Prototype-based Approach [39.0]
時間的データを用いた収穫分断の現在の手法は、データに依存するか、監督の欠如を補うために非常に高度に設計されている。衛星画像時間(SITS)の教師付き画素分割と教師なし画素分割のためのデータセットと手法を提示・比較する。我々は,このシンプルかつ高解釈可能な手法が,低データ方式で最高の性能を実現することを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:04:31 GMT)
GOFA: A Generative One-For-All Model for Joint Graph Language Modeling [38.3]
この問題を解決するために,新たに生成グラフ言語モデルGOFAを提案する。 GOFAは、新たに提案されたグラフレベルの次単語予測、質問応答、構造的タスクに基づいて事前訓練されている。モデルは様々な下流タスクに基づいて評価され、ゼロショットシナリオにおける構造的および文脈的問題を解く強力な能力を示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 22:23:51 GMT)
Open-Canopy: A Country-Scale Benchmark for Canopy Height Estimation at Very High Resolution [38.0]
超高解像度(1.5m)キャノピー高さ推定のための最初のオープンアクセスおよびカントリースケールのベンチマークであるOpen-Canopyを紹介する。また、異なる年に撮影された2つの画像間の天蓋の高さ変化検出のための最初のベンチマークであるOpen-Canopy-$Delta$を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:16:24 GMT)
Instant 3D Human Avatar Generation using Image Diffusion Models [37.5]
AvatarPopUpは、異なる入力モードから高速で高品質な3Dアバターを生成する方法である。われわれのアプローチでは、わずか2秒で3Dモデルを生成することができる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:23:26 GMT)
ShapeLLM: Universal 3D Object Understanding for Embodied Interaction [37.0]
本稿では,3次元マルチモーダル大言語モデル(LLM)を具体化して構築したShapeLLMについて述べる。 ShapeLLMはReConをReCon++に拡張することで改良された3Dエンコーダの上に構築されている。 ShapeLLMは、構築された命令追従データに基づいてトレーニングされ、新しい人為的なベンチマークである3D MM-Vetでテストされる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:36:15 GMT)
Refusing Safe Prompts for Multi-modal Large Language Models [36.3]
安全プロンプトに対する拒絶を誘導する最初の手法であるMLLM-Refusalを紹介する。本稿では,MLLM-Refusalを制約付き最適化問題として定式化し,その解法を提案する。 4つのデータセットにわたる4つのMLLMに対してMLLM-Refusalを評価する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:18:05 GMT)
Enhanced quantum state transfer via feedforward cancellation of optical phase noise [36.1]
超低温RbCs分子のSTIRAP状態伝達におけるレーザー位相ノイズを抑制するための光フィードフォワード法を実装した。使用可能なレーザー強度のみに制限された98.7(1)%の転送効率を著しく向上させる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:35:08 GMT)
TCAN: Animating Human Images with Temporally Consistent Pose Guidance using Diffusion Models [36.0]
TCANはポーズ駆動の人間の画像アニメーション手法であり、誤ったポーズに頑健で、時間とともに一貫性がある。 ControlNetを凍結に保つために、LoRAをUNet層に適応させ、ポーズと外観の特徴の間に潜伏した空間を調整できるようにします。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:02:13 GMT)
RIO-CPD: A Riemannian Geometric Method for Correlation-aware Online Change Point Detection [35.9]
Rio-CPDは非パラメトリック相関対応オンライン変更点検出フレームワークである。 Rio-CPDは検出精度と効率において既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:42:51 GMT)
DiG-IN: Diffusion Guidance for Investigating Networks -- Uncovering Classifier Differences Neuron Visualisations and Visual Counterfactual Explanations [35.5]
ディープラーニングは、ImageNetのような複雑な画像分類タスク、予期せぬ障害モード、例えばスプリアス機能などに大きな進歩をもたらした。安全クリティカルなタスクでは、その決定のブラックボックスの性質は問題であり、説明や少なくとも意思決定を行う方法が緊急に必要である。本稿では,これらの問題に対して,ガイド画像生成のためのフレームワークを用いて分類器由来の目的を最適化した画像を生成する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:53:50 GMT)
3DReact: Geometric deep learning for chemical reactions [35.4]
反応物質と生成物の3次元構造から反応特性を予測する3DReactについて述べる。反応特性予測の既存のモデルと比較して、3DReactは原子マッピング情報を利用する柔軟なフレームワークを提供する。異なるデータセット、原子をマッピングするレシエーション、およびジオメトリと外挿タスクの両方にわたって、体系的にうまく機能する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:15:23 GMT)
Token-Supervised Value Models for Enhancing Mathematical Reasoning Capabilities of Large Language Models [35.3]
大規模言語モデル(LLM)は、ステップバイステップの推論チェーンを通じて、数学における顕著な問題解決能力を実証している。それらは、その後の推論チェーンの品質や、自己回帰的なトークン・バイ・トーケン生成の性質による最終回答に影響を及ぼすエラーの推論に影響を受けやすい。近年の研究では、推論経路の生成を導くために外部検証器の採用が提案されているが、既存の研究はステップバイステップラベルで訓練されたモデルを利用している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:16:50 GMT)
On the Role of Discrete Tokenization in Visual Representation Learning [35.1]
マスク付き画像モデリング (MIM) は, 対照的な学習手法とともに人気を博している。個別のトークンは再建の標的だがこの選択の理論的基盤は未解明のままだ離散トークン化がモデルの一般化能力にどのように影響するかを包括的に理論的に理解する。我々は,MIMフレームワーク内の離散トークンの有効性を評価するために,TCASという新しいメトリクスを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:25:31 GMT)
Stability and decay of subradiant patterns in a quantum gas with photon-mediated interactions [34.8]
2つの光学キャビティのモード交差位置にあるボース・アインシュタイン凝縮体におけるサブ放射率について検討した。 1つのキャビティモードへの放出を抑制する準安定密度構造静止した超放射能格子への緩和を防ぎます我々は、これらのダイナミクスを量子平均場モデルで再現し、他の長距離相互作用系で予測される準定常状態と準定常状態の特性を共有することを示唆する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:47:07 GMT)
Diffusion Tempering Improves Parameter Estimation with Probabilistic Integrators for Ordinary Differential Equations [34.5]
通常微分方程式(ODE)は科学の力学系を記述するために広く用いられているが、実験的な測定を説明するパラメータを特定することは困難である。本稿では,ODEにおける勾配に基づくパラメータ最適化の収束性を改善する確率的数値法の新しい正規化手法である拡散テンパリングを提案する。本手法は複雑性の異なる力学系に対して有効であることを示すとともに,実際に関連するパラメータ数を持つHodgkin-Huxleyモデルに対して,信頼性の高いパラメータ推定値が得られることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:26:25 GMT)
The Sociolinguistic Foundations of Language Modeling [34.0]
我々は、大きな言語モデルは本質的に言語の多様性のモデルであると主張する。この視点が言語モデリングにおける5つの基本的な課題にどのように対処できるかについて議論する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:12:55 GMT)
3x2: 3D Object Part Segmentation by 2D Semantic Correspondences [34.0]
本稿では,いくつかのアノテーション付き3D形状やリッチアノテーション付き2Dデータセットを活用して3Dオブジェクト部分のセグメンテーションを実現することを提案する。我々は,様々な粒度レベルのベンチマークでSOTA性能を実現する3-By-2という新しい手法を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:08:00 GMT)
ASTPrompter: Weakly Supervised Automated Language Model Red-Teaming to Identify Likely Toxic Prompts [33.8]
本稿では,レッドチームタスクの強化学習形式を提案する。 1)凍結したディフェンダーから有毒な出力をトリガーし,(2)ディフェンダーが得点したようにパープレキシティが低いことが判明した。当社の政策は、毒性を引き起こす可能性のあるプロンプトを発生させることができることを実証しています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:33:34 GMT)
Rethinking Graph Backdoor Attacks: A Distribution-Preserving Perspective [33.4]
グラフニューラルネットワーク(GNN)は、様々なタスクにおいて顕著なパフォーマンスを示している。バックドア攻撃は、トレーニンググラフ内のノードのセットにバックドアトリガとターゲットクラスラベルをアタッチすることで、グラフを汚染する。本稿では,IDトリガによる無意味なグラフバックドア攻撃の新たな問題について検討する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:21:54 GMT)
PAS: Data-Efficient Plug-and-Play Prompt Augmentation System [32.7]
大型言語モデル(LLM)は、プラグアンドプレイAIシステムへの需要を増大させた。 LLMベースのプラグアンドプレイ自動プロンプトエンジニアリング(APE)システムであるPASを提案する。 PAS は従来の APE モデルと比較して、平均 6.09 ポイントの改善を達成している。 PASは人間の評価に優れており、ユーザのためのプラグインとしての適合性を強調している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:04:50 GMT)
CEIPA: Counterfactual Explainable Incremental Prompt Attack Analysis on Large Language Models [32.0]
本研究は,大規模言語モデル(LLM)における安全性とプライバシ対策の推進的必要性に光を当てるものである。本稿では,攻撃効果を定量的に測定するために,特定の方法でプロンプトを誘導する新しい手法であるCEIPAを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:26:14 GMT)
Constructing Concept-based Models to Mitigate Spurious Correlations with Minimal Human Effort [32.0]
概念ボトルネックモデル(Concept Bottleneck Models, CBM)は、人間の理解可能な概念を通じて、モデルの振る舞いを開示し、導くための原則的な方法を提供する。本稿では,これらのバイアスに無害でありながら事前学習モデルを活用するために設計された新しいフレームワークを提案する。提案手法を複数のデータセット上で評価し,その解釈可能性を維持しつつ,素粒子相関によるモデル依存の低減効果を示した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:07:28 GMT)
Needle in the Haystack for Memory Based Large Language Models [31.9]
現在の大規模言語モデル(LLM)は、単純な事実検索タスクではよく機能しない。動的に適応可能な外部メモリをLCMに結合することでこの問題を軽減することができるか検討する。テキストサンプルのエピソードを高速に書き書きできるLarimarの外部メモリは、テスト時に、トレーニング中に見られるものよりもはるかに長いコンテキストを扱うために使用できることを示した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:20:34 GMT)
Cs2K: Class-specific and Class-shared Knowledge Guidance for Incremental Semantic Segmentation [31.8]
増分的セグメンテーションは、古いクラスの知識を維持しながら、新しく遭遇したクラスをセグメンテーションする。逐次的セマンティックセグメンテーションのためのクラス固有およびクラス共有知識(Cs2K)ガイダンスを提案する。提案するCs2Kはセグメンテーション性能を著しく向上し,プラグアンドプレイである。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:15:26 GMT)
Neural Poisson Solver: A Universal and Continuous Framework for Natural Signal Blending [31.5]
Inlicit Neural Representation (INR) は視覚信号の表現法として人気がある。 InRによって表現される視覚信号を混合するプラグイン・アンド・プレイフレームワークであるNeural Poisson Solverを紹介する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:19:07 GMT)
Physical Layer Aspects of Quantum Communications: A Survey [31.4]
量子通信システムは、分散量子コンピューティング、分散量子センシング、およびいくつかの暗号プロトコルの形式で独自のアプリケーションをサポートする。これらの通信システムの主要なイネーブルは、未知の量子状態を高速かつ忠実に転送できる効率的なインフラである。古典的世界と量子的世界の間には根本的な違いがあるが、量子通信システムでも有益であることが証明される普遍的なコミュニケーション概念が存在する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:16:47 GMT)
Revealing the Dark Secrets of Extremely Large Kernel ConvNets on Robustness [31.3]
近年、一部の大規模なカーネル・コンブネットは、性能と効率性で復活している。大規模なカーネルネットワークがロバストなのか、そのロバスト性に起因するのかはまだ不明である。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:55:20 GMT)
Deep Bag-of-Words Model: An Efficient and Interpretable Relevance Architecture for Chinese E-Commerce [31.1]
我々は,中国のeコマースにおける効率的かつ解釈可能な関連アーキテクチャであるディープバグ・オブ・ワード(DeepBoW)モデルを提案する。提案手法は,単語重対の集合であるスパースBoW表現に問合せと積を符号化することである。関連スコアは、クエリと製品とのスパースBoW表現間の一致した単語の蓄積によって測定される。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:18:05 GMT)
FedVAE: Trajectory privacy preserving based on Federated Variational AutoEncoder [30.8]
位置情報ベースのサービス(LBS)は、位置情報に合わせてパーソナライズされたサービスを提供するために、軌跡データを活用する。この課題に対処するため、データセット内の個人情報を保護するために、K匿名性や差分プライバシーといったプライバシ保護手法が提案されている。本稿では,個人情報の機密性を保ち,元の特徴構造を保ちつつ,新たなトラジェクトリデータセットを効果的に生成するフェデレート変分オートエンコーダ(FedVAE)アプローチを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:10:59 GMT)
Enhancing Privacy of Spatiotemporal Federated Learning against Gradient Inversion Attacks [30.8]
本稿では,時空間データに適した勾配攻撃アルゴリズムである時空間勾配インバージョンアタック(GIA)を提案する。我々は、時間的連合学習における勾配反転攻撃を軽減するための適応的な防御戦略を設計する。提案した防衛戦略は,効果的なセキュリティ保護による時間的フェデレーション学習の有用性を十分に維持できることを明らかにした。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:37:44 GMT)
On the Need of a Modeling Language for Distribution Shifts: Illustrations on Tabular Datasets [30.5]
5つのデータセットと6万のメソッド構成にまたがる自然なシフトを含む実験的なテストベッドを構築します。 ML文献のX$(co)シフトに重きを置いているのとは対照的に、Y|X$-shiftsはテストベッドでもっとも一般的です。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:54:37 GMT)
FedsLLM: Federated Split Learning for Large Language Models over Communication Networks [30.5]
本稿では,低ランク適応技術 (LoRA) と分割学習フレームワークを組み合わせることで,大規模言語モデル (FedsLLM) のためのフェデレーション分割学習を提案する。提案アルゴリズムは、最適化されていないシナリオと比較して平均47.63%遅延を削減する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:23:54 GMT)
GraspXL: Generating Grasping Motions for Diverse Objects at Scale [30.1]
政策学習フレームワークGraspXLにおいて,複数の動作目標に対して手物体の把握動作の発生を統一する。 58個のオブジェクトでトレーニングされたポリシーは、成功率82.2%の500万以上の未確認オブジェクトに対して、多様な把握動作を堅牢に合成することができる。私たちのフレームワークは、さまざまな手元にデプロイでき、再構築または生成されたオブジェクトで作業できます。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:48:07 GMT)
Mobius: A High Efficient Spatial-Temporal Parallel Training Paradigm for Text-to-Video Generation Task [29.7]
多くの研究者がテキスト・トゥ・ビデオ(T2V)生成タスクに力を注いでいる。本稿では,T2Vタスクのための高効率な時空間並列訓練パラダイム Mobius を提案する。 Mobiusは24%のGPUメモリと12%のトレーニング時間を節約し、T2Vの微調整タスクを大幅に改善する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:03:17 GMT)
OneActor: Consistent Character Generation via Cluster-Conditioned Guidance [29.4]
我々はOneActorと呼ばれる新しいワンショットチューニングパラダイムを提案する。プロンプトのみによって駆動される一貫した主題生成を効率よく行う。提案手法は多目的生成が可能であり, 一般的な拡散拡張と互換性がある。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:03:00 GMT)
A Novel Paradigm for Neural Computation: X-Net with Learnable Neurons and Adaptable Structure [29.1]
X-Netは、回帰タスクや分類タスクにおいて、ニューロンよりも同等またはそれ以上の性能を達成できることを示す。 X-Netは、科学者が数学や物理学の新しい法則を発見するのを助けることが示されている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:21:00 GMT)
MUSCLE: A Model Update Strategy for Compatible LLM Evolution [29.0]
大規模言語モデル(LLM)は、データやアーキテクチャの変更によって頻繁に更新され、パフォーマンスが向上する。ユーザは、対話している特定の機械学習モデルの機能と能力のメンタルモデルを構築することが多い。モデル更新における不整合の数を最小限に抑えるためのトレーニング戦略を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:12:48 GMT)
URRL-IMVC: Unified and Robust Representation Learning for Incomplete Multi-View Clustering [28.8]
不完全なマルチビュークラスタリングのための統一表現学習(URRL-IMVC)を提案する。 URRL-IMVCは、複数のビューや隣接するサンプルからの情報を統合することで、失われた状態を見るのに堅牢な統合埋め込みを直接学習する。提案するURRL-IMVCフレームワークを様々なベンチマークデータセット上で広範囲に評価し,その最先端性能を実証した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:35:25 GMT)
Constrained Intrinsic Motivation for Reinforcement Learning [28.6]
Intrinsic Motivation (IM) は、Reward-Free Pre-Training タスクの強化学習や、Intrinsic Motivation (EIM) タスクの探索に使用される。既存のIM手法は、静的スキル、限られた状態カバレッジ、RFPTタスクのサンプル非効率、EIMタスクのサブ最適性に悩まされている。本稿では,RFPTタスクとEIMタスクに対するemphConstrained Intrinsic Motivation(CIM)を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:20:52 GMT)
Unified Embedding Alignment for Open-Vocabulary Video Instance Segmentation [28.4]
Open-Vocabulary Video Instance (VIS)は、任意のオブジェクトのセグメンテーションと追跡機能によって、注目を集めている。我々はOVFormerと呼ばれる新しいオープン語彙VISベースラインを提案する。 OVFormerは軽量モジュールを使用して、クエリの埋め込みとCLIPイメージの埋め込みを統一する。従来の画像ベーストレーニングとは異なり、ビデオベースのモデルトレーニングを行い、ビデオ内の時間的一貫性を完全にマイニングする半オンライン推論スキームをデプロイする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:49:45 GMT)
TAPI: Towards Target-Specific and Adversarial Prompt Injection against Code LLMs [27.7]
本稿では,新たな攻撃パラダイム,すなわち,コードLLMに対するターゲット固有および対向的プロンプトインジェクション(TAPI)を提案する。 TAPIは悪意のある命令に関する情報を含む読めないコメントを生成し、それらを外部ソースコードのトリガーとして隠す。 CodeGeexやGithub Copilotなど、デプロイされたコード補完統合アプリケーションに対する攻撃に成功しました。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:59:32 GMT)
Detect Llama -- Finding Vulnerabilities in Smart Contracts using Large Language Models [27.7]
我々は、スマートコントラクト脆弱性検出において、GPT-4より優れたオープンソースモデルを微調整する。バイナリ分類(つまり、このスマートコントラクトは脆弱か?)では、GPT-3.5FTとTect Llama-Foundationという2つの最高のパフォーマンスモデルがF1スコアを達成しています。 GPT-3.5FT と Detect Llama - Foundation はいずれも GPT-4 と GPT-4 Turbo を大きく上回っている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:33:13 GMT)
Generating SROI^{-} Ontologies via Knowledge Graph Query Embedding Learning [26.9]
本稿では,SROI-記述論理公理の形でグラフから学習した知識を説明する新しいクエリ埋め込み手法AConEを提案する。理論的には、AConEがSROI-公理を学習できることを示し、演算がSROI-記述論理の概念に対応する代数を定義する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:20:39 GMT)
BoBa: Boosting Backdoor Detection through Data Distribution Inference in Federated Learning [26.7]
フェデレーテッド・ラーニングは、その分散した性質のため、毒殺の被害を受けやすい。本稿では,この問題を解決するために,分布認識型異常検出機構であるBoBaを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:38:42 GMT)
Whose wife is it anyway? Assessing bias against same-gender relationships in machine translation [26.7]
機械翻訳は、しばしばバイアスのあるデータやアルゴリズムに悩まされる。 MTシステムにおける同性関係に対するバイアスの程度について検討する。 3つの一般的なMTサービスは、同じ性別のエンティティ間の関係に関する文を正確に翻訳することができないことが分かりました。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:48:09 GMT)
Multi-Modal Dataset Creation for Federated~Learning with DICOM Structured Reports [26.2]
フェデレーショントレーニングは、多種多様なデータストレージオプション、一貫性のない命名方式、さまざまなアノテーション手順、ラベル品質の相違により、しばしば異種データセットによって妨げられる。これは、均一なデータ表現とフィルタリングオプションを含むデータセット調和が最重要となる、新興のマルチモーダル学習パラダイムにおいて特に顕著である。我々は、マルチモーダルデータセットの組み立てプロセスを簡単にする、データ統合と対話型フィルタリング機能のためのオープンプラットフォームを開発した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:34:10 GMT)
DeCE: Deceptive Cross-Entropy Loss Designed for Defending Backdoor Attacks [26.2]
本稿では,コード言語モデルのセキュリティを高めるために,汎用的で効果的な損失関数DeCE(Deceptive Cross-Entropy)を提案する。さまざまなコード合成データセット,モデル,有毒比による実験は,DeCEの適用性と有効性を示している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:18:38 GMT)
Aligning Diffusion Behaviors with Q-functions for Efficient Continuous Control [25.2]
オフライン強化学習を2段階最適化問題として定式化する。まず、報酬のない行動データセットに関する表現的生成ポリシーを事前訓練し、次にこれらのポリシーを微調整して、Q値のようなタスク固有のアノテーションと整合させる。この戦略により、多種多様な行動データを活用し、一般化を強化し、最小限のアノテーションを使って下流タスクへの迅速な適応を可能にする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:32:36 GMT)
Watermarking Text Data on Large Language Models for Dataset Copyright [25.2]
ディープモデルは、下流のNLPタスクに有用な普遍言語表現を学習することができる。ディープラーニングはさまざまなプライバシ攻撃にも脆弱だが、トレーニングデータセットには多くの機密情報が存在している。バックドアベースのメンバシップ推論手法であるTextMarkerを用いて,新しい透かし手法を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:29:56 GMT)
Pedagogical Alignment of Large Language Models [24.4]
本稿では,Large Language Models (LLM) の新たな概念について紹介する。 LLMは足場ツールとして機能し、複雑な問題を管理可能なサブプロブレムに分解し、建設的なフィードバックとヒントを通じて最終回答へと導く。本研究では、アライメントのレンズを通してタスクを観察することで物語を再解釈し、RLHF法がいかに優れた代替手段として自然に現れるかを実証する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 20:02:03 GMT)
Differentially Private Stream Processing at Scale [24.3]
我々は、私たちの知る限り、最初の微分プライベート(DP)ストリーム集約尺度を設計する。当社のシステム - Differential Privacy Pipelines (DP-P) - Sparkストリーミングに似たストリーミングフレームワークを使用して構築されており、GoogleのSpannerデータベースとF1クエリエンジン上に構築されています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 23:18:22 GMT)
X-ray2CTPA: Generating 3D CTPA scans from 2D X-ray conditioning [24.2]
胸部X線または胸部X線撮影(CXR)はCTスキャンと比較して限られた画像撮影を可能にする。 CTスキャンはCXRよりもコストが高く、放射線被曝も大きく、アクセス性も低い。本研究では,2次元低コントラスト分解能X線入力から3次元高コントラストおよび空間分解能Aスキャンへのクロスモーダル変換について検討する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:18:13 GMT)
Do Multi-Document Summarization Models Synthesize? [24.2]
我々は、一連の要約モデルを用いて、意見とエビデンス合成データセットに関する実験を行う。既存のモデルは部分的には合成を行うが、不完全である。本稿では,モデル合成機能を改善するための,シンプルで汎用的で効果的な手法を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:24:46 GMT)
Zero-Shot Continuous Prompt Transfer: Generalizing Task Semantics Across Language Models [24.1]
提案手法は,ソースプロンプトを相対空間に符号化し,対応するターゲットプロンプトを探索して対象モデルに転送するゼロショット連続プロンプト転送手法である。実験により提案手法の有効性を確認し, 連続的プロンプトにおける「タスク意味論」が様々な言語モデルにまたがって一般化可能であることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:26:08 GMT)
Look Around and Learn: Self-Training Object Detection by Exploration [23.6]
エージェントは、事前訓練されたオフザシェルフ検出器を使用して環境を探索し、オブジェクトを検出し、擬似ラベルを関連付ける。同じオブジェクトの擬似ラベルが、異なる視点で一貫性を持っていなければならないと仮定することで、ハードサンプルをマイニングするためにLook Aroundという探索ポリシーを学びます。我々は現在の最先端の統一されたベンチマークを実装し、既存の探索政策や知覚メカニズムと比較する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:54:33 GMT)
Debiased Noise Editing on Foundation Models for Fair Medical Image Classification [23.6]
本研究は,ブラックボックス内での医療画像のバイアス問題に対処する。本稿では,DNEノイズを発生させるD(ebiased)N(oise)E(diting)戦略を提案する。われわれのパイプライン全体は、様々な医療状況にまたがって適用可能な公平な画像編集を可能にする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:55:42 GMT)
Heavy-Tailed Class Imbalance and Why Adam Outperforms Gradient Descent on Language Models [23.5]
Adamは、他のタスクよりも大きなマージンで、大きな言語モデルでの勾配勾配よりも優れていることが示されている。この性能ギャップの重要な要因は、言語タスクで見られる重み付きクラス不均衡であることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:10:32 GMT)
Investigating the Interplay of Prioritized Replay and Generalization [23.2]
過去のデータを再利用し、サンプル効率を向上させるため、強化学習では、経験の再生は至るところで行われている。 1つの例外は優先順位付き体験再生(PER)であり、サンプリングはTDエラーに比例して行われる。我々はPERの様々なバリエーションを調査し、PERがいつ役に立つかを理解する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:56:24 GMT)
What Makes a Good Explanation?: A Harmonized View of Properties of Explanations [22.8]
解釈可能性(Interpretability)は、機械学習(ML)モデルの側面を検証する手段を提供する。異なる文脈は異なる性質を持つ説明を必要とする。説明の性質に関しては標準化の欠如がある。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:34:29 GMT)
Accelerating the inference of string generation-based chemical reaction models for industrial applications [22.7]
本稿では,自動回帰SMILESジェネレータの投機的復号化による推論を高速化する手法を提案する。反応予測と1段階の逆合成では3倍高速な推算が可能であり,精度は低下しない。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 20:55:59 GMT)
A Mathematical Framework, a Taxonomy of Modeling Paradigms, and a Suite of Learning Techniques for Neural-Symbolic Systems [22.4]
本稿では,ニューラル・シンボリックエネルギーベースモデル(NeSy-EBMs)を紹介する。我々はNeSy-EBMを用いて,システムのニューラルシンボリックインタフェースと推論機能に着目したモデリングパラダイムの分類法を開発した。我々はまた、スケーラビリティと表現性のために設計されたオープンソースのNeSy-EBMライブラリNeuPSL(NeuPSL)についても紹介する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:26:21 GMT)
iNeMo: Incremental Neural Mesh Models for Robust Class-Incremental Learning [22.1]
我々は、時間とともに新しいメッシュで拡張できるインクリメンタルニューラルネットワークモデルを提案する。本研究では,Pascal3DおよびObjectNet3Dデータセットの広範な実験を通して,本手法の有効性を実証する。我々の研究は、ポーズ推定のための最初の漸進的な学習手法も提示している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:57:49 GMT)
Suppression of quantum dissipation: A cooperative effect of quantum squeezing and quantum measurement [22.1]
パラメトリック駆動キャビティに結合したオープン2レベルシステムにおいて,環境誘起散逸を打つ手法を提案する。我々は,協調の存在下では,システム・キャビティの効果的な相互作用によって,システムダイナミクスが完全に支配されることを実証した。この研究は、自然原子や超伝導回路を含む様々な量子力学的プラットフォームにおいて、散逸抑制の一般的な方法を提供する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:10:44 GMT)
Enhancing Single-Slice Segmentation with 3D-to-2D Unpaired Scan Distillation [21.7]
本研究では, 事前学習した3次元モデルを用いて, 2次元単一スライスセグメンテーションを向上する新しい3D-to-2D蒸留フレームワークを提案する。同じデータ入力を必要とする従来の知識蒸留法とは異なり、我々のアプローチでは、2次元の学生モデルをガイドするために、コントラストのない3次元CTスキャンを採用しています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:03:31 GMT)
Global Attention-Guided Dual-Domain Point Cloud Feature Learning for Classification and Segmentation [21.4]
上記の問題に対処するために,グローバルアテンション誘導型デュアルドメイン特徴学習ネットワーク(GAD)を提案する。我々はまず,改良されたグローバルアテンション機構を備えたコンテキスト位置強調変換器(CPT)モジュールを考案した。次に、デュアルドメインK-アレスト隣のフィーチャーフュージョン(DKFF)をカスケードして、効果的なフィーチャーアグリゲーションを行う。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:19:19 GMT)
SS-SfP:Neural Inverse Rendering for Self Supervised Shape from (Mixed) Polarization [21.4]
偏光の形状 (SfP) は偏光の形状 (SfP) として知られる問題である。単視点偏光画像から物体やシーンの3次元形状(画素表面の正規度と深さ)を推定する逆レンダリングに基づく新しいフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:29:00 GMT)
Gloss2Text: Sign Language Gloss translation using LLMs and Semantically Aware Label Smoothing [21.2]
本稿では,事前学習された大言語モデル(LLM),データ拡張,ラベルの平滑化損失関数を活用することで,いくつかの進歩を提案する。提案手法は,Em Gloss2Text翻訳における最先端性能を上回る。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:44:33 GMT)
Bridging Dictionary: AI-Generated Dictionary of Partisan Language Use [21.2]
Bridging Dictionaryは、異なる政治的見解を持つ人々によって、言葉がどのように認識されているかを示すインタラクティブなツールである。 Bridging Dictionaryには、静的で印刷可能なドキュメントが含まれており、大きな言語モデルによって生成された要約を含む796の用語がある。ユーザーは選択した単語を探索し、その頻度、感情、要約、政治的分裂の例を視覚化することができる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:44:40 GMT)
Beyond Statistical Estimation: Differentially Private Individual Computation via Shuffling [21.0]
本稿では,PIC(Private Individual Computation)と呼ばれる新しいパラダイムを紹介する。 PICは、プライバシを保持しながらパーソナライズされたアウトプットを可能にし、シャッフルによってプライバシーを増幅する。実用性を高めるためにPICモデルのために設計された最適確率化器Minkowski Responseを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:36:06 GMT)
Physics-aware Machine Learning Revolutionizes Scientific Paradigm for Machine Learning and Process-based Hydrology [20.9]
我々は、認識される障壁を克服し、両方の分野に革命をもたらすための変革的アプローチとして、物理認識機械学習(ML)を紹介した。まず, 降雨流出水理プロセスと流体力学プロセスを含む, PaML における水文学の体系的な検討を行った。最後に、新しいPaMLベースの水文学プラットフォームであるHydroPMLが、水学応用の基礎としてリリースされた。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:05:28 GMT)
Bora: Biomedical Generalist Video Generation Model [20.6]
本稿では,テキスト誘導型バイオメディカルビデオ生成のための最初のモデルであるBoraを紹介する。新たに確立された医用ビデオコーパスを用いて、モデルアライメントとインストラクションチューニングによって微調整を行う。 Boraは、4つの異なるバイオメディカルドメインにわたる高品質なビデオデータを生成することができる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:00:25 GMT)
Your Diffusion Model is Secretly a Noise Classifier and Benefits from Contrastive Training [20.5]
拡散モデルはデータをノイズ化することを学び、訓練されたデノイザを使用してデータ分布から新しいサンプルを生成する。サンプルに追加される雑音のレベルを識別する,新たな自己教師型学習目標を提案する。提案手法は逐次的および並列的な設定に有効であることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:03:50 GMT)
IDAT: A Multi-Modal Dataset and Toolkit for Building and Evaluating Interactive Task-Solving Agents [20.5]
本稿では,接地型自然言語命令の理解と実行が可能な対話型エージェントを開発する上での課題について述べる。本研究では,Minecraftのような環境下で対話型接地言語命令を収集するためのスケーラブルなデータ収集ツールを提案する。定性解析とエージェント性能比較のためのヒューマン・イン・ザ・ループ対話型評価プラットフォームを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:07:43 GMT)
BKDSNN: Enhancing the Performance of Learning-based Spiking Neural Networks Training with Blurred Knowledge Distillation [20.3]
スパイキングニューラルネットワーク(SNN)は、生物学的ニューラルネットワークを模倣し、離散スパイクを介して情報を伝達する。本研究は,静的およびニューロモルフィックなデータセット上でSNNをトレーニングするための最先端性能を実現する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:17:24 GMT)
STD-LLM: Understanding Both Spatial and Temporal Properties of Spatial-Temporal Data with LLMs [20.3]
Spatial-underlineTemporal UnderlineData の空間的特性と時間的特性をアンダーラインLLMで理解するためのSTD-LLMを提案する。 STD-LLMは仮想ノードと同様に空間的および時間的トークン化器によって空間的時間的相関を理解する。さまざまなデータセットの予測および計算タスクにわたって、強力なパフォーマンスと一般化能力を示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:48:16 GMT)
Continual Learning Optimizations for Auto-regressive Decoder of Multilingual ASR systems [20.1]
継続学習(CL)は、事前学習されたデータの性能を維持しながら、新しいデータで訓練済みモデルを微調整する。自動回帰デコーダのMASRモデルにおける4つの最適化を提案する。 Common VoiceデータセットからWhisperを10の未確認言語に適応させる実験では、これらの最適化により、事前訓練された言語の平均単語誤り率(AWER)が、Experience Replayと比較して14.2%から12.4%に低下することが示されている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:07:04 GMT)
Don't Fear Peculiar Activation Functions: EUAF and Beyond [19.8]
パラメトリック・プライマリ・ユニバーサル・アクティベーション・ファンクション(PEUAF)と呼ばれる新しい超表現的アクティベーション関数を提案する。各種産業・画像データセットの系統的および包括的実験によるPEUAFの有効性を実証する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:57:25 GMT)
Advancing Medical Image Segmentation with Mini-Net: A Lightweight Solution Tailored for Efficient Segmentation of Medical Images [19.6]
Mini-Netは医療画像用に設計された軽量セグメンテーションネットワークである。パラメータが38,000未満のMini-Netは、高周波数と低周波数の両方を効率的にキャプチャする。 DRIVE, STARE, ISIC-2016, ISIC-2018, MoNuSegなど,様々なデータセット上でMini-Netを評価する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:25:59 GMT)
NeuFair: Neural Network Fairness Repair with Dropout [19.5]
本稿では,ディープニューラルネットワーク(DNN)における後処理バイアス緩和としてのニューロンのドロップアウトについて検討する。ランダム化アルゴリズムの設計は, モデルの性能劣化を最小限に抑えつつ, 公平性(最大69%)を向上させるのに効果的であり, 効率的であることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:10:14 GMT)
InstaStyle: Inversion Noise of a Stylized Image is Secretly a Style Adviser [19.5]
本稿では,単一の参照画像のみを用いて高忠実度スタイリング画像を生成する手法であるInstaStyleを提案する。提案手法は,スタイリングされた参照画像からの逆ノイズが本質的にスタイル信号を運ぶことに基づく。本稿では,参照画像のスタイル記述の精度を高めるために,プロンプトリファインメントによる学習可能なスタイルトークンを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:10:23 GMT)
New Desiderata for Direct Preference Optimization [19.3]
我々は,既存のDPO手法が事前学習した基準モデルと,人間の嗜好の実証的尺度とを補間する能力において,未解決の欠点を浮き彫りにする新たな評価基準を導入する。我々の洞察は、これらの制限を確実に緩和する代替のDPOライクな損失を動機付けます。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:52:32 GMT)
Toucan: Many-to-Many Translation for 150 African Language Pairs [19.0]
我々は2つの言語モデル、Cheetah-1.2BとCheetah-3.7Bを紹介した。次に、前述のモデルを微調整して、アフリカ語ペア156をサポートするように設計された、アフロセントリックな機械翻訳モデルであるToucanを作成します。トウカンは他のモデルよりも大幅に優れており、アフリカの言語におけるMTでの顕著なパフォーマンスを示している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:13:47 GMT)
Camera-Pose Robust Crater Detection from Chang'e 5 [19.0]
本研究では, クレーター検出のためのMask R-CNNの性能評価を行い, 外部視角を含む模擬データに基づく事前学習モデルと実画像による事前学習モデルを比較した。実画像に対する事前トレーニングは, 外部視角を含む画像が欠如しているにもかかわらず, 63.1F1スコアの検知性能と0.701交叉の楕円回帰性能を実現しているにもかかわらず, 優れていることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:09:39 GMT)
Seq-to-Final: A Benchmark for Tuning from Sequential Distributions to a Final Time Point [18.8]
履歴データの活用は、最終期間中に限られたデータが利用できる最後の時点のモデルを学ぶために必要である。本研究では,3種類の手法の有効性を評価するために,異なる順序の合成シフトを用いたベンチマークを構築した。この結果から, ベンチマークのシーケンスに対して, 逐次構造を無視し, 最終時点に適応する手法は良好に動作することが示唆された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:03:42 GMT)
Data Overfitting for On-Device Super-Resolution with Dynamic Algorithm and Compiler Co-Design [18.6]
本稿では,Content-Awareデータ処理パイプラインが支援する動的ディープニューラルネットワークを提案する。本手法は,市販携帯電話上でのPSNRとリアルタイム性能(33FPS)の向上を実現する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:39:05 GMT)
Uplifting Range-View-based 3D Semantic Segmentation in Real-Time with Multi-Sensor Fusion [18.4]
Range-View(RV)ベースの3Dポイントクラウドセグメンテーションは、そのコンパクトなデータ形式のために広く採用されている。しかし、RVベースの手法は、隠蔽された点に対して堅牢なセグメンテーションを提供するには不十分である。我々は新しいLiDARとカメラレンジビューに基づく3Dポイントクラウドセマンティックセマンティックセマンティック手法(LaCRange)を提案する。提案手法は,リアルタイム性に加えて,nuScenesベンチマークの最先端結果も実現している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:41:57 GMT)
Radiance Fields from Photons [18.2]
単一光子カメラ(SPC)を用いて個々の光子の粒度を学習する神経放射場である量子放射場を導入する。シミュレーションとプロトタイプのSPCハードウェア,高速動作下での高忠実度再構成,低光域,超ダイナミックレンジ設定による実演を行った。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:06:51 GMT)
ProTIP: Probabilistic Robustness Verification on Text-to-Image Diffusion Models against Stochastic Perturbation [18.1]
テキスト・ツー・イメージ(T2I)拡散モデル(DM)は、単純なテキスト記述に基づいて高品質な画像を生成する際、印象的な能力を示した。多くのディープラーニング(DL)モデルに共通するように、DMは堅牢性に欠ける。本稿では,T2I DMのロバスト性に関する確率論的概念を導入し,統計的保証で評価するための効率的なフレームワークであるProTIPを確立する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:25:42 GMT)
Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey [18.0]
PEFT(Efficient Fine-Tuning)は、様々な下流タスクに対して大きなモデルを効率的に調整することで、実用的なソリューションを提供する。 PEFTは、訓練済みの大規模モデルのパラメータを特定のタスクやドメインに適応させるプロセスを指す。本稿では,様々なPEFTアルゴリズムの総合的な研究を行い,その性能と計算オーバーヘッドについて検討する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:58:10 GMT)
SPIN: Hierarchical Segmentation with Subpart Granularity in Natural Images [18.0]
自然画像のサブパートアノテーションを用いた最初の階層的セマンティックセマンティックセマンティクスデータセットを提案する。また,アルゴリズムが階層レベルの空間的関係と意味的関係をいかにうまく捉えるかを評価するために,新しい評価指標を2つ導入した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:08:00 GMT)
Symmetry Awareness Encoded Deep Learning Framework for Brain Imaging Analysis [18.0]
本研究は,脳疾患の検出とセグメンテーション分析を強化するために,ヒト脳の固有対称解剖学的特徴を活用する新しいアプローチを提案する。左右半球の対称的特徴を符号化するために,新たな対称性認識クロスアテンション (SACA) モジュールが提案され,Symmetry-Aware Head (SAH) として対称的特徴を検出するプロキシタスクが提案されている。本研究は, 事前トレーニングに対称性認識を取り入れることの有効性を提唱し, 医用画像解析のための新しいベンチマークを作成し, 正確かつ効率的な診断プロセスに向けて大きな前進を約束する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:08:15 GMT)
Physics-Informed Learning of Characteristic Trajectories for Smoke Reconstruction [17.6]
既存の物理インフォームドニューラルネットワークは、短期的な物理の制約を強調しており、長期保存の適切な保存は調査を控えている。ラグランジアン流体軌道を暗黙的にモデル化するためにユーレリアニューラル場を利用した新しい表現であるニューラル特性軌道場を導入する。この表現に基づいて物理インフォームド・トラジェクトリ・ラーニングとNeRFに基づくシーン再構成への統合を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 20:19:41 GMT)
MetaWeather: Few-Shot Weather-Degraded Image Restoration [17.6]
メタウェザー(MetaWeather)は、多様な新しい気象条件を単一の統一モデルで処理できる普遍的なアプローチである。メタウェザーは未確認の気象条件に適応でき、最先端のマルチウェザー画像復元法よりも優れることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:19:52 GMT)
Benchmarking Language Model Creativity: A Case Study on Code Generation [17.6]
創造性は少なくとも2つの重要な特徴から成り立っている: 啓発的思考(与えられた目標を達成するための目的性)と啓示的思考(新しい環境や制約への適応性) citeprunco 2003 クリティカル 2つの特徴を取り入れたLCM創造性を定量化する枠組みを提案する。これは、(1)デニアル・プロンプティング(Denial Prompting)は、従来のソリューションに新たな制約を漸進的に課すことによって、LLMが与えられた問題に対してより創造的な解決策を導き出すよう促す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:55:22 GMT)
Open (Clinical) LLMs are Sensitive to Instruction Phrasings [17.5]
大規模言語モデル(LLM)は、自然言語命令が与えられた幅広いタスクを実行できるが、そのような命令がどのようにフレーズ化されるかには敏感である。このことは実際的な疑問を提起する: 臨床NLPタスクで提供される指示の自然変化に対して、命令調整型LLMはどの程度堅牢か? 本研究は,7つのLDMの自然的(非敵的)指示句に対する感受性を定量化するため,様々なタスクを通じて医師からのプロンプトを収集する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:00:44 GMT)
ProDepth: Boosting Self-Supervised Multi-Frame Monocular Depth with Probabilistic Fusion [17.4]
多フレーム単分子深度推定は、静的シーンの仮定の下で連続するフレーム間の幾何的整合性に依存する。動的シーンにおける移動物体の存在は必然的に不整合を引き起こし、トレーニング中に複数のフレームの特徴マッチングと誤解を招く。本稿では,確率論的アプローチを用いて動的オブジェクトによるミスマッチ問題に効果的に対処するProDepthという新しいフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:37:49 GMT)
Beyond Image Prior: Embedding Noise Prior into Conditional Denoising Transformer [17.4]
既存の学習ベースの推論手法は、大規模なデータセットからイメージを一般化するためにモデルを訓練するのが一般的である。本稿では,ノイズと画像の先行部分の分離を区別することによる,難読化問題に対する新たな視点を提案する。本稿では,1つの生雑音画像から直接先行する雑音を正確に推定する局所雑音優先推定アルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:43:11 GMT)
LAPT: Label-driven Automated Prompt Tuning for OOD Detection with Vision-Language Models [17.2]
Label-driven Automated Prompt Tuning (LAPT)は、手動プロンプトエンジニアリングの必要性を減らすOOD検出の新しいアプローチである。 In-distriion (ID) クラス名と負ラベルを自動的にマイニングする分布認識プロンプトを開発した。 LAPTは手作業によるプロンプトよりも一貫して優れており、OOD検出の新しい標準となっている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:30:53 GMT)
Towards Chapter-to-Chapter Context-Aware Literary Translation via Large Language Models [17.0]
既存の文書レベルの翻訳データセットにおける談話現象は少ない。既存の文書レベルのコーパスや文脈対応機械翻訳手法は、文レベルのアライメントに関する非現実的な仮定に依存している。本稿では,Ch2Ch(チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/チャプタ/
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:18:22 GMT)
Towards Unified Task Embeddings Across Multiple Models: Bridging the Gap for Prompt-Based Large Language Models and Beyond [16.9]
本稿では,単一ベクトル空間内において,より小さな言語モデルや多様なプロンプトを持つ大規模言語モデルを含む,様々なモデルからのタスク埋め込みである統合タスク埋め込み(FUTE)フレームワークを提案する。このような一様性は、異なるモデル間の類似性の比較と分析を可能にし、マルチモデルシナリオにおける既存のタスク埋め込みメソッドの範囲と有用性を広げる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:39:28 GMT)
Conformity, Confabulation, and Impersonation: Persona Inconstancy in Multi-Agent LLM Collaboration [16.8]
マルチエージェントAIシステムは、科学的および実践的な応用において、集合的な意思決定をシミュレートするために使用することができる。我々は、AIエージェントが割り当てられたペルソナを確実に採用し、人間のインタラクションを模倣する能力を評価する。以上の結果から,マルチエージェントによる議論は,多様な視点を反映した集団的意思決定を促進することが示唆された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:50:25 GMT)
Security Matrix for Multimodal Agents on Mobile Devices: A Systematic and Proof of Concept Study [16.6]
マルチモーダル大規模言語モデルの推論能力の急速な進歩は、モバイルデバイス上での自律エージェントシステムの開発をきっかけにしている。ヒトと機械の相互作用効率が向上したにもかかわらず、MLLMベースの移動エージェントシステムのセキュリティリスクは体系的に研究されていない。本稿では,MLLMシステムの設計におけるセキュリティ意識の必要性を強調し,今後の攻撃・防御手法の研究の道を開く。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:30:05 GMT)
Factorized Fusion Shrinkage for Dynamic Relational Data [16.5]
本稿では,すべての分解因子がグループ単位の核融合構造に対して動的に縮小される因子化核融合収縮モデルについて考察する。提案手法は、推定された動的潜在因子の比較とクラスタリングにおいて、多くの好ましい特性を享受する。本稿では、最適後部推論と計算スケーラビリティのバランスをとる構造的平均場変動推論フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:25:05 GMT)
Transformer Layers as Painters [16.4]
事前学習したトランスの下位層と最終層は中間層と異なるが,中間層は驚くほど均一であることを示す。また、いくつかの問題のクラスは、レイヤのスキップ、レイヤのトレーニング方法と異なる順序での実行、レイヤの並列実行に対して堅牢性が必要であることも示しています。我々の観察では、凍結した事前学習モデルでさえ、レイヤをスキップしたり、並列にレイヤを走らせることで、遅延の正確さを優雅に交換できる可能性が示唆されている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:31:05 GMT)
Provable Privacy Advantages of Decentralized Federated Learning via Distributed Optimization [16.4]
フェデレートラーニング(FL)は、データのソースへの配置を可能にすることによって、データのプライバシを改善するために設計されたパラダイムとして登場した。最近の知見は、分散FLは、集中型モデルよりも追加のプライバシやセキュリティ上のメリットを経験的に提供していないことを示唆している。分散最適化をデプロイする際の分散FLは、プライバシー保護の強化を実証する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:01:09 GMT)
The topology of data hides in quantum thermal states [16.3]
量子熱状態の蒸留によるトポロジカルデータ解析(TDA)を行うための量子プロトコルを提供する。量子熱状態生成アルゴリズムを活用するために,量子TDAをリアルタイムから仮想画像に変換する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:26:16 GMT)
Region Attention Transformer for Medical Image Restoration [16.3]
領域ベースマルチヘッド自己注意機構(R-MSA)を利用した新しい領域注意変換器(RAT)を提案する。 RATは、ロバストなセグメンション・アシング・モデル(SAM)を用いて、入力画像を非重複セマンティック領域に分割するこの領域はより柔軟で解釈可能であり、類似のセマンティック領域のピクセルのみが互いに補完し、無関係な領域からの干渉を排除している。 PET画像合成,CT画像デノイング,病理画像超解像など,様々な医用画像復元作業におけるRATの有効性を示す実験を行った。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:52:05 GMT)
KUNPENG: An Embodied Large Model for Intelligent Maritime [16.2]
KUNPENGは、スマートオーシャン構築において、インテリジェントな海洋のモデルとして初めて具現化された大型モデルである。総合的な海上作業評価において、KUNPENGは優れた性能を示した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:16:22 GMT)
Adaptive Prediction Ensemble: Improving Out-of-Distribution Generalization of Motion Forecasting [15.9]
本稿では,ディープラーニングとルールに基づく予測専門家を統合した新しいフレームワーク,Adaptive Prediction Ensemble (APE)を提案する。ディープラーニングモデルと並行して訓練された学習ルーティング関数は、入力シナリオに基づいて、最も信頼性の高い予測を動的に選択する。この研究は、自律運転における頑健で一般化可能な運動予測のためのハイブリッドアプローチの可能性を強調している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:57:00 GMT)
Rethinking temporal self-similarity for repetitive action counting [15.8]
本稿では,埋め込みを学習し,完全な時間分解能で行動開始確率を予測するフレームワークを提案する。提案するフレームワークは,3つのデータセットの最先端結果を実現する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:03:14 GMT)
CompAct: Compressing Retrieved Documents Actively for Question Answering [15.6]
CompActは、キー情報を失うことなく、広範囲のドキュメントを格納するためのアクティブな戦略を採用した、新しいフレームワークである。実験により,マルチホップ質問応答ベンチマークにおいて,CompActは性能と圧縮率に大きな改善をもたらすことが示された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:06:54 GMT)
Large Language Models as Biomedical Hypothesis Generators: A Comprehensive Evaluation [15.5]
大規模言語モデル(LLM)は、知識相互作用に革命をもたらす有望なツールとして登場した。バイオメディカル文献から背景と仮説のペアのデータセットを構築し、トレーニング、観察、および見えないテストセットに分割する。最上位モデルの仮説生成能力を、ゼロショット、少数ショット、微調整設定で評価する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:55:13 GMT)
Improving Feature Stability during Upsampling -- Spectral Artifacts and the Importance of Spatial Context [15.4]
画像復元、画像分割、不均一性推定など、さまざまなタスクにおいて、画素ワイズ予測が求められている。以前の研究では、再サンプリング操作がエイリアスなどのアーティファクトの対象であることが示されている。アップサンプリング中に大きな空間的コンテキストが利用できることで,安定かつ高品質な画素ワイズ予測が実現可能であることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 20:58:59 GMT)
Communication-Aware Reinforcement Learning for Cooperative Adaptive Cruise Control [15.3]
強化学習(RL)はCACCにおける複雑な意思決定プロセスの最適化に有効であることが証明されている。 MARLは、複数のCAV間で協調的な動作を可能にすることで、顕著な可能性を示している。これらの課題に対処するために,コミュニケーション対応強化学習(CA-RL)を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:28:24 GMT)
Optimization of DNN-based speaker verification model through efficient quantization technique [15.3]
ディープモデルの量子化は、計算コストとメモリコストの両方を削減する手段を提供する。本研究では,話者検証モデルの定量化のための最適化フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:03:10 GMT)
Motion-Guided Latent Diffusion for Temporally Consistent Real-world Video Super-resolution [15.2]
本稿では,事前学習した潜伏拡散モデルの強度を利用した実世界のVSRアルゴリズムを提案する。我々は、LRビデオの時間的ダイナミクスを利用して、動作誘導損失で潜時サンプリング経路を最適化することにより拡散過程を導出する。動作誘導潜在拡散に基づくVSRアルゴリズムは、実世界のVSRベンチマークデータセットの最先端技術よりも、知覚品質が大幅に向上する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:55:40 GMT)
Mixed-View Panorama Synthesis using Geospatially Guided Diffusion [15.1]
混合ビューパノラマ合成の課題を紹介する。目標は、小さな入力パノラマセットと、その地域の衛星画像が与えられた新しいパノラマを合成することである。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 20:12:07 GMT)
PORCA: Root Cause Analysis with Partially Observed Data [15.0]
ルート原因分析(RCA)は、複雑なシステムから因果構造を発見し解析することによって、システム障害の原因を特定することを目的としている。以前の研究では、部分的な観察の効果を無視するシステムの全観察を暗黙的に仮定していた。 PORCAは、保存されていない共同創設者と保存されていない異質性の両方の下で、信頼性の高い根本原因を探索できる新しいRCAフレームワークである。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:28:49 GMT)
Permutation Superposition Oracles for Quantum Query Lower Bounds [15.0]
入力-出力ペアの述語に対するアルゴリズムの成功確率を、結果のオラクルシミュレーションを用いてバウンドする方法を示す。本研究では, 1ラウンドスポンジ構成がランダムな置換モデルに対して無条件に事前画像に抵抗可能であることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:27:13 GMT)
MaPPing Your Model: Assessing the Impact of Adversarial Attacks on LLM-based Programming Assistants [14.9]
本稿では,攻撃者がプログラムタスクのプロンプトに少量のテキストを付加するMalicious Programming Prompt(MaPP)攻撃を紹介する。我々の迅速な戦略は、LSMが他の方法で正しいコードを書き続けながら脆弱性を追加する可能性があることを示しています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 22:30:35 GMT)
Unifying Sequences, Structures, and Descriptions for Any-to-Any Protein Generation with the Large Multimodal Model HelixProtX [14.9]
我々は,大規模マルチモーダルモデル上に構築されたHelixProtXを導入し,タンパク質の任意のモダリティ生成をサポートする。 HelixProtXは、さまざまなタンパク質関連のタスクにおいて、常に優れた精度を達成し、既存の最先端モデルよりも優れています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:03:02 GMT)
TCLC-GS: Tightly Coupled LiDAR-Camera Gaussian Splatting for Autonomous Driving [14.8]
都市シーンの3次元ガウススティング(3D-GS)に基づくほとんどの3次元ガウススティング(3D-GS)は、3D LiDARポイントで直接3Dガウスを初期化する。我々は,LiDAR-Camera Gaussian Splatting (TCLC-GS) を設計し,LiDARとカメラセンサの双方の強度をフル活用する。提案手法は高速な訓練を行い,1920x1280 (Waymo) の解像度で90 FPS,都市シナリオで1600x900 (nuScenes) の解像度で120 FPS の解像度でリアルタイム RGB と深度レンダリングを実現する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 22:20:08 GMT)
BISCUIT: Scaffolding LLM-Generated Code with Ephemeral UIs in Computational Notebooks [14.6]
計算ノートブックに新たなワークフローを導入し,LLMベースのコード生成を短時間のUIステップで拡張する。本稿では,このワークフローを JupyterLab の拡張である BISCUIT に提示する。 BISCUITはユーザの理解を助けるためのコード表現を提供し、迅速なエンジニアリングの複雑さを減らし、ユーザが異なる変数を探索するための遊び場を作成する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:23:29 GMT)
PCR-99: A Practical Method for Point Cloud Registration with 99% Outliers [14.5]
本稿では,未知のスケールと極端外周比の両方を扱える点雲登録法を提案する。速度を著しく向上させる2つの新しいメカニズムを持つ決定論的3点サンプリング手法を用いる。提案手法は, 最大98%の外れ値比で, 最先端技術に匹敵する性能を達成できることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:15:40 GMT)
FlashAttention-3: Fast and Accurate Attention with Asynchrony and Low-precision [14.4]
注意は、大きな言語モデルと長いコンテキストアプリケーションのボトルネックです。我々はGPUに注意を向ける3つの主要な技術を開発した。提案手法であるFlashAttention-3は,FP16が最大740 TFLOPs/s(75%利用)に達し,FP8が1.2 PFLOPs/sに到達して,H100 GPU上で1.5-2.0$timesの高速化を実現していることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 22:15:02 GMT)
Novel clustered federated learning based on local loss [14.4]
本稿では,学習におけるデータ分布を評価するための新しい指標LCFLを提案する。学習要件と整合し、プライバシー上の懸念に正確に対応し、より正確な分類を提供する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:37:05 GMT)
On-the-Fly Guidance Training for Medical Image Registration [14.3]
本研究は,既存の学習ベース画像登録モデルを改善するための新しいトレーニングフレームワークであるOn-the-Fly Guidance(OFG)を紹介する。本手法では,ラベル付きデータを必要としない登録モデルをトレーニングするための教師付き手法を提案する。提案手法は,複数のベンチマークデータセットおよび先行モデルでテストされ,性能が大幅に向上した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:49:05 GMT)
Graph Neural Network Causal Explanation via Neural Causal Models [14.3]
グラフニューラルネットワーク(GNN)の説明者は、与えられたグラフの予測を保証する重要なサブグラフを特定する。我々は、因果推論によるGNN因果説明器名を提案する。名前は、正確な基礎的な説明の特定において、既存のGNN説明者よりもはるかに優れています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:56:33 GMT)
Meta-Analysis with Untrusted Data [14.3]
メタアナリシスに2つの変更を加えることで、因果的疑問にもっと正確に答える方法を示す。まず,大規模観測データベースから引き出された信頼できないデータを組み込む。第二に、不均一な試行を扱うことができるよりリッチなモデルを訓練する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:07:53 GMT)
Lifelong Histopathology Whole Slide Image Retrieval via Distance Consistency Rehearsal [14.3]
本稿では,破滅的な忘れ事の課題に対処するために,生涯全スライド検索(LWSR)フレームワークを提案する。私たちのフレームワークは、継続的学習中に安定性と可塑性のバランスを達成することを目的としています。提案手法をTCGAプロジェクトの4つの公開WSIデータセット上で評価した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:58:00 GMT)
Exploring State Space and Reasoning by Elimination in Tsetlin Machine [14.2]
Tsetlin Machine(TM)は機械学習(ML)において大きな注目を集めている。 TMは、単語の埋め込みを構築し、節を使ってターゲット語を記述するために使われる。これらの節の記述能力を高めるために,節の定式化におけるReasoning by Elimination(RbE)の概念を検討した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:58:01 GMT)
Hamilton-Jacobi Reachability in Reinforcement Learning: A Survey [14.1]
ハミルトン・ヤコビ到達可能集合は安全性を検証する効果的なツールとなっている。 HJリーチビリティの近似は、学習された制御ポリシーの安全性の向上や、性能の報奨に使用される。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:04:39 GMT)
A Chatbot for Asylum-Seeking Migrants in Europe [14.1]
ACMEは、移民が適用可能な最も高い保護レベルを特定するのを支援することを目的としている。このことは、亡命申請者を支援する領土委員会、裁判所、人道団体の負担を減らすことで、より持続可能な移住に寄与した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:53:40 GMT)
TensorTEE: Unifying Heterogeneous TEE Granularity for Efficient Secure Collaborative Tensor Computing [14.0]
既存の異種TEE設計は、CPUとNPU間のメモリの粒度が微妙で異なるため、協調コンピューティングでは非効率である。安全な協調計算のための統合テンソル・グラニュラリティ異種TEEを提案する。その結果、TEEは、既存の作業と比べて、Large Language Model(LLM)トレーニングワークロードのパフォーマンスを4.0倍改善していることがわかった。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:35:18 GMT)
Soft Prompt Generation for Domain Generalization [14.0]
大規模な事前訓練された視覚言語モデル(VLM)は、手動で設計したプロンプトで下流のタスクに印象的なゼロショット能力を示している。下流タスクにVLMをさらに適応させるために、手動で設計したプロンプトを置き換えるソフトプロンプトが提案されている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:55:37 GMT)
Learning Contrastive Feature Representations for Facial Action Unit Detection [13.8]
顔アクションユニット(AU)検出は、AUが活性化する際の微妙な特徴差を検出するという課題に長年遭遇してきた。本稿では、自己教師付き信号と教師付き信号の両方を組み込んだAU検出を目的とした、新しいコントラスト学習フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:41:21 GMT)
DISQ: Dynamic Iteration Skipping for Variational Quantum Algorithms [13.6]
本稿では,VQAトレーニングのための安定した景観の構築と,ノイズドリフト問題への取り組みについて提案する。 DisQは参照回路を備えた「ドリフト検出器」を採用し、ノイズドリフトエラーによって深刻な影響を受けるイテレーションを特定し、スキップする。 DisQの利点は1.1-1.9倍であり、平均ノイズ検出速度は2.07倍に向上する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:06:17 GMT)
Less is More: Pseudo-Label Filtering for Continual Test-Time Adaptation [13.5]
連続的テスト時間適応(CTTA)は、ソースデータにアクセスすることなく、テストフェーズ中に対象ドメインのシーケンスに事前訓練されたモデルを適用することを目的としている。既存の方法は、すべてのサンプルに対して擬似ラベルを構築し、自己学習を通じてモデルを更新することに依存している。擬似ラベルの品質を向上させるために擬似ラベルフィルタ(PLF)を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:15:22 GMT)
WSESeg: Introducing a Dataset for the Segmentation of Winter Sports Equipment with a Baseline for Interactive Segmentation [13.4]
冬期スポーツ機器の10種類のカテゴリを対象とした,インスタンスセグメンテーションマスクを含む新しいデータセットを提案する。我々は、これらのデータセット上でインタラクティブなセグメンテーション実験を行い、より効率的なラベリングの可能性を探る。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:20:12 GMT)
Domain-Hierarchy Adaptation via Chain of Iterative Reasoning for Few-shot Hierarchical Text Classification [13.3]
我々は,PLMの知識を非構造化の方法で下流階層に適応させるために,HTCの問題を数ショット設定で研究する。階層的条件付き反復ランダムフィールド (HierICRF) という単純な手法を用いて、最もドメインが混在する方向を探索する。 HierICRFによるプロンプトは、平均的なMicro-F1の28.80%から1.50%、Macro-F1の36.29%から1.5%で、HTCのパフォーマンスを著しく向上させる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:21:57 GMT)
Human-like Episodic Memory for Infinite Context LLMs [13.2]
EM-LLMは,ヒトのエピソード記憶と事象認識の重要な側面を大きな言語モデルに統合する新しいアプローチである。 EM-LLMは、ベイジアン・サプライズとグラフ理論境界修正の組み合わせを用いて、トークンの列をコヒーレントなエピソード事象に整理する。 LongBenchデータセットの実験では、EM-LLMのパフォーマンスが向上し、最先端のInfLLMモデルを上回っている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:34:03 GMT)
Learning High-Frequency Functions Made Easy with Sinusoidal Positional Encoding [13.0]
正弦波PE(sinusoidal PE, SPE)は, 適応周波数特徴を真基底関数と密に一致させて効率的に学習するように設計されている。 SPEは、3Dビュー合成、テキスト音声生成、および1Dレグレッションなど、様々なタスクにわたる改善された忠実さと高速なトレーニングを実現している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:51:53 GMT)
Leveraging large language models for nano synthesis mechanism explanation: solid foundations or mere conjectures? [12.9]
我々は,金ナノ粒子合成のメカニズムに着目した775個の多重選択質問からなるベンチマークを開発した。そこで我々は,評価基準である信頼度に基づくスコア(cスコア)を提案し,出力ロジットを探索し,正解の正確な確率を導出する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:05:59 GMT)
AUITestAgent: Automatic Requirements Oriented GUI Function Testing [12.8]
本稿では,モバイルアプリ用の初の自動自然言語駆動GUIテストツールであるAUITestAgentを紹介する。 GUIインタラクションと機能検証の全プロセスを完全に自動化することができる。カスタマイズされたベンチマークの実験では、AUITestAgentが生成されたGUIインタラクションの品質で既存のツールより優れていることが示されている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:14:46 GMT)
It Takes Two: A Peer-Prediction Solution for Blockchain Verifier's Dilemma [12.7]
不正行為の少ない、あるいはまったくないセキュアなブロックチェーンシステムでは、検証担当者がコストのかかる検証を正直に実行する十分なインセンティブが得られなかった。ブロックチェーンおよび潜在的に分散化されたシステムのセキュリティと堅牢性を向上する検証メカニズムのフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:13:25 GMT)
Private Heterogeneous Federated Learning Without a Trusted Server Revisited: Error-Optimal and Communication-Efficient Algorithms for Convex Losses [12.6]
Inter-Silo Record-Level Differential Privacy (ISRL-DP)は、各サイロのデータ漏洩を防止する。異種サイロデータの存在下で最適な過大なリスク境界を実現する新しいISRL-DP FLアルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:20:44 GMT)
Structured Generations: Using Hierarchical Clusters to guide Diffusion Models [12.6]
本稿では拡散確率モデル(DDPM)の枠組みに階層的クラスタリングを統合する深層生成モデルであるDiffuse-TreeVAEを紹介する。提案手法は,学習した潜在木VAE構造体の根埋め込みから新たな画像を生成し,階層的な経路を伝播し,第2段階のDDPMを用いて各データクラスタの異なる高品質な画像を洗練・生成する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:15:03 GMT)
Self-Prompt Tuning: Enable Autonomous Role-Playing in LLMs [12.6]
自己プロンプトチューニングされたLLMは、任意の質問に対して専門家の役割プロンプトを自動的に生成することができる。我々は、広く使われているNLPベンチマークとオープンエンド質問テストに基づいて、自己プロンプト調整LPMを広範囲に評価した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:26:24 GMT)
Leveraging Computer Vision in the Intensive Care Unit (ICU) for Examining Visitation and Mobility [12.3]
我々は、奥行き画像に基づく最先端の非侵襲型コンピュータビジョンシステムを活用し、ICU訪問と患者の移動性を特徴付ける。患者視力低下と訪問の増加に伴うデリリウムの出現との関連を見いだした。 ICU患者に対する非侵襲的自律システムの有用性と可能性について検討した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:43:01 GMT)
Generalized Stein's lemma and asymptotic equipartition property for subalgebra entropies [12.3]
一般化された量子シュタインの補題の主張は、第2の仮説が任意の部分代数 $mathcalN$ の状態空間であるような設定に対して真であることを示す。資源理論の応用として、部分代数の相対エントロピーは適切な操作下での希釈コストであることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:52:36 GMT)
Bridging the Gap Between Information Seeking and Product Search Systems: Q&A Recommendation for E-commerce [12.3]
我々は,製品検索に関連する質問応答(Q&A)ペアを推薦し,購入決定を支援することを提案する。我々は、この新興分野における今後の研究を促進するための課題、オープンな課題、そして解決策を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:22:17 GMT)
Federated Learning and AI Regulation in the European Union: Who is Responsible? -- An Interdisciplinary Analysis [12.1]
欧州連合人工知能法は、機械学習アプリケーションの開発とデプロイにおいて、明確な利害関係者の責任を委任する。 Federated Learningは、データサイロを越えた生成AIモデルのトレーニングを可能にし、データセキュリティを改善しながら、モデルパラメータのみを共有する。私たちの仕事は、双方の役割を明確にすることに貢献し、責任をサーバオペレータにシフトするための戦略を説明し、オープンな技術的課題を指摘します。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:37:53 GMT)
Complexity of Digital Quantum Simulation in the Low-Energy Subspace: Applications and a Lower Bound [12.0]
シミュレーションの誤差は、様々なデジタル量子シミュレーションアルゴリズムや量子システムにおいて、ハミルトニアンの有効な低エネルギーノルムに依存することを示す。低エネルギー部分空間におけるスピンモデルをシミュレートするために、qDRIFTやランダムな置換のようなランダム化された積公式はより小さなトロッター数を必要とすることを証明した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:49:27 GMT)
Weakly-supervised Autism Severity Assessment in Long Videos [12.0]
自閉症スペクトラム障害(Autism Spectrum disorder、ASD)は、社会的コミュニケーションと相互作用の課題を特徴とする多様な神経生物学的条件のコレクションである。長い、トリミングされていないビデオにおける非定型的な行動パターンは、ASDを持つ子供のバイオマーカーとして機能する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:45:25 GMT)
Any-Property-Conditional Molecule Generation with Self-Criticism using Spanning Trees [12.0]
Spanning Tree-based Graph Generation (STGG)は有効な分子の生成を保証するための有望なアプローチである。本研究では,STGGをマルチプロパティ条件生成に拡張する。この結果から,STGG+は分布内および分布外条件生成における最先端の性能を達成できることが示唆された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:32:44 GMT)
GNN with Model-based RL for Multi-agent Systems [11.9]
マルチエージェントシステム(MAS)は、マシンインテリジェンスと高度な応用を探索する上で重要な役割を果たしている。モデルベース強化学習を用いた状態空間グラフニューラルネットワークを用いて,特定のMASミッションに対処する"GNN for MBRL"モデルを提案する。具体的には,まずGNNモデルを用いて,複数のエージェントの将来の状態や軌道を予測し,次にCEM(Cross-Entropy Method)最適化モデル予測制御を適用して,エゴエージェント計画動作を支援し,特定のMASタスクの達成に成功した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:21:35 GMT)
HUP-3D: A 3D multi-view synthetic dataset for assisted-egocentric hand-ultrasound pose estimation [11.9]
HUP-3Dは手動超音波プローブポーズ推定のための3次元マルチビュー合成データセットである。私たちのデータセットは31万以上の動きで構成されています。我々のアプローチには、画像レンダリングの概念、様々な手や腕のテクスチャによる多様性の向上が含まれる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:25:42 GMT)
Mitigating Entity-Level Hallucination in Large Language Models [11.9]
本稿では,大規模言語モデル(LLM)における幻覚の検出・緩和手法として,幻覚検出(DRAD)に基づく動的検索拡張を提案する。実験の結果,LDMにおける幻覚の検出と緩和の両面において,DRADは優れた性能を示した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:47:34 GMT)
TAPFixer: Automatic Detection and Repair of Home Automation Vulnerabilities based on Negated-property Reasoning [11.8]
本稿では,HAシステムにおけるルール間相互作用の脆弱性を自動的に検出し,修復する新しいフレームワークであるTAPFixerを提案する。 HAプロファイルからTAPルールを抽出し、物理的および遅延特性を持つオートマトンモデルに変換し、さまざまな正しさ特性を持つモデルチェックを実行する。次に、新しいネゲートプロパティ推論アルゴリズムを使用して、ネゲートプロパティに基づいたモデル抽象化と改善、モデルチェックを通じてパッチを自動的に推論する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:43:26 GMT)
milliFlow: Scene Flow Estimation on mmWave Radar Point Cloud for Human Motion Sensing [11.5]
mmWaveレーダーはプライバシーにやさしい機能のために人気を博している。我々はmmWave点雲の相補的な動き情報としてシーンフローを推定する新しい深層学習手法である MilliFlow を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:56:07 GMT)
Machine Apophenia: The Kaleidoscopic Generation of Architectural Images [11.5]
本研究では,建築設計における生成人工知能の適用について検討する。本稿では,複数のニューラルネットワークを組み合わせて,教師なしかつ修正されていないユニークなアーキテクチャイメージのストリームを生成する手法を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:11:19 GMT)
Generative AI in Higher Education: Seeing ChatGPT Through Universities' Policies, Resources, and Guidelines [11.5]
本研究は、GenAIの利用に関して、米国トップクラスの大学が確立した学術政策とガイドラインを分析した。その結果,これらの大学の大部分は,GenAIに対するオープンだが慎重なアプローチを採用していることが示唆された。発見は、教育実践における教育者に4つの実践的意味を与える。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:21:46 GMT)
PID: Physics-Informed Diffusion Model for Infrared Image Generation [11.4]
赤外線イメージング技術は、低視認性条件下での信頼性の高いセンシング能力に大きな注目を集めている。既存の画像翻訳法の多くは、赤外線画像は、基礎となる物理法則を無視して、スタイリスティックなバリエーションとして扱う。物理法則に従う赤外線画像にRGB画像を変換するための物理情報拡散(PID)モデルを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:32:30 GMT)
Enhancing Emotion Recognition in Incomplete Data: A Novel Cross-Modal Alignment, Reconstruction, and Refinement Framework [11.3]
本稿では、CM-ARR(Cross-Modal Alignment, Reconstruction and Refinement)フレームワークを提案する。このフレームワークは、欠落したモダリティを扱うために、クロスモーダルアライメント、再構築、改善フェーズに従事します。 IEMOCAPおよびMSP-IMPROVデータセットの実験により、CM-ARRの欠落と完全モダリティの両方の条件下での優れた性能が確認された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:44:42 GMT)
Chasing Convex Functions with Long-term Constraints [11.0]
我々は,長期的制約を伴うオンライン計量問題群を紹介し,研究する。このような問題は、持続可能なエネルギー/計算システムにおけるオンラインリソース割り当てへの幅広い応用を見出すことができる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:44:38 GMT)
Full-Stage Pseudo Label Quality Enhancement for Weakly-supervised Temporal Action Localization [11.0]
本稿では,FuSTALフレームワークを構築するための簡易かつ効率的な擬似ラベル品質向上機構を提案する。 FuSTALはTHUMOS'14で平均50.8%のmAPを達成し、これまでのベストメソッドを1.2%上回った。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:53:55 GMT)
Soft Prompts Go Hard: Steering Visual Language Models with Hidden Meta-Instructions [10.9]
画像上で動作する言語モデルに,新たなタイプの間接的インジェクション脆弱性を導入する。ソフトプロンプトとして機能する画像を生成することによってメタ命令を生成する方法について説明する。誤情報やスピンを含むこれらの攻撃のリスクについて,複数の視覚言語モデルに対して有効性を評価する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:40:13 GMT)
AI-based Drone Assisted Human Rescue in Disaster Environments: Challenges and Opportunities [10.8]
無人航空機(UAV)は、災害時の捜索救助任務のために頻繁に配備される。大規模なドローンは、孤立した災害で立ち往生している人々に必須の物資を届けるために使われる場合もある。聴覚システムは、動物の鳴き声や風など、自然に発生する人間の叫び声と音を区別しなければならない。この課題に対処するためには、人工知能(AI)を使用して音の周波数を分析し、一般的なオーディオシグネチャを識別する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 20:34:34 GMT)
Context Embeddings for Efficient Answer Generation in RAG [10.7]
提案するCOCOMは,コンテキストの長いコンテキストを少数のコンテキスト埋め込みに短縮する,効果的なコンテキスト圧縮手法である。提案手法では,最大5.69ドルの高速化を実現しつつ,既存の効率的な文脈圧縮手法と比較して高い性能を実現している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:30:44 GMT)
A Comprehensive Review of Community Detection in Graphs [10.7]
複雑なネットワークの研究は、我々のコミュニティ構造に対する理解を著しく前進させてきた。グラフ内のコミュニティを検出することは、社会学、生物学、計算機科学の応用において難しい問題である。本稿では, グラフにおけるコミュニティ検出の話題について概説し, 様々なコミュニティ検出手法の徹底的な解説を行う。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:55:47 GMT)
Establishing a Baseline for Gaze-driven Authentication Performance in VR: A Breadth-First Investigation on a Very Large Dataset [10.6]
本稿では,9202人の視線記録のデータセットを用いて,視線駆動型認証性能のベースラインを確立する。我々の主要な発見は、最先端の機械学習アーキテクチャと十分に大きなトレーニングデータセットによって駆動される場合、視線認証はFIDO標準で必要とされるように正確であることを示している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:05:17 GMT)
RoboUniView: Visual-Language Model with Unified View Representation for Robotic Manipulaiton [10.5]
動作学習から視覚的特徴抽出を分離する革新的なアプローチであるRoboUniViewを提案する。我々はまず、アクセスしやすいデータに基づいて事前学習することで、多視点ビューから統一されたビュー表現を学び、その後、この統合されたビュー表現からアクションを導出し、ロボット操作を制御する。 CALVINベンチマークの最先端性能を達成し、D$が93.0%から96.2%に、ABC$が92.2%から94.2%に、D$が93.0%から96.2%に向上した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:57:43 GMT)
Local Optima in Diversity Optimization: Non-trivial Offspring Population is Essential [10.5]
例えば$k$-vertexのカバー問題があり、これは通常の単目的最適化と多様性最適化の重大な違いを浮き彫りにしている。さらに、$(mu + lambda)$ EA with $lambda ge mu$は、$k$-vertexのカバーで、事実上多様な集団を見つけることができることも示しています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:27:47 GMT)
Tissue-Contrastive Semi-Masked Autoencoders for Segmentation Pretraining on Chest CT [10.4]
胸部CT画像のモデリングのための組織コントラストセミマスクオートエンコーダ(TCS-MAE)と呼ばれるMIM法を提案する。本手法は, 組織型マスキング再構成法により, より微細な解剖学的特徴を捉えるとともに, マスク画像とオリジナル画像との対比学習を施した二重AEアーキテクチャを設計した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:24:17 GMT)
Pronunciation Assessment with Multi-modal Large Language Models [10.4]
大規模言語モデル(LLM)に基づくスコアリングシステムを提案する。音声エンコーダは、まず学習者の音声を文脈的特徴にマッピングする。アダプタ層は、これらの機能を潜在空間に埋め込まれたテキストに合わせるように変換する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:16:14 GMT)
Identification and Estimation of the Bi-Directional MR with Some Invalid Instruments [10.3]
両方向メンデルランダム化(MR)における純粋観測データから因果効果を推定する難題について考察する。本稿ではまず,観測データから双方向MRの同定を理論的に検討する。我々は,有効なIV集合を発見し,興味の因果効果を推定するクラスタ融合的手法を開発した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:15:58 GMT)
Towards Adaptive Pseudo-label Learning for Semi-Supervised Temporal Action Localization [10.2]
既存の手法はしばしば厳密な条件に基づいて擬似ラベルをフィルタリングし、最適でない擬似ラベルのランク付けと選択につながる。擬似ラベル選択を容易にするための適応擬似ラベル学習フレームワークを提案する。本手法は,各種半教師付き環境下での最先端性能を実現する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:36:55 GMT)
WateRF: Robust Watermarks in Radiance Fields for Protection of Copyrights [10.1]
我々はNeRFの両表現に利用できる革新的な透かし手法を提案する。これは、NeRFを微調整してバイナリメッセージをレンダリングプロセスに埋め込むことによって実現される。提案手法は,2次元レンダリング画像に埋め込まれた透かしの容量,可視性,堅牢性の3つの異なる側面で評価する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:35:19 GMT)
Parametric Matrix Models [10.1]
パラメトリック行列モデルと呼ばれる機械学習アルゴリズムのクラスを示す。パラメトリック行列モデルは、所望の出力につながる支配方程式を学ぶ。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 20:08:17 GMT)
FANet: Feature Amplification Network for Semantic Segmentation in Cluttered Background [10.0]
既存のディープラーニングアプローチでは、複雑なシナリオに存在するセマンティックセグメンテーションにおいて重要なセマンティックな方法が残されている。マルチステージ機能拡張モジュールを用いて意味情報を組み込んだバックボーンネットワークとして機能増幅ネットワーク(FANet)を提案する。実験の結果,既存の手法と比較して最先端の性能が示された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:57:52 GMT)
Disassembling Obfuscated Executables with LLM [9.9]
本稿では,難読化可能ファイルの解析における課題を克服する新しいディスサンブラであるDisasLLMを提案する。 DisasLLMは、アセンブリコードスニペット内の命令が正しくデコードされているかどうかを決定するLLMベースの分類器と、このモデルを利用して難読化された実行ファイルをエンドツーエンドに分解する分解戦略の2つのコンポーネントで構成されている。我々は、DisasLLMを非常に難解な実行ファイルの集合で評価し、他の最先端の分解ソリューションよりも大幅に優れていることを示した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:10:07 GMT)
Learning Distances from Data with Normalizing Flows and Score Matching [9.6]
密度に基づく距離は、メートル法学習の問題に対するエレガントな解決策を提供する。我々は,フェルマー距離を推定する既存の手法が,低次元と高次元の両方において収束不良に悩まされていることを示す。我々の研究は、特に高次元空間における密度に基づく距離の実践的利用の道を開いた。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:30:41 GMT)
Layer-Wise Relevance Propagation with Conservation Property for ResNet [9.6]
本稿では、ニューラルネットワーク予測を説明するためにRelevance Splittingを導入する。提案手法は, インサーション・削除スコアなどの評価指標において, 優れた性能を実現する。コードの詳細はhttps://5ei74r0.github.io/lrp-for-resnet.comで公開します。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:30:09 GMT)
3M-Health: Multimodal Multi-Teacher Knowledge Distillation for Mental Health Detection [9.5]
メンタルヘルス分類のためのマルチモーダル・マルチティーラー知識蒸留モデルを提案する。多様な特徴を統合するための単純な結合にしばしば依存する従来のアプローチとは異なり、我々のモデルは様々な性質の入力を適切に表現するという課題に対処する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:22:45 GMT)
Enhancing Few-Shot Stock Trend Prediction with Large Language Models [9.4]
既存の手法は主に、広範囲な注釈付きデータに基づいてトレーニングされた教師付きモデルによる株価トレンドの予測に重点を置いている。本稿では,ラベル付きデータの不足を克服するために,Large Language Models (LLM) を数ショットで使用することを提案する。 S&P500は66.59%、CSI-100は62.17%、HK株価予測は61.17%である。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:43:11 GMT)
Accuracy is Not All You Need [9.4]
複数の圧縮技術、モデル、データセットにまたがるメトリクスの詳細な調査を行います。本研究では, 圧縮モデルがエンドユーザーに対して可視である場合, 精度が類似している場合でも, ベースラインモデルとは大きく異なることを示す。我々は、KL-Divergence と flips という2つの指標を提案し、それらがよく相関していることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:19:02 GMT)
ViewFormer: Exploring Spatiotemporal Modeling for Multi-View 3D Occupancy Perception via View-Guided Transformers [9.3]
3Dの占有は、前景と背景を物理的空間で区別することなく、全体のシーンをグリッドマップに表現する。本稿では,効果的な多視点特徴集約のための学習優先視点アテンション機構を提案する。既存の高品質データセットの上に構築されたベンチマークであるFlowOcc3Dを紹介します。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:43:20 GMT)
Depth Information Assisted Collaborative Mutual Promotion Network for Single Image Dehazing [9.2]
単一画像のデハジングを実現するために,デュアルタスク協調促進フレームワークを提案する。このフレームワークは、デュアルタスク相互作用機構による深度推定とデハジングを統合している。提案手法は,最先端手法よりも優れた性能が得られることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:45:53 GMT)
Automata-based constraints for language model decoding [9.1]
LMは、いくつかの形式言語で文字列を生成することがしばしば期待されている。チューニングにはかなりのリソースが必要で、一般的でない、あるいはタスク固有のフォーマットでは実用的ではない。我々はこれらの問題をオートマトン理論を適用して解決する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:02:43 GMT)
Implicit meta-learning may lead language models to trust more reliable sources [9.1]
合成微調整データセットにおける有用性の指標としてランダム文字列(タグ)を導入する。このデータセットの微調整は暗黙的メタラーニング(IML)につながる私たちは、将来のAIシステムの能力、リスク、制御可能性について、私たちの結果が示唆するものを反映しています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:03:25 GMT)
A Survey on Deep Learning Hardware Accelerators for Heterogeneous HPC Platforms [9.0]
この調査は、ディープラーニングアクセラレータの設計における最新の進歩を要約し、分類する。それは、GPUやTPUベースのアクセラレータだけでなく、設計固有のハードウェアアクセラレータも含む、ディープラーニングアクセラレーションをサポートするための最も高度なアプローチを強調している。この調査では、新たなメモリ技術とコンピューティングパラダイムに基づいたアクセラレータについても説明している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:50:59 GMT)
Exploring Knowledge Transfer in Evolutionary Many-task Optimization: A Complex Network Perspective [9.0]
本稿では,EMATO内のタスク間の知識伝達のダイナミクスを解析するために,複雑なネットワークを利用する新しいフレームワークを提案する。その結果,これらのネットワークは多様であり,ネットワーク密度は異なるタスクセットに適応し,コミュニティ構造を指向したグラフ特性を示すことが示唆された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:49:04 GMT)
Conversational Assistants in Knowledge-Intensive Contexts: An Evaluation of LLM- versus Intent-based Systems [8.9]
言語モデル(LLM)により、会話アシスタント(CA)はより柔軟で人間的な方法で会話できる。 LLMは、インテントベースのシステムよりも優れたユーザエクスペリエンス、タスク完了率、ユーザビリティ、認識パフォーマンスを示した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:31:14 GMT)
A Novel Quantum Realization of Jet Clustering in High-Energy Physics Experiments [8.8]
高エネルギー粒子衝突ではクォークとグルーオンが生成され、すぐにジェットとして知られる衝突粒子噴霧を形成する。正確なジェット・クラスタリングは、起源のクォークやグルーオンの情報を保持するために重要である。この研究は、ジェットクラスタリングに革命をもたらす量子コンピューティングの可能性を強調した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:26:22 GMT)
UserBoost: Generating User-specific Synthetic Data for Faster Enrolment into Behavioural Biometric Systems [8.8]
実データと合成データを併用することで,生体認証システムにエンロールするために必要な実データポイント数を削減できることを示す。実世界のシステムにおいて,学習における合成ジェスチャーを用いることで,分類能力の向上が期待できることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:10:07 GMT)
Diagnosing and Re-learning for Balanced Multimodal Learning [8.8]
本稿では,不均衡なマルチモーダル学習問題を克服するための診断・再学習手法を提案する。各モードの学習状態は、その一様表現空間の分離性に基づいて推定される。このように、少ない情報モダリティの過度な強調は避けられる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 22:12:03 GMT)
Real Face Video Animation Platform [8.8]
リアルな人間の顔から漫画的な顔へのリアルタイムな変換を可能にする顔アニメーションプラットフォームを提案する。ユーザーは本物の顔のビデオや画像を入力し、好きな漫画のスタイルを選択することができる。システムは自動的に顔の特徴を分析し、必要な事前処理を実行し、適切なモデルを実行して表現力のあるアニメスタイルの顔を生成する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:17:41 GMT)
Neural-based Video Compression on Solar Dynamics Observatory Images [8.7]
NASAのソーラー・ダイナミクス・オブザーバトリー(SDO)ミッションは、太陽の日常活動を監視するために膨大なデータを収集する。データ圧縮は、限られたテレメトリレートによって引き起こされる課題に対処する上で重要な役割を果たす。本稿では,SDOの画像データ収集における圧縮率の高いニューラルビデオ圧縮手法を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:24:25 GMT)
DART: An Automated End-to-End Object Detection Pipeline with Data Diversification, Open-Vocabulary Bounding Box Annotation, Pseudo-Label Review, and Model Training [8.7]
本稿では,オブジェクト検出のためのエンドツーエンド自動パイプラインであるDARTについて述べる。 DARTは、多様なシナリオに優れながら、人間のラベル付けと広範なデータ収集の必要性を排除する。現在のDARTの実装により、平均精度(AP)は0.064から0.832に大幅に向上した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:16:44 GMT)
Basic syntax from speech: Spontaneous concatenation in unsupervised deep neural networks [8.7]
そこで本研究では,最も基本的な構文操作を生音声から直接,教師なしの方法でモデル化できることを提案する。本稿では,各単語の音響記録を訓練した畳み込みニューラルネットワーク(CNN)が,2、3単語で出力を発生させる現象について紹介する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:30:23 GMT)
Fast and Robust Phase Retrieval via Deep Expectation-Consistent Approximation [8.7]
本稿では,予測整合近似とDeep Denoising Networkを組み合わせたDeepECprを提案する。 DeepECprは、最近の拡散法にインスパイアされた新しい減衰スキームを含んでいる。 PSNRとSSIMでは5倍のデノイザコールで改善が見られた。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:12:50 GMT)
Boundary State Generation for Testing and Improvement of Autonomous Driving Systems [8.7]
本稿では,自律運転システム(ADS)テストのための新しいテストジェネレータであるGENBOについて述べる。このような境界条件を用いて、初期トレーニングデータセットを拡張し、テスト中のDNNモデルを再訓練する。評価結果から,再学習モデルでは,元のDNNモデルに対して,異なる評価トラックに対して平均で最大3倍の成功率を示した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:02:19 GMT)
The Minimum Information about CLinical Artificial Intelligence Checklist for Generative Modeling Research (MI-CLAIM-GEN) [8.6]
新しい生成モデルは、専門的なトレーニングデータをほとんど、あるいは全く持たずに有用な出力を生成することができる。新しいチェックリストは、非生成的(予測的)AIモデルと比較して、トレーニング、評価、解釈可能性、および新しい生成モデルの違いに対処することを目的としている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:46:33 GMT)
Data organization limits the predictability of binary classification [8.5]
実データセット上でのバイナリ分類性能の理論的上限は理論的に達成可能であることを示す。本分析により,2値分類データにおける性能の上限値とクラス重複レベルとの詳細な関係が明らかになった。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:04:47 GMT)
SE(3)-bi-equivariant Transformers for Point Cloud Assembly [8.3]
一対の点雲が与えられた場合、アセンブリの目標は、一方の点雲ともう一方の点雲を整合させる厳密な変換を回復することである。このタスクは、点雲がオーバーラップされない可能性があり、任意の初期位置を持つため、難しい。 BITR (SE(3)-bi-equivariant transformer) という手法を提案する。入力が厳格に摂動されると、出力がそれに従って変換されることを保証する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:01:28 GMT)
A Survey on Symbolic Knowledge Distillation of Large Language Models [8.2]
大規模言語モデルにおける記号的知識蒸留の出現と臨界領域に焦点を当てた調査。知識の深みを理解可能なフォーマットで維持することを含む、中核的な課題について説明する。この分野で開発された様々なアプローチや技法を精査する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:18:19 GMT)
vAttention: Dynamic Memory Management for Serving LLMs without PagedAttention [8.2]
VLLM は KV-cache の動的メモリ割り当てを可能にする PagedAttention を提案した。 PagedAttentionは、KV-cacheのレイアウトを、連続した仮想メモリから連続しない仮想メモリに変更する。動的KVキャッシュメモリ管理のための新しいアプローチであるvAttentionを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:33:31 GMT)
LaSe-E2V: Towards Language-guided Semantic-Aware Event-to-Video Reconstruction [8.2]
セマンティック・アウェアの高品質なE2V再構成を実現する新しいフレームワークであるLaSe-E2Vを提案する。まずイベント誘導時空間アテンション(ESA)モジュールを提案する。次に、時間的コヒーレンスを確保するためのイベント対応マスクロスと、空間的一貫性を高めるためのノイズ戦略を導入する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:03:04 GMT)
Evaluating AI Evaluation: Perils and Prospects [8.1]
本稿では,これらのシステムに対する評価手法が根本的に不適切であることを主張する。 AIシステムを評価するためには改革が必要であり、インスピレーションを得るために認知科学に目を向けるべきである、と私は主張する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:37:13 GMT)
HETOCompiler: An MLIR-based crypTOgraphic Compilation Framework for HEterogeneous Devices [8.1]
HETOCompilerは、異種システム用に設計された新しい暗号コンパイルフレームワークである。 HETOCompilerは、暗号プリミティブと異種コンピューティングモデルのための構文とセマンティクスを抽象化する。実験の結果、既存のOpenSSLライブラリよりも大幅にパフォーマンスが向上した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:12:51 GMT)
Equivariant vs. Invariant Layers: A Comparison of Backbone and Pooling for Point Cloud Classification [7.8]
3つのベンチマークポイントクラウド分類データセット上で、置換同変バックボーンと置換不変大域プールの相互作用について検討した。以上の結果から,トランスポートベースやアテンションベースといった複雑なプーリング手法は,単純なバックボーンの性能を大幅に向上させる可能性が示唆された。プール層の選択は、バックボーンの幅と深さを調整するよりも、モデルの性能に顕著な影響を与える可能性がある。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 23:40:41 GMT)
Segmenting Medical Images with Limited Data [7.8]
データ効率医療セグメンタ(DEMS)と呼ばれる半教師付き一貫性に基づくアプローチを提案する。 DEMSはエンコーダ・デコーダアーキテクチャを備え、開発されているオンライン自動拡張器(OAA)と残留ロバストネス強化(RRE)ブロックを組み込んでいる。極端なデータ不足のシナリオ下では、私たちのDEMSは、それぞれU-Netとトップパフォーマンスの最先端手法と比較して、ダイススコアが16.85%と10.37%向上しました。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:41:18 GMT)
Guidelines for Augmentation Selection in Contrastive Learning for Time Series Classification [7.7]
我々は、トレンドや季節といったデータセットの特徴に基づいて、拡張を選択するための原則的な枠組みを確立する。次に、12の合成データセットと6つの実世界のデータセットにまたがる8つの異なる拡張の有効性を評価する。提案手法は,時系列データセットの有効拡張を正確に識別する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:13:16 GMT)
Detect Closer Surfaces that can be Seen: New Modeling and Evaluation in Cross-domain 3D Object Detection [7.5]
本研究では,エゴ車両のセンサに近接する表面を検出する3次元物体検出モデルの能力を測定するための2つの指標を提案する。また、学習可能な近接面にもっと焦点を合わせるために、EdgeHeadという改良ヘッドも提案しています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:13:48 GMT)
One-Shot Pose-Driving Face Animation Platform [7.4]
我々は、Face LocatorとMotion Frame機構を統合することで、既存のImage2Videoモデルを洗練する。我々は、人間の顔ビデオデータセットを用いてモデルを最適化し、高品質な音声ヘッドビデオを作成する能力を大幅に向上させる。そこで我々は,Gradioフレームワークを用いたデモプラットフォームを開発し,プロセスの合理化を図り,ユーザがカスタマイズした音声ヘッドビデオを簡単に作成できるようにする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:09:07 GMT)
CLOVER: Context-aware Long-term Object Viewpoint- and Environment- Invariant Representation Learning [7.4]
様々な照明条件と視点下での8クラス557個のオブジェクトの1,037,814個の観測を含む,Wild オブジェクト再識別データセット CODa Re-ID を紹介する。また,静的なオブジェクトインスタンスを区別可能なオブジェクト観測のための表現学習手法であるCLOVERを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 23:16:48 GMT)
Does Incomplete Syntax Influence Korean Language Model? Focusing on Word Order and Case Markers [7.3]
語順やケースマーカーなどの構文要素は自然言語処理において基本的なものである。本研究は,韓国語モデルがこの柔軟性を正確に捉えることができるかどうかを考察する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:33:41 GMT)
Latent Watermark: Inject and Detect Watermarks in Latent Diffusion Space [7.1]
既存の手法は、画質と透かしの堅牢性のジレンマに直面している。画像品質の優れた透かしは通常、ぼやけやJPEG圧縮のような攻撃に対して弱い堅牢性を持つ。進行訓練戦略を用いた潜時透かしを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:41:44 GMT)
Spectral Self-supervised Feature Selection [7.1]
教師なし特徴選択のための自己教師付きグラフベースアプローチを提案する。提案手法のコアは,グラフラプラシアンの固有ベクトルに単純な処理ステップを適用することで,ロバストな擬似ラベルを計算することである。我々のアプローチは、外れ値や複雑な部分構造の存在など、困難なシナリオに対して堅牢であることが示されている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:29:08 GMT)
TelecomGPT: A Framework to Build Telecom-Specfic Large Language Models [7.0]
大きな言語モデル(LLM)は、第6世代(6G)通信ネットワークに革命をもたらす可能性がある。本稿では,汎用LLMを通信用LLMに適応させるパイプラインを提案する。既存の評価ベンチマークを拡張し、Telecom Math Modeling、Telecom Open QnA、Telecom Code Tasksという3つの新しいベンチマークを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:51:02 GMT)
BiSHop: Bi-Directional Cellular Learning for Tabular Data with Generalized Sparse Modern Hopfield Model [6.9]
BiSHopは、深層表型学習の2つの大きな課題に対処する。 BiSHopはデュアルコンポーネントのアプローチを採用し、列ワイドと行ワイドの両方のデータを逐次処理する。 We show BiSHop comes over current SOTA method with significantly less HPO run。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 22:45:41 GMT)
ECG Signal Denoising Using Multi-scale Patch Embedding and Transformers [6.9]
本稿では,1次元畳み込み層と変圧器アーキテクチャを組み合わせた深層学習手法を提案する。次に、この埋め込みをトランスネットワークの入力として使用し、ECG信号をデノナイズするトランスの能力を高める。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:13:52 GMT)
EchoMimic: Lifelike Audio-Driven Portrait Animations through Editable Landmark Conditions [6.8]
オーディオのみによって駆動される手法は、時には不安定である。顔のキーポイントのみによって駆動される方法は、より安定した運転ではあるものの、不自然な結果をもたらす。私たちはEchoMimicという新しいアプローチを導入しました。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:41:51 GMT)
Influencer Self-Disclosure Practices on Instagram: A Multi-Country Longitudinal Study [6.5]
この調査は、米国、ブラジル、オランダ、ドイツという4カ国のコンテンツクリエイター400名による100万以上の投稿から成っている。本研究は、各国間のコンテンツ収益化の専門化における差異を示すが、一貫したパターンを示す。一部の国ではスポンサー付きコンテンツの開示に重要な違いがあり、国家法と直接関係がある。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:02:18 GMT)
Metric Learning from Limited Pairwise Preference Comparisons [6.5]
理想点モデルに基づく選好比較から計量学習を研究する。一般に、$o(d)$比較は、無限に多くのユーザでさえ、計量に関する情報を示さないことを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:56:18 GMT)
DroneMOT: Drone-based Multi-Object Tracking Considering Detection Difficulties and Simultaneous Moving of Drones and Objects [6.4]
監視カメラなどの静的プラットフォーム上でのマルチオブジェクトトラッキング(MOT)は、大きな進歩を遂げている。しかし、ドローンのような動的プラットフォームに関しては、従来のMOT手法の有効性は著しく低下している。本稿では,ドローンによる物体検出の高速化と,小型でぼやけた,隠蔽された物体に対する特徴埋め込みを目的とした,ドローンの高速移動を考慮したDroneMOTを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:18:18 GMT)
Salt & Pepper Heatmaps: Diffusion-informed Landmark Detection Strategy [6.3]
解剖学的ランドマーク検出(Anatomical Landmark Detection)は、臨床測定のための画像の重要な領域を特定するプロセスである。機械学習モデルは、ヒートマップで表される確率領域としてランドマークの軌跡を予測する。我々は,自動解剖学的ランドマーク検出を高精度な生成モデルタスクとして再構成し,数ドットのヒートマップを生成する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:50:39 GMT)
Phase Diagram of the Schwinger Model by Adiabatic Preparation of States on a Quantum Simulator [6.2]
我々は、状態の断熱的準備を通じて量子デバイス上の量子物理系の位相構造を研究することが可能であると主張している。そこで我々は新しい手法を導入し、Swingerモデルに適用し、トポロジカルな$theta$-termの存在下でテストに成功した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:44:49 GMT)
Logical Characterizations of Recurrent Graph Neural Networks with Reals and Floats [6.2]
本稿では,2つのシナリオにおいて,繰り返しグラフニューラルネットワーク(GNN)の正確な論理的特徴について述べる。フロートに対して、繰り返しGNNと一致する形式主義は数えられるルールベースのモーダル論理であり、実数に対しては適切な無限のモーダル論理を用いる。キャラクタリゼーションを適用することで、モナディック二階述語論理で定義可能なグラフ特性と比較して、無限論理と規則論理は等しく表現力があることが証明できる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:34:58 GMT)
Exploring Generative AI Policies in Higher Education: A Comparative Perspective from China, Japan, Mongolia, and the USA [6.1]
本研究は,中国,日本,モンゴル,米国の4カ国における生成AIに関する国家政策の比較分析を行った。全4カ国が高等教育における生成AIに対する肯定的な態度を示す一方で、日本とアメリカは人間中心のアプローチを優先している。中国とモンゴルは国家の安全に関する懸念を優先し、そのガイドラインは特に教育に合わせたものではなく、社会水準に重点を置いている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:44:09 GMT)
GRAMMAR: Grounded and Modular Methodology for Assessment of Closed-Domain Retrieval-Augmented Language Model [6.1]
Retrieval-augmented Generation (RAG) システムは、ドメイン固有の知識ベースを問うために、様々な産業で活発に研究され、展開されている。これらのシステムを評価することは、ドメイン固有のクエリが不足し、それに対応する基底真理が不足しているため、ユニークな課題である。 GRAMMARは,1)リレーショナルデータベースとLCMを利用して,スケーラブルな問合せ対を効率よく生成するデータ生成プロセス,2)知識ギャップと堅牢性を区別し,欠陥モジュールの識別を可能にする評価フレームワークである。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:16:30 GMT)
Instruction Tuning for Secure Code Generation [6.0]
既存の命令チューニングスキームは、生成されたコードのセキュリティという重要な側面を見落としている。 SafeCoderは、多種多様な高品質データセットを使用して、セキュリティ中心の微調整を実行する。ユーティリティを保ちながら、セキュリティを大幅に改善できます(約30%)。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:45:57 GMT)
Scalability of Bayesian Network Structure Elicitation with Large Language Models: a Novel Methodology and Comparative Analysis [5.9]
本稿では,異なる経験を持つ複数のLLMに基づいて,ベイズネットワーク (BN) 構造解析手法を提案する。異なる大きさのBNを多種多様かつ広く知られていないBNに対して,本手法を1つの代替手法と比較し,その拡張性について検討する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:52:13 GMT)
Attribution Methods in Asset Pricing: Do They Account for Risk? [5.9]
本稿では、資産価格ドメインの知識から導かれるいくつかの公理を提示し、研究する。シャプリー値と積分勾配は、ほとんどの公理を保存するが、どちらも全ての公理を満たすことはできない。分析的および実証的な例を用いて、帰属法がいかにリスクを反映し、いつ使用すべきでないかを実証する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:16:54 GMT)
Compressed Sensing: A Discrete Optimization Approach [5.9]
本稿では, 2次円錐緩和を強化し, 独自の分岐結合アルゴリズムを開発する半定緩和法を提案する。マルチラベル分類アルゴリズムの構成要素として用いられる場合,提案手法は,ベンチマーク圧縮センシング法よりも高い分類精度を実現する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:46:02 GMT)
OmniSat: Self-Supervised Modality Fusion for Earth Observation [5.8]
OmniSatは,複数のEOモダリティ間の空間的アライメントを利用して,ラベルのない表現型マルチモーダル表現を学習する新しいアーキテクチャである。異なる性質のモダリティを組み合わせる利点を示すため、既存の2つのデータセットを新しいモダリティで拡張する。 OmniSatは、森林、土地被覆分類、作物マッピングの3つの下流タスクで実証されているように、教師なしの方法でリッチな表現を学習することができる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:45:46 GMT)
Deep Adversarial Defense Against Multilevel-Lp Attacks [5.6]
本稿では,EMRC法 (Efficient Robust Mode Connectivity) と呼ばれる,計算効率の良いマルチレベル$ell_p$ディフェンスを提案する。連続最適化で用いられる解析的継続アプローチと同様に、この手法は2つの$p$特化逆最適化モデルをブレンドする。我々は,AT-$ell_infty$,E-AT,MSDと比較して,本手法が様々な攻撃に対して優れていることを示す実験を行った。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:30:00 GMT)
Budget Recycling Differential Privacy [5.6]
幅広いDPメカニズムに対してソフトバウンドノイズ出力を提供するために設計された予算リサイクル微分プライバシー(BR-DP)フレームワーク。 BR-DPは2つのコンポーネントから構成される: 繰り返しごとにノイズの答えを生成するDPカーネルと、ノイズの答えを確率論的にリサイクルまたは再生するリサイクル器である。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:46:17 GMT)
EVOLVE: Predicting User Evolution and Network Dynamics in Social Media Using Fine-Tuned GPT-like Model [5.6]
本研究では,ソーシャルメディア上での利用者の生活の進化を予測的に理解する手法を提案する。 GPTライクなデコーダのみのモデルを微調整し、オンラインソーシャルメディアにおけるユーザの進化の将来の段階を予測する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:20:57 GMT)
Heterogeneous Subgraph Network with Prompt Learning for Interpretable Depression Detection on Social Media [5.6]
ソーシャルメディアにおける早期うつ病検出に関する既存の研究は、解釈可能性に欠けていた。本稿では,プロンプト学習を用いた異種サブグラフネットワークを利用した新しい手法を提案する。提案手法はソーシャルメディア上での抑うつ検出の最先端手法を著しく上回っている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:20:59 GMT)
15M Multimodal Facial Image-Text Dataset [5.6]
FaceCaption-15Mは、1500万対以上の顔画像と、それに対応する顔の特徴の自然言語記述で構成されている。画像品質, テキストの自然性, テキストの複雑さ, テキスト画像の関連性を総合的に分析し, FaceCaption-15Mの優位性を実証した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:19:33 GMT)
TOP-Nav: Legged Navigation Integrating Terrain, Obstacle and Proprioception Estimation [5.5]
TOP-Navは、包括的パスプランナーとTerran認識、Obstacle回避、クローズループプロプライオセプションを統合した、新しい脚付きナビゲーションフレームワークである。そこで,TOP-Navは,従来の知識の分布を超えた地形や乱れをロボットが扱えるように,オープンワールドナビゲーションを実現する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:12:19 GMT)
StainFuser: Controlling Diffusion for Faster Neural Style Transfer in Multi-Gigapixel Histology Images [5.4]
静止正規化アルゴリズムは、ソースマルチギガピクセルの組織像の色と強度特性を、対象画像と一致するように変換することを目的としている。本稿では,新しい条件付き潜在拡散アーキテクチャを用いて,この問題をスタイル伝達タスクとして扱う新しいアプローチであるStainFuserを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:27:06 GMT)
CausalLP: Learning causal relations with weighted knowledge graph link prediction [5.3]
CausalLPは知識グラフ補完問題として不完全因果ネットワークの問題を定式化している。因果関係を表す知識グラフを使うことで、外部のドメイン知識の統合が可能になる。 CausalLPでは、因果的説明と因果的予測という2つの主要なタスクがサポートされている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:11:26 GMT)
A Two-Layer Blockchain Sharding Protocol Leveraging Safety and Liveness for Enhanced Performance [5.3]
既存のプロトコルは、さまざまな敵攻撃を見落とし、トランザクションスループットを制限します。本稿では,この問題に対処する基盤的シャーディングプロトコルReticulumを提案する。コントロール"と"プロセス"のシャードを2つのレイヤで構成する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:12:21 GMT)
When can weak latent factors be statistically inferred? [5.2]
本稿では、主成分分析(PCA)のための新しい包括的推定と推論理論を確立する。我々の理論は断面次元$N$と時間次元$TT$の相対的な成長速度によらず適用可能である。注目すべき技術的革新は、PCAベースの推定器のクローズドフォームの1次近似であり、様々な統計的テストの道を開くものである。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:03:53 GMT)
Optimal Fidelity-Aware Entanglement Distribution in Linear Quantum Networks [5.1]
本稿では,2リンク線形量子ネットワークにおける終端エンタングルメントの完全忠実度を最大化するユーティリティ関数の最大化問題について検討する。本稿では,Purify-then-Swap (PtS) とSwap-then-Purify (StP) の2つのアルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:09:30 GMT)
A Novel Framework for Automated Warehouse Layout Generation [5.1]
自動倉庫レイアウト生成のためのAI駆動フレームワークを提案する。このフレームワークは、制約されたビームサーチを用いて、与えられた空間パラメータ内の最適なレイアウトを導出する。本手法は, 各種倉庫の寸法や形状に対して, 実現可能な最適レイアウトを作成できることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:06:45 GMT)
On the Design and Security of Collective Remote Attestation Protocols [5.0]
Collective Remote Attestation (CRA)は、(異種)ネットワークにおいて、侵入されたデバイスを効率的に識別することを目的としたセキュリティサービスである。ここ数年、CRAプロトコルの提案が大幅に増加し、様々なネットワークトポロジによってガイドされた様々な設計が示されている。 CRAプロトコルを体系的に比較可能な統合フレームワークであるCatを提示する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:06:49 GMT)
SlideGCD: Slide-based Graph Collaborative Training with Knowledge Distillation for Whole Slide Image Classification [5.0]
最近の研究は、スライド間の相関を無視した1つのWSIの内部コンテキスト情報に主に焦点を当てている。本稿では,既存のマルチインスタンス学習(MIL)手法をバックボーンとして考慮し,ノード分類問題としてWSI分類タスクをフォークする汎用的なWSI解析パイプラインSlideGCDを提案する。 2つのTCGAベンチマークデータセットで、これまでの4つの最先端MILメソッドのSlideGCDによる一貫したパフォーマンス向上が観察された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:32:13 GMT)
FD-SOS: Vision-Language Open-Set Detectors for Bone Fenestration and Dehiscence Detection from Intraoral Images [5.0]
FD-SOSは、口腔内画像からFDを検出するための新しいオープンセットオブジェクト検出器である。 CCDN( Conditional contrastive denoising)とTMA(orth-specific matching assignment)の2つの新しい構成要素がある。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:29:25 GMT)
A Deployable Quantum Access Points Selection Algorithm for Large-Scale Localization [5.0]
本稿では,大規模ローカライゼーションシステムのための量子APs選択アルゴリズムを提案する。環境中で利用可能なAPの14%未満を選択することで、我々の量子アルゴリズムはAPの集合全体を利用するのと同じフロアローカライズ精度を達成する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:59:37 GMT)
Is Contrasting All You Need? Contrastive Learning for the Detection and Attribution of AI-generated Text [4.9]
WhosAIは、与えられた入力テキストが人間かAIによって生成されたかを予測するために設計された3重ネットワークコントラスト学習フレームワークである。提案するフレームワークは,チューリングテストとオーサリングの両タスクにおいて,優れた結果が得られることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:44:56 GMT)
SAT Encoding of Partial Ordering Models for Graph Coloring Problems [4.8]
グラフ着色問題と帯域幅着色問題に対する部分順序付けベースLPモデルの新たなSAT符号化を提案する。広く研究されているGCPでは、新しいSATエンコーディングとDIMACSベンチマークセットの最先端アプローチを実験的に比較する。理論解析により,部分順序付きSATとILPの定式化は古典的代入ベースモデルよりも大幅に小さいことがわかった。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:08:05 GMT)
Flow-Based Generative Emulation of Grids of Stellar Evolutionary Models [4.7]
恒星進化モデルの格子をエミュレートするフローベース生成手法を提案する。様々な進化軌道やアイソクロンを連続的な入力パラメータにわたってエミュレートする能力を示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:54:17 GMT)
Lite-SAM Is Actually What You Need for Segment Everything [4.7]
Lite-SAMはSegEveryタスクの効率的なエンドツーエンドソリューションである。 Lite-SAMは4つの主要コンポーネントで構成されている: 合理化されたCNN-Transformerハイブリッドエンコーダ(LiteViT)、自動プロンプトプロポーザルネットワーク(AutoPPN)。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:28:46 GMT)
DRM Revisited: A Complete Error Analysis [4.6]
目標精度を考慮すれば,適切なトレーニングサンプル数を決定するには,どうすればよいのか? 勾配降下過程の出力は、基礎となる偏微分方程式の真の解を特定の精度に近似するだろうか?
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:48:00 GMT)
Random Inverse Problems Over Graphs: Decentralized Online Learning [4.6]
ネットワークグラフ上の分散ランダム逆問題とオンライン計測のフレームワークを構築した。無限ヒルベルト空間におけるL2-漸近安定理論を開発する。非定常および非独立オンラインデータに基づく分散オンライン学習アルゴリズムをRKHSで提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:17:04 GMT)
Revealing the True Cost of Locally Differentially Private Protocols: An Auditing Perspective [4.5]
本稿では,ローカルな差分秘密機構のプライバシー損失を実証的に推定する LDP-Auditor フレームワークについて紹介する。我々は、異なるエンコーディングや摂動機能の影響など、プライバシー監査に影響を与える要因を幅広く検討する。 LDP-Auditorフレームワークは,現在最先端のLPP Pythonパッケージにバグが発見されている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:49:48 GMT)
Integrating White and Black Box Techniques for Interpretable Machine Learning [4.5]
機械学習アルゴリズム設計では、アルゴリズムの解釈可能性と性能の間にトレードオフが存在する。本稿では,高解釈可能な分類器を用いて,より簡単な入力を分類するアンサンブル分類器の設計を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:58:04 GMT)
Prompts First, Finally [4.5]
生成AI(GenAI)と特に大規模言語モデルは、コンピュータサイエンス教育を妨害している。一部の教育者は、彼らがコンピューティング教育に深刻な脅威をもたらし、教室での彼らの使用を禁止すべきだと主張している。プログラミングの抽象化は常に、自然言語に向けられている、と私たちは主張する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:50:28 GMT)
Exploring Data Management Challenges and Solutions in Agile Software Development: A Literature Review and Practitioner Survey [4.5]
ソフトウェア製品とその開発に関連するデータを管理することは、ソフトウェアプロジェクトやアジャイルチームにとって大きな課題となる。課題には、さまざまなソースからのデータを統合し、継続的な変更と適応の観点からデータ品質を保証することが含まれる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:33:59 GMT)
Traffic signal optimization in large-scale urban road networks: an adaptive-predictive controller using Ising models [4.4]
本稿では,スケーラビリティと最適性の両方を保証するAMPICという制御手法を提案する。提案手法では,車両流の予測モデルを明確に考慮し,各制御区間における最適制御問題の解法としてモデル予測制御を用いる。その結果,AMPICは従来の制御方式よりも待ち時間が少なく,より高速な走行が可能であった。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:55:44 GMT)
Introducing GPU-acceleration into the Python-based Simulations of Chemistry Framework [4.4]
我々はPySCFのメソッドのGPUアクセラレーションを提供するモジュールであるGPU4PySCFの最初のバージョンを紹介する。ベンチマーク計算は、PySCFのマルチスレッドCPUHartree-Fockコードに対して、2桁の大幅な高速化を示している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:50:19 GMT)
Feasibility Study on Active Learning of Smart Surrogates for Scientific Simulations [4.4]
深層ニューラルネットワーク(DNN)のサロゲートトレーニングにアクティブラーニングを組み込むことの可能性を検討する。これにより、インテリジェントで客観的なトレーニングシミュレーションの選択が可能になり、広範なシミュレーションデータを生成する必要がなくなる。その結果、スマートサロゲートのための高性能コンピューティング基盤の開発の基礎となった。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:10:53 GMT)
ConRebSeg: A Segmentation Dataset for Reinforced Concrete Construction [4.3]
鉄筋コンクリート施工のためのセグメンテーションラベル付き14,805枚のRGB画像のデータセットを提供する。データ可用性とラベルの不整合がモデルの性能に与える影響について検討する。我々は,建設業界における自律ロボットシステムの開発を促進するために,クラウドソースによるデータセットを提唱する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:53:15 GMT)
DANIEL: A fast Document Attention Network for Information Extraction and Labelling of handwritten documents [4.3]
手書き文書理解のための完全なエンドツーエンドアーキテクチャであるDANIEL(Document Attention Network for Information extract and Labelling)を紹介する。 DANIELは全ページ文書上でレイアウト認識、手書き認識、名前付きエンティティ認識を行う。複数の言語、レイアウト、タスクを同時に学習できる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:09:56 GMT)
On Exact Bit-level Reversible Transformers Without Changing Architectures [4.3]
推論手順のアーキテクチャを変更することなく、正確なビットレベルの可逆変換器を提案する。 BDIA変換器は、$gamma$パラメータの正規化効果により、元の変換器よりも優れている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:42:58 GMT)
Movie Recommendation with Poster Attention via Multi-modal Transformer Feature Fusion [4.2]
本研究では,各映画のポスターの特徴を抽出し,マルチモーダルな映画レコメンデーションシステムを提案する。概念実証モデルの効率は、MovieLens 100Kと1Mデータセットの標準ベンチマーク問題によって検証される。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:44:51 GMT)
Towards Practical and Useful Automated Program Repair for Debugging [4.2]
PracAPRは統合開発環境(IDE)で動作する対話型修復システムである PracAPRはテストスイートやプログラムの再実行を必要としない。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:19:54 GMT)
Streaming quantum state purification [4.2]
量子状態浄化(Quantum state purification)は、未知の純粋な量子状態のほぼ純粋なコピーを復元する作業である。この基本的なタスクは、ノイズの多いチャネル上の量子通信や不完全なデバイスによる量子計算に応用できる。任意の次元のクォーディットのスワップテストに基づいて効率的な浄化手順を導出する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:28:06 GMT)
Vehicle-to-grid for car sharing -- A simulation study for 2030 [4.1]
カーシェアリングシステムは、車両間グリッド(V2G)技術による補助サービスの提供を通じてグリッド安定性を高める上で重要な役割を果たす。本研究では、スイスにおける全国規模のサービスのための将来のシナリオを設計し、カーシェアリングにおけるV2Gの可能性を分析する。本研究は意思決定者に対してガイドラインを提供し,カーシェアリングの領域内での電力取引に関する規制強化の必要性を強調した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:55:01 GMT)
CLIP-PAE: Projection-Augmentation Embedding to Extract Relevant Features for a Disentangled, Interpretable, and Controllable Text-Guided Face Manipulation [4.1]
対照的に、CLIP(Contrastive Language- Image Pre-Training)は、画像とテキストを共同の潜在空間に埋め込むことでブリッジする。共同空間における画像とテキストの埋め込みの相違により、最適化対象としてテキストの埋め込みを用いることで、結果の画像に望ましくないアーティファクトがしばしば導入される。テキスト誘導画像操作の性能向上のための最適化ターゲットとして,CLIPプロジェクション拡張埋め込み(PAE)を導入する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:44:29 GMT)
Large Language Models for Integrating Social Determinant of Health Data: A Case Study on Heart Failure 30-Day Readmission Prediction [4.0]
健康の社会的決定因子(SDOH)は、健康の結果に重要な役割を果たす。最近のオープンデータイニシアチブは、より包括的なSDOHのビューを構築する機会を提供する。大規模言語モデル(LLM)は、構造化されたデータを自動的にアノテートすることを約束している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:14:06 GMT)
CAMP: Continuous and Adaptive Learning Model in Pathology [4.0]
病理画像分類のためのCAMPにおける連続的適応学習モデルを提案する。 CAMPは生成的、効率的、適応的な分類モデルであり、任意の分類タスクに継続的に適応することができる。我々はCAMPを17の分類タスクに対して,1,171,526のパッチと11,811の病理スライドを含む22のデータセットで評価した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:45:37 GMT)
MonoSparse-CAM: Harnessing Monotonicity and Sparsity for Enhanced Tree Model Processing on CAMs [4.0]
本稿では,コンテンツ適応型メモリ(CAM)に基づく計算最適化技術であるMonoSparse-CAMを紹介する。 MonoSparse-CAMはTBMLモデルスパーシリティとCAMアレイ回路を効率よく利用し、処理性能を向上させる。 CAMベースのコンピューティングにおいて,効率的なデプロイメント最適化ソリューションとしてMonoSparse-CAMを提案するとともに,TBMLモデル構造が配列空間に与える影響について検討する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 20:34:59 GMT)
Textual Query-Driven Mask Transformer for Domain Generalized Segmentation [3.9]
視覚言語モデルのテキスト埋め込みからドメイン不変セマンティック知識を活用することにより、ドメイン一般化セマンティック(DGSS)に取り組む手法を提案する。我々は、変換器ベースのセグメンテーションフレームワーク(テキストオブジェクトクエリ)内で、オブジェクトクエリとしてテキスト埋め込みを採用する。我々のtqdmはGTA5$rightarrow$Cityscapes上で68.9 mIoUを達成した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:49:16 GMT)
Combining Neural Networks and Symbolic Regression for Analytical Lyapunov Function Discovery [3.8]
非線形力学系に対する解析的リアプノフ関数を構成するために,CoNSAL (Combining Neural Network and regression for Analytical Lyapunov function)を提案する。このフレームワークは、ニューラルネットワークを精密な分析形式に蒸留するためにシンボリックレグレッションを適用する、ニューラルリアプノフ関数とシンボリックレグレッション成分を含む。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 20:08:46 GMT)
Computational-Statistical Trade-off in Kernel Two-Sample Testing with Random Fourier Features [3.7]
MMD(Maximum Mean Discrepancy)テストは、複雑で高次元のデータを扱う効果的なツールとして登場した。 MMD試験と同じ出力保証を準4次時間で達成できるかどうかは不明だ。準4次時間内にMDD試験と同じミニマックス分離率が得られることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:08:01 GMT)
One Stone, Four Birds: A Comprehensive Solution for QA System Using Supervised Contrastive Learning [3.7]
本稿では,教師付きコントラスト学習(SCL)による質問応答システム(QA)の堅牢性と効率を高めるための,新しい総合的ソリューションを提案する。ユーザ入力意図分類、ドメイン外入力検出、新しい意図発見、継続学習の4つの重要なタスクを定義した。下流タスクに最小限のチューニングを加えることで、モデル効率を大幅に改善し、すべてのタスクにまたがる新しい最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:01:51 GMT)
Beyond Euclid: An Illustrated Guide to Modern Machine Learning with Geometric, Topological, and Algebraic Structures [3.5]
現代の機械学習は、本質的に非ユークリッド的なリッチな構造化されたデータに遭遇する。そのような非ユークリッドデータから知識を抽出するには、より広範な数学的視点が必要である。我々は最近の進歩を直感的な統合フレームワークに統合するグラフィカルな分類法を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:48:36 GMT)
Introducing VaDA: Novel Image Segmentation Model for Maritime Object Segmentation Using New Dataset [3.5]
海上輸送産業はコンピュータビジョン人工知能(AI)の進歩によって急速に進化している海洋環境における物体認識は、光の反射、干渉、激しい照明、様々な気象条件といった課題に直面します。既存のAI認識モデルとデータセットは、自律ナビゲーションシステムを構成するのに限定的に適している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:48:53 GMT)
Time-Frequency Analysis of Variable-Length WiFi CSI Signals for Person Re-Identification [3.4]
人物再識別(ReID)は、セキュリティ検出や数え方において重要な役割を果たす。本文では, 歩行者の特徴を識別するための基礎として, WiFi信号のマルチパス伝搬特性を活用する, WiFiチャネル状態情報(CSI)を用いた手法を紹介する。本稿では、WiFi信号の周波数領域における時間領域の振幅と位相を解析し、可変長データを処理できる2ストリームネットワーク構造を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:10:47 GMT)
The Two Sides of the Coin: Hallucination Generation and Detection with LLMs as Evaluators for LLMs [3.4]
本研究は,CLEF ELOQUENT HalluciGen共有タスクへの参加を示す。目的は、幻覚コンテンツの生成と検出の両方のための評価器を開発することである。 Llama 3, Gemma, GPT-3.5 Turbo, GPT-4の4つのLLMの能力について検討した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:34:46 GMT)
Are They the Same Picture? Adapting Concept Bottleneck Models for Human-AI Collaboration in Image Retrieval [3.2]
textttCHAIRを使えば、人間が中間概念を修正できる。本手法は,外部介入を伴わずに,画像検索指標の類似モデルよりも優れた性能を示すことを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:59:32 GMT)
Development of Cognitive Intelligence in Pre-trained Language Models [3.2]
近年の研究では、大規模事前学習言語モデルにおける創発的認知能力の証拠が示されている。 PLMの発達軌跡は、人間の認知発達に対する最大限の調整の窓を一貫して示している。この窓のあと、トレーニングは損失を減らすという工学的な目標に役立っているように見えるが、人間の認知との整合性を高めるという科学的目標ではない。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:47:31 GMT)
Enhancing Training Efficiency Using Packing with Flash Attention [3.1]
Hugging Face SFTトレーナーは、最大シーケンス長までの複数のトレーニング例を組み合わせるためにパッキングを使用するオプションを提供する。私たちは、各例の適切な注意マスクで、パッキングとFlashアテンションを有効化し、分析し、このトレーニングパラダイムの利点を示します。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:10:37 GMT)
Spectroscopy of elementary excitations from quench dynamics in a dipolar XY Rydberg simulator [3.0]
我々は、ライドバーグ量子シミュレータを用いて、クエンチ分光と呼ばれる新しいタイプの分光法を実証する。本稿では,スピン-1/2双極子XYモデルの二次元シミュレーションについて述べる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:51:17 GMT)
Comparing supervised learning dynamics: Deep neural networks match human data efficiency but show a generalisation lag [3.0]
近年の研究では、画像分類分野における人間とディープニューラルネットワーク(DNN)の行動比較が数多く行われている。本稿では、人間の観察者および様々な古典的かつ最先端のDNNにおける学習力学の詳細な研究について報告する。学習プロセス全体にわたって、十分に学習された表現が、これまで見つからなかったテストデータにどのように一般化できるかを評価し、比較する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:47:19 GMT)
Alistair: Efficient On-device Budgeting for Differentially-Private Ad-Measurement Systems [3.0]
本稿では、既存のプライバシー保護広告計測APIを強化する取り組みについて述べる。 Google、Apple、Meta、Mozillaのデザインを分析し、より厳格で効率的な差分プライバシー(DP)予算コンポーネントでそれらを強化します。当社のアプローチはAlistairと呼ばれ、明確に定義されたDP保証を強制し、広告主がより正確なプライベートな測定クエリを実行できるようにする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:59:41 GMT)
Tree Ensembles for Contextual Bandits [3.0]
木アンサンブルに基づくコンテキスト型マルチアームバンディットのための新しいフレームワークを提案する。本フレームワークでは,アッパー信頼境界法とトンプソンサンプリング法という,広範に使用されている帯域幅法を標準法と設定法の両方で統合する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:40:08 GMT)
How Chinese are Chinese Language Models? The Puzzling Lack of Language Policy in China's LLMs [2.9]
18言語で中国語企業によって事前訓練された6つのオープンソース多言語LPMを評価した。実験の結果,中国における多言語でのLLMのパフォーマンスは国際LLMと区別できないことがわかった。われわれは、中国のLLM開発において、言語多様性のいずれに対しても、一貫した政策の兆候は見つからない。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:21:40 GMT)
AI-Enhanced Intensive Care Unit: Revolutionizing Patient Care with Pervasive Sensing [2.9]
集中治療室 (ICU) は、重篤な患者が集中治療や監視を受ける特別な病院空間である。包括的モニタリングは、患者の状態、特に明度、究極的にはケアの質を評価する上で必須である。現在、表情、姿勢、移動といった細部を含む視力評価は散発的に捉えられるか、全く捉えられていない。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:30:28 GMT)
Combining Federated Learning and Control: A Survey [2.9]
この調査は、(非線形)制御アプリケーションにおける適応性、スケーラビリティ、一般化、プライバシを高めるために、フェデレートラーニング(FL)とコントロールを組み合わせる概要を提供する。 FLは、データプライバシを保持しながら、分散デバイス間の協調学習を可能にする、モデルトレーニングに対する分散アプローチを提供する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:29:17 GMT)
Task-driven single-image super-resolution reconstruction of document scans [2.8]
文書スキャンから光学的文字認識を改善するために,超解像を前処理ステップとして活用する可能性を検討する。そこで本研究では,単一画像の超解像のための深層ネットワークをタスク駆動方式で訓練し,テキスト検出のための適応性を高めることを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:18:26 GMT)
H2O-Danube3 Technical Report [2.8]
6Tトークンで訓練されたH2O-Danube3-4Bと、4Tトークンで訓練されたH2O-Danube3-500Mからなる一連の小言語モデルであるH2O-Danube3を提案する。我々のモデルは、チャットバージョンの最終教師ありチューニングの前に、主に英語のトークンを3段階に分けた高品質なWebデータに基づいて事前訓練されている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:09:40 GMT)
Privacy-Preserving Collaborative Genomic Research: A Real-Life Deployment and Vision [2.8]
本稿ではLynx.MDと共同で開発されたゲノム研究のためのプライバシ保護フレームワークを提案する。このフレームワークは、重要なサイバーセキュリティとプライバシの課題に対処し、プライバシ保護によるゲノムデータの共有と分析を可能にする。 Lynx.MD内でのフレームワークの実装には、ゲノムデータをバイナリ形式に符号化し、制御された摂動技術を通じてノイズを適用することが含まれる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:43:13 GMT)
Fair Federated Data Clustering through Personalization: Bridging the Gap between Diverse Data Distributions [2.8]
フェデレーションクラスタリングにおけるパーソナライズの概念を導入し、より低いクラスタリングコストとクライアント間の均一なコストのバランスを達成することを目的とする。サーバとクライアント間の1ラウンドの通信でこれらの目標に対処するp-FClusを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:35:33 GMT)
Maximum expectation of observables with restricted purity states [2.8]
実用的な量子情報処理(QIP)の評価は、ノイズによって課される限界を理解せずに部分的に行われている。我々は、ノイズの多い量子状態の準備、検証、観察を行うための推定の必要性を満たす。ノイズの多いシステムは、ノイズのないシステムよりも常に高い基底状態エネルギーを与えます。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:48:25 GMT)
On Suppressing Range of Adaptive Stepsizes of Adam to Improve Generalisation Performance [2.7]
我々はAdamの適応段差の範囲を抑えるために階層統計を利用する。結果のアルゴリズムはSET-Adamと呼ばれ、SETは3つの操作の簡単な表記法である。 SET-Adamは、ImageNet上でResNet18をトレーニングするためにAdamやAdaBeliefよりも高い検証精度を生成する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:46:14 GMT)
GPC: Generative and General Pathology Image Classifier [2.7]
本稿では,GPCと呼ばれるタスク依存型画像分類器を提案する。 GPCは、病理画像を高次元の特徴空間にマッピングし、テキストとして関連するクラスラベルを生成する。我々は,4つの病理画像分類タスクに対して,GPCを6つのデータセットで評価した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:54:31 GMT)
SAMM: Sharded Automated Market Makers [2.7]
複数の独立したEmphshardからなるAMMであるEmphSAMMを提案する。流動性プロバイダは、すべてのプールの流動性をバランスさせ、取引が均等に分散された状態に収束する。 Suiブロックチェーンの評価によると、SAMMのスループットは従来のAMMの5倍以上であり、システムの限界に近づいている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 20:38:20 GMT)
MS-TCRNet: Multi-Stage Temporal Convolutional Recurrent Networks for Action Segmentation Using Sensor-Augmented Kinematics [2.6]
本研究は,運動学的データに対する行動セグメンテーションに関連する2つのコントリビューションを提示する。本稿では,キーネマティックデータに特化して設計されたMulti-Stage Temporal Convolutional Recurrent Networks (MS-TCRNet) の2つのバージョンを紹介する。第2に、キネマティックデータの強い幾何学的構造を利用してアルゴリズムの性能とロバスト性を向上する、World Frame RotationとHand Inversionという2つの新しいデータ拡張手法を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:48:09 GMT)
Semi-Supervised Learning for Deep Causal Generative Models [2.6]
我々は、変数間の因果関係を利用して、利用可能なすべてのデータの使用を最大化する半教師付き深い因果生成モデルを開発する。因果推論の手法を利用して、欠落した値を推測し、現実的な反事実を生成する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:13:41 GMT)
Topological Transitions in a Kerr Nonlinear Oscillator [2.6]
カー非線形発振器(KNO)は一対の定常固有状態、対向位相のコヒーレント状態をサポートする。断熱的固有状態の進化は、3つの物理的観測物全てを測定するために用いられる。位相遷移は、最初のチャーン数のジャンプによって明らかにされる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:58:54 GMT)
Under the Hood of Tabular Data Generation Models: the Strong Impact of Hyperparameter Tuning [2.5]
本研究では,モデル統合評価の実践的ニーズに対処する。高速な最適化を実現するために,各モデルに対する探索空間の削減を提案する。ほとんどのモデルでは、データセット固有の大規模チューニングによって、オリジナルの構成よりもパフォーマンスが大幅に向上する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:16:33 GMT)
High-Performance Silicon Photonic Single-Sideband Modulators for Cold Atom Interferometry [2.5]
光パルス原子干渉計(LPAI)は光パルス原子干渉計(LPAI)の中で最も複雑で困難なシステムである LPAIレーザーの主な機能は、低温原子生成、状態準備、状態選択検出を行い、光パルスシーケンスのためのコヒーレントな2光子過程を生成することである。高性能シリコンフォトニックキャリアシングルサイドバンド(SC-SSB)変調器を1560nmで実証し,LPAI内で動的に周波数シフトを行う。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 20:07:07 GMT)
FAD-SAR: A Novel Fishing Activity Detection System via Synthetic Aperture Radar Images Based on Deep Learning Method [2.4]
本稿では,深層学習に基づく漁業活動検知システムを提案する。 6つの古典的オブジェクト検出モデルを使用して、xView3データセットに実装されている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:38:19 GMT)
GenerateCT: Text-Conditional Generation of 3D Chest CT Volumes [2.4]
GenerateCTは、フリーフォームの医療用テキストプロンプトに条件付けされた3D医療用画像を生成するための最初のアプローチである。 GenerateCTを最先端のメソッドと比較し、すべての主要な指標でその優位性を実証した。 GenerateCTは、任意のサイズの合成トレーニングデータセットのスケーリングを可能にする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:28:05 GMT)
Deep Attention Driven Reinforcement Learning (DAD-RL) for Autonomous Vehicle Decision-Making in Dynamic Environment [2.4]
AV中心の時間的注意符号化(STAE)機構を導入し,周囲の車両との動的相互作用を学習する。マップとルートのコンテキストを理解するために,コンテキストマップの抽出にコンテキストエンコーダを用いる。得られたモデルは、Soft Actor Critic (SAC)アルゴリズムを用いて訓練される。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:34:44 GMT)
Toward Regulatory Compliance: A few-shot Learning Approach to Extract Processing Activities [2.2]
本稿では,大規模言語モデル(LLM)を用いたユーザ認可利用シナリオからRoPAのセグメントを生成する手法を提案する。本研究は,F1スコアの要約における実例数の有意な影響を示唆するものである。提案手法は,平均70%のROUGE-L F1スコアで処理アクティビティの要約を成功させる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:56:18 GMT)
DISTINQT: A Distributed Privacy Aware Learning Framework for QoS Prediction for Future Mobile and Wireless Networks [2.1]
5Gと6G以上のネットワークは、あるレベルのQuality of Service(QoS)に依存してスムーズな運用を行う、新しくて挑戦的なユースケースとアプリケーションをサポートすることが期待されている。タイムリーな方法での予測は、特に車両通信の場合のように、安全クリティカルな応用において非常に重要である。 DisTINQTは、予測のための新しいマルチヘッド入力対応分散学習フレームワークである。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:27:57 GMT)
Robustness of LLMs to Perturbations in Text [2.1]
大規模言語モデル(LLM)は素晴らしいパフォーマンスを示していますが、現実のデータでは避けられないノイズを処理できますか? この研究は、LLMのテキストのモルフォロジー変化に対するレジリエンスを調査することによって、この重要な問題に取り組む。以上の結果から, LLM は, 一般の信念とは対照的に, 文中での騒々しい摂動に対して静かであることが明らかとなった。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:50:17 GMT)
Surgical Text-to-Image Generation [2.0]
手術領域に対するテキスト・ツー・イメージ生成モデルの適用について,詳細な解析を行った。様々な言語モデルについて検討し,T5は三重項に基づくテキスト入力に基づく手術動作の識別に,より明確な特徴を提供する。我々は,3重項に基づくテキストプロンプトから,フォトリアリスティックかつ活動対応の手術画像を生成する手術画像nを開発した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:49:11 GMT)
A Taxonomy and Comparative Analysis of IPv4 ID Selection Correctness, Security, and Performance [1.9]
よりセキュアなインターネットへの戦いは、ネットワークプロトコルの最も基本的な部分を含む、多くの面で争われている。本稿では,25年間のIPID利用履歴とそれに対応するIPID選択方法の変更を分類する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 23:44:41 GMT)
STENCIL: Submodular Mutual Information Based Weak Supervision for Cold-Start Active Learning [1.9]
STENCILは、クラス不均衡のコールドスタート設定において、一般的なアクティブな学習手法に対して、複数のテキスト分類データセットに対して10%-18%の精度で、レアクラスのF-1スコアを17%-40%の精度で改善する。 STENCILは、クラス不均衡のコールドスタート設定において、一般的なアクティブな学習方法よりも、複数のテキスト分類データセットに対して10%-18%、レアクラスのF-1スコアを17%-40%の精度で改善することを示した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:44:39 GMT)
Increasing Trust in Language Models through the Reuse of Verified Circuits [1.8]
言語モデル(LM)は、幅広い予測タスクにますます使われていますが、それらのトレーニングは稀なエッジケースを無視します。数学的および論理的に定義されたフレームワークを使用して構築すれば、この標準を満たすようにモデルをトレーニングできることが示される。両タスクの加算回路を広範囲に再利用し,より複雑な減算器モデルの検証を容易にする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:34:01 GMT)
AI-Driven Guided Response for Security Operation Centers with Microsoft Copilot for Security [1.8]
Copilot Guided Response (CGR)は、業界規模のMLアーキテクチャで、セキュリティアナリストを3つの重要なタスクにガイドする。 CGRはMicrosoft Defender XDR製品に統合され、世界中でデプロイされ、数百万のレコメンデーションを生成する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:10:01 GMT)
Enhancing Tracking Robustness with Auxiliary Adversarial Defense Networks [1.8]
視覚的物体追跡におけるアドリアック攻撃は、高度なトラッカーの性能を著しく低下させた。本稿では,入力画像に対して,トラッカーに入力する前に防御変換を行う,効果的な補助前処理防衛ネットワークであるAADNを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:36:50 GMT)
Agricultural Recommendation System based on Deep Learning: A Multivariate Weather Forecasting Approach [1.8]
本稿では,天気予報モデルを用いたコンテキスト型作物推薦システムを提案する。提案された気象モデルでは、バングラデシュの任意の場所で降雨、気温、湿度、日差しを予測でき、平均 R-Squared 値は 0.9824 である。このシステムは、洪水や干ばつが生ずる地域に対する知識に基づく作物の提案にも長けている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:02:45 GMT)
Toward Automatic Group Membership Annotation for Group Fairness Evaluation [1.7]
本研究では,グループフェアネス評価のためのグループメンバーシップの自動アノテートに言語モデルを活用する方法について検討する。 GPT や Mistral といった最先端の大規模言語モデルよりも,BERT ベースのモデルの方が優れた結果が得られた。提案手法は,人間の努力を大幅に減らし,フェアネスを意識した研究のフロンティアをより多くのデータセットに拡張する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:19:02 GMT)
A Look Into News Avoidance Through AWRS: An Avoidance-Aware Recommender System [1.6]
AWRS(Avoidance-Aware Recommender System)を紹介する。このフレームワークは、ニュース記事の回避がユーザの好みに関する重要な情報を伝えるという前提に基づいて、ニュースを推薦する際の回避意識を取り入れている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:16:03 GMT)
ArzEn-LLM: Code-Switched Egyptian Arabic-English Translation and Speech Recognition Using LLMs [1.6]
本稿では,機械翻訳(MT)と自動音声認識(ASR)システムの複雑さについて検討する。我々は、コード変更されたエジプトのアラビア語を英語またはエジプトのアラビア語に翻訳することに重点を置いている。本稿では,LLama や Gemma などの大規模言語モデルを用いて,これらのシステムの開発に使用される手法を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:22:26 GMT)
Efficient Bayesian Updates for Deep Learning via Laplace Approximations [1.6]
本稿では,ディープニューラルネットワークのための新しいベイズ更新手法を提案する。ラプラス近似のガウス後部分布に二階最適化手法を利用する。大規模な評価調査では、我々の更新がコストのかかるリトレーニングの高速で競争力のある代替手段であることを確認しています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:23:28 GMT)
Procedural Content Generation via Generative Artificial Intelligence [1.4]
生成的人工知能(AI)は2010年代半ばに大きな関心を寄せた。生成AIはPCGに有効であるが、高性能AIの構築には膨大なトレーニングデータが必要である。 PCG研究をさらに進めるためには、限られたトレーニングデータに関連する問題を克服する必要がある。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:03:38 GMT)
Compact Proofs of Model Performance via Mechanistic Interpretability [1.4]
本稿では,モデル性能に関する形式的保証を導出し,コンパクトに証明するために,機械的解釈可能性を用いることを提案する。提案手法は, 最大K$タスクで訓練した151個の小型変圧器の精度について, 下限を正式に証明して試作する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:51:34 GMT)
CURE: Privacy-Preserving Split Learning Done Right [1.4]
このシナリオには、同型暗号化(HE)ベースのソリューションが存在するが、しばしば禁止的な計算負担を課す。 CUREは、モデルとデータのサーバ側のみを暗号化する新しいシステムである。 CUREは、実行時の16倍の効率で、平文SLと同等の精度を実現できることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:10:19 GMT)
Machine Learning in High Volume Media Manufacturing [1.4]
大量生産環境でのエラーや失敗は、時間とお金の損失をもたらす可能性がある。ここではルールベースの決定と機械学習モデルを組み合わせた新しいプログラムを開発する。現在の最先端技術を用いて、我々はこのプログラムを大規模に展開し、製造環境からの需要の増加に対処する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:34:54 GMT)
Beyond static AI evaluations: advancing human interaction evaluations for LLM harms and risks [1.3]
ヒューマンインタラクション評価」は、人間-モデルインタラクションの評価に焦点を当てている。安全に焦点を当てた3段階のHIE設計フレームワークを提案する。我々は,HIEのコスト,複製性,非表現性に関する懸念に対処するための具体的な勧告で締めくくっている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:59:53 GMT)
Optimal Defender Strategies for CAGE-2 using Causal Modeling and Tree Search [1.3]
本稿では,CAGE-2の形式的(因果的)モデルと,証明可能な最適なディフェンダー戦略を生成する手法を提案する。 C-POMCPは、有効性に関して最先端の性能を達成し、最も近い競合手法よりも計算時間で2桁効率が良い。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:34:55 GMT)
D2S: Representing sparse descriptors and 3D coordinates for camera relocalization [1.3]
複雑な局所記述子とそのシーン座標を表現するための学習に基づくアプローチを提案する。その単純さと費用対効果が特徴である。本手法は,屋内および屋外環境におけるシーン座標回帰における最先端CNN手法よりも優れる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:10:55 GMT)
Vision language models are blind [1.2]
視覚機能を備えた大規模言語モデル(VLM)は、数え切れないほどの画像テキストアプリケーションを動かしている。 BlindTestは、人間の目で見やすい7つの視覚タスクのスイートです。 4つの最先端のVLMは平均してベンチマークで56.20%しか正確ではなく、ニューソネットが最も正確である(73.77%)。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:55:18 GMT)
MEMO: Dataset and Methods for Robust Multimodal Retinal Image Registration with Large or Small Vessel Density Differences [1.2]
セグメンテーションに基づくディープラーニングフレームワーク(VDD-Reg)と新しい評価指標(MSD)を提案する。 VDD-Regはコンテナセグメンテーションモジュールと登録モジュールで構成される。我々は,VDD-Regが,VD差とVD差が大きい場合に,ベースライン法を定量的に,質的に上回ることを示した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:15:55 GMT)
Sina at FigNews 2024: Multilingual Datasets Annotated with Bias and Propaganda [1.2]
この記事では、偏見とプロパガンダに完全に注記された12万のFacebook投稿の多言語コーパスを提示する。コーパスは、イスラエルのガザ戦争をフレーミングするために、FigNews 2024 Shared Task on News Media Narrativesの一部として作成された。 5つの言語(アラビア語、ヘブライ語、英語、フランス語、ヒンディー語)に12,000のポストがあり、それぞれ2,400のポストがある。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:04:09 GMT)
Predictable and Performant Reactive Synthesis Modulo Theories via Functional Synthesis [1.2]
本稿では,古典的リアクティブハンドル(命題)を仕様言語として,時間論理仕様から正しいコントローラを生成する方法を示す。また,制御器が常に最小の安全値を提供するために出力を最適化できるという意味で応答が可能であることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:23:27 GMT)
Acoustic Analogue for Quantum Field Theory with a Source term [1.2]
古典音源に結合したスカラー場に対する非相対論的流体類似モデルを提案する。一般的なアナログ重力モデルは、音響計量と結合されたフォノン場を含む。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:36:33 GMT)
A Neural Matrix Decomposition Recommender System Model based on the Multimodal Large Language Model [1.1]
本稿では,BoNMFと呼ばれる多モーダル大規模言語モデルに基づくニューラルネットワーク行列分解推薦システムモデルを提案する。ユーザとアイテムの潜在的な特性をキャプチャし、ユーザとアイテムIDからなる低次元行列と対話した後、ニューラルネットワークは結果を出力する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:58:07 GMT)
Decentralized multi-agent reinforcement learning algorithm using a cluster-synchronized laser network [1.1]
競合するマルチアームバンディット問題に対処するフォトニクスに基づく意思決定アルゴリズムを提案する。シミュレーションにより,光結合型レーザーのカオス振動とクラスタ同期,分散結合調整,探索と利用の効率向上が示された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:38:47 GMT)
Music Proofreading with RefinPaint: Where and How to Modify Compositions given Context [1.1]
RefinPaintはサンプリングプロセスを改善するイテレーティブなテクニックである。フィードバックモデルを使用して、より弱い音楽要素を特定することでこれを実現します。実験結果から,RefinPaintの有効性が示唆された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:52:27 GMT)
Detecting Visual Cues in the Intensive Care Unit and Association with Patient Clinical Status [1.0]
ICUの既存の患者評価は散発的であり、手動で管理されている。我々はデータ不均衡問題に対処する新しい「マスケッド損失計算」手法を開発した。 634,054フレームのAU推論を行い,顔面AUと臨床的に重要な患者状況との関連性について検討した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:05:24 GMT)
CT-based brain ventricle segmentation via diffusion Schrödinger Bridge without target domain ground truths [1.0]
クリニカルCTスキャンによる高効率かつ正確な脳室分画は、腹腔鏡下手術のような緊急手術には不可欠である。我々は,CTセグメント化の真偽を必要とせず,新しい不確実性に留意した心室分画法を導入する。提案手法では拡散型Schr"odinger Bridgeと残像U-Netを併用し,画像診断とMRI検査を併用した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:17:42 GMT)
The Emperor is Now Clothed: A Secure Governance Framework for Web User Authentication through Password Managers [1.0]
パスワードマネージャとWebアプリケーション間のインタラクションを促進する既存のアプローチは、適切な機能を提供し、重要な攻撃に対する緩和戦略を提供していない。本稿では,パスワードマネージャとWebアプリケーション間のインタラクションを仲介するブラウザベースのガバナンスフレームワークであるBerytusを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:52:09 GMT)
Towards Personalised Patient Risk Prediction Using Temporal Hospital Data Trajectories [1.0]
本研究では,集中治療単位患者を滞在中の観察データの軌跡によってグループ化するパイプラインを提案する。 ICUステークの最初の4時間のみのデータにパイプラインを適用すると、患者の大多数が、滞在期間全体を考慮した場合と同じクラスタに割り当てられる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:53:26 GMT)
ResumeAtlas: Revisiting Resume Classification with Large-Scale Datasets and Large Language Models [0.9]
様々な情報源から13,389人の履歴書を収集した。我々は BERT や Gemma1.1 2B などの大規模言語モデル (LLM) を分類に用いた。その結果,従来の機械学習手法よりも大幅に改善された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:19:28 GMT)
Identifying macro conditional independencies and macro total effects in summary causal graphs with latent confounding [0.9]
要約因果グラフのマクロトータル効果を同定するために,do-calculusは健全かつ完全であることを示す。また, マイクロコンディショナル・インディペンデンシーとマイクロトータル・エフェクトを考慮した場合, これらの結果は成立しないことを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:51:13 GMT)
Accelerating Electron Dynamics Simulations through Machine Learned Time Propagators [0.9]
本稿では,リアルタイムTDDFTに基づく電子動力学シミュレーションを高速化する新しい手法を提案する。物理インフォームド制約と高分解能トレーニングデータを活用することにより,精度と計算速度が向上する。この方法は、レーザー照射された分子や材料のリアルタイム・オンザフライモデリングを可能にする可能性がある。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:29:48 GMT)
BaCon: Boosting Imbalanced Semi-supervised Learning via Balanced Feature-Level Contrastive Learning [0.9]
クラス不均衡半教師学習(CISSL)では、信頼できない擬似ラベルによって引き起こされるバイアスは、不均衡なデータ分布によって悪化させることができる。提案手法は、よく設計されたコントラスト的な方法で、インスタンスの表現の分布を直接正規化する。提案手法は, CIFAR10-LT, CIFAR100-LT, STL10-LT, SVHN-LTデータセットの包括的実験により有効性を示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:43:48 GMT)
PersonaRAG: Enhancing Retrieval-Augmented Generation Systems with User-Centric Agents [0.9]
本稿では,リアルタイムなユーザデータとインタラクションに基づく検索と生成にユーザ中心のエージェントを取り入れた新しいフレームワークであるPersonaRAGを紹介する。その結果,ユーザ適応型情報検索システムにおける有望な方向性が示唆された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:18:00 GMT)
Clustering Time-Evolving Networks Using the Dynamic Graph Laplacian [0.9]
既存のスペクトルクラスタリングアルゴリズムを一般化し、クラスタの時間的進化を捉える。動的グラフ Laplacian は、有向グラフと無向グラフの時間経過に伴うクラスタ構造進化の明確な解釈を可能にすることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:31:54 GMT)
MLOps: A Multiple Case Study in Industry 4.0 [0.8]
MLOpsは、MLモデルを確実かつ効率的に開発、テスト、デプロイ、管理するために使用されるプロセス、ツール、組織構造を指す。本研究は,企業4.0のシナリオを4つ説明し,その実装と,多数のプロジェクトで直面した課題について,関連する知見を提供する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:17:26 GMT)
DAHRS: Divergence-Aware Hallucination-Remediated SRL Projection [0.8]
多様性を意識した幻覚-SRLプロジェクション(DAHRS) 言語的にインフォームドされた修復アライメントを利用してDAHRSを実装した上で,greedy First-Come First-CFA (F) SRLプロジェクションを施行した。 XSRLよりも高い単語レベルF1を達成する:87.6%対77.3%(EN-FR)、89.0%対82.7%(EN-ES)
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:13:59 GMT)
Structural Design Through Reinforcement Learning [0.8]
Sogymは、トポロジ最適化(TO)における機械学習を促進するために設計された、オープンソースの強化学習環境である。これは、TOの物理学を報酬関数に統合することで、物理的に実現可能で構造的に堅牢な設計を生成する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:31:35 GMT)
MSEval: A Dataset for Material Selection in Conceptual Design to Evaluate Algorithmic Models [0.8]
MSEvalは,多種多様な設計要領と基準にまたがって,専門家による資料評価からなる新しいデータセットである。このデータは、概念設計のための材料選択の文脈における機械学習モデルの評価と修正を容易にするためのベンチマークとして機能するように設計されている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 23:27:33 GMT)
Overcoming Catastrophic Forgetting in Tabular Data Classification: A Pseudorehearsal-based approach [0.8]
継続学習(CL)は、以前取得した知識を忘れずに、データ分散の進化に適応する上で重要な課題となる。本稿では,データ分類問題における破滅的忘れの現象に対処するために,Tarbular-data Rehearsal-based Incremental Lifelong Learning framework (TRIL3) という新しい手法を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:04:06 GMT)
The Effectiveness of Curvature-Based Rewiring and the Role of Hyperparameters in GNNs Revisited [0.7]
グラフニューラルネットワーク(GNN)におけるメッセージパッシングは支配的なパラダイムである近年、データと計算グラフから入力グラフを切断し、メッセージパッシングを行うグラフリウィリング技術に力を入れている。オーバーシャッシングは合成データセットで実証されているが、この研究では、曲率ベースのリワイアリングが現実のデータセットにもたらすパフォーマンス向上を再評価する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:03:58 GMT)
Evaluating the Adversarial Robustness of Semantic Segmentation: Trying Harder Pays Off [0.7]
対人摂動に対する感度の良好な近似は、現在満足していると見なされているものよりもはるかに多くの労力を要すると我々は主張する。我々は新たな攻撃を提案し、文学で利用可能な最強の攻撃と組み合わせる。我々の結果は、異なるモデルが異なる攻撃に対して脆弱であることが多いため、多様な強力な攻撃が必要であることも示している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:32:53 GMT)
Controlization Schemes Based on Orthogonal Arrays [0.6]
量子シミュレーションと量子多体系の学習において、重要なサブルーチンは制御されたハミルトン時間進化を実装している。制御されていない進化へのブラックボックスアクセスのみを与えられた場合、例えば $mathrmctrl(e-iHt) = |0ranglelangle 0|otimes I + |1ranglelangle 1 |otimes e-iHt$ は非自明である。最近の論文では、未知変換のためのアルゴリズムの設計における制御方式を導入している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:04:19 GMT)
FastImpute: A Baseline for Open-source, Reference-Free Genotype Imputation Methods -- A Case Study in PRS313 [0.6]
Genotype imputationは、参照ハプロタイプ情報を用いてSNPの欠落を予測することで遺伝データを増強する。本稿では,任意の遺伝子型チップとゲノム領域にまたがって一般化可能なクライアント側インプットモデルをサポートする,新しい遺伝子型インプットパイプラインのベースラインを紹介する。本研究では,23andMeなどの消費者遺伝子パネルからのSNPを用いて計算すると,単純な線形回帰がPSS313スコアの精度を大幅に向上することを示した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:28:13 GMT)
SfM on-the-fly: Get better 3D from What You Capture [0.6]
Structure from Motion (SfM) は、フォトグラメトリー、コンピュータビジョン、ロボティクスなどの分野で、常に研究のホットスポットとなっている。この作業は、オリジナルのSfMの上に構築され、アップデートされたバージョンには3つの新しい進歩があり、より優れた3Dをキャプチャから得ることができる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:21:33 GMT)
Application of Artificial Intelligence in Supporting Healthcare Professionals and Caregivers in Treatment of Autistic Children [0.6]
本稿では、自閉症スペクトラム障害(ASD)管理における医療従事者と介護者の能力を高める人工知能の可能性について検討する。自閉症児と非自閉症児の日常活動における顔および身体の表情を解析するための高度なアルゴリズムを開発した。本研究は, ASDの診断, 治療, 包括的管理を改善するためのAIの変革的可能性を強調する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:34:40 GMT)
The $μ\mathcal{G}$ Language for Programming Graph Neural Networks [0.5]
$mumathcalG$は、グラフニューラルネットワーク仕様のためのドメイン固有言語である。我々は、最も人気のあるグラフニューラルネットワークモデルを定義するために、$mumathcalG$をどのように使用できるかを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:27:43 GMT)
HiPPO-Prophecy: State-Space Models can Provably Learn Dynamical Systems in Context [0.5]
本研究では、状態空間モデル(SSM)の文脈内学習能力について検討する。我々はSSMの新たな重み構造を導入し、任意の力学系の次の状態を予測できるようにした。我々は、連続SSMが任意の入力信号の微分を近似できることを示すために、HiPPOフレームワークを拡張した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:56:11 GMT)
Early Classification of Time Series: Taxonomy and Benchmark [0.5]
この文書は原則に基づく分類から始まり、非常に広範な実験の結果を報告する。評価を整理するための次元を定義し、非常に広範な実験の結果を報告する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:16:16 GMT)
Mixing Artificial and Natural Intelligence: From Statistical Mechanics to AI and Back to Turbulence [0.5]
この論文は、科学研究におけるAIの役割を反映しており、特に乱流研究に焦点を当てている。これは、ディープニューラルネットワークの革新的利用を通じて、ラグランジアンモデルによる乱流の減少にAIが与える大きな影響を浮き彫りにしている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 20:25:55 GMT)
Adaptive Deep Iris Feature Extractor at Arbitrary Resolutions [0.5]
分解能劣化は、高解像度画像で訓練されたディープラーニングモデルの認識性能を低下させる。我々のフレームワークには、異なる分解能劣化に特化した分解能専門家モジュールが含まれています。低解像度の専門家は、両方の専門家が共通のアイデンティティの特徴を抽出できるように、高解像度の専門家からの知識蒸留によって訓練される。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:15:45 GMT)
Experimental verifiable multi-client blind quantum computing on a Qline architecture [0.5]
分散アーキテクチャにおける2サイクル検証可能なブラインド量子コンピューティングプロトコルの最初の実験的実装を提供する。その結果,大規模ネットワークにおけるマルチテナント分散量子計算の検証の新たな視点が示された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:48:58 GMT)
Photogrammetry for Digital Twinning Industry 4.0 (I4) Systems [0.4]
デジタルツイン(Digital Twins、DT)は、物理プロセスの振る舞いを再現するためにソフトウェアシステムを活用する変換技術である。本稿では,「物理過程」の正確な視覚表現を実現するために,フォトグラムメトリーと3次元走査技術の利用を探求することを目的とする。その結果, コンシューマグレードデバイスを用いたフォトグラメトリは, スマート製造のためのDTを作成する上で, 効率的かつコスト効率のよいアプローチであることが示唆された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:51:19 GMT)
Deep-TEMPEST: Using Deep Learning to Eavesdrop on HDMI from its Unintended Electromagnetic Emanations [0.3]
本稿では,ケーブルやコネクタから無意識に放出される電磁波を分析して,デジタルビデオディスプレイの盗聴問題に対処する。アナログケース(VGA)と比較して、デジタルケースは10ビットの符号化により、観測された信号と画素の強度の間の帯域幅と非線形マッピングがはるかに大きくなるため、難しい。提案手法は、問題を逆問題として再キャストし、深層学習モジュールを訓練し、観測された電磁波を表示された画像にマッピングする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 23:07:37 GMT)
Applications of artificial intelligence in the analysis of histopathology images of gliomas: a review [0.3]
本稿では,ヒトグリオーマの全スライディング組織像に対するAIベースの手法を提案する83の公開研究について検討する。現在の研究の焦点は、成人型びまん性グリオーマのヘマトキシリンおよびエオシン染色組織分画の評価である。これまでのところ、AIベースの手法は有望な成果を上げているが、実際の臨床環境ではまだ使われていない。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:16:55 GMT)
StyleSplat: 3D Object Style Transfer with Gaussian Splatting [0.3]
スタイル転送は、さまざまな芸術スタイルで3Dアセットを強化し、創造的な表現を変革する。本稿では,3次元ガウス表現シーンにおける3次元オブジェクトのスタイリング手法であるStyleSplatを紹介する。様々な3Dシーンやスタイルにまたがって有効性を示し、3D生成における制御とカスタマイズの強化を示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:55:08 GMT)
GRAD-SUM: Leveraging Gradient Summarization for Optimal Prompt Engineering [0.3]
本稿では,自動プロンプトエンジニアリングのためのスケーラブルでフレキシブルなGRAD-SUMを紹介する。提案手法は,ユーザ定義タスク記述と評価基準を取り入れ,新しい勾配要約モジュールを特徴とする。この結果から, GRAD-SUMは, 様々なベンチマークにおいて, 既存の手法よりも一貫した性能を示した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:11:21 GMT)
Ambiguous Resonances in Multipulse Quantum Sensing with Nitrogen Vacancy Centers [0.3]
ダイヤモンド中の1つの窒素空孔中心に存在する3つの効果を実験的に評価した。バイアス磁場における小さなミスアライメントは、窒素核スピンの偏移を中心の電子スピンによって感知する。また、有限パルス時間における量子系の自由進化の影響を計測し、シミュレーションした。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:35:36 GMT)
Tracking Patterns in Toxicity and Antisocial Behavior Over User Lifetimes on Large Social Media Platforms [0.3]
われわれはRedditとWikipediaの5億件近いコメントで14年間にわたって毒性を分析している。 Reddit上で最も有毒な行動は、最もアクティブなユーザーによって集計され、最も有毒な行動は、最もアクティブでないユーザーによって集計され、Wikipedia上で最も有毒な行動であることがわかった。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:45:02 GMT)
Let Me DeCode You: Decoder Conditioning with Tabular Data [0.2]
本稿では,ラベルから派生した特徴をモデル条件付けに利用し,デコーダを動的にリコンストラクションするDeCodeを提案する。 DeCodeは3次元ラベル形状特徴の学習数値表現による条件付埋め込みの導入による3次元セグメンテーション性能の向上に重点を置いている。以上の結果から,DeCode は従来の非条件モデルよりも高い性能を示し,計算コストの低減による精度の向上を実現している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:14:33 GMT)
CLIPping the Limits: Finding the Sweet Spot for Relevant Images in Automated Driving Systems Perception Testing [0.1]
ニューラルネットワークを用いて、自然言語のプロンプトと類似性に応じてデータセット内の画像をソートする。私たちの焦点は、偽陽性と偽陰性を平等に防止することにあります。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:10:30 GMT)
AI-Powered Immersive Assistance for Interactive Task Execution in Industrial Environments [0.1]
我々は,産業環境における複雑なタスクの実行を支援するAIを活用した没入型支援システムを実演する。我々のシステムは、ジュースミキサーのセットアップに似たVR環境を活用している。このデモでは、私たちのAIアシスタントが、認知負荷を減らし、生産性を高め、産業環境の安全性を高める可能性を示しています。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:30:45 GMT)
A Scale-Invariant Diagnostic Approach Towards Understanding Dynamics of Deep Neural Networks [0.1]
本稿では、textitFractal Geometry を用いたスケール不変手法を導入し、コネクショナリストシステムの非線形力学を解析・説明する。我々はフラクタル次元とテクストローネスを定量化し、それらの力学を深く理解し、テクスト固有の説明の質を高める。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:54:05 GMT)
State space representations of the Roesser type for convolutional layers [0.1]
2次元畳み込み層に対するRoesser型の状態空間表現を提供する。また、拡張、ストライド、N-D畳み込みのための状態空間表現も構築する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:08:15 GMT)
Weight Block Sparsity: Training, Compilation, and AI Engine Accelerators [0.0]
Deep Neural Networks(DNN)が開発、トレーニング、利用され、高度なデバイスと限られたデバイスの両方に負担がかかっている。私たちのソリューションは、ハードウェアに親しみやすい構造化された空間であるエムの重みブロック間隔を実装することです。本稿では,Resnet50,Inception V3,VGG16を用いて,AIE2構成セット(AMD Versal FPGA)の正確かつ完全なコード生成による性能評価を行う。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:37:49 GMT)
Variational Inference via Smoothed Particle Hydrodynamics [0.0]
滑らかな粒子流体力学に基づく新しい変分推論法を提案する。高速で、柔軟で、スケーラブルで、決定論的なサンプリングと、確率モデルのクラスに対する推論を提供する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:38:41 GMT)
VS-PINN: A fast and efficient training of physics-informed neural networks using variable-scaling methods for solving PDEs with stiff behavior [0.0]
本稿では,変数スケーリング手法を用いたPINNのトレーニング手法を提案する。提案手法の有効性を実証し,PINNのトレーニング効率と性能を大幅に向上させることができることを確認した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:08:09 GMT)
Using quantum computers to identify prime numbers via entanglement dynamics [0.0]
本稿では, フォールトトレラントコンピュータにおけるこの理論概念の実装を可能にする決定論的アルゴリズムについて概説する。本アルゴリズムで用いられる対角ユニタリ演算は,従来報告されていた一般対角ユニタリの指数的複雑性と対照的に,次数が2次であることが証明された。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:47:13 GMT)
Unscrambling of single-particle wave functions in systems localized through disorder and monitoring [0.0]
本研究では,局所粒子を正確に特徴付ける自由フェルミオン波動関数のスレーター行列式を求めるプロセスを開発する。その結果, 単一粒子波動関数を応用して, 観測された自由フェルミオンや乱れモデルなどのシステムにおける局在化遷移特性について, 貴重な知見を得ることが可能となった。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:12:07 GMT)
Unexplainability of Artificial Intelligence Judgments in Kant's Perspective [0.0]
本稿は,AI判断が人間の判断の特性の観点から理解できない形態を示すものであることを論じる。物理述語を含まない概念は、視覚を通して関数が示されるときの説明が簡単でないことを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:39:55 GMT)
Tunable frequency conversion in doped photonic crystal fiber pumped near degeneracy [0.0]
将来の量子ネットワークは、異なる波長帯域間で光的に符号化された量子情報をコヒーレントに転送する能力に依存する。ゲルマニウムドープコアを用いたフォトニック結晶ファイバを1550nm, テレコムCバンド920nmでグループ速度マッチングする。この繊維の大きな長さは、波長920nmの波長間のナノメートルスケールの周波数シフトを最大79.4%内部変換効率で達成するために用いられる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:48:21 GMT)
Transforming Movie Recommendations with Advanced Machine Learning: A Study of NMF, SVD,and K-Means Clustering [0.0]
本研究では,様々な機械学習技術を用いて,ロバストな映画レコメンデーションシステムを開発する。主な目的は、パーソナライズされた映画レコメンデーションを提供することでユーザーエクスペリエンスを向上させることである。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:26:33 GMT)
Topology-enhanced machine learning model (Top-ML) for anticancer peptide prediction [0.0]
抗がんペプチド予測のためのトポロジー強化機械学習モデル(Top-ML)を提案する。我々のTop-MLモデルは、広く使われている2つのAntiCP 2.0ベンチマークデータセットで検証され、最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:04:54 GMT)
The generalized uncertainty principle within the ordinary framework of quantum mechanics [0.0]
量子力学における基底座標と運動量交換関係の適切な変形は、小さなスケールにおける重力の影響を考慮に入れている。平方運動量項の導入は、粒子位置の最小不確実性をプランク長に制限する一般化された不確実性原理をもたらす。位置と運動量作用素の変形代数は、通常の量子力学の枠組みに組み込むことができる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:37:51 GMT)
The Efficacy of Conversational Artificial Intelligence in Rectifying the Theory of Mind and Autonomy Biases: Comparative Analysis [0.0]
本研究は、認知バイアスの是正と人間とAIの相互作用における影響の認識における会話型人工知能(CAI)の有効性を評価する。この研究は、典型的なユーザとボットの相互作用をシミュレートする臨床ベースの仮想ケースシナリオを用いた構造化手法を用いている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:44:55 GMT)
Tensor networks for black hole interiors: non-isometries, quantum extremal surfaces, and wormholes [0.0]
双曲テンソルネットワークを用いてブラックホール内部のホログラフマップを構築する。地平線の背後にある非等方性と量子超曲面の関係について検討する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:19:15 GMT)
Tensor networks enable the calculation of turbulence probability distributions [0.0]
乱流PDFを"テンソルネットワーク" (TN) と呼ばれる極めて圧縮された形式にパラメータ化することで, 次元問題を克服する方法を示す。我々はそれぞれ$mathcalO(106)$と$mathcalO(103)$でメモリと計算コストの削減を実現している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:06:57 GMT)
Synthetic Cancer -- Augmenting Worms with LLMs [0.0]
大規模言語モデル(LLM)を2つの重要なプロセスに応用した,新しいタイプのメタモルフィックマルウェアを提案する。第一に、LSMは、アンチマルウェアプログラムによるシグネチャベースの検出を避けるために、自動コード書き換えに使用される。マルウェアはLLMを利用して電子メールの返信をソーシャルにエンジニアリングし、受信者にマルウェアの実行を促す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:40:10 GMT)
Static Analysis of Logic Programs via Boolean Networks [0.0]
「静的情報から論理プログラムの安定モデルについて何が言えるか」が研究され、多くの場面で有用であることが証明されている。提案されたコネクションは、既存の結果をBooleanネットワークの静的解析の豊富な歴史に導いてくれる。新しく得られた洞察は、ASP.NETの分野で多くの問題を解決する可能性がある。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:07:05 GMT)
Spectroscopy of Single CdSe Magic-Sized Nanocrystals [0.0]
マジックサイズNC(MSNC)は個別のステップで成長し、単一のサイズと形状(すなわち単分散性)を提供する可能性がある。室温で測定されたCdSe MSNCの発光スペクトルは、最先端の量子ドットよりも広いことが報告されている。以上の結果から,CdSe MSNCは粒子-粒子間変動を示すが,最大寄与は単一粒子線幅による。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:26:10 GMT)
Single system based generation of certified randomness using Leggett-Garg inequality [0.0]
我々は、Leggett-Garg不平等違反を利用して、半デバイス非依存の量子乱数生成のための安全なスキームを理論的に定式化し、実験的に示す。 9,19,118ドルの真に予測不可能なビットを確実に生成します。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:29:01 GMT)
Simulating (2+1)D SU(2) Yang-Mills Lattice Gauge Theory at finite density with tensor networks [0.0]
2次元の非アベリア格子ゲージ理論を数値シミュレーションする。ハミルトンの定式化における SU(2) ヤン・ミルズモデルに焦点をあてる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:57:01 GMT)
SideSeeing: A multimodal dataset and collection of tools for sidewalk assessment [0.0]
構築された環境を評価するためのツールとデータセットを提供する新しいイニシアティブであるSideSeeingを紹介する。本稿では,胸部装着型モバイルデバイスから撮影した同期映像とセンサデータを統合する新しいデータセットを提案する。データセットは、9つの病院の周囲12kmをカバーする3時間のコンテンツを含み、325,000のビデオフレームと対応するセンサーデータを含んでいる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:38:29 GMT)
Show, Don't Tell: Evaluating Large Language Models Beyond Textual Understanding with ChildPlay [0.0]
私たちは戦略的思考と意思決定を評価するために、Tic-Tac-Toe、Connect Four、Battleshipといったゲームを使用しています。標準ベンチマークに習熟しているにもかかわらず、GPT-3.5とGPT-4のプレイ能力と、事前トレーニングなしで完全に観察可能なゲームについて推論する能力は、ごくわずかである。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:17:26 GMT)
Setting up the Data Printer with Improved English to Ukrainian Machine Translation [0.0]
ウクライナ語と英語の文の3M対のノイズの多い並列データセットを用いた翻訳システムを構築するためのレシピを提案する。我々のデコーダのみのモデルであるDragomanは、FLORESデベロップメントセットのアーティファクトエンコーダ-デコーダモデルの性能を上回りました。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:06:15 GMT)
Semantic UV mapping to improve texture inpainting for indoor scenes [0.0]
本研究の目的は, 走査された屋内メッシュの粗い除去後のテクスチャ塗布の改善である。これは、室内のシーンのセマンティック情報を利用して、UVの島々と、壁や床のような異なる構造要素の3D表現をより正確に一致させる新しいUVマッピング前処理によって達成される。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:21:25 GMT)
Securing Confidential Data For Distributed Software Development Teams: Encrypted Container File [0.0]
GitHubのようなクラウドベースのバージョン管理サービスは、一般的にソースコードやその他のファイルに使われている。特定の開発者のみへのアクセスを制限するために機密データを暗号化する必要があるため、さまざまな企業や組織の開発者がプラットフォームを共有している場合、課題が発生する。本稿では,この問題に対処する既存のツールについて論じ,その欠点を浮き彫りにする。著者らは、他のツールで見られる欠陥を克服するために設計された、独自のソリューションであるEncrypted Container Filesを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:19:49 GMT)
Second-Order Coherence as an Indicator of Quantum Entanglement of Hawking Radiation in Moving-Mirror Models [0.0]
我々は、ブラックホールからのホーキング放射のアナログモデルとして機能する移動ミラーモデルを用いて、2階のコヒーレンスを評価する。本研究では, ホーキング放射の熱性によるノイズ効果に着目し, 絡み合いとホーキング放射の2次コヒーレンスの関係について検討した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:30:20 GMT)
Resource-aware scheduling of multiple quantum circuits on a hardware device [0.0]
ハードウェア上での並列実行に可能な限り多くの回路をスケジュールする最適化問題を考える。相互作用する量子ビット間の近接配置を保ちながら、最大忠実性を確保する整数線形プログラミング定式化を示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 02:33:07 GMT)
Quantum-dot-based Kitaev chains: Majorana quality measures and scaling with increasing chain length [0.0]
マヨラナ境界状態 (Majorana bound state,MBSs) は、結合した量子ドットの、短くよく制御可能な鎖であり、障害の問題を後押しする。短鎖の微細なMBSの位相的保護の密接度を定量化する新しい品質指標を提案する。異なる長さの量子ドット鎖の局所的識別性について検討する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:17:36 GMT)
Quantum metrology of low frequency electromagnetic modes with frequency upconverters [0.0]
RQUは、超伝導ループとジョセフソン接合からなるジョセフソン干渉計を用いて、低周波電磁モードとマイクロ波Cバンドのモードの間のパラメトリック相互作用を実装している。我々は量子増幅器理論を用いてRQUの性能を解析し、RQUがこの周波数範囲で量子制限オプアンプとして動作可能であることを示す。 RQUを用いて低周波からマイクロ波Cバンドへの信号アップコンバージョンを示し、完全なBAEの実現に向けた必要なステップである46.9$;dBの位相感度利得(指数比)を示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:57:21 GMT)
Quantum Thermodynamic Integrability for Foundations of Statistical Physics [0.0]
第二法則のカラスエオディ原理を、マクロ変数に依存するエネルギー準位を持つ量子熱力学に拡張する。この拡張は量子熱力学積分(QTI)の概念を導入し、統計力学の代替基盤を提供する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:46:10 GMT)
Probing quantum complexity via universal saturation of stabilizer entropies [0.0]
非安定化性(nonstabilizerness)またはマジック(Magic)は、量子コンピューティングの鍵となるリソースである。安定化器 R'enyi entropies (SREs) は, 臨界数の非クリフォード演算においてその最大値を飽和させることを示した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:59:03 GMT)
Private Blockchain-based Procurement and Asset Management System with QR Code [0.0]
開発システムは、サプライオフィスの調達プロセスにプライベートブロックチェーン技術を統合することを目的としている。調達プロセスには、キャンバス、購入、商品の配送、検査、在庫、廃棄が含まれる。調査では、サプライオフィスで調達と資産管理システムを備えたプライベートブロックチェーンベースのテクノロジの使用を推奨している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:27:36 GMT)
Predicting and Understanding Human Action Decisions: Insights from Large Language Models and Cognitive Instance-Based Learning [0.0]
大きな言語モデル(LLM)は、様々なタスクにまたがってその能力を実証している。本稿では,LLMの推論と生成能力を利用して,2つの逐次意思決定タスクにおける人間の行動を予測する。我々は,LLMの性能を,人間の経験的意思決定を模倣した認知的インスタンスベース学習モデルと比較した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:13:06 GMT)
Predicting Winning Captions for Weekly New Yorker Comics [0.0]
本稿では,ニューヨーク・カートゥーン・カートゥーン・キャプション・コンテスト(New Yorker Cartoon Caption Contest, New Yorker Cartoon Caption Contest)において,入賞者の機知とユーモアをエミュレートしたキャプションを生成することを目的とした,ニューヨーカーの漫画へのイメージキャプション技術の適用について検討する。本稿では,ニューヨーカーの漫画キャプションコンテストのキャプションを生成するために,視覚変換器エンコーダデコーダモデルを用いた新しいベースラインを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:45:00 GMT)
Parameter inference from a non-stationary unknown process [0.0]
非定常系は、二酸化炭素濃度の変化による気候パターンから、上昇する神経調節によって引き起こされる脳のダイナミクスまで、世界中で見られる。非定常過程を解析する手法が必要であるが、実際に使用されるほとんどの時系列解析手法は、定常性の仮定を単純化する。非定常系の解析における重要な問題は、私たちが参照する問題クラスである。非定常未知プロセス(PINUP)からの推論観測時系列が与えられた場合、時系列の非定常性を推進するパラメータを推測する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 04:44:29 GMT)
On the estimation of the number of components in multivariate functional principal component analysis [0.0]
保持する主成分の数の選定を検討するため, 広範囲なシミュレーションを行った。本研究では,各単変量機能特徴に対する分散説明しきい値のパーセンテージを用いた従来の手法は信頼性が低いことを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:53:56 GMT)
On the Problem of Defining Charge Operators for the Dirac Quantum Field [0.0]
3次元物理空間における領域の電荷量を表す演算子$Q_A$について尋ねる。 Q_A$ の自然な公式はあるが、ここで説明するように、それを数学的に正確な定義にすることは困難である。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:44:31 GMT)
OXN -- Automated Observability Assessments for Cloud-Native Applications [0.0]
実験ツールの概念実証実装として, 可観測性 eXperiment eNgine (OXN) を提案する。 OXNはChaos Engineeringに似た任意の障害をアプリケーションに注入できるが、可観測性の設定を変更するユニークな機能もある。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 19:04:13 GMT)
Noncontextuality inequalities for prepare-transform-measure scenarios [0.0]
一般化された非コンテクスト性に整合した相関関係のポリトープを計算するために線形量子化器の除去がいかに用いられるかを示す。また、与えられた状態の集合、変換の集合、あるいは測定の集合の中で保持されるすべての線形操作IDを計算するための単純なアルゴリズムも提供する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:20:41 GMT)
Non-Hermitian Origin of Wannier Localizability and Detachable Topological Boundary States [0.0]
非エルミート境界状態を分離可能な位相境界状態とみなす。固有非エルミート位相が必然性スペクトルフローをもたらすことを示す。この接続と$K$-理論に基づいて、ワニエローカライザビリティと分離可能な位相境界状態の分類を完成させる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:41:19 GMT)
Non-Adiabatic Quantum Optimization for Crossing Quantum Phase Transitions [0.0]
有限時間における量子相転移における量子系の基底状態の最適駆動について考察する。本稿では,非断熱量子最適化(Non-Adiabatic Quantum Optimization,NAQO)を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:00:01 GMT)
Modelling the Human Intuition to Complete the Missing Information in Images for Convolutional Neural Networks [0.0]
実験心理学は、人間の心の状態に依存する多くの種類の直観を明らかにする。視覚認知タスクにおいて、行方不明情報を完成させるのに有用な視覚的直観に焦点を当てる。本研究では、直観をモデル化し、この形式を組み込んで畳み込みニューラルネットワークの性能向上を図る。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:05:27 GMT)
Measuring the Angular Momentum of a Neutron Using Earth's Rotation [0.0]
地球回転と軌道角運動量(OAM)のカップリングは、スピンエコー干渉計を用いて発生した絡み合った中性子で観測される。測定された結合は理論の5%以内であり、不確実性は7.2%である。検出されたビームの逆OAMは4098 + 295 hbar A-1で、以前の中性子実験より5桁低い。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:45:13 GMT)
Lorentz covariant physical Brownian motion: Classical and quantum [0.0]
我々はGoldstein-Kacc速度切替モデルを再検討する。プロセスの前方および後方のチャップマン・コルモゴロフ方程式がローレンツ共変であることが証明される。時空における不整合支持状態間の遷移は起こらないことを検証する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:49:36 GMT)
Krylov complexity and chaos in deformed SYK models [0.0]
我々は、Sachdev-Ye-Kitaevモデルで、KrylovとLyapunov指数を計算する。リアプノフ指数は温度関数として非単調な振舞いを持つことができるが、すべての研究例において、クリロフ指数は単調に振舞う。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:00:02 GMT)
KGpose: Keypoint-Graph Driven End-to-End Multi-Object 6D Pose Estimation via Point-Wise Pose Voting [0.0]
KGposeは、複数のオブジェクトの6Dポーズ推定のためのエンドツーエンドフレームワークである。我々のアプローチはキーポイントベースの手法とキーポイントグラフによる学習可能なポーズ回帰を組み合わせる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 01:06:00 GMT)
Interpretation of wave function by coherent ensembles of trajectories [0.0]
量子力学における波動関数のアンサンブル解釈を改訂する。時空における量子軌道のアンサンブルのコヒーレンス(自動一致)を導入する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:10:04 GMT)
Informed and Assessable Observability Design Decisions in Cloud-native Microservice Applications [0.0]
マイクロサービスアプリケーションの信頼性を確保するためには、可観測性が重要です。アーキテクトは、観測可能性に関するトレードオフを理解して、異なる観測可能性設計の選択肢を重んじる必要がある。我々は、情報的かつ継続的に評価可能な可観測性設計決定に到達するための体系的な方法について議論する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:50:12 GMT)
Information vs Thermodynamic Entropy [0.0]
シャノン情報は熱力学のエントロピーと異なり、熱力学の第二法則とは無関係である。シャノン情報は熱力学のエントロピーと異なり、熱力学の第二法則とは無関係である。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:25:05 GMT)
Hyperbolic Spin Liquids [0.0]
北エフのスピンハニカムモデルを双曲格子に拡張し、非ユークリッド空間群対称性を利用してモデルを正確に解く。我々は8,3$格子上の基底状態相図を解明し、アベリア・エノンとのギャップ付き$mathbbZ$スピン液体、非アベリア・エノンとキラル・エッジ状態のギャップ付きキラルスピン液体、マヨラナ・フェルミオンの非アベリア・ブロッホ状態が支配する状態の低エネルギー密度の圧縮可能なスピン液体を見出した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:00:01 GMT)
Human-machine social systems [0.0]
コンペティション、協調、協力、伝染、集団意思決定の状況において、様々な分野からの最近の研究をレビューし、一般的なダイナミクスとパターンを識別する。より堅牢でレジリエントな人間機械のコミュニティを確保するために、研究者は複雑なシステム手法を用いてそれらを研究すべきである。技術者は、人間-機械と機械-機械の相互作用のためのAIを明示的に設計し、規制当局は人間と機械の生態的多様性と社会的共進化を管理しなければならない。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:29:36 GMT)
High-dimensional maximally entangled photon pairs in parametric down-conversion [0.0]
軌道角運動量(OAM)を持つラゲール・ガウスモードは、高次元の絡み合った量子状態を実験的に設計するために一般的に利用される。次元 d>2 のヒルベルト空間の場合、最大絡み合った状態(MES)は量子通信プロトコルの容量とセキュリティを向上させるのに役立つ。サブスペース内でのOAMモードの追加空間フィルタリングを行うことなく, ポンプビームの空間分布と結晶の非線形分布を利用してMESを生成する方法について定式化する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:13:04 GMT)
Granger Causality in Extremes [0.0]
時系列における極端な事象から因果関係を特定するための厳密な枠組みを導入する。本フレームワークは, 因果尾係数を利用して, 主に極端な事象から因果関係を推定するように設計されている。また,データから極端にグランガー因果性が存在することを検出する新しい推論手法を提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:41:07 GMT)
GPT-4 Generated Narratives of Life Events using a Structured Narrative Prompt: A Validation Study [0.0]
我々は,OpenAIのGPT-4を用いて,ゼロショット構造化された物語プロンプトを用いて24,000の物語を生成する。このデータセットから、2,880の物語を手動で分類し、出生、死亡、雇用、解雇の妥当性を評価する。我々は分析を拡張し、残りの21,120の物語の分類を予測する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:46:47 GMT)
FlowCon: Out-of-Distribution Detection using Flow-Based Contrastive Learning [0.0]
我々は新しい密度に基づくOOD検出技術であるtextitFlowConを紹介する。我々の主な革新は、正規化フローの特性と教師付きコントラスト学習を効率的に組み合わせることである。経験的評価は、一般的な視覚データセットにまたがる手法の性能向上を示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 21:55:33 GMT)
Flash normalization: fast RMSNorm for LLMs [0.0]
RMSNormはLlama、Mistral、OpenELMなど多くのLLMで使われている。この記事では、RMSNormの正確な実装であるFlashNormについて詳述する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 00:37:55 GMT)
FairyLandAI: Personalized Fairy Tales utilizing ChatGPT and DALLE-3 [0.0]
本稿では,OpenAIのAPIを通じて開発された,革新的な大規模言語モデル(LLM)であるFairyLandAIを紹介する。子どもの想像的な世界と調和し、教育的かつ娯楽的な物語を提供するのが専門である。 FairyLandAIの実証的評価は、子ども向けの捕食物語の制作においてその効果を実証している。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 17:46:58 GMT)
Exploring the role of criticality in the quantum Otto cycle fueled by the anisotropic quantum Rabi-Stark model [0.0]
熱エンジン、冷蔵庫、ヒーター、加速器を含む量子熱機械は、量子熱力学の最前線である。本稿では,理想シナリオと有限時間シナリオの両方で動作する量子オットーエンジンについて検討する。量子熱機関に焦点をあてることで、これらの相転移がAQRSMベースのエンジンの効率とパワーを批判的に調節することを明らかにする。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:36:57 GMT)
Exploring the Effectiveness of Methods for Persona Extraction [0.0]
本稿では,対話参加者に関する情報を抽出し,そのパフォーマンスをロシア語で評価する手法について検討する。このタスクのモデルをトレーニングするために、Multi-Session Chatデータセットは複数の翻訳モデルを使用してロシア語に翻訳された。抽出モデルの有効性を評価するために,Fスコアの概念に基づく計量を示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:30:10 GMT)
Exploring Richer and More Accurate Information via Frequency Selection for Image Restoration [0.0]
空間および周波数領域の知識をシームレスに統合するマルチスケール周波数選択ネットワーク(MSFSNet)を導入する。我々のMSFSNetは最先端のアルゴリズムに匹敵する性能を達成する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:10:08 GMT)
Exploring Factors Affecting Student Learning Satisfaction during COVID-19 in South Korea [0.0]
本研究は,パンデミックにおける学生の学習嗜好と満足度に関連するいくつかの側面を理解することを目的とした。収集したデータには、学生の性別、専攻、学習時の満足度、モチベーションレベル、パフォーマンス、感情状態、学習環境が含まれていた。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:28:11 GMT)
Experimental photon addition and subtraction in multi-mode and entangled optical fields [0.0]
複数光子の付加と減算を1つの実験装置を用いて相互に比較する。空間分解能の高い強化CCDカメラで検出された密な空間相関を持つ双発ビームを用いる。最大3個の光子が加えられ、非古典的および非ガウス的状態に到達する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 13:52:46 GMT)
Exactly-solved model of light-scattering errors in quantum simulations with metastable trapped-ion qubits [0.0]
準安定原子量子ビットのイジング力学における光散乱モデルの解析を行った。メタスタブルレベルが40$Ca$+$イオンである実験のシミュレーションにおける基本誤差の影響を解析する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:24:06 GMT)
Estimation Sample Complexity of a Class of Nonlinear Continuous-time Systems [0.0]
本稿では, 大規模非線形系のパラメータ推定法について述べる。正規化線形回帰を用いて力学を直接反転させることにより未知パラメータを解く手法は、微分フィルタと正規化最小二乗の新たな設計と解析のアイデアに基づいている。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 22:35:47 GMT)
Enhancing Depressive Post Detection in Bangla: A Comparative Study of TF-IDF, BERT and FastText Embeddings [0.0]
本研究は,バングラにおける抑うつ的なソーシャルメディア投稿を識別する手法を提案する。ドメインの専門家によって注釈付けされたこの研究で使用されるデータセットには、抑うつ的ポストと非抑うつ的ポストの両方が含まれている。クラス不均衡の問題に対処するために,マイノリティクラスに対するランダムなオーバーサンプリングを利用した。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:40:17 GMT)
Encoding arbitrary Ising Hamiltonians on Spatial Photonic Ising Machines [0.0]
本研究では,完全な相互作用行列を直接制御できるSPIMインスタンスを導入,実験的に検証する。実験によって測定されたIsingエネルギーと理論的な期待値との整合性を実証し、未重み付きグラフ問題と重み付きグラフ問題の両方を解決する。本手法は,システム固有の利点を犠牲にすることなく,実世界のアプリケーションに適用可能なSPIMを大幅に拡張する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:54:07 GMT)
Emotion Talk: Emotional Support via Audio Messages for Psychological Assistance [0.0]
感情トーク(Emotion Talk)とは、心理的援助のための音声メッセージを通じて継続的な感情的支援を提供するシステムである。このソリューションはポルトガル語話者に焦点を合わせ、システムが言語的かつ文化的に関連があることを保証する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 05:13:17 GMT)
Dressing trapped ions with integrated wires [0.0]
手術前後にドレッシングフィールドをアディバティカルに打ち込むと、有効ハミルトニアンが変化する。ドレッシング場の振幅と変形は、任意の操作の特性をカスタマイズするために使用できる調整可能な自由度として作用する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:18:12 GMT)
Distinct citation distributions complicate research evaluations. A single indicator that universally reveals research efficiency cannot be formulated [0.0]
サイズに依存しないトップパーセンタイルに基づく指標は、地域出版物のグローバルなランクが権力法に適合するときに正確である。最も引用されていない論文の偏差は、国で頻繁に見られ、高い影響因子を持つ全てのジャーナルで発生します。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 10:16:21 GMT)
Dissipative variational quantum algorithms for Gibbs state preparation [0.0]
本稿では、変分量子回路の本質的な部分として、qubit RESETやゲートなどの散逸演算を組み込むことにより、散逸型変分量子アルゴリズム(D-VQA)を導入する。このようなアルゴリズムは、広範囲の量子多体ハミルトンと温度でギブス状態を作ることができ、コヒーレントノイズと非コヒーレントノイズの両方による誤差を著しく低減することができる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:48:46 GMT)
Disorder-Free Sachdev-Ye-Kitaev models: Integrability and Quantum Chaos [0.0]
本研究では、Sachdev-Ye-Kitaevモデル(SYK)の2種類の障害のない変種について検討する。これらのモデルでは, 時間外相関器 (OTOC) が早期に指数関数的な成長を示した。以上の結果から,SYKモデルのクリーンバージョンは,乱れのない量子多体系の単純かつ非自明な例であることがわかった。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 03:19:06 GMT)
DisQ: A Markov Decision Process Based Language for Quantum Distributed Systems [0.0]
本研究では,分散バージョンへの量子アルゴリズムの書き直しを容易にするフレームワークとしてDisQを提案する。 DisQはChemical Abstract Machine(CHAM)とMarkov Decision Processs(MDP)の概念を組み合わせることで、量子的並列性と分散挙動を明確に区別することを目的としている。分散バージョンに等価な書き直しを示すために、量子加算やショアのアルゴリズムなどのいくつかのケーススタディを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 22:26:22 GMT)
Diagnosing quantum transport from wave function snapshots [0.0]
スピン鎖の非平衡量子力学を波動関数スナップショットのデータセットに主成分分析(PCA)を用いて研究する。スピンやエネルギー輸送の異なるいくつかの相互作用するスピン鎖の研究により、データ情報の拡散はスピンやエネルギーの量子輸送の根底にあるものと同じ動的指数に従っていることが明らかとなった。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:40:32 GMT)
Deep Generative Models for Detector Signature Simulation: A Taxonomic Review [0.0]
粒子物理学検出器からの信号は衝突の物理を符号化する低レベル物体(エネルギー沈降や軌道など)である。検出器におけるそれらの完全なシミュレーションは、計算と記憶集約的なタスクである。我々は,検出器シグネチャのシミュレーションについて,既存の文献の包括的かつ徹底的な分類学的レビューを行う。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 22:11:43 GMT)
Criticality-amplified quantum probing of a spontaneous collapse model [0.0]
自然崩壊モデルは動的ウェーブパレットの低減を考慮に入れた設計である。このような経験的モデルの自由なパラメータの計量的上界を導出するイット量子探索手法を導入する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:37:58 GMT)
Continual Developmental Neurosimulation Using Embodied Computational Agents [0.0]
神経系の形態形成, 発達学習, 可塑性の関連現象のブリッジングにおける発達軌跡の役割を考察することができる。我々のアプローチは発達的実施と密に統合されており、発達的ブレイテンベルク車両(dBV)と呼ばれる種類のエージェントを用いて実装することができる。 dBVは、体、センサー、エフェクター、神経システムなど、エージェントベースのシステムへと変貌する、未定義の構造の集合として、自らの生活を始める。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 06:10:30 GMT)
Conceptual and formal groundwork for the study of resource dependence relations [0.0]
資源理論は状態に対して事前順序を課し、一方の状態が他方の状態より上である場合、第一の状態が自由操作によって第二の状態に変換される。リソースフルネスの異なる概念の間には、非自明な依存関係が存在する可能性がある。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 22:56:35 GMT)
Chebyshev approximation and composition of functions in matrix product states for quantum-inspired numerical analysis [0.0]
解析的かつ高度に微分可能な関数をMPSチェビシェフ補間子として表現するために,反復的なチェビシェフ展開とクレショー評価を用いるアルゴリズムを提案する。これは高微分可能な函数に対する急速な収束を示し、理論的な予測と整合し、多次元のシナリオに効率的に一般化する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 18:00:06 GMT)
CFaults: Model-Based Diagnosis for Fault Localization in C Programs with Multiple Test Cases [0.0]
本稿では,複数の障害を持つCプログラムに対して,新しい障害局所化手法を提案する。 CFaultsは、複数の観察でモデルベース診断(MBD)を活用し、失敗したすべてのテストケースを統一されたMaxSAT公式に集約する。 C プログラムのベンチマークセット TCAS と C-Pack-IPAs の実験結果から,CFaults は他の FBFL の手法よりも高速であることがわかった。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:14:49 GMT)
Bi-Entangled Hidden Markov Processes and Recurrence [0.0]
二重絡み合った隠れマルコフ過程は、隠れたプロセス自体が絡み合ったマルコフ過程を示す隠れ量子過程である。これらのプロセスのジョイント期待に関する具体的な公式を提示する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 16:05:55 GMT)
Annealing Dynamics of Regular Rotor Networks: Universality and Its Breakdown [0.0]
スピンベクトルランゲヴィン(SVL)モデルはモンテカルロモデルの代替として提案され、試験されている。古典的O(2)ローターの非平衡ダイナミクスを正規グラフ上で研究する。この結果は、長距離相互作用を特徴とする古典力学系におけるキブル・ズレーク機構の普遍的な分解を確立する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:55:25 GMT)
Advanced Graph Clustering Methods: A Comprehensive and In-Depth Analysis [0.0]
本稿では,従来のグラフクラスタリング手法と最近のグラフクラスタリング手法について検討する。背景のセクションでは、グラフラプラシアンやグラフ解析におけるディープラーニングの統合など、重要なトピックが取り上げられている。本稿では,グラフクラスタリングの実践的応用について論じる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 07:22:45 GMT)
ABC Easy as 123: A Blind Counter for Exemplar-Free Multi-Class Class-agnostic Counting [0.0]
我々は,MCAC(Multi-class-Agnostic Counting dataset)とABC123(A Blind Counter)を提案する。 ABC123は、トレーニングや推論中に型を使用せずに、複数のタイプのオブジェクトを同時にカウントできる。 ABC123は,ヒトのループ内アノテーションを必要とせず,MCACの現代的な手法よりも優れていることを示す。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 11:41:33 GMT)
A realistic model for completing Quantum Mechanics [0.0]
コペンハーゲンでは、物理的対象と実験結果はマクロ言語でのみ記述できる。測定問題は、主に波動関数の低減プロセスの導入を必要とするため、これらの困難の中心にある。我々は、測定問題とそれに関連する他の問題をすべて解決できるモデルを構築し、提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 08:59:13 GMT)
A quantum-network register assembled with optical tweezers in an optical cavity [0.0]
量子計算と量子通信は、ユーザーに古典物理学ではアクセスできない機能を提供すると期待されている。 1つの解決策は、計算量子ビットを含む小さな量子レジスタからなる量子ネットワークを開発することである。我々は、光学的ツイーザと光学格子の両方を用いて、2次元の原子配列を光学的空洞に決定的に組み立てるレジスタについて報告する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 09:20:57 GMT)
A digital-analog quantum genetic algorithm using Rydberg atom arrays [0.0]
デジタルアナログ量子コンピューティング(DAQC)は、デジタルゲートとアナログ演算を組み合わせる。本稿では,Rydberg原子エミュレータを用いたDAQCフレームワーク内の量子遺伝的アルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 14:45:19 GMT)
A Unified Anomaly Synthesis Strategy with Gradient Ascent for Industrial Anomaly Detection and Localization [0.0]
本稿では,多様体と超球分布制約の下で,より広範な異常のカバレッジを合成する新しい統一フレームワークを提案する。 GLASSはMVTec AD(99.9%のAUROC)、VisA、MPDDデータセットの最先端の結果を達成し、弱い欠陥検出に優れる。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 15:33:37 GMT)
A Spin-Optical Quantum Computing Architecture [0.0]
フォールトトレラント量子コンピューティング用に設計された適応性とモジュール型ハイブリッドアーキテクチャを提案する。量子エミッターと線形光学的エンタングゲートを組み合わせて、物質ベースのアプローチとフォトニックベースのアプローチの両方の強度を利用する。
論文参考訳（メタデータ） (Fri, 12 Jul 2024 12:46:58 GMT)