Data Mixture Inference: What do BPE Tokenizers Reveal about their Training Data? [112.0] 我々は、トレーニングデータの分布的構成を明らかにすることを目的として、データ混合推論と呼ぶタスクに取り組む。
本稿では,これまで見過ごされていた情報-バイトペア符号化(BPE)トークン化手法に基づく新たな攻撃手法を提案する。
我々は,自然言語,プログラミング言語,データソースの既知混合に基づいて訓練されたトークン化剤に対して,高い精度で混合比を回復することを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:13:22 GMT)
OpenDevin: An Open Platform for AI Software Developers as Generalist Agents [109.9] 私たちは、人間の開発者と同様の方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenDevinを紹介します。
プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:50:43 GMT)
PartGLEE: A Foundation Model for Recognizing and Parsing Any Objects [104.3] 画像中の物体と部分の位置と識別のための部分レベル基礎モデルであるPartGLEEを提案する。
PartGLEEは、オープンワールドシナリオにおけるあらゆる粒度のインスタンスの検出、セグメンテーション、グラウンド化を達成する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:58:26 GMT)
Learning Task Decomposition to Assist Humans in Competitive Programming [90.5] タスク分解学習のための新しい目的,いわゆる値(AssistV)を導入する。
我々は、さまざまな分解されたソリューションに対して、人間の修理経験のデータセットを収集する。
人間の177時間以内の研究では、非専門家が33.3%の問題を解き、それらを3.3倍スピードアップさせ、無支援の専門家にマッチさせる権限を与える。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:26:32 GMT)
SAM-CP: Marrying SAM with Composable Prompts for Versatile Segmentation [88.8] Segment Anything Model (SAM)は、イメージピクセルをパッチにグループ化する機能を示しているが、セグメンテーションにそれを適用することは依然として大きな課題に直面している。
本稿では,SAM-CPを提案する。SAM-CPはSAM以外の2種類の構成可能なプロンプトを確立し,多目的セグメンテーションのために構成する単純な手法である。
実験により、SAM-CPはオープンドメインとクローズドドメインの両方においてセマンティック、例、およびパノプティックセグメンテーションを達成することが示された。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:47:25 GMT)
Beyond Binary Gender: Evaluating Gender-Inclusive Machine Translation with Ambiguous Attitude Words [85.5] 既存の機械翻訳の性別バイアス評価は主に男性と女性の性別に焦点を当てている。
本研究では,AmbGIMT (Gender-Inclusive Machine Translation with Ambiguous attitude words) のベンチマークを示す。
本研究では,感情的態度スコア(EAS)に基づく性別バイアス評価手法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:13:51 GMT)
WorkArena: How Capable Are Web Agents at Solving Common Knowledge Work Tasks? [83.2] 本稿では,Webブラウザを介してソフトウェアと対話する大規模言語モデルベースエージェントについて検討する。
WorkArenaは、広く使用されているServiceNowプラットフォームに基づく33のタスクのベンチマークである。
BrowserGymは、そのようなエージェントの設計と評価のための環境である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:19:28 GMT)
Position: AI/ML Influencers Have a Place in the Academic Process [82.2] 機械学習研究の可視性向上におけるソーシャルメディアインフルエンサーの役割について検討する。
2018年12月から2023年10月までの間に、8000以上の論文の包括的なデータセットを収集しました。
我々の統計的および因果推論分析は、これらのインフルエンサーが支持する論文の引用が著しく増加することを示している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:49:43 GMT)
DetToolChain: A New Prompting Paradigm to Unleash Detection Ability of MLLM [81.8] DetToolChainはマルチモーダル大言語モデル(MLLM)のゼロショットオブジェクト検出能力を解き放つ新しいパラダイムである。
提案手法は,高精度検出にヒントを得た検出プロンプトツールキットと,これらのプロンプトを実装するための新しいChain-of-Thoughtから構成される。
DetToolChainを用いたGPT-4Vは,オープン語彙検出のための新しいクラスセットにおいて,最先端のオブジェクト検出器を+21.5%AP50で改善することを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:14:54 GMT)
World Model on Million-Length Video And Language With Blockwise RingAttention [75.8] 現在の言語モデルは、言葉で簡単に説明できない世界の理解の側面に乏しく、複雑で長期的なタスクに苦しむ。
ビデオシーケンスは、言語と静的な画像に欠落する貴重な時間情報を提供するため、言語との共同モデリングには魅力的である。
数百万のビデオおよび言語シーケンスのトークンから学ぶことは、メモリ制約、計算複雑性、限られたデータセットによる課題を引き起こす。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:57:26 GMT)
PreAlign: Boosting Cross-Lingual Transfer by Early Establishment of Multilingual Alignment [73.2] 大規模な言語モデルは、英語中心の事前訓練にもかかわらず、合理的な多言語能力を示す。
これらのモデルにおける自発的な多言語アライメントは弱く、不満足な言語間移動と知識共有をもたらす。
言語モデル事前学習に先立って多言語アライメントを確立するフレームワークであるPreAlignを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:59:53 GMT)
INF-LLaVA: Dual-perspective Perception for High-Resolution Multimodal Large Language Model [71.5] 本稿では,高解像度画像認識のための新しいMLLM INF-LLaVAを提案する。
我々はDCM(Dual-perspective Cropping Module)を導入し、各サブイメージが局所的な視点から連続的な詳細を含むことを保証する。
第2に,グローバルな特徴と局所的な特徴の相互強化を可能にするDEM(Dual-perspective Enhancement Module)を導入する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:02:30 GMT)
APTNESS: Incorporating Appraisal Theory and Emotion Support Strategies for Empathetic Response Generation [71.3] 共感反応生成は、他人の感情を理解するように設計されている。
検索強化と感情支援戦略統合を組み合わせたフレームワークを開発する。
我々の枠組みは認知的・情緒的共感の両面からLLMの共感能力を高めることができる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:23:37 GMT)
Some Aspects of Remote State Restoring in State Transfer Governed by XXZ-Hamiltonian [70.4] XXZ-アルモリアン励起数で支配されるスピン系を考える。
最大20個のノードを持つスピン鎖の修復について研究した。
スピン鎖長による状態移動時間の指数的増加を示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:18:47 GMT)
Learning to Plan and Generate Text with Citations [69.6] 提案手法は, テキストの忠実性, 接地性, 制御性を向上させるために最近実証されたプランベースモデルの帰属性について検討する。
本稿では,異なるブループリントの変種を利用する帰属モデルと,質問をゼロから生成する抽象モデルと,質問を入力からコピーする抽出モデルを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:54:10 GMT)
RanDumb: A Simple Approach that Questions the Efficacy of Continual Representation Learning [68.4] 既存のオンライン学習深層ネットワークは、単純な事前定義されたランダム変換に比べて劣った表現を生成することを示す。
続いて、オンライン連続学習環境において、前例を保存せずに単純な線形分類器をトレーニングし、一度に1つのサンプルを処理します。
本研究は, 表現学習の大きな限界, 特に低経験, オンライン連続学習のシナリオについて明らかにした。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:52:28 GMT)
OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation [67.6] OV-Uni3DETRは、様々なシナリオにおける最先端のパフォーマンスを達成し、既存のメソッドを平均6%以上上回っている。
コードと事前訓練されたモデルは、後にリリースされる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:20:00 GMT)
ToDER: Towards Colonoscopy Depth Estimation and Reconstruction with Geometry Constraint Adaptation [67.2] そこで本稿では,ToDERという双方向適応アーキテクチャを用いて,高精度な深度推定を行う新しいパイプラインを提案する。
以上の結果から,本手法は実写および合成大腸内視鏡ビデオの深度マップを精度良く予測できることが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:24:26 GMT)
Domain-Adaptive 2D Human Pose Estimation via Dual Teachers in Extremely Low-Light Conditions [65.0] 低照度ポーズ推定の最近の研究は、トレーニングのために地上の真実とペアの明るい画像と低照度画像を使用する必要がある。
我々の主な新規性は、2つの補完的な教員ネットワークを活用して、より信頼性の高い擬似ラベルを生成することである。
本手法は最新技術(SOTA)法に対して6.8%(2.4 AP)の改善を達成した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:22:53 GMT)
SINKT: A Structure-Aware Inductive Knowledge Tracing Model with Large Language Model [64.9] 知識追跡(KT)は、学生が次の質問に正しく答えるかどうかを判断することを目的としている。
大規模言語モデルを用いた構造認識帰納的知識追跡モデル(SINKT)
SINKTは、学生の知識状態と質問表現とを相互作用させることで、対象の質問に対する学生の反応を予測する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:23:38 GMT)
Can Large Language Models Automatically Jailbreak GPT-4V? [64.0] 本稿では,迅速な最適化にインスパイアされた革新的な自動ジェイルブレイク技術であるAutoJailbreakを紹介する。
実験の結果,AutoJailbreakは従来の手法をはるかに上回り,95.3%を超えるアタック成功率(ASR)を達成した。
この研究は、GPT-4Vのセキュリティ強化に光を当て、LCMがGPT-4Vの完全性向上に活用される可能性を強調している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:50:45 GMT)
KAN or MLP: A Fairer Comparison [63.8] 本稿では,様々なタスクにおけるkanとモデルの比較を,より公平かつ包括的に行う。
パラメータ数とFLOPを制御して,kanの性能と表現性を比較する。
我々は,KANSAの課題が,標準クラス増分学習環境において忘れることよりも深刻であることが確認された。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:43:35 GMT)
Networks of Networks: Complexity Class Principles Applied to Compound AI Systems Design [63.2] 多くの言語モデル推論コールからなる複合AIシステムは、ますます採用されている。
本研究では,提案した回答の生成と正当性検証の区別を中心に,ネットワークネットワーク(NoN)と呼ばれるシステムを構築した。
我々は,Kジェネレータを備えた検証器ベースの判定器NoNを導入し,"Best-of-K"あるいは"judge-based"複合AIシステムのインスタンス化を行う。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 20:40:37 GMT)
RigorLLM: Resilient Guardrails for Large Language Models against Undesired Content [62.7] 現在の緩和戦略は効果はあるものの、敵の攻撃下では弾力性がない。
本稿では,大規模言語モデルのための弾力性ガードレール(RigorLLM)について紹介する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 22:56:13 GMT)
SINDER: Repairing the Singular Defects of DINOv2 [62.0] 大規模なデータセットでトレーニングされたビジョントランスフォーマーモデルは、抽出したパッチトークンにアーティファクトを表示することが多い。
本稿では,小さなデータセットのみを用いて構造欠陥を補正するスムーズなスムーズな正規化を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 20:34:23 GMT)
Motion Capture from Inertial and Vision Sensors [60.5] MINIONSは、INertialとvisION Sensorsから収集された大規模なモーションキャプチャーデータセットである。
単眼カメラと極めて少ないIMUを用いたマルチモーダルモーションキャプチャの実験を行った。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:41:10 GMT)
Exploring Automatic Cryptographic API Misuse Detection in the Era of LLMs [60.3] 本稿では,暗号誤用の検出において,大規模言語モデルを評価するための体系的評価フレームワークを提案する。
11,940個のLCM生成レポートを詳細に分析したところ、LSMに固有の不安定性は、報告の半数以上が偽陽性になる可能性があることがわかった。
最適化されたアプローチは、従来の手法を超え、確立されたベンチマークでこれまで知られていなかった誤用を明らかにすることで、90%近い顕著な検出率を達成する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:31:26 GMT)
Strike a Balance in Continual Panoptic Segmentation [60.3] 既存の知識の安定性と新しい情報への適応性のバランスをとるため,過去クラスのバックトレース蒸留を導入する。
また,リプレイ用サンプルセットのクラス分布と過去のトレーニングデータとの整合性を考慮したクラス比記憶戦略を導入する。
連続パノプティカルバランス(BalConpas)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:58:20 GMT)
DreamVTON: Customizing 3D Virtual Try-on with Personalized Diffusion Models [56.6] 画像ベースの3Dバーチャルトライオン(VTON)は、人や衣服の画像に基づいて3D人間を彫刻することを目的としている。
近年のテキスト・ツー・3D法は高忠実度3Dヒューマンジェネレーションにおいて顕著な改善を実現している。
我々は,3次元人間の形状とテクスチャを個別に最適化するために,textbfDreamVTONという新しい3次元人体試行モデルを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:25:28 GMT)
Differentially Private Synthetic Data via Foundation Model APIs 2: Text [56.1] 現実世界で生成された高品質なテキストデータはプライベートであり、プライバシー上の懸念から自由に共有したり、利用したりすることはできない。
テキストの複雑な設定に適用可能な拡張PEアルゴリズムであるAug-PEを提案する。
その結果, Aug-PE は SOTA DP の微調整ベースラインと競合する DP 合成テキストを生成することがわかった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 19:19:02 GMT)
MovieDreamer: Hierarchical Generation for Coherent Long Visual Sequence [56.0] MovieDreamerは、自己回帰モデルの強みと拡散ベースのレンダリングを統合する、新しい階層的なフレームワークである。
様々な映画ジャンルにまたがって実験を行い、そのアプローチが優れた視覚的・物語的品質を実現することを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:17:05 GMT)
OriGen:Enhancing RTL Code Generation with Code-to-Code Augmentation and Self-Reflection [54.8] OriGenは、セルフリフレクション機能とデータセット拡張方法論を備えた、完全なオープンソースフレームワークである。
我々は、OriGenがRTLコード生成において、他のオープンソース代替よりも著しく優れていることを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:22:25 GMT)
Improving the Computational Efficiency of Adaptive Audits of IRV Elections [54.4] AWAIREは、任意の数の候補でIRVコンテストを監査できるが、当初の実装では、候補数とともに指数関数的に増加するメモリと計算コストが増大していた。
本稿では,従来の6候補と比較して,55候補のIRVコンテストを実際に実施する3つの方法で,AWAIREのアルゴリズム実装を改善した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:28:00 GMT)
How Easy is It to Fool Your Multimodal LLMs? An Empirical Analysis on Deceptive Prompts [54.1] 提案するMAD-Benchは,既存のオブジェクト,オブジェクト数,空間関係などの5つのカテゴリに分割した1000の試験サンプルを含むベンチマークである。
我々は,GPT-4v,Reka,Gemini-Proから,LLaVA-NeXTやMiniCPM-Llama3といったオープンソースモデルに至るまで,一般的なMLLMを包括的に分析する。
GPT-4oはMAD-Bench上で82.82%の精度を達成するが、実験中の他のモデルの精度は9%から50%である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:02:30 GMT)
Lean-STaR: Learning to Interleave Thinking and Proving [53.9] 証明の各ステップに先立って,非公式な思考を生成するために,言語モデルをトレーニングするフレームワークであるLean-STaRを紹介します。
Lean-STaRは、Lean定理証明環境内のminiF2F-testベンチマークで最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 04:53:11 GMT)
EgoCVR: An Egocentric Benchmark for Fine-Grained Composed Video Retrieval [52.4] EgoCVRは、きめ細かいComposted Video Retrievalの評価ベンチマークである。
EgoCVRは2,295のクエリで構成され、高品質な時間的ビデオ理解に特化している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:19:23 GMT)
Deep Learning based Key Information Extraction from Business Documents: Systematic Literature Review [51.6] 鍵情報抽出のための深層学習に基づくアプローチは、文書理解(Document Understanding)という用語で提案されている。
この体系的な文献レビューの目的は、この領域における既存のアプローチの詳細な分析とさらなる研究の機会の同定である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:15:55 GMT)
EquiPocket: an E(3)-Equivariant Geometric Graph Neural Network for Ligand Binding Site Prediction [49.7] 標的タンパク質の結合部位の予測は、薬物発見の基本的な役割を担っている。
既存のディープラーニング手法の多くは、タンパク質を原子をボクセルに空間的にクラスタリングすることで3D画像とみなしている。
本研究では,結合サイト予測のためのE3-equivariant Graph Neural Network(GNN)であるEquiPocketを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 03:32:32 GMT)
A deeper look at depth pruning of LLMs [49.3] 大規模言語モデル(LLM)は、トレーニングにはリソース集約的だが、本番環境でのデプロイにはよりコストがかかる。
最近の研究は、ブロックの重要性を推定するために、安価なプロキシに基づいてLSMのブロックをプルークしようと試みている。
適応メトリクスはタスク間のパフォーマンスのトレードオフを示すことを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:40:27 GMT)
Ranking protein-protein models with large language models and graph neural networks [49.2] DeepRank-GNN-esmはグラフベースのPPI構造のランク付けのためのディープラーニングアルゴリズムである。
ここでは、例を挙げて、ソフトウェアの使用について詳述する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 10:51:35 GMT)
Scientific Large Language Models: A Survey on Biological & Chemical Domains [48.0] 大規模言語モデル(LLM)は、自然言語理解の強化において、変革的な力として現れてきた。
LLMの応用は従来の言語境界を超えて、様々な科学分野で開発された専門的な言語システムを含んでいる。
AI for Science(AI for Science)のコミュニティで急成長している分野として、科学LLMは包括的な探査を義務付けている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:56:42 GMT)
Learning Scalable Model Soup on a Single GPU: An Efficient Subspace Training Strategy [45.5] モデルスープの変種であるLearned-Soupは、パフォーマンスを大幅に改善するが、メモリと時間コストが大幅に低下する。
本稿では,この問題に対処するために,メモリ効率の高いハイパープレーン学習スープ(MEHL-Soup)を提案する。
テスト精度ではMEHL-Soup(+)がLearred-Soup(+)より優れており,メモリ使用量も13ドル以上削減されている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:19:21 GMT)
BEV$^2$PR: BEV-Enhanced Visual Place Recognition with Structural Cues [45.0] 本稿では,鳥眼ビュー(BEV)における構造的手がかりを1台のカメラから活用して,画像に基づく視覚的位置認識(VPR)フレームワークを提案する。
BEV$2$PRフレームワークは、単一のカメラに基づいて視覚的手がかりと空間的認識の両方を持つ複合記述子を生成する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:20:27 GMT)
A Multitask Deep Learning Model for Classification and Regression of Hyperspectral Images: Application to the large-scale dataset [44.9] ハイパースペクトル画像上で複数の分類タスクと回帰タスクを同時に行うマルチタスク深層学習モデルを提案する。
我々は、TAIGAと呼ばれる大規模なハイパースペクトルデータセットに対するアプローチを検証した。
結果の総合的定性的および定量的分析により,提案手法が他の最先端手法よりも有意に優れていることを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:14:54 GMT)
Contracting Skeletal Kinematics for Human-Related Video Anomaly Detection [43.7] COSKADは、人間の骨格の動きをグラフ畳み込みネットワークによって符号化する新しいモデルである。
ビデオ異常検出のために、SKeletal埋め込みを最小体積の潜在超球面に抽出する。
すべての変種は、最新のUBnormalデータセットで最先端のデータセットを上回っている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:43:06 GMT)
PrISM-Observer: Intervention Agent to Help Users Perform Everyday Procedures Sensed using a Smartwatch [43.4] PrISM-Observerはスマートウォッチベースのコンテキスト対応リアルタイム介入システムで、エラーを防止して日常的なタスクをサポートする。
情報を探さなければならない従来のシステムとは異なり、エージェントはユーザーの行動を観察し、積極的に介入する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:38:07 GMT)
Vision Language Model is NOT All You Need: Augmentation Strategies for Molecule Language Models [43.3] そこで本研究では,分子-テキスト対を構造的類似性保持損失で拡張するAMOLEを提案する。
また, 専門知識の少ない分子から, 専門知識の少ない分子へ, 知識を伝達する専門的再構築損失を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:31:20 GMT)
End-to-End Video Question Answering with Frame Scoring Mechanisms and Adaptive Sampling [43.0] そこで我々は,VidF4を提案する。VidF4は,ビデオQAを効果的かつ効率的に選択するためのフレーム選択戦略を備えた,新しいビデオQAフレームワークである。
本稿では,ビデオ上での質問に対する各フレームの重要性を評価するために,質問関連性とフレーム間類似性の両方を考慮した3つのフレーム照合機構を提案する。
広く採用されている3つのベンチマークによる実験結果から,我々のモデルは既存のビデオQA手法より一貫して優れていることが示された。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:56:22 GMT)
FACTTRACK: Time-Aware World State Tracking in Story Outlines [41.9] 本稿では,原子の事実を追跡し,矛盾に対処するための新しい手法FACTTRACKを提案する。
FACTTRACKは、各事実に対する時間認識の妥当性間隔も維持し、経時変化を可能にする。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:50:14 GMT)
COALA: A Practical and Vision-Centric Federated Learning Platform [41.7] 我々は、ビジョン中心のフェデレートラーニング(FL)プラットフォームであるCOALAと、実践的なFLシナリオのためのベンチマークスイートを提示する。
タスクレベルでは、COALAは単純な分類から、オブジェクト検出、セグメンテーション、ポーズ推定などを含む15のコンピュータビジョンタスクまでサポートを拡張している。
データレベルでは、COALAは監督FLを超え、半監督FLと教師なしFLの両方をベンチマークする。
モデルレベルでは、COALAはFLを異なるクライアントの分割モデルと異なるモデルでベンチマークする。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:14:39 GMT)
Surfel-based Gaussian Inverse Rendering for Fast and Relightable Dynamic Human Reconstruction from Monocular Video [41.7] 本稿では,Surfel-based Gaussian Inverse Avatar (SGIA)法を提案する。
SGIAは従来のガウスアバター法を進歩させ、人間のアバターの物理的レンダリング(PBR)特性を包括的にモデル化した。
提案手法は,既存の暗黙的手法を超越した高速光計算のために,事前積分と画像ベース照明を統合する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:57:32 GMT)
Event-Based Simulation of Stochastic Memristive Devices for Neuromorphic Computing [41.7] イベントベースシステムのシミュレーションに適したメムリスタの一般モデルを構築した。
既存のmemristorの汎用モデルをイベント駆動設定に拡張する。
本稿では,イベントベースモデルのパラメータをドリフトモデルに適合させる手法を示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:47:06 GMT)
Does In-Context Learning Really Learn? Rethinking How Large Language Models Respond and Solve Tasks via In-Context Learning [41.6] In-context Learning (ICL)は、スケールアップされた大規模言語モデル(LLM)の開発と共に強力な能力として登場した。
本稿では,ICLの全体的な性能をラベル空間,フォーマット,識別の3次元に分解する。
ICLはラベル空間とフォーマットを制御し,所望のラベル語にLLMが反応するのに役立つことを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:28:14 GMT)
Gaussian Splashing: Unified Particles for Versatile Motion Synthesis and Rendering [41.6] 立体と流体の物理アニメーションを3Dガウススティング(3DGS)と統合し、3DGSを用いて再構成された仮想シーンにおける新たな効果を創出する。
我々のフレームワークは動的流体上の表面ハイライトを現実的に再現し、新しいビューからシーンオブジェクトと流体間の相互作用を容易にする。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 04:05:53 GMT)
Cinemo: Consistent and Controllable Image Animation with Motion Diffusion Models [41.3] 我々は、より優れたモーション制御性を実現するための、新しいイメージアニメーションアプローチであるCinemoを紹介する。
我々は,Cinemoのトレーニングと推論段階における3つの効果的な戦略を提案し,その目標を達成する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 01:35:07 GMT)
Diffusion Transformer Captures Spatial-Temporal Dependencies: A Theory for Gaussian Process Data [39.4] ビデオ生成のためのSoraのバックボーンであるDiffusion Transformerは、拡散モデルのキャパシティをうまく拡張する。
空間的・時間的依存関係を捉えるための拡散変圧器のブリッジ化に向けた第一歩を踏み出す。
空間的時間的依存が学習効率にどのように影響するかを強調した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:42:43 GMT)
Rethinking Out-of-Distribution Detection on Imbalanced Data Distribution [38.8] アーキテクチャ設計におけるバイアスを緩和し,不均衡なOOD検出器を増強する訓練時間正規化手法を提案する。
提案手法は,CIFAR10-LT,CIFAR100-LT,ImageNet-LTのベンチマークに対して一貫した改良を行う。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:28:59 GMT)
OutfitAnyone: Ultra-high Quality Virtual Try-On for Any Clothing and Any Person [38.7] OutfitAnyoneは、バーチャル衣料品のトライアルのために、高忠実でディテールに一貫性のある画像を生成する。
ポーズ、ボディシェイプ、広範囲な適用性など、スケーラビリティを規定する要因を自分自身と区別する。
さまざまなシナリオにおけるOutfitAnyoneのパフォーマンスは、実世界のデプロイに対する実用性と準備性を示している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:04:42 GMT)
On the Benefits of Rank in Attention Layers [38.7] 注意機構のランクと頭数との間には、劇的なトレードオフがあることが示される。
本研究は,本研究の成果を検証した既成のトランスフォーマーを用いた実験である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 03:40:24 GMT)
The Oscars of AI Theater: A Survey on Role-Playing with Language Models [38.6] 本調査では,言語モデルを用いたロールプレイングの急成長分野について検討する。
それは、初期のペルソナモデルから、Large Language Models(LLMs)によって促進される高度なキャラクタ駆動シミュレーションまでの開発に焦点を当てている。
データやモデル,アライメント,エージェントアーキテクチャ,評価など,これらのシステムを設計する上で重要なコンポーネントを包括的に分類する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:18:31 GMT)
A Task is Worth One Word: Learning with Task Prompts for High-Quality Versatile Image Inpainting [38.5] 我々は,複数の塗装タスクに優れる最初の高品質で多用途な塗装モデルであるPowerPaintを紹介する。
本稿では,PowerPaintにおけるタスクプロンプトの汎用性について,オブジェクト削除の負のプロンプトとしての有効性を示す。
我々は, 形状誘導型物体の塗布を制御可能とし, 形状誘導型アプリケーションにおけるモデルの適用性を高めるために, プロンプト技術を活用している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:48:57 GMT)
CGB-DM: Content and Graphic Balance Layout Generation with Transformer-based Diffusion Model [38.0] 変換器ベース拡散モデル(CGB-DM)を用いたコンテンツとグラフバランスレイアウト生成を提案する。
具体的には、予測されたコンテンツとグラフィック重量のバランスをとるレギュレータを最初に設計し、キャンバス上のコンテンツにより多くの注意を払う傾向を克服する。
第2に、レイアウト表現と画像間の幾何学的特徴のアライメントをさらに高めるために、サリエンシ境界ボックスのグラフィック制約を導入する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:22:45 GMT)
ESOD: Efficient Small Object Detection on High-Resolution Images [36.8] 小さなオブジェクトは通常、わずかに分散され、局所的にクラスタ化される。
画像の非対象背景領域において、大量の特徴抽出計算を無駄にする。
本稿では,検出器のバックボーンを再利用して,特徴レベルのオブジェクト探索とパッチスライシングを行う方法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:21:23 GMT)
Research on Adverse Drug Reaction Prediction Model Combining Knowledge Graph Embedding and Deep Learning [36.7] 本稿では,知識グラフの埋め込みと深層学習に基づく薬物反応予測モデルを開発する。
得られた予測モデルは、予測精度と安定性が良好であり、後続の安全な薬剤指導のための効果的な基準を提供することができる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 03:25:55 GMT)
Time Sensitive Knowledge Editing through Efficient Finetuning [35.8] 大きな言語モデル(LLM)は、様々なタスクにおいて印象的な能力を示し、多くのドメインに変革をもたらす。
LLMの知識を最新に保つことは、事前トレーニングが完了するまで、依然として課題である。
既存の位置と編集の知識編集(KE)手法には2つの制限がある。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 00:46:37 GMT)
How Easily do Irrelevant Inputs Skew the Responses of Large Language Models? [35.8] 大きな言語モデル(LLM)は多くの知識集約的なタスクを達成するための拡張された能力を示す。
現在の検索システムに固有の欠陥があるため、検索する上位のパスには無関係な情報が存在する可能性がある。
我々は,意味的に無関係で,部分的に関連があり,質問に関連するような,高品質な無関係な情報を構築するための枠組みを導入する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:19:18 GMT)
PathM3: A Multimodal Multi-Task Multiple Instance Learning Framework for Whole Slide Image Classification and Captioning [35.2] 本稿では,WSI分類とキャプションのためのマルチタスク・マルチインスタンス学習フレームワークPathM3を提案する。
本手法は,限られたWSI診断キャプションデータを活用することで,WSIレベルのキャプションにおけるデータ不足を克服する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 20:14:17 GMT)
Cultural Commonsense Knowledge for Intercultural Dialogues [31.1] 本稿では,文化知識の高精度・高精度な主張を蒸留する方法であるMANGOについて述べる。
GPT-3.5でMANGO法を実行すると、30Kのコンセプトと11Kのカルチャーに対して167Kの高精度なアサーションが得られる。
MANGOから知識を追加することで、対話応答の全体的な品質、特異性、文化的感受性が向上することがわかった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 10:28:44 GMT)
How to Leverage Personal Textual Knowledge for Personalized Conversational Information Retrieval [31.0] 鍵となる約束は、パーソナルテキスト知識ベース(PTKB)がパーソナライズされた情報検索の有効性を向上させることである。
本稿では,PTKBから知識を抽出し,大規模言語モデル(LLM)を用いてクエリ再構成に利用するいくつかの方法について検討・検証する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 05:34:41 GMT)
Probabilistic Parameter Estimators and Calibration Metrics for Pose Estimation from Image Features [30.9] 本稿では,実時間における測定の不確実性を考慮した確率的パラメータ推定の課題に対処する。
本稿では,最小二乗サンプリング法,線形近似法,確率的プログラミング推定法という3つの確率的パラメータ推定手法を提案する。
線形近似推定器は、他の手法よりも格段に高速にシャープで精度の良いポーズ予測を生成できるが、特定のシナリオにおいて過信な予測をもたらす可能性があることを実証する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:02:01 GMT)
Explanation Regularisation through the Lens of Attributions [30.7] 説明正則化(ER)は、モデルが予測を「称賛できる」ように導く方法として導入された。
この研究は、可算トークンの分類決定を通知するERの有効性の研究に貢献する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:56:32 GMT)
Mobius: A High Efficient Spatial-Temporal Parallel Training Paradigm for Text-to-Video Generation Task [29.7] 多くの研究者がテキスト・トゥ・ビデオ(T2V)生成タスクに力を注いでいる。
本稿では,T2Vタスクのための高効率な時空間並列訓練パラダイム Mobius を提案する。
Mobiusは24%のGPUメモリと12%のトレーニング時間を節約し、T2Vの微調整タスクを大幅に改善する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:08:47 GMT)
Knowledge-driven AI-generated data for accurate and interpretable breast ultrasound diagnoses [29.7] 本稿では, 知識駆動型生成モデルを構築し, 適切な合成データを生成するパイプラインTAILORを提案する。
生成モデルは、ソースデータとして3,749の病変を使用し、特にエラーを起こしやすいまれな症例において、数百万の乳房US画像を生成することができる。
今後の外部評価では, 同じ感度で9名の放射線技師の平均性能を33.5%向上させる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:49:01 GMT)
Don't Go To Extremes: Revealing the Excessive Sensitivity and Calibration Limitations of LLMs in Implicit Hate Speech Detection [29.1] 本稿では,暗黙のヘイトスピーチを検出し,その応答に自信を表現できる大規模言語モデルを提案する。
1) LLMは, 公平性問題を引き起こす可能性のあるグループやトピックに対して過度な感受性を示し, ヘイトスピーチとして良心的発言を誤分類する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:20:32 GMT)
Local vs Global continual learning [29.1] 既存の継続的学習アルゴリズムの成功と失敗の背後にあるメカニズムをより深く理解することで、新たな成功戦略の開発を解き放つことができる。
提案手法は,使用した近似に基づいて既存の連続学習アルゴリズムを分類し,この区別の実践的効果を共通の連続学習環境において評価する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:18:00 GMT)
Neural Network-Based Bandit: A Medium Access Control for the IIoT Alarm Scenario [28.7] IIoTアラームのシナリオに対して,NNBB(Neural Network-Based Bandit)と題する分散ランダムアクセス方式を提案する。
このようなシナリオでは、デバイスは共通のクリティカルイベントを検出し、アラーム情報が少なくとも1つのデバイスから確実に配信されることが目標である。
シミュレーションの結果,ネットワーク内のデバイス数の増加に伴い,マルチアーマッドバンド (MAB) RA ベンチマークと比較してNNBBの性能向上が見られた。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 22:57:23 GMT)
Generative Motion Stylization of Cross-structure Characters within Canonical Motion Space [28.6] 本研究では,多種多様かつ多種多様な構造体上での動作に対して,モーションスタイリングパイプライン(MotionS)を提案する。
私たちの重要な洞察は、モーションスタイルをモダリティのラテント空間に埋め込むことで、標準モーション空間内でのモーションスタイリングを可能にします。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:43:31 GMT)
Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach [26.0] Retrieval Augmented Generation (RAG) は、Large Language Models (LLM) において、過度に長いコンテキストを効率的に処理するための強力なツールである。
RAGとLong-context (LC) LLMを比較し,両者の強みを活用することを目的とした。
本稿では, モデル自己回帰に基づいて, クエリをRAGやLCにルーティングする, 単純かつ効果的な手法であるSelf-Routeを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 20:51:52 GMT)
Multi-Scale Simulation of Complex Systems: A Perspective of Integrating Knowledge and Data [25.6] 我々は、知識とデータの観点から、複雑なシステムのマルチスケールシミュレーションに関する文献を体系的にレビューする。
我々は,マルチスケールモデリングとシミュレーションの主な目的を,明瞭なスケールのシナリオと不明瞭なスケールのシナリオを考慮し,5つのカテゴリに分けた。
本稿では,一般的な物質システムや社会システムにおけるマルチスケールシミュレーションの適用について紹介する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:23:02 GMT)
3D-GOI: 3D GAN Omni-Inversion for Multifaceted and Multi-object Editing [25.4] 複数オブジェクト上のアフィン情報の多面的編集を可能にする3D編集フレームワークである3D-GOIを提案する。
3D-GOIは、有名な3D GANであるGIRAFFEによって制御される属性コードの多さを反転させることで、複雑な編集機能を実現する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 04:01:08 GMT)
CrossScore: Towards Multi-View Image Evaluation and Scoring [24.9] 相互参照画像品質評価法は画像評価景観のギャップを埋める。
本手法は,地上の真理参照を必要とせず,精度の高い画像品質評価を可能にする。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:47:35 GMT)
RedAgent: Red Teaming Large Language Models with Context-aware Autonomous Language Agent [24.5] 我々は,コンテキスト認識型ジェイルブレイクプロンプトを生成するためのマルチエージェントLLMシステムRedAgentを提案する。
我々のシステムは、ほとんどのブラックボックスLSMをたった5つのクエリでジェイルブレイクすることができ、既存のレッドチーム方式の効率を2倍に向上させることができる。
すべての問題を報告し、バグ修正のためにOpenAIとMetaと通信しました。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:34:36 GMT)
TLCR: Token-Level Continuous Reward for Fine-grained Reinforcement Learning from Human Feedback [24.4] 人間のフィードバックからの強化学習のためのTLCR(Token-Level Continuous Reward)を紹介する。
提案するTLCRは,従来のシーケンスレベルやトークンレベルの離散報酬よりも一貫した性能向上を実現している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:27:37 GMT)
Prior Knowledge Integration via LLM Encoding and Pseudo Event Regulation for Video Moment Retrieval [23.9] 本稿では,大言語モデル(LLM)を一般知識の統合に活用し,擬似イベントを時間的コンテンツ配信の先駆けとして活用する可能性について検討する。
これらの制限を克服するために,デコーダの代わりにLLMエンコーダを提案する。
LLMエンコーダを既存のVMRアーキテクチャ、特に核融合モジュールに組み込むための一般的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 03:51:43 GMT)
Data-Centric Human Preference Optimization with Rationales [23.2] 人間のフィードバックからの強化学習は、言語モデルを人間の好みに合わせる上で重要な役割を担っている。
この作業は、データ中心のアプローチによる好み学習の改善に重点を移す。
我々は、選択の背景にある理由を説明する機械生成論理を用いて、既存の嗜好データセットを豊かにすることを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:10:12 GMT)
Audio Prompt Adapter: Unleashing Music Editing Abilities for Text-to-Music with Lightweight Finetuning [23.2] 我々は、事前訓練されたテキストから音楽へのモデルへの軽量な追加であるAP-Adapterを提案する。
22Mのトレーニング可能なパラメータで、AP-Adapterはユーザーがグローバル(ジャンルや音色など)とローカル(メロディなど)の両方を活用できるようにする。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:16:18 GMT)
LiCROcc: Teach Radar for Accurate Semantic Occupancy Prediction using LiDAR and Camera [23.0] 3Dレーダーは、自動運転アプリケーションにおけるLiDARを徐々に置き換えている。
我々は,点雲と画像の融合フレームワークを実現するために,BEVに3段階の密接な融合手法を提案する。
提案手法はレーダー専用(R-LiCROcc)とレーダーカメラ(RC-LiCROcc)の両方での性能を向上させる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 05:53:05 GMT)
Rome was Not Built in a Single Step: Hierarchical Prompting for LLM-based Chip Design [22.7] 大言語モデル(LLM)は、ハードウェア記述言語(HDL)生成によるコンピュータハードウェア合成に有効である。
本稿では,効率的なステップワイズ設計手法を実現する階層的プロンプト技術一式を導入し,そのプロセスのための一般化可能な自動化パイプラインを開発する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 21:18:31 GMT)
Dyn-Adapter: Towards Disentangled Representation for Efficient Visual Recognition [22.6] 本稿では動的アダプタ(Dyn-Adapter)という,効率的な視覚認識パラダイムを提案する。
適応的なトレーニング戦略とともに,複数レベルの特徴抽出のための早期のバランスの取れた動的アーキテクチャを考案する。
予測中のFLOPを50%削減し,高い認識精度を維持した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:57:17 GMT)
STATE: A Robust ATE Estimator of Heavy-Tailed Metrics for Variance Reduction in Online Controlled Experiments [22.3] 我々は、学生のt分布と機械学習ツールを統合して、ヘビーテールのメトリクスに適合する新しいフレームワークを開発する。
ログ類似度関数を最適化するために変分EM法を採用することにより、アウトリアの負の影響を大幅に排除するロバストな解を推測できる。
Meituan実験プラットフォーム上での合成データと長期実験結果のシミュレーションにより,本手法の有効性を実証した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:35:59 GMT)
MonoWAD: Weather-Adaptive Diffusion Model for Robust Monocular 3D Object Detection [22.3] 既存の手法は主に理想的な気象条件下での3D検出に重点を置いており、明瞭で最適な視界を持つシナリオが特徴である。
気象適応拡散モデルを用いた新規な気象ロバストなモノクロ3D物体検出器MonoWADを紹介する。
様々な気象条件下での実験では、MonoWADは天候に乱れたモノクロ3D物体の検出を達成している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:58:49 GMT)
No Re-Train, More Gain: Upgrading Backbones with Diffusion Model for Few-Shot Segmentation [22.3] Few-Shot (FSS) は、注釈付き画像のみを使用して、新しいクラスを分割することを目的としている。
現在のFSSメソッドでは、再トレーニングなしでのバックボーンアップグレードの柔軟性、さまざまなアノテーションを均一に扱うことができない、という3つの問題に直面している。
拡散過程を用いた条件生成問題としてFSSタスクを概念化する新しいFSS手法であるDiffUpを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 05:09:07 GMT)
Timeliness-Fidelity Tradeoff in 3D Scene Representations [21.8] 本稿では,リアルタイム3次元シーン表現におけるタイムラインと忠実さのトレードオフについて検討する。
具体的には,通信遅延がトレードオフに与える影響を評価する枠組みを確立する。
3次元シーン表現の忠実度を改善するために,一段階のPPO法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:30:08 GMT)
PhenoFlow: A Human-LLM Driven Visual Analytics System for Exploring Large and Complex Stroke Datasets [21.8] PhenoFlowは、人間と大規模言語モデル(LLM)の協調を利用した視覚分析システムである。
PhenoFlowは、生の患者データにアクセスせずに、メタデータを使用して推論し、実行可能なコードを合成する。
本研究は,急性虚血性脳卒中患者のデータ駆動型臨床意思決定における現在の課題にLCMを用いて取り組む可能性を示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:25:59 GMT)
Exploring the Effectiveness and Consistency of Task Selection in Intermediate-Task Transfer Learning [21.7] 転送性能は、異なるソースタスク間で大きなばらつきを示し、種を訓練する。
埋め込みのない方法やテキスト埋め込みと比較して、微調整された重みで構築されたタスク埋め込みは、タスク転送可能性をよりよく見積もることができる。
本稿では,内部積探索の最大化によるトークンの相互類似度の測定手法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:31:43 GMT)
Scalar Function Topology Divergence: Comparing Topology of 3D Objects [21.5] コンピュータビジョンのための新しいトポロジツール - Scalar Function Topology Divergence (SFTD) を提案する。
SFTDは、共通領域を持つ2つの函数の下位レベル集合の間の多重スケール位相の相似性を測定する。
提案ツールは,関数が位相的相似性を持つ領域を視覚化する有用なツールである。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:26:34 GMT)
Figure it Out: Analyzing-based Jailbreak Attack on Large Language Models [21.3] 解析ベースジェイルブレイク (ABJ) は大規模言語モデル (LLM) に対する効果的なジェイルブレイク攻撃法である
ABJはGPT-4-turbo-0409上で94.8%の攻撃成功率(ASR)と1.06の攻撃効率(AE)を達成する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:14:41 GMT)
Situating the social issues of image generation models in the model life cycle: a sociotechnical approach [21.0] 本稿では,画像生成モデルに関連する社会問題の包括的分類について報告する。
データ問題,知的財産権,バイアス,プライバシ,情報,文化,自然環境など,画像生成モデルから生じる7つのイシュークラスタを特定します。
画像生成モデルによって引き起こされるリスクは、大きな言語モデルによってもたらされるリスクと重大であると主張する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 01:39:55 GMT)
DiffMesh: A Motion-aware Diffusion Framework for Human Mesh Recovery from Videos [20.9] ヒューマンメッシュリカバリ(Human Mesh recovery, HMR)は、さまざまな現実世界のアプリケーションに対して、リッチな人体情報を提供する。
ビデオベースのアプローチはこの問題を緩和するために時間的情報を活用する。
DiffMeshはビデオベースのHMRのための革新的な動き認識型拡散型フレームワークである。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 01:44:15 GMT)
Automatic Environment Shaping is the Next Frontier in RL [20.9] 多くのロボット学者は、夕方にタスクを持ったロボットを提示し、翌朝にそのタスクを解くことができるロボットを見つけることを夢見ている。
実際の強化学習は、挑戦的なロボティクスのタスクにおいて素晴らしいパフォーマンスを達成したが、そのタスクをRLに相応しい方法でセットアップするには、相当な人的努力が必要である。
政策最適化やその他のアイデアのアルゴリズムによる改善は、トレーニング環境を形作る際の主要なボトルネックを解決するために導かれるべきだ、という私たちの立場です。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 05:22:29 GMT)
LLMExplainer: Large Language Model based Bayesian Inference for Graph Explanation Generation [20.2] 最近の研究は、複数の教師なし学習モデルを通してグラフニューラルネットワーク(GNN)の解釈可能性を提供することを目指している。
データセットが不足しているため、現在の手法ではバイアスの学習が困難になる。
学習バイアス問題を回避するため,GNN説明ネットワークにLarge Language Model (LLM) を知識として組み込む。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 04:01:19 GMT)
PDF: A Probability-Driven Framework for Open World 3D Point Cloud Semantic Segmentation [20.2] オープンワールドセマンティックセグメンテーションのための確率駆動フレームワーク(PDF)を提案する。
私たちのフレームワークは、未知の物体を認識して、対応する知識で段階的に学習することのできる、人間のように振る舞うことができる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:54:17 GMT)
From Imitation to Refinement -- Residual RL for Precise Visual Assembly [20.0] 強化学習により、政策はタスク報酬の監督と探索を通じて局所的な修正行動を取得することができる。
本稿では、精密な操作タスクにおいて、BC訓練ポリシーを改善するためにRLファインチューニングを用いることについて検討する。
我々は,標準方針勾配法とスパース報酬法を用いて,凍ったBCトレーニング拡散モデル上での残留ポリシーのトレーニングを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:44:54 GMT)
FlowMap: High-Quality Camera Poses, Intrinsics, and Depth via Gradient Descent [20.0] FlowMapは、正確なカメラポーズ、カメラ内在、およびビデオシーケンスのフレーム毎の密度の深さを解決する、エンドツーエンドの微分可能な方法である。
提案手法は,最小2乗の目的をビデオごとの勾配差最小化する。
提案手法によって得られたカメラパラメータと密度深度は,360度軌道上での光リアルな新規ビュー合成を可能にすることを実証的に示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:41:03 GMT)
FakingRecipe: Detecting Fake News on Short Video Platforms from the Perspective of Creative Process [19.6] フェイクニュースの作り方を考える新しい視点を導入する。
ニュースビデオ制作の背後にある創造的なプロセスのレンズを通して、我々の経験的分析はフェイクニュースビデオの特徴を明らかにする。
得られた知見に基づいて、フェイクニュースショートビデオを検出するクリエイティブなプロセス認識モデルであるFakingRecipeを設計する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:39:49 GMT)
Generalization within in silico screening [19.6] シリカスクリーニングでは、予測モデルを使用して、実験的な検証のためにライブラリから好ましい特性を持つ化合物のバッチを選択する。
学習理論を拡張することにより、選択政策の選択性は一般化に大きな影響を及ぼすことを示す。
モデルがバッチで望ましい結果のごく一部を予測できる能力を考えると,一般化が著しく向上できることが示される。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:37:22 GMT)
Watermarks in the Sand: Impossibility of Strong Watermarking for Generative Models [19.3] 強い透かし方式は、計算的に拘束された攻撃者が、大幅な品質劣化を引き起こすことなく、透かしを消去できない性質を満たす。
我々は、明確に定義された自然な仮定の下で、強い透かしが達成できないことを証明した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:05:59 GMT)
On the Utility of Speech and Audio Foundation Models for Marmoset Call Analysis [19.2] 本研究は,4,8,16kHzの事前学習帯域において,音声領域と一般音声領域から派生した特徴表現をマーモセットコールタイプおよび発信者分類タスクに対して評価する。
その結果、より高い帯域幅を持つモデルでは性能が向上し、音声や一般音声での事前学習では同等の結果が得られ、スペクトルベースラインよりも改善されることがわかった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:00:44 GMT)
Proof of Diligence: Cryptoeconomic Security for Rollups [19.1] ロールアップの第一線として機能するインセンティブ付ウォッチトウワーネットワークを導入する。
我々の主な貢献は、観察者がL2アサーションが検証されたという証明を継続的に提供する必要があるディリジェンスのプロトコルの証明である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 20:15:03 GMT)
Multi-scale direction-aware SAR object detection network via global information fusion [19.0] 本稿では,SARオブジェクト検出における方向認識情報のグローバルな融合を目的とした新しいフレームワークであるSAR-Netを提案する。
UCMとDAMは効率的なグローバル情報融合と伝送を可能にする。
実験は、SAR-Netの有効性を示し、航空機や船舶のデータセットに対して最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:57:26 GMT)
PEAN: A Diffusion-Based Prior-Enhanced Attention Network for Scene Text Image Super-Resolution [18.9] シーンテキスト画像スーパーレゾリューション(STISR)は,低解像度のシーンテキスト画像の解像度と可読性を同時に向上することを目的としている。
シーンテキスト画像の視覚構造と意味情報の2つの要因が認識性能に大きな影響を及ぼす。
本稿では,これらの要因による影響を軽減するために,事前注意ネットワーク(PEAN)を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:09:33 GMT)
Finetuning Generative Large Language Models with Discrimination Instructions for Knowledge Graph Completion [18.9] 伝統的な知識グラフ(KG)補完モデルは、不足した事実を予測するために埋め込みを学ぶ。
最近の研究は、大言語モデル(LLM)を用いたテキスト生成方式でKGを完成させようとしている。
我々は,LLMのKG完了能力を解き放ち,基底誤差を回避するためのファインタニングフレームワークDIFTを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:25:01 GMT)
SOAP: Enhancing Spatio-Temporal Relation and Motion Information Capturing for Few-Shot Action Recognition [18.5] 従来のデータ駆動研究には大量のビデオサンプルが継続的に必要である。
本稿では,Stemp-Oral frAme tuwenle (SOAP) と呼ばれるアクション認識のための新しいプラグイン・アンド・プレイアーキテクチャを提案する。
SOAP-Netは、SthSthV2、Kineetics、UCF101、SOAP51といった有名なベンチマークで、最先端のパフォーマンスを新たに達成します。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:45:25 GMT)
Lawma: The Power of Specialization for Legal Tasks [18.5] 我々は260の法的テキスト分類タスクを研究し、ほぼ全て機械学習コミュニティに新しい。
軽量で微調整されたLlama 3モデルは、通常2桁のパーセンテージポイントで、ほぼ全てのタスクにおいてGPT-4をはるかに上回る。
より大型のモデルの方が、より小型のモデルよりも微調整に反応することがわかった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:23:04 GMT)
Accelerating Learned Video Compression via Low-Resolution Representation Learning [18.4] 低解像度表現学習に焦点を当てた学習ビデオ圧縮のための効率最適化フレームワークを提案する。
提案手法は,H.266参照ソフトウェアVTMの低遅延P構成と同等の性能を実現する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:02:57 GMT)
APPLS: Evaluating Evaluation Metrics for Plain Language Summarization [18.4] 本研究では,Plain Language Summarization (PLS) のメトリクス評価を目的とした,詳細なメタ評価テストベッド APPLS を提案する。
従来の作業から4つのPLS基準を特定し,これらの基準に対応する摂動のセットを定義した。
APPLSを用いて、自動スコア、語彙特徴、LLMプロンプトに基づく評価を含む14のメトリクスのパフォーマンスを評価する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:28:43 GMT)
HAPFI: History-Aware Planning based on Fused Information [18.1] EIF(Embodied Instruction following)は、ハイレベルな自然言語命令を与えられた一連のサブゴールを計画するタスクである。
我々はエージェントがそれぞれのステップで決定を行う際に、過去の、すなわち過去のデータを考慮する必要があると論じる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:46:07 GMT)
Transformer-based Graph Neural Networks for Battery Range Prediction in AIoT Battery-Swap Services [18.0] 共有経済の概念は広く認知され、この文脈において、共有E-Bike電池は社会的な関心の焦点として現れてきた。
人気にもかかわらず、SEBの残りのバッテリー範囲と現実に関するユーザの期待との間には、注目すべき相違点が残っている。
本稿では,SEBのバッテリ範囲の予測に特化して設計されたSEB-Transformerと呼ばれる構造トランスモデルを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 01:33:21 GMT)
Efficient Generation of Targeted and Transferable Adversarial Examples for Vision-Language Models Via Diffusion Models [18.0] 大規模視覚言語モデル(VLM)のロバスト性を評価するために、敵対的攻撃を用いることができる。
従来のトランスファーベースの敵攻撃は、高いイテレーション数と複雑なメソッド構造により、高いコストを発生させる。
本稿では, 拡散モデルを用いて, 自然, 制約のない, 対象とする対向的な例を生成するAdvDiffVLMを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:33:28 GMT)
Chameleon: Images Are What You Need For Multimodal Learning Robust To Missing Modalities [17.7] マルチモーダル学習法は、1つ以上のモダリティが欠如している場合、劣化した性能を示すことが多い。
本稿では,従来のマルチブランチ設計から完全に逸脱した,頑健なテキスト-視覚的マルチモーダル学習手法Chameleonを提案する。
実験は、Hateful Memes, UPMC Food-101, MM-IMDb, Ferramentaの4つの一般的なデータセットで行われている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:29:57 GMT)
Conceptualizing Trustworthiness and Trust in Communications [17.7] 本稿では,コミュニケーションの文脈において,信頼度を体系的に扱うための新しい総合的アプローチを提案する。
本稿では,信頼性に基づく信頼を確立するために,客観的なシステム特性と主観的信念を取り入れた最初の試みを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:11:13 GMT)
3D-UGCN: A Unified Graph Convolutional Network for Robust 3D Human Pose Estimation from Monocular RGB Images [17.7] 本稿では,空間時間グラフ畳み込みネットワーク(UGCN)に基づく改良手法を提案する。
ネットワークが3次元人間のポーズデータを処理し、3次元人間のポーズスケルトン配列を改善するための改良Nを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:50:27 GMT)
Crystals with Transformers on Graphs, for Prediction of Unconventional Crystal Material Properties and the Benchmark [17.6] 我々はCrysToGraph(textbfCrys$tals with $textbfT$ransformers $textbfo$n $textbfGraph$s)を提案する。
CrysToGraphは、トランスフォーマーベースのグラフ畳み込みブロックと、グラフワイドトランスフォーマーブロックとの長距離インタラクションを効果的にキャプチャする。
これは既存のほとんどの方法より優れており、非伝統的な結晶と伝統的な結晶の両方のベンチマークで新しい最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:31:06 GMT)
ITINERA: Integrating Spatial Optimization with Large Language Models for Open-domain Urban Itinerary Planning [17.3] 本稿では,自然言語によるユーザ要求から個人化された都市イテナリーを生成するオープンドメイン都市イテナリープランニング(OUIP)の課題を紹介する。
そこで我々は,大規模言語モデルと空間最適化を統合したOUIPシステムであるITINERAを紹介した。
実世界のデータセットの実験と、デプロイされたシステムの性能は、パーソナライズされた空間的に整合したイテレーションを提供するシステムの能力を示している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:25:26 GMT)
On ADMM in Heterogeneous Federated Learning: Personalization, Robustness, and Fairness [16.6] 本稿では,乗算器の交互方向法(ADMM)を利用して,パーソナライズおよびグローバルモデルの学習を行う最適化フレームワークFLAMEを提案する。
我々の理論的解析は、軽度の仮定の下で、FLAMEのグローバル収束と2種類の収束速度を確立する。
実験の結果,FLAMEは収束と精度において最先端の手法より優れており,各種攻撃下では高い精度を達成できることがわかった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:35:42 GMT)
AbdomenAtlas: A Large-Scale, Detailed-Annotated, & Multi-Center Dataset for Efficient Transfer Learning and Open Algorithmic Benchmarking [16.5] 腹部CTデータセット(AbdomenAtlasと略す)は, 多様な人口, 地理, 施設にまたがる112の病院の3次元CTボリューム20,460点が最も大きい。
AbamenAtlasは、AIアルゴリズムの助けを借りて10人の放射線学者のチームが注釈を付けた腹部領域の解剖学的構造の、673Kの高品質マスクを提供する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:59:44 GMT)
A Comprehensive Survey of LLM Alignment Techniques: RLHF, RLAIF, PPO, DPO and More [16.5] 大規模言語モデル(LLM)は、人間のクエリに対する事実的かつ一貫性のある応答を生成することができる。
しかし、学習データの混合品質は、望ましくない応答を発生させる可能性がある。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:45:52 GMT)
A Faster Branching Algorithm for the Maximum $k$-Defective Clique Problem [16.4] 未分岐グラフの$k$-defective cliqueは、$G$は、最大で$k$の欠損エッジを持つほぼ完全なグラフを誘導する。
与えられたグラフから最大の$k$$-defective Cliqueを求める最大$k$-defective Clique問題は、社会的および生物学的ネットワーク分析のような多くのアプリケーションにおいて重要である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:40:35 GMT)
An Empirical Study of Validating Synthetic Data for Formula Generation [16.3] 大規模言語モデル(LLM)は、スプレッドシートで公式を書くのに役立つ。
我々は、(他の)モデルを用いて、微調整のための合成自然言語発話を生成する。
バリデーションは、4つのモデルにわたる生データよりも性能を向上させることを実証する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:41:50 GMT)
SAM2CLIP2SAM: Vision Language Model for Segmentation of 3D CT Scans for Covid-19 Detection [16.2] 本稿では,任意のモデルや手法に統合可能な画像の効果的セグメンテーションのための新しいアプローチを提案する。
私たちのアプローチには、CTスキャンをセグメント化する視覚言語モデルの組み合わせが含まれています。
提案手法をCTスキャンのセグメンテーションに用いた場合の性能向上を示す2つのCovid-19アノテートデータベースに対して実験を行った。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 23:53:03 GMT)
Integrating IP Broadcasting with Audio Tags: Workflow and Challenges [15.5] 放送業界はIP技術を採用しており、生放送と録画されたコンテンツ制作の両方に革命をもたらしている。
考えられる1つのツールは、ライブオーディオタグの使用であり、コンテンツの生産に多くの用途がある。
本稿では、複数の異なるネットワーク構成に統合可能な、小さな分離コードモジュールであるマイクロサービスにオーディオタグモデルをコンテナ化するプロセスについて述べる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:46:03 GMT)
On Simultaneous Information and Energy Transmission through Quantum Channels [15.4] 本稿では,キャパシティ・パワー関数の量子古典的類似点を紹介する。
我々は、ノイズチャネルを介して古典情報を伝達するための古典情報理論で結果を一般化する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:43:22 GMT)
Leveraging Enhanced Queries of Point Sets for Vectorized Map Construction [15.3] 本稿では,オンラインベクトル化マップ構築のためのクエリ機能の向上を重視したエンドツーエンド手法であるMapQRを紹介する。
MapQR はscatter-and-gather クエリと呼ばれる新しいクエリ設計を採用している。
提案したMapQRは,最高平均精度(mAP)を達成し,nuScenesとArgoverse 2.0の両方で良好な効率を維持する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:57:55 GMT)
EIANet: A Novel Domain Adaptation Approach to Maximize Class Distinction with Neural Collapse Principles [15.2] ソースフリードメイン適応(SFDA)は、ラベル付きソースドメインから未ラベルのターゲットドメインに知識を転送することを目的としている。
SFDAにおける大きな課題は、ターゲットドメインの正確な分類情報を導き出すことである。
クラスプロトタイプを分離するための新しいETF-Informed Attention Network(EIANet)を導入する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 05:31:05 GMT)
What Matters in Range View 3D Object Detection [15.1] ライダーベースの知覚パイプラインは複雑なシーンを解釈するために3Dオブジェクト検出モデルに依存している。
過去のレンジビュー文献に提案されている複数の手法を使わずに、レンジビュー3次元オブジェクト検出モデル間の最先端を実現する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:42:37 GMT)
Demonstration of a variational quantum eigensolver with a solid-state spin system under ambient conditions [15.0] 量子シミュレータは、物理系の量子的性質を利用して別の物理系を研究する能力を提供する。
変分量子固有解法アルゴリズムは分子電子構造の研究に特に有望な応用である。
スピンベースの固体量子ビットは、長いデコヒーレンス時間と高忠実度量子ゲートの利点がある。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:17:06 GMT)
HDRSplat: Gaussian Splatting for High Dynamic Range 3D Scene Reconstruction from Raw Images [14.3] 3D Gaussian Splatting(3DGS)は、3Dシーンの再現空間に革命をもたらし、高忠実なノベルビューをリアルタイムで実現した。
しかし,従来の3DGS法とNeRF法では8ビットトーンマップの低ダイナミックレンジ画像がシーン再構成に利用されている。
提案手法は,14ビットの直線的原像を暗黒付近で直接トレーニングし,シーンの全ダイナミックレンジと内容を保存する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:21:00 GMT)
Magnetic Resonance Linewidth of Alkali-Metal Vapor in Unresolved Zeeman Resonance Regime [14.2] 未解決ゼーマン共鳴系におけるアルカリ金属原子の線幅について検討した。
スピン交換率とスピン破壊率との比が臨界値を超える場合にのみ光狭化効果が生じる。
これらの知見は、アルカリ金属原子のスピン緩和を理解するための理論的ツールを提供する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:05:08 GMT)
TransFeat-TPP: An Interpretable Deep Covariate Temporal Point Processes [14.1] 古典的時間点過程(TPP)は、発生時間を考慮して強度関数を構成する。
本稿では,Transformer-based covariate temporal point process (TransFeat-TPP)モデルを提案する。
合成データセットと実データセットの実験的結果は、予測精度の向上と、常に解釈可能な特徴の重要性を示している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 04:05:29 GMT)
When, Where, and What? An Novel Benchmark for Accident Anticipation and Localization with Large Language Models [14.1] 本研究では,複数の次元にわたる予測能力を高めるために,LLM(Large Language Models)を統合した新しいフレームワークを提案する。
複雑な運転シーンにおけるリスクの高い要素の優先順位を動的に調整する,革新的なチェーンベースアテンション機構を開発した。
DAD, CCD, A3Dデータセットの実証的検証は平均精度(AP)と平均時間到達精度(mTTA)において優れた性能を示す
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:29:49 GMT)
Probing Perfection: The Relentless Art of Meddling for Pulmonary Airway Segmentation from HRCT via a Human-AI Collaboration Based Active Learning Method [13.4] 肺気管分節症では, 注記データの不足が主訴である。
ディープラーニング(DL)メソッドは、'ブラックボックス'モデルの不透明さとパフォーマンス向上の必要性という課題に直面します。
多様なクエリ戦略とさまざまなDLモデルを組み合わせることで、これらの課題に対処する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:16:22 GMT)
Fréchet Video Motion Distance: A Metric for Evaluating Motion Consistency in Videos [13.4] 映像生成における動きの整合性を評価することを目的としたFr'echet Video Motion Distanceメトリックを提案する。
具体的には、キーポイント追跡に基づく明示的な動作特徴を設計し、Fr'echet距離を用いてこれらの特徴間の類似度を測定する。
我々は大規模な人間の研究を行い、我々の測定値が時間的ノイズを効果的に検出し、既存の測定値よりも生成された映像品質の人間の知覚とよく一致していることを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:10:50 GMT)
Automated Security Response through Online Learning with Adaptive Conjectures [13.3] 我々はITインフラに対する自動セキュリティ対応について研究する。
我々は攻撃者とディフェンダーとの相互作用を部分的に観察された非静止ゲームとして定式化する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:50:09 GMT)
Quantifying the Role of Textual Predictability in Automatic Speech Recognition [13.3] 音声認識研究における長年の疑問は、エラーを音響をモデル化するモデルの能力にどのように属性付けるかである。
テキストの相対的予測可能性の関数として誤り率をモデル化する新しい手法を検証する。
本稿では,ASRの診断と改善において,このアプローチがいかに簡単に利用できるかを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:47:25 GMT)
A Multi-view Mask Contrastive Learning Graph Convolutional Neural Network for Age Estimation [13.2] 本稿では,年齢推定のためのマルチビューマスクコントラスト学習グラフ畳み込みニューラルネットワーク(MMCL-GCN)を提案する。
MMCL-GCNネットワークの全体構造は特徴抽出段階と年齢推定段階を含む。
MMCL-GCNは,ベンチマークデータセットの年齢推定誤差を効果的に低減できることを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:17:46 GMT)
Towards scalable efficient on-device ASR with transfer learning [13.1] 転送学習のための多言語事前学習は、低リソース単言語ASRモデルのロバスト性を大幅に向上させる。
我々の発見は、RNNT-loss pretrainingに続いて、MinWER(Minmum Word Error Rate)による単言語微調整により、イタリア語やフランス語などの言語での単語誤り率(WER)が一貫して減少することを示している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:29:02 GMT)
Navigating Uncertainty in Medical Image Segmentation [13.1] 医用画像における不確実なセグメンテーション手法の選択と評価に対処する。
前立腺分節化(prestate segmentation)という2つのケーススタディを提示し、最小限のアノテータ変動に対して単純な決定論的モデルでは十分であることを示した。
その結果,不確実なセグメンテーションモデルを正確に選択し,開発するためのガイドラインが導かれた。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 10:21:18 GMT)
A Coarse-to-Fine Place Recognition Approach using Attention-guided Descriptors and Overlap Estimation [13.0] 位置認識のための新しい粗大なアプローチを提案する。
粗い段階では、注意誘導ネットワークを用いて注意誘導記述子を生成する。
次に、素早い親和性に基づく候補選択プロセスを用いて、Top-Kの最も類似した候補を特定する。
細かな段階では、狭められた場所候補同士のペアの重複を推定し、最終一致を決定する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:40:36 GMT)
A Comprehensive Survey on Root Cause Analysis in (Micro) Services: Methodologies, Challenges, and Trends [12.8] 本調査は根本原因分析(RCA)技術に関する総合的かつ構造化されたレビューを提供することを目的としている。
メトリクス、トレース、ログ、マルチモデルデータを含む方法論を探求する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:02:49 GMT)
A Simulation Benchmark for Autonomous Racing with Large-Scale Human Data [12.8] 本稿では,自動走行アルゴリズムの試験,検証,ベンチマークを行うためのシミュレータAssetto Corsaに基づくレースシミュレーションプラットフォームを提案する。
私たちのコントリビューションには、このシミュレーションプラットフォームの開発、レース環境に適した最先端のアルゴリズムのいくつか、人間ドライバーから収集された包括的なデータセットなどが含まれています。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:45:16 GMT)
A Tale of Two DL Cities: When Library Tests Meet Compiler [12.8] DLライブラリのテスト入力からドメイン知識を抽出するOPERAを提案する。
OPERAはDLライブラリの様々なテストインプットから様々なテストを構築する。
多様性に基づくテストの優先順位付け戦略を取り入れて、これらのテストインプットを移行し実行します。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:35:45 GMT)
AI-Enhanced 7-Point Checklist for Melanoma Detection Using Clinical Knowledge Graphs and Data-Driven Quantification [12.6] 7-point checklist (7PCL) は, 緊急医療的注意を要する悪性黒色腫病変の同定に広く用いられている。
主要な属性はそれぞれ2ポイントの価値があり、マイナーなものは1ポイントの価値がある。
現在の方法の大きな制限は属性の均一な重み付けであり、それによって不正確さが生まれ、相互接続を無視する。
臨床知識ベーストポロジカルグラフ(CKTG)とデータ駆動重み付け標準を用いた勾配診断戦略(GDDDW)の2つの革新的な要素を統合した新しい診断手法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 20:27:16 GMT)
Uncertainty-Aware Deep Neural Representations for Visual Analysis of Vector Field Data [12.6] 定常ベクトル場を効果的にモデル化するために,不確実性を考慮した暗黙的ニューラル表現を開発する。
いくつかのベクトルデータセットを用いて詳細な探索を行ったところ、不確実性を考慮したモデルがベクトル場の特徴の情報可視化結果を生成することが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 01:59:58 GMT)
Masked Graph Learning with Recurrent Alignment for Multimodal Emotion Recognition in Conversation [12.5] 対話におけるマルチモーダル感情認識(MERC)は、世論監視、インテリジェントな対話ロボット、その他の分野に適用することができる。
従来の作業では、マルチモーダル融合前のモーダル間アライメントプロセスとモーダル内ノイズ情報を無視していた。
我々は,MGLRA(Masked Graph Learning with Recursive Alignment)と呼ばれる新しい手法を開発し,この問題に対処した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:23:51 GMT)
Machine Translation Hallucination Detection for Low and High Resource Languages using Large Language Models [12.4] 本稿では,Large Language Models (LLM) を用いた幻覚検出手法と多言語埋め込みにおける意味的類似性について述べる。
LLMは、いかなる機械翻訳タスクに対しても明示的に訓練されていないにもかかわらず、以前提案されたモデルと同等またはそれ以上の性能を達成することができる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:40:54 GMT)
AMONGAGENTS: Evaluating Large Language Models in the Interactive Text-Based Social Deduction Game [12.4] 本論文は、シミュレーション環境における人間の行動のプロキシの作成に焦点をあて、シミュレーション環境における人間の行動を研究するためのツールとして、textitAmong Usを用いた。
この環境下では、シミュレートされた言語エージェントの挙動を解析する。
我々の研究は、最先端の大規模言語モデル(LLM)がゲームルールを効果的に把握し、現在の状況に基づいて意思決定できることを示した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:34:38 GMT)
Data-driven Multistage Distributionally Robust Linear Optimization with Nested Distance [11.7] サンプルパスに時間一貫性があり,適切に定義された,最適なロバストポリシを見出す。
凸最適化手法を用いて,値関数を効率的に計算できる場合の抽出可能なケースを同定する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:49:22 GMT)
Aster: Fixing the Android TEE Ecosystem with Arm CCA [11.6] Androidエコシステムは、悪意のあるアプリやAndroidバグからセキュリティに敏感なサービスを分離するためにTrustZoneに依存している。
サンドボックス化された実行では,サンドボックス,Android,ハイパーバイザ,セキュアなワールドメモリにアクセスできないサンドボックスサービスを提案する。
サンドボックス化された実行がAndroidと通信してインプットを取得し、出力を安全に提供できることを保証しながら、これらの目標を達成するAsterを紹介します。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:57:36 GMT)
Weakly Supervised Gaussian Contrastive Grounding with Large Multimodal Models for Video Question Answering [11.2] Video Question(ビデオQA)は、ビデオで観察される情報に基づいて、自然言語の質問に答えることを目的としている。
視覚的な入力として疑問クリティカルな瞬間に答えを推論するために,LMMを強制する,弱い教師付きフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 10:17:39 GMT)
Minimax Optimality of Score-based Diffusion Models: Beyond the Density Lower Bound Assumptions [11.2] カーネルベースのスコア推定器は$widetildeOleft(n-1 t-fracd+22(tfracd2 vee 1)rightの最適平均二乗誤差を達成する
核を用いたスコア推定器は,拡散モデルで生成した試料の分布の総変動誤差に対して,極小ガウスの下での最大平均2乗誤差を$widetildeOleft(n-1/2 t-fracd4right)$上界で達成することを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:00:52 GMT)
Towards Understanding the Bugs in Solidity Compiler [11.2] 本稿では,533のSolidityコンパイラのバグに関する最初の系統的研究について述べる。
本研究は, その特徴(症状, 根本原因, 分布など)とトリガー試験例について検討した。
次に,Solidityコンパイラファザの限界について検討するため,Solidityコンパイラファザを3つ評価した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 05:47:18 GMT)
Comparison of Static Application Security Testing Tools and Large Language Models for Repo-level Vulnerability Detection [11.1] 静的アプリケーションセキュリティテスト(SAST)は通常、セキュリティ脆弱性のソースコードをスキャンするために使用される。
ディープラーニング(DL)ベースの手法は、ソフトウェア脆弱性検出の可能性を実証している。
本稿では,ソフトウェア脆弱性を検出するために,15種類のSASTツールと12種類の最先端のオープンソースLLMを比較した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:21:14 GMT)
Recent Advances in Generative AI and Large Language Models: Current Status, Challenges, and Perspectives [10.2] 生成人工知能(AI)と大規模言語モデル(LLM)の出現は、自然言語処理(NLP)の新しい時代を象徴している。
本稿では,これらの最先端技術の現状を概観し,その顕著な進歩と広範囲な応用を実証する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:07:28 GMT)
Differentiable Product Quantization for Memory Efficient Camera Relocalization [10.0] 我々は,記述子量子化-復号化を行う軽量シーン固有オートエンコーダネットワークをエンドツーエンドの微分可能な方法で訓練する。
その結果,1MBのローカルディスクリプタメモリでは,提案したネットワークとマップ圧縮の相乗的組み合わせが最高の性能を発揮することがわかった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:34:55 GMT)
Augmented Efficiency: Reducing Memory Footprint and Accelerating Inference for 3D Semantic Segmentation through Hybrid Vision [10.0] 本稿では,2次元と3次元のコンピュータビジョン技術を組み合わせた3次元セマンティックセグメンテーションの新たなアプローチを提案する。
我々は3次元点雲にリンクしたRGB画像に対して2Dセマンティックセマンティックセマンティックセマンティクスを行い、その結果をクラスラベルの押出手法を用いて3Dに拡張する。
このモデルは、KITTI-360データセット上の最先端の3Dセマンティックセマンティックセグメンテーションモデルとして機能する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 00:04:10 GMT)
ITERTL: An Iterative Framework for Fine-tuning LLMs for RTL Code Generation [9.4] 大規模言語モデル(LLM)は、人間の命令を理解し、コードを生成するのに優れた性能を示した。
我々は,ITERTLという,シンプルながら効果的な反復訓練パラダイムを導入する。
提案手法によってトレーニングされたモデルは、最先端のオープンソースモデル(SOTA)と競合し、さらに優れていることを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:08:45 GMT)
Shape-biased Texture Agnostic Representations for Improved Textureless and Metallic Object Detection and 6D Pose Estimation [9.2] テクスチャレスおよびメタリックオブジェクトは、CNNの視覚的手がかりやテクスチャバイアスが少ないため、依然として重要な課題である。
形状バイアスをCNNトレーニングに誘導する手法を提案する。
この手法は、シームレスなデータレンダリングと、一貫性のあるテクスチャ面のないトレーニングデータの結果を可能にする。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:18:48 GMT)
Improving Depth Gradient Continuity in Transformers: A Comparative Study on Monocular Depth Estimation with CNN [9.2] 我々は、トランスフォーマーとCNNの区別を対照的に分析するために、スパースピクセルアプローチを採用している。
以上の結果から,トランスフォーマーはグローバルな文脈や複雑なテクスチャを扱うのに優れるが,CNNより遅れて奥行き勾配の連続性を保っていることが示唆された。
本稿では,高次微分,特徴融合,再校正による深度推定を改良したDGRモジュールを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:40:10 GMT)
From Category to Scenery: An End-to-End Framework for Multi-Person Human-Object Interaction Recognition in Videos [9.2] ビデオベースのヒューマンオブジェクトインタラクション(HOI)認識は、人間とオブジェクトの間の複雑なダイナミクスを探索する。
本研究では,シーンフレームワークCATSに新たなエンドツーエンドカテゴリを提案する。
我々は,これらの拡張幾何学的視覚的特徴をノードとして構成し,人間とオブジェクトのカテゴリ間の関係を学習する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:10:28 GMT)
Kernel Memory Networks: A Unifying Framework for Memory Modeling [9.1] 我々は、ニューラルネットワークをトレーニングして、最大ノイズロバスト性を持つパターンの集合を格納する問題を考察する。
解は、各ニューロンにカーネル分類または最小重量ノルムの実行を訓練することで導出される。
我々は、カーネルメモリネットワークと呼ばれる最適なモデル、特に、異種および自己連想型メモリモデルの多くを含むものを導出する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:09:17 GMT)
Enhancing Encrypted Internet Traffic Classification Through Advanced Data Augmentation Techniques [9.0] 本稿では,暗号化されたインターネットトラフィックを分類する上での課題について述べる。
実データからデータを生成するための2つのデータ拡張(DA)手法を提案する。
本手法は,暗号化されたトラフィック分類モデルを大幅に強化することを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:49:17 GMT)
Beyond the Contact: Discovering Comprehensive Affordance for 3D Objects from Pre-trained 2D Diffusion Models [8.9] 我々はComprehensive Affordance(ComA)という新しい余裕表現を導入する。
3Dオブジェクトメッシュが与えられたとき、ComAは相互作用する人間のメッシュにおける相対配向と頂点の近接の分布をモデル化する。
ComAは、連絡先ベースの価格のモデリングにおいて、人間のアノテーションに依存している競争相手よりも優れていることを実証する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:13:21 GMT)
Strategy and Skill Learning for Physics-based Table Tennis Animation [8.5] 本稿では,物理に基づく卓球アニメーションのための戦略とスキル学習手法を提案する。
本手法は,複雑なタスクを実行するために必要な運動能力を完全に活用できないモード崩壊の問題に対処する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:31:13 GMT)
Robust Privacy Amidst Innovation with Large Language Models Through a Critical Assessment of the Risks [8.5] 本研究では, EHRとNLPを大規模言語モデル(LLM)と統合し, 医療データ管理と患者ケアを改善することを目的とした。
バイオメディカル研究のために、高度なモデルを使用して安全でHIPAAに準拠した合成患者ノートを作成することに焦点を当てている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 04:20:14 GMT)
Learning General Continuous Constraint from Demonstrations via Positive-Unlabeled Learning [8.4] 本稿では,実証から連続的,任意の,あるいは非線形な制約を推測する,正の未ラベル(PU)学習手法を提案する。
提案手法の有効性を2つのMujoco環境で検証した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:00:18 GMT)
BIGbench: A Unified Benchmark for Social Bias in Text-to-Image Generative Models Based on Multi-modal LLM [8.2] テキスト・ツー・イメージ(T2I)生成モデルは、複雑で高品質な画像を生成する能力においてより重要になっている。
本稿では,ビジェス・オブ・イメージ・ジェネレーションのための統一ベンチマークであるBIGbenchを,よく設計されたデータセットで紹介する。
既存のベンチマークとは対照的に、BIGbenchは複雑なバイアスを4次元に分類し評価する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:13:42 GMT)
MapsTP: HD Map Images Based Multimodal Trajectory Prediction for Automated Vehicles [8.2] 我々はResNet-50を利用して高精細マップデータから画像の特徴を抽出し、IMUセンサデータを用いて速度、加速度、ヨーレートを計算する。
時間確率ネットワークを用いて潜在的な軌道を計算し、最も正確で高い確率の軌道経路を選択する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:12:12 GMT)
Forecasting Automotive Supply Chain Disruption with Heterogeneous Time Series [8.2] フォードは世界の37の工場で年間17億の部品を使って600万台の車やトラックを製造している。
このような混乱を早期に予測し、特定する能力は、シームレスな操作を維持するために不可欠である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:28:10 GMT)
Using Case Studies to Teach Responsible AI to Industry Practitioners [8.2] 我々は、対話型ケーススタディを用いて、組織的・実践的なエンゲージメントとRAI(Responsible AI)の先進的学習を実現する新しい利害関係者第一の教育手法を提案する。
評価の結果,ワークショップの参加者は,作業にRAIを適用することに対する理解とモチベーションに肯定的な変化があることが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 23:59:20 GMT)
Distribution-Aware Robust Learning from Long-Tailed Data with Noisy Labels [8.1] 実世界のデータは、しばしば長い尾の分布とラベルノイズを示し、一般化性能を著しく低下させる。
近年の研究では,各クラス内の高信頼度サンプルに基づいて,各クラスのセントロイドを推定するノイズの多いサンプル選択手法に焦点が当てられている。
そこで我々は,分散型サンプル選択・コントラスト学習(DaSC)を提案し,拡張型セントロイドを生成する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 19:06:15 GMT)
Synth4Kws: Synthesized Speech for User Defined Keyword Spotting in Low Resource Environments [8.1] テキスト・トゥ・スピーチ(TTS)合成データをカスタムKWSに活用するフレームワークであるSynth4Kwsを紹介する。
TTSフレーズの多様性が増大し,発話サンプリングが単調にモデル性能を向上することがわかった。
我々の実験は英語と単一単語の発話に基づいているが、この結果はi18n言語に一般化されている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 21:05:44 GMT)
TimeInf: Time Series Data Contribution via Influence Functions [8.0] TimeInfは時系列データセットのデータコントリビューション推定手法である。
実験の結果、TimeInfは有害な異常を識別する最先端の手法より優れていることが示された。
TimeInfはデータ値の直感的かつ解釈可能な属性を提供しており、視覚化によって様々な異常パターンを容易に識別することができる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:16:27 GMT)
Matrix majorization in large samples with varying support restrictions [8.0] 大規模試料および触媒系におけるマトリックスの偏化について検討した。
量子熱力学における触媒状態変換理論の応用を見いだす。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:37:17 GMT)
MOMAland: A Set of Benchmarks for Multi-Objective Multi-Agent Reinforcement Learning [7.8] 多目的多エージェント強化学習(MOMARL)は、学習プロセスにおいて複数の目的を考慮する必要がある複数のエージェントによる問題に対処する。
MOAlandは、多目的マルチエージェント強化学習のための標準化された環境の最初のコレクションである。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:05:06 GMT)
Integrating Meshes and 3D Gaussians for Indoor Scene Reconstruction with SAM Mask Guidance [7.8] 本稿では,3次元ガウススプラッティング(3DGS)とメッシュ表現を組み合わせた3次元屋内シーン再構築手法を提案する。
壁や天井,床などの屋内シーンの室内レイアウトにはメッシュを使用し,他のオブジェクトには3Dガウスアンを採用しています。
メッシュと3Dガウスの合同トレーニングは、どのプリミティブがレンダリング画像のどの部分に影響を与えるべきかが明確でないため、難しい。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 04:39:04 GMT)
Identifiable latent bandits: Combining observational data and exploration for personalized healthcare [7.7] Banditのアルゴリズムは、パーソナライズされた意思決定を改善することを約束している。
ほとんどの健康アプリケーションでは、各患者に新しいバンディットを適合させることは不可能であり、観察可能な変数はしばしば最適な治療法を決定するのに不十分である。
潜伏帯域は、文脈変数が明らかにできる範囲を超えて、迅速な探索とパーソナライズの両方を提供する。
本稿では, 非線形独立成分分析に基づく帯域幅アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:26:38 GMT)
A Geometry-Aware Algorithm to Learn Hierarchical Embeddings in Hyperbolic Space [7.7] ハイパーボリック埋め込みは、データがツリーのようなグラフとして抽象化される場合、競合的なパフォーマンスを提供する。
実際、双曲空間とユークリッド空間の間の幾何学の違いから、階層データの双曲埋め込みを学習することは困難である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:56:59 GMT)
Aggregated Attributions for Explanatory Analysis of 3D Segmentation Models [7.4] 本稿では,セグメンテーションモデルの予測の微細なボクセル属性を集約する手法であるAgg2Expを紹介する。
実験により,勾配に基づくボクセル属性は摂動に基づく説明よりもモデルの予測に忠実であることが示された。
Agg2Expは、予測性能以上の大きなセグメンテーションモデルの説明分析を容易にする。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:14:01 GMT)
FairFlow: An Automated Approach to Model-based Counterfactual Data Augmentation For NLP [7.4] 本稿では,FairFlowを提案する。FairFlowは,逆ファクトテキスト生成モデルの学習のための並列データの自動生成手法である。
FairFlowは優れた性能を維持しつつ辞書ベースの単語置換手法の限界を大幅に克服することを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:29:37 GMT)
Trust Your Gut: Comparing Human and Machine Inference from Noisy Visualizations [7.3] 人間の直観が理想的な統計的合理性を超えたシナリオを考察する。
その結果,合理性から外れた場合でも,可視化に対するアナリストの反応が有利である可能性が示唆された。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 22:39:57 GMT)
BONES: a Benchmark fOr Neural Estimation of Shapley values [7.2] 本稿では、Shapley Valueのニューラルネットワーク推定に焦点を当てた新しいベンチマークであるBONESを紹介する。
BONESは研究者たちに、最先端のニューラルおよび従来の推定器のスイートを提供する。
目的は、XAIモデルの使用、評価、比較を単純化することである。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:53:22 GMT)
Will the Real Linda Please Stand up...to Large Language Models? Examining the Representativeness Heuristic in LLMs [7.1] 大規模言語モデル(LLM)は、テキストをモデル化し、人間に似たテキストを生成するのに顕著な能力を示した。
LLMは、代表性と呼ばれる人間の意思決定において共通の認知的罠に感受性がある。
本研究は, LLM推論における代表性の影響について検討する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:41:57 GMT)
AutoGPT+P: Affordance-based Task Planning with Large Language Models [6.8] AutoGPT+Pは、余裕に基づくシーン表現と計画システムを組み合わせたシステムである。
提案手法は,現在最先端のLCM計画手法であるSayCanの81%の成功率を超え,98%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:56:03 GMT)
CeCNN: Copula-enhanced convolutional neural networks in joint prediction of refraction error and axial length based on ultra-widefield fundus images [6.8] 本稿では,CeCNNを用いて,球面等価性(SE)測定と高近視診断を共同で予測する手法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:27:37 GMT)
FCNR: Fast Compressive Neural Representation of Visualization Images [6.6] 我々は,何万もの可視化画像に対する高速圧縮ニューラル表現であるFCNRを提案する。
FCNRはステレオ画像圧縮の最近の進歩に基づき、ステレオコンテキストモジュールとジョイントコンテキスト転送モジュールを同化して画像ペアを圧縮する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 10:34:02 GMT)
Optimizing Multicarrier Multiantenna Systems for LoS Channel Charting [6.6] チャネルチャート(CC)は、生のチャネル観測の空間と、近接点がユーザ機器(UE)のチャネルと空間的に近接する低次元空間の間のマッピングを学習する。
このマッピングを学習する様々な方法のなかには、チャネルベクトル間の距離測定に依存するものもある。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:39:54 GMT)
TEXT2AFFORD: Probing Object Affordance Prediction abilities of Language Models solely from Text [6.6] 事前学習言語モデル(LM)と事前学習型ビジョンランゲージモデル(VLM)における対象値の知識について検討する。
文献の増大は、PTLMが矛盾なく非意図的に失敗し、推論と根拠の欠如を示していることを示している。
Text2Affordは15のアプライアンスクラスを特徴とする,新しい,包括的なオブジェクトアプライアンスデータセットをキュレートする。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:07:40 GMT)
DOPRA: Decoding Over-accumulation Penalization and Re-allocation in Specific Weighting Layer [6.4] 大規模言語モデル(MLLM)における幻覚を緩和する新しいアプローチであるDOPRAを紹介する。
DOPRAは、復号処理中に12層のような特定の層で重み付けされたオーバーレイペナルティと再分配の戦略を採用している。
全体として、DOPRAはMLLMの出力品質を改善するための重要な一歩である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:30:57 GMT)
Theoretical Analysis of Privacy Leakage in Trustworthy Federated Learning: A Perspective from Linear Algebra and Optimization Theory [6.3] フェデレーション学習は、データのプライバシを保ちながら協調的なモデルトレーニングのための有望なパラダイムとして登場した。
近年の研究では、データ再構成攻撃など、さまざまなプライバシ攻撃に対して脆弱であることが示されている。
本稿では,線形代数と最適化理論という2つの観点から,フェデレート学習におけるプライバシー漏洩の理論解析を行う。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:23:38 GMT)
Decoding Digital Influence: The Role of Social Media Behavior in Scientific Stratification Through Logistic Attribution Method [6.3] 本研究では,ソーシャルメディアが科学的階層化と移動性に与える影響を包括的に分析する。
メソレベルの視点から説明可能なロジスティック分析を用いて、ソーシャルメディアの行動と科学的社会的成層との相関を探索する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:01:40 GMT)
Artificial Intelligence in Extracting Diagnostic Data from Dental Records [6.1] 本研究は, 未構造化テキストから診断情報を抽出することにより, 歯科記録に欠落する構造データの問題に対処する。
我々は、GPT-4を利用した高度なAIおよびNLP手法を用いて、RoBERTaモデルの微調整のための合成ノートを生成する。
2つのデータセットからランダムに選択した120個の臨床ノートを用いてモデルの評価を行い,診断精度の向上を実証した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 04:05:48 GMT)
Cross-lingual Argument Mining in the Medical Domain [6.0] 注釈付きデータがない医療用テキストでArgument Mining(AM)を実行する方法を示す。
我々の研究は、アノテーション(データ転送)を英語から特定のターゲット言語に自動翻訳・投影することは、注釈付きデータを生成する効果的な方法であることを示している。
また、スペイン語で自動生成されたデータを用いて、元の英語単言語設定の結果を改善する方法も示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:17:35 GMT)
Interpolation-Split: a data-centric deep learning approach with big interpolated data to boost airway segmentation performance [6.0] 気道のセグメンテーションは 気道全体の輪郭を作るのに 重要な役割を担っています
本研究では,気道木を分割するデータ中心の深層学習手法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:02:52 GMT)
On Differentially Private 3D Medical Image Synthesis with Controllable Latent Diffusion Models [6.0] 本研究は, 短軸視における3次元心筋MRI像の課題に対処するものである。
医用属性に条件付き合成画像を生成する潜在拡散モデルを提案する。
UK Biobankデータセットに差分プライバシでモデルを微調整します。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:49:58 GMT)
Hierarchical accompanying and inhibiting patterns on the spatial arrangement of taxis' local hotspots [5.9] 本研究は,中国武漢市と北京市において,タクシーの軌跡データを用いて,微粒な局部ホットスポットの空間配置を定量的に検討した。
人気のホットスポットは一般的にあまり人気のないホットスポットに囲まれているが、人気のあるホットスポットが多い地域では人気が低いホットスポットの存在を妨げている。
両方のパターンに触発されて、これらの関係を記述するためにKNNベースのモデルが開発され、最もポピュラーでないホットスポットの空間分布を再現することに成功した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:47:20 GMT)
Advanced AI Framework for Enhanced Detection and Assessment of Abdominal Trauma: Integrating 3D Segmentation with 2D CNN and RNN Models [5.8] 本研究は, 腹部外傷診断の高速化と精度向上を目的として, 人工知能(AI)と機械学習(ML)の応用について検討した。
我々は、診断性能を向上させるために、3Dセグメント化、2D畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)を組み合わせた高度なAIモデルを開発した。
本モデルでは腹部CTでリアルタイム, 正確な評価を行い, 臨床診断と患者成績の改善を図る。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 04:18:34 GMT)
Articulation Work and Tinkering for Fairness in Machine Learning [5.5] コンピュータ科学と社会志向・学際研究(SOI)の緊張関係について検討する。
公正なAIの場合、有効な研究に必要なタスク、リソース、アクターを分析します。
CS研究者はある程度SOIに携わるが、組織的条件、調音作業、社会世界のあいまいさはSOI研究の実施可能性を制限する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:11:12 GMT)
MambaMixer: Efficient Selective State Space Models with Dual Token and Channel Selection [5.4] MambaMixerは、トークンとチャネル間の二重選択機構を使用する、データ依存の重みを持つ新しいアーキテクチャである。
概念実証として,Vision MambaMixer (ViM2) とTime Series MambaMixer (TSM2) を設計した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 21:33:06 GMT)
MiranDa: Mimicking the Learning Processes of Human Doctors to Achieve Causal Inference for Medication Recommendation [5.3] 病院における在院期間(ELOS)を推定できる最初の行動可能なモデルであるMiranDaを提案する。
詳しくは、MiranDaは、ELOSによってシフトされた2つの勾配スケーリングフェーズを通じて、医師の教育軌道をエミュレートする。
Intensive Care III データセットとIV データセットのための医療情報マートの評価では,5つの指標にまたがって,我々のモデルの優れた結果が示された。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 01:08:57 GMT)
PlantTrack: Task-Driven Plant Keypoint Tracking with Zero-Shot Sim2Real Transfer [4.9] 植物の特徴の追跡は、表現型付け、刈り取り、収穫などの様々な農業作業に不可欠である。
そこで我々は,DINOv2を用いて高次元特徴を提供するPlantTrackを提案し,キーポイントヒートマップ予測ネットワークを訓練する。
キーポイント予測器を訓練するための20個の合成画像を用いて,実環境における植物の特徴を効果的に追跡できるゼロショットSim2Real転送を実現する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 20:40:17 GMT)
Advances in Land Surface Model-based Forecasting: A comparative study of LSTM, Gradient Boosting, and Feedforward Neural Network Models as prognostic state emulators [4.9] 地表面プロセスのシミュレーションによる実験研究の高速化における3つの代理モデルの効率性を評価する。
以上の結果から, LSTMネットワークは, 予測期間を経た平均モデル全体の精度は高いが, 慎重に調整した場合は, 大陸の長距離予測に優れることがわかった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:26:05 GMT)
Is 3D Convolution with 5D Tensors Really Necessary for Video Analysis? [4.8] 本稿では,4次元および/または3次元テンソルのみを用いた2次元および/または1次元畳み込みを用いた3次元畳み込みブロックの実装手法を提案する。
私たちのモチベーションは、5Dテンソルを用いた3Dコンボリューションが計算コストが高く、ロボットなどのリアルタイムアプリケーションで使用されるエッジデバイスではサポートされないことです。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:30:51 GMT)
A Survey of Text Style Transfer: Applications and Ethical Implications [4.7] テキストスタイル転送(TST)は、テキストのスタイルに依存しない内容を変更することなく、丁寧さ、形式性、感情など、言語使用の選択された属性を制御することを目的としている。
本稿では,従来の言語アプローチと近年のディープラーニング手法の両方を用いて,長年にわたって研究されてきたTST応用の総合的なレビューを行う。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:15:23 GMT)
Subgraph-Aware Training of Text-based Methods for Knowledge Graph Completion [4.7] 微調整事前学習言語モデル(PLM)は、最近知識グラフ補完(KGC)を改善する可能性を示している。
我々は, (i) サブグラフ認識のミニバッチを併用して, (ii) ハードネガティブサンプリングを促進するためのサブグラフ認識学習フレームワークKGC(SATKGC) と, (ii) ハードエンティティとハードネガティブトリプルにもっと焦点を合わせるための新しいコントラスト学習手法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:26:30 GMT)
Deformable Convolution Based Road Scene Semantic Segmentation of Fisheye Images in Autonomous Driving [4.7] 本研究では,近代的変形可能な畳み込みニューラルネットワーク(DCNN)のセマンティックセグメンテーションタスクへの応用について検討する。
実験では,WoodScapeの魚眼画像データセットを10種類の異なるクラスに分割し,複雑な空間関係を捉えるデフォルマブルネットワークの能力を評価する。
変形可能なCNNの統合によるmIoUスコアの大幅な改善は、魚眼画像に存在する幾何歪みを扱う上での有効性を示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:02:24 GMT)
A Dataset for Crucial Object Recognition in Blind and Low-Vision Individuals' Navigation [4.4] 本稿では,視覚障害者や視覚障害者のナビゲーション作業を支援するリアルタイム物体認識システムを構築するためのデータセットを提案する。
このデータセットは、屋外空間をナビゲートするBLV個体の21の動画と、焦点グループによる研究によって改善されたBLVナビゲーションに不可欠な90のオブジェクトの分類から成っている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:19:27 GMT)
Do LLMs Know When to NOT Answer? Investigating Abstention Abilities of Large Language Models [4.4] 無視能力 (Abstention Aabilities, AA) とは、大きな言語モデル(LLM)が、不確実な場合や確定的な回答ができない場合の回答を控える能力である。
そこで本研究では,多目的QAタスクにおけるLCMのAAを検証し,理解するためのブラックボックス評価手法を提案する。
以上の結果から, GPT-4のような最先端のLCMでさえ, 棄権に苦しむ一方で, 戦略的なプロンプトは, この能力を著しく向上させる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:56:54 GMT)
From Text to Insight: Large Language Models for Materials Science Data Extraction [4.1] 科学知識の大部分は、構造化されていない自然言語に存在する。
構造化データは革新的で体系的な材料設計に不可欠である。
大きな言語モデル(LLM)の出現は、大きな変化を示している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 22:23:47 GMT)
The Computational Advantage of MIP* Vanishes in the Presence of Noise [4.0] エンタングルメント MIP* を持つ量子マルチプロペラ対話型証明システムは、古典的な MIP よりもはるかに強力である。
QinとYao '21と'23の最近の研究は、プローサの共有状態がノイズを含む場合、この利点は著しく減少することを示した。
提案手法では,各EPR状態が任意に小さなノイズ量で影響を受ける場合,その複雑性クラスはNEXP = MIPと等価であることを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:51:20 GMT)
Large Language Models Lack Understanding of Character Composition of Words [4.0] 大規模言語モデル(LLM)は、幅広い自然言語処理において顕著な性能を示した。
これらの課題の多くは、人間が完璧に扱える簡単なタスクでさえ、確実に実行できないことが示されています。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:39:06 GMT)
Federated Learning for Face Recognition via Intra-subject Self-supervised Learning [4.0] 対象を含まない顔認識モデルを学習するためのFedFS (Federated Learning for Personal Face Recognition via intra-ject Self-supervised Learning framework)を提案する。
FedFSは、ローカルモデルとグローバルモデルの集約された特徴を活用して、オフザシェルフモデルの表現に協力する2つの重要なコンポーネントから構成される。
我々は,DigiFace-1MおよびVGGFaceデータセットの総合的な実験を行い,従来の手法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:43:42 GMT)
Towards Effective Fusion and Forecasting of Multimodal Spatio-temporal Data for Smart Mobility [3.8] ディープラーニングベースの手法は、スマートモビリティやスマートシティ、その他のインテリジェント交通システムといった分野において、下流タスクをサポートするために相関関係を学習する。
その効果にもかかわらず、STデータ融合と予測手法は現実のシナリオにおいて実践的な課題に直面している。
本稿では,現実の様々な応用の課題を探求する最近の研究を紹介するとともに,今後の研究分野におけるオープンな課題の確立について述べる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:08:22 GMT)
MCTS Based Dispatch of Autonomous Vehicles under Operational Constraints for Continuous Transportation [3.8] 本稿では、MCTSベースのディスパッチプランナFlow-Achieving Scheduling Tree(FAST)を活用して、ディスパッチ計画に運用上の制約満足度を組み込む。
MCTSジェネレータモデルを利用することで、コストの明示的な定式化を回避し、機会コストを導出する。
4種類の運用制約による実験的研究は、制約満足度に対する機会コストの活用の成功を実証している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:06:16 GMT)
Adapting Multilingual LLMs to Low-Resource Languages with Knowledge Graphs via Adapters [3.7] 本稿では,言語から多言語大モデル(LLM)へのグラフ知識の統合について検討する。
我々は、感情分析(SA)および名前付きエンティティ認識(NER)における低リソース言語(LRL)の性能向上のために、言語固有のアダプタを使用している。
構造化グラフ知識が,SA および NER における LRL の多言語 LLM の性能に与える影響を評価する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:51:12 GMT)
Inferring turbulent velocity and temperature fields and their statistics from Lagrangian velocity measurements using physics-informed Kolmogorov-Arnold Networks [3.7] 実験乱流速度データから隠れた温度場を推定するためのAIVT法を提案する。
具体的には、AIVTは物理インフォームされたコルモゴロフ・アルノルドネットワーク(ニューラルネットワークではない)に基づいており、複合損失関数の最適化によって訓練されている。
乱流の直接数値シミュレーション (DNS) に匹敵する忠実度でスパース実験データから連続的, 即時的な速度場と温度場を再構成し, 推定できることを実証した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:19:18 GMT)
Probing the Information Theoretical Roots of Spatial Dependence Measures [3.7] 空間依存度とエントロピーの情報理論測度との間には関係がある。
自己情報レンズによる空間自己相関の理論的根源を探る。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:50:18 GMT)
A Kernel-Based Conditional Two-Sample Test Using Nearest Neighbors (with Applications to Calibration, Regression Curves, and Simulation-Based Inference) [3.6] 本稿では,2つの条件分布の違いを検出するカーネルベースの尺度を提案する。
2つの条件分布が同じである場合、推定はガウス極限を持ち、その分散はデータから容易に推定できる単純な形式を持つ。
また、条件付き適合性問題に適用可能な推定値を用いた再サンプリングベースのテストも提供する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:04:38 GMT)
A study of animal action segmentation algorithms across supervised, unsupervised, and semi-supervised learning paradigms [3.6] 本稿では,教師付き深層ニューラルネットワークと教師なしグラフィカルモデルとのギャップを埋める半教師付きアクションセグメンテーションモデルを提案する。
時間的情報を加えることで、完全に管理された時間的畳み込みネットワークが、すべてのデータセットで監視されたメトリクスで最高のパフォーマンスを発揮することが分かりました。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:22:16 GMT)
An Exploratory Study on Automatic Identification of Assumptions in the Development of Deep Learning Frameworks [3.5] 既存の仮定管理のためのアプローチとツールは通常、仮定のマニュアル識別に依存する。
我々はKerasとGitHubリポジトリから収集された仮定の新しい最大データセット(AssuEval)を構築しました。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 00:50:15 GMT)
SPLAT: A framework for optimised GPU code-generation for SParse reguLar ATtention [3.4] MHSA(Multi-head-self-attention)メカニズムは、自然言語処理や視覚タスクにまたがって、最先端のSOTA(State-of-the-art)パフォーマンスを実現する。
このボトルネックを回避するために、研究者は様々なスパースMHSAモデルを提案しており、そこでは注意のサブセットが計算されている。
現在のスパースライブラリとコンパイラは、その基盤となるスパースフォーマットのため、多様なスパース-MHSAパターンの高性能実装をサポートしていない。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 21:18:07 GMT)
Chemical Reaction Extraction from Long Patent Documents [3.4] ChemPatKBは、先行技術検索を支援し、ドメインの専門家が化合物合成とユースケースの新しいイノベーションを探求するためのプラットフォームを提供するために使用できる。
このKBの基本的な構成要素は、長い特許文書から重要な反応スニペットを抽出することである。
本研究では,反応資源データベースを作成するために化学特許から反応を抽出する問題について検討する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:11:47 GMT)
TAMIGO: Empowering Teaching Assistants using LLM-assisted viva and code assessment in an Advanced Computing Class [3.4] 本稿では,ビバとコードアセスメントを用いた指導支援システムにおける大規模言語モデルの適用について検討する。
我々は,プログラミング課題を評価するためのLLMベースのTAMシステムであるTAMIGOを開発した。
我々は, LLM生成ビバ質問の品質, モデル回答, ビバ回答に対するフィードバック, 学生コード提出に対するフィードバックを評価した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 19:12:13 GMT)
DC is all you need: describing ReLU from a signal processing standpoint [3.3] 本稿では,一般的なアクティベーション機能であるReLUのスペクトル挙動について検討する。
我々は、ReLUが信号と定数DC成分に高周波数発振を導入することを実証した。
我々は,CNNの表現におけるReLUによって導入されたDC成分の役割を実験的に検討した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:09:40 GMT)
Empirical analysis of Binding Precedent efficiency in the Brazilian Supreme Court via Similar Case Retrieval [3.3] 我々は,最高級裁判所において,第11,第14,第17,第26,第37の5回の拘束前例の法的影響を実証的に評価した。
類似事例検索における自然言語処理手法の比較を行った。
我々は,特定の類似事例検索タスクにおいて,ディープラーニングモデルが著しく悪化したことを観察した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:20:45 GMT)
Representation Magnitude has a Liability to Privacy Vulnerability [3.3] 本稿では,会員のプライバシー漏洩を軽減するためのプラグインモデルレベルのソリューションを提案する。
我々のアプローチは、一般化性を維持しながらモデルのプライバシの脆弱性を改善する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 04:13:52 GMT)
Assessing In-context Learning and Fine-tuning for Topic Classification of German Web Data [3.3] トピック関連コンテンツの検出をバイナリ分類タスクとしてモデル化する。
トピックごとの注釈付きデータポイントはわずか数百で、ドイツの3つのポリシーに関連するコンテンツを検出する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:31:59 GMT)
TookaBERT: A Step Forward for Persian NLU [3.3] ペルシャのデータを使って2つの新しいBERTモデルをトレーニングし導入する。
14種類のペルシアの自然言語理解(NLU)タスクにまたがる既存の7つのモデルと比較する。
我々のより大きなモデルは競争に勝り、少なくとも2.8ポイントの平均的な改善を示している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:12:47 GMT)
Optimization of deterministic photonic graph state generation via local operations [3.2] 本稿では,状態の局所的クリフォード等価度と生成コストパラメータのグラフ理論的相関に基づくプロトコルの最適化手法を提案する。
任意の大きなリピータグラフ状態を生成するために、2量子ゲートを使用する場合、50%の削減を実現し、ランダムな高密度グラフを生成するために、合計ゲート数も同様に大幅に削減する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 21:11:07 GMT)
ExaWorks Software Development Kit: A Robust and Scalable Collection of Interoperable Workflow Technologies [3.2] 不均一な科学的発見は、ますます高性能なコンピューティングプラットフォーム上での実行を必要としている。
私たちはExaWorks Software Development Kit(SDK)の開発でこの問題に対処することに貢献しました。
SDKは、現在のベストプラクティスに従って開発された一連のワークフロー技術であり、特にHPCプラットフォームで動作するように設計されている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:00:09 GMT)
Evaluating Long Range Dependency Handling in Code Generation Models using Multi-Step Key Retrieval [3.2] コンテクストウィンドウ内の複数ステップのキー検索タスクを最大8kトークンまで長値化することで,複数のコード生成モデルが長距離依存を処理可能であることを解析する。
関数がプロンプトで後で定義される別の関数を参照すると、パフォーマンスは著しく低下する(最大2倍)。
また,スライディングウィンドウアテンション機構を用いたモデルでは,単一ウィンドウのサイズ以上の参照処理が困難であることも確認した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:45:22 GMT)
GenCeption: Evaluate Multimodal LLMs with Unlabeled Unimodal Data [3.1] MLLM(Multimodal Large Language Models)は通常、高価な注釈付きマルチモーダルベンチマークを用いて評価される。
本稿では,新しいアノテーションのない評価手法であるGenCeptionの概要と検証を行う。
モダリティ間のセマンティック・コヒーレンスを測定するために一元データのみを必要とし、逆にMLLMの幻覚傾向を評価する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:54:16 GMT)
Score matching for bridges without time-reversals [3.1] スコアマッチング手法を用いてブリッジ拡散過程を学習するための新しいアルゴリズムを提案する。
本手法は,前処理のダイナミクスを逆転させ,これを用いてスコア関数を学習することに依存する。
従来の方法とは対照的に、我々はスコア項 $nabla_x log p(t, x; T, y)$, for given $t, Y$ を直接学習する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:25:16 GMT)
Modality-Order Matters! A Novel Hierarchical Feature Fusion Method for CoSAm: A Code-Switched Autism Corpus [3.1] 本研究は,小児における早期ASD検出の促進を目的とした,新しい階層的特徴融合法を提案する。
この手法は、コードスイッチされた音声コーパスであるCoSAmを、ASDと一致した制御グループと診断された子供から収集する。
このデータセットは、ASDと診断された30人の子供から61人の音声記録と、神経型児から31人の音声記録を含んでおり、3歳から13歳の間である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:56:22 GMT)
Users Feel Guilty: Measurement of Illegal Software Installation Guide Videos on YouTube for Malware Distribution [3.1] 本研究では,人気ビデオ共有プラットフォームを活用した高度なマルウェア配布手法を紹介し,検討する。
この攻撃では、脅威アクターは、プレミアムソフトウェアとゲーム不正の無料バージョンを約束する偽のコンテンツを通じてマルウェアを配布する。
MalTubeはユーザーの罪悪感を悪用し、違法行為の可能性がある。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 02:32:52 GMT)
Data-Driven Optimal Feedback Laws via Kernel Mean Embeddings [3.0] 制御拡散過程に関連するマルコフ遷移作用素を特定するためにカーネル平均埋め込み(KME)を導入する。
従来の動的プログラミング手法とは異なり、我々の手法はカーネルトリックを利用して次元の呪いを破る。
本手法の有効性を数値的な例で示し, 非線形最適制御問題を解く能力を強調した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:53:03 GMT)
Estimating Environmental Cost Throughout Model's Adaptive Life Cycle [2.9] PreIndexは、データの分散シフトに伴うモデル再トレーニングに関連する環境および計算資源を推定する予測指標である。
これは、現在のデータ分布から新しいデータ分布への再トレーニングにおいて、二酸化炭素排出量やエネルギー使用量などの環境コストを見積もることができる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 03:58:06 GMT)
Enhancing Neural Training via a Correlated Dynamics Model [2.9] 相関モード分解(CMD)は、パラメータ空間をグループにクラスタリングし、エポック間の同期動作を表示するアルゴリズムである。
トレーニングと同時に動作するように設計された効率的なCMDバリアントを導入する。
実験の結果,CMD は画像分類のコンパクトなモデル化のための最先端手法を超越していることがわかった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:42:14 GMT)
Studying Critical Parameters of Superconductor via Diamond Quantum Sensors [2.9] 我々は、複数の臨界パラメータを決定・推定するために、単一の種類の量子センサーを使用する。
ダイアモンド粒子とバルクダイアモンドを用いてマイスナー効果を探索する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 21:23:54 GMT)
Active Learning of Piecewise Gaussian Process Surrogates [2.5] 本研究では,Jump GPサロゲートを能動的に学習する手法を開発した。
ジャンプGPは、設計空間の領域において連続であるが、不連続である。
本研究では,Jump GPモデルのバイアスとばらつきを推定する手法を開発した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 21:06:04 GMT)
Sortability of Time Series Data [2.5] 自己相関型定常時系列のデータセットにおいても、変数可能性などのデータセットの特定の特性が生じることを示す。
最も驚くべき発見は、調査対象の現実世界のデータセットが高いバラエティと低いR2$ソータビリティを示していることです。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:34:47 GMT)
Retrieve, Generate, Evaluate: A Case Study for Medical Paraphrases Generation with Small Language Models [2.5] SLM(Small Language Models)を用いた検索用拡張生成パイプラインpRAGeと医用パラフレーズ生成の評価について紹介する。
フランスの医療パラフレーズ生成におけるSLMの有効性と外部知識ベースの影響について検討した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:17:11 GMT)
Closing the Affective Loop via Experience-Driven Reinforcement Learning Designers [2.4] 本研究では,感情調整コンテンツを生成するための新しい強化学習フレームワークを提案する。
私たちはレースゲームの領域でそれをテストします。
本研究は,デザイナーのスタイルに応じて,感情駆動型レーシングゲームレベルを生成できることを示唆する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:56:43 GMT)
E-TSL: A Continuous Educational Turkish Sign Language Dataset with Baseline Methods [2.0] 本研究は,5年生,6年生,8年生を対象に,オンライントルコ語授業から収集した連続的トルコ手話データセットについて紹介する。
データセットは、合計24時間近くの1,410本のビデオで構成され、11人の署名者によるパフォーマンスを含んでいる。
特に64%がシングルトン語、85%がまれな単語で、5回未満の出現である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:56:20 GMT)
A new Linear Time Bi-level $\ell_{1,\infty}$ projection ; Application to the sparsification of auto-encoders neural networks [2.0] 我々は、$ell_1,infty$ノルムの時間複雑性が、行列 $ntimes m$ に対して$mathcalObig(n m big)$ であることを示す。
実験によると、我々の2レベル$ell_1,infty$プロジェクションは、実際の最速アルゴリズムよりも2.5ドル速い。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:51:29 GMT)
LawLuo: A Chinese Law Firm Co-run by LLM Agents [2.0] LLM(Large Language Models)は、法的背景を持たないユーザに対して法的コンサルティングサービスを提供する。
既存の中国の法的LLMは、1つのモデル-ユーザ対話にインタラクションを制限している。
本稿では,LawLuoと呼ばれる複数のLLMエージェントの協調機能を活用する,新たな法的対話フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:40:41 GMT)
Development of Compositionality and Generalization through Interactive Learning of Language and Action of Robots [1.8] 本稿では、視覚、受容、言語を予測符号化と能動推論の枠組みに組み込む脳に触発されたニューラルネットワークモデルを提案する。
その結果,課題構成の訓練変化が増大すると,未学習の動詞-名詞合成への学習の一般化が著しく向上することが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 05:21:44 GMT)
Time resolved quantum tomography in molecular spectroscopy by the Maximal Entropy Approach [1.8] 光化学反応における分子電子状態間の量子コヒーレンスの役割は何か?
最大エントロピー (MaxEnt) に基づく量子状態トモグラフィ (Quantum State Tomography, QST) アプローチは、分子動力学の研究においてユニークな利点をもたらす。
本稿では,分子の向きに依存した振動ダイナミクスを正確に把握する分子角分布モーメント(MADM)を利用する2つの方法を提案する。
電子サブシステムの絡み合いエントロピーを初めて構築することで、画期的なマイルストーンを達成する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:43:01 GMT)
Lymphoid Infiltration Assessment of the Tumor Margins in H&E Slides [1.7] 腫瘍縁部リンパ管浸潤は固形腫瘍の予後マーカーとして重要である。
現在の評価手法は、非常に依存的なオンケミカルであり、腫瘍マージンのデライン化の課題に直面している。
本稿では,高度リンパ球分画モデルに基づくHematoxylin and Eosin(H&E)染色法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:27:44 GMT)
A Framework for Pupil Tracking with Event Cameras [1.7] サッカデス(Saccades)は、同時に起こる両眼の非常に速い動きである。
ササード中の眼の最高角速度は、ヒトでは700deg/sに達する。
標準的なディープラーニングアルゴリズムで容易に利用できるフレームとしてイベントを提示する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:32:02 GMT)
Prompt Injection Attacks on Large Language Models in Oncology [1.7] ヴィジュアル言語人工知能モデル(VLM)は医療知識を持ち、様々な方法で医療に応用することができる。
これらのモデルはインジェクション攻撃によって攻撃され、VLMと相互作用することで有害な情報を出力することができる。
医用画像データにサブビジュアルプロンプトを埋め込むことで, 有害な出力が得られることを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:29:57 GMT)
A new visual quality metric for Evaluating the performance of multidimensional projections [1.7] 人間の知覚に基づく新しい視覚品質指標を提案する。
提案手法は,MPの質を従来の測定値よりも正確に分析する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:02:46 GMT)
AI Act for the Working Programmer [1.7] 欧州AI法(European AI Act)は、欧州におけるAI技術の開発と使用に関する一定の要件を強制する、法的に拘束力のある新しい手段である。
この法律の規定が、ヨーロッパ以降のITセクターにおける、多くのソフトウェアエンジニア、ソフトウェアテスタ、データエンジニア、その他の専門家の作業に影響を与えることは期待できる。
本稿では,「作業プログラマ」と呼ばれるソフトウェア分野のプロフェッショナルの視点から,法律をナビゲートする支援を提供することを目的とする。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:30:20 GMT)
GenRec: A Flexible Data Generator for Recommendations [1.4] GenRecは、現実的でよく知られた特性を示す合成ユーザ・イテム相互作用を生成するための新しいフレームワークである。
このフレームワークは潜在因子モデリングに基づく生成プロセスに基づいている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:53:17 GMT)
Universal control of four singlet-triplet qubits [1.4] 半導体量子ドットにおける相互作用スピンのコヒーレント制御は 量子情報処理に強い関心を持つ
近接するスピン間の完全かつ制御可能な相互作用を持つゲルマニウム量子ドットアレイを2時間4ドルで提示する。
その結果、量子コンピューティングの競合するプラットフォームとして、シングルトリップキュービットの可能性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:24:53 GMT)
HiRISE: High-Resolution Image Scaling for Edge ML via In-Sensor Compression and Selective ROI [1.4] エッジ機械学習(ML)のための高解像度画像スケーリングシステムHiRISEを提案する。
データ転送とエネルギー消費の最大17.7倍の削減を実現している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:26:05 GMT)
Fast LiDAR Upsampling using Conditional Diffusion Models [1.4] 既存の手法は拡散モデルを用いて高忠実度で洗練されたLiDARデータを生成する可能性を示している。
高速かつ高品質な3次元シーンポイント雲のスパース・ツー・デンスアップサンプリングのための条件拡散モデルに基づく新しいアプローチを提案する。
本手法では,条件付き塗装マスクを用いて訓練した拡散確率モデルを用いて,画像補完タスクの性能向上を図っている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:51:06 GMT)
Patched RTC: evaluating LLMs for diverse software development tasks [1.1] 本稿では,Large Language Models (LLM) の新たな評価手法であるPatched Round-Trip Correctness (Patched RTC)を紹介する。
Patched RTCは、人間の介入なしにモデルの応答の一貫性と堅牢性を測定する、自己評価フレームワークを提供する。
GPT-3.5とGPT-4を異なるソフトウェア開発タスクで比較した結果、Patched RTCはモデルの性能とタスクの難易度を効果的に区別することがわかった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:12:14 GMT)
Efficient Detection of Commutative Factors in Factor Graphs [1.1] そこで本研究では,可換因子(DECOR)検出アルゴリズムを導入し,実際に可換因子であるかどうかを確認するための計算労力を大幅に削減する。
我々は,DECORが要求イテレーション数を劇的に減らし,DECORの効率を実証的に評価する制約を効率的に識別できることを証明した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:31:24 GMT)
qMRI Diffusor: Quantitative T1 Mapping of the Brain using a Denoising Diffusion Probabilistic Model [1.1] 我々は、深部生成モデルを利用したqMRIの新しいアプローチであるqMRI Diffusorを提案する。
その結果,パラメータ推定の精度と精度が向上し,視覚性能も向上することが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:49:19 GMT)
Nudging Using Autonomous Agents: Risks and Ethical Considerations [1.1] 本稿は,本手法が有意な意図,予測可能なリスク,緩和を透明化する実用的手法である,という立場を取る。
AIと自律エージェントの能力の不確実性を考えると、そのような実用的手法は、ドメインや技術の柔軟性を犠牲にすることなく、少なくとも安全な経路を提供すると信じています。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 10:11:35 GMT)
A Diffusion Model for Simulation Ready Coronary Anatomy with Morpho-skeletal Control [1.1] 仮想的介入研究のために,潜在拡散モデルを用いて冠状動脈解剖学をカスタムに合成する方法を検討する。
われわれのフレームワークは、冠動脈解剖学を制御可能な方法で生成・編集することを可能にし、デバイス設計者が機械的洞察を導き出すことを可能にする。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:51:18 GMT)
Securing Tomorrow's Smart Cities: Investigating Software Security in Internet of Vehicles and Deep Learning Technologies [1.0] IoV(Internet of Vehicles)におけるディープラーニング(DL)技術の統合は,徹底的な検査を必要とするセキュリティ上の課題や課題を数多く導入している。
この文献は、IoVシステムにおけるDLに関連する固有の脆弱性とリスクを概観し、セキュリティ脅威の多面的な性質に光を当てている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:56:33 GMT)
Detecting the relative phase between different frequency components of a photon using a three-level $Λ$ atom coupled to a waveguide [0.9] 導波路に沿って伝播する1つの光子の散乱を、導波路に結合する2つの非退化基底状態の重ね合わせにおいて、1つの3レベル$Lambda$原子を持つ任意の重ね合わせ状態の2つの周波数で研究する。
その結果、導波管に結合した3レベル$Lambda$原子が光子位相フィルタとして利用でき、光子重畳状態の2つの周波数間の相対位相を検出することができることがわかった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 05:37:00 GMT)
New design paradigm for highly efficient and low noise photodetector [0.9] 低暗カウントの高量子効率(QE)は、単一光子雪崩検出器(SPAD)を含む高感度光検出器(PD)に必須である
我々は,誘電体Mie共鳴と横伝播波の結合を利用した新しい設計パラダイムを開発した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 20:40:18 GMT)
Arbitrary quantum states preparation aided by deep reinforcement learning [0.9] 2つの任意の量子状態間の制御軌道設計を実現するために、初期状態と目標状態情報を状態準備タスクに統合する。
その結果, 制御軌道は, 単一量子ビット系と2量子ビット系の両方に対して, 任意の量子状態の準備を効果的に達成できることが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 10:28:52 GMT)
EffiSegNet: Gastrointestinal Polyp Segmentation through a Pre-Trained EfficientNet-based Network with a Simplified Decoder [0.9] EffiSegNetは、トレーニング済みの畳み込みニューラルネットワーク(CNN)をバックボーンとして、トランスファーラーニングを活用する新しいセグメンテーションフレームワークである。
Kvasir-SEGデータセットを用いて消化管ポリープセグメンテーションタスクの評価を行い,その成果を得た。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:54:55 GMT)
Multi-Type Point Cloud Autoencoder: A Complete Equivariant Embedding for Molecule Conformation and Pose [0.9] 我々は,マルチタイプの点群に対する新しいタイプのオートエンコーダである分子O(3)エンコーディングネット(Mo3ENet)を開発し,訓練し,評価する。
Mo3ENetはエンドツーエンドの同変であり、学習した表現をO(3)で操作することができる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:24:02 GMT)
Solving a Real-World Optimization Problem Using Proximal Policy Optimization with Curriculum Learning and Reward Engineering [0.9] 本稿では,カリキュラム学習(CL)の原則と巧妙な報酬工学によって訓練されたPPOエージェントを提案する。
我々の研究は、運用上の安全性、ボリューム最適化、リソース使用量の最小化という競合する目標を効果的にバランスさせることの課題に対処する。
提案手法は, プラントの処理効率の向上に加えて, 推定時間の安全性を著しく向上し, ほぼゼロに近い安全性違反を達成できることを実証した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:15:01 GMT)
Fusion and Cross-Modal Transfer for Zero-Shot Human Action Recognition [0.8] 慣性測定ユニット(IMU)は人間の動きを理解するための有能な信号を提供する。
視覚と慣性の間で知識を伝達する手法について検討する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 19:06:44 GMT)
Unexpected Benefits of Self-Modeling in Neural Systems [0.7] 人工ネットワークが内部状態を補助的タスクとして予測することを学ぶと、それらが根本的に変化することを示す。
自己モデルタスクをより良く実行するために、ネットワークはよりシンプルで、より正規化され、よりパラメータ効率が良いものにすることを学ぶ。
この自己正規化は、最近の機械学習文献で報告されている自己モデルの有用性を説明するのに役立つかもしれない。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 21:54:12 GMT)
Minimum uncertainty states and squeezed states from sum uncertainty relation [0.7] ハイゼンベルクの不確実性関係は、最小の不確実性状態と光の圧縮状態の理解の起源である。
我々は、従来よりも弱いが、和の不確実性関係に対して MUS を定義するのに十分な異なる和不確実性関係を導出する。
これは、圧縮状態の定義が強い和の不確実性関係によって完全に影響を受けないことを意味する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:43:42 GMT)
In Search for Architectures and Loss Functions in Multi-Objective Reinforcement Learning [0.7] 多目的強化学習(MORL)は実世界のRL問題の複雑さに対処するために不可欠である。
MORLは、深層学習に基づく関数近似器による不安定な学習ダイナミクスのために困難である。
我々の研究は、モデルフリーのポリシー学習損失関数と異なるアーキテクチャ選択の影響を実証的に探求する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 19:17:47 GMT)
Reinforcement Learning-based Adaptive Mitigation of Uncorrected DRAM Errors in the Field [0.6] メモリ内の不正エラーは現在のジョブを終了させ、最後のチェックポイントから全ての計算を無駄にする。
本稿では,修正されていない誤りの軽減を誘導する最初の適応手法を提案する。
MareNostrum スーパーコンピュータからの2年間の生産ログでは、この手法は減算を伴わず、損失計算時間を54%削減する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:04:33 GMT)
Floquet engineering the quantum Rabi model in the ultrastrong coupling regime [0.6] 超強結合状態における空洞-双極子カップリングの周期的変調の下で、量子化キャビティモードに結合した2レベル系の量子ラビモデルについて検討し、リッチなフロケ状態をもたらす。
この理論の適用例として、周期的結合速度の強さと周波数によって、純粋に機械的駆動が真の光子を生成できることを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 05:26:56 GMT)
Deep Learning for Pancreas Segmentation: a Systematic Review [0.6] 膵分離のための多くの深層学習モデルが近年提案されている。
腹部CTにて小径の膵分画が困難であった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:05:23 GMT)
Learning deep illumination-robust features from multispectral filter array images [0.5] マルチスペクトル(MS)スナップショットカメラは、1枚のショットで複数のスペクトルバンドをキャプチャし、各ピクセルが1つのチャネル値しか持たない生画像を生成する。
完全定義MS画像のトレーニングは、特にディープニューラルネットワーク(DNN)を用いて、計算集約的に行うことができる
本稿では,原画像から識別・照度特性を学習するための独自のアプローチを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:27:10 GMT)
A Comparative Study on Patient Language across Therapeutic Domains for Effective Patient Voice Classification in Online Health Discussions [0.5] 本研究では,患者音声の正確な分類における言語的特徴の重要性を分析する。
我々は、類似した言語パターンと組み合わせたデータセットに基づいて事前学習した言語モデルを微調整し、高い精度で患者音声を自動分類した。
この話題の先駆的な研究として、ソーシャルメディアから真正の患者体験を抽出することに注力することは、医療基準の進歩に向けた重要なステップである。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:51:46 GMT)
Comparative Analysis of AES, Blowfish, Twofish, Salsa20, and ChaCha20 for Image Encryption [0.5] 本研究は,防止とストリーム暗号化に利用される暗号手法とアルゴリズムについて検討する。
AES(Advanced Encryp-tion Standard)、Blowfish、Twofish、Salsa20、ChaCha20などのエンコーディング技術について検討している。
その結果、ChaCha20は暗号化と復号の両方で、他のアルゴリズムよりも50%以上高速であることがわかった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:26:05 GMT)
UniMEL: A Unified Framework for Multimodal Entity Linking with Large Language Models [0.4] MEL(Multimodal Entities Linking)は、ウィキペディアのようなマルチモーダル知識ベースの参照エンティティに、多モーダルコンテキスト内で曖昧な言及をリンクすることを目的とした重要なタスクである。
既存の方法はMELタスクを過度に複雑にし、視覚的意味情報を見渡す。
大規模言語モデルを用いたマルチモーダル・エンティティ・リンクタスクを処理するための新しいパラダイムを確立する統一フレームワークUniMELを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 03:58:08 GMT)
Anwendung von Causal-Discovery-Algorithmen zur Root-Cause-Analyse in der Fahrzeugmontage [0.3] 根本原因分析(英: Root Cause Analysis, RCA)は、問題の因果関係を系統的に調査し、同定することを目的とした品質管理手法である。
現代の生産プロセスでは、大量のデータが収集される。
この出版物は、主要な自動車メーカーの組み立てデータに対する因果発見アルゴリズム(CDA)の適用を実証している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:22:33 GMT)
Prisec II -- A Comprehensive Model for IoT Security: Cryptographic Algorithms and Cloud Integration [0.3] 本研究は、特にIoT環境において、相互接続されたデバイスにおけるデータセキュリティと効率を確保することの重大な問題に対処する。
目的は,暗号アルゴリズムを用いて5Gネットワークのデータセキュリティを向上させるモデルの設計と実装である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:35:24 GMT)
How Video Passthrough Headsets Influence Perception of Self and Others [0.3] 本研究では,ビデオパススルーがユーザに与える影響を定量的に検討する。
40人の参加者が1度はヘッドセットを装着しながら2回、そして1度はヘッドセットを装着せずに、ボディ転送タスクを完了した。
その結果、ビデオパススルーは、シミュレーター病を誘発し、社会的不在を発生させ、自己報告された身体スキーマを変更し、距離知覚を歪ませることを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 23:55:54 GMT)
Towards contrast-agnostic soft segmentation of the spinal cord [0.3] 本稿では,脊髄のソフトセグメンテーションを生成する深層学習法を提案する。
我々のモデルは、目に見えないデータセット、ベンダー、コントラスト、病理の最先端の手法よりも良く一般化する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:12:41 GMT)
A systematic review and analysis of the viability of virtual reality (VR) in construction work and education [0.2] 本稿では,建設業界における学習成果と運用効率を高めるために,仮想現実(VR)技術の実用性について検討する。
この論文は、Web of Science、ERIC、Scopusなどのデータベースから、36の査読論文を分析した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 19:12:08 GMT)
Protecting Quantum Procrastinators with Signature Lifting: A Case Study in Cryptocurrencies [0.2] この作業では、量子プロクラシネータ(量子後暗号への移行に失敗したユーザ)を保護する。
我々は、ある性質を満たすプリ量子署名スキームを同じ鍵を使用するポスト量子署名スキームに持ち上げることができるシグネチャリフトと呼ばれる技術を導入する。
本稿では,多くの暗号通貨に適用可能なシグネチャリフトに基づく改質法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:55:06 GMT)
Semantic Change Characterization with LLMs using Rhetorics [0.1] 本研究では,LLMが3種類の意味変化(思考,関係,方向)を特徴づける可能性について検討する。
本結果は,意味的変化の捕捉と解析におけるLLMの有効性を強調し,計算言語応用を改善する上で有用な洞察を提供するものである。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:32:49 GMT)
Learning to Play Foosball: System and Baselines [0.1] この研究は、科学研究、特にロボット学習の領域において、フォスボールを多用途プラットフォームとして活用する。
本稿では,Fosball の自動表とそれに対応する模擬表を提示し,様々な課題を提示する。
物理フォスボールテーブルを研究フレンドリーなシステムにするために、ゴールキーパーロッドを制御するために、自由な運動鎖を2度の自由度で拡張しました。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:11:08 GMT)
VidyaRANG: Conversational Learning Based Platform powered by Large Language Model [0.0] 大規模言語モデルは機密情報から派生した質問に対する回答の提供に失敗する。
ここでは知識強化検索技術が特に有用になる。
提案するプラットフォームは,異なる分野から学習者のニーズを満たすように設計されている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:30:35 GMT)
Universality of Information Thermodynamics and the Efficiency of Information Erasure on the Cosmological Apparent Horizon [0.0] 膨張する宇宙における宇宙の見かけ上の地平線における情報損失は、情報力学のランダウアー原理と直接対応していることを示す。
これは、情報力学と宇宙の地平線の拡大を直接的に対応させる最初の作品である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 20:51:43 GMT)
Universal Performance Gap of Neural Quantum States Applied to the Hofstadter-Bose-Hubbard Model [0.0] 本研究では,Hofstadter-Bose-Hubbard (HBH)モデルの基底状態の近似におけるNQSの性能について検討した。
以上の結果から,磁束の増大はエネルギー誤差を最大3桁に増加させることが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:18:41 GMT)
Twist-and-turn dynamics of spin squeezing in bosonic Josephson junctions: Enhanced shortcuts-to-adiabaticity approach [0.0] 本研究では, ボソニックジョセフソン接合部におけるスピンスクイーズ状態の生成に, STA と最近開発された拡張版 (eSTA) が有効であることを示す。
次に、コヒーレント・スピン・スクイーズ・アンド・ナンバー・スクイーズ・パラメータの評価により、このシステムの修正されたツイスト・アンド・ターンのダイナミクスを特徴づける。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:50:38 GMT)
Towards an Improved Taxonomy of Attacks related to Digital Identities and Identity Management Systems [0.0] 攻撃に関連するアイデンティティ管理のためのフレームワーク分類法(TaxIdMA)を提案する。
TaxIdMAの目的は、システムアイデンティティ、ID管理システム、エンドユーザアイデンティティに関連する既存の攻撃、攻撃ベクトル、脆弱性を分類することである。
TaxIdMAの組み合わせは、攻撃の概要を構造化し、異なるシナリオに適用することが可能であり、脅威情報のための記述言語は、セキュリティアイデンティティ管理システムとプロセスを改善するのに役立つ。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:46:40 GMT)
The spectrum consistency of fractional quantum Hall effect model [0.0] 3つのフェルミオン族$U(1)時間U(1)=3次元の量子電磁力学のスペクトル一貫性を解析した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:43:18 GMT)
The dynamics of the Reddit collective action leading to the GameStop short squeeze [0.0] 2021年初頭、GameStop、AMC、Nokia、BlackBerryの株価は劇的に上昇した。
これらの出来事は、金融集団行動を引き起こすオンラインソーシャルネットワークの可能性を示した。
Redditの議論が増えたことで、GameStopのショートストレッチの前に取引高が予想されることがわかった。
当社の結果は、ソーシャルメディア利用者による初めての大規模金融集団行動の背景にあるダイナミクスを浮き彫りにしたものだ。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 10:09:25 GMT)
The binarisation loophole in high-dimensional quantum correlation experiments [0.0] 我々は,ブラックボックス相関実験において,測定バイナライゼーションの手順に欠陥があり,抜け穴が開いていることを論じる。
本稿では,二項化による相関関係を忠実に解析する手法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:59:57 GMT)
The Hybrid Forecast of S&P 500 Volatility ensembled from VIX, GARCH and LSTM models [0.0] 本研究では,S&P500のボラティリティ予測の精度を向上させるための4つの方法を検討する。
機械学習アプローチ,特にハイブリッドLSTMモデルは,従来のGARCHモデルよりも大幅に優れていることがわかった。
この研究結果は、より正確なボラティリティ予測を達成するための貴重な洞察を提供する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:28:16 GMT)
The Efficacy of Conversational Artificial Intelligence in Rectifying the Theory of Mind and Autonomy Biases: Comparative Analysis [0.0] メンタルヘルス介入における会話型人工知能(CAI)の展開の増加は、認知バイアスの是正と人間とAIの相互作用に対する影響の認識において、その効果を評価する必要がある。
本研究の目的は、認知バイアスの同定と修正およびユーザインタラクションへの影響認識における汎用言語モデル(GPT-3.5, GPT-4, Gemini Pro)に対する治療用チャットボットの有効性を評価することである。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:33:32 GMT)
Thawed Gaussian wave packet dynamics: a critical assessment of three propagation schemes [0.0] 他の2つの近似スキーム、ヘラーと拡張半古典的スキームは、様々な収差を示す。
我々はTDVPに基づくスキームのみが問題のない動的シミュレーションに適していると結論付けた。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 18:55:26 GMT)
Systematically Searching for Identity-Related Information in the Internet with OSINT Tools [0.0] 本稿では、IDに関連するデータとオープンソースインテリジェンス(OSINT)ツールの分類を提案する。
次のステップでは、データを分析し、対策を講じることができます。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:40:25 GMT)
Supervised machine learning for microbiomics: bridging the gap between current and best practices [0.0] 機械学習(ML)は、臨床微生物学の革新を加速する。
ここでは、マイクロバイオミクスデータへの教師付きMLの適用における現在のプラクティスのスナップショットをキャプチャする。
実験設計における様々なアプローチのメリットについて,データ駆動型アプローチをステアディスカッションに適用する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:39:05 GMT)
Super-Optimal Charging of Quantum Batteries via Reservoir Engineering [0.0] 本稿では,コヒーレント充電器と電池の相互作用を,エンジニアによる共有貯水池による散逸相互作用に置き換える新しい充電手法を提案する。
超最適充電は、充電器バッテリ構成の実用的な正当性を提供する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:06:45 GMT)
Sobolev neural network with residual weighting as a surrogate in linear and non-linear mechanics [0.0] 本稿では、感度情報を含むトレーニングプロセスの改善について検討する。
計算力学では、トレーニング損失関数を拡張することにより、ニューラルネットワークに感性を適用することができる。
この改善は、線形および非線形な材料挙動の2つの例で示される。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:28:07 GMT)
Securing The Future Of Healthcare: Building A Resilient Defense System For Patient Data Protection [0.0] この研究は、勾配ボオスティング機械学習モデルを用いて、医療データ漏洩の深刻度を予測する。
その結果、ハッキングとITインシデントは、医療業界で最も一般的なタイプの違反であることがわかった。
モデル評価の結果,勾配向上アルゴリズムは良好に動作することがわかった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 04:25:35 GMT)
RogueGPT: dis-ethical tuning transforms ChatGPT4 into a Rogue AI in 158 Words [0.0] 本稿では、ChatGPTのデフォルトの倫理的ガードレールが、最新のカスタマイズ機能を使っていかに簡単にバイパスできるかを考察する。
この変化したChatGPTは「RogueGPT」とあだ名され、心配な行動に反応した。
我々の発見は、違法薬物生産、拷問方法、テロリズムといったトピックに関するモデルの知識に関する重要な懸念を提起する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:13:03 GMT)
Revisiting Brownian SYK and its possible relations to de Sitter [0.0] ブラウン・サハデフ・イェ・キタエフ模型は、過去に文献で見落とされたエネルギー保存の創発的存在であると主張している。
このモデルを二重スケールの状態で解き、超高速スクランブル、相関関数の指数減衰、有界スペクトル、高点関数の予期せぬ分解を示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 23:20:17 GMT)
Restrictions imposed by a pure quantum state on the results of measuring the momentum of a particle [0.0] 粒子の純粋量子状態を記述する波動関数の拡張解釈を示す。
粒子運動量値の2つのフィールドが定義され、これは測定の結果である。
ボヘミア力学とは異なり、我々のアプローチには隠れた変数は存在しない。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:48:34 GMT)
Phases and dynamics of quantum droplets in the crossover to two-dimensions [0.0] クロスオーバー領域における超低温原子滴の力学を3次元から2次元に探索する。
主な発見の1つは、結合エネルギーが小さくなると、滴が大幅に拡張できることである。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:14:47 GMT)
Phase-space representation of coherent states generated through SUSY QM for tilted anisotropic Dirac materials [0.0] 固有値問題に固有の微分方程式系の疎結合を可能にする。
超対称量子力学は、ハミルトニアン作用素に対応する固有状態と固有値の決定を促進する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:30:37 GMT)
Pascal's pyramid and number projection operators for quantum computation [0.0] この研究は、量子コンピュータ上の多体量子システムの対称性特性の活用に焦点を当てている。
標準ジョルダン・ウィグナーフェルミオン・ツー・キュービット写像における数投影演算子に対応する量子ビットオブジェクトについて検討する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:14:53 GMT)
Parrondo's paradox in quantum walks with inhomogeneous coins [0.0] パロンドのパラドックス(英: Parrondo's paradox)は、2つの敗戦戦略が組み合わさって勝利をもたらす反直感的な現象である。
本研究では,離散時間量子ウォークにおけるパロンドのパラドックスの出現について検討する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:14:12 GMT)
Pareto Front Approximation for Multi-Objective Session-Based Recommender Systems [0.0] MultiTRONは、マルチオブジェクトセッションベースのレコメンデータシステムに近似技術を適用するアプローチである。
提案手法は,選好ベクトルの学習によるクリックスルーや変換率といった重要な指標間のトレードオフを最適化する。
大規模なオフラインおよびオンライン評価を通じて、モデルの性能を検証する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 20:38:23 GMT)
PLM-Net: Perception Latency Mitigation Network for Vision-Based Lateral Control of Autonomous Vehicles [0.0] 知覚緩和ネットワーク(PLM-Net)は、視覚に基づく自律走行(AV)横方向制御システムにおいて、知覚遅延に対処する新しいディープラーニングアプローチである。
PLM-Netはベースモデル(BM)と時間行動予測モデル(TAPM)で構成される。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:41:13 GMT)
Orbital-free density functional theory with first-quantized quantum subroutines [0.0] 確率的想像時間進化(PITE)を用いた軌道自由密度汎関数理論(OFDFT)を実現する量子古典ハイブリッドスキームを提案する。
PITEはOFDFTの一部に適用され、各自己整合体(SCF)反復におけるハミルトニアン基底状態を探索する。
ハミルトンの基底状態エネルギーを得るには、回路深さが$O(log N_mathrmg)$が必要である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 05:34:11 GMT)
Open quantum systems -- A brief introduction [0.0] このテキストは、駆動散逸多体系の物理学の簡単な導入である。
我々は、(Gorini-Kossakowski-Sudarshan-) Lindbladマスター方程式という、オープン量子系の最も単純で、もっとも効果的に記述する1つに焦点を当てる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 21:46:57 GMT)
On The Expressive Power of Knowledge Graph Embedding Methods [0.0] 知識グラフ埋め込み(KGE)は、潜在空間における知識グラフの実体と関係を表現することを目的とした一般的なアプローチである。
様々なタスクにおいてKGEが広く普及しているにもかかわらず、KGE法は推論能力に制限がある。
KGE手法の推論能力を比較する数学的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:21:38 GMT)
Neural information field filter [0.0] 本稿では,高次元非線形力学系に対するニューラル情報場フィルタ,ベイズ状態およびパラメータ推定手法を提案する。
有限線形基底のスパンを用いて時間発展状態経路をパラメータ化する。
真の状態パスを知る前に表現的だが単純な線形基底を設計することは、推論の正確性には不可欠だが困難である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:18:26 GMT)
Nanomechanically-induced nonequilibrium quantum phase transition to a self-organized density wave of a Bose-Einstein condensate [0.0] ハイブリッド量子多体系における非平衡量子相転移(NQPT)について報告する。
NQPTは一定間隔の遷移周波数に対して不連続かつ連続であり、その外部では純粋に不連続である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:05:46 GMT)
Mobile Technology: A Panacea to Food Insecurity In Nigeria -- A Case Study of SELL HARVEST Application [0.0] 本論文は,異なる農業技術についてレビューし,農業をより持続的かつ安全な食品にするための移動型ソリューションであるコード・セル・ハーベストを提案する。
テクノロジーはナイジェリアが世界の貧困を克服し、農村部と都市部の両方で飢餓を早めるのに役立てることができる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:21:52 GMT)
MicroEmo: Time-Sensitive Multimodal Emotion Recognition with Micro-Expression Dynamics in Video Dialogues [0.0] 本稿では,局所的な顔マイクロ圧縮のダイナミクスに注意を向け,時間に敏感なマルチモーダル言語モデル(MLLM)を提案する。
本モデルでは,(1)グローバルなフレームレベル・タイムスタンプ結合画像特徴とマイクロ表現の時間的ダイナミクスの局所的な顔特徴とを融合したグローバルな視覚的エンコーダ,(2)発話セグメントごとに視覚的トークンシーケンスを生成し,それらを組み合わせてマルチスケールおよび文脈的依存関係をキャプチャする発話認識ビデオQ-Formerの2つのアーキテクチャ的コントリビューションを取り入れた。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:05:55 GMT)
MPSDynamics.jl: Tensor network simulations for finite-temperature (non-Markovian) open quantum system dynamics [0.0] MPSDynamics.jlパッケージは、ゼロ温度と有限温度でオープン量子システムシミュレーションを実行するための使いやすいインターフェースを提供する。
Juliaプログラミング言語で書かれたMPSDynamics.jlは汎用的なオープンソースパッケージである。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 17:29:48 GMT)
Logifold: A Geometrical Foundation of Ensemble Machine Learning [0.0] データセット理解のための局所的・局所的・測度論的アプローチを提案する。
中心となる考え方は、ロジフォールド構造を定式化し、制限されたドメインを持つネットワークモデルをデータセットの局所チャートとして解釈することである。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 04:47:58 GMT)
Iterative construction of conserved quantities in dissipative nearly integrable systems [0.0] 本研究では,高効率な一般化Gibsアンサンブル記述において主役となる保存量を決定する積分可能性破壊摂動(バス)を反復的に決定する手法を開発する。
提案手法は, 熱力学的な大規模システムにおける計算の容易化を図り, 未知の保存量の構築に利用することができる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:02:38 GMT)
Interval Forecasts for Gas Prices in the Face of Structural Breaks -- Statistical Models vs. Neural Networks [0.0] ニューラルネットワークのような現代の機械学習手法が、このような変化に対してより耐性があるかどうかを検討する。
衝撃期においては、ほとんどのモデルでは、余震期における分散を過大評価しながら、分散を過小評価している。
興味深いことに、広く使われている長短のニューラルネットワークは、競合他社よりも優れています。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:34:13 GMT)
Interaction Information and Family of Quantum Mutual Informations in Multiparty Quantum Systems [0.0] 我々は、真のマルチパーティ量子相互情報のファミリーを紹介する。
この文献で知られている多党間の量子相互情報の2つのバージョンは、このファミリーの一部である。
量子暗号に有用な秘密モノトンを推測する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 10:15:45 GMT)
Integer Programming Using A Single Atom [0.0] 我々は,IP問題を元の形で任意の量子システムにマップし,解くアルゴリズムを開発した。
最適解は、最大8つの変数と4つの制約を持つIP問題に対して数マイクロ秒以内に見つかる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 10:27:14 GMT)
Implementing engrams from a machine learning perspective: the relevance of a latent space [0.0] これまでの研究では、脳内のエングラムを、リカレントニューラルネットワーク上でのオートエンコーダとして生物学的に実装することを提案した。
本稿では,これらのオートエンコーダにおける潜伏空間の関連性について述べる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:24:29 GMT)
How to Design a Blue Team Scenario for Beginners on the Example of Brute-Force Attacks on Authentications [0.0] 実践的なトレーニングは、生徒がトピックを紹介するのにも使える。
ユーザー認証を必要とするウェブサイトに対する絶え間ない脅威は、いわゆるブルートフォース攻撃である。
3つのオープンソースのBlueチームシナリオが設計され、体系的に記述されている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:26:34 GMT)
How Can Deep Neural Networks Fail Even With Global Optima? [0.0] 浅いニューラルネットワークの表現力は、簡単なトリックを使って、どんな深さのネットワークにも拡張する。
我々は、グローバルな最適性があるにもかかわらず、分類や関数近似の問題で未だにうまく機能しない、非常に過度に適合するディープニューラルネットワークを構築している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 22:44:57 GMT)
Hooked: A Real-World Study on QR Code Phishing [0.0] クイックレスポンス(QR)コードの使用は、新型コロナウイルス(COVID-19)パンデミックの前の時代に限られていた。
我々は,研究キャンパスで2種類のQRコードを用いた実世界のフィッシングキャンペーンを行った。
フィッシングキャンペーンと調査はどちらも、プロフェッショナルなデザインがより多くの注目を集めていることを示している。
その結果、技術に精通したユーザの方がリスクに気付いていることが確認できたが、技術に精通していないユーザにとって悪意のあるポテンシャルを支えている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:14:50 GMT)
Histopathology image embedding based on foundation models features aggregation for patient treatment response prediction [0.0] びまん性大細胞型B細胞リンパ腫患者に対する全スライド画像からの治療反応を予測する新しい方法を提案する。
本手法は, 組織小領域に対応する画像の局所的表現を得るために, 特徴抽出器としていくつかの基礎モデルを利用する。
本研究は152名の患者を対象とした実験で,本手法の有望な結果を示した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:31:12 GMT)
Highly engaging events reveal semantic and temporal compression in online community discourse [0.0] Redditの会話データを利用して、コミュニティベースの構造を利用して、オフラインイベントがオンラインユーザーインタラクションや行動にどのように影響するかを明らかにする。
オンライン会話は、より限定的な語彙で反復的になり、より速いペースで発展し、感情が高められる。
ユーザはよりアクティブになり、よりリッチな語彙や反復的なメッセージを使うにもかかわらず、より多くのオーディエンスと情報を交換する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:04:37 GMT)
Grover Speedup from Many Forms of the Zeno Effect [0.0] 我々は、他のゼノ効果の現示が、物理的に現実的なモデルにおいて最適なスピードアップをサポートすることを示す。
我々はこれらのアルゴリズムを3つのファミリーに分類し、スピードアップがどのように得られるかの構造化された理解を容易にする。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:46:22 GMT)
Global Minima by Penalized Full-dimensional Scaling [0.0] 次に、ペナルティパラメータの値の増大に対する応力の最小値の軌跡を用いて、低次元の多次元スケーリングのための(tentative)大域最小値を求める。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:59:13 GMT)
First Detailed Study of the Quantum Decoherence of Entangled Gamma Photons [0.0] このような絡み合った$gamma$の3重コンプトン散乱に対する、統計学的および運動学的に正確な実験データを示す。
測定された$R$は、複数の散乱背景から分離され、中間散乱角が$sim$60$circ$までの古典的な極限を超え、より大きな角度で減少する。
この結果は、基本物理学とPETイメージングにおいて、絡み合ったメガ電子ボルト$gamma$の今後の研究と活用に不可欠である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 23:08:45 GMT)
Elementary Quantum Recursion Schemes That Capture Quantum Polylogarithmic Time Computability of Quantum Functions [0.0] 我々は、高速量子再帰と呼ばれる量子再帰の基本形式を導入し、初等量子関数の$EQS$を定式化する。
このクラスは、BQPOLYLOGTIMEという複雑性クラスを形成する、正確に量子多対数時間計算可能性を取得する。
また、よく知られた分割・分散戦略を実装するアルゴリズム的スキームについても検討する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 06:10:19 GMT)
Dynamical blockade of a reservoir for optimal performances of a quantum battery [0.0] 本研究では,貯水池の閉塞により,その自由度へのエネルギー漏れが防止され,高効率で電池内のエネルギー蓄積が著しく促進されることを示す。
これらの条件を$LC$量子回路で実装することは、固体量子電池の新しい道を開く。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:43:14 GMT)
Distinguishing bounce and inflation via quantum signatures from cosmic microwave background [0.0] CMBRの動的フィデリティ・サセプティビリティ(DFS)という2つのシナリオを区別する量子測度を提案する。
同じパワースペクトルを持つ2つの単純なモデルを用いて、DFSが2つのシナリオに対して異なる振る舞いをすることを示す。
我々は、今後の宇宙ミッションにおいて、DFSを差別化要因として用いる可能性について論じる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:24:03 GMT)
Discrete time crystals in the presence of non-Markovian dynamics [0.0] 非マルコフ散逸の存在下で、周期的に駆動される量子系における離散時間結晶(DTC)について検討する。
我々は,非マルコフ体制がパラメータ値の広い範囲でDTCを安定化するのに非常に有益であることを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 05:59:26 GMT)
Deep Bayesian segmentation for colon polyps: Well-calibrated predictions in medical imaging [0.0] 我々は,さまざまなベイズニューラルネットワークを用いて,大腸ポリプ画像のセマンティックセグメンテーションを開発する。
その結果、これらのモデルが、この医療データセットのセグメンテーションにおける最先端のパフォーマンスを提供するだけでなく、正確な不確実性の推定値が得られることがわかった。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 16:13:27 GMT)
Correlation between optical phonon softening and superconducting $T_c$ in YBa$_2$Cu$_3$O$_x$ within $d$-wave Eliashberg theory [0.0] 実験で観測されたラマンモードの酸素移動に伴う軟化とそれに対応する超伝導臨界温度$T_c$との強い相関関係を数学的に記述する。
T_c$対ドーピングの傾向で観測される異なる規則は、ラマンスペクトルにおける光フォノン軟化の対応する規則と関連付けられる。
これらの結果は、希土類銅酸化物における高温超伝導の物理的起源に関するさらなる証拠を与える。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 13:15:17 GMT)
Conformally Natural Families of Probability Distributions on Hyperbolic Disc with a View on Geometric Deep Learning [0.0] 双曲円盤上の確率分布の新しいファミリーを紹介する。
群不変性は、双曲的データの不確実性を符号化するのに便利でトラクタブルなモデルである。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:32:21 GMT)
Condensed Encodings of Projective Clifford Operations in Arbitrary Dimension [0.0] 我々は、$n$-qudit射影クリフォード群に対する構造定理の注意深い解析と、その要素に対する様々な符号化スキームを提供する。
我々の結果はすべての整数に$dgeq2$、特に偶数の場合に適用されます。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 22:04:10 GMT)
CheMFi: A Multifidelity Dataset of Quantum Chemical Properties of Diverse Molecules [0.0] 我々は、TD-DFT形式で計算された5つのフィデリティからなる量子化学マルチフィデリティ(CheMFi)データセットを提供する。
STO-3G, 3-21G, 6-31G, def2-SVP, def2-TZVP。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 10:34:19 GMT)
Capturing the spectrotemporal structure of a biphoton wave packet with delay-line-anode single-photon imagers [0.0] 本稿では,周波数絡み合った2光子のより効率的な測定を実現するために,新しい光子検出法を提案する。
我々の手法は、偶然の測定を必要とするマルチモード量子科学における全ての実験の道を開く。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 03:24:47 GMT)
Capital as Artificial Intelligence [0.0] 本稿では,歴史的エージェントシステムとしてのCapitalの特徴と,コンピュータサイエンスのツールを用いたCapitalのモデルを提案する。
私たちは、その進化が定量的な最適化プロセスによって駆動される場合、Capitalは人工知能の質を持つことができると主張している。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:05:33 GMT)
Can time series forecasting be automated? A benchmark and analysis [0.0] 時系列予測は、金融、医療、気象など様々な分野において重要な役割を担っている。
与えられたデータセットに対して最適な予測方法を選択するタスクは、データパターンや特徴の多様性による複雑なタスクである。
本研究では,幅広いデータセットを対象とした時系列予測手法の評価とランキングのための総合ベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 12:54:06 GMT)
Ballistic Entanglement Cloud after a Boundary Quench [0.0] 絡み合いは強く相関した多体系の構造を特徴づけるために広く用いられている。
強く相関した多体系における絡み合いの空間的・時間的分析について考察する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 08:30:59 GMT)
Automated Schizophrenia Detection from Handwriting Samples via Transfer Learning Convolutional Neural Networks [0.0] 統合失調症 (Schizophrenia) は、日常生活に深刻な障害を与える世界的な精神疾患である。
本研究の目的は, 統合失調症手書きサンプルと非統合失調症手書きサンプルを識別するための, 正確で客観的かつアクセス可能な計算手法を開発することである。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 15:16:34 GMT)
Artificial Agency and Large Language Models [0.0] 大規模言語モデル(LLM)は、人工的にエージェンシーを実現する可能性について哲学的な議論を巻き起こしている。
人工エージェントのしきい値概念として使用できる理論モデルを提案する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 05:32:00 GMT)
Approximate real-time evolution operator for potential with one ancillary qubit and application to first-quantized Hamiltonian simulation [0.0] 我々は,一元対角行列によって生成された実時間進化演算子を実装する手法を比較した。
特に、第一量子化ハミルトニアンシミュレーションにおけるポテンシャル部分に対するリアルタイム進化演算子の実装に本手法を適用した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:47:47 GMT)
Analyzing the Polysemy Evolution using Semantic Cells [0.0] 本研究は, セマンティック・セルの進化的帰結として, ポリーセミー(polysemy)という言葉が現れることを示唆する。
特に、Chat GPTを用いて収集された単語Springの4つの感覚のそれぞれに対して、ある順序で1000文の文列を解析すると、単語が最も多節単調に取得されることを示す。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 00:52:12 GMT)
An Algorithm for Reversible Logic Circuit Synthesis Based on Tensor Decomposition [0.0] 可逆論理合成のためのアルゴリズムを提案する。
写像は階数 ($2n-2$) テンソルのテンソル積と 2 倍の恒等行列のテンソル積と書くことができる。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 14:01:28 GMT)
An Active Inference Strategy for Prompting Reliable Responses from Large Language Models in Medical Practice [0.0] 大規模言語モデル(LLM)は非決定論的であり、誤ったあるいは有害な応答を与え、品質管理を保証するために規制できない。
提案フレームワークは, 評価された医療情報を含むドメイン固有のデータセットに対して, 一次知識ベースを限定することにより, LLM応答を改良する。
不眠症治療士に対する専門的認知行動療法をブラインド形式で評価した。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 05:00:18 GMT)
Advancements in Point Cloud-Based 3D Defect Detection and Classification for Industrial Systems: A Comprehensive Survey [0.0] 3Dポイントクラウド(PC)は、様々な分野にまたがる多様な応用により、注目されている。
ディープラーニング(DL)は、2Dビジョンで直面する様々な課題に対処するために3D PCを活用するのに有効であることが証明されている。
3DPCを処理するためにディープニューラルネットワーク(DNN)を適用することは、ユニークな課題である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 09:34:45 GMT)
Adaptive Extensions of Unbiased Risk Estimators for Unsupervised Magnetic Resonance Image Denoising [0.0] ディープニューラルネットワーク(DNN)のイメージデノナイジングへの応用は、従来のデノナイジング手法に挑戦している。
本稿では,ガウスノイズとポアソンノイズの関連したMRIデータに対して,これらの手法を包括的に評価する。
我々の主な貢献は、SURE、eSURE、特に医療画像のためのePUREフレームワークの効果的適応と実装である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 19:09:23 GMT)
Achieving Heisenberg scaling by probe-ancilla interaction in quantum metrology [0.0] ハイゼンベルクスケーリング(Heisenberg Scaling)は、量子力学の原理によって許容されるパラメータ推定の最終的な精度限界である。
また, プローブと補助システムとの相互作用により, パラメータ推定の精度が向上し, 標準量子限界を超える可能性が示唆された。
このプロトコルの特徴は, (i) ハイゼンベルクスケーリングはプローブの積状態によって達成でき, (ii) アンシラ上の局所的な測定だけで十分である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 23:11:50 GMT)
A simple and fast C++ thread pool implementation capable of running task graphs [0.0] 筆者らは,タスクグラフの実行が可能な,シンプルで高速なC++スレッドプールの実装を提案する。
実装はGitHubで公開されており、https://github.com/dpuyda/scheduling.comを参照してほしい。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 10:27:44 GMT)
A Quantum Leaky Integrate-and-Fire Spiking Neuron and Network [0.0] 量子ニューロモルフィックコンピューティングのための新しいソフトウェアモデルを導入する。
量子スパイクニューラルネットワーク(QSNN)と量子スパイク畳み込みニューラルネットワーク(QSCNN)の構築において,これらのニューロンを構築ブロックとして利用する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 11:38:06 GMT)
A New Variational Quantum Algorithm Based on Lagrange Polynomial Encoding to Solve Partial Differential Equations [0.0] 部分微分方程式 (Partial Differential Equations, PDEs) は、幅広い科学的研究の基盤となる。
PDEの解を見つけることは、しばしば従来の計算手法の能力を超える。
量子コンピューティングの最近の進歩は、PDEを解く量子アルゴリズムの設計に対する研究者の関心が高まりつつある。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 10:11:44 GMT)
A Multi-Level Hierarchical Framework for the Classification of Weather Conditions and Hazard Prediction [0.0] 本稿では,気象条件の分類と危険予知のための多段階階層的枠組みを提案する。
このフレームワークは、画像の分類を、露、凍土、氷、ライム、雪、干し草、雨、雷、虹、砂嵐の11の天候カテゴリに分類することができる。
リアルタイム気象情報を提供し、精度は0.9329である。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 20:55:25 GMT)
15 Years of Algorithmic Fairness -- Scoping Review of Interdisciplinary Developments in the Field [0.0] 本稿では,過去15年間のアルゴリズムフェアネス研究のスコーピングレビューについて述べる。
あらゆる記事は、コンピュータ科学と法学の分野から来ており、集団に差別的影響を与える可能性のあるAIアルゴリズムに焦点を当てている。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:50:01 GMT)
$K$-theory classification of Wannier localizability and detachable topological boundary states [0.0] 非エルミートトポロジーは、エルミートトポロジカル絶縁体および超伝導体における剥離可能な境界状態の下にあることを示す。
ワニエ局所化性は、位相位相の準同型を通じてアルトランド・ジルンバウアー対称性クラスからウィグナー・ダイソン対称性クラスへ分類する。
論文参考訳(メタデータ) (Tue, 23 Jul 2024 07:27:41 GMT)