Gamba: Marry Gaussian Splatting with Mamba for single view 3D reconstruction [153.5] Gambaは、エンドツーエンドの3D再構成モデルである。
Gambaは、データ前処理、正規化設計、トレーニング方法論の大幅な進歩を取り入れている。
ここでガンバは、質的にも量的にも競争力のある生成能力を示しながら、目覚ましいスピードを実現している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:40:14 GMT)
Few-shot Learner Parameterization by Diffusion Time-steps [134.0] 大規模なマルチモーダル・ファンデーション・モデルを使用する場合、ほとんどショット・ラーニングは難しい。
我々は、失った属性を補うために、時間ステップFew-shot(TiF)学習者を提案する。
TiF学習者は、OpenCLIPとそのアダプタを様々な細粒度でカスタマイズされた数発の学習タスクで大幅に上回っている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:34:00 GMT)
NaturalSpeech 3: Zero-Shot Speech Synthesis with Factorized Codec and Diffusion Models [127.5] ゼロショット方式で自然な音声を生成するために,分解拡散モデルを備えたTSSシステムであるNaturalSpeech 3を提案する。
具体的には、分解ベクトル量子化(FVQ)を用いて、音声波形をコンテンツ、韻律、音色、音響的詳細の部分空間に分解する。
実験により、NaturalSpeech 3は、品質、類似性、韻律、知性において最先端のTSSシステムより優れていることが示された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:14:34 GMT)
Lift3D: Zero-Shot Lifting of Any 2D Vision Model to 3D [95.1] 2Dビジョンモデルは、大規模な2D画像データセットによって実現されるセマンティックセグメンテーション、スタイル転送、シーン編集に使用できる。
しかし、シーン編集のような単一の2Dビジョン演算子を3Dに拡張するには、通常、そのタスクに特化した非常に創造的な方法が必要である。
本稿では,いくつかの視覚モデルによって生成された特徴空間の未知のビューを予測するためのLift3Dを提案する。
問題のあるタスクに特化した最先端の手法よりも優れています。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:13:16 GMT)
UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.8] さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:26:23 GMT)
BridgeTower: Building Bridges Between Encoders in Vision-Language Representation Learning [91.9] 近年,2towerアーキテクチャを用いた視覚言語モデル(VL)が視覚表現学習を支配している。
そこで,BridgeTowerを提案する。このBridgeTowerは,ユニモーダルエンコーダの上位層とクロスモーダルエンコーダの各層との間の接続を構築する複数のブリッジ層を提供する。
BridgeTowerは78.73%の精度を達成し、以前の最先端モデルであるMETERを1.09%上回った。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:53:23 GMT)
MetaCap: Meta-learning Priors from Multi-View Imagery for Sparse-view Human Performance Capture and Rendering [91.8] そこで本研究では, 高精度かつ高品質な幾何復元と新規なビュー合成手法を提案する。
私たちのキーとなるアイデアは、低解像度のマルチビュービデオからのみ、放射界の重みをメタラーニングすることです。
パブリックおよびWildDynaCapデータセットにおける最近の最先端手法と比較して,優れた結果を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:59:54 GMT)
MacGyver: Are Large Language Models Creative Problem Solvers? [87.7] 本稿では, 現代LLMの創造的問題解決能力について, 制約付き環境下で検討する。
我々は1,600以上の実世界の問題からなる自動生成データセットであるMACGYVERを作成する。
我々はLLMと人間の両方にコレクションを提示し、それらの問題解決能力を比較して比較する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 23:43:54 GMT)
Duolando: Follower GPT with Off-Policy Reinforcement Learning for Dance Accompaniment [87.2] 舞踊伴奏と呼ばれる3次元舞踊生成の分野における新しい課題を紹介する。
これは、リードダンサーの動きと、基礎となる音楽リズムと同期した「フォロワー」と呼ばれるダンスパートナーからの応答的な動きを生成する必要がある。
本稿では,GPTに基づくDuolandoモデルを提案する。このモデルでは,音楽の協調情報,リーダの動作,従者の動きに基づいて,後続のトークン化動作を自動回帰予測する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:57:02 GMT)
Towards Unified Multi-Modal Personalization: Large Vision-Language Models for Generative Recommendation and Beyond [87.2] 我々の目標は、マルチモーダルパーソナライゼーションシステム(UniMP)のための統一パラダイムを確立することである。
我々は、幅広いパーソナライズされたニーズに対処できる汎用的でパーソナライズされた生成フレームワークを開発する。
我々の手法は、パーソナライズされたタスクのための基礎言語モデルの能力を高める。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:11:19 GMT)
Detection of subclinical atherosclerosis by image-based deep learning on chest x-ray [86.4] 460胸部X線で冠状動脈カルシウム(CAC)スコアを予測する深層学習アルゴリズムを開発した。
AICACモデルの診断精度は, 曲線下領域(AUC)で評価された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:56:14 GMT)
BioMedLM: A 2.7B Parameter Language Model Trained On Biomedical Text [82.7] BioMedLM は270億のパラメータ GPT スタイルの自己回帰モデルであり、PubMed の抽象概念と全記事に特化して訓練されている。
微調整すると、BioMedLMはより大規模なモデルと競合する強力な多重選択のバイオメディカルな質問応答結果を生成することができる。
BioMedLMは、医療トピックに関する患者の質問に対する有用な回答を生成するために、微調整することもできる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:18:21 GMT)
Learning Inclusion Matching for Animation Paint Bucket Colorization [76.5] ネットワークにセグメント間の包摂関係を理解するための,学習に基づく新たな包摂的マッチングパイプラインを導入する。
提案手法では,粗いカラーワープモジュールと包括的マッチングモジュールを統合した2段階のパイプラインを特徴とする。
ネットワークのトレーニングを容易にするため,PaintBucket-Characterと呼ばれるユニークなデータセットも開発した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:32:48 GMT)
Generalized Logit Adjustment: Calibrating Fine-tuned Models by Removing Label Bias in Foundation Models [76.0] CLIPのようなファンデーションモデルは、追加のトレーニングデータなしで、さまざまなタスクでゼロショット転送を可能にする。
微調整やアンサンブルも一般的に下流のタスクに合うように採用されている。
しかし、先行研究は基礎モデルに固有のバイアスを見落としていると論じる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:55:39 GMT)
Generating Diverse Agricultural Data for Vision-Based Farming Applications [74.8] このモデルは, 植物の成長段階, 土壌条件の多様性, 照明条件の異なるランダム化フィールド配置をシミュレートすることができる。
我々のデータセットにはセマンティックラベル付き12,000の画像が含まれており、精密農業におけるコンピュータビジョンタスクの包括的なリソースを提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:42:47 GMT)
Stochastic Approximation with Delayed Updates: Finite-Time Rates under Markovian Sampling [73.6] マルコフサンプリングの遅延更新による近似スキームの非漸近的性能について検討した。
我々の理論的な発見は、幅広いアルゴリズムの遅延の有限時間効果に光を当てた。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:48:29 GMT)
Hourglass Tokenizer for Efficient Transformer-Based 3D Human Pose Estimation [73.3] 本稿では,Hourglass Tokenizer (HoT) と呼ばれるプラグアンドプレイのプルーニング・アンド・リカバリフレームワークを提案する。
私たちのHoDTは、冗長なフレームのポーズトークンのプルーニングから始まり、フル長のトークンを復元することで終了します。
提案手法は,従来のVPTモデルと比較して高い効率性と推定精度を両立させることができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:43:28 GMT)
Stragglers-Aware Low-Latency Synchronous Federated Learning via Layer-Wise Model Updates [71.8] 同期フェデレーションラーニング(FL)は、協調エッジラーニングの一般的なパラダイムである。
一部のデバイスは計算資源が限られており、様々な可用性があるため、FLレイテンシはストラグラーに非常に敏感である。
本稿では,NNの最適化手法をバックプロパゲーションにより活用し,グローバルモデルを階層的に更新するストラグラー対応層対応学習(SALF)を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:14:36 GMT)
LITA: Language Instructed Temporal-Localization Assistant [71.7] ビデオ長に対してタイムスタンプをエンコードするタイムトークンを導入し,ビデオ中のタイムスタンプをよりよく表現する。
また、アーキテクチャにSlowFastトークンを導入し、微細な時間分解能で時間情報をキャプチャする。
時間的ローカライゼーションに重点を置くことで,既存のビデオLLMに比べて映像ベースのテキスト生成が大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 22:50:48 GMT)
DiffusionFace: Towards a Comprehensive Dataset for Diffusion-Based Face Forgery Analysis [71.4] DiffusionFaceは、最初の拡散ベースのフェイスフォージェリーデータセットである。
非条件およびテキストガイドの顔画像生成、Img2Img、Inpaint、Diffusionベースの顔交換アルゴリズムなど、さまざまなフォージェリーカテゴリをカバーする。
重要なメタデータと、評価のための実世界のインターネットソースの偽顔画像データセットを提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:32:44 GMT)
HybridNeRF: Efficient Neural Rendering via Adaptive Volumetric Surfaces [71.1] ニューラル放射場は、最先端のビュー合成品質を提供するが、レンダリングが遅くなる傾向がある。
本稿では,ほとんどの物体を表面としてレンダリングすることで,両表現の強みを生かしたHybridNeRFを提案する。
仮想現実分解能(2Kx2K)のリアルタイムフレームレート(少なくとも36FPS)を達成しながら、エラー率を15~30%改善する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 22:58:34 GMT)
Adaptive Negative Evidential Deep Learning for Open-set Semi-supervised Learning [69.8] オープンセット半教師付き学習(Open-set SSL)は、ラベル付きデータ(inliers)で観測されない新しいカテゴリ(outliers)を含むラベル付きデータとテストデータを含む、より実践的なシナリオである。
本研究では,様々な不確かさを定量化するための外乱検出器として顕在的深層学習(EDL)を導入し,自己学習と推論のための異なる不確実性指標を設計する。
Inlierとoutlierの両方を含むラベルなしデータセットに適合するように、新しい適応的負の最適化戦略を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:44:25 GMT)
HandBooster: Boosting 3D Hand-Mesh Reconstruction by Conditional Synthesis and Sampling of Hand-Object Interactions [68.3] HandBoosterは、データの多様性を向上し、3Dハンド・ミーシュ・リコンストラクションのパフォーマンスを向上する新しいアプローチである。
まず,多様な手やポーズ,ビュー,背景を持つリアルな画像を生成するために,拡散モデルを誘導する多目的コンテンツ認識条件を構築した。
そこで我々は,我々の類似性を考慮した分布サンプリング戦略に基づく新しい条件作成手法を設計し,トレーニングセットとは異なる,斬新で現実的なインタラクションのポーズを意図的に見つける。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:56:08 GMT)
LLatrieval: LLM-Verified Retrieval for Verifiable Generation [67.9] 検証可能な生成は、大きな言語モデル(LLM)がドキュメントをサポートするテキストを生成することを目的としている。
本稿では,LLatrieval (Large Language Model Verified Retrieval)を提案する。
実験により、LLatrievalは幅広いベースラインを著しく上回り、最先端の結果が得られることが示された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:36:46 GMT)
InterControl: Generate Human Motion Interactions by Controlling Every Joint [67.6] 関節間の所望距離を維持するために,新しい制御可能な運動生成手法であるInterControlを導入する。
そこで本研究では,既成の大規模言語モデルを用いて,ヒューマンインタラクションのための結合ペア間の距離を生成できることを実証した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:26:09 GMT)
CBQ: Cross-Block Quantization for Large Language Models [66.8] ポストトレーニング量子化(PTQ)は、超低コストで大規模言語モデル(LLM)を圧縮する上で重要な役割を果たしている。
LLMのためのクロスブロック再構成に基づくPTQ手法CBQを提案する。
CBQはリコンストラクションスキームを使用してクロスブロック依存関係を採用し、エラーの蓄積を最小限に抑えるために複数のブロックにまたがる長距離依存関係を確立する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:51:51 GMT)
Discovering and Mitigating Visual Biases through Keyword Explanation [66.7] 視覚バイアスをキーワードとして解釈するBias-to-Text(B2T)フレームワークを提案する。
B2Tは、CelebAの性別バイアス、ウォーターバードの背景バイアス、ImageNet-R/Cの分布シフトなど、既知のバイアスを特定することができる。
B2Tは、Dollar StreetやImageNetのような大きなデータセットで、新しいバイアスを明らかにする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:47:20 GMT)
InferDPT: Privacy-Preserving Inference for Black-box Large Language Model [66.1] InferDPTは、ブラックボックスLSMのプライバシ保護推論のための最初の実用的なフレームワークである。
RANTEXTはInferDPTの摂動モジュールに組み込まれた新しい微分プライバシー機構である。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:19:01 GMT)
Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.8] Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。
RAFは密集した室内音響データを提供する最初のデータセットである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:59:56 GMT)
TextCraftor: Your Text Encoder Can be Image Quality Controller [65.3] 拡散に基づくテキスト・画像生成モデル(例えば、安定拡散)は、コンテンツ生成の分野に革命をもたらした。
本研究では,テキスト・ツー・イメージ拡散モデルの性能を向上させるための微調整手法であるTextCraftorを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:52:55 GMT)
Emerging Trends in Federated Learning: From Model Fusion to Federated X Learning [65.1] フェデレートラーニング(Federated Learning)は、データ収集とモデルトレーニングを、マルチパーティの計算とモデルアグリゲーションを通じて分離する新しいパラダイムである。
我々は、他の学習アルゴリズムとともに、フェデレーション学習の焦点を絞った調査を行う。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:07:29 GMT)
Fact Checking Beyond Training Set [64.9] 本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:15:14 GMT)
Back to 3D: Few-Shot 3D Keypoint Detection with Back-Projected 2D Features [64.4] 3次元形状のキーポイント検出には意味的および幾何学的認識が必要である。
我々はキーポイント候補最適化モジュールを用いて,その形状上のキーポイントの平均分布を一致させる。
結果として得られたアプローチは、KeyPointNetデータセットで数ショットのキーポイント検出のための新しい状態を実現する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:46:59 GMT)
Unified Sequence-to-Sequence Learning for Single- and Multi-Modal Visual Object Tracking [64.3] SeqTrackは、ビジュアルトラッキングをシーケンス生成タスクとしてキャストし、オブジェクト境界ボックスを自動回帰的に予測する。
SeqTrackv2は補助モダリティのための統一インターフェースとタスクを指定するためのタスクプロンプトトークンのセットを統合している。
このシーケンス学習パラダイムは、トラッキングフレームワークを単純化するだけでなく、14の挑戦的なベンチマークで優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:23:12 GMT)
Debiasing Multimodal Large Language Models [61.7] LVLM(Large Vision-Language Models)は、コンピュータビジョンや自然言語処理において欠かせないツールとなっている。
本研究は,入力画像に先行するLarge Language Models (LLM) の影響を主に受け,生成したコンテンツに有意なバイアスが生じることを示す。
これらのバイアスを是正し、視覚情報に対するモデルの焦点をリダイレクトするために、我々は2つの単純で訓練のない戦略を導入する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:43:41 GMT)
A Channel-ensemble Approach: Unbiased and Low-variance Pseudo-labels is Critical for Semi-supervised Classification [61.5] 半教師付き学習(SSL)はコンピュータビジョンにおける実践的な課題である。
Pseudo-label (PL) メソッド、例えば FixMatch や FreeMatch は SSL で State of The Art (SOTA) のパフォーマンスを取得する。
本稿では,複数の下位PLを理論的に保証された非偏りと低分散のPLに集約する,軽量なチャネルベースアンサンブル法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:49:37 GMT)
Task-Adaptive Saliency Guidance for Exemplar-free Class Incremental Learning [60.5] EFCILにタスク適応型サリエンシを導入し、タスク適応型サリエンシ・スーパービジョン(TASS)と呼ばれる新しいフレームワークを提案する。
提案手法は,CIFAR-100, Tiny-ImageNet, ImageNet-Subset EFCILベンチマークを用いて,タスク間のサリエンシマップの保存や,最先端の成果の達成に有効であることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:33:42 GMT)
CAUSE: Counterfactual Assessment of User Satisfaction Estimation in Task-Oriented Dialogue Systems [60.3] 我々は,大規模言語モデル(LLM)を利用して,満足度を考慮した対実対話を生成する。
生成されたサンプルの信頼性を確保するために、人間のアノテーションを収集します。
この結果から,TODシステムにおけるユーザ満足度推定のためのデータ拡張手法の必要性が明らかになった。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 23:45:31 GMT)
LLMs Are Few-Shot In-Context Low-Resource Language Learners [59.7] In-context Learning (ICL) は、大規模言語モデル(LLM)に、表現不足の言語で多様なタスクを実行する権限を与える。
ICLとその言語間変動(X-ICL)を25の低リソース言語と7の比較的高リソース言語で検討した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:25:10 GMT)
Is Modularity Transferable? A Case Study through the Lens of Knowledge Distillation [59.4] 同族PLM間で事前訓練されたタスク固有のPEFTモジュールを転送するための極めて簡単なアプローチを提案する。
また,不整合性PLM間のモジュールの移動を,推論複雑性の変化を伴わずに行う方法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:50:00 GMT)
Long-form factuality in large language models [59.3] 大規模言語モデル(LLM)は、しばしば、オープンエンドトピックの事実検索プロンプトに応答するときに、事実エラーを含むコンテンツを生成する。
まず最初にGPT-4を用いて、38のトピックにまたがる何千もの質問からなるプロンプトセットであるLongFactを生成します。
そこで我々は,LLMエージェントを検索拡張現実性評価器 (SAFE) と呼ぶ手法により,長期的事実性の自動評価器として使用できることを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:48:55 GMT)
Efficient Test-Time Adaptation of Vision-Language Models [58.4] 事前学習された視覚言語モデルによるテスト時間適応は、テスト時間中に分散シフトに取り組むことに注目が集まっている。
我々は、視覚言語モデルによる効率的なテスト時間適応を可能にするトレーニングフリーな動的アダプタであるTDAを設計する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:37:51 GMT)
PPAD: Iterative Interactions of Prediction and Planning for End-to-end Autonomous Driving [57.9] PPAD(Iterative Interaction of Prediction and Planning Autonomous Driving)は、予測と計画のより良い統合を目的とした、タイムステップワイドなインタラクションである。
我々は,階層的動的キーオブジェクトに着目したego-to-agent,ego-to-map,ego-to-BEVインタラクション機構を設計し,インタラクションをモデル化する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:00:07 GMT)
OrCo: Towards Better Generalization via Orthogonality and Contrast for Few-Shot Class-Incremental Learning [57.4] FSCIL(Few-Shot Class-Incremental Learning)は、問題空間を限られたデータで拡張するパラダイムを導入する。
FSCILの手法は、データが漸進的に到着するにつれて、破滅的な忘れ込みの課題に直面している。
表現空間における特徴の直交性と対照的な学習という2つの基本原理に基づいて構築されたOrCoフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:30:48 GMT)
Probing Multimodal Large Language Models for Global and Local Semantic Representations [57.3] マルチモーダル大言語モデルのどの層がグローバルな画像情報に最も力を注いでいるかを検討する。
本研究では,モデルの中間層が,よりグローバルな意味情報を符号化できることを見出した。
最上位のレイヤが過度にローカル情報に集中していることが分かり、グローバル情報をエンコードする能力の低下につながります。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:59:57 GMT)
EMAGE: Towards Unified Holistic Co-Speech Gesture Generation via Expressive Masked Audio Gesture Modeling [57.1] 音声とマスクによるジェスチャーから全身の人間のジェスチャーを生成するためのフレームワークEMAGEを提案する。
まずBEAT2(BEAT-SMPLX-FLAME)というメッシュレベルの音声合成データセットを紹介した。
EmAGEは、最先端のパフォーマンスで全体的なジェスチャーを生成する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:06:36 GMT)
BLADE: Enhancing Black-box Large Language Models with Small Domain-Specific Models [56.9] 大規模言語モデル(LLM)は多用途であり、多様なタスクに対処することができる。
従来のアプローチでは、ドメイン固有のデータによる継続的な事前トレーニングを行うか、一般的なLLMをサポートするために検索拡張を採用する。
BLADEと呼ばれる新しいフレームワークを提案する。このフレームワークは、小さなDomain-spEcificモデルでブラックボックスのLArge言語モデルを拡張する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:57:21 GMT)
EASYTOOL: Enhancing LLM-based Agents with Concise Tool Instruction [56.0] EasyToolは、多種多様で長いツールドキュメントを統一的で簡潔なツール命令に変換するフレームワークである。
トークン使用量を大幅に削減し、現実のシナリオにおけるツール利用のパフォーマンスを向上させることができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:31:42 GMT)
DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.9] 判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:40:14 GMT)
NeuroPictor: Refining fMRI-to-Image Reconstruction via Multi-individual Pretraining and Multi-level Modulation [55.5] 本稿では,fMRI信号を用いた拡散モデル生成過程を直接変調することを提案する。
様々な個人から6万枚のfMRI画像ペアでトレーニングを行うことで,fMRI画像から画像へのデコーディング能力に優れたモデルが得られた。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:42:52 GMT)
Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models [55.3] Mini-Geminiはマルチモーダルビジョン言語モデル(VLM)を強化するフレームワーク
Mini-Gemini は 2B から 34B までの一連の高密度および高密度な MoE 言語モデル (LLM) をサポートしている。
いくつかのゼロショットベンチマークで主要なパフォーマンスを達成でき、開発済みのプライベートモデルを超えている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:59:04 GMT)
Reasoning over the Behaviour of Objects in Video-Clips for Adverb-Type Recognition [54.9] 本稿では,ビデオクリップから抽出したオブジェクトの振る舞いを理由として,クリップの対応する副詞型を認識するための新しいフレームワークを提案する。
具体的には、生のビデオクリップから人間の解釈可能な物体の挙動を抽出する新しいパイプラインを提案する。
生のビデオクリップから抽出したオブジェクト-振る舞い-ファクトのデータセットを2つリリースする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:17:46 GMT)
FoC: Figure out the Cryptographic Functions in Stripped Binaries with LLMs [54.3] 削除されたバイナリの暗号関数を抽出するFoCと呼ばれる新しいフレームワークを提案する。
FoC-BinLLMは、ROUGE-LスコアでChatGPTを14.61%上回った。
FoC-Simは52%高いRecall@1で過去のベストメソッドを上回っている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:45:33 GMT)
Byzantine-resilient Federated Learning With Adaptivity to Data Heterogeneity [54.1] 本稿では、ビザンツの悪意ある攻撃データの存在下でのグラディエント・ラーニング(FL)を扱う。
Average Algorithm (RAGA) が提案され、ロバストネスアグリゲーションを活用してデータセットを選択することができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:57:54 GMT)
InstructBrush: Learning Attention-based Instruction Optimization for Image Editing [54.1] InstructBrushは命令ベースの画像編集方法の逆変換手法である。
画像ペアから編集命令として編集効果を抽出し、さらに画像編集に適用する。
提案手法は,編集性能に優れ,目的の編集効果とセマンティックに一致している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:03:38 GMT)
GlotScript: A Resource and Tool for Low Resource Writing System Identification [53.6] GlotScriptは、低リソースの書き込みシステム識別のためのオープンリソースである。
GlotScript-Rは7000以上の言語に対して証明済みの書記システムを提供している。
GlotScript-Tは161のUnicode 15.0スクリプトをカバーする記述システム識別ツールである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:57:29 GMT)
Agent-Pro: Learning to Evolve via Policy-Level Reflection and Optimization [53.5] Agent-Proはポリシーレベルのリフレクションと最適化を備えたLLMベースのエージェントである。
過去の軌道と信念を反復的に反映し、より良い政策のために不合理な信念を微調整する。
Agent-Proは、BlackjackとTexas Hold'emの2つのゲームで評価され、バニラLLMと特殊モデルを上回っている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:34:57 GMT)
NeuSDFusion: A Spatial-Aware Generative Model for 3D Shape Completion, Reconstruction, and Generation [52.8] 3D形状生成は、特定の条件や制約に固執する革新的な3Dコンテンツを作成することを目的としている。
既存の方法は、しばしば3Dの形状を局所化されたコンポーネントの列に分解し、各要素を分離して扱う。
本研究では2次元平面表現を利用した空間認識型3次元形状生成フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:09:34 GMT)
L2B: Learning to Bootstrap Robust Models for Combating Label Noise [52.0] 本稿では,Learning to Bootstrap (L2B) という,シンプルで効果的な手法を提案する。
モデルは、誤った擬似ラベルの影響を受けずに、自身の予測を使ってブートストラップを行うことができる。
これは、実際の観測されたラベルと生成されたラベル間の重みを動的に調整し、メタラーニングを通じて異なるサンプル間の重みを動的に調整することで実現される。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 22:33:13 GMT)
A Wolf in Sheep's Clothing: Generalized Nested Jailbreak Prompts can Fool Large Language Models Easily [51.6] 大きな言語モデル(LLM)は有用で安全な応答を提供するように設計されている。
ジェイルブレイク」と呼ばれる 敵のプロンプトは 保護を回避できる
有効なジェイルブレイクプロンプトを生成するためにLLM自体を活用する自動フレームワークであるReNeLLMを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:29:31 GMT)
Generative Multi-modal Models are Good Class-Incremental Learners [51.6] クラス増分学習のための新しい生成型マルチモーダルモデル(GMM)フレームワークを提案する。
提案手法は適応生成モデルを用いて画像のラベルを直接生成する。
Few-shot CIL設定では、現在の最先端のすべてのメソッドに対して少なくとも14%精度が向上し、忘れてはならない。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:21:07 GMT)
Visually Guided Generative Text-Layout Pre-training for Document Intelligence [51.1] 視覚誘導型生成テキスト事前学習(ViTLP)を提案する。
文書画像が与えられた場合、モデルは階層言語とレイアウトモデリングの目的を最適化し、インターリーブされたテキストとレイアウトシーケンスを生成する。
ViTLPは、文書画像のテキストをローカライズし、認識するためのネイティブなOCRモデルとして機能する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:32:31 GMT)
Spectral Meets Spatial: Harmonising 3D Shape Matching and Interpolation [50.4] 本稿では,3次元形状の対応と形状の両面を統一的に予測する枠組みを提案する。
我々は、スペクトル領域と空間領域の両方の形状を地図化するために、奥行き関数写像フレームワークと古典的な曲面変形モデルを組み合わせる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:16:21 GMT)
Enhancing Generative Class Incremental Learning Performance with Model Forgetting Approach [50.4] 本研究は, ジェネレーティブ・クラス・インクリメンタル・ラーニング(GCIL, Generative Class Incremental Learning)への新たなアプローチを提案する。
我々は, 忘れる機構の統合により, 新たな知識獲得におけるモデルの性能が著しく向上することを発見した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:10:38 GMT)
Continual-MAE: Adaptive Distribution Masked Autoencoders for Continual Test-Time Adaptation [49.8] 連続的テスト時間適応(CTTA)は、ソース事前学習モデルから目標分布の連続的な変化に移行するために提案される。
提案手法は,CTTAタスクの分類とセグメンテーションの両方において,最先端の性能を実現する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:12:32 GMT)
Contrastive Pre-Training with Multi-View Fusion for No-Reference Point Cloud Quality Assessment [49.4] No-Reference Point Cloud Quality Assessment (NR-PCQA) は、歪んだ点雲の知覚的品質を、参照なしで自動的に評価することを目的としている。
我々は,PCQA(CoPA)に適した新しいコントラスト付き事前学習フレームワークを提案する。
提案手法は,最新のPCQA手法よりも高い性能を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:25:51 GMT)
How Does Message Passing Improve Collaborative Filtering? [49.0] 協調フィルタリング(CF)はレコメンダシステムに顕著な結果をもたらし、現実世界のアプリケーションに広く利用されている。
メッセージパッシングは、グラフベースの学習タスク全般の利点に似た方法でCFメソッドを支援する。
テスト時アグリゲーション(Test-time Aggregation for CF)は、推論時に一度だけメッセージパッシングを行うテスト時アグリゲーションフレームワークである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:53:04 GMT)
Beyond Static Evaluation: A Dynamic Approach to Assessing AI Assistants' API Invocation Capabilities [48.9] 人間の関与なしにアシスタントのAPIコール能力を評価するために,自動動的評価(Automated Dynamic Evaluation, AutoDE)を提案する。
この枠組みでは,人間と機械の相互作用において,真の人間の会話パターンを忠実に反映するように努力する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:22:53 GMT)
Leveraging Code to Improve In-context Learning for Semantic Parsing [48.7] In-context Learning (ICL) は、その少数ショットの性質と一般化の改善により、意味解析に魅力的なアプローチである。
我々は,(1)DSLの代わりにPythonなどの汎用プログラミング言語を用いた意味解析におけるICLの有効性を向上し,(2)ドメイン記述を構造化したプロンプトを増強する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:52:11 GMT)
LC-LLM: Explainable Lane-Change Intention and Trajectory Predictions with Large Language Models [48.5] 本稿では,Large Language Models (LLM) の強い推論能力と自己説明能力を活用する,説明可能なレーン変更予測モデルを提案する。
大規模高次元データセットに対する実験により,車線変化予測タスクにおけるLC-LLMの優れた性能と解釈性を示した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:34:55 GMT)
ViDA: Homeostatic Visual Domain Adapter for Continual Test Time Adaptation [48.0] 目標ドメインの継続的な変更に事前訓練されたモデルを適用するために、連続的なテスト時間適応タスクを提案する。
我々はCTTA用のVisual Domain Adapter (ViDA) を設計し、ドメイン固有知識とドメイン共有知識の両方を明示的に扱う。
提案手法は,CTTAタスクの分類とセグメント化の両方において,最先端の性能を実現する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:44:55 GMT)
Towards LLM-RecSys Alignment with Textual ID Learning [48.0] 我々は,各項目を一意で簡潔で,意味的にリッチで,プラットフォームに依存しないテキストIDとして表現するIDGenを提案する。
標準実験条件下では,IDGen が既存のモデルを常に上回り,逐次レコメンデーションすることを示す。
その結果、事前訓練された基礎モデルのゼロショット性能は、従来のレコメンデーションモデルに匹敵するか、それ以上に優れていることが示された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:22:37 GMT)
Towards Image Ambient Lighting Normalization [47.4] 環境照明正規化(ALN)は、より広い文脈で影間の相互作用を研究し、画像復元と影除去を統一する。
ベンチマークでは、様々な主流手法を選択し、Ambient6K上でそれらを厳格に評価する。
IFBlendは、Ambient6K上でSOTAスコアを達成し、従来のシャドウ除去ベンチマークで競合性能を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:20:55 GMT)
Intelligent Learning Rate Distribution to reduce Catastrophic Forgetting in Transformers [46.9] 変圧器ニューラルネットワークにおける破滅的忘れの問題について検討する。
フラットな学習率よりも優れた学習率分布が見つかる。
GLUEデータセットからの様々なNLPベンチマークを用いて,これらの学習率分布を検証する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:40:09 GMT)
Debiasing Sentence Embedders through Contrastive Word Pairs [46.9] NLP解に対する線形および非線形バイアス情報を除去する手法を検討する。
従来のバイアス指標と非線形情報を考慮に入れたバイアス指標の共通偏り評価手法との比較を行った。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:34:59 GMT)
RAP: Retrieval-Augmented Planner for Adaptive Procedure Planning in Instructional Videos [46.3] 本稿では,教育ビデオにおける適応的プロシージャ計画(Adaptive procedure planning)と呼ばれる,新しい実践的な設定を提案する。
RAPは自動回帰モデルアーキテクチャを用いて行動の結論を適応的に決定する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:22:40 GMT)
Measuring Political Bias in Large Language Models: What Is Said and How It Is Said [46.2] 政治問題に関するコンテンツの内容とスタイルの両方を分析し,LLMにおける政治的偏見を測定することを提案する。
提案尺度は, 生殖権や気候変動などの異なる政治課題を, それらのバイアスの内容(世代的物質)と様式(語彙的極性)の両方で考察する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:22:48 GMT)
Self-Contrast: Better Reflection Through Inconsistent Solving Perspectives [45.9] 研究によると、外部からのフィードバックがなければ、Large Language Modelの本質的なリフレクションは不安定である。
我々の調査によると、重要なボトルネックは自己評価されたフィードバックの品質である。
要求に合わせて様々な解決の観点を適応的に探求し、相違点を対比し、これらの相違点を再検討し、相違点を排除するために使用できるチェックリストにまとめます。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:24:47 GMT)
Ship in Sight: Diffusion Models for Ship-Image Super Resolution [45.6] 本稿では,クラス認識中にテキストコンディショニングを利用する拡散モデルに基づくアーキテクチャを提案する。
ShipSpottingfootnoteurlwww.shipspotting.comのWebサイトから、オンラインの船画像から抽出された大きなラベル付き船のデータセットも紹介します。
提案手法は, 従来の超解像に用いた他の深層学習モデルよりも頑健な結果が得られる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:06:36 GMT)
OpenMoE: An Early Effort on Open Mixture-of-Experts Language Models [44.8] OpenMoEは、完全にオープンソースで再現可能なデコーダのみのMixture-of-Experts (MoE)ベースの大規模言語モデル(LLM)のシリーズである。
本研究は,MoEをベースとしたLLMの方が高密度LLMよりも良好なコスト効率のトレードオフを提供できることを確認した。
MoEモデルにおけるルーティング決定は、主にトークンIDに基づいており、最小限のコンテキスト関連性がある。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:21:24 GMT)
Decomposing Disease Descriptions for Enhanced Pathology Detection: A Multi-Aspect Vision-Language Pre-training Framework [43.5] 医学的な視覚言語事前訓練は研究の最前線として現れ、ゼロショットの病理診断を可能にしている。
バイオメディカルテキストの複雑なセマンティクスのため、現在の方法では、医学的画像と、非構造化レポートの重要な病理学的所見の整合に苦慮している。
これは、大きな言語モデルと医療専門家に相談することで達成される。
近年の手法の精度は, それぞれ8.56%, 17.0%まで向上している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:51:59 GMT)
Weakly-Supervised Emotion Transition Learning for Diverse 3D Co-speech Gesture Generation [43.0] 本研究では,3次元アバターにおける鮮明で感情的な3次元共同音声ジェスチャを生成する新しい手法を提案する。
そこで我々は,ChatGPT-4と音声インペインティング手法を用いて,高忠実度感情遷移音声を構築する。
本手法は,1つの感情条件に適応して構築した最先端モデルよりも優れる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:01:22 GMT)
Rotation-Invariant Transformer for Point Cloud Matching [42.6] 我々は,回転不変変換器であるRoITrを導入し,点クラウドマッチングタスクにおけるポーズ変動に対処する。
本稿では,自己認識機構によって学習した,回転不変なクロスフレーム空間認識を備えたグローバルトランスフォーマーを提案する。
RoITrは、Inlier RatioとRegistration Recallの点で、既存のメソッドを少なくとも13と5のパーセンテージで上回っている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:00:18 GMT)
Backpropagation-free Network for 3D Test-time Adaptation [42.5] テスト時間適応(TTA)法は、計算的に重く、メモリ集約的なバックプロパゲーションに基づくアプローチを適用する傾向がある。
本稿では,TTAのバックプロパゲーションフリーアプローチを3次元データの特定の場合に適用する手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:50:24 GMT)
Mechanisms of non-factual hallucinations in language models [42.5] State-of-the-art Language Model (LM) は、世界の知識と混同する非現実的な幻覚を生じることがある。
本研究では,幻覚の機械的原因,特にLMが対象属性を不正確に予測する非現実的原因について検討した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 00:23:03 GMT)
Toward Interactive Regional Understanding in Vision-Large Language Models [42.4] 明示的な地域モデリング機能を備えたtextbfRegionVLM を導入する。
我々は、新しい情報ソース、すなわちローカライズド・ナラティブを含むデータセットを活用する。
本実験は,対話型対話システムを実現するだけでなく,様々なゼロショット領域理解タスクにおいて優れた性能を示すことを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:22:06 GMT)
Fast Dynamic 3D Object Generation from a Single-view Video [42.1] 本稿では,効率的な4Dオブジェクト生成フレームワークであるEfficient4Dを提案する。
異なるカメラビューの下で高品質な時空一貫性の画像を生成し、ラベル付きデータとして使用する。
合成ビデオと実ビデオの実験によると、Efficient4Dのスピードは20倍に向上している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:33:02 GMT)
Addressing Data Annotation Challenges in Multiple Sensors: A Solution for Scania Collected Datasets [41.7] 自動運転車のデータアノテーションは、ディープニューラルネットワーク(DNN)ベースのモデルの開発における重要なステップである。
この記事では、主にScaniaが収集したデータセットのコンテキスト内で、この問題に対処することに焦点を当てます。
提案手法は,アノテートされた物体の軌跡を入力とし,移動水平推定(MHE)を用いてその速度を頑健に推定する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:56:44 GMT)
ProSwitch: Knowledge-Guided Language Model Fine-Tuning to Generate Professional and Non-Professional Styled Text [41.6] 本研究は、テキストプロフェッショナル主義に焦点をあて、ProSwitchという新しい方法論を導入する。
ProSwitchは、知識誘導型インストラクションチューニングを通じて、プロフェッショナルと非プロフェッショナルの両方のレスポンスを生成できる言語モデルを備えている。
汎用言語モデルと特殊言語モデルの比較分析により,プロと非プロのテキスト生成の切り替えにおいて,本手法がベースラインを上回っていることが判明した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:02:55 GMT)
Cross--domain Fiber Cluster Shape Analysis for Language Performance Cognitive Score Prediction [41.0] 脳画像における形状解析は、人間の脳の構造と機能の相関を解釈するのに役立ちます。
拡散磁気共鳴画像(dMRI)による脳の3D点配列の再構成を行った。
本稿では,マルチヘッド型クロスアテンション機能融合モジュールを利用して,対象言語の性能を予測する新しいフレームワーク,シェイプフューズファイバクラスタトランス (SFFormer) を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:51:02 GMT)
InfoCTM: A Mutual Information Maximization Perspective of Cross-Lingual Topic Modeling [40.5] 言語間トピックモデルは、一致した潜在トピックを明らかにすることによって、言語間テキスト分析において一般的である。
既存のほとんどの手法は、低被覆辞書によるさらなる分析と性能低下を妨げる反復的なトピックの生成に悩まされている。
本稿では,相互情報を用いた多言語トピックモデリング(InfoCTM)を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:53:42 GMT)
Vulnerability Detection with Code Language Models: How Far Are We? [40.5] PrimeVulは、脆弱性検出のためのコードLMのトレーニングと評価のための新しいデータセットである。
これは、人間の検証されたベンチマークに匹敵するラベルの精度を達成する、新しいデータラベリング技術を含んでいる。
また、厳密なデータ重複解消戦略と時系列データ分割戦略を実装して、データの漏洩問題を軽減している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:34:29 GMT)
MonoHair: High-Fidelity Hair Modeling from a Monocular Video [40.3] MonoHairはモノクロビデオから高忠実度毛髪再構築を実現するための汎用フレームワークである。
提案手法は, 毛髪のモデリング過程を, 正確な外装再構築と内部構造推定の2つの段階に分岐させる。
実験により,本手法は多彩なヘアスタイルにまたがって頑健性を示し,最先端の性能を実現していることが示された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:48:47 GMT)
Point, Segment and Count: A Generalized Framework for Object Counting [40.2] クラスに依存しないオブジェクトカウントは、例ボックスやクラス名に関して、イメージ内のすべてのオブジェクトをカウントすることを目的としている。
本稿では,検出に基づく少数ショットとゼロショットの両方のオブジェクトカウントのための一般化されたフレームワークを提案する。
PseCoは、少数ショット/ゼロショットオブジェクトカウント/検出の両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:01:44 GMT)
Functional Graph Convolutional Networks: A unified multi-task and multi-modal learning framework to facilitate health and social-care insights [40.0] 本稿では,デジタルヘルスと縦断研究におけるマルチタスクとマルチモーダル学習の複雑さに対処する,関数型グラフ畳み込みネットワーク(funGCN)フレームワークを提案する。
funGCNは複数のエンティティに対して複数変数の長手データを処理する統一的なアプローチを提供し、小さなサンプルサイズであっても解釈可能である。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:57:20 GMT)
SemEval Task 1: Semantic Textual Relatedness for African and Asian Languages [39.8] 意味的テクスト関連性(STR)に関する最初の共有課題を提示する。
14言語にまたがる意味的関連性の広範な現象について検討する。
これらの言語は5つの異なる言語族の出身であり、主にアフリカとアジアで話されている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:30:26 GMT)
Formal Verification of Consistency for Systems with Redundant Controllers [39.7] NRP FDと呼ばれるアルゴリズムは、可用性よりも一貫性を優先することでこの問題を解決する。
モデリングと形式検証を併用して NRP FD で2つのプライマリコントローラを同時に持つという問題を発見した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:08:49 GMT)
Recurrent Action Transformer with Memory [39.6] オフラインの強化学習では、イベント自体と決定ポイントの両方をモデルで捉えることが不可欠である。
この問題の解決策の1つは、メモリ機構によるトランスフォーマーの強化である。
本稿では,リカレントメモリを組み込んだRecurrent Action Transformer with Memory (RATE)を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:02:58 GMT)
BEVUDA: Multi-geometric Space Alignments for Domain Adaptive BEV 3D Object Detection [38.9] 視覚中心の鳥眼視(BEV)の認識は、自律運転において有望な可能性を示している。
最近の研究は主に効率や精度の向上に重点を置いているが、環境の変化に直面している場合の課題は無視されている。
ドメインシフトの蓄積を容易にするために,マルチスペースアライメント・教師学生(MATS)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:50:54 GMT)
Beyond Embeddings: The Promise of Visual Table in Multi-Modal Models [38.6] 視覚表現学習はコンピュータビジョンの基盤であり、人間の注釈付きラベルによる教師付き学習から、インターネットからのイメージテキストペアの整列へと進化してきた。
近年のMLLM(Multi-modal large language model)の発展にもかかわらず、CLIP埋め込みのような視覚的な表現は、現実世界の視覚的推論に不可欠な外部世界の知識へのアクセスを欠いていることが多い。
本稿では,MLLM に適した新しい視覚表現である Visual Table を提案する。シーン記述と,カテゴリ,属性,知識をインスタンスレベルで包含する複数のオブジェクト中心記述からなる,全体的視覚シーンの階層的なテキスト記述を提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:49:23 GMT)
Conditions on Preference Relations that Guarantee the Existence of Optimal Policies [38.2] 部分的に観測可能な非マルコフ環境におけるLfPF問題を解析するための新しいフレームワークを提案する。
報酬関数が学習目標を表現できない場合でも、意思決定問題は最適ポリシーを持つことができることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 22:03:46 GMT)
CT-3DFlow : Leveraging 3D Normalizing Flows for Unsupervised Detection of Pathological Pulmonary CT scans [37.7] 正規化フロー(NF)は、非可逆アーキテクチャを通じてトレーニング例の確率分布を直接学習する能力を持つ。
我々はこの特性をCT-3DFlowと呼ばれる新しい3次元NFモデルで利用し、特に胸部CTデータにおける患者レベルの肺病理診断に特化している。
本モデルは健康な3次元肺CTパッチで教師なしの訓練を行い,異常としてログ状分布から逸脱を検出する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:44:57 GMT)
Density-guided Translator Boosts Synthetic-to-Real Unsupervised Domain Adaptive Segmentation of 3D Point Clouds [36.3] 3次元合成-非教師なしドメイン適応セグメンテーションは、新しいドメインのアノテートに不可欠である。
本稿では,ドメイン間の点密度を変換し,DGT-STという2段階の自己学習パイプラインに統合する密度誘導型トランスレータを提案する。
2つの合成と実のセグメンテーションタスクの実験は、DGT-STが最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:28:57 GMT)
Learning Concept-Based Causal Transition and Symbolic Reasoning for Visual Planning [36.1] ビジュアルプランニングは、人間が望ましい目標を達成するために意思決定する方法をシミュレートする。
本稿では,解釈可能で汎用的な視覚計画フレームワークを提案する。
我々のフレームワークは、未確認のタスクトラジェクトリ、未確認のオブジェクトカテゴリ、実世界のデータに一般化できることを示します。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:54:35 GMT)
Scaling Vision-and-Language Navigation With Offline RL [35.6] 本稿では,VLN-ORLの新しい問題設定について紹介する。
本稿では,VLNエージェントを訓練するためのデータセットの最適度を考慮に入れた,単純かつ効果的な報酬条件付きアプローチを提案する。
本実験は,提案手法が性能改善につながることを示すものである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:13:20 GMT)
Adapting Knowledge for Few-shot Table-to-Text Generation [35.6] AKG(Adapt-Knowledge-to-Generate)という新しいフレームワークを提案する。
AKGはラベルのないドメイン固有の知識をモデルに適応させ、少なくとも3つの利点をもたらす。
本モデルでは,人間の評価と自動評価により,流速,精度の両面において優れた性能を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:46:56 GMT)
Hybrid Video Diffusion Models with 2D Triplane and 3D Wavelet Representation [35.5] 複雑な依存関係をより効率的にキャプチャできるHVtemporalDMというハイブリッドビデオオートエンコーダを提案する。
HVDMは、ビデオの歪んだ表現を抽出するハイブリッドビデオオートエンコーダによって訓練される。
当社のハイブリッドオートエンコーダは、生成されたビデオに詳細な構造と詳細を付加した、より包括的なビデオラテントを提供します。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 00:51:01 GMT)
Retrieval-Augmented Generation for AI-Generated Content: A Survey [35.3] Retrieval-Augmented Generation (RAG) はそのような課題に対処するためのパラダイムとして最近登場した。
RAGは情報検索プロセスを導入し、利用可能なデータストアから関連オブジェクトを検索することで生成プロセスを強化する。
本稿では,RAG手法をAIGCシナリオに統合する既存の取り組みを概観的にレビューする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:00:25 GMT)
Attacks, Defenses and Evaluations for LLM Conversation Safety: A Survey [34.7] 大規模言語モデル(LLM)が会話アプリケーションで一般的なものになった。
有害な反応を引き起こすために悪用されるリスクは、深刻な社会的懸念を引き起こしている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:55:14 GMT)
AIC-UNet: Anatomy-informed Cascaded UNet for Robust Multi-Organ Segmentation [34.5] 既存のエンコーダ・デコーダセグメンテーションモデルに解剖学的制約を課す新しいアプローチを導入する。
歪んだ事前は復号フェーズ中に統合され、より解剖学的にインフォームドされた予測のためにモデルを導出する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:46:24 GMT)
Efficient Heatmap-Guided 6-Dof Grasp Detection in Cluttered Scenes [34.4] 広範に使われているヒートマップは6次元グリップ生成の効率において過小評価されていることを示す。
そこで本研究では,グローバル・ローカル・セマンティック・ツー・ポイント方式で推定する,効果的な局所的把握ジェネレータとグリップ・ヒートマップをガイダンスとして提案する。
我々のフレームワークは、リアルタイムに高品質な把握検出を行い、最先端の結果を得ることができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:24:58 GMT)
ObjectDrop: Bootstrapping Counterfactuals for Photorealistic Object Removal and Insertion [34.3] 拡散モデルは画像編集に革命をもたらしたが、しばしば物理法則に違反した画像を生成する。
本稿では,qcounterfactal データセットを中心とした実用的ソリューションを提案する。
このデータセット上で拡散モデルを微調整することで、オブジェクトを除去するだけでなく、シーンへの影響も除去できるのです。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:59:52 GMT)
Towards Non-Exemplar Semi-Supervised Class-Incremental Learning [33.6] クラス増分学習は、古いクラスの識別性を保ちながら、新しいクラスを徐々に認識することを目的としている。
コントラスト学習と半教師付きインクリメンタルプロトタイプ分類器(Semi-IPC)を用いた非経験的半教師付きCILフレームワークを提案する。
Semi-IPCは教師なしの正規化で各クラスのプロトタイプを学習し、部分的にラベル付けされた新しいデータからモデルを漸進的に学習することを可能にする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:28:19 GMT)
Multi-scale Unified Network for Image Classification [33.6] CNNは、実世界のマルチスケール画像入力を扱う際に、性能と計算効率において顕著な課題に直面している。
本稿では,マルチスケール,統一ネットワーク,スケール不変制約からなるMultiscale Unified Network(MUSN)を提案する。
MUSNは精度が44.53%向上し、マルチスケールシナリオではFLOPを7.01-16.13%減少させる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:40:26 GMT)
Branch-Tuning: Balancing Stability and Plasticity for Continual Self-Supervised Learning [33.6] 自己教師付き学習(SSL)は、膨大な量のラベルのないデータから一般的な表現を導出するための効果的なパラダイムとして登場した。
これは、新しい情報に適応する際の安定性と可塑性のバランスを崩すことに挑戦する。
本稿では,SSLの安定性と可塑性のバランスを両立させる手法であるブランチチューニングを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:38:48 GMT)
Boosting Object Detection with Zero-Shot Day-Night Domain Adaptation [33.1] 精巧なデータで訓練された検出器は、可視性が低いため、低照度データに対して顕著な性能低下を示す。
我々は、ゼロショット昼夜領域適応による低照度物体検出の高速化を提案する。
本手法は,低照度データを必要とすることなく,高照度シナリオから低照度シナリオへの検出器の一般化を行う。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:23:16 GMT)
TULIP: Transformer for Upsampling of LiDAR Point Cloud [32.8] LiDAR Upは、ロボットや自動運転車の認識システムにとって難しいタスクだ。
近年の研究では、3次元ユークリッド空間からのLiDARデータを2次元画像空間の超解像問題に変換することでこの問題を解決することを提案する。
低分解能LiDAR入力から高分解能LiDAR点雲を再構成する新しい方法であるTジオメトリを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:24:56 GMT)
Quantum Random Access Codes Implementation for Resource Allocation and Coexistence with Classical Telecommunication [32.7] 現代の量子ネットワークは、異なるユーザー間でリソースを分配する能力に制限がある。
資源割り当ての観点から、符号化と復号化の戦略を実験的に検証する。
共存する古典的コミュニケーションをエミュレートすることにより、ノイズの存在下で実装のレジリエンスをテストする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:46:50 GMT)
Distilling ODE Solvers of Diffusion Models into Smaller Steps [32.5] 本稿では, ODEソルバの定式化を基礎とした蒸留法であるDistilled-ODE solverを紹介する。
本手法は学習自由サンプリングと学習ベースサンプリングの両方の長所をシームレスに統合する。
従来の蒸留法と比較して計算オーバーヘッドは無視できる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:07:20 GMT)
VersaT2I: Improving Text-to-Image Models with Versatile Reward [32.3] VersaT2Iは、あらゆるテキスト・トゥ・イメージ(T2I)モデルの性能を向上させる汎用的なトレーニングフレームワークである。
画像の品質を、美学、テキストイメージアライメント、幾何学、低レベルの品質など、いくつかの側面に分解する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:08:41 GMT)
CAFE: Towards Compact, Adaptive, and Fast Embedding for Large-scale Recommendation Models [32.3] 既存の埋め込み圧縮ソリューションは、メモリ効率、低レイテンシ、動的データ分散への適応性の3つの重要な設計要件を同時に満たすことはできない。
Caffeは、上記の要件に対処するコンパクトで適応的で高速な埋め込み圧縮フレームワークである。
Caffe は既存の埋め込み圧縮法を著しく上回り、Criteo Kaggle データセットと CriteoTB データセットで10000倍の圧縮比で AUC を3.92%と3.68%上回っている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:14:14 GMT)
Learning Quadruped Locomotion Using Differentiable Simulation [31.8] 微分可能シミュレーションはより高速な収束とより安定した訓練を約束する。
我々のフレームワークは、ひとつのシミュレーションロボットを用いて、数分で四足歩行を学習することができる。
われわれのアプローチでは、四足歩行ロボットは、トロット、ペース、バウンド、ガロップなどの多様な移動スキルを、数分で挑戦的な地形で習得できる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:24:55 GMT)
Generalization Bounds: Perspectives from Information Theory and PAC-Bayes [31.8] PAC-Bayesianアプローチは、機械学習アルゴリズムの一般化機能に対処するための柔軟なフレームワークとして確立されている。
一般化に関する情報理論的な視点が発達し、一般化と様々な情報手段の関係が確立された。
本稿では,2つの視点が共通する手法と結果を提示し,異なるアプローチと解釈について議論する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:07:47 GMT)
CLIP-DINOiser: Teaching CLIP a few DINO tricks for open-vocabulary semantic segmentation [31.3] アノテーションを必要としないオープン語彙セマンティックセマンティックセマンティクス法を提案する。
使用済みの自己教師機能プロパティは,CLIP機能から直接学習可能であることを示す。
我々のCLIP-DINOiser法は,CLIPの1つの前方通過と2つの軽い畳み込み層のみを必要とする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:18:04 GMT)
MA4DIV: Multi-Agent Reinforcement Learning for Search Result Diversification [30.9] 我々は,MARL(Multi-Agent reinforcement learning)を検索結果のDIVersity(MA4DIV)に導入する。
このアプローチでは、各文書はエージェントであり、検索結果の多様化は複数のエージェント間の協調的なタスクとしてモデル化される。
我々は,MA4DIVが産業規模データセット上の既存のベースラインよりも有効性と効率の両面で大幅に向上していることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:28:53 GMT)
Intent-Aware DRL-Based Uplink Dynamic Scheduler for 5G-NR [30.1] 産業用インターネット・オブ・モノのユーザ機器(IIoT UE)を意図的(QoS要求品質)とランダムなトラフィック到着で支援する問題について検討する。
利用可能な通信資源のスケジューリング方法を学ぶために,DRLに基づく時間周波数リソースの集中型動的スケジューラを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:57:15 GMT)
E4S: Fine-grained Face Swapping via Editing With Regional GAN Inversion [30.1] E4S (Editing for swapping) は, きめ細かい顔編集の観点から, 顔交換の新しいアプローチである。
本稿では,形状とテクスチャの明示的なアンタングル化を可能にする地域GANインバージョン(RGI)手法を提案する。
私たちのE4Sは、テクスチャ、形状、照明を保存するための既存の方法よりも優れています。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:23:28 GMT)
Stock Recommendations for Individual Investors: A Temporal Graph Network Approach with Diversification-Enhancing Contrastive Learning [30.1] 複雑な金融市場では、レコメンダシステムは個人に情報的な決定を強制する上で重要な役割を果たす。
有効株式推薦システムを開発するためには,1)個人の選好,2)ポートフォリオの多様化,3)株式の特徴と個人の選好の時間的側面の3つの重要な側面を考慮する必要がある。
PfoTGNRecは時間的に異なる協調的な信号を処理し、多変量化によるコントラスト学習を取り入れたポートフォリオ時間グラフネットワークレコメンデータである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:17:55 GMT)
SemRoDe: Macro Adversarial Training to Learn Representations That are Robust to Word-Level Attacks [29.9] 本稿では,セマンティック・ロバスト・ディフェンス(Semantic Robust Defence, セマンティック・ロバスト・ディフェンス, セマンティック・ロバスト・ディフェンス, セマンティック・ロバスト・ディフェンス, セマンティック・ロバスト・ディフェンス, セマンティック・ロバスト・ディフェンス, セマンティック・ロバスト・ディフェンス)
この2つの領域を橋渡しする頑健な表現を学習する。
結果は、最先端の堅牢性を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:24:25 GMT)
Robust Active Speaker Detection in Noisy Environments [29.8] 雑音環境下での頑健なアクティブ話者検出(rASD)問題を定式化する。
既存のASDアプローチは、音声と視覚の両モードを利用するが、周囲の環境における非音声は、性能に悪影響を及ぼす可能性がある。
雑音のない音声特徴を学習するためのガイダンスとして,音声・視覚的音声分離を利用した新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:52:30 GMT)
Few-shot Online Anomaly Detection and Segmentation [29.7] 本稿では,難易度の高いオンライン異常検出・セグメンテーション(FOADS)の課題に対処することに焦点を当てる。
FOADSフレームワークでは、モデルを数ショットの通常のデータセットでトレーニングし、その後、正常サンプルと異常サンプルの両方を含む未ラベルのストリーミングデータを活用することで、その能力の検査と改善を行う。
限られたトレーニングサンプルを用いた性能向上のために,ImageNetで事前学習したCNNから抽出したマルチスケール特徴埋め込みを用いて,ロバストな表現を得る。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:24:00 GMT)
PIE-NeRF: Physics-based Interactive Elastodynamics with NeRF [29.6] 物理シミュレーションをNeRFとシームレスに統合することで,現実世界の物体の高品質なエラストダイナミックスを生成できることを示す。
2次一般化移動最小二乗(Q-GMLS)を用いて、非線型力学と暗黙モデル上の大きな変形を捉える。
我々は、非線形シミュレーションの複雑さを著しく低減するために、最小二乗核をNeRF密度場に従って適応的に配置する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 23:49:07 GMT)
No-Regret Learning in Bilateral Trade via Global Budget Balance [29.5] 我々は、様々なフィードバックモデルの下で、敵対的二元貿易のための最初のノンレグレットアルゴリズムを提供する。
フルフィードバックモデルでは、学習者は後見の最高の固定価格に対して$tilde O(sqrtT)$ regretを保証できる。
また,1ビットフィードバックを伴って,$tilde O(T3/4)$ regret upper boundを保証した学習アルゴリズムも提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:44:21 GMT)
Uncertainty-Aware Deployment of Pre-trained Language-Conditioned Imitation Learning Policies [29.0] 本稿では,事前学習した言語条件の模倣学習エージェントの,不確実性を考慮したデプロイ手法を提案する。
具体的には、温度スケーリングを用いてこれらのモデルをキャリブレーションし、キャリブレーションされたモデルを利用して不確実性を認識した決定を行う。
本稿では,3つの事前学習モデルを用いてシミュレーションを行い,タスク完了率を大幅に向上させる可能性を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:19:36 GMT)
Preventing Arbitrarily High Confidence on Far-Away Data in Point-Estimated Discriminative Neural Networks [29.0] ReLUネットワークは、テストデータがトレーニングセットから遠く離れている場合、ほぼ常に高い信頼性の予測が得られることが示されている。
我々は、余剰クラスのロジットに対応するニューラルネットワークの出力に項を追加することで、この問題を克服する。
この技術は、簡易な識別点推定訓練を維持しながら、遠距離試験データに対する任意に高い信頼を確実に防止する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:44:22 GMT)
Minimax Optimal Fair Classification with Bounded Demographic Disparity [28.9] 本稿では,2つの保護群による公正二項分類の統計的基礎について考察する。
有限サンプルを用いると、グループ固有の受容閾値を推定する必要があるため、追加のコストが発生することを示す。
オフセットを持つグループワイドしきい値法であるFairBayes-DDP+を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:59:04 GMT)
Bayesian Learned Models Can Detect Adversarial Malware For Free [28.5] 対数訓練は有効な方法であるが、大規模データセットにスケールアップするには計算コストがかかる。
特にベイズ式はモデルパラメータの分布を捉えることができ、モデル性能を犠牲にすることなく不確実性を定量化することができる。
ベイズ学習法で不確実性を定量化することで、敵のマルウェアを防御できることがわかった。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:16:48 GMT)
AcTED: Automatic Acquisition of Typical Event Duration for Semi-supervised Temporal Commonsense QA [28.4] イベントの典型的な期間を自動的に取得するための投票駆動型アプローチを提案する。
擬似ラベルは驚くほど高い精度とバランスの取れたカバレッジを示す。
当社のベストアプローチは、エクササイズマッチを7%改善した最先端のパフォーマンスを確立することです。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:33:42 GMT)
Temporal Graph Networks for Graph Anomaly Detection in Financial Networks [28.4] 本稿では,時間グラフネットワーク(TGN)の財務異常検出への応用について検討する。
我々はTGNの性能を静的グラフネットワーク(GNN)ベースライン、最先端ハイパーグラフニューラルネットワークベースラインと比較する。
以上の結果から,TGNはAUCの指標で他のモデルよりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:17:16 GMT)
SuPerPM: A Large Deformation-Robust Surgical Perception Framework Based on Deep Point Matching Learned from Physical Constrained Simulation Data [28.3] データアソシエーションのための学習に基づく非剛性点クラウドマッチングを利用する外科的知覚フレームワークSuPerPMを提案する。
提案手法は, 大規模な変形を特徴とする, 難易度の高い外科的データセット上で実証された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:15:27 GMT)
Improving Attributed Text Generation of Large Language Models via Preference Learning [28.1] 属性タスクを選好学習としてモデル化し,自動選好最適化フレームワークを導入する。
APOは、回答品質の高い最先端の引用F1を達成する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:19:13 GMT)
Self-supervised co-salient object detection via feature correspondence at multiple scales [27.7] 本稿では,画像群における2段階の自己教師型手法を用いて,セグメンテーションアノテーションを必要とせず,共起性有色物体(CoSOD)を検出する手法を提案する。
我々は、画像間の局所パッチレベルの特徴対応を計算し、コサレント領域を検出する自己教師ネットワークを訓練する。
3つのCoSODベンチマークデータセットの実験では、我々のモデルは、対応する最先端モデルよりも大きなマージンで優れています。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:48:34 GMT)
Capability-aware Prompt Reformulation Learning for Text-to-Image Generation [27.6] テキスト・ツー・イメージ・ジェネレーション・システムは、芸術的創造の領域において革命的なツールとして登場した。
これらのシステムの有効性は、ユーザが提供するプロンプトの品質と密接に関連している。
本稿では,対話ログからユーザ更新データを活用して,自動的なプロンプト更新モデルを構築することで,この問題に対処する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:41:16 GMT)
Intrinsic Subgraph Generation for Interpretable Graph based Visual Question Answering [27.2] グラフに基づく視覚質問応答(VQA)に対する解釈可能なアプローチを提案する。
本モデルは,問合せ処理中に本質的にサブグラフを生成するように設計されている。
生成した部分グラフを,グラフニューラルネットワークの確立したポストホックな説明可能性法と比較し,人的評価を行う。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:07:59 GMT)
Benchmarking Object Detectors with COCO: A New Path Forward [26.8] Common Objects in Context (COCO)データセットは、過去10年にわたってオブジェクト検出器のベンチマークに役立っている。
高ラベルモデルが出現すると、COCOのこれらのエラーが、オブジェクト検出器を確実にベンチマークする上で、その有用性を妨げているかどうかを問う。
我々は,不正確なマスク境界,非排他的アノテーション付インスタンス,誤動作マスクなど,さまざまなタイプのエラーを明らかにする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:59:53 GMT)
Towards Regulatable AI Systems: Technical Gaps and Policy Opportunities [26.5] AIの専門家は、規制要件に準拠するために、AIシステムをどの程度精査できるだろうか?
2つの公共セクターの調達チェックリストのレンズを通してこの問題を調査する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:11:30 GMT)
Generative 3D Part Assembly via Part-Whole-Hierarchy Message Passing [26.4] 生成3D部品の組み立ては、部品の関係を理解し、現実的な3D形状を組み立てるための6-DoFのポーズを予測する。
効率的な3次元部分集合のための部分階層型メッセージパッシングネットワークを提案する。
PartNetデータセットを用いた実験結果から,本手法は部分的な最先端性能と接続精度を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:13:52 GMT)
Demonstration of a parity-time symmetry breaking phase transition using superconducting and trapped-ion qutrits [26.2] 我々は、この非平衡相転移を実現することができる3レベル量子系であるクォートリットを示す。
結果は、物理効果をシミュレートするマルチレベル(量子)プロセッサの潜在的な利点を示している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:46:42 GMT)
Dual Instruction Tuning with Large Language Models for Mathematical Reasoning [26.0] 本稿では,前方方向と逆方向の両方から数学的推論をモデル化するための二重命令チューニング手法を提案する。
これには、中間推論状態予測タスク(フォワード推論)とインストラクション再構築タスク(リバース推論)を導入して、LCMの理解と命令の実行を強化することが含まれる。
総合的な実験は、様々な数学的推論タスクにまたがる二重命令チューニング戦略の有効性と領域一般化を検証した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:43:58 GMT)
Preference-Based Planning in Stochastic Environments: From Partially-Ordered Temporal Goals to Most Preferred Policies [25.7] マルコフ決定過程としてモデル化されたシステムは、時間的に拡張された一連の目標に対して部分的に順序づけられた選好を考慮に入れている。
部分的に順序づけられた選好を計画するために、時間的目標に対する選好をMDPの政策に対する選好にマッピングする順序理論を導入する。
順序付けの下で最も好まれるポリシーは、MDP内の有限経路上の非支配確率分布を誘導する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:46:09 GMT)
Boosting Conversational Question Answering with Fine-Grained Retrieval-Augmentation and Self-Check [25.6] 本稿では,対話型質問応答のための細粒度検索と自己チェックを組み込んだ対話レベルのRAG手法を提案する。
特に,本手法は,対話型質問精算器,きめ細かい検索器,自己チェックに基づく応答生成器の3つのコンポーネントから構成される。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:20:18 GMT)
Mitigating Hallucinations in Large Vision-Language Models with Instruction Contrastive Decoding [25.5] 本稿では,LVLM推論における幻覚の低減を目的とした,命令コントラストデコーディング(ICD)手法を提案する。
本手法は,マルチモーダル核融合モジュールにおいて,外乱指示が幻覚を著しく悪化させるという観察に着想を得たものである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:04:47 GMT)
Object Pose Estimation via the Aggregation of Diffusion Features [25.1] 画像から物体のポーズを推定することは、3Dシーン理解において重要な課題である。
最近のアプローチは、目に見えないオブジェクトを扱う場合、大幅なパフォーマンス低下を経験します。
粒度の異なる拡散特性を効果的に捕捉・集約できる3つの異なるアーキテクチャを提案する。
提案手法は,3つのベンチマークデータセットに対して,最先端の手法よりもかなりの差がある。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:35:24 GMT)
ABScribe: Rapid Exploration & Organization of Multiple Writing Variations in Human-AI Co-Writing Tasks using Large Language Models [24.8] ABScribeは、迅速かつ視覚的に構造化され、探索され、書込みのバリエーションの組織化をサポートするインタフェースである。
ABScribeでは、再利用可能なボタンに自動変換されるLSMプロンプトを使用して、変更を迅速に修正することができる。
変化はテキストフィールドに隣接して格納され、ポップアップツールバー上のマウスオーバーインタラクションを用いた高速なインプレース比較を行う。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:38:00 GMT)
Task-wise Sampling Convolutions for Arbitrary-Oriented Object Detection in Aerial Images [24.5] Arbitrary-oriented Object Detection (AOOD) は、リモートセンシング画像において、様々な方向のオブジェクトを発見・分類するために広く応用されている。
本稿では,タスクワイドサンプリング畳み込み(TS-Conv)と呼ばれるAOOD手法を提案する。
TS-Convは、各センシティブな領域からタスクワイズな特徴を適応的にサンプリングし、これらの特徴をアライメントしてマッピングすることで、より優れた予測のための動的ラベル割り当てをガイドする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:16:02 GMT)
A Recommender System for NFT Collectibles with Item Feature [24.2] 本稿では,さまざまなデータソースを用いて高精度なレコメンデーションを生成するNFTのためのレコメンデーションシステムを提案する。
本研究では,データ効率のよいグラフベースのレコメンデーションシステムを構築し,各項目とユーザ間の複雑な関係を効率的に把握する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:59:39 GMT)
FoMo-Bench: a multi-modal, multi-scale and multi-task Forest Monitoring Benchmark for remote sensing foundation models [24.1] 第1回森林モニタリングベンチマーク(FoMo-Bench)について紹介する。
FoMo-Benchは、衛星、航空、在庫データを含む15の多様なデータセットで構成されている。
FoMo-Benchで表されるタスクや地理の多様性をさらに高めるため、我々は新しいグローバルデータセットであるTalloSを紹介した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:00:54 GMT)
The Effects of Mixed Sample Data Augmentation are Class Dependent [24.1] Mixup、CutMix、PuzzleMixなどのMixed Sample Data Augmentation (MSDA)技術は、様々なタスクのパフォーマンス向上に広く認識されている。
前回の研究では、従来のデータ拡張(DA)のクラス依存性を報告した。
本稿では,MSDAのクラス依存効果を明らかにし,クラスによっては性能が向上し,他のクラスでは性能が劣化していることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:16:28 GMT)
Few-Shot Recalibration of Language Models [23.8] 我々は、任意のスライスからラベルのない例をいくつか取り込んだリカレーションモデルをトレーニングし、信頼度スコアをそのスライスに対してより正確なものに再マップする曲線を予測する。
我々の訓練されたモデルは、そのスライスからラベル付きデータを使わずに、任意の新しいスライスのために再調整できる。
実験により、我々の数発の再校正器は既存の校正方法より一貫して優れていることが示された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:25:40 GMT)
CaT: Constraints as Terminations for Legged Locomotion Reinforcement Learning [23.8] 現在の解決者は、厳しい制約を尊重する効率的なポリシーを作成できない。
本稿では,制約付きRLアルゴリズムCaTとしてConstraintsを提案する。
ビデオとコードはhttps://constraints-as-termminations.ioで公開されている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:03:31 GMT)
Extend Your Own Correspondences: Unsupervised Distant Point Cloud Registration by Progressive Distance Extension [23.7] 本研究では, 遠隔地における雲の分布に適応する遠隔地クラウド登録手法であるEYOCを提案する。
実験により、EYOCは、最先端の教師付き手法と同等の性能を、より低いトレーニングコストで達成できることが示されている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:28:55 GMT)
SingularTrajectory: Universal Trajectory Predictor Using Diffusion Model [23.6] 拡散に基づく普遍軌道予測フレームワークであるSingularTrajectoryを提案する。
SingularTrajectoryの中核は、関連するタスク上のさまざまなヒューマンダイナミクス表現を統一することである。
5つの公開ベンチマークの実験は、SingularTrajectoryが既存のモデルを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:11:08 GMT)
Can Language Beat Numerical Regression? Language-Based Multimodal Trajectory Prediction [23.5] 言語モデルは、文脈理解と生成性能において印象的な能力を示してきた。
LMTraj (Language-based Multimodal Trajectory predictor) を提案する。
本稿では,言語に基づくモデルが,歩行者の軌道予測に有効なことを示し,既存の数値ベースの予測手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:06:44 GMT)
Re2LLM: Reflective Reinforcement Large Language Model for Session-based Recommendation [23.2] セッションベースレコメンデーション(SBR)を強化するための有望なアプローチとして,大規模言語モデル(LLM)が登場している。
本稿では,SBRのための反射強化大言語モデル(Re2LLM)を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:27:24 GMT)
LayoutFlow: Flow Matching for Layout Generation [23.0] 高品質なレイアウトを生成することができる効率的なフローベースモデルを提案する。
提案手法は,最終予測に到達するまで,初期サンプルの要素を徐々に移動し,流れていくことを学習する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:40:21 GMT)
CosalPure: Learning Concept from Group Images for Robust Co-Saliency Detection [22.8] Co-Salient Object Detection (CoSOD) は、特定の画像群をまたいだ共通領域(通常は前景)を特定することを目的としている。
逆行性摂動は、いくつかの逆行性摂動の影響を受けやすいため、かなりの精度の低下につながる。
本稿では,入力群画像に基づいて,共分散オブジェクトの概念を学習し,新しいロバストネス向上フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:33:14 GMT)
Scaling Laws For Dense Retrieval [22.8] 本研究は,高密度検索モデルの性能が他のニューラルモデルと同様のスケーリング法則に従うかどうかを考察する。
その結果、我々の設定下では、高密度検索モデルの性能は、モデルサイズとアノテーション数に関連する正確なパワーロースケーリングに従っていることがわかった。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:27:36 GMT)
Asymptotic Bayes risk of semi-supervised learning with uncertain labeling [22.6] 本稿では,ガウス混合モデルに基づく半教師付き分類について考察する。
本モデルの主な目的はベイズリスクの計算であり,ベイズリスクの挙動と,このモデルで最もよく知られたアルゴリズムを比較する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:49:19 GMT)
Dial-MAE: ConTextual Masked Auto-Encoder for Retrieval-based Dialogue Systems [22.3] Dial-MAEは、対話応答選択における高密度エンコーダに適した、単純で効果的なポストトレーニング手法である。
実験の結果,Dial-MAEは高い有効性を示し,評価された2つのベンチマークで最先端の性能を実現することができた。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:06:13 GMT)
World Models via Policy-Guided Trajectory Diffusion [21.9] 既存の世界モデルは、次の状態を予測するために、ポリシーから次のアクションをサンプリングする、自己回帰的である。
本稿では, 自己回帰的でない新しい世界モデリング手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:11:48 GMT)
Modeling uncertainty for Gaussian Splatting [21.8] ガウススティング(GS)を用いた不確実性推定のための最初のフレームワークを提案する。
本稿では,不確実性予測をGSの共通レンダリングパイプラインにシームレスに統合する,変分推論に基づくアプローチを提案する。
また、損失関数の新たな用語としてAUSE(Area Under Sparsification Error)を導入し、画像再構成とともに不確実性推定の最適化を可能にする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:45:08 GMT)
Exploring the Deceptive Power of LLM-Generated Fake News: A Study of Real-World Detection Challenges [21.4] 条件付き変分オートエンコーダライズプロンプト(VLPrompt)と呼ばれる強力なフェイクニュース攻撃手法を提案する。
現行のメソッドとは異なり、VLPromptはコンテキストコヒーレンスを維持しながら追加のデータ収集を不要にする。
さまざまな検出方法や新しい人間の研究指標を含む実験を行い,その性能をデータセット上で評価した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:39:18 GMT)
In-Distribution and Out-of-Distribution Self-supervised ECG Representation Learning for Arrhythmia Detection [21.2] 本稿では,心電図不整脈検出のための自己監視学習法(SSL)の有効性について,系統的な検討を行った。
まず、一般的なECGベースの不整脈データセットであるTB-XL、Chapman、Ribeiroの3つのデータ分布を新たに解析することから始める。
次に、異なる拡張とパラメータを用いて包括的な実験を行い、様々なSSLメソッドの有効性を評価する。
分析の結果,SSL手法は最先端の手法によって達成された手法に対して高い競争力を発揮することがわかった。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:58:26 GMT)
Self-Expansion of Pre-trained Models with Mixture of Adapters for Continual Learning [21.2] 連続学習は、学習済みの知識を最小限に抑えて、継続的に到着するデータのストリームから学習することを目的としている。
モジュール化適応(SEMA)を用いた事前学習モデルの自己拡張を提案する。
SEMAは継続的学習において、必要に応じてアダプタモジュールを再利用または追加することを決定する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:59:21 GMT)
Can LLMs Converse Formally? Automatically Assessing LLMs in Translating and Interpreting Formal Specifications [21.1] 本稿では,自然言語記述と形式仕様の変換における大規模言語モデルの有用性を評価する。
本稿では,LLMの2つのコピーと既製の検証器を併用して,翻訳能力を自動評価する手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:08:00 GMT)
Tensor-based Graph Learning with Consistency and Specificity for Multi-view Clustering [20.9] グラフ学習は多視点クラスタリングにおいて重要な手法として広く認識されている。
マルチビュークラスタリングの一貫性と特異性を同時に検討するテンソルベースのグラフ学習フレームワークを提案する。
実世界のデータセットで行った実験は、いくつかの最先端のマルチビュークラスタリング手法よりも提案手法の優れた性能を示した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:30:50 GMT)
Generative Pre-Training of Time-Series Data for Unsupervised Fault Detection in Semiconductor Manufacturing [20.7] 本稿では,畳み込み・生成事前学習型変換器を用いた時系列異常検出のためのTRACE-GPTを提案する。
私たちのモデルは、すべてのデータセットでEER(Equal Error Rate)が最も高いF1スコアを持ち、オープンデータセットの監督された最先端ベースラインよりわずか0.026低い。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:02:57 GMT)
TriviaHG: A Dataset for Automatic Hint Generation from Factoid Questions [20.5] ファクトイド問題に対するヒント自動生成のためのフレームワークを提案する。
我々はTriviaQAデータセットから16,645の質問に対応する160,230のヒントを含む新しい大規模データセットを構築した。
提案手法とTriviaHGデータセットを評価するために,提案したヒントを用いて10名の個人に2,791のヒントを注釈付け,6名の人間に回答を指示した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:27:28 GMT)
Dense Vision Transformer Compression with Few Samples [20.5] 少ないショットモデル圧縮は、大きめのモデルを小さなトレーニングセット(ラベルなしでも)でよりコンパクトなモデルに圧縮することを目的としている。
本稿では,DC-ViT と呼ばれる数ショットのVT圧縮のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:56:42 GMT)
SSM Meets Video Diffusion Models: Efficient Video Generation with Structured State Spaces [20.2] 映像生成のための近年の拡散モデルでは、時間的特徴を抽出するために注意層を主に利用している。
我々は、より長いビデオシーケンスを生成するために状態空間モデル(SSM)を活用することを提案する。
我々のSSMベースのモデルは、注目ベースのモデルと競合するFVDスコアを維持しながら、長いシーケンスでメモリ消費を大幅に削減することができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:02:38 GMT)
DifFlow3D: Toward Robust Uncertainty-Aware Scene Flow Estimation with Iterative Diffusion-Based Refinement [20.2] 拡散確率モデルを用いた不確実性を考慮したシーンフロー推定ネットワーク(DifFlow3D)を提案する。
提案手法は,KITTIデータセット上での前例のないミリレベルの精度(EPE3Dで0.0078m)を達成する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:22:18 GMT)
IterAlign: Iterative Constitutional Alignment of Large Language Models [20.1] 我々はIterAlignと呼ばれるデータ駆動型構成発見と自己調整フレームワークを提案する。
IterAlign は LLM の弱点を発見し、強力な LLM を用いて新しい構成を自動的に発見する。
IterAlignは、誠実さ、役に立つこと、無害さ、誠実さをうまく改善し、LLMアライメントを最大13.5%改善する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:32:19 GMT)
WALT3D: Generating Realistic Training Data from Time-Lapse Imagery for Reconstructing Dynamic Objects under Occlusion [20.0] 本稿では,時間経過画像を用いた閉塞下での動的オブジェクトの大規模で現実的なデータセットを自動的に生成する新しいフレームワークを提案する。
既設の2D(バウンディングボックス、セグメンテーション、キーポイント)と3D(目的、形状)の予測を擬似グラウンドトゥルスとして活用することにより、未禁止の3Dオブジェクトを自動的に識別し、クリップアート形式で背景に合成する。
提案手法は,2次元と3次元の両方の再現において,特に車両や都市部で密集した物体のシナリオにおいて,顕著な改善を示すものである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:24:20 GMT)
A Semi-supervised Nighttime Dehazing Baseline with Spatial-Frequency Aware and Realistic Brightness Constraint [19.7] 実世界における夜間脱ハージングのための半教師付きモデルを提案する。
まず、空間的注意と周波数スペクトルフィルタリングを、空間周波数領域情報相互作用モジュールとして実装する。
第2に、半教師付きトレーニングプロセスにおける擬似ラベルに基づくリトレーニング戦略と局所窓ベースの輝度損失は、迷路や光を抑制するように設計されている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:27:02 GMT)
CYCLE: Learning to Self-Refine the Code Generation [19.7] 本稿では,CYCLEフレームワークを提案する。
350M, 1B, 2B, 3B のベンチマークで, パラメータ数が異なる CYCLE の4つの変種を実装した。
その結果、CYCLEは一度のコード生成の品質を維持し、時には改善すると同時に、コードLMの自己抑制能力を大幅に改善することがわかった。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:45:02 GMT)
LocalStyleFool: Regional Video Style Transfer Attack Using Segment Anything Model [19.4] LocalStyleFoolは、ビデオ上の地域スタイルのトランスファーベースの摂動を重畳する、ブラックボックスビデオの敵対攻撃の改良だ。
そこで我々は、LocalStyleFoolがフレーム内およびフレーム間自然性の両方を人為的な調査によって改善できることを実証した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:34:44 GMT)
A Geometric Explanation of the Likelihood OOD Detection Paradox [19.2] 最小の確率質量を含む場合、高次領域は生成されないことを示す。
本稿では,事前訓練したDGMから得られた可能性とLID推定値とをペアリングするOOD検出手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:02:49 GMT)
Exploring the Privacy Protection Capabilities of Chinese Large Language Models [19.1] 言語システムにおけるプライバシ評価のための3段階のプログレッシブフレームワークを考案した。
我々の主な目的は、大規模言語モデルの個人情報に対する感度を包括的に評価することである。
既存の中国の大規模言語モデルは、プライバシー保護の欠点を普遍的に示している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:31:54 GMT)
SAR-Net: Multi-scale Direction-aware SAR Network via Global Information Fusion [19.0] 本稿では,SARオブジェクト検出における方向認識情報のグローバルな融合を目的とした新しいフレームワークであるSAR-Netを提案する。
UCMとDAMは、異なるスケールにわたる機能間の補完関係の確立を促進し、効率的なグローバル情報融合を可能にする。
大規模な実験は、SAR-Netの有効性を示し、航空機や船舶のデータセットに対して最先端の結果を達成する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:46:36 GMT)
FedSN: A Novel Federated Learning Framework over LEO Satellite Networks [18.2] 多数の低軌道軌道(LEO)衛星が打ち上げられ、SpaceXなどの商業企業によって宇宙に投入された。
LEO衛星が搭載するマルチモーダルセンサにより、通信だけでなく、空間変調認識やリモートセンシング画像分類など、さまざまな機械学習アプリケーションにも機能する。
本稿では,これらの課題に対処するための一般FLフレームワークとしてFedSNを提案し,LEO衛星上でのデータ多様性について検討する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:56:23 GMT)
X-Portrait: Expressive Portrait Animation with Hierarchical Motion Attention [18.2] 本稿では,表現的かつ時間的コヒーレントなポートレートアニメーションを生成するための,革新的な条件拡散モデルであるX-Portraitを提案する。
外観参照として1つのポートレートが与えられた場合、駆動ビデオから得られる動きをアニメーション化し、非常にダイナミックかつ微妙な表情をキャプチャすることを目的としている。
実験により,X-ポートレートの多彩な顔画像および表現力のある運転シーケンスに対する普遍的効果が示された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 23:57:47 GMT)
Leveraging Large Language Models for Relevance Judgments in Legal Case Retrieval [18.1] 本稿では,訴訟の関連判断に適した新規な数ショットワークフローを提案する。
LLMと人的専門家の関連判断を比較することで,信頼性の高い関連判断が得られたことを実証的に示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:46:56 GMT)
Retrieval-Augmented Generation for Large Language Models: A Survey [17.8] 大きな言語モデル(LLM)には印象的な能力があるが、幻覚のような課題に直面している。
Retrieval-Augmented Generation (RAG) は,外部データベースからの知識を取り入れた,有望なソリューションとして登場した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:16:57 GMT)
Average Rényi Entanglement Entropy in Gaussian Boson Sampling [17.7] 量子コンピューティングの枠組みとして,出力状態のモーダル絡みについて検討する。
より一般的には、すべての整数に対して、モードの極限において$alpha$ と入力状態に対して$alpha = 1$ の式を導出します。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:00:01 GMT)
Moderating Illicit Online Image Promotion for Unsafe User-Generated Content Games Using Large Vision-Language Models [17.5] オンラインユーザ生成コンテンツゲーム(UGCG)は、子供や青年の間で人気が高まっている。
露骨なコンテンツに露出するリスクが高くなり、子供や青年のオンライン安全への懸念が高まっている。
ソーシャルメディア上での不正な画像ベースのアンセーフGのプロモーションの問題に対処する研究はほとんどない。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:02:13 GMT)
Understanding the Learning Dynamics of Alignment with Human Feedback [17.4] 本稿では,人間の嗜好アライメントの学習力学を理論的に解析する試みについて述べる。
選好データセットの分布がモデル更新率にどのように影響するかを示し、トレーニング精度に厳密な保証を与える。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:39:28 GMT)
A Dataset for Pharmacovigilance in German, French, and Japanese: Annotating Adverse Drug Reactions across Languages [17.4] 本研究は, 患者フォーラム, ソーシャルメディア, 臨床報告, ドイツ語, フランス語, 日本語など, さまざまなソースから収集した副薬物反応に関する多言語コーパスを提示する。
これは、医療のための現実の多言語言語モデルの開発に貢献する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:21:01 GMT)
Learning by Erasing: Conditional Entropy based Transferable Out-Of-Distribution Detection [17.3] トレーニングとテストシナリオ間の分散シフトを処理するためには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
既存の方法は、データセット固有の特徴表現やデータ分散をキャプチャするために、再トレーニングを必要とする。
我々は,新しいIDデータセットで再トレーニングする必要がない,DGMに基づく転送可能なOOD検出手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:29:27 GMT)
From Text to Source: Results in Detecting Large Language Model-Generated Content [17.3] 大きな言語モデル(LLM)は、人間に似たテキストを生成する能力によって祝われる。
本稿では,LLM生成テキストと人文テキストを区別するために訓練された分類器が,それ以上の訓練を行なわずに目標LLMからテキストを検出することができるかどうかを評価することで,Cross-Model Detectionについて検討する。
この研究では、量化と透かし検出に加えて、ソースモデル識別、モデルファミリー、モデルサイズ分類を含むモデル属性についても検討している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:50:24 GMT)
A Quantum Fuzzy-based Approach for Real-Time Detection of Solar Coronal Holes [17.3] 本研究では,CHs領域の高速検出のために,量子コンピューティングに基づく高速ファジィc平均法を開発した。
提案手法は、193 AA SDO/AIAフルディスクの太陽画像データセットに対して試験されており、既存の手法と比較されている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:38:56 GMT)
$\mathrm{F^2Depth}$: Self-supervised Indoor Monocular Depth Estimation via Optical Flow Consistency and Feature Map Synthesis [17.2] 自己教師型屋内単分子深度推定フレームワークである$mathrmF2Depth$を提案する。
深度学習を監督するために、自己教師付き光フロー推定ネットワークを導入する。
その結果,本モデルは未知の屋内シーンで撮影された単眼画像とよく一致していることがわかった。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:00:33 GMT)
Selective Mixup Fine-Tuning for Optimizing Non-Decomposable Objectives [17.1] 現在の最先端の実証技術は、実用的で非分解不能な性能目標に対して、準最適性能を提供する。
本稿では,SelMixを提案する。SelMixは,事前学習モデルに対して,選択型ミキサアップに基づく安価な微調整技術である。
提案したSelMixファインタニングにより,ベンチマーク間での様々な非分解性目標の性能が大幅に向上することがわかった。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:55:23 GMT)
CoRAST: Towards Foundation Model-Powered Correlated Data Analysis in Resource-Constrained CPS and IoT [16.8] ファンデーションモデル(FM)は、事前の知識を活用することで、分散的で多様な環境データを活用することができる。
本稿では,FMを用いた新しい学習フレームワークであるCoRASTについて紹介する。
実世界の気象データに対する評価は、CoRASTが相関した異種データを活用できることを実証している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:11:06 GMT)
ModaLink: Unifying Modalities for Efficient Image-to-PointCloud Place Recognition [16.8] イメージをエンコードし、クラウドをプレース・ディペンシブ・ディスクリプタに向ける、高速で軽量なフレームワークを紹介します。
本研究では,FoV(FoV)変換モジュールを用いて,点雲を画像に類似したモダリティに変換する手法を提案する。
また、非負の分解に基づくエンコーダを設計し、点群と画像間の相互に一貫した意味的特徴を抽出する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:01:10 GMT)
Multi-criteria Token Fusion with One-step-ahead Attention for Efficient Vision Transformers [16.6] Vision Transformer (ViT) はコンピュータビジョンのバックボーンとして登場した。
近年の作業は、冗長なトークンをプルーニングまたはファンクションすることにより、自己保持層の二次コストを低減している。
ここでは,トークンの融合は情報損失を最小限に抑えるために,トークン間の多様な関係を考慮する必要があると論じる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:52:10 GMT)
Tracking-Assisted Object Detection with Event Cameras [16.4] イベントベースのオブジェクト検出は、コンピュータビジョンコミュニティで最近注目を集めている。
しかし、特徴的不規則性や空間性は、カメラに対する相対的な動きがないため、見えない物体を生じさせる。
本稿では,これらの見えない物体を擬似隠蔽物体とみなし,その特徴を明らかにすることを目的とする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:11:25 GMT)
Look Before You Leap: Problem Elaboration Prompting Improves Mathematical Reasoning in Large Language Models [15.7] 本稿では,大規模言語モデル(LLM)の数学的能力を高めるために,PEPという新しい手法を提案する。
PEPは、推論の前に問題コンテキストを分解し、解明するので、コンテキストモデリングと解析効率が向上する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:23:58 GMT)
AEROBLADE: Training-Free Detection of Latent Diffusion Images Using Autoencoder Reconstruction Error [15.5] 計算コストの低い高解像度画像を生成するための重要なイネーブルは、潜時拡散モデル(LDM)の開発である。
LDMは、高次元画像空間の代わりに、事前訓練されたオートエンコーダ(AE)の低次元潜時空間で復調処理を行う。
本稿では,画像と潜時空間間の画像変換に用いるAEという,LDMの固有成分を利用した新しい検出手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:17:14 GMT)
Structure Guided Large Language Model for SQL Generation [15.4] 本稿では,構造情報を活用する構造間フレームワークを提案する。
SGU-は構造化された方法でユーザクエリとデータベースをリンクする。
その後、文法木で複雑な構造を分解し、LCMを誘導してステップバイステップを生成する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:30:44 GMT)
Identification and Uses of Deep Learning Backbones via Pattern Mining [15.4] 与えられたインスタンスのグループに対して、ディープラーニングのバックボーンを特定する方法を示す。
また、これらのバックボーンを調べて、ミスを特定し、パフォーマンスを改善します。
いくつかの挑戦的なデータセットを用いてアプリケーションベースの結果を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:13:39 GMT)
Image Deraining via Self-supervised Reinforcement Learning [15.4] 自己監督型強化学習(RL)による雨害除去による雨像の復元を目指す。
入力雨画像から辞書学習により雨のストリーク画素を抽出し,複数の塗料を塗布して雨を徐々に除去する。
いくつかのベンチマーク画像デライニングデータセットの実験結果から、提案したSRL-Derainは、最先端の少数ショットと自己監督型デライニングおよびデノイング手法に対して好適に機能することが示された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:52:39 GMT)
Unleashing the Potential of SAM for Medical Adaptation via Hierarchical Decoding [15.4] 本稿では,医療画像の高速微調整のためのSegment Anything Model (SAM) の即時適応であるH-SAMを紹介する。
初期段階では、H-SAMはSAMのオリジナルのデコーダを使用して、より複雑なデコードプロセスの導出として、以前の確率マスクを生成する。
我々のH-SAMは、既存のプロンプトフリーSAMよりも平均Diceが4.78%改善していることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:55:16 GMT)
Egocentric Scene-aware Human Trajectory Prediction [15.3] 本研究では,周囲の静的なシーン上での人間の動作条件を予測する手法を提案する。
本モデルでは,衝突回避および軌道モードカバレッジの重要な指標について,既存の手法よりも優れる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:43:12 GMT)
Learning to Act without Actions [15.2] 本稿では,ビデオから潜時行動情報を復元する手法であるLatent Action Policies (LAPO)を紹介する。
LAPOは観測された力学からのみ真の作用空間の構造を復元できる最初の方法である。
LAPOは、専門家レベルのポリシーに迅速に微調整可能な潜在アクションポリシーのトレーニングを可能にする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 00:15:16 GMT)
Towards Trustworthy Reranking: A Simple yet Effective Abstention Mechanism [15.2] 実世界の制約に合わせた軽量な禁制機構を提案する。
ブラックボックスシナリオにおける禁忌戦略を評価するためのプロトコルを導入し,その有効性を実証する。
実験複製と禁忌実装のためのオープンソースコードを提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:59:57 GMT)
Fusion approaches for emotion recognition from speech using acoustic and text-based features [15.2] 音声とテキストを用いた音声から感情を分類する手法について検討した。
音声とテキストのモダリティを組み合わせる戦略を比較し,IEMOCAPとMPP-PODCASTデータセット上で評価する。
IEMOCAPでは,クロスバリデーション・フォールドの定義に使用される基準が結果に大きく影響していることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:40:25 GMT)
Language Models are Free Boosters for Biomedical Imaging Tasks [15.2] 本研究では,バイオメディカルイメージングタスクのエンコーダの一部として,残留型大規模言語モデル(LLM)の予期せぬ有効性を明らかにする。
これらのLCMは,2次元と3次元の視覚的分類タスクを含む,様々なバイオメディカルイメージングアプリケーションにおいて,性能を向上させることができることがわかった。
副産物として,提案手法は,MedMNIST-2Dと3Dの広範囲な標準化データセットに対して,最先端の成果を新たに設定し,優れた性能を実現した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:49:16 GMT)
Decoupled Data Consistency with Diffusion Purification for Image Restoration [15.0] 本稿では,データ整合性ステップから逆処理を分離することで問題に対処する拡散型画像復元法を提案する。
我々の手法は多目的性を示し、潜在空間における効率的な問題解決に高い適応性を与える。
提案手法の有効性は,画像のデノイング,デブロアリング,インペイント,超解像など,画像修復作業における総合的な実験を通じて検証される。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:06:10 GMT)
TAFormer: A Unified Target-Aware Transformer for Video and Motion Joint Prediction in Aerial Scenes [14.9] 本研究では,ターゲット認識空中映像予測(Target-Aware Aerial Video Prediction)と呼ばれる新しいタスクを導入する。
本研究では,空間的静的な注意と時間的ダイナミックな注意にビデオダイナミクスの学習を分離し,シーンの外観と動きを効果的にモデル化する時空間的注意(STA)を紹介した。
ぼかし予測における目標の識別の難しさを軽減するため,ターゲット感性ガウス損失(TSGL)を導入し,目標の位置と内容の両方に対するモデルの感度を高める。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:03:55 GMT)
Efficient Generation of Multi-partite Entanglement between Non-local Superconducting Qubits using Classical Feedback [14.7] ゲートベースの量子コンピューティングでは、絡み合った状態の生成や量子プロセッサ間の絡み合いの分布は、絡み合った量子ビットの数で増加する回路深さを必要とすることが多い。
テレポーテーションベースの量子コンピューティングでは、量子ビット数で一定となる回路深さの絡み合った状態を決定論的に生成することができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:06:00 GMT)
Chiral Virasoro algebra from a single wavefunction [14.7] エッジが純粋にキラルであるとき、低エネルギーエッジ励起のヒルベルト空間は単一のビラソロ代数の表現を形成することができる。
単一基底状態波動関数からビラソロ代数の生成元を体系的に抽出する手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:54:21 GMT)
Regret-Based Defense in Adversarial Reinforcement Learning [14.7] 敵の騒音は、安全クリティカルな環境において悲惨な結果をもたらす可能性がある。
既存のRLアルゴリズムを観測摂動敵に堅牢にするためのアプローチは、リアクティブアプローチに重点を置いている。
我々は、受信した「観測」に対する観察の「隣人」に対する最大の後悔を最小限に抑える、原則化されたアプローチを提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:57:30 GMT)
Theoretical Guarantees for the Subspace-Constrained Tyler's Estimator [14.6] この研究は、低次元の部分空間を復元するために設計されたサブスペース制約されたタイラー推定器(STE)を分析する。
弱い不リエ・アウトリアモデルを想定し、不リエの分数は、頑健な部分空間回復問題の計算硬度に繋がる分数よりも小さくすることができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:03:29 GMT)
DiffPrompter: Differentiable Implicit Visual Prompts for Semantic-Segmentation in Adverse Conditions [14.5] DiffPrompterは、視覚的かつ潜時的な新しいプロンプト機構である。
提案した$nabla$HFC画像処理ブロックは,特に悪天候条件下では優れている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:51:24 GMT)
Prompt Risk Control: A Rigorous Framework for Responsible Deployment of Large Language Models [14.5] 本稿では,情報的リスク対策の家族に対する厳密な上限に基づくプロンプト選択のためのフレームワークであるPrompt Risk Controlを提案する。
最悪の応答を測定する量を含む、さまざまなメトリクスセットのバウンダリを生成する方法を提供しています。
オープンエンドチャット、医療質問の要約、コード生成といったアプリケーションの実験では、このようなフレームワークが責任あるデプロイメントを促進する方法が強調されている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:20:22 GMT)
ChatGPT Needs SPADE (Sustainability, PrivAcy, Digital divide, and Ethics) Evaluation: A Review [14.4] ChatGPTも大きな言語モデル(LLM)である。
本研究は、サステナビリティ、プライバシ、ディジタルディビジョン、倫理など、主に見落とされがちな重要な側面に焦点を当てる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:03:32 GMT)
Meta-Learning with Generalized Ridge Regression: High-dimensional Asymptotics, Optimality and Hyper-covariance Estimation [14.2] 本研究では,高次元ランダム効果線形モデルの枠組みにおけるメタラーニングについて考察する。
本研究では,データ次元がタスク毎のサンプル数に比例して大きくなる場合に,新しいテストタスクに対する予測リスクの正確な振る舞いを示す。
トレーニングタスクのデータに基づいて,逆回帰係数を推定する手法を提案し,解析する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:18:43 GMT)
Physical 3D Adversarial Attacks against Monocular Depth Estimation in Autonomous Driving [14.2] 3D Depth Fool (3D$2$Fool)は、MDEモデルに対する最初の3Dテクスチャベースの敵攻撃である。
3D$2$Foolは、車種をモデル化するための3Dの敵対的なテクスチャを生成するために特別に最適化されている。
物理的車体モデルに3Dテクスチャを印刷した実世界の実験では、我々の3D$2$Foolが10メートル以上のMDEエラーを引き起こします。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:23:09 GMT)
Follower Agnostic Methods for Stackelberg Games [14.1] 我々は,複数のフォロワーを対象とするオンラインStackelbergゲームにおいて,フォロワーに依存しない方法で効率よく解決するアルゴリズムを提案する。
私たちのアプローチは、リーダがフォロワーのユーティリティ機能や戦略空間について知識を持っていない場合でも機能します。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 00:38:33 GMT)
Rejection Improves Reliability: Training LLMs to Refuse Unknown Questions Using RL from Knowledge Feedback [14.1] LLM(Large Language Models)はしばしば幻覚と呼ばれる誤った出力を生成する。
知識フィードバックによる強化学習(Reinforcement Learning from Knowledge Feedback, RLKF)と呼ばれる新しいアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:39:56 GMT)
CroSel: Cross Selection of Confident Pseudo Labels for Partial-Label Learning [14.1] 部分ラベル学習(Partial-label Learning, PLL)は, 弱い教師付き学習問題である。
モデルからの履歴予測を利用して,ほとんどのトレーニング例で真のラベルを識別するCroSelと呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:53:12 GMT)
Few-magnon excitations in a frustrated spin-$S$ ferromagnetic chain with single-ion anisotropy [14.1] 強磁性近傍相互作用を持つ有限サイズのスピン-S$鎖における少数のマグノン励起について検討する。
我々は、$Delta'-D/|J'|$平面において、SIやNNNをサポートする領域を2つのマグノン境界状態として解析的に同定する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:24:21 GMT)
Towards Fairness-Aware Adversarial Learning [13.9] フェアネス・アウェア・アドバーサリアル・ラーニング(FAAL)という新しい学習パラダイムを提案する。
提案手法は,異なるカテゴリ間で最悪の分布を求めることを目的としており,高い確率で上界性能が得られることを保証している。
特にFAALは、不公平なロバストモデルを2つのエポックで公平に調整できるが、全体的なクリーンで堅牢なアキュラシーを損なうことはない。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 23:33:15 GMT)
Spikewhisper: Temporal Spike Backdoor Attacks on Federated Neuromorphic Learning over Low-power Devices [13.8] 本稿では,時間分割多重化の概念を用いて,FedNLベースのシステムの新たな脆弱性を探究する。
特に、スパイクウィスパーのステルス性は、グローバルトリガーの時間領域の可視性に由来する。
2つの異なるニューロモルフィックデータセットに基づく実験により、スパイクウィスファーの攻撃成功率は時間的に集中的な攻撃よりも高いことが示された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:25:02 GMT)
Enhancing Object Coherence in Layout-to-Image Synthesis [13.8] 本稿では,グローバル・セマンティック・フュージョン(GSF)と自己相似機能拡張モジュールを用いた新しい拡散モデルを提案する。
セマンティックコヒーレンスについては,イメージキャプションには画像内のオブジェクト内のセマンティックな関係を定義するための豊富な情報が含まれていると論じる。
物理コヒーレンスを改善するため,各画素の生成プロセスに局所的な物理的コヒーレンスを明示的に統合する自己相似コヒーレンスアテンション(SCA)モジュールを開発した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:18:51 GMT)
Learning CNN on ViT: A Hybrid Model to Explicitly Class-specific Boundaries for Domain Adaptation [13.8] ほとんどのドメイン適応(DA)法は、畳み込みニューラルネットワーク(CNN)または視覚変換器(ViT)に基づいている。
ECB(Explicitly Class-specific boundaries)と呼ばれる,ViTとCNNの両方をフル活用するためのハイブリッド手法を設計する。
ECBは独自の強みを組み合わせるために、ViTでCNNを学びます。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:52:44 GMT)
Weakly-Supervised Conditional Embedding for Referred Visual Search [13.6] 提案するReferred Visual Search(RVS)は,ユーザが希望する類似性をより正確に定義できるタスクである。
業界における従来のビジュアルサーチ手法とは異なり、明示的なオブジェクト検出を回避し、優れた性能を達成できることを実証する。
提案手法は軽量でロバスト性を示し、2Morsに対する強力な検出ベースラインよりも優れたリコールを実現する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:21:17 GMT)
Antitrust, Amazon, and Algorithmic Auditing [13.6] デジタル市場において、反トラスト法と特別規制は、今日のデジタルプラットフォームがすべての人の生活で果たす支配的な役割にもかかわらず、市場が競争力を維持することを目的としている。
我々は、Amazonが一般的に自己紹介と表現されるプラクティスにどの程度従事しているかについて、一連の実証的な調査を提示する。
本稿では,アルゴリズム監査をベースとし,大規模デジタル市場を規制する規制環境において,この論文で使用されるコンピュータサイエンスツールをどのように利用できるかについて議論する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:34:22 GMT)
$\textit{LinkPrompt}$: Natural and Universal Adversarial Attacks on Prompt-based Language Models [13.4] Promptベースの学習は、事前訓練された言語モデルを下流のタスクに適応させる。
敵のトリガーは、ターゲットのPLMの予測を変更するために生成される。
$textitLinkPrompt$は、UATを生成する逆攻撃アルゴリズムである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:37:58 GMT)
PRDP: Proximal Reward Difference Prediction for Large-Scale Reward Finetuning of Diffusion Models [13.3] リワード微調整は、ファンデーションモデルを下流の目標と整合させるための有望なアプローチとして現れています。
既存の報酬微調整手法は、大規模なプロンプトデータセットにおける不安定性によって制限される。
拡散モデルに対する安定なブラックボックス報酬の微調整を可能にするためのPRDP(Proximal Reward difference Prediction)を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:37:39 GMT)
Input Convex Lipschitz RNN: A Fast and Robust Approach for Engineering Tasks [13.2] 入力凸リプシッツリカレントニューラルネットワークと呼ばれる新しいネットワークアーキテクチャを開発した。
このモデルは、高速で堅牢な最適化ベースのタスクのために明示的に設計されている。
計算効率と非対向ロバスト性の観点から、一連のエンジニアリングタスクにおいて、既存の繰り返しユニットよりも優れています。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:06:34 GMT)
Deep Learning for Traffic Flow Prediction using Cellular Automata-based Model and CNN-LSTM architecture [13.1] 近年の研究では、深層学習による交通流の予測が試みられているが、結果はまちまちである。
これらのアプローチは2つの重要な課題に直面している。まず、ディープラーニングニューラルネットワークのトレーニングには、トラフィックフローシステムではまだ利用できない大量のトレーニングデータが必要である。
第二に、データが利用可能である場合でも、ニューラルネットワークは、将来のトラフィック状態をうまく予測するために、最も可能なトラフィックフローのダイナミクスをカバーする歴史的なデータにアクセスする必要がある。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:57:42 GMT)
Aiming for Relevance [12.9] 臨床状況に合わせて,新しいバイタルサイン予測性能指標を導入する。
これらの指標は、ICU臨床医へのインタビューを通じて得られた経験的効用曲線から得られたものである。
これらの指標をニューラルネットワークの損失関数として用い,臨床上の重要な事象を予測できるモデルを構築した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:11:07 GMT)
Envisioning MedCLIP: A Deep Dive into Explainability for Medical Vision-Language Models [12.9] 我々は、視覚言語モデルであるMedCLIPを用いて、様々な説明可能なAI手法の性能を分析し、その内部動作を復調する。
我々の研究は、医療分野における最近の有名なVLMの説明可能性について、新たな視点を提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:30:01 GMT)
PhoWhisper: Automatic Speech Recognition for Vietnamese [12.8] ベトナム語自動音声認識のためのPhoWhisperを5つのバージョンで導入する。
PhoWhisperの堅牢性は、844時間のデータセット上でWhisperモデルを微調整することで達成される。
ベトナムのASRデータセットのベンチマークにおいて,PhoWhisperの最先端性能を実証した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:10:06 GMT)
Tricking LLMs into Disobedience: Formalizing, Analyzing, and Detecting Jailbreaks [12.5] 我々は、既知の(そして可能な)ジェイルブレイクの形式主義と分類法を提案する。
私たちは3700のjailbreakプロンプトにまたがるモデル出力のデータセットを4つのタスクでリリースしています。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:38:44 GMT)
New Constraints on Exotic Spin-Spin-Velocity-Dependent Interactions with Solid-State Quantum Sensors [12.4] 電子スピン間のエキゾチックスピン-スピン-速度依存性相互作用に関する実験結果について報告する。
NVアンサンブルの1つはスピン源として機能し、もう1つはスピンセンサーとして機能する。
我々は、短力範囲でエキゾチックスピン-スピン-速度依存相互作用を精査することができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:33:18 GMT)
Attention Calibration for Disentangled Text-to-Image Personalization [12.3] 本稿では,T2Iモデルの概念レベル理解を改善するための注意校正機構を提案する。
本手法は, 定性評価と定量的評価の両方において, 現状よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:31:39 GMT)
Noise-Robust Keyword Spotting through Self-supervised Pretraining [11.9] 自己教師型学習は、クリーンな条件下での精度を高めることが示されている。
本稿では,KWSモデルの雑音条件下でのロバスト性を高めるためにSSLプリトレーニングをどのように利用できるかを検討する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:42:14 GMT)
Towards Human-Centered Construction Robotics: An RL-Driven Companion Robot For Contextually Assisting Carpentry Workers [11.8] 本稿では,既存の作業における作業者の支援を目的とした,作業支援ローバーを用いた人間中心型アプローチを提案する。
我々は,ロボットシステムを大工のフォームワークに導入するための詳細な研究を行い,移動性,安全性,快適な作業ロボットのコラボレーションを重視したプロトタイプを紹介した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 23:55:02 GMT)
Garment3DGen: 3D Garment Stylization and Texture Generation [11.8] Garment3DGenは、単一の入力イメージをガイダンスとして与えられたベースメッシュから3Dの衣服資産を合成する新しい方法である。
生成された資産は人体に直接描画し、シミュレーションすることができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:59:33 GMT)
DVLO: Deep Visual-LiDAR Odometry with Local-to-Global Feature Fusion and Bi-Directional Structure Alignment [11.8] 画像は規則的で密度が高いが、LiDARポイントは秩序がなく、疎い。
双方向構造アライメントを有する局所-グローバル融合ネットワークを提案する。
本手法は,KITTI odometry と FlyingThings3D シーンフローデータセットの最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:57:45 GMT)
Qubit teleportation between a memory-compatible photonic time-bin qubit and a solid-state quantum network node [11.8] ダイアモンドNV中心量子ネットワークノードと795nmフォトニック時間ビン量子ビットを接続するインタフェース。
2光子量子干渉は、変換された795nm光子とネイティブなNV中心光子の間で(89.5$pm$ 1.9)%の非識別性を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:01:58 GMT)
Theoretical Bound-Guided Hierarchical VAE for Neural Image Codecs [11.7] 近年の研究では、変分オートエンコーダ(VAE)と速度歪み理論の間に有意な関係があることが示されている。
VAEは画像の情報レート歪み関数の理論上界を推定する。
このギャップを狭めるために,ニューラルネットワークのための理論的境界誘導型階層型VAE(BG-VAE)を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:11:34 GMT)
LORD: Large Models based Opposite Reward Design for Autonomous Driving [11.7] LORDは、望ましくない言語目標を通じて、対向的な報酬設計に基づく新しい大モデルである。
提案手法は,大規模な事前学習モデルのパワーを有効活用し,安全で高機能な自動運転を実現するための有効性を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:30:06 GMT)
Dual Structure-Aware Image Filterings for Semi-supervised Medical Image Segmentation [11.7] 半教師付き医用画像分割のための画像レベルのバリエーションとして,新しい二重構造対応画像フィルタリング(DSAIF)を提案する。
構造を意識したツリーベース画像表現において, 画像のフィルタリングを簡略化するコネクテッドフィルタリングにより, 二重コントラスト不変の Max-tree と Min-tree の表現を利用する。
提案したDSAIFを相互に教師付きネットワークに適用することにより、ラベルなし画像上の誤った予測のコンセンサスを減少させる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:09:10 GMT)
SteinGen: Generating Fidelitous and Diverse Graph Samples [11.6] 我々はSteinGenを導入し、観測された1つのグラフからグラフを生成する。
我々は,SteinGenが,サンプルの多様性と組み合わせて,元のデータに高い分布類似性(高忠実度)をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:59:05 GMT)
High Dimensional Distributed Gradient Descent with Arbitrary Number of Byzantine Attackers [11.4] 任意の数のビザンツ人攻撃者の下で,高次元問題に適した新しい手法を設計する。
次元性への依存は、以前の研究と比べて著しく改善されている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:04:04 GMT)
TGMM: Combining Parse Tree with GPU for Scalable Multilingual and Multi-Granularity Code Clone Detection [11.3] TGMMは、多言語および多言語コードクローン検出のためのツリーおよびGPUベースのツールである。
ユーザが提供する文法ファイルに基づいてパースツリーを生成することで、TGMMは特定の粒度でコードブロックを抽出し、Type-3クローンを効率的に検出することができる。
TGMMは最初に実行時間と精度でランク付けし、リコールは他のものと同等である。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:24:13 GMT)
Nesting Particle Filters for Experimental Design in Dynamical Systems [11.2] 最適設計を推論するネスト型シーケンシャルモンテカルロ法を開発し,それを粒子マルコフ連鎖モンテカルロフレームワークに埋め込み,勾配に基づくポリシー補正を行う。
提案手法は, コントラスト推定器に頼らないため, 他のアモータイズされた実験設計手法と異なる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:12:43 GMT)
Improved Neural Protoform Reconstruction via Reflex Prediction [11.1] 我々は、プロトフォームはコグネート集合(関連する反射の集合)から推論可能であるだけでなく、プロトフォームからも推論可能であるべきだと主張する。
本稿では,リフレクション予測モデルを用いて,再構成モデルから候補となるプロトフォームをリランクするシステムを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:13:38 GMT)
Long and Short-Term Constraints Driven Safe Reinforcement Learning for Autonomous Driving [11.1] 強化学習 (Reinforcement Learning, RL) は意思決定作業において広く用いられているが, 訓練過程におけるエージェントの安全性を保証することはできない。
安全RLのための長短制約(LSTC)に基づく新しいアルゴリズムを提案する。
本稿では,ラグランジュ乗算器に基づく二制約最適化を用いた安全なRL法を開発し,エンドツーエンド自動運転のトレーニングプロセスを最適化する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:41:52 GMT)
skscope: Fast Sparsity-Constrained Optimization in Python [11.0] 本稿では,空間制約付き最適化(SCO)問題を解くためのライブラリ・スコープを提案する。
スコープの利便性は、論文の2つの例を通して示される。
数値実験により、スコスコープで利用可能な解法は最大80倍のスピードアップを達成できることが明らかになった。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:17:15 GMT)
A Comprehensive Review of Community Detection in Graphs [10.7] 複雑なネットワークの研究は、我々のコミュニティ構造に対する理解を著しく前進させてきた。
グラフ内のコミュニティを検出することは、社会学、生物学、計算機科学の応用において難しい問題である。
本稿では, グラフにおけるコミュニティ検出の話題について概説し, 様々なコミュニティ検出手法の徹底的な解説を行う。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:12:18 GMT)
Projective Methods for Mitigating Gender Bias in Pre-trained Language Models [10.4] プロジェクティブメソッドは実装が高速で、少数の保存されたパラメータを使用し、既存のモデルパラメータを更新しない。
射影法は内在バイアスと下流バイアス軽減の両方に有効であるが, 両者の結果は必ずしも相関しない。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:49:31 GMT)
Enhancing Manufacturing Quality Prediction Models through the Integration of Explainability Methods [10.3] 本研究では,機械学習モデルの性能向上のための説明可能性手法を用いて,製粉プロセスの品質を予測する手法を提案する。
この手法はMLモデルの初期訓練を伴い、その後、説明可能性法で識別された無関係な特徴を除去する微調整フェーズが続く。
本研究は,製造領域における予測モデルの説明と最適化における説明可能性手法の有用性を強調した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:21:24 GMT)
"Sorry, Come Again?" Prompting -- Enhancing Comprehension and Diminishing Hallucination with [PAUSE]-injected Optimal Paraphrasing [10.2] 幻覚は現代大言語モデル(LLM)の最も脆弱な側面として現れてきた。
本稿では,LCMの幻覚を避けることを目的としたSCAプロンプトについて紹介する。
本稿では,21のLLMに対するプロンプトの形式性,可読性,具体性について,言語的ニュアンスを詳細に分析する。
与えられたプロンプトの最も理解しやすいパラフレーズを識別する最適なパラフレーズ化手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:45:09 GMT)
What's in a Prior? Learned Proximal Networks for Inverse Problems [9.9] 近似作用素は、逆問題においてユビキタスであり、通常は、そうでなければ不適切な問題を正則化するための戦略の一部として現れる。
現代のディープラーニングモデルは、プラグアンドプレイやディープアンロールのフレームワークのように、これらのタスクにも耐えられてきました。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:48:37 GMT)
A Picture is Worth 500 Labels: A Case Study of Demographic Disparities in Local Machine Learning Models for Instagram and TikTok [9.9] 人気の高いソーシャルメディアアプリTikTokとInstagramを分析して、画像とビデオデータからユーザーを推測する、両方のアプリの視覚モデルを明らかにする。
モバイルアプリにおける機械学習タスクのキャプチャと評価のための新しい手法を開発した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:46:14 GMT)
VIGraph: Generative Self-supervised Learning for Class-Imbalanced Node Classification [9.7] グラフデータのクラス不均衡は、ノード分類において重要な課題である。
SMOTEベースのアプローチのような既存の手法は、不均衡グラフを構築する際の限界を示す。
本稿では,変分GAEを基本モデルとする簡易かつ効果的な生成型SSL手法であるVIGraphを紹介する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:12:31 GMT)
Shifting to Machine Supervision: Annotation-Efficient Semi and Self-Supervised Learning for Automatic Medical Image Segmentation and Classification [9.7] 我々は、自己教師型および半教師型学習の進歩を活用する新しいアプローチであるS4MIパイプラインを紹介する。
本研究は、これらの手法を3つの異なる医用画像データセット上で評価し、分類と分割作業の有効性を評価する。
注目すべきは、半教師付きアプローチはセグメンテーションにおいて優れた結果を示し、全データセットで50%少ないラベルを使用しながら、完全な教師付き手法よりも優れた結果を示したことだ。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:41:50 GMT)
Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal Perspective [9.6] 視覚質問応答問題におけるバイアスを解釈するための因果的枠組みを提案する。
因果グラフに動機付け,12,000VQAインスタンスからなるMOREデータセットを新たに導入する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:38:49 GMT)
ADMarker: A Multi-Modal Federated Learning System for Monitoring Digital Biomarkers of Alzheimer's Disease [9.4] アルツハイマー病(AD)と関連する認知症は高齢化による世界的な健康問題である。
マルチモーダルセンサと,自然環境における多次元ADデジタルバイオマーカー検出のための新しいフェデレーション学習アルゴリズムを統合した,初のエンドツーエンドシステムであるADMarkerを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:56:59 GMT)
Multi-Label Adaptive Batch Selection by Highlighting Hard and Imbalanced Samples [9.4] 本稿では,多ラベル深層学習モデルに適した適応バッチ選択アルゴリズムを提案する。
提案手法は, ランダムなバッチ選択よりも高速に収束し, 性能が向上する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:00:18 GMT)
Planning to Go Out-of-Distribution in Offline-to-Online Reinforcement Learning [9.3] オンラインインタラクションの限られた予算の中で、最高のパフォーマンスポリシーを見つけることを目指しています。
まず本研究では,本質的な報酬と UCB に基づくオンラインRL探索手法について検討する。
そして,これらの問題を回避するために,配当を廃止する計画を立てるアルゴリズムを導入する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:48:34 GMT)
Fourier or Wavelet bases as counterpart self-attention in spikformer for efficient visual classification [9.3] 生体可塑性スパイキングニューラルネットワーク(SNN)と人工トランスフォーマーを組み合わせたエネルギー効率の高いスパイクフォーマーが提案されている。
本稿では,バニラSSAをスパイク形式のフーリエ変換,ウェーブレット変換,およびそれらの組み合わせに置き換える。
FWformerは、同等またはそれ以上のアキュラシー(0.4%$-1.5%$)、より高いランニングスピード(9%$-51%$)、推論のために19%$-70%$を達成することができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:31:16 GMT)
From Correspondences to Pose: Non-minimal Certifiably Optimal Relative Pose without Disambiguation [9.2] 相対カメラのポーズを2つのキャリブレーションされたビュー間の対応で$n geq 5$から推定することは、コンピュータビジョンの基本的なタスクである。
我々は,処理後ステップを必要とせずに,対応関係から適切な相対カメラのポーズを直接推定できることを示す。
提案手法の有効性, 有効性, 精度を検証し, 総合的な合成および実世界の実験を通して本手法の有効性を検証した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:21:12 GMT)
Heterogeneous Peridynamic Neural Operators: Discover Biotissue Constitutive Law and Microstructure From Digital Image Correlation Measurements [9.1] 異方性異方性物質のデータ駆動モデリングのためのヘテロPNO(heteroPNO)手法を提案する。
目的は、非局所法則と物質の両方を、不均一なファイバー配向場として学習することである。
当社のフレームワークは, 新規かつ未確認なロードインスタンスに対して, 変位および応力場予測を行うことができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:20:11 GMT)
A State-of-the-practice Release-readiness Checklist for Generative AI-based Software Products [9.0] 本稿では,大規模言語モデルをソフトウェア製品に統合することの複雑さを考察し,リリースの準備の整合性を決定する上で直面する課題に焦点をあてる。
グレー文献の体系的なレビューでは,事前学習から微調整,ユーザエクスペリエンスの考慮に至るまで,LCMのデプロイにおける一般的な課題が明確化されている。
この調査では,パフォーマンスや監視,デプロイメント戦略など,重要なリリース準備の面を評価する上で,実践者のガイドとして設計された包括的なチェックリストが紹介されている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:02:56 GMT)
ZAEBUC-Spoken: A Multilingual Multidialectal Arabic-English Speech Corpus [9.0] ZAEBUC-Spokenは多言語多言語対応アラビア語-英語音声コーパスである。
コーパスは自動音声認識(ASR)のための課題セットを提供する
我々は、既存の転写ガイドラインからインスピレーションを得て、会話音声、コードスイッチング、両方の言語の正書法といった問題を扱う一連のガイドラインを提示する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:19:23 GMT)
CrystalBox: Future-Based Explanations for Input-Driven Deep RL Systems [8.9] 本稿では,Deep Reinforcement Learningコントローラのためのモデルに依存しない,ポストホックな説明可能性フレームワークであるCrystalBoxを紹介する。
入力駆動環境における報酬関数の自然な分解可能性と分解された還元の説明力を組み合わせる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:38:27 GMT)
Don't Look into the Dark: Latent Codes for Pluralistic Image Inpainting [8.6] 本稿では,離散潜在符号の生成枠組みに基づく大規模マスク多元画像の描画手法を提案する。
本手法は,画像の可視な場所でのみ計算を行うことで,トークンとして識別された遅延先行を学習する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:28:36 GMT)
Distributed Maximum Consensus over Noisy Links [8.3] 我々は、ノイズロスト分散最大コンセンサス(RD-MC)と呼ばれる分散アルゴリズムを導入する。
提案手法では,分散最適化問題として最大コンセンサス問題を再定義する。
RD-MCは,既存の最大合意アルゴリズムに比べて通信リンクノイズに対してかなり頑健であることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:39:16 GMT)
Expectations Versus Reality: Evaluating Intrusion Detection Systems in Practice [8.3] 最高のソリューションはないが、データセット内の攻撃の種類、複雑性、ネットワーク環境など、外部変数に依存している。
ディープニューラルネットワークソリューションは、テストされたデータセットの平均F1スコアが最も高かったが、必ずしも最高のパフォーマンスであるとは限らない。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:54:59 GMT)
BAM: Box Abstraction Monitors for Real-time OoD Detection in Object Detection [8.2] ディープニューラルネットワーク(DNN)のアウト・オブ・ディストリビューション(OoD)検出技術は、安全クリティカルなアプリケーションにおいて不可欠である。
本稿では,オブジェクト検出DNNにおける再トレーニングやアーキテクチャの変更を必要としない,単純かつ驚くほど効果的な手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:10:01 GMT)
Demystifying Misconceptions in Social Bots Research [8.2] ソーシャルボットの研究は、知識の進歩と、最も議論を呼んだオンライン操作のソリューションの提供を目的としている。
しかし、ソーシャルボットの研究は、広範な偏見、誇張された結果、誤解に悩まされている。
本稿は、社会ボット研究の支持者と反対者の両方が用いている共通の誤った議論を特定し、否定することで、そのような取り組みを加速させるものである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:48:48 GMT)
Power and Play: Investigating "License to Critique" in Teams' AI Ethics Discussions [8.1] 本研究は, ディスカージカル・クロージャ(discursive closure)を規定する基準と, 権力関係が, 人々が批判を高めるかどうか, どのように影響するかを検討する。
私たちは、AI倫理に関する幅広い議論を呼び起こすように設計されたゲームをプレイします。
ゲームは製品やプラクティスへの直接的な変更を可能にすることはありそうにないが、メンバーが将来の集団行動に対して、批判的に整合した同盟者を見つけることは、よりありそうにない。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 23:09:50 GMT)
Imitating Cost-Constrained Behaviors in Reinforcement Learning [8.1] 本稿では, トラジェクティブコスト制約の存在下で, 専門家分布に適合する手法を提案する。
試行錯誤学習手法はコスト制約の少ない動作を模倣することを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:39:26 GMT)
Since the Scientific Literature Is Multilingual, Our Models Should Be Too [8.0] 文献の大部分は多言語であり、現在のモデルとベンチマークはこの言語多様性を反映すべきである、と論じている。
テキストベースのモデルでは、非英語の論文に意味のある表現を作れず、多言語ドメインで非差別的に英語のみのモデルを使用することによるネガティブなユーザ面の影響を強調できる証拠を提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:47:10 GMT)
ÌròyìnSpeech: A multi-purpose Yorùbá Speech Corpus [8.0] IroyinSpeechは、高品質で現代のヨルブの音声データの量を増やしたいという願望に影響された新しいコーパスである。
オープン・ライセンスCC-BY-4.0でニュース・クリエイティブ・ライティング・ドメインから約23,000のテキストをキュレートした。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:56:01 GMT)
Uncertainty-Aware SAR ATR: Defending Against Adversarial Attacks via Bayesian Neural Networks [7.9] 敵攻撃は、自動ターゲット認識(ATR)システムにおける機械学習(ML)画像分類器の脆弱性を実証している。
敵攻撃を検出するための新しい不確実性認識型SAR ATRを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:40:51 GMT)
The Comparison of Translationese in Machine Translation and Human Transation in terms of Translation Relations [7.8] この研究は2つのパラレルコーパスを用いており、それぞれが9つのジャンルにまたがって、同じソーステキストで、1つはNMTによって翻訳され、もう1つは人間によって翻訳された。
以上の結果から,NMTはHTよりも翻訳に大きく依存していることが示唆された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:12:20 GMT)
PLOT-TAL -- Prompt Learning with Optimal Transport for Few-Shot Temporal Action Localization [7.7] 本稿では,時間的行動ローカライゼーション(TAL)への新たなアプローチを提案する。
本稿では,最適輸送により強化されたマルチプロンプト学習フレームワークを提案する。
本実験は,数ショット設定における動作の局所化精度とロバスト性を大幅に改善したことを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:08:14 GMT)
Causal-StoNet: Causal Inference for High-Dimensional Complex Data [7.6] 本稿では,高次元複素データを扱うための新しい因果推論手法を提案する。
これは、疎いディープラーニング理論やニューラルネットワークなど、ディープラーニング技術に基づいている。
提案手法は、データセットに欠落した値が存在する場合にも使用できる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:27:31 GMT)
Clustering Change Sign Detection by Fusing Mixture Complexity [7.6] クラスタ構造は、データが有限混合モデルで表現される場合、クラスタの数などの離散的な構造特性を指す。
私たちは、時間とともにクラスタ構造が徐々に変化するシナリオに注目します。
複数の混合数が可能である状況に対処するために, MC の拡張として MC 融合を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:50:23 GMT)
Few-Shot Cross-System Anomaly Trace Classification for Microservice-based systems [7.6] マイクロサービスベースのシステム(MSS)は、複雑で動的な性質のため、さまざまな障害カテゴリで障害を経験する可能性がある。
障害を効果的に処理するために、AIOpsツールはトレースベースの異常検出と根本原因分析を利用する。
そこで本研究では,MSSの異常トレース分類のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:38:04 GMT)
Guided Distant Supervision for Multilingual Relation Extraction Data: Adapting to a New Language [7.6] 本稿では,ドイツにおける大規模生物関係抽出データセットの作成のために,遠距離監視法を適用した。
我々のデータセットは,9種類の関係型に対して80,000以上のインスタンスで構成されており,ドイツで最大規模の関係抽出データセットである。
私たちは、自動生成されたデータセット上に、最先端の機械学習モデルをトレーニングし、それらもリリースします。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:15:16 GMT)
Retrieval Helps or Hurts? A Deeper Dive into the Efficacy of Retrieval Augmentation to Language Models [7.5] 大規模言語モデル(LM)における実体と関係の組合せの効果について検討する。
一般の事実を想起する上で,より大きなLMは優れているが,検索者に比べて少ないエンティティ-リレーションペアでは困難である。
適応型検索システムを用いて,より微細な測定値と洞察値の有効性を実証する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:48:34 GMT)
Multi-Modal Contrastive Learning for Online Clinical Time-Series Applications [7.5] ICUデータに自己指導型マルチモーダルコントラスト学習技術を適用し、特に臨床ノートと時系列を臨床関連オンライン予測タスクに適用する。
ソフトな近傍関数であるMulti-Modal Neborhood Contrastive Loss (MM-NCL)を導入した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:38:36 GMT)
Interpretable machine learning for time-to-event prediction in medicine and healthcare [7.4] 時間依存的な特徴効果とグローバルな特徴重大説明を導入する。
我々は、ポストホックな解釈手法が、滞在期間を予測するAIシステムのバイアスを見つけるのにどのように役立つかを示す。
我々は,がんの生存率を予測性能を超えて評価し,マルチオミクスの特徴群の重要性を考察した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:52:59 GMT)
Enhancing Programming Education with ChatGPT: A Case Study on Student Perceptions and Interactions in a Python Course [7.2] 本稿では,8週間にわたる1年生向けのPythonプログラミングコースにおいて,ChatGPTが学習に与える影響について検討する。
調査,オープンエンド質問,学生-ChatGPTダイアログデータからの回答を分析して,ChatGPTの有用性を総合的に把握することを目的とする。
本研究は,ChatGPTに対する肯定的な反応を明らかにし,プログラミング教育経験の向上におけるChatGPTの役割について考察する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:22:41 GMT)
ReflectSumm: A Benchmark for Course Reflection Summarization [7.1] ReflectSummは、学生のリフレクティブ・ライティングを要約するために特別に設計された新しい要約データセットである。
データセットはさまざまな要約タスクを含み、包括的なメタデータを含んでいる。
実用性を示すために,複数の最先端ベースラインを用いて広範囲な評価を行った。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:10:07 GMT)
SplatFace: Gaussian Splat Face Reconstruction Leveraging an Optimizable Surface [7.1] SplatFaceは3次元人間の顔再構成のための新しいガウススプレイティングフレームワークであり、正確な事前決定幾何に依存しない。
本手法は,高品質な新規ビューレンダリングと高精度な3Dメッシュ再構成の両方を同時に実現するように設計されている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:32:04 GMT)
Nonstandard Lagrangians and branched Hamiltonians: A brief review [7.0] ラグランジュ人の非伝統的な形態は文学に注目されている。
様々な例として、分枝ハミルトニアンの理論における運動量依存質量の概念の出現を強調する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:48:54 GMT)
A Physics-embedded Deep Learning Framework for Cloth Simulation [6.9] 本稿では,布地シミュレーションの物理特性を直接エンコードする物理組込み学習フレームワークを提案する。
このフレームワークは、従来のシミュレータやサブニューラルネットワークを通じて、外部の力や衝突処理と統合することもできる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:35:47 GMT)
Generalized bulk-boundary correspondence in periodically driven non-Hermitian systems [6.8] 我々は、周期的に駆動される2つの非エルミート系の非ブロッホバンド理論に焦点をあてる。
我々は高次元周期駆動非エルミート系における新しい現象を概説する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:29:30 GMT)
SMOF: Streaming Modern CNNs on FPGAs with Smart Off-Chip Eviction [6.8] 本稿では,計算パイプラインに沿ったオフチップメモリに重み付けとアクティベーション消去機構を導入する。
提案機構は既存のツールフローに組み込まれ,オフチップメモリをバッファとして利用することで設計空間を拡大する。
SMOFは、競争力があり、場合によっては、コンピュータビジョンタスクの範囲で最先端のパフォーマンスを提供する能力を示した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:12:24 GMT)
H2ASeg: Hierarchical Adaptive Interaction and Weighting Network for Tumor Segmentation in PET/CT Images [6.8] PET(Positron emission tomography)とCT(Computed tomography)の併用は、がんの診断や予後に日常的に用いられている。
従来のマルチモーダルセグメンテーションソリューションは、モダリティ融合の連結演算に依存している。
本稿では,H2ASeg と呼ばれる階層型適応的相互作用と重み付けネットワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:28:14 GMT)
Scalable Non-Cartesian Magnetic Resonance Imaging with R2D2 [6.7] 本研究では,非電子磁気共鳴画像再構成のための新しい手法を提案する。
我々は「Residual to-Residual DNN series for high range imaging (R2D2)」を利用する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:07:02 GMT)
Illicit object detection in X-ray images using Vision Transformers [6.7] Illicitオブジェクト検出は、さまざまな高セキュリティ場所で実施される重要なタスクである。
本研究では、SWINやNextViTのようなトランスフォーマーとハイブリッドのバックボーンの両方と、DINOやRT-DETRのような検出器を利用する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 22:36:02 GMT)
Insights into the Lottery Ticket Hypothesis and Iterative Magnitude Pruning [6.7] そこで本研究では,反復的等級切削工程の様々な段階で得られた溶液の体積/幾何学および損失景観特性について検討した。
抽選券仮説によって提案された特定の初期化が、一般化(および訓練)性能においてよりうまく機能する傾向にある理由を説明する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:47:24 GMT)
CheckEval: Robust Evaluation Framework using Large Language Model via Checklist [6.7] 大規模言語モデルを用いた新しい評価フレームワークであるCheckEvalを紹介する。
CheckEvalは、現在の評価方法における曖昧さと一貫性の課題に対処する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:20:39 GMT)
Identifying the Correlation Between Language Distance and Cross-Lingual Transfer in a Multilingual Representation Space [6.7] 本研究では,MLLMが生成する各言語表現空間の絶対的進化について検討する。
本稿では,言語的特徴の役割に特に重点を置いて,表現空間への影響と言語間移動性能との関連について検討する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:43:28 GMT)
Dyadic Interaction Modeling for Social Behavior Generation [6.6] 本稿では,ダイアディックインタラクションにおける3次元顔の動きを効果的に生成するための枠組みを提案する。
既存の作業では、リスナーは話者の声や顔の動きに対する反射的な振る舞いを持つ反応剤であると考えられている。
我々のフレームワークの核心はDyadic Interaction Modeling (DIM)であり、これは話者の動作とリスナーの動きを共同でモデル化する事前学習のアプローチである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:32:10 GMT)
PEMA: An Offsite-Tunable Plug-in External Memory Adaptation for Language Models [6.6] プレトレーニング言語モデル (PLM) は、様々な下流のNLPタスクにおいて顕著な性能を示す。
大量の資源を必要とするため、多くのPLM重みは機密である。
本稿では,PEMA(Plug-in external Memory Adaptation)を紹介する。
すべての重みを必要とせずにファインチューニングを可能にするPEFT (Efficient Fine-Tuning) 法。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:53:58 GMT)
Attention-aware semantic relevance predicting Chinese sentence reading [6.3] 本研究では,文脈意味的関連性を計算するための注意意識的アプローチを提案する。
意味的関連性の注意を意識したメトリクスは、中国語読解タスクの固定期間をより正確に予測することができる。
私たちのアプローチは、人間の言語理解と処理方法の理解を深めるために、これらのメトリクスの可能性を強調します。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:22:38 GMT)
(2+1)D topological phases with RT symmetry: many-body invariant, classification, and higher order edge modes [6.3] 我々はフェルミオン対称性群と相互作用するフェルミオンの多体系を$G_f mathbbZf times mathbbZ$とする。
これらの対称性を持つ (2+1)D 可逆フェルミオン相は、$mathbbZ times mathbbZ_8$, $mathbbZ_8$, $mathbbZ2 times mathbbZ$, $mathbbZ2 を持つことを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:00:00 GMT)
Faster Convergence for Transformer Fine-tuning with Line Search Methods [6.1] 本研究では,新しいトランスフォーマーアーキテクチャとデータセットドメインへの行探索手法の拡張に成功した。
我々の作業はpythonパッケージとして公開されており、任意のネットワークアーキテクチャと互換性のある超自由勾配のpytorchを提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:35:23 GMT)
Generalized Policy Learning for Smart Grids: FL TRPO Approach [6.1] フェデレートラーニング(FL)は、データのプライバシを維持しながら、異種データセット上のモデルをトレーニングすることができる。
本稿では,FLと信頼地域政策最適化(FL TRPO)を組み合わせた,エネルギー関連排出削減とコスト削減を目的とした枠組みを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:47:06 GMT)
Distinguishing pure and thermal states by Landauer's principle in open systems [6.0] 量子ビットと空洞量子場理論(QFT)の相互作用について検討する。
本手法では,システム順序の進化を順序で計算する。
熱状態と熱状態の代替として、正準熱純量子状態(CTPQ)の違いについて論じる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:17:00 GMT)
Electromagnetic chirality-induced negative refraction with the same amplitude and anti-phase of the two chirality coefficients [5.8] 負の屈折は、同じ振幅の2つのキラリティ係数と反対の位相とで達成できる。
同時に負の誘電率と磁気透過性も不要である。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:15:28 GMT)
Towards a World-English Language Model for On-Device Virtual Assistants [5.7] 我々は、地域英語の変種を組み合わせて、オンデバイスVAのためのWorld English's NNLMを構築します。
アダプタモジュールは,サブネットワーク全体の特化よりも,方言のモデリングに有効であることが判明した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:31:39 GMT)
Large Language Models Need Consultants for Reasoning: Becoming an Expert in a Complex Human System Through Behavior Simulation [5.7] 大規模言語モデル(LLM)は、数学、法学、コーディング、常識、世界知識といった分野において、人間に匹敵する優れた能力を示してきた。
本稿では,生成エージェントによるシミュレーション技術を活用した新たな推論フレームワークであるMosaic Expert Observation Wall' (MEOW)を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:33:32 GMT)
When SMILES have Language: Drug Classification using Text Classification Methods on Drug SMILES Strings [5.6] 薬物のような複雑な化学構造は、通常SMILES文字列によって分子と結合の配列として定義される。
薬物のSMILESを従来の文章として扱い、薬物分類のためのテキスト分類に関わった場合はどうでしょう?
この研究は、各原子と結合を文成分と見なすという概念を探求し、薬物の種類を分類するための基本的なNLP法を用いている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:51:03 GMT)
CADGL: Context-Aware Deep Graph Learning for Predicting Drug-Drug Interactions [5.6] 薬物・薬物相互作用(DDIs)は、薬物開発における重要な要素である。
我々は,CADGLという新しいフレームワークを導入することで,文脈認識深層グラフ学習の有効性を活用することで,課題に対処することを目指している。
カスタマイズされた変分グラフオートエンコーダ (VGAE) に基づいて, 重要な構造および物理化学的情報を取得する。
我々は厳格なケーススタディで支援された,臨床的に価値のある新規DDIの予測に長けている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:47:49 GMT)
Intraoperative 2D/3D Image Registration via Differentiable X-ray Rendering [5.6] DiffPoseは、患者固有のシミュレーションと微分可能な物理ベースのレンダリングを利用して、手動でラベル付けされたデータに頼ることなく正確な2D/3D登録を実現する自己教師型アプローチである。
DiffPoseは手術用データセット全体の術速でサブミリ精度を達成し、既存の教師なしの手法を桁違いに改善し、教師付きベースラインよりも優れています。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:24:29 GMT)
Foundation Model Makes Clustering A Better Initialization For Cold-Start Active Learning [5.6] コールドスタート能動学習のためのサンプルを選択するために,基礎モデルとクラスタリング手法を統合することを提案する。
ファンデーションモデルは、自己管理パラダイムによってトレーニングされた大量のデータセットを指す。
総合的な比較のために、埋め込みを取得するための古典的なImageNet教師付きモデルを含む。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:23:40 GMT)
HotStuff-2 vs. HotStuff: The Difference and Advantage [5.6] ブロックチェーン技術では、ビザンチンのコンセンサスプロトコルが不可欠だ。
HotStuffプロトコルは、効率的なビュー変更と通信複雑性の低減に暗号化手段を使用する。
HotStuffの主な著者は、HotStuff-2という先進的なイテレーションを導入した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:54:56 GMT)
PDNNet: PDN-Aware GNN-CNN Heterogeneous Network for Dynamic IR Drop Prediction [5.5] 電力供給ネットワーク(PDN)上のIRドロップは、PDNの構成とセル電流消費と密接に関連している。
PDN構造と細胞-PDN関係の表現を統一する新しいグラフ構造PDNGraphを提案する。
我々は、深層学習に基づく動的IRドロップ予測法にグラフ構造を適用した最初の研究である。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:50:13 GMT)
Toward Low-latency Iterative Decoding of QLDPC Codes Under Circuit-Level Noise [5.5] 信念伝播(BP)に基づくスライディングウィンドウデコーダを提案する。
我々は、各ラウンドで最も反転しそうな変数ノードをデシミネーションしたBPのラウンドを数回採用する。
導出デコーダBPを導出デシミネーション推定(GDG)で表現する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:00:04 GMT)
Generative Medical Segmentation [5.5] Generative Medical (GMS) は、画像セグメンテーションに生成モデルを活用する新しいアプローチである。
GMSは、画像とマスクの両方の潜在表現を導出するために、堅牢な事前訓練されたVari Autoencoder(VAE)を使用し、次に、潜時空間における画像からマスクへの遷移を学習するマッピングモデルを使用する。
GMSの設計はモデルの学習可能なパラメータを減らし、計算負荷の低減と一般化能力の向上をもたらす。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:16:04 GMT)
Multi-modal Misinformation Detection: Approaches, Challenges and Opportunities [5.4] ソーシャルメディアプラットフォームは、テキストベースのフォーラムからマルチモーダル環境へと進化している。
誤情報スプレッダーは、最近、テキストや画像などのモダリティ間のコンテキスト接続をターゲットにしている。
マルチモーダルな誤情報検出の分野での新たな研究機会を見出すために,既存のアプローチを分析,分類,そして,それらが直面する課題や欠点に加えて特定する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 23:27:58 GMT)
Neural Fields for Interactive Visualization of Statistical Dependencies in 3D Simulation Ensembles [5.4] 大規模な3次元シミュレーションアンサンブルにおいて、物理変数の値間の統計的依存関係をコンパクトに表現し、効率的に再構築できる最初のニューラルネットワークを提案する。
シミュレーショングリッド250 x 352 x 20 に複数の物理変数を格納し,1000人のメンバからなる大規模な天気予報アンサンブルによる学習と再構築を実演する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:12:45 GMT)
AIR-HLoc: Adaptive Image Retrieval for Efficient Visual Localisation [5.3] 最先端の階層的ローカライゼーションパイプライン(HLOC)は、2D-3D対応を確立するために画像検索(IR)技術に依存している。
本稿では,参照データベースとの類似性に基づいて,クエリ画像を異なる局所化困難度に分割する新しいアプローチであるAIR-HLocを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:17:21 GMT)
Quantum search algorithm on weighted databases [5.2] グロバーアルゴリズムは非構造化探索問題に対処するための重要な解法である。
本研究は,非一様分散データベースにおけるGroverの探索手法を幅広く検討する。
この進化によって促進される探索過程が、常にスピードアップするわけではないことが観察された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:28:12 GMT)
Improving Content Recommendation: Knowledge Graph-Based Semantic Contrastive Learning for Diversity and Cold-Start Users [5.2] 本稿では,複数タスクのハイブリッド学習手法を提案する。
我々のアプローチは、テキストからの意味情報を活用することにより、知識グラフ内のエンティティ間の関係をよりよく理解することを可能にする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:11:00 GMT)
mALBERT: Is a Compact Multilingual BERT Model Still Worth It? [5.2] ALBERTのようなコンパクトモデルなど,これらのPLMよりも頑丈なモデルに焦点をあてる。
PLMは、SpokenやNatural LanguageUnderstandingといった自然言語処理タスク、分類、質問応答タスクにおいて、大きなブレークスルーを可能にします。
これらの事実を踏まえ、ウィキペディアデータを用いて事前訓練された多言語コンパクトALBERTモデルの最初のバージョンを無償で提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:25:28 GMT)
SoftTiger: A Clinical Foundation Model for Healthcare Workflows [5.2] 医療基盤モデルとして設計された臨床用大規模言語モデル(CLaM)であるSoftTigerを紹介する。
我々は,3つのサブタスク,すなわち国際患者要約,臨床印象,医療的出会いのデータを収集し,注釈する。
公立および認証臨床データを用いて,最先端のLCMの微調整を指導した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:03:00 GMT)
ECoDepth: Effective Conditioning of Diffusion Models for Monocular Depth Estimation [5.2] パララックスの手がかりがない場合、学習に基づく単一画像深度推定モデルは、画像のシェーディングと文脈的手がかりに大きく依存する。
CLIPのような事前訓練された基礎モデルからの埋め込みを使用することで、いくつかのアプリケーションにおけるゼロショット転送が改善されることが示されている。
拡散バックボーンを用いた新しいSIDEモデルを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:53:30 GMT)
Partial Mobilization: Tracking Multilingual Information Flows Amongst Russian Media Outlets and Telegram [5.2] 我々は、2022年を通して、ロシアの16のメディアが732のTelegramチャンネルとどのように対話し、利用したかを調査した。
我々は、ニュースメディアがTelegramを通じて既存の物語を広めるだけでなく、メッセージプラットフォームから資料を発信していることを示す。
例えば、我々の研究のウェブサイト全体では、2.3%(ura.news)から26.7%(ukraina.ru)までの記事がTelegram上での活動から生まれたり反したりした内容について論じている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 00:47:21 GMT)
Empowering Data Mesh with Federated Learning [5.1] 新しいパラダイムであるData Meshは、中央チームから各データドメインにデータオーナシップを分散することで、ドメインを第一級の関心事として扱う。
Paypal、Netflix、Zalandoといった数十万ドルの企業はすでに、この新しいアーキテクチャに基づいてデータ分析パイプラインを変革している。
我々はフェデレートラーニングをData Meshに組み込む先駆的なアプローチを導入します。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:01:00 GMT)
An Evolutionary Network Architecture Search Framework with Adaptive Multimodal Fusion for Hand Gesture Recognition [5.0] 適応型マルチモデル融合(AMF-ENAS)を用いた進化的ネットワークアーキテクチャ探索フレームワークを提案する。
AMF-ENASは、Ninapro DB2、DB3、DB7データセットの最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:39:23 GMT)
Automated Construction of Time-Space Diagrams for Traffic Analysis Using Street-View Video Sequence [5.0] 移動車に搭載されたカメラで撮影したストリートビュー映像シーケンスを利用して、時間空間図を構築するための革新的なアプローチを提案する。
これらの図は交通パターンに関する貴重な洞察を与え、交通インフラや交通管理戦略の設計に貢献する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:26:44 GMT)
Neural Architecture Search for Sentence Classification with BERT [4.9] 計算コストが小さいだけで,現在の単一層よりも優れたアーキテクチャを見つけるために,AutoML検索を実行します。
GLUEデータセットから,様々なNLPベンチマークを用いて分類アーキテクチャを検証する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:25:43 GMT)
Improving Line Search Methods for Large Scale Neural Network Training [4.9] 我々は,最先端のライン探索手法における既存の問題を特定し,拡張を提案し,その有効性を厳格に評価する。
我々は,ADAMからの運動量項を探索方向に統合することにより,Armijoライン探索を改善し,大規模学習を効率化する。
本評価では,NLPおよび画像データの領域におけるトランスフォーマーとCNNに着目した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:50:27 GMT)
Integration of Graph Neural Network and Neural-ODEs for Tumor Dynamic Prediction [4.9] 本稿では,二部グラフ畳み込みニューラルネットワーク(GCN)とニューラル正規微分方程式(Neural-ODE)を組み合わせたグラフエンコーダを提案する。
まず,本手法が経験的モデルにより著しく改善される腫瘍のダイナミックモデルを発見することができることを示す。
本研究は, 提案手法が有望であり, プリクリニカル・セッティングに応用できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:34:21 GMT)
The Invalsi Benchmark: measuring Language Models Mathematical and Language understanding in Italian [4.8] 本研究は,イタリア語における数学的理解と言語理解のモデル性能を評価するための2つの新しいベンチマークを示す。
これらのベンチマークは、イタリアの学校システムにおいて、11歳から18歳の学生が実施する実際のテストに基づいている。
これは、現在の言語モデルが60%の精度でバインドされている、挑戦的なベンチマークであることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:46:25 GMT)
Fpga-Based Neural Thrust Controller for UAVs [4.8] 本稿では,Artix-7 FPGAを搭載した,オープンソースのマイクロUAVプラットフォーム用の新しいハードウェアボードを提案する。
我々はRLベースの低レベルコントローラを実装することで、その機能を検証することに成功した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:52:54 GMT)
Super-Resolution of SOHO/MDI Magnetograms of Solar Active Regions Using SDO/HMI Data and an Attention-Aided Convolutional Neural Network [4.7] 太陽画像超解像のための注意支援畳み込みニューラルネットワーク(CNN)を提案する。
太陽・ヘリオスフェア天文台(SOHO)に搭載されたミッチェルソンドップラー・イメージラー(MDI)によって収集された太陽活動領域(AR)の視線磁図の質を高めることを目的として,SolarCNNと名付けられた手法を開発した。
実験結果から、SolarCNNは構造類似度指数測定(SSIM)、ピアソン相関係数(PCC)、ピーク信号-雑音比(PSNR)の観点からSOHO/MDI磁気グラムの品質を向上させることが示された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:58:01 GMT)
Quantum concentration inequalities and equivalence of the thermodynamical ensembles: an optimal mass transport approach [4.6] 我々は量子スピン系に対する新しい濃度不等式を証明した。
我々の結果は、スピンを正則格子に配置する必要がない。
局所的なW1距離を導入し、局所観測可能な状態に対する2つの状態の識別性を定量化する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:32:03 GMT)
SDSAT: Accelerating LLM Inference through Speculative Decoding with Semantic Adaptive Tokens [4.6] 意味適応トークン(SDSAT)を用いた投機的復号化による大規模言語モデル(LLM)の高速化手法を提案する。
この設計の主な目的は、LLMモデルの精度を損なうことなく、より正確にドラフトトークンを生成する能力を高めることである。
CodeLlama-13B と 7B で実施された実験では、それぞれ3.5X と 3.0X 以上の速度向上が達成されている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:54:27 GMT)
LCANets++: Robust Audio Classification using Multi-layer Neural Networks with Lateral Competition [4.6] LCANets++を導入し、LCAを介して複数の層でスパースコーディングを行う。
LCANets++は、通常のCNNやLCANetよりも、摂動に対して堅牢であることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:47:41 GMT)
X-LLaVA: Optimizing Bilingual Large Vision-Language Alignment [4.6] 91Kの英語-韓国-中国の多言語・マルチモーダルトレーニングデータセットを作成します。
韓国語と英語の両方で優れた性能を示すバイリンガル・マルチモーダル・モデルを開発した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:05:22 GMT)
ViT-CoMer: Vision Transformer with Convolutional Multi-scale Feature Interaction for Dense Predictions [4.6] Vision Transformer (ViT) はコンピュータビジョンにおいて大きな成功を収めているが、密集した予測タスクではうまく機能しない。
コンボリューショナル・マルチスケール機能を有するVTバックボーンであるViT-CoMerについて述べる。
階層的特徴をまたいだマルチスケールの融合を行う,シンプルで効率的なCNN-Transformer双方向核融合モジュールを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:44:13 GMT)
DODA: Diffusion for Object-detection Domain Adaptation in Agriculture [4.5] 本稿では,農業の新しい領域を対象とした高品質なオブジェクト検出データを生成するデータシンセサイザーであるDODAを提案する。
具体的には、画像としてレイアウトを符号化することでレイアウト・ツー・イメージの制御性を向上し、ラベルの品質を向上させる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:16:33 GMT)
The Impact of Uniform Inputs on Activation Sparsity and Energy-Latency Attacks in Computer Vision [4.5] 研究者は最近、ニューラルネットワークのエネルギー消費と決定レイテンシを高めるために、攻撃者が推論時にいわゆるスポンジ例を計算し、提出できることを実証した。
コンピュータビジョンでは、提案された戦略は、計算の高速化に使用可能なアクティベーションの間隔を小さくして入力を作成する。
均一な画像、すなわち、主に平坦で均一に色のついた表面を持つ画像は、畳み込み、バッチ正規化、ReLUアクティベーションの特定の相互作用により、より多くのアクティベーションをトリガーする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:11:23 GMT)
A2V: A Semi-Supervised Domain Adaptation Framework for Brain Vessel Segmentation via Two-Phase Training Angiography-to-Venography Translation [4.5] 画像の異なる脳血管セグメンテーションのための半教師付きドメイン適応フレームワークを提案する。
本フレームワークは,注釈付血管造影と限られた数の血管造影に頼り,画像から画像への翻訳とセマンティックセグメンテーションを実現する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:51:15 GMT)
Looking Beyond What You See: An Empirical Analysis on Subgroup Intersectional Fairness for Multi-label Chest X-ray Classification Using Social Determinants of Racial Health Inequities [4.4] ディープラーニングモデルにおける継承バイアスは、保護されたグループ間での予測精度の相違につながる可能性がある。
本稿では,正確な診断結果を達成し,交差点群間の公平性を確保するための枠組みを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:13:20 GMT)
Few-Shot Detection of Machine-Generated Text using Style Representations [4.3] 人間の文章を巧みに模倣する言語モデルは、虐待のかなりのリスクを負う。
そこで本研究では,人間が作成したテキストから推定した書体スタイルの表現を活用することを提案する。
また,人間と機械作家の区別にも有効であることがわかった。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:38:35 GMT)
Optimizing Cyber Response Time on Temporal Active Directory Networks Using Decoys [4.3] 攻撃の可能性を検出するために,Microsoft Active Directory (AD) ネットワークにデコイを配置する問題について検討する。
本稿では、時間的攻撃グラフにおけるデコイ配置の有効性を測定するために、応答時間と呼ばれる新しい指標を提案する。
我々の目標は、最悪の攻撃経路に対するディフェンダーの対応時間を最大化することです。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 00:05:48 GMT)
Bringing Textual Prompt to AI-Generated Image Quality Assessment [4.2] IP-IQA (AGIs Quality Assessment via Image and Prompt)は、AGIQAのマルチモーダルフレームワークである。
また、新規な特別な[QA]トークンとともに、効果的で効率的なイメージプロンプト融合モジュールも適用した。
実験により,我々のIP-IQAがAGIQA-1kおよびAGIQA-3kデータセットの最先端化を実現していることが示された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:02:00 GMT)
A Survey on Large Language Models from Concept to Implementation [4.2] 近年のLarge Language Models (LLM) の進歩により、自然言語処理(NLP)アプリケーションの範囲が拡大している。
本稿では,これらのモデルの多面的応用について検討し,GPTシリーズに着目した。
この調査は、コーディングや問題解決といった従来のタスクに革命をもたらす人工知能(AI)駆動ツールの変革的な影響に焦点を当てている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:35:41 GMT)
Assessing the overall and partial causal well-specification of nonlinear additive noise models [4.1] このような誤用があっても因果関係を推測できる予測変数を同定することを目的としている。
本稿では,有限サンプルデータに対するアルゴリズムを提案し,その特性について議論し,シミュレーションおよび実データ上での性能を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:40:27 GMT)
A Novel Corpus of Annotated Medical Imaging Reports and Information Extraction Results Using BERT-based Language Models [4.0] 医療画像は多くの健康状態の診断、監視、治療に重要である。
放射線学者は、これらの複雑で非構造的なイメージを解釈し、ほとんど非構造的のままの物語報告を通じてその評価を明確にする。
この非構造化の物語は、振り返り分析や臨床決定支援のような二次的な応用を促進するために、構造化された意味表現に変換されなければならない。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:43:45 GMT)
Physics-Informed Graph Neural Networks for Water Distribution Systems [4.0] 水道システム(WDS)は、都市開発に欠かせない重要なインフラの不可欠な部分である。
WDSにおける油圧状態推定のための物理インフォームドディープラーニング(DL)モデルを提案する。
本モデルでは,2つの油圧状態特徴を推定するために水圧原理を用いる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:51:26 GMT)
Evaluating Large Language Models for Health-Related Text Classification Tasks with Public Social Media Data [3.9] 大規模言語モデル(LLM)は、NLPタスクにおいて顕著な成功を収めた。
我々は、サポートベクトルマシン(SVM)に基づく教師付き古典機械学習モデルと、RoBERTa、BERTweet、SocBERTに基づく3つの教師付き事前訓練言語モデル(PLM)と、6つのテキスト分類タスクで2つのLLMベースの分類器(GPT3.5、GPT4)をベンチマークした。
LLM(GPT-4)を用いた軽量教師付き分類モデルの訓練には,比較的小さな人手によるデータ拡張(GPT-4)が有効であることを示す総合的な実験を行った。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 22:05:10 GMT)
Targeted collapse regularized autoencoder for anomaly detection: black hole at the center [3.9] オートエンコーダは通常のクラスを超えて一般化することができ、いくつかの異常なサンプルに対して小さな再構成誤差を達成できる。
我々は、ニューラルネットワークコンポーネントの追加、計算の関与、煩雑なトレーニングの代わりに、再構成損失を計算的に軽い用語で補うという、驚くほど簡単な方法を提案する。
これは、オートエンコーダに基づく異常検出アルゴリズムのブラックボックスの性質を緩和し、さらなる利点、障害事例、潜在的な新しい方向の解明のための道筋を提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 23:54:26 GMT)
Statistical Inference of Optimal Allocations I: Regularities and their Implications [3.9] まず、ソート作用素の一般性質の詳細な解析を通して、値関数のアダマール微分可能性(英語版)を導出する。
アダマール微分可能性の結果に基づいて、関数デルタ法を用いて値関数プロセスの特性を直接導出する方法を実証する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:39:13 GMT)
FlexEdit: Flexible and Controllable Diffusion-based Object-centric Image Editing [3.9] オブジェクトのフレキシブルでコントロール可能な編集フレームワークであるFlexEditを紹介します。
FlexEditブロックを使用して、各denoisingステップでレイトを反復的に調整します。
当社のフレームワークでは,デノナイズ時に自動的に抽出されるアダプティブマスクを用いて,背景の保護を行う。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:24:30 GMT)
Benchmarking Image Transformers for Prostate Cancer Detection from Ultrasound Data [3.8] 超音波画像における前立腺癌(PCa)の分類のための深層学習法は、通常、針トレース領域に沿った小さな領域(ROI)におけるがんを検出するために、畳み込みネットワーク(CNN)を用いている。
マルチ・インスタンス・ラーニング(MIL)を用いて複数のROIから癌を検出するために,トランスフォーマーの認識とCNN特徴抽出器を組み合わせることで,この問題を軽減するためのマルチスケールアプローチが提案されている。
本稿では、ROIスケールおよびマルチスケールの分類のための複数の画像トランスフォーマーアーキテクチャについて検討し、超音波による前立腺癌分類のためのCNNとトランスフォーマーの性能の比較を行った。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:39:57 GMT)
Scalable Lipschitz Estimation for CNNs [3.8] ディープニューラルネットワークのリプシッツ定数を推定することは、関心が高まっている。
CNNはコンピュータビジョン関連のアプリケーションにおける最近の成功の多くを支えている。
CNNのリプシッツ定数推定を高速化する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:28:44 GMT)
The Artificial Neural Twin -- Process Optimization and Continual Learning in Distributed Process Chains [3.8] 本稿では,モデル予測制御,ディープラーニング,センサネットワークの概念を組み合わせた人工ニューラルツインを提案する。
我々のアプローチでは、分散プロセスのステップの状態を推定するために、微分可能なデータ融合を導入します。
相互接続されたプロセスステップを準ニューラルネットワークとして扱うことで、プロセス最適化やモデル微調整のための損失勾配をプロセスパラメータにバックプロパゲートすることができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:34:39 GMT)
MD-PK: Metaphor Detection via Prompt Learning and Knowledge Distillation [3.8] 以前のアプローチは、しばしば言語規則の不適切な適用に苦しんだ。
メタファ検出タスクに適した素早い学習テンプレートを考案する。
我々は,有意義なソフトラベルを生成するために,事前知識を備えた教師モデルを採用する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:51:42 GMT)
3D Face Reconstruction Using A Spectral-Based Graph Convolution Encoder [3.7] 本稿では,既存の2次元機能と3次元機能を統合し,モデル学習プロセスを導く革新的なアプローチを提案する。
我々のモデルはデータセットの組み合わせから2D-3Dデータペアを用いて訓練され、NoWベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:21:42 GMT)
Dealing with Imbalanced Classes in Bot-IoT Dataset [3.7] Bot-IoTデータセットにおけるクラス不均衡問題に対処するために,合成マイノリティオーバーサンプリング技術(SMOTE)を用いたバイナリ分類手法を提案する。
提案手法は,攻撃パケットを検出し,SMOTEアルゴリズムを用いてクラス不均衡問題を克服することを目的としている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:09:59 GMT)
SeSaMe: A Framework to Simulate Self-Reported Ground Truth for Mental Health Sensing Studies [3.7] メンタルモデル (SeSaMe) は、デジタルメンタルヘルス研究における参加者の負担を軽減する枠組みである。
事前訓練された大規模言語モデル(LLM)を活用することで、SeSaMeは参加者の心理的尺度に対する反応のシミュレーションを可能にする。
本稿では,GPT-4を用いて1つのスケールで応答をシミュレートするSeSaMeの応用例を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:08:31 GMT)
A Novel Behavior-Based Recommendation System for E-commerce [3.7] 本研究では,eコマースプラットフォーム上でのブラウジングやクリックといった顧客の自然な行動を活用する行動に基づくレコメンデーションシステムを提案する。
提案するリコメンデーションシステムは、アクティブな顧客をクラスタリングし、近隣を判断し、類似ユーザを収集し、類似ユーザに基づいて製品評判を計算し、高評価製品を推薦する。
提案手法は,有名なeコマースサイトAlibabaの行動データセットを用いて実施した実験において,ベンチマーク手法よりも優れている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:12:41 GMT)
U-Sketch: An Efficient Approach for Sketch to Image Diffusion Models [3.7] 拡散モデルはテキスト・画像合成において顕著な性能を示した。
その成功にもかかわらず、ディフュージョンモデルはまだスケッチ・ツー・イメージ合成タスクに遅れを取っている。
U-Net型潜在エッジ予測器を備えたフレームワークであるU-Sketchを紹介する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:26:42 GMT)
NLP-based detection of systematic anomalies among the narratives of consumer complaints [3.7] 我々は,NLPをベースとしたシステム的非商業的消費者苦情の検出手法を開発した。
本稿では, 消費者金融保護局の苦情談話を用いて, 全手続について解説する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 00:29:33 GMT)
Efficient Algorithms for Regularized Nonnegative Scale-invariant Low-rank Approximation Models [3.6] 低ランク近似モデルに固有のスケール不変性は、予期せぬ有益効果と有害効果の両方で暗黙の正則化を引き起こすことを示す。
正規化された非負の低ランク近似を多数処理する一般化行列化最小化アルゴリズムを導出する。
我々は,スパース非負行列因子分解,リッジ規則化カノニカルポリアディック分解,スパース非負タッカー分解への貢献を紹介する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:49:14 GMT)
Language Plays a Pivotal Role in the Object-Attribute Compositional Generalization of CLIP [3.6] 本研究では,視覚言語モデルが,属性オブジェクト対の新たな構成で画像の分類を成功させるかどうかを考察する。
その結果,OpenAI CLIP, LAION-400M, LAION-2Bなどの大規模データセットを用いてトレーニングしたCLIPは, 有効合成OoDの一般化において, オーダー・オブ・マグニチュードの改善を示すことがわかった。
本研究は,学習データと言語指導の規模と多様性が,視覚言語モデルの構成一般化能力の解放に重要な役割を果たしていることを示すものである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:59:44 GMT)
Sampling reduced density matrix to extract fine levels of entanglement spectrum [3.6] 低層微細絡み合いスペクトル(ES)を抽出する新しい手法を提案する。
量子モンテカルロシミュレーションを用いて環境をトレースし、還元密度行列を対角化してESを得る。
我々のシミュレーション結果は、前例のないほど大きなシステムサイズで、環境自由度の高い絡み合いスペクトルの実践的なスキームを確立した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:04:38 GMT)
SAT-NGP : Unleashing Neural Graphics Primitives for Fast Relightable Transient-Free 3D reconstruction from Satellite Imagery [3.5] 現在のステレオビジョンパイプラインは、衛星画像の複数のペアや三脚を使用する場合、高精度な3D再構成を実現する。
学習を高速化するために,効率的なサンプリング戦略とマルチレゾリューションハッシュエンコーディングを提案する。
衛星ニューラルネットワークプリミティブ(SAT-NGP)は3次元再構成の品質を維持しながら学習時間を15分に短縮する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:58:25 GMT)
Challenging Common Paradigms in Multi-Task Learning [3.5] 近年,MTL (Multi-task Learning) が注目されているが,その基盤となるメカニズムはよく分かっていない。
最近の手法では、単一タスク学習(STL)ベースラインよりも一貫した性能向上は得られなかった。
MTLにおけるAdamのような一般的なSTLツールの役割を示す。
STLとMTLの驚くべき類似性は、より広い文脈で両方の分野からの手法を検討することを示唆している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:24:17 GMT)
Shotgun crystal structure prediction using machine-learned formation energies [3.4] 組み立てられた原子の安定あるいは準安定な結晶構造は、原子配置の空間上で定義されたエネルギー表面の大域的または局所的なミニマを見つけることで予測できる。
ここでは,簡単な機械学習ワークフローを用いて,結晶構造予測問題の解決に大きな進歩を遂げた。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:31:34 GMT)
CoBOS: Constraint-Based Online Scheduler for Human-Robot Collaboration [3.3] 本稿では,リアクティブ実行制御フレームワークを用いたオンライン制約ベースのスケジューリング手法を提案する。
これにより、ロボットは(人間によって)遅延した活動完了や活動選択などの不確実な事象に適応することができる。
作業条件の改善に加えて,本アルゴリズムは極めて不確実なシナリオにおいても,効率の向上につながる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:18:01 GMT)
Sequential Inference of Hospitalization ElectronicHealth Records Using Probabilistic Models [3.3] 本研究では,入院電子健康記録(EHR)データに含まれる複数の任意長配列に対する確率的教師なしモデルの設計を行う。
このモデルは潜在変数構造を使用し、薬物、診断、実験室のテスト、神経学的評価、薬物の間の複雑な関係を捉えている。
推論アルゴリズムは、部分的データを用いて、その長さや特定の値の存在を含む完全なシーケンスの特性を推測する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:06:26 GMT)
Many-Objective Evolutionary Influence Maximization: Balancing Spread, Budget, Fairness, and Time [3.2] インフルエンス・最大化(IM)問題は、情報伝達を最大限に広めることのできるグラフ内のノードの集合を見つけ出そうとする。
この問題はNPハードであることが知られており、通常は第2の目的を最適化する影響(スプレッド)を最大化して研究される。
本研究では,シードセットサイズの影響と最小化に基づいて,予算の公平性,コミュニティ,時間といったIM固有の目的関数を最適化した最初のケーススタディを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:54:45 GMT)
Leveraging Large Language Models for Fuzzy String Matching in Political Science [3.2] 政治学者が異なる情報源のデータを組み合わせている場合、ファジィ文字列マッチングは依然として重要な問題だ。
既存のマッチング方法は、レヴェンシュテイン距離やコサイン類似性のような文字列距離に依存する。
我々は、この問題を簡単かつ直感的にサイドステップするために、大きな言語モデルを使うことを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:04:21 GMT)
LLMs in Political Science: Heralding a New Era of Visual Analysis [3.2] 画像分析は、政治科学界の比較的小さなグループに限られている。
本稿では,画像コンテンツ分析におけるジェミニの利用可能性の意識を高めることを目的とする。
ジェミニは、政治的科学者にとって画像分析において最も一般的かつ基本的な課題である物体検出を行うのに非常に正確であることが判明した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:21:03 GMT)
Synthesizing EEG Signals from Event-Related Potential Paradigms with Conditional Diffusion Models [3.2] 本研究では,主観,セッション,クラス固有の脳波を直接生成する条件拡散モデルを提案する。
その結果,提案モデルでは被験者,セッション,クラスごとの実際のデータに類似した脳波データを生成することが可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:58:45 GMT)
Robustness and Visual Explanation for Black Box Image, Video, and ECG Signal Classification with Reinforcement Learning [3.1] 本稿では,異なるモデルタイプに対する敵対的攻撃を実現するために最適化された汎用強化学習フレームワークを提案する。
このフレームワークは、センシティブな領域を特定し、最小限の歪みで誤分類を誘発することに焦点を当てている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:07:39 GMT)
Integrating urban digital twins with cloud-based geospatial dashboards for coastal resilience planning: A case study in Florida [3.1] 本稿では,都市型デジタルツインと地理空間ダッシュボードを統合して,重要なインフラストラクチャ内の脆弱性を可視化するフレームワークを提案する。
また、アクセシビリティの確保、透明性とエクイティの促進、個人のプライバシーの保護など、プラットフォーム開発における倫理的配慮も明らかにした。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:44:39 GMT)
DeepMachining: Online Prediction of Machining Errors of Lathe Machines [3.1] 深層学習に基づくAIシステムDeepMachiningについて述べる。
我々の知る限りでは、この研究は、学習済みの深層学習モデルを用いて、機械の加工誤差を予測する最初の工場実験の1つである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:36:21 GMT)
Frequentist Guarantees of Distributed (Non)-Bayesian Inference [3.1] 本稿では,分散(非)ベイズ推論問題に対する後続一貫性,正規性,後続収縮率などの頻繁な特性について述べる。
この結果から,分散ベイズ推定はパラメトリックな効率を保っていることがわかった。
解析結果を時間変化グラフに拡張し,指数関数型ファミリーモデル,分散ロジスティック回帰モデル,分散検出モデルに適用する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:59:13 GMT)
Can AI Models Appreciate Document Aesthetics? An Exploration of Legibility and Layout Quality in Relation to Prediction Confidence [3.0] 十分に設計された文書は、その言葉だけでなく、その視覚的雄弁性を通してもコミュニケーションする。
著者は、色、フォント、グラフィック、レイアウトなどの美的要素を使って情報の知覚を形作る。
最先端のドキュメントAIモデルはレイアウトと画像データを組み込むことの利点を示しているが、文書美学のニュアンスを効果的に捉えているかどうかは不明だ。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:21:48 GMT)
Tangling schedules eases hardware connectivity requirements for quantum error correction [3.0] 本稿では,遠方量子ビット間の観測可能性の測定が可能なタングルドシンドローム抽出回路を提案する。
ハードウェア自体を物理的に変更することなく、前述の不規則な非局所安定化器を計測する方法を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:46:32 GMT)
RankMamba, Benchmarking Mamba's Document Ranking Performance in the Era of Transformers [2.9] トランスフォーマーアーキテクチャのコアメカニズム -- 注意には、トレーニングにおけるO(n2)$時間複雑さと推論におけるO(n)$時間複雑さが必要です。
状態空間モデルに基づく有名なモデル構造であるMambaは、シーケンスモデリングタスクにおいてトランスフォーマー等価のパフォーマンスを達成した。
同じトレーニングレシピを持つトランスフォーマーベースモデルと比較して,Mambaモデルは競争性能が向上することがわかった。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:07:05 GMT)
Fermihedral: On the Optimal Compilation for Fermion-to-Qubit Encoding [2.8] 本稿では、最適なFermion-to-qubitエンコーディングの発見に焦点を当てたコンパイラフレームワークであるFermihedralを紹介する。
Fermihedralは、Fermion-to-qubitエンコーディングの複雑な制約と目的をブール満足度問題に再定義する。
多様なフェルミオニオン系における評価はフェルミヘドラルの優越性を強調し、実装コスト、ゲート数、回路深さの大幅な削減を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:00:55 GMT)
PIPNet3D: Interpretable Detection of Alzheimer in MRI Scans [2.8] Part-Prototype Neural Network (PP-NN) は標準ブラックボックスモデルの代替品である。
ボリューム画像のためのPP-NNであるPIPNet3Dを提案する。
構造磁気共鳴画像(sMRI)を用いたアルツハイマー病診断におけるPIPNet3Dの有用性について検討した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:09:04 GMT)
Scaling Enhancement of Photon Blockade in Output Fields [2.8] 非線形共振器と補助共振器(線形共振器)の混合出力場において,光子遮断を大きく向上させることができることを示す。
出力場におけるこの光子遮断の増大は、2つの光子が2つの空洞を通過するときの2つの経路間の破壊的干渉によって引き起こされる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:54:53 GMT)
Deep Limit Order Book Forecasting [2.8] 我々は、最先端の深層学習手法を利用して、高頻度リミットオーダーブックの中間価格変化の予測可能性を探る。
大規模なリミットオーダーブックデータを効率的に処理するオープンソースコードベースであるLOBFrame'をリリースする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:11:02 GMT)
Manipulating Neural Path Planners via Slight Perturbations [2.8] データ駆動型ニューラルパスプランナーは、ロボティクスコミュニティへの関心が高まっている。
ニューラルネットワークコンポーネントは通常、ブラックボックスとして提供され、基盤となる意思決定プロセスが無視される。
本稿では,バックドアと呼ばれる,隠された悪意のある動作をニューラルパスプランナに特定・注入する手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:56:48 GMT)
An Exploratory Study on Upper-Level Computing Students' Use of Large Language Models as Tools in a Semester-Long Project [2.7] 本研究の目的は、学期間ソフトウェアエンジニアリングプロジェクトにおいて、計算学生のLSMの使用経験とアプローチを検討することである。
我々はPurdue大学の上級ソフトウェア工学コースからデータを収集した。
本研究では,学生の利用パターンや学習成果に関連するテーマを特定するために,データを分析した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:21:58 GMT)
Online Embedding Multi-Scale CLIP Features into 3D Maps [2.6] 本研究では,マルチスケールCLIP機能を3次元地図にオンライン埋め込みする手法を提案する。
CLIPを活用することで、この手法は従来の語彙制限手法の制約を超越する。
基本的に,本手法は,不慣れな環境のリアルタイムなオブジェクト探索とマッピングを同時に実現している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:12:31 GMT)
IIP-Mixer:Intra-Inter Patch Mixing Architecture for Battery Remaining Useful Life Prediction [2.6] Intra-Inter Patch Mixer (IIP-Mixer) と呼ばれる単純なミクサーベースアーキテクチャを提案する。
IIP-Mixerは、他の一般的な時系列フレームワークよりも優れたバッテリRUL予測において、競合的なパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:17:50 GMT)
Semi-Supervised Learning for Deep Causal Generative Models [2.6] 我々は、変数間の因果関係を利用して、利用可能なすべてのデータの使用を最大化する半教師付き深い因果生成モデルを開発する。
因果推論の手法を利用して、欠落した値を推測し、現実的な反事実を生成する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:06:37 GMT)
On the Communication Complexity of Approximate Pattern Matching [2.4] 上界が$O(n/m cdot k log2 m)$ bitsであることを証明する。
また、$O(n/m cdot k log2 m)$ bits は、$k$-error 発生毎に$P$ in $T$ のエンコードを可能にする。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:57:16 GMT)
An Image Grid Can Be Worth a Video: Zero-shot Video Question Answering Using a VLM [2.4] 本稿では,単一の視覚言語モデル(VLM)のみを利用する,シンプルで斬新な戦略を提案する。
ビデオ理解の本質は、時間的側面と各フレームの空間的詳細を包括的に管理することにある。
提案した画像グリッドビジョン言語モデル (IG-VLM) が既存の10のベンチマークのうち9つの手法を上回り, 提案手法を網羅した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:48:23 GMT)
Equity in Healthcare: Analyzing Disparities in Machine Learning Predictions of Diabetic Patient Readmissions [2.3] 本研究では,糖尿病患者に対して,機械学習(ML)モデルを用いて患者の入院容積を正確に予測する方法について検討した。
私たちはDeep Learning、Generalized Linear Models、Gradient Boosting Machines (GBM)、Naive Bayesといったモデルを比較しました。
GBMは84.3%のF1スコアと82.2%の精度で、人口統計学的に読み書きを正確に予測した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 23:49:22 GMT)
Users prefer Jpegli over same-sized libjpeg-turbo or MozJPEG [2.3] lib-turboの品質95のJpegli画像に類似した画質の画像を圧縮する場合は、lib-turbo画像とMoz-turbo画像の両方よりも好まれる。
生のレーティングとソースイメージは、さらなる分析と研究のために公開されています。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:12:56 GMT)
Global Vegetation Modeling with Pre-Trained Weather Transformers [2.2] 我々は、植物活動のモデル化のために、利用可能なFourCastNetを適応させる。
我々は、大気の状態の学習されたグローバルな表現が、正規化差分植生指標(NDVI)をモデル化するためにどのように転送できるかを検討する。
我々は,事前学習した気象モデルを利用することで,NDVIモデルをスクラッチから学習するよりもNDVI推定を改善することを示した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:45:16 GMT)
A Path Towards Legal Autonomy: An interoperable and explainable approach to extracting, transforming, loading and computing legal information using large language models, expert systems and Bayesian networks [2.2] 法的な自律性は、開発者やデプロイ者、ユーザといったAIアクターに制約を課すこと、あるいはAIエージェントが環境に与える影響の範囲と範囲に制約を課すことによって達成できる。
後者のアプローチでは、AI駆動デバイスに関する既存のルールを、それらのデバイスを制御するAIエージェントのソフトウェアにエンコードする。
このようなアプローチの有効性は、説明可能かつ法的に相互運用可能な法的情報を抽出、ロード、変換、計算する手法を必要とするため、これは課題である。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:12:57 GMT)
NLPre: a revised approach towards language-centric benchmarking of Natural Language Preprocessing systems [2.1] 規則に基づく形態解析や辞書を頼りに、新しい解を十分に整合した前処理ツールキットと比較することは困難である。
GLUEベンチマークにインスパイアされたこの言語中心ベンチマークシステムは、複数のNLPreツールの包括的な評価を可能にする。
プロトタイプアプリケーションはポーランド語用に設定されており、完全に組み立てられたNLPre-PLベンチマークと統合されている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:50:56 GMT)
Chinese Offensive Language Detection:Current Status and Future Directions [2.1] 本稿では,中国語における攻撃的言語検出について概観し,現在のベンチマークとアプローチについて検討する。
本調査の主な目的は,既存の技術を探究し,今後の研究の道筋を明らかにすることである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:34:44 GMT)
The Innovation Paradox: Concept Space Expansion with Diminishing Originality and the Promise of Creative AI [2.1] TechNetの統計的分析は、全体的な技術概念空間の指数関数的拡大ではなく、線形的な拡張を明らかにしている。
これらの傾向は、人間の認知能力の制約が、成長を続ける先行技術の領域を超えて革新することに起因する可能性がある。
創造的な人工知能をイノベーションプロセスに統合することは、これらの制限を克服し、将来観察されるトレンドを変える可能性を秘めている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:23:29 GMT)
Annolid: Annotate, Segment, and Track Anything You Need [2.1] Annolidは、ビデオファイル内の研究対象のセグメンテーション、ラベル付け、追跡のために設計されたソフトウェアパッケージである。
最先端のインスタンスセグメンテーションメソッドに基づいて、AnnolidはCutieビデオオブジェクトセグメンテーションモデルを利用している。
Segment Anything と Grounding-DINO の戦略を統合することで、認識可能な動物や物体の自動マスキングとセグメンテーションをテキストコマンドで実現する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:41:23 GMT)
Phase Crossover induced by Dynamical Many Body Localization in Periodically Driven Long-Range Spin Systems [2.0] 動的多体凍結は周期的横磁場駆動型可積分量子スピン系において起こる。
また,Lipkin-Meshkov-Glick(LMG)モデルでも同様の凍結が認められる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:00:46 GMT)
A Systematic Evaluation of Euclidean Alignment with Deep Learning for EEG Decoding [1.9] ユークリッドアライメント(EA)は、使いやすさ、計算の複雑さの低さ、ディープラーニングモデルとの互換性のために人気を集めている。
EAは対象物のデコーディングを4.33%改善し、収束時間を70%以上短縮する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:47:06 GMT)
Multi-camera calibration with pattern rigs, including for non-overlapping cameras: CALICO [1.9] 本稿では,挑戦的コンテキストに適したマルチカメラキャリブレーション手法であるCALICOについて述べる。
CalICOはパターンに基づくアプローチであり、パターンとカメラ間の剛性制約を用いて多重校正問題を定式化する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:03:41 GMT)
Middle Fusion and Multi-Stage, Multi-Form Prompts for Robust RGB-T Tracking [1.9] M3PTは、ミドルフュージョンとマルチモーダル、マルチステージの視覚的プロンプトを活用する新しいRGB-Tプロンプトトラッキング手法である。
我々は,RGB-Tトラッキングにおける中間融合フレームワークの利用の先駆者であり,性能と効率のバランスを実現する。
提案手法は,46.1fpsの推論速度を達成しつつ,4つの挑戦的ベンチマークにおいて最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:06:25 GMT)
Learning in PINNs: Phase transition, total diffusion, and generalization [1.9] 勾配信号-雑音比(SNR)のレンズを用いた完全連結ニューラルネットワークの学習力学について検討する。
全拡散と呼ばれる第3相を同定する」。
本稿では,情報誘起圧縮現象を考察し,全拡散相におけるアクティベーションの顕著な圧縮を示唆する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:10:30 GMT)
Differentiable Turbulence: Closure as a partial differential equation constrained optimization [1.9] 我々は、ディープラーニングアーキテクチャの物理に着想を得た選択と組み合わせて、エンドツーエンドの微分可能解法を使用する、微分可能な乱流の概念を活用する。
微分可能な物理パラダイムは、オフラインのテキストタプリオリ学習よりも成功しており、深層学習へのハイブリッド・ソルバ・イン・ザ・ループアプローチは、計算効率、精度、一般化の理想的なバランスを提供することを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 23:15:33 GMT)
A 4D Hybrid Algorithm to Scale Parallel Training to Thousands of GPUs [1.7] 大規模通信コストは、分散システム上で最先端のニューラルネットワークをトレーニングする上で、重要なボトルネックとなる。
本稿では,新しい4次元並列化手法であるAxoNNを紹介する。
AxoNNは通信オーバーヘッドを最小限にするために2つの重要な戦略を採用している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:47:56 GMT)
Coarse-Tuning for Ad-hoc Document Retrieval Using Pre-trained Language Models [1.7] 情報検索システムの微調整には、クエリ表現とクエリドキュメントの関係の学習が必要である。
本研究では,事前学習と微調整を橋渡しする中間学習段階として粗調整を導入する。
粗いチューニングのためのクエリ文書ペア予測(QDPP)を提案し,クエリ文書ペアの適切性を予測する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:53:36 GMT)
On Spectrogram Analysis in a Multiple Classifier Fusion Framework for Power Grid Classification Using Electric Network Frequency [1.6] ENF(Electric Network Frequency)は、電力流通システム固有の信号である。
ここでは、ENFを利用した電力グリッド分類の新しい手法を開発した。
スペクトログラムは異なるグリッドにまたがるオーディオと電力の記録から生成され、固有のENFパターンが明らかになる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:44:50 GMT)
Conditional Wasserstein Distances with Applications in Bayesian OT Flow Matching [1.6] 逆問題において、多くの条件生成モデルは、合同測度と学習近似との距離を最小化することにより、後続測度を近似する。
条件付きワッサーシュタイン距離は、後部の期待するワッサーシュタイン距離と等しいような制限された結合の集合を通じて導入する。
我々は条件付きワッサーシュタイン距離の理論的性質を導出し、対応する測地線と速度場と流れのODEを特徴づける。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:54:55 GMT)
Signatures of Parafermion Zero Modes in Fractional Quantum Hall-Superconductor Heterostructures [1.5] パラフェミオンゼロモードは、s波超伝導体で放射された$nu=1/m$分数量子ホールエッジからなるハイブリッド構造で生じる。
このようなハイブリッド構造に形成される接合部におけるパラフェミオンとクーパー対トンネルと後方散乱を考察する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:07:17 GMT)
I2CKD : Intra- and Inter-Class Knowledge Distillation for Semantic Segmentation [1.4] 本稿では,イメージセマンティックセグメンテーションに適した新しい知識蒸留法を提案する。
本手法の焦点は,教師(面倒なモデル)と生徒(コンパクトモデル)の中間層間の知識の獲得と伝達である。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:05:22 GMT)
Incorporating simulated spatial context information improves the effectiveness of contrastive learning models [1.4] 本稿では,既存のコントラスト学習手法を補完する,環境空間類似性(ESS)というユニークなアプローチを提案する。
ESSは部屋の分類や空間予測タスク、特に馴染みの無い環境での卓越した熟練を可能にします。
潜在的に変革的な応用は、ロボット工学から宇宙探査まで多岐にわたる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:49:52 GMT)
Collaborative Active Learning in Conditional Trust Environment [1.4] 複数の協力者が既存のデータやモデルを開示することなく、組み合わせた機械学習機能を活用して新しいドメインを探索するパラダイムである、協調型アクティブラーニングについて検討する。
このコラボレーションは、(a)直接モデルとデータ開示の必要性を排除し、プライバシとセキュリティの懸念に対処する、(b)直接データ交換なしで異なるデータソースとインサイトの使用を可能にする、(c)共有ラベリングコストを通じてコスト効率とリソース効率を促進する、といういくつかの利点を提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:40:27 GMT)
Macroscale fracture surface segmentation via semi-supervised learning considering the structural similarity [1.4] セグメンテーション能力に対する構造的類似性の影響を分析するために、3つのデータセットが作成された。
半教師あり学習のための弱強整合正則化を実装した。
提案手法はトレーニングに必要なラベル付き画像の数を6。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:21:41 GMT)
LTL learning on GPUs [1.3] 線形時間論理(LTL)は工業的検証公式で広く使われている。
列挙型プログラムの新たな形式を用いて,GPUを用いた最初の学習者を実装した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:00:00 GMT)
Supervised Multiple Kernel Learning approaches for multi-omics data integration [1.3] マルチカーネル学習(MKL)は、マルチオミクス入力の多様な性質を考える上で、柔軟で有効なアプローチであることが示されている。
我々は、異なるカーネル融合戦略に基づく新しいMKLアプローチを提供する。
その結果、MKLベースのモデルは、より複雑で最先端の教師付きマルチオミクス積分アプローチと競合することを示した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:48:16 GMT)
Conformal Intent Classification and Clarification for Fast and Accurate Intent Recognition [1.2] Conformal Intent Classification and Clarification (CICC) はタスク指向対話システムのための高速かつ正確な意図分類のためのフレームワークである。
このフレームワークは、意図の不確実性スコアを、真の意図を含むことが保証される明確化問題に変換する。
CICCは、専門家や研究者が、特定の明確化質問を伴う対話エージェントのユーザエクスペリエンスを大幅に改善するのに役立つ。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:42:01 GMT)
UVL Sentinel: a tool for parsing and syntactic correction of UVL datasets [1.2] 機能モデルは、ソフトウェア製品ラインの多様性を表すデファクトスタンダードになっています。
UVL(Universal Variability Language)は、それらの機能、依存関係、制約を表現する言語である。
UVL SentinelはUVLフォーマットで機能モデルのデータセットを分析し、エラー解析レポートを生成し、それらのエラーを記述し、最終的には最も一般的なソリューションを適用する構文処理を行う。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:56:08 GMT)
An Experimentally Validated Feasible Quantum Protocol for Identity-Based Signature with Application to Secure Email Communication [1.2] 1984年、シャミールは公開鍵インフラを簡素化する最初のIDベースの署名(IBS)を開発した。
IBSプロトコルはいくつかの理論的な仮定に基づく難しい問題に依存している。
量子暗号(QC)はそのようなアプローチである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 04:32:41 GMT)
Universality conditions of unified classical and quantum reservoir computing [1.2] 貯留層コンピューティング(Reservoir computing)は、計算神経科学と機械学習における多用途パラダイムである。
統一理論フレームワークを提案し、普遍性を確保するための準備の整った設定を提案する。
量子レジスタを扱う際に空間多重化が計算資源として機能する理由を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:20:35 GMT)
SIGNeRF: Scene Integrated Generation for Neural Radiance Fields [1.1] 高速かつ制御可能なNeRFシーン編集とシーン統合オブジェクト生成のための新しいアプローチを提案する。
新しい生成的更新戦略により、反復的な最適化を必要とせずに、編集された画像全体の3D一貫性が保証される。
画像拡散モデルの奥行き条件付け機構を利用して,編集の空間的位置を細かく制御する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:39:41 GMT)
Nonlinear model reduction for operator learning [1.0] 本稿では,ニューラルネットワークとカーネル主成分分析(KPCA)を組み合わせた演算子学習のための効率的なフレームワークを提案する。
本結果は,POD-DeepONetよりもKPCA-DeepONetの方が優れていることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:24:26 GMT)
FRESCO: Federated Reinforcement Energy System for Cooperative Optimization [0.9] 再生可能エネルギーの上昇は、よりクリーンでより参加的なエネルギーグリッドを生み出すことを約束するエネルギーグリッドの新しいダイナミクスを生み出している。
本研究は,連合学習を用いた強化学習エージェントの階層的制御アーキテクチャを用いて,エネルギー市場の実装を容易にすることを目的としたフレームワークであるFRESCOを紹介する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:00:53 GMT)
A vascular synthetic model for improved aneurysm segmentation and detection via Deep Neural Networks [0.9] 私たちの目標は、3D畳み込みニューラルネットワーク(CNN)で使用できる脳動脈のデータセットを提供することでした。
本モデルは,動脈形状,ICA形状,背景雑音を同時に再現するように設計されている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:22:45 GMT)
MisGUIDE : Defense Against Data-Free Deep Learning Model Extraction [0.8] MisGUIDE(ミスGUIDE)は、ディープラーニングモデルのための2段階の防御フレームワークである。
提案手法の目的は,真正クエリの精度を維持しつつ,クローンモデルの精度を下げることである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:59:21 GMT)
HEMIT: H&E to Multiplex-immunohistochemistry Image Translation with Dual-Branch Pix2pix Generator [0.8] HEMITはヘマトキシリンとエオシンのセクションを多重イムノ(mIHC)画像に変換するために設計されたデータセットである。
HEMITのmIHC画像は、多成分および細胞レベルでH&Eと整合し、教師付き染色翻訳タスクを充実させる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:24:20 GMT)
Trustworthy Self-Attention: Enabling the Network to Focus Only on the Most Relevant References [0.8] 近年の手法では、自己相似性の仮定に基づいて、隠蔽点の光学的流れを推定するための基準として、関連する非閉塞点を見つけるために自己注意を用いる。
我々は, 閉塞性拡張視覚特徴と2つの強い制約を構築するために, オンライン閉塞性認識情報をフル活用する。
Sintel Albedo パス上の最新 GMA-base 法である MATCHFlow(GMA) を用いて,全点,非包含点,非包含点,非包含点に対して 18.6%,16.2%,20.1% の誤差低減を実現した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:50:06 GMT)
Chemically Motivated Simulation Problems are Efficiently Solvable by a Quantum Computer [0.8] 本稿では, 化学シミュレーション問題の解法として, 本質的に効率的な手法を提案する。
提案手法は, 散乱木における動的シミュレーションのための初期状態の組立てにより, 良好な初期状態を求める。
我々は、量子シミュレーションに基づいて測定できる化学的な興味の量について論じる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:15:31 GMT)
Women are less comfortable expressing opinions online than men and report heightened fears for safety: Surveying gender differences in experiences of online harms [0.8] 女性は全体的に被害に遭うことを非常に恐れています。
彼らは特定の経験の結果、より否定的な心理的影響を報告した。
女性は、さまざまな安全ツールの使用を高く報告し、いくつかの形態のオンライン参加で快適さを減らします。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 22:16:03 GMT)
Vision Transformer-Based Deep Learning for Histologic Classification of Endometrial Cancer [0.7] 子宮内膜癌(英: Endometrial cancer)は、アメリカ合衆国の女性で4番目に多いがんであり、この疾患を発症するリスクは約2.8%である。
本研究では,畳み込みニューラルネットワークを用いて組織学的特徴を抽出し,その視覚的特徴に基づいてスライドを高次・低次に分類するEndoNetを紹介する。
このモデルは、ダートマス・ヘルスにおける子宮内膜癌に対する929のデジタル化ヘマトキシリンとエオシン染色による全スライディング画像に基づいて訓練された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:38:27 GMT)
Sample Efficient Reinforcement Learning with Partial Dynamics Knowledge [0.7] オンラインQ-ラーニング手法のサンプル複雑性について,動的知識が利用可能であったり,効率的に学習できたりした場合に検討する。
我々は,$f$の完全知識の下で,$tildemathcalO(textPoly(H)sqrtSAT)$ regretを達成する楽観的なQ-ラーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:48:21 GMT)
All incompatible measurements on qubits lead to multiparticle Bell nonlocality [0.7] 量子ビット上の任意の不整合の測定が、多粒子シナリオにおいて適切なベルの不等式を破ることにつながることを証明している。
この結果から,量子ビットの計測不整合性は常にデバイスに依存しない方法で証明できることが示唆された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:12:15 GMT)
The Topos of Transformer Networks [0.7] 本稿では, トポス理論のレンズを用いて, トランスフォーマーアーキテクチャの表現性に関する理論的解析を行う。
我々は、多くの一般的なニューラルネットワークアーキテクチャが、一括線形関数のプリトポに組み込むことができるが、トランスフォーマーはそのトポス完了に必然的に存在することを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:06:33 GMT)
Exploiting Symmetry in Dynamics for Model-Based Reinforcement Learning with Asymmetric Rewards [0.7] 本稿では,特定の対称性を示すダイナミックスを学習する手法を提案する。
数値実験により,提案手法がより正確な力学モデルを学習できることを実証する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:31:46 GMT)
TopoNav: Topological Navigation for Efficient Exploration in Sparse Reward Environments [0.7] TopoNavは、スパース・リワード設定における効率的な目標指向の探索とナビゲーションのための新しいフレームワークである。
TopoNavは環境のトポロジカルマップを動的に構築し、主要な場所と経路をキャプチャする。
本研究では,Clearpath Jackalロボットを用いて,シミュレーションと実世界のオフロード環境におけるTopoNavの評価を行った。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:01:24 GMT)
Transformers-based architectures for stroke segmentation: A review [0.7] ストロークは依然として重要な世界的な健康上の問題であり、タイムリーな介入と患者の成果を改善するために正確かつ効率的な診断ツールを必要とする。
当初自然言語処理用に設計されたトランスフォーマーは、医療画像解析を含む様々なコンピュータビジョンアプリケーションで顕著な能力を発揮している。
このレビューは,脳卒中セグメンテーションの文脈で適用された最先端のTransformerベースのアーキテクチャを詳細に調査することを目的としている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:42:08 GMT)
On Optimizing Hyperparameters for Quantum Neural Networks [0.6] 現在の最先端の機械学習モデルは、トレーニングに数週間を要する。
量子コンピューティング、特に量子機械学習(QML)は、理論的なスピードアップと強化されたパワーを提供する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:59:09 GMT)
Exploring the Berezinskii-Kosterlitz-Thouless Transition in a Two-dimensional Dipolar Bose Gas [0.6] 長距離および異方性双極子相互作用は量子系において複素位を誘導する。
準長距離秩序を持つ超流動性は、ベレジンスキー-コステリッツ-Thouless (BKT) 機構を介して現れる。
我々は、エルビウム原子の準2次元双極性ボースガスにおいて、通常の気体から超流動相へのBKT遷移を観察した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:27:04 GMT)
Classical simulation of non-Gaussian bosonic circuits [0.5] ガウス状態の重ね合わせに適用したボソニックリニア光回路をシミュレートするための高速な古典的アルゴリズムを提案する。
本稿では,回路のモード数とサイズを正確にシミュレーションするアルゴリズムを提案する。
また、この数で実行が2次となる高速な近似ランダム化アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 23:52:35 GMT)
GeNet: A Graph Neural Network-based Anti-noise Task-Oriented Semantic Communication Paradigm [0.5] 従来の意味コミュニケーションのアプローチは、チャネルノイズを軽減するためにSNR(Signal-to-Noise ratio)の知識に依存していた。
ノイズ対策を目的とした意味コミュニケーションのためのグラフニューラルネットワーク(GNN)に基づくパラダイムであるGeNetを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:46:59 GMT)
Solving a Real-World Package Delivery Routing Problem Using Quantum Annealers [0.4] 本研究の目的は,問題緩和や技術的ショートカットを回避し,現実的な事例の解決方法を提案することである。
量子古典的ハイブリッド解法 Q4RPD を開発した。
Q4RPDの適用を実証するために、6つの異なるインスタンスからなる実験が実施されている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:13:42 GMT)
Exploring language relations through syntactic distances and geographic proximity [0.4] ユニバーサル依存データセットから抽出した音声の一連の部分(POS)を用いて言語間距離を探索する。
特定の形態的類型によって説明される例外を除いて、よく知られた言語族やグループに対応する定型クラスタが見つかる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:36:17 GMT)
Visual Acuity Prediction on Real-Life Patient Data Using a Machine Learning Based Multistage System [0.4] 視力(VA)の予測と実生活環境下での劣化の早期検出は、不均一データや不完全データにより困難である。
本稿では,ドイツの最大医療病院の眼科領域の異なるITシステムを融合した研究対応型データコーパスを開発するためのワークフローを提案する。
マクロ平均F1スコアの最終的な予測精度は、57.8と50 +-10.7%の眼科医と同じ範囲でありながら、69 %のマクロ平均F1スコアが得られる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 22:02:30 GMT)
Usage-Specific Survival Modeling Based on Operational Data and Neural Networks [0.4] 提案した手法は、スナップショットと呼ばれる特定のタイミングで継続的に収集され、保存されるデータを使用してトレーニングされたニューラルネットワークベースの生存モデルに基づいている。
論文は、データがすべてのスナップショット時間が同じ特定のフォーマットにある場合、最大限のトレーニングを適用でき、望ましい結果が得られることを示した。
トレーニング中に必要となるサンプルの数を減らすため,トレーニング開始前にデータセットを再サンプリングする代わりに,トレーニング開始時にデータセットをランダムに再サンプリングする手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:32:32 GMT)
Optimization tools for distance-preserving flag fault-tolerant error correction [0.4] 我々は、フラグフォールトトレラント量子誤り訂正(FTQEC)に必要な空間と時間オーバーヘッドを潜在的に低減できるツールを開発する。
我々の技術には、コンパクトなルックアップテーブルの構築、Meet-in-the-Middle技術、フラグFTQECの適応時間デコード、分離された$X$と$Z$カウント技術が含まれる。
我々は,回路レベルの雑音下での六角形3,5,7,9のカラーコードの数値シミュレーションを用いて,ツールの性能評価を行った。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:07:15 GMT)
Benchmarking Quantum Generative Learning: A Study on Scalability and Noise Resilience using QUARK [0.4] 本稿では,量子生成学習アプリケーションのスケーラビリティと耐雑音性について検討する。
厳密なベンチマーク手法を用いて、進捗を追跡し、QMLアルゴリズムのスケーリングにおける課題を特定する。
その結果,QGANはQCBMほど次元の呪いの影響を受けず,QCBMはノイズに耐性があることがわかった。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:05:55 GMT)
Modelling the Impact of Quantum Circuit Imperfections on Networks and Computer Applications [0.3] ポスト量子および量子暗号スキームは、7Gネットワークのための実現可能な量子コンピュータアプリケーションである。
これらのアルゴリズムは、Shorアルゴリズムのような量子コンピュータ上で動作する量子検索アルゴリズムの進歩によって妥協された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:00:35 GMT)
Superior Parallel Big Data Clustering through Competitive Stochastic Sample Size Optimization in Big-means [0.3] 本稿では,従来のBig-means手法の進歩である,新しいK-meansクラスタリングアルゴリズムを提案する。
提案手法は並列処理,サンプリング,競合最適化を効率よく統合し,ビッグデータアプリケーション用に設計されたスケーラブルな変種を作成する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:05:03 GMT)
Reshaping Free-Text Radiology Notes Into Structured Reports With Generative Transformers [0.3] 構造化報告(SR)は様々な医療社会で推奨されている。
自由テキストレポートから情報を抽出するパイプラインを提案する。
我々の研究は自然言語処理(NLP)とトランスフォーマーベースのモデルを活用することを目的としている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:38:39 GMT)
EndToEndML: An Open-Source End-to-End Pipeline for Machine Learning Applications [0.3] 機械学習モデルの事前処理、トレーニング、評価、可視化が可能なWebベースのエンドツーエンドパイプラインを提案する。
本ライブラリは,マルチモーダル・マルチセンサ・データセットの認識,分類,クラスタリング,および予測を支援する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:24:38 GMT)
First Experiences with the Identification of People at Risk for Diabetes in Argentina using Machine Learning Techniques [0.3] 本稿では,アルゼンチンにおけるT2DとPDのリスクのある人を特定するための予測モデルの開発と評価について述べる。
その結果,これらのモデルを用いた2つのデータセットに対して,非常に良好な性能が得られた。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:38:02 GMT)
How is Testing Related to Single Statement Bugs? [0.3] GitHubのトップ100のMavenベースのプロジェクトからのデータを分析しました。
以上の結果より, SSBの増加はSSBの発生をやや減少させる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:31:00 GMT)
A citizen science toolkit to collect human perceptions of urban environments using open street view images [0.2] ストリートビューレベルの画像(SVI)は、研究(環境アセスメント、緑地識別、土地被覆分類など)に有用なデータソースである。
オープンなSVIデータセットは、Mapillaryのような制限の少ないソースから容易に利用できる。
オープンなSVIを自動ダウンロード、処理、収穫、フィルタリングする効率的な方法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:13:19 GMT)
Deep Learning Segmentation and Classification of Red Blood Cells Using a Large Multi-Scanner Dataset [0.2] RBC画像分割と分類のための2段階のディープラーニングフレームワークを提案する。
データセットは8つの異なるクラスを含む100K以上のRBCの非常に多様なデータセットである。
98.03%のIoUと96.5%の平均分類精度がテストセットで達成された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:28:32 GMT)
Open system dynamics in interacting quantum field theories [0.2] 環境と相互作用する量子系は、非マルコフ的またはマルコフ的マスター方程式によって記述される非単体進化を行う。
マルコフ極限を含む様々な近似の下で方程式がどのように単純化されるかを示す。
レッドフィールド方程式に基づく解は、標準二階ダイソン級数に対する摂動的再帰を与えると主張する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:01:17 GMT)
Building defect conformal field theory from the Sachdev-Ye-Kitaev interactions [0.1] 欠陥点におけるSYK$_q$相互作用と$N$Majorana鎖を結合することにより、境界とインターフェースのCFTの新たなファミリーを導入する。
我々は、欠陥CFTの$g$-functionと有効中心電荷を含むユニークな絡み合い特性を計算した。
驚いたことに、送信係数は欠陥全体にわたる有効中心電荷との普遍的関係から大きなN$制限で逸脱し、我々の欠陥 CFT がガウス欠陥 CFT の既知のすべての例を超えていることを示唆している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:41:29 GMT)
Probing the quantum nature of gravity using a Bose-Einstein condensate; "Erste Abhandlung" [0.1] ボース・アインシュタイン凝縮体を用いてグラビトンによる騒音の影響について検討した。
ボース=アインシュタインが1つのモードで凝縮すると、振幅測定における不確実性の平方の期待値の低い境界は無限にはならない。
重力波によって誘導されるノイズのため、ボース・アインシュタイン凝縮体を用いて重力波を検出できない測定時間の最小値が存在する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:18:44 GMT)
Impact of Employing Weather Forecast Data as Input to the Estimation of Evapotranspiration by Deep Neural Network Models [0.1] Evapotranspiration (ET0) は、作物の水需要に係数が関係しているため、スマート灌水スケジューリングを設計するための重要なパラメータである。
FAO56-PM法を用いてET0を計算するには、気温、湿度、風、太陽放射の4つの主要な気象パラメータが必要である。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:01:51 GMT)
One flow to correct them all: improving simulations in high-energy physics with a single normalising flow and a switch [0.1] シミュレーションの不完全さは 観測されたデータと シミュレーションされた出来事の間に 大きな違いをもたらす
簡単なアーキテクチャを用いて,1つの多次元分布(シミュレーション)を1つのデータ(データ)に変換する補正手法を提案する。
本手法の有効性を,観測対象の非自明な誤モデリングを用いた物理刺激型玩具データセットに適用し,その相関性を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:03:41 GMT)
Left-handedness without absorption in the four-level Y-type atomic medium [0.1] 密度行列法による4レベルY型原子系と相互作用する外部磁場について検討した。
ゼロ吸収特性は、結合場の位相と強度を変化させた操作の可能性を示す。
ゼロ吸収特性は、従来のレンズによる撮像で失われたエバネッセント波を増幅するために用いられる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:39:32 GMT)
Bootstrapping Guarantees: Stability and Performance Analysis for Dynamic Encrypted Control [0.1] ブートストラップ(bootstrapping)は、完全に同型な暗号システムで一般的に使用されるテクニックで、コントローラ状態のオーバーフローを避けるために使用できる。
ブートストラップを考慮した動的暗号化制御の解析を行う。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:52:41 GMT)
Visualizing High-Dimensional Temporal Data Using Direction-Aware t-SNE [0.0] 実世界のデータセットは、一時的なコンポーネントを含むか、状態から状態への遷移を伴う。
探索的データ解析では、これらの高次元データセットを二次元マップで表現することができる。
t-SNE や UMAP のような既存の次元還元技術の多くは、データの時間的あるいは関係的な性質を考慮していない。
データの時間的側面を強調したt-SNEの最適化関数における2つの相補的方向対応損失項を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 22:26:50 GMT)
Vertex corrections to conductivity in the Holstein model: A numerical-analytical study [0.0] 光伝導率プロファイルは、量子多体系における電子力学の情報を運ぶ。
解析的にも数値的にも、ゼロ電子-フォノン相互作用、ゼロ電子帯域幅、無限温度の限界における光伝導率に対する頂点補正は消滅する。
これらの変化は、弾道輸送と拡散輸送の間の中間時間スケールにおいて、時間制限された電子のスローダウンを完全に捉えないバブル近似に遡る。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:31:09 GMT)
Using Quantum Computing to Infer Dynamic Behaviors of Biological and Artificial Neural Networks [0.0] 本質的に完全に探索されていないトピックは、量子アルゴリズムとコンピューティングを使用して、ニューラルネットワークの機能的ダイナミクスに関する質問をテキスト化し、問うことである。
これは、生体および人工ニューラルネットワークのモデリングとシミュレーションに量子コンピューティングを適用するという、まだ初期段階のトピックのコンポーネントである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:16:56 GMT)
Unraveling a cavity induced molecular polarization mechanism from collective vibrational strong coupling [0.0] 熱平衡における分子の集合振動強い結合は、熱力学の限界において大きな局所的な電子分極を引き起こす可能性があることを示す。
本研究は, 偏光化学の徹底的な理解には, 着衣電子構造の自己持続的処理が必要であることを示唆する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:32:51 GMT)
Universal stability of coherently diffusive 1D systems with respect to decoherence [0.0] 我々は,コヒーレント拡散が存在する場合,輸送は非コヒーレントノイズに対して極めて安定であることを示す。
我々の結果は、多くの生物学的システムの機能に新たな光を当てるかもしれない。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:42:11 GMT)
TransFusion: Contrastive Learning with Transformers [0.0] TransFusionは、コントラスト学習のプロセスをより分析的で説明しやすいものにするために設計されている。
結果は、TransFusionが複雑な実世界のデータからクラスタを分離する機能をうまく抽出していることを示している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:24:54 GMT)
Towards Sustainable SecureML: Quantifying Carbon Footprint of Adversarial Machine Learning [0.0] 敵MLの炭素フットプリントに関する最初の研究を開拓した。
ロバストネス炭素トレードオフ指数(RCTI)について紹介する。
この新しい計量は、経済の弾力性原理にインスパイアされ、反対の強靭性の変化に対する二酸化炭素の感度を捉えている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:02:15 GMT)
Topological phases of unitary dynamics: Classification in Clifford category [0.0] 量子セルオートマトン (QCA) あるいは因果ユニタリ (Cousal Unitary) は、定義によって局所作用素代数の自己同型である。
クリフォード QCA は、任意のパウリ作用素をパウリ作用素の有限テンソル積に写像するものである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 22:22:44 GMT)
Thermalization condition for non-Hermitian quantum systems [0.0] 固有状態熱化仮説の非エルミート量子系への応用は、散逸的量子カオスにおいて最も重要なトピックの1つとなっている。
我々は、非エルミート系を記述するゴリーニ-コサコフスキー-スダルシャン-リンドブラッドマスター方程式の2つのバージョンを導出した。
この発見は、最近提案された直交確率行列理論が適切な修正を必要とすることを示唆している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:48:45 GMT)
Theory of quantum error mitigation for non-Clifford gates [0.0] 量子誤差緩和技術は、複数の関連する雑音回路を実行することで、ノイズのない量子回路を模倣する。
そのような技法がいかにうまく機能するかは、根底にある門がいかにうるさいかに強く依存していると考えられている。
本稿では,これらの手法を非クリフォードゲートに一般化する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:36:35 GMT)
Thelxinoë: Recognizing Human Emotions Using Pupillometry and Machine Learning [0.0] 本研究は,現実的かつ感情的に共鳴するタッチインタラクションのための複数のセンサデータを統合することで,VR体験の向上を目的とした,Thelxino"eフレームワークに大きく貢献する。
我々の発見は、没入的でインタラクティブなVR環境を開発するための新しい道を開き、バーチャルタッチ技術の将来の進歩への道を開いた。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:14:17 GMT)
The current state of security -- Insights from the German software industry [0.0] 本稿では,本稿で論じられたセキュアなソフトウェア開発の主な考え方について概説する。
実施に関するデータセットは、20社による質的なインタビュー調査を通じて収集される。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 21:13:09 GMT)
Statistical testing of random number generators and their improvement using randomness extraction [0.0] 本稿では,既存の統計的テストスイートをベースとした総合統計テスト環境(STE)について紹介する。
STEは、認証機関が必要とするものを超えて、集中的なテストまで、軽量(即ち高速)で実行するようにパラメータ化することができる。
次に、RNGの出力品質を異なる仮定のセットで改善するランダム性抽出器の形で、さまざまな後処理手法を提示、実装する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:05:02 GMT)
Squeezing below the ground state of motion of a continuously monitored levitating nanoparticle [0.0] Squeezingは、量子情報処理と量子センシングにとって重要なリソースである。
トラップ電位の時間制御を慎重に組み込んだスキームの性能解析を行う。
我々の提案は、実験的な最先端に近いものであり、量子状態工学にとって貴重なツールである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:34:50 GMT)
Sister Celine's polynomials in the quantum theory of angular momentum [0.0] ヤコビとハーンズは運動量の量子論に特に興味がある。
ここでは、既約回転の文字と角の「d」行列が「d」として表現できることを示す。
このような接続は、量子力学や原子物理学において重要な量の新しいアイデンティティをもたらす可能性がある。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 22:38:38 GMT)
Shapley Values-Powered Framework for Fair Reward Split in Content Produced by GenAI [0.0] 本稿では,モデル開発者とデータ提供者間のコラボレーションを構築する手法を提案する。
安定拡散-v1.5モデルにより生成された画像におけるアーティストの寄与を定量化するために,Shapley Values を用いる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:42:25 GMT)
Shaping entangled photons through thick scattering media using an advanced wave beacon [0.0] 絡み合った光子は、生体組織や乱流雰囲気のような複雑な媒体を介して伝播する。
波面形状を用いて散乱を補正し、2光子相関を求めることは、信号対雑音比が低いために困難である。
我々は、Klyshkoの高度な波動図にインスパイアされた、新しいフィードバック機構を提案し、実証する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:56:13 GMT)
Scalable and Robust Transformer Decoders for Interpretable Image Classification with Foundation Models [0.0] 解釈可能なコンピュータビジョンモデルは、画像の特徴をトレーニングデータセットのプロトタイプと比較し、それら間の類似性が分類の基礎となる、透過的な予測を生成することができる。
本稿では,トランスデコーダヘッドと階層的混合モデルを用いた新しい画像分類手法であるComFeを紹介する。
グローバルなイメージラベルのみを使用し、セグメンテーションやアノテーションを含まないことで、ComFeは、鳥の頭、体、翼、尾などの一貫したイメージコンポーネントと画像背景を識別し、これらの特徴のうちどれが予測を行うに有益かを決定することができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:53:14 GMT)
Safety Verification of Wait-Only Non-Blocking Broadcast Protocols [0.0] 我々は、同じ有限プロトコルを実行し、2つの異なる方法で同期的に通信するプロセスのネットワークについて研究する。
パラメータ化されたプロセス数を持つ2つの被覆可能性問題に対して、精度の高い複雑性クラスを確立する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:17:33 GMT)
Safe and Robust Reinforcement-Learning: Principles and Practice [0.0] 強化学習は比較的複雑なタスクの解決に顕著な成功を収めた。
現実のシナリオにおけるRLシステムのデプロイは、安全性と堅牢性に関する重大な課題を生じさせる。
本稿では, アルゴリズム, 倫理的, 実践的考察を含む安全で堅牢なRL景観の主次元について考察する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:14:29 GMT)
Robustness of Quantum Chaos and Anomalous Relaxation in Open Quantum Circuits [0.0] 一般量子多体系における量子カオスと散逸の相互作用について検討する。
可解モデルの場合、大きな局所ヒルベルト空間次元の極限において、ランダムなユニタリゲート上での平均化されたDFFの正確な式を得る。
システムは常に、ギャップ閉鎖の存在や欠如を特徴とする2つの特徴的な体制でリラックスしている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:39:23 GMT)
Road Obstacle Detection based on Unknown Objectness Scores [0.0] 異常検出技術により、未知の物体の画素をオフ・オブ・ディストリビューション(OoD)サンプルとして識別することができる。
本研究の目的は,物体検出の手法を画素単位の異常検出手法に組み込むことで,未知物体を検出するための安定した性能を実現することである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:35:36 GMT)
Resonances crossing effect and quantum sensor of electric fields [0.0] 外部直流電場を受ける2レベル量子系において、共鳴の虚部が正確に交差する場合、減衰ビーティング現象が発生する。
この事実は、1次元の明示的なモデルで数値的に検証され、外部磁場強度が割り当てられた値を持つかどうかを非常に単純な方法で決定する量子センサーを設計する可能性を示している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:06:24 GMT)
Representatividad Muestral en la Incertidumbre Simétrica Multivariada para la Selección de Atributos [0.0] 統計的シミュレーション手法を用いて,多変量対称不確かさ(MSU)測定の挙動を解析した。
実験では、属性の数、濃度、サンプルサイズがMSUにどのように影響するかが示されている。
これら3つの要因の異なる組み合わせで, MSUの良質な品質を維持する条件を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:29:08 GMT)
Relativistic exponential-type spinor orbitals and their use in many-electron Dirac equation solution [0.0] ディラック・クーロン型微分方程式とその解相対論的指数型スピノル軌道を導入する。
相対論的クーロンエネルギーはポアソン方程式のスペクトル解を用いて1$-$電子ポテンシャルを求めることで決定される。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:13:48 GMT)
Quantum-classical phase transition with spontaneous superposition breaking (basic characteristics) [0.0] 崩壊は効果的な(絶対ではない)現象であり、自発的対称性の破れの一般的な形式主義の特別な場合と見なすことができる。
量子力学は古典力学と量子場理論の間の自然な橋渡しを表す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:01:19 GMT)
Quantum to Classical Neural Network Transfer Learning Applied to Drug Toxicity Prediction [0.0] 毒性 (Toxicity) は、不規則な数の薬物が命を救うために使用されるのを防ぐブロックである。
本稿では、古典的ニューラルネットワークの動作を模倣した量子回路設計を用いて、薬物毒性を予測するためのハイブリッド量子古典ニューラルネットワークを提案する。
モデルの全古典的な$mathcalO(n3)$アナログに対して、コンメンシュレートな予測精度が得られることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:32:04 GMT)
Quantum backflow current in a ring: Optimal bounds and fractality [0.0] 我々は、環に閉じ込められた量子粒子を、非負の角運動量を持つ固定数の最低エネルギー固有状態からなる状態に準備する。
リングの周に沿った特定の点における確率電流の時間依存性挙動について検討する。
本稿では,過去最高のバックフロー確率伝達をもたらす量子状態の解析式を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:10:01 GMT)
Quantum Algorithms: A New Frontier in Financial Crime Prevention [0.0] この研究は量子機械学習(QML)や量子人工知能(QAI)といった先進的な方法論を紹介している。
これらの量子アプローチは、古典的手法が直面する制限を克服するために、量子コンピュータの本質的な計算能力を活用する。
金融機関はリスクを特定し緩和する能力を向上させることができ、より堅牢なリスク管理戦略につながる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:52:10 GMT)
Properties and Applications of the Kirkwood-Dirac Distribution [0.0] KD分布は量子力学を解析するための強力な準確率分布である。
任意の可観測性の観点から量子状態を表現することができる。
本稿はKD分布を3つにまとめる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:00:02 GMT)
Physicality of evolution and statistical contractivity are equivalent notions of maps [0.0] 可能なすべての線型写像の中で、フィッシャー情報と契約する唯一のものは、まさに物理的なものであることを証明している。
この結果は、一般的な意見に反して、物理写像と正準統計量化器の間には基本的な階層が存在しないことを示している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:25:21 GMT)
Phase-space representation of coherent states generated through SUSY QM for tilted anisotropic Dirac materials [0.0] 固有値問題に固有の微分方程式系の分離を可能にする。
超対称量子力学は、ハミルトニアン作用素に対応する固有状態と固有値の決定を促進する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 23:04:51 GMT)
Parallel refreshed cryogenic charge-locking array with low power dissipation [0.0] 低温量子ビットは 多数の古典的な制御信号を 供給する効率的な方法を必要とします
チャージロックアレイを実装するための電力効率のよい手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:24:18 GMT)
PT-symmetric dynamical confinement: Fermi acceleration, quantum force and Berry phase [0.0] 移動壁を有するPT対称ボックスによって引き起こされる動的閉じ込めの下での量子粒子について考察する。
後者は、時間依存の PT-対称境界条件に従う時間依存シュリンガー方程式の項で記述される。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:19:35 GMT)
Optimal Coherent Quantum Phase Estimation via Tapering [0.0] 位相推定問題のコヒーレントバージョンについて検討する。
目標は、重ね合わせで$U$の位相を見積もることである。
本稿では,よく知られた標準量子位相推定アルゴリズムの改良版を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:17:23 GMT)
Observation of vortices in a dipolar supersolid [0.0] 超固体は、2つの連続対称性を自発的に破る物質の状態である。
我々の研究は、非変調量子流体と変調量子流体の渦発芽ダイナミクスの根本的な違いを明らかにした。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:39:50 GMT)
Nonlinear Control Allocation: A Learning Based Approach [0.0] 現代の航空機は、耐故障性と操縦性要件を満たすために冗長な制御エフェクターで設計されている。
これにより航空機は過度に作動し、制御エフェクタ間で制御コマンドを分配するために制御割り当てスキームが必要となる。
伝統的に最適化に基づく制御割当スキームが用いられるが、非線型割当問題では、これらの手法は大きな計算資源を必要とする。
本研究では,ニューラルネットワーク(ANN)に基づく非線形制御割り当て方式を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:45:26 GMT)
Nested Dirichlet models for unsupervised attack pattern detection in honeypot data [0.0] 共通の意図を共有しているように見えるクラスタリング攻撃は、脅威追跡の専門家にとって非常に価値がある。
本稿では,ハニーポットから収集した端末セッションコマンドをクラスタリングするためのディリクレ分布トピックモデルについて検討する。
セッションをクラスタリングする主な実践的意味は2つある。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:30:59 GMT)
NL-ITI: Optimizing Probing and Intervention for Improvement of ITI Method [0.0] 大型言語モデル(LLM)は偽情報を返す傾向がある。
Inference-Time-Intervention (ITI)は、最も多く望まれる知識を含む注意ヘッドを識別する。
非線形な探索とマルチトークンの介入を導入することで、ITIフレームワークをさらに改善した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:22:16 GMT)
Multichannel quantum defect theory of strontium bound Rydberg states [0.0] 新規に算出されたマルチチャネル量子欠陥理論パラメータとチャネル分画を、ストロンチウムの1重項および3重項S,P,D系列および1重項F系列に対して提示する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:38:46 GMT)
Mollow-like triplets in ultra-fast resonant absorption [0.0] 滑らかなレーザー場の共振吸収により, モロー状三重項パターンが得られることを示す。
このような三重項の一般的な条件は、超ガウスパルスシーケンスによって導出され、図示される。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:20:38 GMT)
Modelling the Raft Distributed Consensus Protocol in mCRL2 [0.0] Raftアルゴリズムは、LamportのPaxosアルゴリズムの代替として容易に理解し実装できるものとして広く普及したコンセンサス問題の解決策である。
本稿では,mCRL2仕様言語におけるRaftアルゴリズムの形式化とその関連性について論じる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:08:31 GMT)
Mistake, Manipulation and Margin Guarantees in Online Strategic Classification [0.0] 到着した各エージェントが真の特徴ベクトルを操作して正の予測ラベルを得るという,オンライン戦略分類問題を考える。
我々は、様々なエージェントコスト構造に対する収束、有限の誤り、有限の操作保証を証明した。
実データおよび合成データに関する数値的な研究により、新しいアルゴリズムは、マージン、操作数、誤り数において、以前のアルゴリズムよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:05:45 GMT)
Minimal entanglement for injecting diagonal gates [0.0] 計算空間とマジックステートファクトリの接続性は,非クリフォード演算を実装可能な速度において,基本的なボトルネックとなることを示す。
計算空間に$D$を実装するために$nu(|Drangle)$ ebitsのみを使用する局所安定化回路を構築する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:00:03 GMT)
Markovian and non-Markovian master equations versus an exactly solvable model of a qubit in a cavity [0.0] 量子マスター方程式は一般に開量子系の力学をモデル化するために用いられるが、その精度は正確に解けるモデルの解析解と比較されることは稀である。
非マルコフ的時空マスター方程式を2階(レッドフィールド)と4階まで、および3種類のマルコフ的マスター方程式とみなす。
粗粒度マスター方程式は、弱い結合や高い量子ビット周波数に対して標準RWAベースのリンドブラッドマスター方程式よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 05:09:46 GMT)
Light-cone feature selection for quantum machine learning [0.0] 本稿では,量子機械学習に着目した特徴選択手法を提案する。
我々のスキームは、量子モデルの光錐(すなわち部分空間)を特徴として扱い、対応する局所量子カーネルのトレーニングを通じて関連するものを選択する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:22:35 GMT)
Interval Effect Algebras and Holevo Instruments [0.0] この記事は凸効果状態空間の研究から始まる。
そのような空間は順序線型空間を生成し、順序決定する状態の集合を持つ区間効果代数と等価である。
次に、非制限条件を仮定して区間効果代数の演算と楽器について議論する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:16:24 GMT)
InceptionTime vs. Wavelet -- A comparison for time series classification [0.0] 2つの異なるアプローチを比較して、インフラウンドデータを分類した。
ひとつは、InceptionTimeネットワークのカスタム実装を使用して、時系列データの直接的な分類に基づいている。
他の手法では、信号のウェーブレット変換の2次元画像を生成し、その後ResNetの実装を用いて分類した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:34:27 GMT)
Implementation of the Principal Component Analysis onto High-Performance Computer Facilities for Hyperspectral Dimensionality Reduction: Results and Comparisons [0.0] 本研究は,主成分分析(PCA)アルゴリズムを2種類の高性能デバイスに実装するものである。
得られた結果は,PCA アルゴリズムのフィールドプログラマブルゲートアレイ (FPGA) による実装と比較された。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:50:45 GMT)
INEXA: Interactive and Explainable Process Model Abstraction Through Object-Centric Process Mining [0.0] イベントログへのリンクを保持するインタラクティブで説明可能なプロセスモデル抽象化手法であるINEXAを提案する。
出発点として、INEXAは大規模なプロセスモデルを「表示可能な」サイズに集約する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:03:33 GMT)
Heat and Work in Quantum Thermodynamics: a Cybernetic Approach [0.0] 制御理論による可観測性分解に基づく仕事と熱を区別する新しい提案を提案する。
観測可能エネルギーの即時散逸を表すエルミート作用素を導出し、フォン・ノイマンエントロピーの一般化を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:57:11 GMT)
HU at SemEval-2024 Task 8A: Can Contrastive Learning Learn Embeddings to Detect Machine-Generated Text? [0.0] 本稿では,SemEval-2024 Task 8, Multigenerator, Multi Domain, and Multilingual Black-Box Machine-Generated Text Detection'のために開発したシステムについて述べる。
重要な発見は、複数のモデルのアンサンブルがなくても、単一のベースモデルは、データ拡張と対照的な学習の助けを借りて、同等のパフォーマンスを持つことができるということです。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:30:08 GMT)
General quantum resources provide advantages in work extraction tasks [0.0] 作業抽出によって状態とチャネルの両方の一般的な量子資源を認証するための熱力学的タスクを提供する。
本稿では,グローバルな分散絡み合いに起因する局所的に抽出可能なエネルギーの一種である,新しいタイプの異常なエネルギーフローについて報告する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:53:29 GMT)
From Two-Dimensional to Three-Dimensional Environment with Q-Learning: Modeling Autonomous Navigation with Reinforcement Learning and no Libraries [0.0] 本研究では,2次元(2次元)および3次元(3次元)環境における強化学習エージェントの性能について検討した。
この研究の重要な側面は、アルゴリズムが計算数学のみによって開発された、学習のための既製ライブラリが存在しないことである。
この研究は、強化学習エージェントが空間次元の異なる環境でどのように適応し、機能するかという問題に対処することを目的としている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:07:18 GMT)
Exact Solution of Bipartite Fluctuations in One-Dimensional Fermions [0.0] 量子多体系における流体力学の出現は、近年、関心が高まっている。
極低温原子(J. F. Wienand et al., arXiv:2306.11457)の最近の実験は、ハードコアボソンにおける創発的流体力学を研究した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:54:56 GMT)
Evaluation of Semantic Search and its Role in Retrieved-Augmented-Generation (RAG) for Arabic Language [0.0] 本稿では,アラビア語のセマンティックサーチにおいて,単純かつ強力なベンチマークの確立に尽力する。
これらの指標とデータセットの有効性を正確に評価するために、検索拡張生成(RAG)の枠組み内で意味探索の評価を行う。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:42:31 GMT)
Equivalence Checking of Quantum Circuits by Model Counting [0.0] 本稿では、重み付きモデルカウント(WMC)に対する(ユニバーサル)量子回路等価問題をチューリング還元する。
オープンソースの実装により、この手法はZX計算と決定図に基づく最先端の等価性チェックツールより優れていることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:58:20 GMT)
Enhancing Multiple Object Tracking Accuracy via Quantum Annealing [0.0] 複数物体追跡(MOT)は画像認識において重要な課題である。
提案手法はリアルタイムMOTアプリケーションに有意な可能性を秘めている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:02:23 GMT)
Emulating moiré materials with quasiperiodic circuit quantum electrodynamics [0.0] 電荷空間におけるモワール物理をエミュレートする従来の超伝導回路の容量を実証する。
我々はホフスタッターの蝶と魔法の角効果が分光輸送測定で直接見えることを示した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:34:59 GMT)
Effective Embedding of Integer Linear Inequalities for Variational Quantum Algorithms [0.0] 変分量子アルゴリズムでは、通常、制約はペナルティ項によって問題対象に追加される。
本研究では,これらの欠点を伴わない量子アルゴリズムの線形不等式をモデル化するためのアプローチについて検討する。
我々の主な提案は、スラック量子ビットを完全に省略し、パラメータチューニング中に古典的に不等式を評価することである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:32:26 GMT)
Doppler-assisted quantum resonances through swappable excitation pathways in Potassium vapor [0.0] 我々はD$3,9K$蒸気の多様体における2つのサブ自然線幅量子干渉の観測を報告した。
他の2つの特徴は、ドップラー拡張吸収プロファイルよりも3,9Kドルの超微細分割が小さいためのみ現れる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:45:04 GMT)
Direct mineral content prediction from drill core images via transfer learning [0.0] 深層探査は、鉱業、石油、ガス産業、化学廃棄物や核廃棄物の処理のための地質単位の評価において重要である。
本研究では,機械学習,特に畳み込みニューラルネットワーク(CNN)を活用して,ドリルコア画像の解析のみからリソロジーとミネラル含量を評価する可能性について検討する。
その結果、ドリルコアセグメントを異なる形成クラスに分類する際、96.7%の精度が明らかとなった。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:15:22 GMT)
Dimensional Reduction in Quantum Optics [0.0] 1次元量子光学モデルは、通常、異なる空間次元に付随する大規模な分離や凍結力学の直観に依拠する。
量子化された電磁場を$-$、正確に$-$で、低次元の部分空間上に存在する無限個の部分体に分解する方法を示す。
次元還元近似は、例えば原子との相互作用を考えると、原子空間プロファイルの修正に対応するようなサブフィールドの数のトランケーションに対応する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 10:39:05 GMT)
DiffStyler: Diffusion-based Localized Image Style Transfer [0.0] 画像スタイル転送は、色、ブラシストローク、形状など、スタイルターゲットの特徴的な特性を持つデジタルイメージを埋め込むことを目的としている。
任意のスタイル転送手法の進歩にもかかわらず、コンテンツセマンティクスとスタイル属性の微妙な均衡は依然として大きな課題である。
本稿ではDiffStylerについて紹介する。DiffStylerは、任意の画像スタイルの効率的な転送を容易にする新しいアプローチである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 11:19:34 GMT)
Deep Learning-Driven Approach for Handwritten Chinese Character Classification [0.0] 手書き文字認識は、機械学習研究者にとって難しい問題である。
多数のユニークな文字クラスが存在するため、ロジカルスクリプトや中韓文字シーケンスのようなデータによっては、HCR問題に新たな複雑さをもたらす。
本稿では、モデルアーキテクチャ、データ前処理ステップ、設計手順のテストを導入し、詳細な文字画像分類のための高度にスケーラブルなアプローチを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 00:46:26 GMT)
Deep Learning for Robust and Explainable Models in Computer Vision [0.0] この論文は、MLとDLを実際に使用する際の堅牢性と説明可能性の問題に対処する様々なアプローチを提示している。
この論文は、コンピュータビジョンモデルの堅牢性と説明可能性の発展を示す。
理論的発展に加えて、この論文は異なる文脈におけるMLとDLのいくつかの応用を実証している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:17:10 GMT)
Copyright related risks in the creation and use of ML/AI systems [0.0] 本稿では機械学習(ML)と人工知能(AI)システム(Large Language Models --LLMsを含む)がもたらす著作権関連リスクについて要約する。
これらのリスクは、トレーニングデータの著作権の所有者、ML/AIシステムのユーザ、トレーニングされたモデルの作者、AIシステムのオペレータなど、さまざまな利害関係者に影響を与える。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:48:44 GMT)
Contrastive Learning with Orthonormal Anchors (CLOA) [0.0] 本研究では,コントラスト学習における不安定性問題に対処すること,特にInfoNCE損失関数とその導関数について検討する。
我々はこれらの損失関数が制限的な挙動を示すことを批判的に観察し、埋め込みが特異点にマージする傾向にある収束現象を導いた。
この「オーバーフュージョン」効果は、その後の教師あり学習タスクの分類精度に有害である。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:48:16 GMT)
Computationally and Memory-Efficient Robust Predictive Analytics Using Big Data [0.0] 本研究では、データ不確実性、ストレージ制限、ビッグデータを用いた予測データ駆動モデリングの課題をナビゲートする。
本稿では,ロバスト主成分分析(RPCA)を有効ノイズ低減と外乱除去に利用し,最適センサ配置(OSP)を効率的なデータ圧縮・記憶に活用する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 22:39:08 GMT)
Compression of the Koopman matrix for nonlinear physical models via hierarchical clustering [0.0] クープマン作用素の線型特性は非線形力学を理解することを希望する。
本研究では,階層クラスタリングを用いてクープマン行列を圧縮する手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 01:18:00 GMT)
Colour and Brush Stroke Pattern Recognition in Abstract Art using Modified Deep Convolutional Generative Adversarial Networks [0.0] 本稿では,GAN(Generative Adrial Neural Networks)を用いた抽象絵画の広範な分布について述べる。
課題は、一般的なトレーニングの落とし穴を克服する効率的なGANアーキテクチャを開発することだ。
本稿では,高品質なアートワーク生成のための改良型DCGAN (mDCGAN) を提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 09:35:56 GMT)
Classifying symmetric and symmetry-broken spin chain phases with anomalous group actions [0.0] 局所分解可能群作用の下で不変な量子スピン鎖の分類問題を考察する。
我々は、自然に一次元対称性に保護された位相位相をカバーする分類の不変性を導出する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:54:45 GMT)
Classical dynamics and semiclassical analysis of excitons in cuprous oxide [0.0] 酸化銅中の励起子の古典的および半古典的理論を包括的に導出した。
特に,エキシトンダイナミクスのエネルギー依存性について検討する。
半古典的および量子力学的エクシトン再帰スペクトルの一致は、古典的および半古典的アプローチの妥当性を示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 06:58:50 GMT)
Characteristics, Implementation and Applications of Special Perfect Entangler Circuits [0.0] 本研究では、2量子ゲートの非局所部分の平方固有値のアーガン図に現れるコードを用いて、2量子ゲートが絡み合った状態を生成する能力を示す。
特殊完全エンタングル回路を用いて2つの普遍2量子ビット量子回路を構築する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:13:02 GMT)
Centered Masking for Language-Image Pre-Training [0.0] 言語画像事前学習(GLIP)のためのガウスマスキングについて紹介する。
GLIPは視覚言語モデルの事前学習中に画像パッチをマスキングする新しい、単純で効果的な手法である。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 08:54:06 GMT)
COVID-19 detection from pulmonary CT scans using a novel EfficientNet with attention mechanism [0.0] この課題は、CTスキャン画像からのCOVID-19検出のために提案したパイプラインを評価する機会を提供する。
従来の/パストパイプラインとは違い、パイプラインは前処理ステップに依存しています。
私たちのパイプラインは、例えば肺を分節するデコーダを組み込まないように、計算的に効率的です。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 20:10:05 GMT)
CEIMVEN: An Approach of Cutting Edge Implementation of Modified Versions of EfficientNet (V1-V2) Architecture for Breast Cancer Detection and Classification from Ultrasound Images [0.0] 乳がんは女性の死亡数の最大の原因となっている。
近年の研究では、超音波画像やマンモグラフィーから乳がんを検出・分類し、深層ニューラルネットワークで分類する上で、医療画像処理と医療画像処理が重要な役割を担っている。
本研究では,EfficientNet の最先端版の改良版に対する厳密な実装と反復的な結果分析に焦点をあてた。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:12:09 GMT)
CARE: Co-Attention Network for Joint Entity and Relation Extraction [0.0] 本稿では,共同エンティティと関係抽出のためのコ・アテンション・ネットワークを提案する。
提案手法では,サブタスク毎に異なる表現を学習するための並列符号化方式を採用する。
このアプローチのコアとなるのは,2つのサブタスク間の双方向のインタラクションをキャプチャするコアテンションモジュールです。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:46:37 GMT)
Autonomous Quantum Heat Engine Based on Non-Markovian Dynamics of an Optomechanical Hamiltonian [0.0] この量子熱エンジンの解析モデルと非マルコフ準古典モデルを構築した。
この提案は、非マルコフ政権における量子熱エンジンの詳細な研究を裏付けるものである。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:45:12 GMT)
Automated Extraction and Maturity Analysis of Open Source Clinical Informatics Repositories from Scientific Literature [0.0] 本研究では、arXivにインデックスされた学術論文からGitHubリポジトリURLを体系的に抽出することにより、ギャップを埋める自動化手法を提案する。
当社のアプローチでは、関連論文に対するarXiv APIのクエリ、抽出したGitHub URLのクリーニング、GitHub APIによる包括的なリポジトリ情報の取得、スター、フォーク、オープンイシュー、コントリビュータなどの定義されたメトリクスに基づいてリポジトリの成熟度を分析しています。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 17:36:09 GMT)
Artifact Reduction in 3D and 4D Cone-beam Computed Tomography Images with Deep Learning -- A Review [0.0] コーンビームCT(CBCT)における画像品質向上のための深層学習技術
本稿では,3次元のアーティファクトの削減に成功している深層学習技術の概要と,時間分解(4D)CBCTについて概説する。
この研究の重要な発見の1つは、GANやスコアベース、拡散モデルを含む生成モデルの利用に向けた観測傾向である。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 13:46:01 GMT)
Analyticity and the Unruh effect: a study of local modular flow [0.0] ウンルー効果は、リンドラーのくさびの中のミンコフスキー真空がそのモジュラーフローとしてブーストを持つという言明として定式化することができる。
幾何学的に局所的なモジュラーフローを持つ状態の他の例は、場の量子論や量子重力におけるエネルギーとエントロピーを理解する上で重要な役割を果たしている。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 18:36:38 GMT)
Algorithmic Details behind the Predator Shape Analyser [0.0] この章では、プレデター形状分析装置の背後にあるアルゴリズムの詳細な記述に焦点を当てている。
Predatorは、シーケンシャルな非再帰的なCコードの形式解析と検証に特に適している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:05:49 GMT)
Addition and Differentiation of ZX-diagrams [0.0] ZX-ダイアグラムの追加に関する一般帰納的定義を導入する。
ZX-ダイアグラムの誘導的分化を提供する。
また、結果を適用してイジング・ハミルトン多様体の図形を導出する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 16:27:04 GMT)
A unified view of direct measurement of quantum states, processes, and measurements [0.0] 量子系の力学は、量子状態、量子過程、量子測定の3つの構成要素によって特徴づけられる。
これら3つのコンポーネントの直接測定手法を体系的に導出するための理論的枠組みを提案する。
光パルストレインを用いた量子状態の直接測定法の有効性を実験的に実証した。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 02:42:11 GMT)
A thermodynamically consistent physics-informed deep learning material model for short fiber/polymer nanocomposites [0.0] 本研究では, 種々の環境条件下での短繊維強化ナノ粒子充填エポキシスの粘弾性・粘弾性挙動を解析するための物理インフォームド・ディープ・ラーニング(PIDL)モデルを提案する。
PIDLモデルは, 種々の熱水条件下での繊維およびナノ粒子の体積分画に対するエポキシ系ナノコンポジットの力学的挙動を正確に予測することができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 07:22:32 GMT)
A survey on learning models of spiking neural membrane systems and spiking neural networks [0.0] スパイキングニューラルネットワーク(英: Spiking Neural Network、SNN)は、特定の脳のような特性を持つ、生物学的にインスパイアされたニューラルネットワークのモデルである。
SNNでは、スパイクトレインとスパイクトレインを通してニューロン間の通信が行われる。
SNPSは形式的オートマトン原理に基づくSNNの分岐と見なすことができる。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 14:26:41 GMT)
A pragma based C++ framework for hybrid quantum/classical computation [0.0] 本稿では,HPC環境に適合するハイブリッド量子古典フレームワークの要件について述べる。
Q-Pragmaと呼ばれる新しいハードウェアに依存しないフレームワークを導入している。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:11:21 GMT)
A blue repulsive potential for dysprosium Bose-Einstein condensates [0.0] 量子気体の短流体反発電位は、新しい系を実現し、新しい現象を研究することができる。
ダイオキシン類の偏光率のスカラー成分とテンソル成分の両方を測定するために,スペクトルフィルタダイオードレーザーシステムを用いた。
ボース=アインシュタイン凝縮体を操作するのに適したポテンシャル強度の実装について, 散乱寿命が1秒を超えることを実証する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 15:20:51 GMT)
A Transformer-Based Framework for Payload Malware Detection and Classification [0.0] ディープパケット検査(Deep Packet Inspection, DPI)は、IDSがネットワークパケットの内容を分析することを可能にする技術である。
本稿では,悪意のあるトラフィックを検出するために適応したトランスフォーマーに基づくDPIアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 03:25:45 GMT)
A Secure Quantum Key Distribution Protocol Using Two-Particle Transmission [0.0] Unextendible Product Bases (UPB) は、その固有の不明瞭さのため、量子暗号において約束を守る。
本研究は, UPBを用いて遠隔者間の量子鍵を確立するプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 12:00:29 GMT)
A Python library for efficient computation of molecular fingerprints [0.0] 分子指紋を効率的に計算し、包括的なインターフェースを提供するPythonライブラリを作成します。
このライブラリは、ユーザが並列性を使って大規模なデータセット上で計算を実行することを可能にする。
分子指紋を用いて、最先端のMLソリューションに匹敵する結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 27 Mar 2024 19:02:09 GMT)