Reduce, Reuse, Recycle: Compositional Generation with Energy-Based Diffusion Models and MCMC [102.6] 拡散モデルは、多くの領域において、生成モデリングの一般的なアプローチとなっている。
本稿では,新しい構成演算子の利用を可能にする拡散モデルのエネルギーベースパラメータ化を提案する。
これらのサンプルは、幅広い問題にまたがって構成生成の顕著な改善につながっている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 20:56:53 GMT)
Bi-Factorial Preference Optimization: Balancing Safety-Helpfulness in Language Models [94.4] 人間の嗜好を微調整した大型言語モデル(LLM)は、その能力向上に成功している。
しかし、微調整中のLLMの安全性確保は依然として重要な懸念事項である。
本稿では,BFPO(Bi-Factorial Preference Optimization)と呼ばれる教師あり学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:31:21 GMT)
GenRec: Unifying Video Generation and Recognition with Diffusion Models [84.1] 我々は、ランダムフレーム条件付けプロセスでトレーニングされた最初の統一フレームワークであるGenRecを紹介する。
実験は、認識と生成の両方にGenRecの有効性を示す。
GenRecはまた、最高のクラス条件の画像-ビデオ生成結果も実行します。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:59:41 GMT)
Constrained Diffusion Models via Dual Training [80.0] 我々は,要求に応じて所望の分布に基づいて制約付き拡散モデルを開発する。
本稿では,制約付き拡散モデルを用いて,目的と制約の最適なトレードオフを実現する混合データ分布から新しいデータを生成することを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:25:42 GMT)
Foundation Models for Music: A Survey [77.7] ファンデーションモデル(FM)は音楽を含む様々な分野に大きな影響を与えている。
本総説では,音楽の事前学習モデルと基礎モデルについて概観する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:09:44 GMT)
The Mamba in the Llama: Distilling and Accelerating Hybrid Models [76.6] 注目層からの線形射影重みを学術的なGPU資源で再利用することにより,大規模な変換器を線形RNNに蒸留することが可能であることを示す。
その結果、注意層を4分の1含むハイブリッドモデルは、チャットベンチマークのオリジナルのTransformerに匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:56:11 GMT)
The VoxCeleb Speaker Recognition Challenge: A Retrospective [75.4] VoxCeleb Speaker Recognition Challenges (VoxSRC)は、2019年から2023年にかけて毎年開催される一連の課題とワークショップである。
課題は主に、様々な環境下で話者認識とダイアリゼーションのタスクを評価した。
私たちは、これらの課題について、彼らが何を探求したのか、課題参加者によって開発された方法、そしてそれらがどのように進化したのかをレビューします。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:57:31 GMT)
Leveraging Hallucinations to Reduce Manual Prompt Dependency in Promptable Segmentation [74.0] 本稿では,プロペラジェネレータとマスクジェネレータを備えたProMaC(Prompt-Mask Cycle Generation framework)を提案する。
プロンプトジェネレータは、最初は、テストイメージ上で拡張された文脈知識を抽出するための幻覚を探究する、複数スケールの思考プロンプトの連鎖を使用する。
生成されたマスクは、プロンプトジェネレータを反復的にタスク関連の画像領域に集中させ、無関係な幻覚を減らし、より良いプロンプトとマスクを共同で生成する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:06:22 GMT)
A StrongREJECT for Empty Jailbreaks [72.9] StrongREJECTは、ジェイルブレイクのパフォーマンスを評価するための高品質なベンチマークである。
これは、被害者モデルが禁止されたプロンプトに対する応答の有害性を評価する。
それは、ジェイルブレイクの有効性の人間の判断と最先端の合意を達成します。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:32:47 GMT)
Research on the Spatial Data Intelligent Foundation Model [70.5] 本報告では、これらのモデルの原理、手法、最先端の応用を探求する、空間データインテリジェントな大規模モデルに焦点を当てる。
これは、空間データインテリジェントな大規模モデルの定義、開発履歴、現状、およびトレンドに関する詳細な議論を提供する。
本報告では, 都市環境, 航空宇宙リモートセンシング, 地理, 交通, その他のシナリオにおける空間データ知能大規模モデルの重要技術とその応用を体系的に解明する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:45:18 GMT)
Multimodality Helps Unimodality: Cross-Modal Few-Shot Learning with Multimodal Models [69.3] 人間はクロスモーダル情報を使って、新しい概念を効率的に学習する。
犬について読んだり、バークを聴いたりすることで、より優れた$bfビジュアルの犬分類器を構築できることを示す。
我々は、最初の(知識のために)オーディオヴィジュアルな数ショットのベンチマークを構築し、画像分類と音声分類の両方の性能を向上させるために、クロスモーダルトレーニングを使用する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:00:47 GMT)
Measuring Human Contribution in AI-Assisted Content Generation [68.0] 本研究は,AIによるコンテンツ生成における人間の貢献度を測定する研究課題を提起する。
人間の入力とAI支援出力の自己情報に対する相互情報を計算することにより、コンテンツ生成における人間の比例情報貢献を定量化する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 05:56:04 GMT)
OWSM v3.1: Better and Faster Open Whisper-Style Speech Models based on E-Branchformer [67.8] Open Whisperスタイルの音声モデル(OWSM)は、公開データとオープンソースツールキットを使用してOpenAI Whisperを再現するための最初のステップである。
OWSM v3.1 は100M から 1B のパラメータを含む一連の E-Branchformer ベースのモデルを示す。
OWSM v3.1は、ほとんどの評価ベンチマークにおいて、以前のOWSM v3よりも優れ、推論速度は25%向上した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:15:49 GMT)
Handling Geometric Domain Shifts in Semantic Segmentation of Surgical RGB and Hyperspectral Images [67.7] 本稿では,幾何学的アウト・オブ・ディストリビューションデータに直面する場合の,最先端のセマンティックセマンティックセマンティクスモデルの最初の解析を行う。
本稿では, 汎用性を高めるために, 有機移植(Organ Transplantation)と呼ばれる拡張技術を提案する。
我々の拡張技術は、RGBデータに対して最大67%、HSIデータに対して90%のSOAモデル性能を改善し、実際のOODテストデータに対して、分配内パフォーマンスのレベルでのパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:13:15 GMT)
LQ-LoRA: Low-rank Plus Quantized Matrix Decomposition for Efficient Language Model Finetuning [66.9] 提案手法では,事前学習した行列を高精度の低ランク成分とメモリ効率の量子化成分に分解するために反復アルゴリズムを用いる。
微調整されたRoBERTaとLLaMA-2の実験は、我々の低ランク+量子化行列分解法(LQ-LoRA)が強いQLoRAおよびGPTQ-LoRAベースラインより優れていることを示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 00:48:35 GMT)
Sequence-aware Pre-training for Echocardiography Probe Guidance [66.4] 心臓超音波は、(1)心臓の本質的に複雑な構造、(2)重要な個人差の2つの大きな課題に直面している。
これまでの研究は、心臓のパーソナライズされた構造的特徴よりも、心臓の2Dおよび3Dの人口平均構造についてしか学ばなかった。
パーソナライズされた2次元と3次元の心構造特徴を学習するためのシーケンス認識型自己教師付き事前学習法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:55:54 GMT)
Genixer: Empowering Multimodal Large Language Models as a Powerful Data Generator [63.8] Genixerは4つの重要なステップからなる包括的なデータ生成パイプラインである。
LLaVA1.5でトレーニングされた合成VQAライクなデータセットは、12のマルチモーダルベンチマークのうち10のパフォーマンスを向上させる。
タスク固有のデータセットで訓練されたMLLMは、複雑な命令チューニングデータを生成する際に、GPT-4Vを超えることができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:51:13 GMT)
TAPVid-3D: A Benchmark for Tracking Any Point in 3D [63.1] 我々は,3Dにおける任意の点の追跡作業を評価するための新しいベンチマークTAPVid-3Dを導入する。
このベンチマークは、モノクロビデオから正確な3Dの動きと表面の変形を理解する能力を改善するためのガイドポストとして機能する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:14:16 GMT)
Classification Matters: Improving Video Action Detection with Class-Specific Attention [61.1] ビデオアクション検出(VAD)は、アクターを検出し、そのアクションをビデオで分類することを目的としている。
一般的な手法が、分類のための特徴をどう形成するかを分析し、アクター領域の優先順位付けを行う。
本稿では,アクターに対する偏見を減らし,各アクションクラスに関連する文脈に注意を払うことを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:06:38 GMT)
Gated Linear Attention Transformers with Hardware-Efficient Training [60.7] 本研究は、並列化性に対してメモリ移動をオフにする線形注意のためのハードウェア効率のアルゴリズムについて述べる。
次に、このアルゴリズムを、データ依存ゲートを用いたより表現力豊かな線形アテンションに一般化する。
変圧器の標準アテンション層に代えて使用すると、結果として生じるゲート状リニアアテンショントランスが競合的に動作することが分かる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:27:29 GMT)
Generative Inbetweening: Adapting Image-to-Video Models for Keyframe Interpolation [60.3] 本稿では,一対の入力キーフレーム間のコヒーレントな動きで映像列を生成する手法を提案する。
実験の結果,本手法は既存の拡散法と従来のフレーム技術の両方に優れることがわかった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:57:14 GMT)
CNN-Transformer Rectified Collaborative Learning for Medical Image Segmentation [60.1] 本稿では,医用画像セグメンテーションのための強力なCNNベースモデルとトランスフォーマーベースモデルを学習するための,CNN-Transformer修正協調学習フレームワークを提案する。
具体的には,学生ソフトラベルの誤り領域を適応的に選択・修正する基礎的真理を取り入れた修正ロジット・ワイド・コラボレーティブ・ラーニング(RLCL)戦略を提案する。
また,機能空間におけるCNNベースモデルとTransformerベースモデル間の効果的な知識伝達を実現するために,クラス認識型特徴量協調学習(CFCL)戦略を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:11:44 GMT)
Distribution-Aware Calibration for Object Detection with Noisy Bounding Boxes [58.3] そこで我々はDISCO(Distribution-aware CalibratiOn)を提案する。
分類, 局所化, 解釈可能性を改善するために, 3つの分布認識技術を開発した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:23:22 GMT)
Fast Matrix Multiplications for Lookup Table-Quantized LLMs [58.1] FLUTEはLUT量子化LLM用のフレキシブルなルックアップテーブルエンジンである。
バッチサイズ32と量子化グループサイズ128では、FLUTEカーネルは既存のGEMMカーネルよりも2〜4倍高速である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 00:27:12 GMT)
Hierarchical Graph Interaction Transformer with Dynamic Token Clustering for Camouflaged Object Detection [57.9] 本稿では,HGINetと呼ばれる階層的なグラフ相互作用ネットワークを提案する。
このネットワークは、階層的トークン化機能間の効果的なグラフ相互作用を通じて、知覚不能なオブジェクトを発見することができる。
本実験は,既存の最先端手法と比較して,HGINetの優れた性能を示すものである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:53:25 GMT)
Estimating Causal Effects from Learned Causal Networks [56.1] 本稿では、離散可観測変数に対する因果影響クエリに応答する代替パラダイムを提案する。
観測データから直接因果ベイズネットワークとその共起潜伏変数を学習する。
本手法は, 推定手法よりも有効であることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:54:04 GMT)
Learning-based Multi-View Stereo: A Survey [55.3] MVS(Multi-View Stereo)アルゴリズムは、複雑な環境における正確な再構築を可能にする包括的な3D表現を合成する。
ディープラーニングの成功により、多くの学習ベースのMVS手法が提案され、従来の手法に対して優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:53:18 GMT)
CrossViewDiff: A Cross-View Diffusion Model for Satellite-to-Street View Synthesis [54.9] CrossViewDiffは、衛星間ビュー合成のためのクロスビュー拡散モデルである。
ビュー間の大きな相違による課題に対処するため、衛星シーン構造推定とクロスプラットフォームテクスチャマッピングモジュールを設計する。
合成結果のより包括的な評価を実現するため,GPTに基づくスコアリング手法を設計する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:41:44 GMT)
Training-free Long Video Generation with Chain of Diffusion Model Experts [54.4] ConFinerは、ビデオ生成をより簡単なサブタスクに分離する、効率的な高品質なビデオ生成フレームワークである。
オフザシェルフ拡散モデルの専門家の鎖で高品質なビデオを生成することができ、それぞれが分離されたサブタスクを担当している。
私たちのフレームワークは、すべての客観的および主観的メトリクスにわたって、LavieやModelscopeのような代表的なモデルを超えています。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:12:52 GMT)
No Regrets: Investigating and Improving Regret Approximations for Curriculum Discovery [53.1] 非教師なし環境設計(UED)手法は、エージェントがイン・オブ・アウト・ディストリビューション・タスクに対して堅牢であることを保証するため、近年注目されている。
これらの手法が、現実のロボット工学の問題に強くインスパイアされた、新しい設定に適用された場合、どの程度堅牢であるかを問う。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:31:54 GMT)
Unsupervised Domain Adaptation via Style-Aware Self-intermediate Domain [52.8] 非教師なしドメイン適応(UDA)は、ラベル豊富なソースドメインから関連するがラベルのないターゲットドメインに知識を伝達する、かなりの注目を集めている。
本研究では,大規模なドメインギャップと伝達知識を橋渡しし,クラス非ネイティブ情報の損失を軽減するために,SAFF(style-aware feature fusion)法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:16:06 GMT)
Say No to Freeloader: Protecting Intellectual Property of Your Deep Model [52.8] コンパクト・アントランスファーブル・ピラミッド分離ドメイン(CUPI-Domain)は、権限のないドメインから権限のないドメインへの違法な転送に対する障壁として機能する。
本稿では,CUPI-Domain と CUPI-Domain の両方の特徴をアンカーとして選択する CUPI-Domain ジェネレータを提案する。
非許可ドメインが知られているかどうかに基づいて、CUPI-Domainを利用するための2つのソリューションを提供する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:05:57 GMT)
RAW-Adapter: Adapting Pre-trained Visual Model to Camera RAW Images [51.7] 本稿では,カメラRAWデータへのsRGB事前学習モデルの適用を目的とした新しいアプローチであるRAW-Adapterを紹介する。
Raw-Adapterは、学習可能なISPステージを使用してRAW入力を調整する入力レベルアダプタと、ISPステージとその後の高レベルネットワーク間の接続を構築するモデルレベルアダプタで構成されている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:14:54 GMT)
DAC: Decomposed Automation Correction for Text-to-SQL [51.5] De Automation Correction (DAC)を導入し、エンティティリンクとスケルトン解析を分解することでテキストから合成を補正する。
また,本手法では,ベースライン法と比較して,スパイダー,バード,カグルDBQAの平均値が平均3.7%向上することを示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:14:54 GMT)
Non-instructional Fine-tuning: Enabling Instruction-Following Capabilities in Pre-trained Language Models without Instruction-Following Data [51.3] 本稿では,OpenWebText からのランダムテキストの前半を命令として,GPT-3.5-turbo あるいは GPT-4-turbo を用いて応答としてテキストを完成させる手法を提案する。
データが"非教育的"であるにも関わらず、このデータに基づいて微調整された事前学習されたLLMが、命令追従能力を得る可能性があることがわかった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:21:53 GMT)
GIFT-SW: Gaussian noise Injected Fine-Tuning of Salient Weights for LLMs [51.0] 我々は,Gaussian noise Injected Fine Tuning of Salient Weights (GIFT-SW)と呼ばれる新しいPEFT法を提案する。
本手法では, ガウス雑音を非正弦波に注入しながら, 正弦波列のみを更新する。
LLaMAモデルによる実験により、GIFT-SWは、同じ計算予算の下で、完全な微調整および現代的なPEFTメソッドよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:41:14 GMT)
Pattern based learning and optimisation through pricing for bin packing problem [50.8] 確率変数の分布のような問題条件が変化すると、以前の状況でうまく機能するパターンはより効果的になるかもしれないと論じる。
本研究では,パターンを効率的に同定し,各条件に対する値の動的定量化を行う新しい手法を提案する。
本手法は,制約を満たす能力と目的値に対する影響に基づいて,パターンの値の定量化を行う。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:03:48 GMT)
Time-Aware Face Anti-Spoofing with Rotation Invariant Local Binary Patterns and Deep Learning [50.8] 模倣攻撃は 不正な識別と その後の攻撃者の認証につながる
顔認識と同様に、模倣攻撃も機械学習で検出できる。
本稿では,未使用の機能と時間認識の深層学習戦略を組み合わせることで,高い分類精度を実現する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:26:10 GMT)
Efficient LLM Training and Serving with Heterogeneous Context Sharding among Attention Heads [50.0] 本研究では,異種コンテキスト分割を異なるアテンションヘッドに割り当てて分割・征服するアテンションアルゴリズムであるSparsely-Sharded (S2)アテンションを提案する。
S2-Attentionは、各アテンションヘッドを強化されたスパーシティパターンに従ってコンテキストの分割にのみ参加するように強制する一方、フルコンテキストはすべてのシャードの結合として保存される。
S2-Attentioncan は,(1) 壁面の注意速度を FlashAttention-2 より25.3倍に向上し,エンドツーエンドのトレーニング時間と10倍の推論遅延を6倍短縮することを示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 22:06:20 GMT)
Machine Learning for Methane Detection and Quantification from Space -- A survey [49.8] メタン (CH_4) は強力な温室効果ガスであり、20年間で二酸化炭素 (CO_2) の86倍の温暖化に寄与する。
この研究は、ショートウェーブ赤外線(SWIR)帯域におけるメタン点源検出センサの既存の情報を拡張する。
従来の機械学習(ML)アプローチと同様に、最先端の技術をレビューする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:03:20 GMT)
Optimal level set estimation for non-parametric tournament and crowdsourcing problems [49.8] クラウドソーシングによって動機づけられた我々は、$d$の質問に対する$n$の専門家の回答の正しさを部分的に観察する問題を考える。
本稿では、専門家$i$が疑問に答える確率を含む行列$M$が、行と列の置換までの双等方性であることを仮定する。
我々は,この分類問題に対して最小限のアルゴリズムを最適に構築する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:28:31 GMT)
Constraining Participation: Affordances of Feedback Features in Interfaces to Large Language Models [49.7] 大規模言語モデル(LLM)は、コンピュータ、Webブラウザ、ブラウザベースのインターフェースによるインターネット接続を持つ人なら誰でも利用できるようになった。
本稿では,ChatGPTインタフェースにおける対話型フィードバック機能の可能性について検討し,ユーザ入力の形状やイテレーションへの参加について分析する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:50:37 GMT)
Automating the Practice of Science -- Opportunities, Challenges, and Implications [48.5] 本稿では、科学的実践における自動化のスコープを評価し、最近のアプローチを評価する。
自動科学の背景にあるモチベーションについて議論し、遭遇したハードルを分析し、その影響を調査し、この記事では、研究者、政策立案者、ステークホルダーに、自動化科学の実践のフロンティアをナビゲートするよう依頼する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:51:31 GMT)
FLEXTAF: Enhancing Table Reasoning with Flexible Tabular Formats [48.5] フレキシブルフォーマットを用いてテーブル推論性能を向上させるためのFLEXTAF-SingleとFLEXTAF-Voteを提案する。
WikiTableQuestionsとTabFactに関する我々の実験は、平均的な2.3%と4.8%の大幅な改善を示している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:23:45 GMT)
A Preliminary Exploration Towards General Image Restoration [48.0] 本稿では、これらの課題を統一モデル内で解決することを目的とした、一般画像復元(GIR)と呼ばれる新しい問題を提案する。
GIRは個々の画像復元タスク(例えば、画像のデノイング、デブロイング、デライニング、超解像)とそれらの組み合わせを汎用的にカバーしている。
我々は、GIR課題に対処するための既存のアプローチを包括的に評価し、その強みと実用的課題を明らかにする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:31:45 GMT)
X-Reflect: Cross-Reflection Prompting for Multimodal Recommendation [48.0] LMM(Large Language Models)とLMM(Large Multimodal Models)は、アイテム記述を充実させる効果を高めることが示されている。
本稿では,テキストと画像間の支援的・矛盾する情報をLMMに明示的に識別・調整するよう促すことにより,制約に対処する新しいフレームワークであるクロス・リフレクション・プロンプト(Cross-Reflex Prompting)を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:10:21 GMT)
Text2SQL is Not Enough: Unifying AI and Databases with TAG [47.5] Table-Augmented Generation (TAG) は、データベース上の自然言語の質問に答えるパラダイムである。
我々は、TAG問題を研究するためのベンチマークを開発し、標準手法がクエリの20%以上を正しく答えることを発見した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 00:50:14 GMT)
Integrating Paralinguistics in Speech-Empowered Large Language Models for Natural Conversation [46.9] 本稿では,広範な音声テキストLLMフレームワークである統一音声対話モデル(USDM)を紹介する。
USDMは、与えられた入力音声に関連する自然な韻律的特徴を持つコヒーレントな音声応答を生成するように設計されている。
提案手法は,従来のベースラインとカスケードベースラインを超越した自然な音声応答を効果的に生成する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:24:30 GMT)
A Statistical Framework for Data-dependent Retrieval-Augmented Models [46.8] 最新のMLシステムは、最終的な予測を強化するために、追加の関連情報によって入力インスタンスを増大させる。
本研究では,1)データ依存メトリックを用いて大規模コーパスから関連する情報を識別するエム検索器,2)検索した情報とともに入力インスタンスを消費し最終的な予測を行うエム予測器,の2つのコンポーネントを用いたモデルについて検討する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 20:51:06 GMT)
Sifting through the Chaff: On Utilizing Execution Feedback for Ranking the Generated Code Candidates [46.7] 大規模言語モデル(LLM)は、自然言語記述に基づいたコードの自動生成によって、開発者がプログラミングにアプローチする方法を変えつつある。
本稿では,実行フィードバックを活用するコードランキングの革新的なアプローチである RankEF について述べる。
3つのコード生成ベンチマークの実験では、RanEFが最先端のCodeRankerよりも大幅に優れていることが示されている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:49:19 GMT)
Irregular Traffic Time Series Forecasting Based on Asynchronous Spatio-Temporal Graph Convolutional Network [46.4] 本稿では,不規則なトラフィック時系列予測に適した非同期時空間グラフ畳み込み nEtwoRk (ASeer) を提案する。
まず,適応的なトラフィック信号によって制御される非同期なトラフィック状態間の空間依存性をキャプチャする非同期グラフ拡散ネットワークを提案する。
そこで本研究では,時間認識型コンボリューションネットワークを提案し,時間認識型コンボリューションを時間認識型コンボリューションに適応させる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:39:38 GMT)
Learning Robust Reward Machines from Noisy Labels [46.2] PROB-IRMは、雑音のある実行トレースから強化学習(RL)エージェントのための堅牢な報酬機(RM)を学習するアプローチである。
ProB-IRMは雑音の痕跡からRMを学習し、それらを利用してRLエージェントを訓練し、そのタスクをうまく解決できることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:41:42 GMT)
SpeechGLUE: How Well Can Self-Supervised Speech Models Capture Linguistic Knowledge? [45.9] 音声表現のための自己教師付き学習(SSL)は、様々な下流タスクにうまく適用されている。
本稿では,音声SSL技術が言語知識をうまく捉えることができるかどうかを明らかにすることを目的とする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:35:20 GMT)
Taxonomy-Guided Zero-Shot Recommendations with LLMs [45.8] 大規模言語モデル (LLM) はレコメンデータシステム (RecSys) において有望であることを示す。
項目情報の明瞭度と構造を改善するため,分類学辞書を用いた新しい手法を提案する。
TaxRecは従来のゼロショットアプローチに比べて推奨品質を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:18:05 GMT)
Dynamic Object Queries for Transformer-based Incremental Object Detection [45.4] インクリメンタルオブジェクト検出は、新しいクラスを逐次学習することを目的としている。
従来の方法論は主に知識の蒸留と模範的な再生を通じて忘れる問題に取り組む。
安定塑性トレードオフを実現するためのモデル表現能力を漸進的に拡張するDyQ-DETRを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:03:00 GMT)
Time Series Analysis for Education: Methods, Applications, and Future Directions [45.1] 本論文は,特に教育現場における時系列解析技術に関する総合的なレビューを初めて行ったものである。
本研究は,4つの時系列手法である予測,分類,クラスタリング,異常検出を,教育環境における特定の応用点を推定するものである。
本稿では,個人化学習分析,マルチモーダルデータ融合,および教育時系列における大規模言語モデル(LLM)の役割など,今後の方向性について論じる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:06:17 GMT)
Expert Knowledge-Aware Image Difference Graph Representation Learning for Difference-Aware Medical Visual Question Answering [45.1] メインイメージとレファレンスイメージのペアが与えられたこのタスクは、両方の疾患に関するいくつかの疑問に答えようとしている。
我々は164,324対の主画像と参照画像から700,703対のQAペアを含むMIMIC-Diff-VQAという新しいデータセットを収集した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:25:39 GMT)
Can Transformers Do Enumerative Geometry? [45.0] 曲線のモジュライ空間上の$psi$クラス交叉数を解析するための計算列挙幾何学の新しいパラダイムを導入する。
量子エアリー構造に基づく$psi$クラス交叉数を計算するためのTransformerベースのモデルを開発した。
我々は単に交叉数を計算し、トランスフォーマーの列挙的な「世界モデル」を探求する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:44:01 GMT)
OWSM-CTC: An Open Encoder-Only Speech Foundation Model for Speech Recognition, Translation, and Language Identification [44.9] Connectionist Temporal Classification (CTC)に基づく新しいエンコーダのみの音声基礎モデルOWSM-CTCを提案する。
多言語自動音声認識(ASR)、音声翻訳(ST)、言語識別(LID)のための180k時間の公開音声データをトレーニングする。
エンコーダデコーダOWSMと比較して、OWSM-CTCはASRとSTの24%の相対的改善を達成し、より堅牢で推論の3倍から4倍高速である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:22:00 GMT)
On Newton's Method to Unlearn Neural Networks [44.9] ニューラルネット(NN)に対する近似的未学習アルゴリズムを探索し、同じモデルを再学習したオラクルに返却する。
本稿では, 立方正則化を利用してヘッセン系縮退を効果的に処理するCureNewton法を提案する。
異なるモデルとデータセットをまたいだ実験により、我々の手法は、実践的な未学習環境で最先端のアルゴリズムと競合する未学習性能を達成できることを示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:19:20 GMT)
Recent Event Camera Innovations: A Survey [44.3] 人間の視覚システムにインスパイアされたイベントベースのビジョンは、低レイテンシ、高ダイナミックレンジ、消費電力の削減といったトランスフォーメーション機能を提供する。
本稿では、イベントカメラに関する総合的な調査を行い、その進化を経時的に追跡する。
この調査は、主要な製造業者による様々なイベントカメラモデル、重要な技術マイルストーン、そして影響力のある研究貢献をカバーしている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:14:51 GMT)
Cross-Modal Temporal Alignment for Event-guided Video Deblurring [44.3] ビデオデブロアリングは、隣接するビデオフレームから情報を集めることで、モーションレッドビデオの復元結果の品質を高めることを目的としている。
1) フレーム内機能拡張は, 単一のぼやけたフレームの露出時間内で動作し, 2) フレーム間時間的特徴アライメントは, 重要な長期時間情報を対象のフレームに収集する。
提案手法は, 合成および実世界のデブロアリングデータセットを用いた広範囲な実験により, 最先端のフレームベースおよびイベントベース動作デブロアリング法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:09:17 GMT)
Build-A-Scene: Interactive 3D Layout Control for Diffusion-Based Image Generation [44.2] インタラクティブな3次元レイアウト制御によるテキスト・ツー・イメージ(T2I)生成のための拡散型アプローチを提案する。
レイアウト制御に使用される従来の2Dボックスを3Dボックスに置き換える。
我々は,T2Iタスクを多段階生成プロセスとして再設計し,各段階において,オブジェクトを初期から保存しながら3次元に挿入,変更,移動することが可能となる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:01:56 GMT)
AgentMonitor: A Plug-and-Play Framework for Predictive and Secure Multi-Agent Systems [43.3] AgentMonitorはエージェントレベルで統合されたフレームワークで、インプットとアウトプットをキャプチャし、回帰モデルをトレーニングしてタスクのパフォーマンスを予測する統計に変換する。
さらに、悪意のあるエージェントによるセキュリティリスクに対処し、ネガティブな影響を軽減し、MASセキュリティを強化するために、リアルタイムの修正を適用することができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:24:38 GMT)
Barbie: Text to Barbie-Style 3D Avatars [43.2] 多様な高品質なバービーのような衣服やアクセサリーを身に着けた3Dアバターを作るための新しいフレームワークであるBarbieを提案する。
バービーは人体と衣服のセマンティックアライズされたモデルによって、アバターの細粒度のゆがみを達成している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:19:22 GMT)
Red-Teaming for Generative AI: Silver Bullet or Security Theater? [42.4] 我々は、赤いチーム化は、GenAIの有害な軽減を特徴付ける上で価値のある大胆なアイデアであるが、業界はAIを保護するために、閉じたドアの後ろでレッドチームやその他の戦略を効果的に適用するかもしれないと論じている。
生成AIの評価のより堅牢なツールボックスに向けて、私たちは、私たちの推奨事項を、将来のAI赤チームプラクティスをガイドし、足場にすることを目的とした質問銀行に合成します。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:23:44 GMT)
MRSE: An Efficient Multi-modality Retrieval System for Large Scale E-commerce [42.3] 現在の埋め込みベースのRetrieval Systemsは、クエリとアイテムを共有の低次元空間に埋め込む。
本稿では,テキスト,項目画像,ユーザ嗜好を統合したマルチモーダル検索システムMRSEを提案する。
MRSEはオフラインの妥当性が18.9%向上し、オンラインのコアメトリクスが3.7%向上した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:21:19 GMT)
Evidence-Enhanced Triplet Generation Framework for Hallucination Alleviation in Generative Question Answering [42.0] 本稿では,三重項(クエスト,エビデンス,アンスワー)の組合せを予測するための新しいエビデンス強化三重項生成フレームワークであるEATQAを提案する。
推測段階における証拠から知識を抽出するために,分布ギャップを橋渡しする。
我々のフレームワークは,クエリとエビデンスと応答の間の論理的関係を学習し,同時にエビデンス生成とクエリ応答を改善する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:07:07 GMT)
Single-photon description of the lossless optical Y coupler [41.9] 3ポート光YカップラーやYブランチのユニタリ散乱行列を導出する。
従来の受動線形光片方向スプリッタとは異なり、Yカップラーの出力ポートに光を結合すると強いコヒーレントなバックリフレクションが生じる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:55:43 GMT)
Long-lived entanglement of molecules in magic-wavelength optical tweezers [41.9] 電子レンジ駆動型エンタングリングゲートの2分子間の最初の実現について述べる。
この魔法の波長トラップは、0.5秒以上の測定可能な減衰を伴わず、絡み合いを保っていることを示す。
複雑な分子系への精密な量子制御の拡張により、量子科学の多くの領域にまたがる追加の自由度が利用できるようになる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:28:56 GMT)
Easy-access online social media metrics can effectively identify misinformation sharing users [41.9] 高いツイート頻度は共有コンテンツの事実性の低さと正に関連しているのに対し、アカウント年齢はそれと負に関連していることがわかった。
以上の結果から,これらのソーシャル・ネットワークの指標を頼りにすることで,誤情報を拡散しやすいユーザを早期に識別する,低障壁なアプローチが実現する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:41:13 GMT)
Graph and Sequential Neural Networks in Session-based Recommendation: A Survey [41.6] セッションベースのレコメンデーション(SR)は、ユーザの短期的な好みのキャプチャを専門とし、よりダイナミックでタイムリーなレコメンデーションを提供することを目指している。
まず、様々なSRタスクの定義を明確にし、セッションベースレコメンデーションの特徴を紹介する。
第2に,既存の手法を,逐次ニューラルネットワークとグラフニューラルネットワーク(GNN)の2つのカテゴリにまとめる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:08:05 GMT)
ANLS* -- A Universal Document Processing Metric for Generative Large Language Models [40.9] 本稿ではANLS*と呼ばれる生成モデルを評価するための新しい指標を提案する。
ANLS*メトリックは、既存のANLSメトリクスをドロップ・イン・リプレースとして拡張し、以前報告されたANLSスコアと互換性がある。
また、SFTと呼ばれる文書のプロンプトを生成する新しい手法を、LATINなどの他のプロンプト技術に対してベンチマークする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:33:29 GMT)
Noise-aware variational eigensolvers: a dissipative route for lattice gauge theories [40.8] 量子シミュレータにおける$mathbbZ$格子ゲージ理論(LGT)の基底状態構築のための新しい変分アンザッツを提案する。
これは、完全に決定論的スキームにおける散逸的かつユニタリな操作と、考慮された格子の大きさとスケールしない回路深さを組み合わせている。
非常にわずかな変動パラメータで、アンザッツは$mathbbZ$ LGTの閉じ込められた位相と分解された位相の両方のエネルギーの精度を$>!
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:02:06 GMT)
Delay as Payoff in MAB [40.7] エージェントが受信した支払いが遅延し、直接遅延の大きさに対応する古典的マルチアーム帯域幅問題(MAB)の変種について検討する。
当社の主なコントリビューションは、コストと報酬の設定の両方に関して、上と下の境界の厳格さです。
私たちの後悔は、コストシナリオと報酬シナリオの違いを強調し、コストシナリオの改善が報酬よりも重要であることを示すことです。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:52:52 GMT)
Instruct-SkillMix: A Powerful Pipeline for LLM Instruction Tuning [40.6] Instruct-SkillMixは、多様な高品質なSFTデータを作成するための自動化アプローチである。
LLaMA-3-8B-BaseはAlpacaEval 2.0で42.76%の勝利率を達成した。
Instruct-SkillMixパイプラインは柔軟性があり、他の設定に適応できる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:31:58 GMT)
DocLayLLM: An Efficient and Effective Multi-modal Extension of Large Language Models for Text-rich Document Understanding [40.4] テキストリッチドキュメント理解(テキストリッチドキュメント理解、TDU)とは、テキストコンテンツを含む文書を分析し、解釈することである。
TDU用に特別に設計された大規模言語モデル(LLM)の効率的かつ効果的なマルチモーダル拡張であるDocLayLLMを紹介する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:13:38 GMT)
Exploring Human-in-the-Loop Test-Time Adaptation by Synergizing Active Learning and Model Selection [40.1] 既存のテスト時間適応(TTA)アプローチは、ラベルのないテストデータストリームでモデルに適応することが多い。
能動的学習とモデル選択を相乗化してHILTTAにアプローチすることを提案する。
提案手法は市販のTTA手法と互換性があることを5つのTTAデータセットで示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:22:54 GMT)
Ultralight dark matter detection with levitated ferromagnets [40.0] 印加された交流磁場に対する浮遊強磁性体の応答について検討する。
既存の誘電体強磁性体は、既に軸-電子結合に匹敵する感度を持つことを示す。
将来の設定は、軸-電子カップリング、暗-光子運動混合、および軸-光子カップリングの感度の高いプローブとなる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:00:03 GMT)
Towards Real-world Event-guided Low-light Video Enhancement and Deblurring [39.9] イベントカメラは、低照度環境における画質向上のための有望なソリューションとして登場した。
これらのタスクを効果的に処理するためのエンドツーエンドフレームワークを導入します。
我々のフレームワークは、イベントやフレームからの時間情報を効率的に活用するためのモジュールを組み込んでいます。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:44:54 GMT)
HPT++: Hierarchically Prompting Vision-Language Models with Multi-Granularity Knowledge Generation and Improved Structure Modeling [39.1] 本稿では,階層型プロンプトチューニング(HPT)と呼ばれる新しい手法を提案し,構造化知識と従来の言語知識の同時モデリングを可能にする。
低レベルの即時学習のためのエンティティと属性間のペアワイズ関連をキャプチャする、関係誘導型アテンションモジュールを導入する。
全体意味論をモデル化する高レベルかつグローバルレベルのプロンプトを取り入れることで、提案された階層構造は、クロスレベルな相互リンクを偽造し、より複雑で長期的な関係を扱うようにモデルに権限を与える。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:50:28 GMT)
Learning to Decode Collaboratively with Multiple Language Models [37.3] 本稿では,複数の大規模言語モデル (LLM) に,トークンレベルで世代間をインターリーブすることで協調する手法を提案する。
復号化中のトークンレベルのコラボレーションは、各モデルの専門知識を、手元にある特定のタスクに合わせて統合することを可能にする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:31:04 GMT)
Platypus: A Generalized Specialist Model for Reading Text in Various Forms [37.0] テキスト読解のための一般化されたスペシャリストモデルであるPlatypusを提案する。
Platypusは、様々な形式のテキストを単一の統一アーキテクチャで認識できるという、両方の世界の長所を兼ね備えている。
標準ベンチマーク実験では、提案したPlatypusモデルの有効性と優位性を示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:24:51 GMT)
Vid2Robot: End-to-end Video-conditioned Policy Learning with Cross-Attention Transformers [36.5] Vid2Robotは、人間のビデオで操作タスクを入力として表現し、ロボットアクションを生成する、エンドツーエンドのビデオ条件付きポリシーである。
我々のモデルは、ビデオから人間とロボットのアクションの統一表現を学習するために、プロンプトロボット軌道対の大規模なデータセットを用いて訓練されている。
実世界のロボット上でのVid2Robotの評価を行い、人間のプロンプトビデオを用いた場合、BC-Zよりも20%以上の改善が見られた。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 23:15:11 GMT)
CL4KGE: A Curriculum Learning Method for Knowledge Graph Embedding [36.5] 知識グラフにおける3つの学習の難易度を測定するために、計量Zカウントを定義する。
この指標に基づいて,効率的なtextbfCurriculum textbfLearningに基づくトレーニング戦略である textbfCL4KGE を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:51:26 GMT)
Faithfulness Measurable Masked Language Models [35.4] NLPモデルを説明するための一般的なアプローチは、予測にどのトークンが重要であるかを表現する重要な尺度を使用することである。
そのような指標の1つは、トークンが本当に重要であるなら、それらを隠すことはモデルのパフォーマンスを悪化させる。
この研究は、これらの課題に対処する本質的に忠実度測定可能なモデルを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:37:57 GMT)
Zero-Shot Character Identification and Speaker Prediction in Comics via Iterative Multimodal Fusion [35.3] 本稿では,未注釈の漫画画像のみに基づいて文字を識別し,話者名を予測するためのゼロショット手法を提案する。
本手法ではトレーニングデータやアノテーションは必要とせず,任意のコミックシリーズで使用することができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:56:33 GMT)
PolicyLR: A Logic Representation For Privacy Policies [34.7] 我々は、プライバシポリシーの包括的な機械可読表現を提供する新しいパラダイムであるPolicyLRを提案する。
PolicyLRは、プライバシーポリシーを原子式の評価を用いて機械可読形式に変換する。
ポリシコンプライアンス,一貫性検出,プライバシ比較ショッピングという3つのプライバシタスクにおいて,ポリシLRを実証する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:27:16 GMT)
BaichuanSEED: Sharing the Potential of ExtensivE Data Collection and Deduplication by Introducing a Competitive Large Language Model Baseline [34.5] LLM(Large Language Models)の一般的な能力は、いくつかの機関によって商業秘密として扱われる広範な事前訓練データセットに大きく依存している。
我々は、その有効性と可能性を検証するために、普遍的に適用可能なデータ処理パイプラインの詳細をオープンソース化する。
BaichuanSEEDはトレーニングを通じて一貫性と予測可能性を示し、包括的なベンチマークで同等のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:08:23 GMT)
Can Unconfident LLM Annotations Be Used for Confident Conclusions? [34.2] 大規模言語モデル (LLMs) は、様々なタスクにおいて、人間と高い合意を示してきた。
信頼性駆動推論(Confidence-Driven Inference)は、LCMの信頼度インジケータを組み合わせて、どのアノテーションを収集すべきかを戦略的に選択する手法である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:03:18 GMT)
MROVSeg: Breaking the Resolution Curse of Vision-Language Models in Open-Vocabulary Semantic Segmentation [33.7] オープン語彙セマンティックセマンティックセグメンテーションのためのマルチレゾリューション・トレーニング・フレームワークを提案する。
MROVSegはスライディングウィンドウを使用して高解像度の入力を均一なパッチにスライスし、それぞれがよく訓練されたイメージエンコーダの入力サイズと一致する。
オープン語彙セマンティックセグメンテーションベンチマークにおけるMROVSegの優位性を実証する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:45:53 GMT)
MeshUp: Multi-Target Mesh Deformation via Blended Score Distillation [33.4] 複数のターゲット概念に対して3Dメッシュを変形させる手法であるMeshUpを提案する。
概念はテキストクエリ、例えば「犬」や「カメ」、インスピレーションのあるイメージとして定義することができる。
概念の影響を効果的に制御し, 新規なスコア蒸留手法を用いて混合することができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:23:18 GMT)
Alfie: Democratising RGBA Image Generation With No $$$ [33.3] 本稿では,事前学習した拡散変圧器モデルの推論時挙動を変化させ,RGBA図形の完全自動生成手法を提案する。
我々は、デザインプロジェクトや芸術シーンへのシームレスな統合のために、背景が容易に取り除かれるシャープな刈り取りを行なわずに、被験者全体の生成を強制する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:13:44 GMT)
VTON-HandFit: Virtual Try-on for Arbitrary Hand Pose Guided by Hand Priors Embedding [32.9] VTON-HandFitは手閉塞症例の外観と構造を再構成する。
手形外乱埋め込みモジュールは、手の構造パラメトリックと視覚的外観の特徴に手先をゆがめる。
モデル画像のハンドテンプレートから、構造エッジの知識をよりよく学習するために、手持ちの制約損失をカスタマイズする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:53:37 GMT)
Estimating optical vegetation indices and biophysical variables for temperate forests with Sentinel-1 SAR data using machine learning techniques: A case study for Czechia [32.2] 森林生態系をモニタリングするための現在の光学的植生指標(VIs)は,様々な用途でよく確立され,広く利用されている。
対照的に、合成開口レーダ(SAR)のデータは、雲や昼夜の画像取得による信号の侵入により、完全な時系列(TS)を備えた洞察に富んだ、体系的な森林モニタリングを提供することができる。
本研究では、SARデータを用いて、機械学習(ML)による森林の光VIs推定の代替として光学衛星データの限界に対処することを目的とする。
一般に、SARベースのVIを高精度に推定し、年間240回測定し、空間分解能を20mまで向上することができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:34:26 GMT)
Affective Visual Dialog: A Large-Scale Benchmark for Emotional Reasoning Based on Visually Grounded Conversations [31.7] 本稿では,視覚的な会話における感情の形成を理解するためのテストベッドとして,Affective Visual Dialogを紹介した。
この課題には,対話型質問回答,対話型感情予測,感情説明生成という3つのスキルが含まれる。
私たちの重要な貢献は、AffectVisDialと呼ばれる大規模なデータセットの収集です。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:22:50 GMT)
LLM4GEN: Leveraging Semantic Representation of LLMs for Text-to-Image Generation [30.9] 我々はtextbfLLM4GEN という新しいフレームワークを提案する。
特別に設計されたクロスアダプタモジュール(CAM)は、テキスト・ツー・イメージ・モデルのオリジナルのテキスト機能とLLM機能を統合する。
7000ドルの高密度プロンプトを含むDensePromptsは、テキスト・画像生成タスクの包括的な評価を提供する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:33:31 GMT)
ALIAS: DAG Learning with Efficient Unconstrained Policies [30.7] 我々は、強化学習機械を利用した因果発見の新しいアプローチであるALIASを紹介する。
本手法は,DAGを最適2次複雑度で1ステップで生成する効率的なポリシを特徴とする。
因果発見における最先端技術と比較して, ALIAS の強い性能を示す説得力のある実証的証拠を提供する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:28:50 GMT)
European Quantum Ecosystems -- Preparing the Industry for the Quantum Security and Communications Revolution [30.2] 10年も経たないうちに、この第2次量子革命は多くの産業に重大な影響を与えるだろうと期待されている。
量子コンピュータは、非対称暗号化を破る可能性のある既知の量子アルゴリズムのために、サイバーセキュリティの現状を脅かす。
量子鍵分布(QKD)とポスト量子暗号(PQC)の2つのソリューションが利用可能である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:56:13 GMT)
S-MolSearch: 3D Semi-supervised Contrastive Learning for Bioactive Molecule Search [30.1] 仮想スクリーニングのためのコントラスト学習において,分子3次元情報と親和性情報を活用する最初のフレームワークであるS-MolSearchを提案する。
S-MolSearchはラベル付きデータとラベルなしデータの両方を効率的に処理し、ラベルなしデータのソフトラベルを生成しながら分子構造エンコーダを訓練する。
構造ベースおよびリガンドベースの仮想スクリーニング手法を抜いて、0.5%、1%、5%の要素を濃縮する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:51:11 GMT)
FaceCat: Enhancing Face Recognition Security with a Unified Diffusion Model [30.1] 対面防止(FAS)と対向検出(FAD)は、顔認識システムの安全性を確保するための重要な技術であると考えられている。
本研究の目的は,1) 顔下特徴表現と2) トレーニングデータの不足という2つの主要な障害を突破することで,この目標を達成することである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:02:07 GMT)
Bandwidth-Aware and Overlap-Weighted Compression for Communication-Efficient Federated Learning [29.7] フェデレーション平均化(FedAvg)におけるスパシフィケーションなどの現在のデータ圧縮手法は、フェデレーション学習(FL)のコミュニケーション効率を効果的に向上させる。
これらの手法は、異種帯域幅と非IIDデータによるストラグラー問題やモデル性能の低下といった課題に直面する。
非IIDデータに関連する問題を軽減しつつ,通信効率の向上を目的としたFLのための帯域幅対応圧縮フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:28:27 GMT)
Splatt3R: Zero-shot Gaussian Splatting from Uncalibrated Image Pairs [29.7] Splatt3Rはポーズレスフィードフォワード方式で,立体対からの3次元再構成と新しいビュー合成を行う。
Splatt3Rは補正されていない自然画像から、カメラパラメータや深度情報を必要とせずに3Dガウススプラッターを予測できる。
Splatt3Rは512 x 512の解像度で4FPSでシーンを再構築でき、その結果のスプラッターをリアルタイムでレンダリングできる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:06:57 GMT)
Generative Verifiers: Reward Modeling as Next-Token Prediction [29.5] 本研究では,ユビキタスな次世代予測目標を用いて,検証とソリューション生成を併用したトレーニング検証手法を提案する。
標準検証器と比較して、そのような生成検証器(genRM)はLLMのいくつかの利点の恩恵を受けることができる。
我々は,アルゴリズムおよび小学校数学推論タスクにおいて,Gemmaベースの検証器を用いる場合,差別的検証器やLLM-as-a-Judgeよりも優れた性能を示すことを示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:57:45 GMT)
Large Language Models for Disease Diagnosis: A Scoping Review [29.5] 大規模言語モデル(LLM)の出現は、人工知能のパラダイムシフトを引き起こした。
この分野に注目が集まっているにもかかわらず、多くの重要な研究課題が未解決のままである。
本研究は, 疾患の種類, 関連臓器システム, 関連臨床データ, LLM技術, 既存の研究で報告されている評価方法について検討した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:06:45 GMT)
ZeroMamba: Exploring Visual State Space Model for Zero-Shot Learning [28.5] Zero-shot Learning (ZSL) は、目に見えないクラスから見えないクラスに意味的な知識を移すことによって、目に見えないクラスを認識することを目的としている。
我々はZSLを前進させるためにZeroMambaと呼ばれるパラメータ効率の高いZSLフレームワークを提案する。
ZeroMambaは、SLP(Semantic-Aware Local Projection)、GRL(Global Representation Learning)、Semantic Fusion(SeF)の3つの重要なコンポーネントで構成されている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:39:47 GMT)
DRL-Based Federated Self-Supervised Learning for Task Offloading and Resource Allocation in ISAC-Enabled Vehicle Edge Computing [28.5] Vehicle Edge Computing(VEC)は、タスクをRoad Side Unit(RSU)にオフロードすることで、この問題に対処する。
改良されたアルゴリズムは、部分的なタスクをROSにオフロードし、送信電力、CPU周波数、タスク割り当て比率を調整することでエネルギー消費を最適化する。
シミュレーションの結果,拡張アルゴリズムは省エネ,オフロード効率の向上,フェデレートSSLの精度の向上を実現している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:28:05 GMT)
NoRA: Nested Low-Rank Adaptation for Efficient Fine-Tuning Large Models [27.8] Nested Low-Rank Adaptation (NoRA) はパラメータ効率の良い微調整のための新しいアプローチである。
外部のLoRA重みを凍結し、内部のLoRA設計を使用することで、NORAはコンパクトなパラメータ空間で正確なタスク適応を可能にする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:34:49 GMT)
I-SHEEP: Self-Alignment of LLM from Scratch through an Iterative Self-Enhancement Paradigm [27.4] 大規模言語モデル(LLM)は大きな進歩を遂げているが、共通学習パラダイムはLLMを受動的情報リポジトリとして扱う。
textbfIterative textbfSelf-EntextbfHanctextbfEmtextbfEnt textbfParadigmを紹介する。
I-SHEEPはQwenモデルとLlamaモデルの両方の容量を大幅に向上させることができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:50:12 GMT)
Detecting AI Flaws: Target-Driven Attacks on Internal Faults in Language Models [27.4] 大規模言語モデル(LLM)は、人工知能の急速に発展する分野において焦点となっている。
重要な懸念は、これらのモデルの事前学習コーパス内に有毒な物質が存在することであり、不適切な出力が発生する可能性がある。
本稿では,プロンプトを最適化する代わりに,ターゲット応答を直接抽出することに焦点を当てた,ターゲット駆動型攻撃パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:12:08 GMT)
Generating $SROI^-$ Ontologies via Knowledge Graph Query Embedding Learning [26.9] 本稿では,このグラフから学習した知識を,SROI-$記述論理公理の形で記述する新しいクエリ埋め込み手法AConEを提案する。
AConEはパラメータが少なく、以前のベースラインよりも優れた結果が得られる。
我々は,公理を表現する能力が問合せ応答の結果に肯定的な影響を及ぼすことを示す包括的分析を行った。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:40:13 GMT)
MTMamba++: Enhancing Multi-Task Dense Scene Understanding via Mamba-Based Decoders [26.2] Mambaベースのデコーダを備えたマルチタスクシーン理解のための新しいアーキテクチャであるMTMamba++を提案する。
コアブロックには、セルフタスクのMambaブロックとクロスタスクのMambaブロックの2種類がある。
NYUDv2、PASCAL-Context、Cityscapesデータセットの実験では、CNNベースのメソッドとTransformerベースのメソッドよりもMTMamba++の方が優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:36:46 GMT)
Inverse-Q*: Token Level Reinforcement Learning for Aligning Large Language Models Without Preference Data [25.8] Inverse-Q*はトークンレベルの強化学習を最適化することで従来のRL手法を超越する革新的なフレームワークである。
この結果から,Inverse-Q*は従来のRLHFアプローチに代わる実用的で堅牢な代替手段であることがわかった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:43:32 GMT)
Private Gradient Estimation is Useful for Generative Modeling [25.8] そこで本研究では,サンプルをハミルトン力学で生成し,よく訓練されたネットワークから推定したプライベートデータセットの勾配を推定する手法を提案する。
我々のモデルは256x256の解像度でデータを生成することができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:46:38 GMT)
RT-Attack: Jailbreaking Text-to-Image Models via Random Token [24.6] ランダム検索を利用した2段階のクエリベースのブラックボックスアタック手法を提案する。
第1段階では、敵と標的の有害なプロンプト間の意味的類似性を最大化することにより、予備的なプロンプトを確立する。
第2段階では、この初期プロンプトを使用してアプローチを洗練し、脱獄を目的とした詳細な敵対的プロンプトを作成します。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:13:01 GMT)
PPVF: An Efficient Privacy-Preserving Online Video Fetching Framework with Correlated Differential Privacy [24.4] 高品質なオンラインビデオサービスを維持しつつ、ユーザの要求のプライバシを維持するための新しいプライバシ保存ビデオフェッチフレームワークを提案する。
信頼されたエッジデバイスを使用して、ビデオのプレフェッチとキャッシュを行い、エッジキャッシュの効率を最適化しながら、ユーザの要求のプライバシを確保する。
その結果,PPVFは高いビデオキャッシング性能を維持しつつ,ユーザの要求するプライバシを効果的に保護することを示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:03:36 GMT)
Fast and Modular Autonomy Software for Autonomous Racing Vehicles [24.2] インディ・オートマチック・チャレンジ(英語: Indy Autonomous Challenge、IAC)は、自動運転車開発を推進する国際大会である。
本稿は、ITCにおける自動運転レースに対するMIT-Pitt-RWチームのアプローチについて詳述する。
自律的なスタックを構築するために,エージェント検出,動作計画,制御に対するモジュール型かつ高速なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:57:16 GMT)
Implicit Geometry of Next-token Prediction: From Language Sparsity Patterns to Model Representations [24.2] 大規模テキストコーパス上でのNTP(Next-token Prediction)は,大規模言語モデルの学習のパラダイムとなっている。
得られたモデル表現の幾何学的特性に対する言語パターンのマッピングにNTPがどう影響するかを考察する。
合成および小規模な実言語データセットについて,本研究の成果を検証した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:46:47 GMT)
Self-supervised Topic Taxonomy Discovery in the Box Embedding Space [23.9] 本稿では,単語やトピックをボックス埋め込み空間にマッピングする,Box Embedding-based Topic Model (BoxTM) を提案する。
BoxTMは、特定のトピック間の相関に基づいて、上位のトピックを明示的に推論する。
広範囲にわたる実験により、BoxTMで学んだトピック分類の質が検証された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:19:32 GMT)
SynthDoc: Bilingual Documents Synthesis for Visual Document Understanding [23.9] 本稿では、ビジュアル文書理解(VDU)を強化するために設計された新しい合成文書生成パイプラインであるSynthDocを紹介する。
データ取得の課題と既存のデータセットの制限に対処するため、SynthDocは、一般公開されたコーパスと高度なレンダリングツールを活用して、包括的な汎用データセットを作成する。
ドナウモデルを用いて実験を行った結果,SynthDocのデータを用いて学習したモデルは,事前学習された読み出しタスクにおいて優れた性能を示し,言語的矛盾にもかかわらず,下流タスクにおいて堅牢性を維持することができた。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:31:24 GMT)
Revisiting LARS for Large Batch Training Generalization of Neural Networks [23.6] 本稿では,レイヤワイド・アダプティブ・スケーリング・比率(LARS)を用いた大規模バッチ・トレーニング手法について検討する。
我々は,初期段階における堅牢なトレーニングのために,ウォームアップをシグモイドのような関数に置き換える新しいアルゴリズムであるTime Varying LARS(TVLARS)を提案する。
TVLARSはLARSとLAMBを一貫して上回り、分類シナリオは最大2%改善している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:03:12 GMT)
Snap and Diagnose: An Advanced Multimodal Retrieval System for Identifying Plant Diseases in the Wild [22.9] 我々は,画像やテキストのプロンプトに基づいて,病気検索を支援するマルチモーダル植物病画像検索システムを開発した。
我々は、89のカテゴリで18,000枚以上の画像を含む、最大規模の植物病データセットであるPlantWildを利用している。
クロスモーダル検索は、新しいCLIPベースの視覚言語モデルによって促進される開発システムで実現されている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:23:49 GMT)
Fundus2Video: Cross-Modal Angiography Video Generation from Static Fundus Photography with Clinical Knowledge Guidance [22.9] Fundus Fluorescein Angiographyは網膜血管動態を評価し、眼疾患の診断を支援する重要なツールである。
現在のCFからFFAへの変換法は静的生成に限られている。
本稿では,スムーズでメモリ節約なフレーム・バイ・フレームFFA合成のための自己回帰型GANを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:30:49 GMT)
PMSN: A Parallel Multi-compartment Spiking Neuron for Multi-scale Temporal Processing [22.1] スパイキングニューラルネットワーク(SNN)は、脳にインスパイアされたエネルギー効率の高い計算システムを実現する大きな可能性を秘めている。
PMSN(Parallel Multi-compartment Spiking Neuron)と呼ばれる新しいスパイキングニューロンモデルを提案する。
PMSNは、複数の相互作用するサブ構造を組み込んで生物学的ニューロンをエミュレートし、サブ構造数の柔軟な調整を可能にする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:47:46 GMT)
Pitfalls and Outlooks in Using COMET [22.0] COMETのメトリクスは、機械翻訳コミュニティの足跡となった。
広く知られていないかもしれない新たな落とし穴について検討する。
この作業の目標は、コミュニティがCOMETメトリックをよりうまく活用できるようにすることです。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:03:11 GMT)
Advancing Adversarial Suffix Transfer Learning on Aligned Large Language Models [22.0] 言語モデル(LLM)は、悪意のあるユーザによる誤用による安全性上の懸念に直面している。
近年のレッドチームの取り組みは、勾配に基づく探索アルゴリズムGreedy Coordinate Gradient (GCG) を用いて、LDMをジェイルブレイクできる敵サフィックスを特定している。
本稿では,2段階の移動学習フレームワークであるDeGCGを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:38:48 GMT)
TourSynbio: A Multi-Modal Large Model and Agent Framework to Bridge Text and Protein Sequences for Protein Engineering [22.0] TourSynbio-7Bは、外部のタンパク質エンコーダを使わずにタンパク質工学タスクのために設計された大型モデルである。
TourSynbio-Agentは、突然変異解析、逆フォールディング、タンパク質の折り畳み、可視化など、さまざまなタンパク質工学タスクを実行することができるフレームワークである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:36:00 GMT)
Glauber Generative Model: Discrete Diffusion Models via Binary Classification [21.8] 離散拡散モデルの新しいクラスであるグラウバー生成モデル(GGM)を紹介する。
GGMはマルコフ連鎖を展開させ、離散トークンの共分散からサンプルにノイズトークンの列を分解する。
言語生成や画像生成において,既存の離散拡散モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:05:33 GMT)
NeuroLM: A Universal Multi-task Foundation Model for Bridging the Gap between Language and EEG Signals [21.4] 我々は,脳波を外国語として扱うことで,Large Language Models (LLMs) の機能を活用する,最初のマルチタスク基盤モデルであるNeuroLMを提案する。
我々のアプローチは、脳波信号を離散的な神経トークンにエンコードするベクトル量子化された時間周波数予測を通じて、テキスト整列型ニューラルトークンを学習することから始まります。
我々は、LLMを具体化することによって、NeuroLMは命令チューニングによって単一のモデル内で多様な脳波タスクを統合できることを初めて実証した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:07:09 GMT)
Test-based Patch Clustering for Automatically-Generated Patches Assessment [21.1] オーバーフィッティングは、パッチが実行され、テストスイートがエラーを露呈しない場合に発生するが、パッチは、実際に基盤となるバグを修正したり、テストスイートがカバーしていない新しい欠陥を導入したりする。
私たちの研究は、プログラマがレビューしなければならない妥当なパッチの数を最小限に抑え、正しいパッチを見つけるのに必要な時間を短縮することを目的としています。
我々は、xTestClusterと呼ばれる新しい軽量なテストベースのパッチクラスタリング手法を導入し、その動的挙動に基づいてパッチをクラスタリングする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:46:51 GMT)
TFDet: Target-Aware Fusion for RGB-T Pedestrian Detection [21.0] TFDet と呼ばれる多スペクトル歩行者検出のための新しい目標認識融合戦略を提案する。
TFDetは、KAISTとLLVIPの2つのマルチスペクトル歩行者ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:13:01 GMT)
Nonlinear subspace clustering by functional link neural networks [21.0] フィードフォワードニューラルネットワークに基づくサブスペースクラスタリングは、いくつかの高度なサブスペースクラスタリングアルゴリズムよりも優れたクラスタリング精度を提供することを示した。
我々は,データサンプルを非線形領域に変換するために,関数型リンクニューラルネットワークを用いる。
本稿では,線形サブスペースクラスタリング手法と関数型リンクニューラルネットワークサブスペースクラスタリング手法を組み合わせた凸結合サブスペースクラスタリング手法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 05:26:14 GMT)
A Comprehensive Survey of Cross-Domain Policy Transfer for Embodied Agents [20.8] ロボット学習と具現化されたAIの急成長は、大量のデータに対する需要の高まりを引き起こしている。
しかし、コストのかかるデータ収集プロセスと厳格な安全要件のために、ターゲットドメインから十分なバイアスのないデータを集めることは、依然として課題である。
我々は、既存のクロスドメインポリシー転送手法の体系的なレビューを行う。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:05:38 GMT)
Learning Differentially Private Diffusion Models via Stochastic Adversarial Distillation [20.6] DP-SADは, 逆蒸留法により個人拡散モデルを訓練する。
画像の質を向上するために,画像が教師と学生のどちらであるかを識別する識別器を導入する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:29:29 GMT)
Pano2Room: Novel View Synthesis from a Single Indoor Panorama [20.3] Pano2Roomは、1枚のパノラマ画像から高品質な3D屋内シーンを自動的に再構築するように設計されている。
鍵となるアイデアは、最初に入力パノラマから予備メッシュを構築し、パノラマRGBDインペイントを使用して反復的にこのメッシュを洗練することである。
精巧なメッシュは3次元ガウス散乱場に変換され、収集された擬似ノベルビューで訓練される。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:21:02 GMT)
Distance-Forward Learning: Enhancing the Forward-Forward Algorithm Towards High-Performance On-Chip Learning [20.0] バックプロパゲーション(BP)の限界に対処する局所学習手法として,フォワードフォワード(FF)アルゴリズムが最近提案されている。
距離メトリック学習を用いてFFを再構成し、教師付き視覚タスクにおけるFF性能を改善するための距離フォワードアルゴリズム(DF)を提案する。
CIFAR-10では88.2%、CIFAR-100では59%、SVHNでは95.9%、ImageNetteでは82.5%である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:01:43 GMT)
OctFusion: Octree-based Diffusion Models for 3D Shape Generation [19.9] OctFusionは1台のNvidia 4090 GPUで2.5秒で任意の解像度で3D形状を生成することができる。
OctFusionは、テクスチャメッシュ生成のための高品質なカラーフィールドと、テキストプロンプト、スケッチ、またはカテゴリラベル上の高品質な3D条件付き形状を生成することで、拡張可能で柔軟性がある。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:55:40 GMT)
An Investigation on The Position Encoding in Vision-Based Dynamics Prediction [19.7] RGB画像と単純なオブジェクト記述を利用してオブジェクト状態を予測するビジョンベースの動的予測モデルは、環境のミスアライメントによって挑戦された。
本稿では,出力特徴を抽象化するオブジェクトとしてバウンディングボックスを用いて位置情報を符号化するプロセスと必要な条件について検討する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:02:03 GMT)
PAT: Pruning-Aware Tuning for Large Language Models [19.6] 大規模言語モデルは言語タスク、特に事前訓練後の教師付き微調整において優れている。
伝統的なポストホットプルーニングは、しばしばパフォーマンスを著しく損なう。
モデル冗長性を排除するために,Pruning-Aware Tuning(PAT)パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:04:14 GMT)
SelectLLM: Can LLMs Select Important Instructions to Annotate? [19.6] SelectLLMは、未実装の命令を選択的にアノテートするフレームワークである。
AlpacaEval2 と MT-Bench で評価し,最先端手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:57:07 GMT)
muPRL: A Mutation Testing Pipeline for Deep Reinforcement Learning based on Real Faults [19.3] まず,レポジトリマイニングによって得られた実RL断層の分類について述べる。
次に、そのような実断層から派生した突然変異演算子を示し、ツール muPRL に実装する。
実験結果から, muPRLは弱い試験発電機と強い判別に有効であることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:45:13 GMT)
SpikingSSMs: Learning Long Sequences with Sparse and Parallel Spiking State Space Models [19.0] 長いシーケンス学習のためのスパイキング状態空間モデル(SpikingSSM)を開発した。
樹状ニューロン構造にインスパイアされた我々は、神経力学を元のSSMブロックと階層的に統合する。
そこで本研究では,リセット後の膜電位を正確に予測し,学習可能なしきい値に適合する軽量サロゲート動的ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:35:49 GMT)
Predictive Modeling of Flexible EHD Pumps using Kolmogorov-Arnold Networks [18.9] 我々は,コルモゴロフ・アルノルドネットワークを用いて,フレキシブル電気流体ポンプの圧力と流量を予測する新しい手法を提案する。
コルモゴロフ・アルノルドの表現定理に着想を得たカンは、固定活性化関数を学習可能なスプラインベースの活性化関数に置き換える。
カンは予測精度が優れ、平均正方形誤差は12.186、圧力と流量の予測は0.001である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:44:20 GMT)
Step-by-Step Unmasking for Parameter-Efficient Fine-tuning of Large Language Models [18.9] パラメータ効率細調整(PEFT)のクラスは、モデルのパラメータのごく一部だけを選択的に微調整することで、計算上の課題を軽減することを目的としている。
我々はパラメータの重要度を連続的に計算し,パラメータを動的にアンマスクする新しいPEFT法である$textID3$を紹介した。
解析的に、$textID3$は勾配更新数を2倍に減らし、計算効率が向上することを示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:56:11 GMT)
On Stateful Value Factorization in Multi-Agent Reinforcement Learning [18.9] そこで我々はDuelmixを紹介した。Duelmixは、各エージェント毎のユーティリティ推定器を学習し、性能を向上する。
StarCraft IIのマイクロマネジメントとBox Pushingタスクの実験は、私たちの直感の利点を示しています。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:45:26 GMT)
ML-EAT: A Multilevel Embedding Association Test for Interpretable and Transparent Social Science [18.7] 本研究はML-EAT(Multilevel Embedding Association Test)を紹介する。
ML-EATは従来のEAT測定の曖昧さと難易度の問題に対処している。
本研究は,ML-EATを用いて,埋め込み型アソシエーションテストの9つの可能性について,EATパターンの分類を定義した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 20:05:59 GMT)
Polyp SAM 2: Advancing Zero shot Polyp Segmentation in Colorectal Cancer Detection [18.6] ポリープ分画は大腸癌の早期発見と診断において重要な役割を担っている。
最近、Meta AI Researchは、いくつかのセグメンテーションタスクで有望なパフォーマンスを示す一般的なセグメンテーションモデル2(SAM2)をリリースした。
そこで本論文では,各種刺激条件下でのセグメンテーションポリプにおけるSAM2の性能評価を行った。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:00:53 GMT)
STD-PLM: Understanding Both Spatial and Temporal Properties of Spatial-Temporal Data with PLM [18.6] STD-PLMは時空間予測と計算処理の両方を実装できる。
STD-PLMは、明示的に設計された空間的および時間的トークン化器を通して空間的時間的相関を理解する。
STD-PLMは予測タスクと計算タスクの競合性能と一般化能力を示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:50:50 GMT)
Probabilistic Forecasting with Stochastic Interpolants and Föllmer Processes [18.3] 生成モデルに基づく動的システムの確率的予測のためのフレームワークを提案する。
このSDEのドリフトと拡散係数は訓練後に調整できることを示し、推定誤差の影響を最小限に抑える特定の選択がF"ollmerプロセスを与えることを示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:42:55 GMT)
Correntropy-Based Improper Likelihood Model for Robust Electrophysiological Source Imaging [18.3] 既存のソースイメージングアルゴリズムは、観測ノイズに対するガウスの仮定を利用して、ベイズ推定の確率関数を構築する。
脳活動の電磁的測定は、通常、様々な人工物に影響され、観測ノイズの非ガウス分布につながる可能性がある。
非ガウス雑音に対して頑健な新しい確率モデルを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:54:15 GMT)
SiCP: Simultaneous Individual and Cooperative Perception for 3D Object Detection in Connected and Automated Vehicles [18.2] 連結車両と自動車両の協調認識は、伝統的に2台以上の車両の特徴マップの融合によって達成される。
この欠点は、車両資源が2つの知覚モデルを同時に使用するには不十分なため、協調的な知覚の採用を妨げる。
我々は、最先端のスタンドアロン認識バックボーンを幅広くサポートする汎用フレームワークである、同時個人協調知覚(SiCP)を提示する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:33:51 GMT)
Adaptive Fusion of Radiomics and Deep Features for Lung Adenocarcinoma Subtype Recognition [17.9] 肺腺癌 (LUAD) は低用量CT検診技術が出現して以来, 発見が進んでいる。
臨床的には, 浸潤性LUAD (pre-invasive LUAD) は定期的なフォローアップケアを必要とするが, 浸潤性LUAD (invasive LUAD) は癌亜型に基づく適切な肺癌切除を即時行う必要がある。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:47:47 GMT)
MegActor-$Σ$: Unlocking Flexible Mixed-Modal Control in Portrait Animation with Diffusion Transformer [17.9] MegActor-$Sigma$は混合モード条件拡散変換器(DiT)である
本稿では,視覚と音声の制御強度のバランスをとるためのモダリティ・デカップリング・コントロール(Modality Decoupling Control)のトレーニング戦略を提案する。
実験では、鮮明なポートレートアニメーションの生成における我々のアプローチの優位性を実証し、プライベートデータセットでトレーニングされた従来の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:31:47 GMT)
Adapting Segment Anything Model to Multi-modal Salient Object Detection with Semantic Feature Fusion Guidance [17.8] マルチモーダル・サリアン・オブジェクト検出(SOD)のためのSegment Anything Model(SAM)の強力な特徴表現とゼロショット一般化能力を探求し活用するための新しいフレームワークを提案する。
アンダーラインSAMとサブラインマンティックファウンダリナールファウンダリナールグダンクンダリナール(サマン)を併用して開発する。
画像エンコーダでは,マルチモーダルSAMをマルチモーダル情報に適用するためのマルチモーダルアダプタが提案されている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:47:31 GMT)
Force-Guided Bridge Matching for Full-Atom Time-Coarsened Dynamics of Peptides [17.6] そこで本研究では,まず物理前処理をブリッジマッチングに組み込んだ実力誘導型ブリッジマッチングモデルFBMを提案する。
我々のよく設計された中間力場の誘導により、FBMは余分なステップなしで直接推論によりボルツマン様の分布を目標にすることができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:07:27 GMT)
Pre-training Everywhere: Parameter-Efficient Fine-Tuning for Medical Image Analysis via Target Parameter Pre-training [17.4] ターゲット事前学習(TPP)に基づく簡易かつ効果的な微調整フレームワークを提案する。
TPPはPEFTの前にこれらのターゲットパラメータを事前訓練するための追加段階を含む。
TPPは既存のPEFT手法に容易に統合でき、性能が大幅に向上する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:48:46 GMT)
Mamba2MIL: State Space Duality Based Multiple Instance Learning for Computational Pathology [17.3] 本稿では,Mamba2MILと呼ばれる新しいマルチインスタンス学習フレームワークを提案する。
Mamba2MILは順序関係と順序に依存しない特徴を利用しており、配列情報の最適部分の利用をもたらす。
私たちは、複数のデータセットにまたがって広範な実験を行い、ほぼすべてのパフォーマンス指標の改善を実現しています。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:01:19 GMT)
When Fairness Meets Privacy: Exploring Privacy Threats in Fair Binary Classifiers via Membership Inference Attacks [17.2] 本研究では,公平度差分結果に基づく公平度向上モデルに対する効率的なMIA手法を提案する。
また、プライバシー漏洩を緩和するための潜在的戦略についても検討する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:25:58 GMT)
Dataset Scale and Societal Consistency Mediate Facial Impression Bias in Vision-Language AI [17.1] 43のCLIP視覚言語モデルを用いて、人間の顔の印象バイアスを学習するかどうかを検証した。
社会全体でバイアスが共有される度合いがCLIPモデルに反映される度合いを予測するのはこれが初めてである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:57:45 GMT)
EX-DRL: Hedging Against Heavy Losses with EXtreme Distributional Reinforcement Learning [17.0] 分散強化学習(DRL)における一般的なアプローチは、特定のレベルでの損失分布の量子化をQR(Quantile Regression)を用いて学習することである。
この方法は、直接量的リスク評価(VaR)や条件的リスク評価(CVaR)などのオプションヘッジにおいて特に有効である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:59:25 GMT)
How will advanced AI systems impact democracy? [16.9] 生成的人工知能が民主的プロセスに与える影響について論じる。
我々は、AIが選挙のような民主的なメカニズムを不安定化または支援するためにどのように使われるか尋ねる。
最後に、AIが民主主義の原則を強化するか弱めるかについて議論する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:05:59 GMT)
Inference-Time Rule Eraser: Fair Recognition via Distilling and Removing Biased Rules [16.9] 機械学習モデルは、しばしば性別、人種、その他の社会的属性などのバイアスのある特徴に基づいて予測を行う。
この問題に対処する従来のアプローチは、公正さを意識した最適化目標を持つニューラルネットワークの再トレーニングや微調整を含む。
フェアネス問題に対処する新しい手法である推論時ルール消去器(Eraser)を紹介する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:43:10 GMT)
Evaluating the Energy Consumption of Machine Learning: Systematic Literature Review and Experiments [16.6] 機械学習(ML)のエネルギー消費をモニタリングし、理解し、最適化することは、MLのエネルギー使用量を評価する必要がある様々な理由である。
全てのユースケースでこの疑問に答えられる普遍的なツールは存在しておらず、特定のユースケースのエネルギー消費を評価する方法についても意見の相違があるかもしれない。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:08:06 GMT)
A Functional Trade-off between Prosodic and Semantic Cues in Conveying Sarcasm [16.4] 発話とキーフレーズの韻律的特徴を3つの異なる皮肉カテゴリーに分けて分析した。
その結果, 意味論的意味が有意なフレーズでは, 意味論的意味が意味論的意味から明らかでない場合よりも, 韻律的手がかりは関連性が低いことがわかった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:07:37 GMT)
Cross-subject Brain Functional Connectivity Analysis for Multi-task Cognitive State Evaluation [16.2] 本研究は脳機能と脳波信号とを併用し,複数の被験者の脳領域の関連性を把握し,リアルタイム認知状態を評価する。
分析と評価のために30件の被験者が取得され, 内的対象, 対人的対象, ジェンダー的基盤となる脳機能接続など, さまざまな視点で解釈される。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:51:59 GMT)
Continuity of entropies via integral representations [16.0] 量子相対エントロピーのフレンケルの積分表現は、量子情報測度に対する連続性境界を導出する自然な枠組みを提供することを示した。
条件付きエントロピーの厳密な連続性関係は、条件付き系上で等しい限界を持つ場合において、この特別な場合においてワイルドの予想を解く場合、(2)量子エントロピー上のファンヌ=オーデナート不等式のより強いバージョン、(7)「フィルター付き」相対エントロピー距離の連続性に関するクリスティール、フェラーラ、ランシエンによる予想の証明である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:44:52 GMT)
Brain-inspired Artificial Intelligence: A Comprehensive Review [16.0] レビューは、現代のAIモデル、すなわち脳にインスパイアされた人工知能(BIAI)を形成する多様なデザインインスピレーションを探求する
本稿では,BIAIアプローチを物理的構造に着想を得たモデルと人間行動に着想を得たモデルに分類する。
さまざまなBIAIモデルが優れている実世界のアプリケーションについて検討し、その実用的メリットとデプロイメント上の課題を強調します。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:49:50 GMT)
Learning effective pruning at initialization from iterative pruning [15.8] 本稿では、トレーニングコストを削減するために、エンドツーエンドのニューラルネットワークに基づくPaI手法を提案する。
提案手法は, 既存手法よりも高スパース性設定で優れる。
ニューラルネットワークを用いた最初のPaI手法として、このアプローチに影響を与える要因を検証するために広範な実験を行う。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:17:52 GMT)
DIFR3CT: Latent Diffusion for Probabilistic 3D CT Reconstruction from Few Planar X-Rays [15.8] DIFR3CTは平面X線観測から可塑性CT体積を生成する3次元潜時拡散モデルである。
本研究は,DIFR3CTが従来の画素レベルにおいて,近年のスパースCT再建ベースラインより優れていることを示す実験である。
また,DIFR3CTはモンテカルロサンプリングによる不確実な定量化をサポートし,再現信頼性を計測する機会を提供することを示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:58:08 GMT)
OMEGAS: Object Mesh Extraction from Large Scenes Guided by Gaussian Segmentation [15.8] 大きな場面から特定の物体を正確に再構築することは困難である。
現在のシーン再構築技術は、しばしばオブジェクトの詳細テクスチャが失われる。
本稿では,ガウシアンがガイドした大規模シーンからオブジェクト抽出を行う OMEGAS というフレームワークを提案する。
本研究では,大規模シーンから,定量的かつ定性的に,特定のターゲットを正確に再構築できることを実証する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 22:09:19 GMT)
Relation Also Knows: Rethinking the Recall and Editing of Factual Associations in Auto-Regressive Transformer Language Models [15.7] 自己回帰変換言語モデル(LM)における事実関連の記憶とリコールが注目されている。
ほとんどの編集作業は、主に主題知識に焦点を当てた既存の知識リコールの解釈の指導の下で知識編集を行う。
本研究では,トランスフォーマーLMの知識リコールを推論中に解釈し,過度な一般化を避けるために知識編集に適用する,新たな関係性に着目した視点を見いだす。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:22:02 GMT)
Feature Representations for Automatic Meerkat Vocalization Classification [15.6] 本稿では,自動メエルカット発声解析のための特徴表現について検討する。
2つのデータセットを対象としたコールタイプ分類研究により、人間の音声処理のために開発された特徴抽出法が、自動メエルカット呼分析に効果的に活用できることが明らかになった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:51:51 GMT)
FERI: A Multitask-based Fairness Achieving Algorithm with Applications to Fair Organ Transplantation [15.5] 本研究は, 肝移植患者の移植失敗リスクの公平な予測のために, Equitable Rate of Improvement in Multitask Learning (FERI) アルゴリズムを用いてフェアネスを紹介する。
FERIは、学習率のバランスとトレーニングプロセスにおけるサブグループ支配の防止により、サブグループ損失を抑える。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:58:09 GMT)
AlphaForge: A Framework to Mine and Dynamically Combine Formulaic Alpha Factors [14.8] 本稿では,アルファ因子マイニングと因子組み合わせのための2段階のアルファ生成フレームワークAlphaForgeを提案する。
実世界のデータセットを用いて行った実験により,我々の提案したモデルは,定式的アルファファクターマイニングにおいて,同時代のベンチマークより優れていることが示された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:32:50 GMT)
UNA: Unifying Alignments of RLHF/PPO, DPO and KTO by a Generalized Implicit Reward Function [14.7] 我々は、RLHF/PPO、DPO、KTOを統一するtextbfUNified textbfAlignment (UNA)を提案する。
この新たな報酬モデルと最適ポリシーのマッピングにより、UNAは1。
RLHF/PPOの性能は、RL微調整プロセスの単純化、安定化、高速化、メモリ負荷の低減を図りながら向上する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:04:07 GMT)
Sapiens: Foundation for Human Vision Models [14.7] サピエンス(Sapiens)は、4つの基本的人間中心の視覚タスクのモデル群である。
我々のモデルは1Kの高分解能推論をサポートし、個々のタスクに容易に適応できる。
我々は、人間の画像のキュレートされたデータセット上での自己教師付き事前訓練が、多種多様な人間中心のタスクのパフォーマンスを著しく向上させるのを観察する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:31:42 GMT)
Universal Time-Series Representation Learning: A Survey [14.3] 時系列データは、現実世界のシステムやサービスのあらゆる部分に存在する。
ディープラーニングは、時系列データから隠れたパターンや特徴を抽出する際、顕著な性能を示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:45:07 GMT)
Multilingual Arbitrage: Optimizing Data Pools to Accelerate Multilingual Progress [14.2] 与えられた言語に対する複数のモデル間の性能変動を生かした「多言語仲裁」を導入する。
我々は、多言語仲裁に切り替える際に、すべての言語で平均される勝利率を最大56.5%向上させることを観察する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:07:15 GMT)
FastTextSpotter: A High-Efficiency Transformer for Multilingual Scene Text Spotting [14.1] 本稿では,Swin Transformerの視覚バックボーンとTransformer-Decoderアーキテクチャを統合したFastTextSpotterを提案する。
FastTextSpotterは、通常のテキストのICDAR2015や任意の形のテキストのCTW1500、TotalTextなど、複数のデータセットで検証されている。
以上の結果から,FastTextSpotterは多言語シーンテキストの検出と認識において,より優れた精度を実現することが示唆された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:28:41 GMT)
CoopASD: Cooperative Machine Anomalous Sound Detection with Privacy Concerns [13.7] 産業用モノのインターネット(Industrial Internet of Things, IIoT)における最も有望な応用の1つとして、ASD(Machine Anomalous Sound Detection)が登場した。
そこで我々は,各工場がローカルデータセット上でASDモデルをトレーニングし,中央サーバが定期的にこれらのローカルモデルを集約する,CoopASDという新しいフレームワークを提案する。
集中的な設定でトレーニングされた従来の最先端(SOTA)モデルと比較して、CoopASDは、無視可能な0.08%の劣化を伴う競争結果を示している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:07:03 GMT)
StyleSpeech: Parameter-efficient Fine Tuning for Pre-trained Controllable Text-to-Speech [13.7] StyleSpeechは、合成音声の自然性と精度を高める新しいテキスト音声合成システムである。
既存のTS技術に基づいて、StyleSpeechには独自のStyle Decorator構造が組み込まれており、ディープラーニングモデルでスタイルと音素の特徴を同時に学習することができる。
LoRAは、事前訓練されたモデルにおけるスタイル機能の効率的な適応を可能にする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 00:37:07 GMT)
Nuance Matters: Probing Epistemic Consistency in Causal Reasoning [13.7] 因果推論の微妙な差異を伴う中間体を識別する際の大規模言語モデルの自己整合性について検討する。
本稿では,この領域で大規模言語モデルを評価するための新しいメトリクスセットを提案する。
我々の研究は、因果推論に関わる微粒な中間体に対する自己整合性を調べることによって、AI研究における重要なギャップを埋める。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:42:34 GMT)
Trust and ethical considerations in a multi-modal, explainable AI-driven chatbot tutoring system: The case of collaboratively solving Rubik's Cube [13.6] 高校のAI教育における著名な倫理的問題は、データのプライバシー、情報漏洩、虐待的言語、公平性である。
本稿では,マルチモーダル・コラボレーティブ・プラットフォームにおける倫理的かつ信頼性の高い懸念に対処するために構築された技術コンポーネントについて述べる。
データプライバシでは、子どもや親、教師のインフォームドコンセントが、管理されるデータの中心にあることを確実にしたいと思っています。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:09:18 GMT)
Listen, Disentangle, and Control: Controllable Speech-Driven Talking Head Generation [13.1] 本稿では,一般のトーキング・フェイス・ジェネレーションと区別するワンショットトーキング・ヘッド・ジェネレーション・フレームワーク(SPEAK)を提案する。
本稿では,人間の顔の特徴を3つの潜在空間に分離するIRFD法を提案する。
次に、音声コンテンツと顔の潜時符号を1つの潜時空間に修正する顔編集モジュールを設計する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:44:56 GMT)
Experimental Quantum Byzantine Agreement on a Three-User Quantum Network with Integrated Photonics [13.1] 量子通信ネットワークをスケーラブルで費用効率のよい方法で構築することは、広く普及するのに不可欠である。
そこで我々は,ブラッグ反射導波路量子源を極性に統合した完全連結ネットワークを構築した。
プライベートアンプリフィケーションの必要性を回避した不完全な鍵を用いた、ソース非依存の量子デジタルシグネチャの最初の実験的実装を提供する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:52:38 GMT)
Tractable Equilibrium Computation in Markov Games through Risk Aversion [13.0] リスク-逆量子応答平衡(RQE)は,すべての$n$プレーヤ行列と有限ホリゾンマルコフゲームで計算可能であることを示す。
RQEは下層のゲーム構造とは独立であり、エージェントのリスク回避度と有界有理性にのみ依存する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:31:50 GMT)
Tora: Trajectory-oriented Diffusion Transformer for Video Generation [12.8] Toraは、テキスト、視覚、および軌跡条件を同時に統合する最初のトラジェクトリ指向のDiTフレームワークである。
我々の設計はDiTのスケーラビリティとシームレスに一致し、様々な期間、アスペクト比、解像度で映像コンテンツのダイナミクスを正確に制御できる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:14:16 GMT)
BEYOND DIALOGUE: A Profile-Dialogue Alignment Framework Towards General Role-Playing Language Model [12.6] 大規模言語モデル(LLM)の急速な進歩はロールプレイングに革命をもたらし、一般的なロールプレイングモデルの開発を可能にした。
現在のロールプレイングトレーニングには2つの大きな問題がある: (I) 特定のシナリオに対する対話トレーニングを促すために事前に定義されたロールプロファイルを使用することで、対話とプロファイルの間に矛盾や矛盾が生じ、トレーニングバイアスが生じる。
我々はこれらのハードルを克服するために、DIALOGUEと呼ばれるシンプルで効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:58:39 GMT)
Intertwined Biases Across Social Media Spheres: Unpacking Correlations in Media Bias Dimensions [12.6] メディアバイアスは、ステレオタイプを強化し、社会的分裂を悪化させることによって、公共の認知を著しく形作る。
われわれは過去5年間にYouTubeとRedditから収集された新しいデータセットを紹介した。
私たちのデータセットには、幅広いバイアス次元にわたるYouTubeコンテンツの自動アノテーションが含まれています。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:03:42 GMT)
PRODIGy: a PROfile-based DIalogue Generation dataset [12.6] コミュニケーションスタイル, 伝記, パーソナリティなど, 各対話が可能なすべての話者表現と整合する新たなリソースを提案する。
このフレームワークは、複数のプロファイル構成を持つ生成言語モデルを使用して構築されたいくつかのベースラインをテストすることができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:20:57 GMT)
CSPs with Few Alien Constraints [12.3] CSP$(mathcalA cup mathcalB)$ ここで$mathcalA$は構造、$mathcalB$は異方構造である。
我々は、以前分類の試みを免れたいくつかのよく研究された問題に対して、接続を確立し、転送可能な複雑性結果を得る。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:26:53 GMT)
Dr.E Bridges Graphs with Large Language Models through Words [12.2] 本稿では,LLMグラフアライメントのためのエンドツーエンドのモダリティアライメントフレームワークについて紹介する。
提案手法は LLM とのトークンレベルアライメントを容易にするために設計されており,グラフの内在的な '' を理解可能な自然言語に効果的に翻訳することができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:07:27 GMT)
Pathfinding with Lazy Successor Generation [12.0] 位置のみを付与し,エッジを暗黙的に定義するパスフィンディング問題について検討する。
単純な構造にもかかわらず、この問題は膨大な数の位置で非自明になる。
そこで我々は,LaCAS*アルゴリズムを提案する。これは,全ての後継を一度に生成するのではなく,探索が進むにつれて徐々に後継を生成できる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 23:25:25 GMT)
In-ear ECG Signal Enhancement with Denoising Convolutional Autoencoders [11.9] 耳内の心電図記録は、小さな振幅と他の生理的信号の存在によって大きなノイズに悩まされることが多い。
本研究は, よりクリーンなECG出力を生成するため, 内部記録からのECG情報を高めるための畳み込み自己符号化器を開発した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:50:57 GMT)
LLM Defenses Are Not Robust to Multi-Turn Human Jailbreaks Yet [11.8] マルチターンヒトジェイルブレイクによって重大な脆弱性が発見され,HarmBenchの攻撃成功率(ASR)は70%を超えた。
我々はこれらの結果を537個のマルチターンジェイルブレイクにまたがる2,912個のプロンプトのデータセットであるMHJ(Multi-Turn Human Jailbreaks)にコンパイルする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:33:30 GMT)
DiffuseHigh: Training-free Progressive High-Resolution Image Synthesis through Structure Guidance [11.4] テキストから画像への拡散モデルのような大規模生成モデルは、様々な領域で広く注目を集めている。
既存の大規模拡散モデルでは、最大1K解像度の画像を生成できる。
本稿では,高分解能画像の生成を導くために,生成した低分解能画像を完全に活用する新しいプログレッシブアプローチを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 05:46:06 GMT)
Breaking-Good: Explaining Breaking Dependency Updates with Build Analysis [11.4] 依存関係の更新は、新しい依存関係バージョンが既存のクライアントコードと互換性のない変更を導入したときに、コンパイルエラーを引き起こすことが多い。
Breaking-Goodは、更新を壊すための説明を自動的に生成するツールです。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:22:05 GMT)
GenFormer -- Generated Images are All You Need to Improve Robustness of Transformers on Small Datasets [11.3] 我々は、生成した画像を利用したデータ拡張戦略であるGenFormerを提案し、小型画像分類タスクにおける変換器の精度とロバスト性を改善する。
総合評価では、Tiny ImageNetの新たなテストセットとして、Tiny ImageNetV2, -R, -Aを提案する。
我々は,訓練データに制限のある困難条件下でのアプローチの有効性を実証し,精度と堅牢性の両方において有意な改善が示された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 05:54:42 GMT)
Query-by-Example Keyword Spotting Using Spectral-Temporal Graph Attentive Pooling and Multi-Task Learning [11.2] 本稿では,スペクトル時間減衰グラフプーリングとマルチタスク学習を利用したQbyE (Query-by-Example) KWSシステムを提案する。
本フレームワークは,QbyE KWSタスクに対する話者不変および言語不変の埋め込みを効果的に学習することを目的としている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:44:57 GMT)
Sewer Image Super-Resolution with Depth Priors and Its Lightweight Network [11.1] クイックビュー(QV)技術は下水道システム内の欠陥を検出する主要な方法である。
超解像度は画像品質を改善する効果的な方法であり、様々な場面で応用されている。
本研究では, DSRNet で表される新しい深層誘導参照型超解法フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:34:00 GMT)
General-Kindred Physics-Informed Neural Network to the Solutions of Singularly Perturbed Differential Equations [11.1] 我々は,Singular Perturbation Differential Equations(SPDE)の解法として,GKPINN(General-Kindred Physics-Informed Neural Network)を提案する。
この手法は, 境界層の事前知識を方程式から利用し, 境界層を近似するPINNを支援する新しいネットワークを確立する。
GKPINNは,確立したPINN法と比較して,2~4桁の誤差を2~4桁に削減し,大幅な性能向上を実現している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:03:22 GMT)
Characterizing Physician Referral Networks with Ricci Curvature [11.1] 本稿では,ネットワークの幾何学的トポロジカルな特性である曲率の新しい応用法をPhysian Referral Networksに導入する。
ネットワーク構造の表現力で知られているForman-RicciとOllivier-Ricciの曲率測定は,医療効果の変動を検出する上で有望な指標であることがわかった。
我々はまた、Ricci曲率やその他のネットワーク機能を利用したオープンソースツールであるAPPARENTを、地域物理学的参照ネットワーク構造、地域国勢調査データ、医療効果、患者結果の相関関係を調べるために提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:20:35 GMT)
Compressed Federated Reinforcement Learning with a Generative Model [11.1] 強化学習は近年、前例のない人気を得たが、それでもサンプルの非効率さに悩まされている。
この課題に対処するため、フェデレーション強化学習(FedRL)が出現し、エージェントは局所的な推定を集約することで単一のポリシーを協調的に学習する。
通信効率のよいFedRL手法であるCompFedRLを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:12:42 GMT)
Investigating Coverage Criteria in Large Language Models: An In-Depth Study Through Jailbreak Attacks [10.9] 本稿では,ニューラルアクティベーション機能を利用して,ジェイルブレイク攻撃をリアルタイムに検出するための革新的なアプローチを提案する。
提案手法は,LLMを組み込んだ将来のシステムにおいて,堅牢なリアルタイム検出機能を実現することを約束する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:14:21 GMT)
Unlocking Potential in Pre-Trained Music Language Models for Versatile Multi-Track Music Arrangement [10.7] シンボリック・ミュージック・モデルの微調整を可能にする一貫したシーケンス・ツー・シーケンス・フレームワークを提案する。
提案手法は,タスク固有のベースラインよりも高い音質が得られることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:18:51 GMT)
Alternating Minimization Schemes for Computing Rate-Distortion-Perception Functions with $f$-Divergence Perception Constraints [10.6] 離散メモリレスソースに対するRDPF(Ralse-Distortion-Perception Function)の計算について検討した。
最適パラメトリック解を特徴付ける。
歪みと知覚制約について十分な条件を提供する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:50:12 GMT)
SCAN-Edge: Finding MobileNet-speed Hybrid Networks for Diverse Edge Devices via Hardware-Aware Evolutionary Search [10.5] 我々は,多種多様なエッジデバイスに対応するために,自己認識,畳み込み,アクティベーションを探索する統一NASフレームワークを提案する。
SCAN-Edgeは、サンプリングプロセスを高速化するために、検索空間の品質を改善するハードウェア対応の進化アルゴリズムに依存している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 20:39:09 GMT)
Channel-wise Influence: Estimating Data Influence for Multivariate Time Series [10.5] 影響関数は、トレーニングデータが削除または修正されたときのモデルパラメータや関連する関数への影響を測定する。
MTSにおける異なるチャネルの影響を推定できる最初の方法であるチャネルワイド・インフルエンス関数を提案する。
MTSにおけるチャネルの影響を推定するために,この影響関数をどのように利用できるかを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:30:18 GMT)
Drone-assisted Road Gaussian Splatting with Cross-view Uncertainty [10.4] 3D Gaussian Splatting (3D-GS)は、ニューラルレンダリングにおいて画期的な進歩を遂げた。
大規模な道路シーンレンダリングの一般的な忠実度は、入力画像によって制限されることが多い。
カービューのアンサンブルに基づくレンダリングの不確実性と空中画像とのマッチングにより、3D-GSにクロスビューの不確実性を導入する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:59:55 GMT)
How to Train Text Summarization Model with Weak Supervisions [10.3] 本稿では,複雑な目的を単純なタスクに分解し,各タスクの監視信号を生成する手法を提案する。
そして、これらの監視信号を管理可能な形式に統合し、簡単に学習することができる。
実験結果から,本手法はCNNとDailyMailのデータセットで極めて良好に動作することがわかった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:35:51 GMT)
Variational Autoencoding of Dental Point Clouds [10.1] 本稿では,歯のメッシュと点雲の広範なコレクションであるFDI 16データセットを紹介する。
本稿では,変分FoldingNet(VF-Net)という,点群に対する完全確率的変分オートエンコーダを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:23:51 GMT)
Prompt-Softbox-Prompt: A free-text Embedding Control for Image Editing [10.1] テキスト埋め込みの絡み合いと不透明さは、正確な画像編集を実現する上で重要な課題である。
PSP (Prompt-Softbox-Prompt) と呼ばれる自由テキスト埋め込み制御方式を用いた新しい画像編集手法を提案する。
PSPは、クロスアテンション層にテキスト埋め込みを挿入または追加し、Softboxを使用してセマンティックインジェクションの特定の領域を定義し制御することで、正確な画像編集を可能にする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:59:59 GMT)
Diffusion based Semantic Outlier Generation via Nuisance Awareness for Out-of-Distribution Detection [9.9] アウト・オブ・ディストリビューション(OOD)検出は、最近、合成OODデータセットによるトレーニングを通じて有望な結果を示している。
本稿では, 難解な外乱を生じさせる新しいフレームワークであるセマンティック外乱生成手法(SONA)を提案する。
提案手法はSONAガイダンスを取り入れ,IDサンプルの意味領域とニュアンス領域を分離的に制御する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:52:44 GMT)
Unboxing Occupational Bias: Grounded Debiasing of LLMs with U.S. Labor Data [9.9] 大規模言語モデル(LLM)は、社会的バイアスを継承し増幅する傾向がある。
LLMバイアスは、不公平な慣行をもたらし、社会的不平等を悪化させる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:11:32 GMT)
SiHGNN: Leveraging Properties of Semantic Graphs for Efficient HGNN Acceleration [9.9] 不均一グラフニューラルネットワーク (HGNN) は、グラフ表現学習を異種グラフ場に拡張した。
近年の研究では、医療分析やレコメンデーションシステムなど、様々な応用において優れた性能を示している。
我々は,SiHGNNと呼ばれるHGNN用の軽量ハードウェアアクセラレータを提案する。このアクセラレータはツリーベースのセマンティックグラフビルダーを組み込んで,効率的なセマンティックグラフ生成を実現し,セマンティックグラフレイアウトを最適化するための新しいグラフ再構成器を備えている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:20:21 GMT)
Structured Deep Neural Networks-Based Backstepping Trajectory Tracking Control for Lagrangian Systems [9.6] 提案したコントローラは、任意の互換性のあるニューラルネットワークパラメータに対してクローズループ安定性を確保することができる。
モデル近似誤差や外乱の存在下では、閉ループ安定性と追従制御性能が保証されることが示されている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:13:54 GMT)
PEER: Expertizing Domain-Specific Tasks with a Multi-Agent Framework and Tuning Methods [9.6] GPT-4は大きな可能性を秘めているが、性能、コスト、データプライバシーの重大な三重項に直面している。
PEER(Plan, Execute, Express, Review)マルチエージェントフレームワークを紹介する。
これは、正確な質問分解、高度な情報検索、包括的な要約、厳密な自己評価を統合することで、ドメイン固有のタスクを体系化する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:02:41 GMT)
BCDNet: A Convolutional Neural Network For Breast Cancer Detection [9.5] 浸潤性十二指腸癌 (IDC) は乳癌の亜型として最も多い。
現代のコンピュータ支援診断(CAD)システムは、強力な計算資源を使わずにほとんどのケースに対処できる。
我々は、89.5%の精度で画像中のIDCを効果的に検出し、トレーニング時間を効果的に短縮する、hisNetと呼ばれる新しいCNNモデルを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:30:47 GMT)
TCNFormer: Temporal Convolutional Network Former for Short-Term Wind Speed Forecasting [9.5] 本研究は,短期(12時間)の風速予測のための時間的コンテンポラル前駆体 (TCNFormer) を提案する。
以上の結果から,TNFormerは予測精度において最先端モデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:35:42 GMT)
Continuity bounds for quantum entropies arising from a fundamental entropic inequality [9.2] 2つの量子状態の間のフォン・ノイマンエントロピーの差について、厳密な上限を確立する。
我々は、有名な Audenaert-Fannes の不等式を意味する新しいエントロピー不等式を導出する。
我々の証明は、大まかに言えば、一般化理論と凸最適化に基づいている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:59:38 GMT)
Attack on Scene Flow using Point Clouds [9.1] 本稿では,シーンフローネットワークに特化して,敵のホワイトボックス攻撃を導入する。
実験結果から, 生成した逆数例は平均点誤差において最大33.7の相対劣化が得られることがわかった。
この研究は、一次元または色チャネルの点雲を標的とする攻撃が、平均的な端点誤差に与える影響も明らかにしている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:23:50 GMT)
HEAD: A Bandwidth-Efficient Cooperative Perception Approach for Heterogeneous Connected and Autonomous Vehicles [9.1] HEADは3次元物体検出ネットワークにおける分類と回帰ヘッドの特徴を融合する手法である。
実験の結果,HEADは通信帯域幅と知覚性能を効果的にバランスさせる融合法であることがわかった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 22:05:44 GMT)
Feedback-based Modal Mutual Search for Attacking Vision-Language Pre-training Models [8.9] 我々は、フィードバックベースのモーダル・ミューチュアル・サーチ(FMMS)と呼ばれる新たな攻撃パラダイムを提案する。
FMMSは、マッチした画像とテキストのペアをランダムに描画しながら、特徴空間に不一致のペアを描画することを目的としている。
これは、ターゲットモデルフィードバックを利用して、マルチモーダリティの逆境を探索する最初の試みである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:31:39 GMT)
Into the Unknown Unknowns: Engaged Human Learning through Participation in Language Model Agent Conversations [8.8] 協調的なSTORMは、複数のLMエージェント間の会話を観察し、管理することを可能にする。
エージェントはユーザの代理として質問を行い、未知の未知をセレンディピティーに発見する。
自動評価のために,実際の情報検索記録をユーザ目標として収集し,WildSeekデータセットを構築する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:50:03 GMT)
Resource Placement for Rate and Fidelity Maximization in Quantum Networks [8.7] 既存の光学ネットワークのインフラは、光子損失のために量子ネットワークアプリケーションにすぐには利用できない。
既存のインフラにまたがる量子リピータを効率的に分散することを目的とした,ネットワーク計画のための包括的フレームワークを提案する。
量子リピータにおける量子メモリ多重化の効果と,メモリコヒーレンス時間の影響について検討する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:09:40 GMT)
SAM & SAM 2 in 3D Slicer: SegmentWithSAM Extension for Annotating Medical Images [8.6] Segment Anything Model 2 (SAM2) は、ビデオに注釈を付けるために設計されたプロンプトベースのセグメンテーションアルゴリズムである。
本稿では,このモデルを3次元医用画像のアノテーションに適用し,一般的なアノテーションソフトウェアである3Dスライダの拡張という形で実装する。
この拡張により、ユーザーは2Dスライスにポイントプロンプトを配置し、アノテーションマスクを生成し、これらのアノテーションを1つの方向または双方向の方法で全ボリュームにわたって伝達することができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:39:33 GMT)
Diffusion Models Are Real-Time Game Engines [8.5] GameNGenは、高品質な長い軌道上の複雑な環境とのリアルタイム対話を可能にする最初のゲームエンジンである。
次のフレーム予測は、20フレーム以上の1フレームでのランダムな29.4よりも優れている。
人間のレイパーは、シミュレーションのクリップとショートクリップを区別するのにわずかに優れている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:46:07 GMT)
GeoTransfer : Generalizable Few-Shot Multi-View Reconstruction via Transfer Learning [8.5] ニューラルレージアンスフィールド(NeRF)の表現力を利用したスパース3次元再構成手法を提案する。
提案手法は,NeRF特徴量に符号化された情報を伝達して,正確な占有場表現を導出することにより,両世界の長所を提供する。
我々はDTUデータセットに対する我々のアプローチを評価し、再構築精度の観点から最先端の性能を実証する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:28:15 GMT)
Exploiting the Potential of Seq2Seq Models as Robust Few-Shot Learners [8.4] この結果から,Seq2seqモデルは多種多様なアプリケーションに対して非常に効果的であることを示す。
本稿では,セq2seqモデルにおける文脈内学習能力をより効果的に活用する2つの手法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:30:29 GMT)
LN-Gen: Rectal Lymph Nodes Generation via Anatomical Features [8.4] 周囲の解剖学的構造の複雑さと注釈付きデータの不足は重大な課題である。
本研究は, 多様な, 現実的な合成直腸リンパ節サンプルを作成することを目的とした, 新規なリンパ節合成手法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:40:23 GMT)
Interactive dense pixel visualizations for time series and model attribution explanations [8.2] DAVOTSは、生の時系列データ、ニューラルネットワークのアクティベーション、高密度ピクセル可視化における属性を探索する、インタラクティブなビジュアル分析アプローチである。
可視化されたデータドメインにクラスタリングアプローチを適用し、グループをハイライトし、個々のデータ探索と組み合わせたデータ探索のための順序付け戦略を示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:02:21 GMT)
T-FAKE: Synthesizing Thermal Images for Facial Landmarking [8.2] スパースと密集したランドマークを持つ新しい大規模合成熱データセットであるT-FAKEデータセットを紹介する。
我々のモデルは、スパース70点のランドマークと密度478点のランドマークアノテーションの両方で優れた性能を示している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:07:58 GMT)
DCT-CryptoNets: Scaling Private Inference in the Frequency Domain [8.1] ホモモルフィック暗号化(FHE)と機械学習は、機密データの個人推論に前例のない機会を提供する。
FHEは、暗号化されたデータに直接計算を可能にし、データやモデルの機密性を含む、マシンラーニングパイプライン全体を保護する。
ディープニューラルネットワークのための既存のFHEベースの実装は、計算コスト、レイテンシ、スケーラビリティの課題に直面している。
本稿では、これらの問題に対処するために周波数領域学習を利用する新しいアプローチであるDCT-CryptoNetsを紹介する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:48:29 GMT)
AutoPatch: Automated Generation of Hotpatches for Real-Time Embedded Devices [8.0] 医療用や工業用デバイスのようなリアルタイムの組み込みデバイスは、サイバー攻撃がますますターゲットになっている。
ホットパッチングは、再起動せずにミッションクリティカルな組み込みデバイスにパッチを適用するアプローチである。
本稿では,オフィシャルパッチの静的解析により等価なホットパッチを自動的に生成する,新しいホットパッチ技術であるAutoPatchを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:11:39 GMT)
CycleGAN with Better Cycles [8.0] CycleGANは、サイクル整合性損失を使用して、未ペアデータセットで画像から画像への変換をトレーニングするフレームワークを提供する。
本稿では, サイクル整合性に対する3つの簡単な修正を提案し, より少ないアーティファクトでより良い結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:22:06 GMT)
TART: Boosting Clean Accuracy Through Tangent Direction Guided Adversarial Training [7.9] 敵の訓練は、敵の攻撃に対するディープニューラルネットワークの堅牢性を高めることに成功している。
しかし、この堅牢性はクリーンデータに対する精度の大幅な低下を伴う。
本稿では,TART(Tangent Direction Guided Adversarial Training)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:41:21 GMT)
Triplètoile: Extraction of Knowledge from Microblogging Text [7.8] ソーシャルメディアプラットフォーム上でのマイクロブログ投稿からオープンドメインエンティティを含む知識グラフの抽出に適した情報抽出パイプラインを提案する。
我々のパイプラインは、単語の埋め込みに対する階層的クラスタリングを通じて、依存関係解析を活用し、教師なしの方法でエンティティ関係を分類する。
本稿では,デジタルトランスフォーメーションに関する1万ツイートのコーパスからセマンティック・トリプルを抽出し,生成した知識グラフを公開するユースケースを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:35:13 GMT)
Quantum Network Tomography via Learning Isometries on Stiefel Manifold [7.8] 本稿では,Stiefel多様体上のアイソメトリーを学習し,量子ネットワークトモグラフィーの効率的な手法を提案する。
その結果,提案手法は精度と効率性が高いことがわかった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:19:01 GMT)
Data Augmentation for Continual RL via Adversarial Gradient Episodic Memory [7.8] 連続RLでは、学習者は定常的でないシーケンシャルなタスクと対話し、以前の知識を忘れずに新しいタスクを学習する必要がある。
本稿では,連続RLにおけるデータ拡張の有効性について検討する。
本稿では,乱数振幅スケーリング,ステートスウィッチ,ミックスアップ,逆数拡張,Adv-GEMなどのデータ拡張が,既存の連続RLアルゴリズムを改善することを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:19:31 GMT)
TAAT: Think and Act from Arbitrary Texts in Text2Motion [7.7] 既存の設定では、テキストにはアクションラベルが含まれており、実用的なシナリオでは柔軟性が制限される。
本稿では,テキストが任意であるというより現実的な仮定で,この課題を拡張した。
本稿では,Large Language Model (LLM) を用いて任意のテキストから行動表現を抽出し,その後に動きを生成するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:36:12 GMT)
Revisiting Surgical Instrument Segmentation Without Human Intervention: A Graph Partitioning View [7.6] 本稿では,ビデオフレーム分割をグラフ分割問題として再検討し,教師なしの手法を提案する。
自己教師付き事前学習モデルは、まず、高レベルな意味的特徴をキャプチャする特徴抽出器として活用される。
ディープ」固有ベクトルでは、手術用ビデオフレームは、ツールや組織などの異なるモジュールに意味的に分割され、区別可能な意味情報を提供する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 05:31:30 GMT)
Urban context and delivery performance: Modelling service time for cargo bikes and vans across diverse urban environments [7.5] 都市環境に基づいた配送時間の予測を行うためのモデリングフレームワークを提案する。
UberのH3インデックスを使用して、都市を六角形に分割し、各セルにOpenStreetMapタグを集約します。
GeoVexは連続ベクトル空間の点としてマイクロリージョンを表現し、車両のサービス時間を予測するための入力として機能する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:25:25 GMT)
Variational Bayesian Imaging with an Efficient Surrogate Score-based Prior [7.2] 不完全, 雑音の計測により, クリーンな画像後部を狙う不完全な逆画像問題について考察する。
最近の研究は、スコアベースの拡散モデルを、不適切な画像問題を解くための原則化された先行モデルに変えた。
提案するサロゲート先行法は, スコアベース拡散モデルの低境界に基づくものである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:05:09 GMT)
The Benefits of Balance: From Information Projections to Variance Reduction [7.1] 表現の崩壊を避けるために通常使用される反復アルゴリズムは、疑わしい利益を享受できることを示す。
我々は、この分散還元効果を定量化する非漸近境界を提供し、それらを適切に定義されたマルコフ作用素の固有デカイに関連付ける。
コントラッシブなマルチモーダル学習と自己教師付きクラスタリングにおいて、様々な形式のデータバランシングが、この分散還元スキームのインスタンスとしてどのように解釈できるかを説明する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:48:15 GMT)
Optimization Solution Functions as Deterministic Policies for Offline Reinforcement Learning [7.1] 本稿では,最適化の最適値に対する決定論的ポリシー(アクター)および単調関数として最適化解関数を用いる暗黙的アクター批判(iAC)フレームワークを提案する。
学習ポリシーは指数的減衰感度(EDS)特性を介して学習したアクターパラメータの準最適性に頑健であることを示す。
提案手法を実世界の2つのアプリケーションで検証し, 最先端(SOTA)オフラインRL法よりも大幅に改善したことを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:04:32 GMT)
Reflective Human-Machine Co-adaptation for Enhanced Text-to-Image Generation Dialogue System [7.0] 我々はRHM-CASという,人間と機械の協調適応戦略を提案する。
外部では、Agentはユーザが生成した画像を反映して洗練するために、意味のある言語インタラクションに従事します。
内部的には、エージェントはユーザーの好みに基づいてポリシーを最適化し、最終的な結果がユーザの好みと密接に一致することを保証する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:08:00 GMT)
Inference with Mondrian Random Forests [7.0] 我々は、モンドリアンのランダムな森林回帰推定器に対して、ベリー・エッセイン型中央極限定理とともに、正確なバイアスと分散特性を与える。
未知回帰関数に対する有効な統計的推測法を提案する。
効率的で実装可能なアルゴリズムは、バッチとオンラインの学習設定の両方に考案されている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:12:12 GMT)
Toward Large Language Models as a Therapeutic Tool: Comparing Prompting Techniques to Improve GPT-Delivered Problem-Solving Therapy [7.0] そこで本研究では,大規模言語モデル (LLM) を指導するためのプロンプトエンジニアリングの効果について検討する。
本稿では,プロンプトエンジニアリング手法を適切に利用することにより,プロトタイズされた治療を提供するモデルの能力を向上できることを実証する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:25:16 GMT)
Divergence-free neural operators for stress field modeling in polycrystalline materials [6.9] 本研究の目的は、多結晶材料の準静的機械応答の代理モデリングのためのフーリエ神経演算子(FNO)の開発と比較である。
物理誘導型FNO(PgFNO)、物理インフォーム型FNO(PiFNO)、物理符号化型FNO(PeFNO)の3種類が考えられる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:18:41 GMT)
Properties of Effective Information Anonymity Regulations [6.8] 我々は匿名化規則と関連する規則に関する一連の技術的要件を策定する。
例として、EUの一般データ保護規則(General Data Protection Regulation)からの規制要件の競合する解釈を評価します。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:34:41 GMT)
Jump-teaching: Ultra Efficient and Robust Learning with Noisy Label [6.8] そこで本研究では,トレーニング中のラベルのずれを識別する新しい手法を提案する。
インタープレイを分離し、損失からより多くのセマンティック情報をマイニングするために、ジャンプ方式の更新を行うネットワークは1つだけです。
提案手法は, ピークメモリフットプリントの高速化, ピークメモリフットプリントの0.56タイム, 各種ノイズ設定による最先端処理よりも優れたロバスト性を実現する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:02:58 GMT)
Zero-Shot Visual Reasoning by Vision-Language Models: Benchmarking and Analysis [6.7] 視覚言語モデル(VLM)は、実世界の視覚的質問応答ベンチマークにおいて、印象的なゼロショットと少数ショットのパフォーマンスを示した。
VLMの視覚的推論性能が世界的知識によるものなのか、それとも実際の視覚的推論能力によるものなのかは不明だ。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:43:54 GMT)
Fuzzing MLIR Compilers with Custom Mutation Synthesis [6.6] 我々は、文法に基づくファジィとカスタム合成突然変異を組み合わせたSynTHFUZZと呼ばれる新しいテストジェネレータを開発した。
各方言のカスタム突然変異演算子を手動で定義する必要がなくなる。
評価の結果,SynTHFUZはMLIRの方言対のカバレッジを1.75倍に改善し,ブランチのカバレッジを1.22倍に向上させることがわかった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:08:52 GMT)
Semi-Classical Subspaces, The No Synchronization Law, and More [6.5] 本稿では,アルゴリズム情報理論と物理の交わりについて考察する。
量子世界と古典的領域の間の障壁を特徴づける定理について議論する。
ブラックホールのコルモゴロフ複雑性に関する今後の研究について考察する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:00:12 GMT)
Diffusion Tensor Estimation with Uncertainty Calibration [6.5] 本研究では,拡散テンソルを推定し,推定の不確実性を計算する深層学習手法を提案する。
データ依存の不確実性はネットワークによって直接計算され、損失減衰によって学習される。
提案手法によって計算された推定の不確実性は,モデルのバイアスを強調し,領域シフトを検出し,測定における雑音の強さを反映できることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:09:32 GMT)
SpecGuard: Specification Aware Recovery for Robotic Autonomous Vehicles from Physical Attacks [6.5] SpecGuardはミッション仕様に準拠し、RAVを安全に回収する技術である。
まず、Deep Reinforcement Learning (Deep-RL)を用いてミッション仕様を取り入れ、回復制御ポリシーを学ぶアプローチを導入する。
第二に、SpecGuardには、攻撃によるセンサーの摂動を最小限に抑える技術である状態再構成が組み込まれている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:01:13 GMT)
Does Audio Deepfake Detection Generalize? [6.4] 我々は、関連する作業からアーキテクチャを再実装し、一様に評価することで、音声スプーフィング検出をシステム化する。
有名人や政治家のオーディオ録音を37.9時間記録したデータセットを新たに公開し、そのうち17.2時間がディープフェイクである。
これは、コミュニティがASVSpoofベンチマークに近づきすぎており、ディープフェイクが以前考えられていたよりもラボ外で検出するのがずっと難しいことを示唆しているかもしれない。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:48:49 GMT)
Human Perception of Audio Deepfakes [6.4] 音声のディープフェイクを検出するための人間と機械の能力を比較する。
我々の実験では、472人のユニークなユーザーが14912ラウンドで最先端のAIディープフェイク検出アルゴリズムと競合した。
人間とディープフェイク検出アルゴリズムは類似の強みと弱みを共有しており、どちらも特定の種類の攻撃を検出するのに苦労している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:19:45 GMT)
5%>100%: Breaking Performance Shackles of Full Fine-Tuning on Visual Recognition Tasks [6.4] 本稿では,新しい適応型チューニング手法であるマルチ認知型ビジュアルアダプタ(Mona)チューニングを提案する。
まず、視覚信号の処理能力を高めるために、複数の視覚フレンドリーなフィルタをアダプタに導入する。
次に,適応器に拡張正規化層を追加し,視覚フィルタの入力特徴の分布を調節する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 05:08:00 GMT)
Halfway Escape Optimization: A Quantum-Inspired Solution for General Optimization Problems [6.4] 本稿ではまず,高次収束率で高次元の地形を特徴とする一般最適化問題に対処するために,量子インスパイアされたメタヒューリスティックであるHalfway Escape Optimization (HEO)アルゴリズムを提案する。
本研究では,粒子群最適化 (PSO), 遺伝的アルゴリズム (GA), 人工魚群アルゴリズム (AFSA), グレイウルフ (GWO), 量子行動群最適化 (QPSO) など,確立された最適化アルゴリズムに対するHEOの性能を総合的に比較した。
圧力容器設計におけるHEOの有効性と実時間応用の可能性
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:57:34 GMT)
Sequential-Scanning Dual-Energy CT Imaging Using High Temporal Resolution Image Reconstruction and Error-Compensated Material Basis Image Generation [6.4] 我々は高時間分解能画像再構成と誤差補償材料ベース画像生成を用いたシーケンシャルスキャン画像を開発した。
その結果,ACCELERATIONによる定量化精度と画質の向上が示された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:09:39 GMT)
AI Reliance and Decision Quality: Fundamentals, Interdependence, and the Effects of Interventions [6.4] 私たちは、AIによる意思決定に関する現在の文献で、信頼と意思決定品質が不適切に混ざり合っていると論じています。
我々の研究は、AIによる意思決定における信頼行動と意思決定品質の区別の重要性を強調している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 23:28:29 GMT)
Histo-Diffusion: A Diffusion Super-Resolution Method for Digital Pathology with Comprehensive Quality Assessment [6.4] ヒスト拡散(Histo-Diffusion)は、デジタル病理学における超解像の生成と評価のために特別に設計された拡散法である。
病理組織学の復元モジュールと、高品質な画像を生成するための制御可能な拡散モジュールを含む。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:31:00 GMT)
SwiftBrush v2: Make Your One-step Diffusion Model Better Than Its Teacher [6.2] 我々は,一段階のテキスト・ツー・イメージ拡散モデルであるSwiftBrushの性能を向上させる。
効率的なLoRAでトレーニングされたモデルの重みとフルトレーニングを組み合わせることで、新しい最先端のワンステップ拡散モデルを実現する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:59:58 GMT)
Poly2Vec: Polymorphic Encoding of Geospatial Objects for Spatial Reasoning with Deep Neural Networks [6.2] Poly2Vecは、異なる地理空間オブジェクトのモデリングを統一するエンコーディングフレームワークである。
我々は2次元フーリエ変換のパワーを利用して、形状や位置などの有用な空間特性を符号化する。
この統一されたアプローチは、異なる空間タイプごとに別々のモデルを開発し、訓練する必要がない。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:28:35 GMT)
Enhancing Analogical Reasoning in the Abstraction and Reasoning Corpus via Model-Based RL [6.1] モデルに基づく強化学習は類推的推論の課題に適した手法であることを示す。
モデルベースRL法であるDreamerV3とモデルフリーRL法であるProximal Policy Optimizationを比較した。
この結果から,モデルベースRLはモデルフリーのRLよりも,単一タスクからの学習や一般化に優れるだけでなく,類似タスク間の推論において大きな優位性を示すことがわかった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:15:20 GMT)
Low-Budget Simulation-Based Inference with Bayesian Neural Networks [6.1] ベイジアンニューラルネットワークは,数百のシミュレーションで情報的,よく校正された後続推定を導出することを示す。
これにより、非常に高価なシミュレータを使用して、信頼性の高いシミュレーションベースの推論を実行する可能性が開ける。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:19:07 GMT)
Multi-Feature Aggregation in Diffusion Models for Enhanced Face Super-Resolution [6.1] 超解像を生成するために,複数の低画質画像から抽出した特徴と組み合わせた低解像度画像を利用するアルゴリズムを開発した。
他のアルゴリズムとは異なり、我々のアプローチは属性情報を明示的に提供せずに顔の特徴を復元する。
これは、高解像度画像と低解像度画像を組み合わせて、より信頼性の高い超高解像度画像を生成するコンディショナーとして初めて使用される。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 20:08:33 GMT)
BOX3D: Lightweight Camera-LiDAR Fusion for 3D Object Detection and Localization [6.0] 本稿では,RGBカメラと3D LiDARの情報を融合させることにより,興味の対象をローカライズする新しい手法であるBOX3Dを提案する。
BOX3Dは、3層構造で構築されており、入力されたシーケンシャルセンサーデータの局所的な知覚から、グローバルな知覚の洗練までで構成されている。
提案した新しいアーキテクチャのベンチマーク結果は,都市環境の大規模データセットに関する複数の実験で実証された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:26:05 GMT)
CLIP-AGIQA: Boosting the Performance of AI-Generated Image Quality Assessment with CLIP [6.0] 生成画像の品質評価のためのCLIPに基づく回帰モデルであるCLIP-AGIQAを開発した。
CLIPのテキスト知識を品質評価に活用するために,複数カテゴリの学習可能なプロンプトを実装した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:30:36 GMT)
Post-processing fairness with minimal changes [5.9] 本稿では,モデルに依存しない新しいポストプロセッシングアルゴリズムを提案する。
我々のアルゴリズムは偏りのある予測と偏りのある予測の間の最小限の変化を強制するように設計されている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:26:56 GMT)
Local Causal Discovery for Structural Evidence of Direct Discrimination [5.9] 直接識別のための局所的な発見 (LD3) は、結果変数の因果親を特定することによって、直接識別の構造的証拠を明らかにする方法である。
LD3は、直接識別の質的指標である重み付け制御された直接効果に対して、新しいグラフィカルな基準の下で有効な調整セット(VAS)を返すことを示す。
我々はLD3を用いて2つの複雑な意思決定システム、すなわち犯罪再犯予測と肝移植割当の因果フェアネスを分析する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:28:33 GMT)
The Uniqueness of LLaMA3-70B with Per-Channel Quantization: An Empirical Study [5.8] 我々はLLaMA3/3.1-70BモデルとLLaMA3/3.1-8B/405Bモデルの両方に欠落しているLLaMA3/3.1-70Bモデルに特徴的な量子化関連挙動を観察した。
残りの97%の層がチャネル単位の構成を維持しているのに対し、W8A8の量子化は3%未満の混合戦略を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:03:01 GMT)
Riemannian Flow Matching Policy for Robot Motion Learning [5.7] 本稿では,ロボットビジュモータポリシーの学習と合成のための新しいモデルを提案する。
RFMPはよりスムーズな行動軌跡を提供し,推論時間を大幅に短縮することを示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:13:43 GMT)
MPC-Pipe: an Efficient Pipeline Scheme for Secure Multi-party Machine Learning Inference [5.7] 重なり合う計算と通信の手順を慎重に整理することは可能であることを示す。
MPC-Pipeは機械学習ワークロードのトレーニングと推論の両方に効率的なMPCシステムである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:32:39 GMT)
Online Event-Triggered Switching for Frequency Control in Power Grids with Variable Inertia [5.3] 再生可能エネルギー資源の電力グリッドへの統合は、時間とともに変化するシステムの慣性と周波数力学の連続的な劣化につながった。
有望な解決策は、周波数偏差に応じて出力設定点を調整することにより、再生可能発電機や電池エネルギー貯蔵などのエネルギー資源を一次周波数制御に使用することである。
時間変化慣性下での周波数ダイナミクスを非線形スイッチングシステムとしてモデル化し、各モードの周波数ダイナミクスを非線形揺動方程式で記述し、異なるモードが異なる慣性レベルを表す。
ニューラルネットワークの集合から最も適切なコントローラを選択するためのオンラインイベントトリガースイッチングアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 22:44:33 GMT)
A Neurosymbolic Approach to Adaptive Feature Extraction in SLAM [5.3] 既存の追跡手法は環境変化や境界条件に適応しない。
ディープラーニングベースのアプローチは、環境の変化に適応できるが、トレーニングにはかなりのデータを必要とし、新しいドメインに適応する柔軟性に欠けることが多い。
本稿では,データを利用して複雑な関係を学習しながら,従来のSLAMアプローチからドメイン知識を統合した適応型SLAMパイプラインを構築するための,ニューロシンボリックプログラム手法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 00:03:31 GMT)
Depth Restoration of Hand-Held Transparent Objects for Human-to-Robot Handover [5.3] 本稿では,1枚のRGB-D画像から暗黙的ニューラル表現関数を作成することにより,手持ち透明物体に対する手持ち深度復元法を提案する。
提案手法では,手の位置を意味情報や幾何学的情報を活用するための重要なガイダンスとして紹介する。
さらに,提案手法に基づく実世界の人間ロボットハンドオーバシステムを開発し,その人間ロボットインタラクションへの応用価値を実証する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:25:12 GMT)
XG-NID: Dual-Modality Network Intrusion Detection using a Heterogeneous Graph Neural Network and Large Language Model [5.3] XG-NIDは異種グラフ構造内にフローレベルとパケットレベルのデータを融合する最初の方法である。
XG-NIDは、フローとパケットペイロードデータの複雑な関係を効果的に捉えながら、リアルタイムの推論を可能にする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:14:34 GMT)
GINN-KAN: Interpretability pipelining with applications in Physics Informed Neural Networks [5.3] 本稿では,解釈可能性パイプラインの概念を導入し,複数の解釈可能性技術を導入し,各手法の精度を向上する。
我々は、標準的なニューラルネットワークアーキテクチャに解釈可能性を導入する可能性のために選択された2つの最近のモデルを評価する。
両モデルの利点を合成する新しい解釈可能なニューラルネットワークGINN-KANを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:57:53 GMT)
A Note on Knowledge Distillation Loss Function for Object Classification [5.2] 本研究ノートでは, オブジェクト分類における知識蒸留損失関数について紹介する。
これまでに提案したロジットマッチング損失関数との関係について論じる。
我々は、知識蒸留を出力正則化の特定の形態として扱い、ラベルの平滑化とエントロピーに基づく正則化との関係を実証する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:09:05 GMT)
Diffusion-Occ: 3D Point Cloud Completion via Occupancy Diffusion [5.2] 拡散点クラウドコンプリートのための新しいフレームワークである textbfDiffusion-Occ を紹介する。
占有領域をしきい値にすることで、それを完全点雲に変換する。
実験の結果,Diffusion-Occは既存の差別的・生成的手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:57:58 GMT)
Toward Time-Continuous Data Inference in Sparse Urban CrowdSensing [5.1] Mobile Crowd Sensing(MCS)は,モバイルユーザとそのスマートポータブルデバイスを活用して,さまざまな実世界のタスクを実行する,有望なパラダイムである。
Sparse MCSはより実用的な代替として出現し、限られた数のターゲットからデータを収集し、推論アルゴリズムを利用して完全なセンシングマップを完成させている。
本稿では,センササイクルの細粒度化,すなわち最小時間単位への分割から,より正確で連続的な完了へと進む。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:25:41 GMT)
Conditional Stochastic Interpolation for Generative Learning [5.0] 本研究では条件分布を学習するための条件条件付き条件付き(CSI)手法を提案する。
条件予測の観点から条件ドリフトとスコア関数の明示的な表現を導出する。
ベンチマーク画像データセットを用いた画像生成におけるCSIの適用について述べる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:23:23 GMT)
Attention is All They Need: Exploring the Media Archaeology of the Computer Vision Research Paper [5.0] 深層学習革命が学界に前例のない成長をもたらしたため、過去10年間にコンピュータビジョンの変化を研究してきた。
我々の分析は、研究論文要素がいかに広告、測定、普及に寄与するかという研究注意経済に焦点を当てている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:44:11 GMT)
The Illusion of Randomness: An Empirical Analysis of Address Space Layout Randomization Implementations [4.9] アドレス空間レイアウトランダム化の現実の実装は不完全であり、攻撃者が悪用できる弱点を負う。
この研究は、LinuxやWindowsを含む主要なデスクトッププラットフォームにおけるASLRの有効性を評価する。
我々は,Linux 5.18以降のライブラリのエントロピーの大幅なエントロピー削減と,攻撃者が利用複雑性を著しく低減するために活用できる相関パスの同定を行う。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:46:04 GMT)
Improved identification of breakpoints in piecewise regression and its applications [4.9] 断片的回帰においてブレークポイントを識別する新しいアルゴリズムを提案する。
アルゴリズムはブレークポイントを更新し、各ブレークポイントの近傍を探索することでエラーを最小限にする。
最適なブレークポイントを見つけるために、収束速度と安定性が速い。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:26:20 GMT)
Coprime Bivariate Bicycle Codes and their Properties [4.9] 本研究では, BB符号の探索過程を高速化する新しい数値アルゴリズムを提案する。
また、量子誤り訂正に適したBB符号の新しいサブクラスも定義している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 23:34:53 GMT)
From Chaos to Consistency: The Role of CSAF in Streamlining Security Advisories [4.9] Common Security Advisory Format (CSAF)は、セキュリティアドバイザリを標準化されたフォーマットにすることを目的としている。
CSAFは現在滅多に使われていない。
主な理由の1つは、システムがまだ自動化のために設計されていないことである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:22:59 GMT)
Causal structure learning with momentum: Sampling distributions over Markov Equivalence Classes of DAGs [4.8] 我々はDAGのクラス上の確率分布を目標とする可逆的連続時間マルコフ連鎖を考案する。
我々はGES演算子のリスト、カウント、一様サンプリング、および可能な動作の適用のための新しいアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:24:41 GMT)
PressProtect: Helping Journalists Navigate Social Media in the Face of Online Harassment [4.8] 我々は、既存のプラットフォームツールやニュースルームのリソースが、ジャーナリストの適切な保護に不足している状況を理解するために、アジア系アメリカ人や太平洋諸島のジャーナリストと必要なインタビューを行う。
PressProtectは、ジャーナリストがTwitter/Xで読者とやりとりするときに、より大きなエージェンシーを提供するインターフェイスです。
我々は、オンラインハラスメントに直面しているジャーナリストのデフォルトを守りたいと願う、ソーシャルプラットフォームに対する私たちの発見と推奨に関する議論で締めくくります。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:22:03 GMT)
Revisiting thermodynamics in computation and information theory [4.8] 計算の熱力学的コストの分析は、研究の主要な焦点の1つである。
物理学の進歩は、計算と統計力学(熱力学コスト)の関連を理解するのに役立っている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:48:09 GMT)
Compressed Empirical Measures (in finite dimensions) [4.7] 有限次元再生核ヒルベルト空間(RKHS)の文脈における経験的尺度の圧縮手法について検討する。
そのようなコアセットがどれほど大きいかを制御する重要な量は、経験的凸集合に含まれる経験的測度の周りにある最大の球の大きさである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:32:12 GMT)
Quantum 2D Liouville Path-Integral Is a Sum over Geometries in AdS$_3$ Einstein Gravity [4.7] 任意の2次元曲面 $mathcalM$ 上で、リウヴィル理論の経路積分を三角化する。
これは本質的には3次元トポロジカル理論の状態を解釈するテンソルネットワークである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:56:48 GMT)
Anti-Matthew FL: Bridging the Performance Gap in Federated Learning to Counteract the Matthew Effect [4.7] フェデレートラーニング(FL)は、異種および多種多様なデータセット間のモデルトレーニングを容易にする。
本研究では,クライアントレベルでのグローバルモデルに対するアンチマシューフェアネスを提案する。
提案するアンチマシューFLは,高性能なグローバルモデルを実現する上で,他の最先端のFLアルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:17:34 GMT)
Temporal Graph Neural Network-Powered Paper Recommendation on Dynamic Citation Networks [4.7] 本稿では,紙レコメンデーション戦略に時間的次元を導入する。
中心となる考え方は、新しい引用関係が現れたときに紙の埋め込みを継続的に更新することである。
リカレントニューラルネットワーク(RNN)に基づく学習可能なメモリ更新モジュールを使用して、埋め込みの進化を研究する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:10:21 GMT)
Text-guided Foundation Model Adaptation for Long-Tailed Medical Image Classification [4.7] 医学的文脈では、まれな疾患のラベルの少ない長いデータセットにおける不均衡なデータ分布は、ディープラーニングモデルの診断精度を著しく損なう。
最近のマルチモーダルテキスト画像管理基盤モデルは、効率的な表現学習を通じて、データの不足に対する新しい解決策を提供する。
長期医療画像分類のための新しいテキスト誘導基礎モデル適応法(TFA-LT)を提案する。
提案手法は27.1%の精度向上を実現し,本領域における基礎モデル適用の可能性を強調した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:18:18 GMT)
Generation of quantum phases of matter and finding a maximum-weight independent set of unit-disk graphs using Rydberg atoms [4.6] 本稿では,Rydberg 励起を用いた単位ディスクグラフの最大重み付き独立集合の問題について検討する。
相互作用する原子の量子系を多体基底状態に駆動し,非線形準断熱プロファイルを用いてライドバーグデチューニングを網羅する。
また、原子配列の1次元および2次元空間配置において、コンメニュレートおよび非コンメニュレート相を実現する物質の量子相についても検討する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 20:25:01 GMT)
An Improved Phase Coding Audio Steganography Algorithm [4.5] AI技術は音声のクローン化をますます利用しやすくし、AI生成オーディオ偽造の不正行為の増加につながっている。
本研究では,中間位相成分にデータを埋め込んで動的に音声信号を分割する位相符号化型オーディオステガノグラフィーアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:58:34 GMT)
Scaling Learning based Policy Optimization for Temporal Logic Tasks by Controller Network Dropout [4.4] 非線形環境下で動作する自律エージェントに対して,フィードバックコントローラを訓練するためのモデルに基づくアプローチを提案する。
この学習問題は、エージェントのタスク目標の時間的地平線に比例して繰り返し単位の数が比例する、リカレントニューラルネットワーク(RNN)のトレーニングとどのように似ているかを示す。
そこで我々は,ドロップアウトあるいは勾配サンプリングのアイデアに基づく新しい勾配近似アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 22:18:07 GMT)
ODDR: Outlier Detection & Dimension Reduction Based Defense Against Adversarial Patches [4.4] 敵対的攻撃は、機械学習モデルの信頼性の高いデプロイに重大な課題をもたらす。
パッチベースの敵攻撃に対処するための総合的な防御戦略である外乱検出・次元削減(ODDR)を提案する。
提案手法は,逆パッチに対応する入力特徴を外れ値として同定できるという観測に基づいている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:55:37 GMT)
Data-driven Effective Modeling of Multiscale Stochastic Dynamical Systems [4.4] 本稿では,未知のマルチスケール力学系の遅い成分の力学を数値的に学習する手法を提案する。
提案手法は, 観測データを利用して, 分布の遅い変数の有効ダイナミクスを正確に把握できる生成モデルを構築することができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:03:51 GMT)
Strategy of satellite QKD with passive high brightness entangled photon pair source [4.3] 高輝度エンタングルド光子対 (HBEPP) は、エンタングルメントに基づく量子鍵分布の導出に不可欠である。
非対称損失チャネルを用いたHBEPP分布の測定確率の計算モデルを提案する。
平均光子数を$barmu=0.1$で固定すると、理想的な一方通信エンタングルメントベースのSQKDプロトコルと比較して99.7%のパフォーマンスが得られることを確認した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:07:51 GMT)
A Survey of Large Language Models for European Languages [4.3] 大規模言語モデル(LLM)は、多岐にわたる自然言語処理における高い性能のため、大きな注目を集めている。
LLaMA, PaLM, GPT, MoE など LLM ファミリーの概要を報告する。
LLMの事前学習に使用される共通単言語および多言語データセットの包括的要約を提供する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:10:05 GMT)
LapisGS: Layered Progressive 3D Gaussian Splatting for Adaptive Streaming [4.2] LapisGSは、適応ストリーミングとプログレッシブレンダリングをサポートする3DGS層である。
実験により,視覚的忠実度とモデルのコンパクトさのバランスをとるためのアプローチの有効性が検証された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:06:49 GMT)
Submodular Maximization Approaches for Equitable Client Selection in Federated Learning [4.2] 従来の学習フレームワークでは、トレーニングのためのクライアント選択は、通常、各イテレーションでクライアントのサブセットをランダムにサンプリングする。
本稿では,ランダムクライアント選択の限界に対処するために,SUBTRUNCとUNIONFLという2つの新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:27:07 GMT)
Showing the Receipts: Understanding the Modern Ransomware Ecosystem [4.1] 偽陽性の少ないランサムウェア支払いを識別する新しい手法を提案する。
ランサムウェア支払いで9億ドルを超える最大の公開データセットを公開しています。
次に、この拡張データセットを活用して、ランサムウェアグループの活動の時間的理解に焦点を当てた分析を行う。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:51:52 GMT)
RGDA-DDI: Residual graph attention network and dual-attention based framework for drug-drug interaction prediction [4.0] 薬物・薬物相互作用予測のための残留グラフ注意ネットワーク(Residual-GAT)とデュアルアテンションベースのフレームワークであるRGDA-DDIを提案する。
一連の評価指標は、RGDA-DDIが2つの公開ベンチマークデータセット上でのDDI予測性能を大幅に改善したことを示している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:13:56 GMT)
Exact Polaron-Polaron interactions in a Quantum Hall Fluid [3.9] ポラロン相互作用は、最低ランダウのフェルミオンが重い不純物より多いとき、正確にゼロである。
不純物間の距離Rが磁気距離よりも大きい場合、ポテンシャルは消失するが、クーロンの形 -1/R の後、短距離で強く分岐する。
我々の予測は、強磁場下での電子ドープ半導体におけるエキシトン-ポーラロン間の効果的な相互作用を理解する上でも有用である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:43:03 GMT)
Generalist Segmentation Algorithm for Photoreceptors Analysis in Adaptive Optics Imaging [3.9] 共焦点適応光学スキャニング光眼鏡(AOSLO)イメージングにより、導波路光受容体の反射から円錐を可視化することができる。
本稿では,AOSLO画像中のコーンの検出とセグメンテーションを行うための,ディープラーニング(DL)に基づく手法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:49:21 GMT)
Graph GOSPA metric: a metric to measure the discrepancy between graphs of different sizes [3.9] 本稿では,ノード数が異なる可能性のあるグラフ間の相似性を測定する指標を提案する。
提案したグラフGOSPAメトリクスは、適切に割り当てられたノード、ミスノード、偽ノード、グラフ間のエッジミスマッチに対するノード属性エラーに関連するコストを含む。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:34:43 GMT)
Interactive Occlusion Boundary Estimation through Exploitation of Synthetic Data [3.8] 閉塞境界(OB)は2次元画像中の閉塞事象を幾何学的に局所化し、様々なシーン理解問題に対処するための有用な情報を含む。
本研究では,本論文で最初に発表されたOBの対話的推定について検討し,効率的なディープ・ネットワーク・ベースの手法を提案する。
そこで我々は,2次元画像の自動生成のためのMesh2OBというツールを開発した。
我々はOB-LabNameという名のベンチマークを作成し、120個の高解像度画像と、その基底構造OBの精度を超越した精度のベンチマークを作成しました。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:07:09 GMT)
Automatic Detection of COVID-19 from Chest X-ray Images Using Deep Learning Model [3.8] コロナウイルス(2019-nCoV)は昨年から広く普及しており、世界中に波及している。
テストキットが限られているため、従来の手法で重篤な呼吸障害のある患者を検査するのも大変な作業である。
本稿では,ディープラーニングを用いた診断システムの有効性を示すモデルを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:01:58 GMT)
Artificially intelligent Maxwell's demon for optimal control of open quantum systems [3.8] 我々は、量子マックスウェルの悪魔の役割を自動化し、捉えるために強化学習アプローチを採用する。
熱化, 測定, 単位フィードバックの時間スケールの順序付けに基づいて, 異なる体制を探索する。
測定結果に基づいて, 厳密な有限時間熱化プロトコルを用いた手法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:00:02 GMT)
Improving Adversarial Robustness in Android Malware Detection by Reducing the Impact of Spurious Correlations [3.8] 機械学習(ML)は、Androidのマルウェア検出(AMD)において大きな進歩を見せている。
しかし、現実的な回避攻撃に対するMLのレジリエンスは、AMDにとって大きな障害である。
本研究では,マルウェアサンプルとAEの分布を調整することで,AMDの一般化性を向上させるための領域適応手法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:01:12 GMT)
The Fact Selection Problem in LLM-Based Program Repair [3.7] コードコンテキストのような単純な構文的な詳細から、以前はPythonプロジェクトのコンテキストで探索されていなかった意味情報まで、それぞれの事実が有益であることを示す。
重要なことは、プログラム修復プロンプトの有効性は、使用済み事実の数よりも非単調であることが判明した。
我々は、特定のバグに固有の事実を抽出し、プロンプトに含める基本統計モデルManipleを開発した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:17:20 GMT)
CrossInspector: A Static Analysis Approach for Cross-Contract Vulnerability Detection [3.6] CrossInspectorは静的解析によってバイトコードレベルでクロスコントラクトの脆弱性を検出する新しいフレームワークである。
私たちは300の現実世界のスマートコントラクトでランダムに選択されたセット上でCrossInspectorを実行し、以前のツールで見逃された11のクロスコントラクト脆弱性を特定しました。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 00:53:14 GMT)
FPO++: Efficient Encoding and Rendering of Dynamic Neural Radiance Fields by Analyzing and Enhancing Fourier PlenOctrees [3.6] Fourier PlenOctreesは動的ニューラルレイディアンス場(NeRF)のリアルタイムレンダリングの効率的な表現であることを示した。
本稿では,これらのアーティファクトの詳細な分析を行い,得られた知見を活用して,改良された表現を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:05:27 GMT)
Personalized Video Summarization using Text-Based Queries and Conditional Modeling [3.4] この論文は、テキストベースのクエリと条件付きモデリングを統合することで、ビデオ要約の強化を探求する。
精度やF1スコアなどの評価指標は、生成された要約の品質を評価する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:43:40 GMT)
On Tables with Numbers, with Numbers [3.4] 我々は、その無関係、環境影響、社会的不平等の実現と悪化における役割、そして商業的応用と利益主導型研究との深い結びつきに基づいて、数字の表を論じる。
我々は,過去10年間の計算言語学研究のメタ分析から得られた経験的証拠を用いて,我々の議論を裏付ける。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:47:13 GMT)
3D Adaptive Structural Convolution Network for Domain-Invariant Point Cloud Recognition [3.4] 3D Adaptive Structure Convolution Network (3D-ASCN)は、3Dポイントクラウド認識のための最先端フレームワークである。
3次元畳み込みカーネル、構造木構造、および効果的な幾何学的特徴抽出のための適応近傍サンプリングを組み合わせる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:45:49 GMT)
Geometric Artifact Correction for Symmetric Multi-Linear Trajectory CT: Theory, Method, and Generalization [3.3] 既存のCTの校正法は粗大かつ非効率である。
本稿では,CTの難解な幾何学的アーティファクトを包括的かつ効率的に解決する。
また, 一般的な回転CTとCTの変種に有意な一般化が認められた。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:56:48 GMT)
From Variability to Stability: Advancing RecSys Benchmarking Practices [3.3] 本稿では,RecSysアルゴリズムの公平かつ堅牢な比較を容易にするため,新しいベンチマーク手法を提案する。
本研究で導入された2つを含む30ドルのオープンデータセットの多種多様なセットを利用することで、データセット特性がアルゴリズム性能に与える影響を批判的に検証する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:01:56 GMT)
From Bias to Balance: Detecting Facial Expression Recognition Biases in Large Multimodal Foundation Models [3.2] 本研究では,大規模マルチモーダルファンデーションモデル(LMFM)における表情認識(FER)システムの人種的偏見について考察する。
既存の研究は主に従来のFERモデル(CNN、RNN、ViT)に焦点を当てており、LMFMにおける人種的バイアスの理解のギャップを残している。
GPT-4o、PaliGemma、Gemini、CLIPの4つの主要なLMFMをベンチマークし、異なる人種層にわたる顔の感情検出のパフォーマンスを評価する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:54:01 GMT)
AAVENUE: Detecting LLM Biases on NLU Tasks in AAVE via a Novel Benchmark [3.2] AAVENUE は、AAVE と Standard American English の NLU タスクにおける大きな言語モデル (LLM) のパフォーマンスを評価するためのベンチマークである。
AAVENUE と VALUE の翻訳を,5つの人気のある LLM と,フルーエンシ,BARTScore,品質,コヒーレンス,理解可能性などの総合的な指標を用いて比較した。
評価の結果, LLM は AAVE に翻訳されたバージョンよりも, SAE タスクで一貫した性能が向上し, 固有のバイアスが強調された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:56:35 GMT)
Enhancing Sign Language Detection through Mediapipe and Convolutional Neural Networks (CNN) [3.2] この研究は、ASLデータセットの効率的かつ正確な解釈のためにMediaPipeとCNNを組み合わせる。
ASLデータセットのモデルによって達成される精度は99.12%である。
このシステムは、コミュニケーション、教育、アクセシビリティードメインに応用される。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:57:01 GMT)
RSTeller: Scaling Up Visual Language Modeling in Remote Sensing with Rich Linguistic Semantics from Openly Available Data and Large Language Models [3.2] 我々は,Google Earth Engine (GEE) プラットフォームから取得した画像に対して,平易な OpenStreetMap (OSM) データから,意味的に豊富なキャプションを持つマルチモーダルデータセットを大規模に生成するワークフローを提案する。
本稿では,100万以上のRS画像からなるマルチモーダルデータセットであるRSTellerについて述べる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:45:26 GMT)
BayTTA: Uncertainty-aware medical image classification with optimized test-time augmentation using Bayesian model averaging [3.1] 本稿では,Bayesian-based TTA (Bayesian-based TTA) と呼ばれる,TTAを最適化するための新しいフレームワークを提案する。
我々は、TTAによって生成された入力データの様々なバリエーションに関連付けられた予測リストを生成する。
次に,BMAを用いて,各後部確率の重み付けした予測を組み合わせる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:00:47 GMT)
Toward Mixed Analog-Digital Quantum Signal Processing: Quantum AD/DA Conversion and the Fourier Transform [3.0] 我々は、アナログデジタル量子信号処理の新たなパラダイムを開発する。
量子信号のアナログデジタル変換を自然に行う方法を示す。
そこで,この量子アナログデジタル変換により,CV-DVハードウェア上での量子アルゴリズムの新たな実装が可能となることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:53:57 GMT)
What makes math problems hard for reinforcement learning: a case study [3.0] 群論からの長年の予想を用いて、不当に高い報酬を持つ稀な事例を見つけるという課題を探求する。
超スパース報酬問題で他の領域に関係のあるアルゴリズム改善を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:00:06 GMT)
Evanescent Electron Wave Spin [3.0] 本研究は、有限量子井戸と無限量子井戸の両方の外にある電子波の存在を実証する。
このエバネッセント波は井戸内に閉じ込められた波とスピン特性を共有しており、すべての領域にわたる電流密度の解析式が支持している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 20:24:07 GMT)
Enhancing License Plate Super-Resolution: A Layout-Aware and Character-Driven Approach [3.0] 本稿では, LPRタスク自体の性能だけでなく, 解像度, テクスチャ, 構造的詳細などの要因を考慮した新しい損失関数Layout and Character Oriented Focal Loss(LCOFL)を提案する。
我々は、変形可能な畳み込みと共有重み付けを用いた文字特徴学習を強化し、識別器として光学文字認識(OCR)モデルを用いたGANベースのトレーニングアプローチを採用する。
実験の結果, 文字再構成の精度は向上し, 定量化と定性化の両面で, 最先端の2つの手法に優れていた。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:40:19 GMT)
Deep R Programming [2.9] Deep R Programmingは、データサイエンスの最も人気のある言語の1つである包括的で詳細な入門コースである。
野心的な学生、専門家、研究者に、この強力な環境の独立したユーザーになるための知識とスキルを与える。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:28:52 GMT)
Domain-decoupled Physics-informed Neural Networks with Closed-form Gradients for Fast Model Learning of Dynamical Systems [2.9] 物理インフォームドニューラルネットワーク(PINN)は、物理方程式を用いて訓練され、データから学習することで、モデル化されていない効果を組み込むことができる。
本稿では、大規模で複雑な非線形力学系を扱う場合のPINCの現在の限界に対処するために、ドメイン分離された物理情報ニューラルネットワーク(DD-PINN)を導入する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:54:51 GMT)
An Item Response Theory-based R Module for Algorithm Portfolio Analysis [2.9] 本稿では,AIRT-Moduleと呼ばれるアルゴリズムポートフォリオ評価のための項目応答理論に基づく分析ツールを提案する。
IRTをアルゴリズムの評価に適用すると、AIRT-Module は Shiny Web アプリケーションと R パッケージの Airt を含む。
アルゴリズムの長所と短所は、テストインスタンスの難易度スペクトルを用いて可視化される。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:36:52 GMT)
Quotient Normalized Maximum Likelihood Criterion for Learning Bayesian Network Structures [2.8] ネットワーク構造学習のための情報理論的基準として、商正規化最大度(qNML)を導入する。
シミュレーションデータと実データの両方の実験により、新しい基準が予測精度の良い擬似モデルに繋がることを示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:17:22 GMT)
Chain-of-Thought Augmentation with Logit Contrast for Enhanced Reasoning in Language Models [2.8] 思考の連鎖は言語モデル推論の大幅な改善につながった。
我々は、文脈認識復号(CAD)からインスピレーションを得て、思考の連鎖によって引き起こされる推論のタイプをさらに促進する。
データセットやモデル間でこれらの結果を安定化する作業は継続するが、文脈を考慮した推論のための入力ベースのステアリング手法に関するさらなる調査が保証されている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:00:03 GMT)
How transformers learn structured data: insights from hierarchical filtering [2.8] 本稿では,木上の配列の生成モデルに対する階層的フィルタリング手法を提案する。
我々は,バニラエンコーダのみのトランスフォーマーアーキテクチャが最適なBelief伝搬アルゴリズムを実装できることを示す。
フィルタの度合いの異なるモデルのアテンションマップに注目することで,トランスフォーマー層がどのように成功するかを分析する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:23:09 GMT)
A domain decomposition-based autoregressive deep learning model for unsteady and nonlinear partial differential equations [2.8] 非定常・非線形偏微分方程式(PDE)を正確にモデル化するためのドメイン分割型ディープラーニング(DL)フレームワークCoMLSimを提案する。
このフレームワークは、(a)畳み込みニューラルネットワーク(CNN)ベースのオートエンコーダアーキテクチャと(b)完全に接続された層で構成される自己回帰モデルという、2つの重要なコンポーネントで構成されている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:43:52 GMT)
Quantum teleportation coexisting with classical communications in optical fiber [2.8] 本報告では,従来の通信網を通したファイバ上での量子テレポーテーションの最初の実演について報告する。
量子状態伝達は、400GbpsのCバンドの古典的なトラフィックを運ぶ30.2kmのファイバー上で達成される。
その結果, 集積ファイバ基盤内で動作する高度な量子および古典的ネットワークアプリケーションの実現可能性を示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:38:50 GMT)
Automated Synthesis of Quantum Algorithms via Classical Numerical Techniques [2.8] 量子コンピュータのアルゴリズムを自動合成する問題に対して,古典計算機の数値最適化と線形代数アルゴリズムを適用した。
提案手法は,シングルキュービットシステムと大規模システムで評価される。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:43:58 GMT)
Deep Learning-based Average Shear Wave Velocity Prediction using Accelerometer Records [2.7] 本稿では3チャンネル地震記録を用いて,Vs30の震源位置を推定する深層学習手法を提案する。
CNNはエピセンタを推定するために訓練され、すべてのレコードに対して基礎的な真実が利用できる。
提案手法の性能を手作り特徴を用いた機械学習モデルと比較した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:09:34 GMT)
Urdu Digital Text Word Optical Character Recognition Using Permuted Auto Regressive Sequence Modeling [2.7] 本稿では,デジタルウルドゥー文字認識に特化して設計された,革新的な単語レベル光学文字認識(OCR)モデルを提案する。
このモデルは、約160,000Uurduテキスト画像の包括的なデータセットに基づいてトレーニングされ、文字誤り率(CER)0.178を達成した。
このモデルの強みは、permuted autoregressive sequence (PARSeq)モデルを組み込んだ独自のアーキテクチャにある。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:58:13 GMT)
Exploring Cross-model Neuronal Correlations in the Context of Predicting Model Performance and Generalizability [2.7] 本稿では,新しいモデルを用いたモデルの性能評価手法を提案する。
提案手法は,1つのネットワーク内の各ニューロンに対して,類似の出力を生成する他のネットワークにニューロンが存在するかどうかを判定することにより相関性を評価する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:04:35 GMT)
Split-and-Denoise: Protect large language model inference with local differential privacy [2.6] Split-N-Denoise (SnD) はプライベートな推論フレームワークであり、最小の計算コストでクライアント側でトークン埋め込み層を実行するためにモデルを分割する。
各種LLMアーキテクチャおよび下流タスク間のプライバシ・ユーティリティ・トレードオフを最適化する上で,SnDの有効性を示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:28:12 GMT)
Computer User Interface Understanding. A New Dataset and a Learning Framework [2.4] コンピュータUI理解の難しい課題を紹介します。
ユーザがアクションのシーケンスを実行しているビデオのセットでデータセットを提示し、各画像はその時点のデスクトップコンテンツを表示する。
また,データセットに関連する特徴を付加する合成サンプル生成パイプラインを構成するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:36:12 GMT)
Quantum Complexity vs Classical Complexity: A Survey [2.4] 量子コンピューティングの潜在能力を最大限活用するためには、問題解決戦略の適応が不可欠である。
本稿では,量子コンピューティングによる複雑な古典的計算問題を解くことを目的とした先行研究の集約に焦点をあてる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:40:17 GMT)
Optimizing Structured Data Processing through Robotic Process Automation [2.4] 本研究では、構造化データ抽出における RPA の利用について検討し、手作業による処理よりもその優位性を評価する。
人為的なタスクとRPAソフトウェアボットが実行するタスクを比較することにより、請求書からのデータ抽出の効率性と精度を評価する。
本研究は,ロボットが作業の完了を手作業よりもはるかに少ない時間で行うことにより,RPAが達成した顕著な効率向上を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 05:53:02 GMT)
KAN-RCBEVDepth: A multi-modal fusion algorithm in object detection for autonomous driving [2.4] 本稿では, 自律走行における3次元物体検出の高速化を目的としたkan-RCBEVDepth法を提案する。
我々のユニークなBird’s Eye Viewベースのアプローチは、検出精度と効率を大幅に改善します。
コードはurlhttps://www.laitiamo.com/laitiamo/RCBEVDepth-KANでリリースされる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:46:53 GMT)
PoseWatch: A Transformer-based Architecture for Human-centric Video Anomaly Detection Using Spatio-temporal Pose Tokenization [2.3] ビデオ異常検出(VAD)はコンピュータビジョンにおいて重要な課題である。
人間中心のVADは、人間の振る舞いのバリエーション、データの潜在的なバイアス、および人間の被写体に関連する実質的なプライバシー上の懸念など、さらなる複雑さに直面している。
近年の進歩は、プライバシの懸念を緩和し、外観バイアスを低減し、背景干渉を最小限に抑えるために、人間のポーズを高レベルな特徴として活用するポーズベースのVADに焦点を当てている。
本稿では,人間中心のポーズに基づくVADに特化して設計された,新しいトランスフォーマーベースのアーキテクチャであるPoseWatchを紹介する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:40:14 GMT)
Rank, Pack, or Approve: Voting Methods in Participatory Budgeting [2.3] スタンフォード参加予算プラットフォームは、150以上の予算プロセスで住民を巻き込むために使われてきた。
ここでは,K-approval,K- rank,knapsackプライマリ・バロットを用いて,これらのプロセスから匿名化された予算意見のデータセットを提示する。
投票方法が異なる投票方法を用いた投票ペアを用いて,選択したプロジェクトのコストに対する投票方法の効果を分析する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:47:33 GMT)
Can LLM be a Good Path Planner based on Prompt Engineering? Mitigating the Hallucination for Path Planning [2.3] 本研究では、空間-関係変換とカリキュラムQ-Learning(S2RCQL)という革新的なモデルを提案する。
そこで我々は,Qラーニングに基づく経路計画アルゴリズムを設計し,文脈不整合の幻覚を緩和する。
プロンプトの補助情報として状態反応のQ-値を用いて,LLMの幻覚を補正する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:27:08 GMT)
AnomalousPatchCore: Exploring the Use of Anomalous Samples in Industrial Anomaly Detection [2.3] 視覚検査(英: visual inspection)または産業異常検出(英: industrial anomaly detection)は、製造業において最も一般的な品質管理タイプの一つである。
ほとんどの異常検出法は、通常のサンプルからのみ知識を利用でき、しばしば利用可能な異常サンプルからの情報を活用することができない。
そこで本研究では,異常検出システムであるAnomalousPatchCore(APC)を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:51:34 GMT)
Improving Water Quality Time-Series Prediction in Hong Kong using Sentinel-2 MSI Data and Google Earth Engine Cloud Computing [2.2] 本研究は,香港沿岸域におけるクロロフィルa (Chl-a), 懸濁固体 (SS), 濁度を予測するための時系列モデルを構築した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:02:49 GMT)
Baseline Results for Selected Nonlinear System Identification Benchmarks [2.1] 本稿では,5つのベンチマークにおいて,10種類のベースライン手法とその相対的性能について述べる。
本研究の目的は,識別手法の客観的比較に関する思考と議論を刺激することである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:28:35 GMT)
Evaluating the Impact of Multiple DER Aggregators on Wholesale Energy Markets: A Hybrid Mean Field Approach [2.1] 地域エネルギー市場への分散エネルギー資源の統合は、グリッドの柔軟性を大幅に向上させ、市場効率を向上し、より持続可能なエネルギーの未来に貢献することができる。
我々は、複数のDERアグリゲータを特徴とする市場モデルについて検討し、それぞれがDERリソースのポートフォリオを制御し、DER資産所有者に代わって市場への入札を行う。
本稿では,MFGフレームワーク内で各エージェントが最適な戦略を学習し,市場状況や不確実性に適応する能力を向上させるための強化学習(RL)手法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:56:28 GMT)
VHAKG: A Multi-modal Knowledge Graph Based on Synchronized Multi-view Videos of Daily Activities [2.0] 我々は,日常活動の同期型マルチビューシミュレートビデオに基づくMMKGを構築した。
私たちのMMKGには、ビデオフレーム内のボックスのバウンディングなど、フレームごとのきめ細かい変更が含まれています。
アプリケーション例として、MMKGが視覚言語モデルのベンチマークを容易にすることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:18:57 GMT)
Enhancing Uplift Modeling in Multi-Treatment Marketing Campaigns: Leveraging Score Ranking and Calibration Techniques [2.0] 昇降モデリングは、特定のマーケティングキャンペーンに対してポジティブに反応する可能性のある個人を選択することで、マーケティング戦略の最適化に不可欠である。
本稿では, スコアランキングとキャリブレーション技術を活用して, マルチトリートキャンペーンにおけるアップリフトモデリングの新たなアプローチを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:53:22 GMT)
AUTOGENICS: Automated Generation of Context-Aware Inline Comments for Code Snippets on Programming Q&A Sites Using LLM [2.0] ソースコードのインラインコメントは、理解しやすく、再利用しやすく、可読性も向上している。
Stack Overflow (SO)のようなQ&Aサイトでの回答のコードスニペットにはコメントがないことが多い。
これらの課題を踏まえ、我々は、大規模な言語モデルを利用して、SOのコードスニペットに対する効果的なインラインコメントを生成するために、SOと統合するために設計されたツールであるAUTOGENICSを紹介した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:21:13 GMT)
Intraoperative Glioma Segmentation with YOLO + SAM for Improved Accuracy in Tumor Resection [1.9] グリオーマは、健康な組織との類似性から、重要な外科的課題を呈する。
MRI画像は、脳のシフトなどの要因により、手術中は効果がないことが多い。
本稿では,You Only Look Once Version 8 (Yv8) と Segment Anything Model Vision Transformer-base を組み合わせたディープラーニングパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:58:08 GMT)
DiffSurf: A Transformer-based Diffusion Model for Generating and Reconstructing 3D Surfaces in Pose [1.9] 本稿では,DiffSurfについて述べる。DiffSurfは3次元表面の生成と再構成のための変圧器を用いた分極拡散モデルである。
このアーキテクチャによりDiffSurfは、人体、手、動物、人工物など、さまざまなポーズや形状で3D表面を生成することができる。
シングルイメージのヒューマンメッシュリカバリのタスクに適用すると、DiffSurfは、ほぼリアルタイムで以前のテクニックに匹敵する精度を達成できる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:28:01 GMT)
Unsupervised discovery of the shared and private geometry in multi-view data [1.9] 我々は低次元の共有変数とプライベート潜伏変数をアンハングリングする非線形ニューラルネットワークに基づく手法を開発した。
我々は,異なる雑音条件で解釈可能な共有構造とプライベート構造を探索するモデルの能力を実証する。
本手法を海馬と前頭前皮質の同時記録に応用し, マウスが直線軌道を走行している間に, 動物の位置を符号化する低次元の潜伏空間を発見する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:34:24 GMT)
IPAdapter-Instruct: Resolving Ambiguity in Image-based Conditioning using Instruct Prompts [1.9] IPAdapter-Instructは、自然画像の条件付けとInstruct'のプロンプトを組み合わせることで、同じ条件付け画像の解釈を切り替える。
タスクごとの専用モデルと比較して、品質の損失を最小限に抑えた複数のタスクを効率的に学習する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:39:18 GMT)
Enhancing Depression Diagnosis with Chain-of-Thought Prompting [1.9] 我々は,患者健康アンケート8(PHQ-8)のスコアを評価するためのチェーン・オブ・シント(CoT)を用いることで,AIモデルによるスコアの精度が向上すると考えている。
私たちの目標は、AIモデルによる人間の会話の複雑さに対する理解を広げ、患者の感情やトーンをより効果的に評価できるようにすることです。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:05:07 GMT)
Channel-Partitioned Windowed Attention And Frequency Learning for Single Image Super-Resolution [1.9] ウィンドウベースのアテンション手法は特にSingle Image Super-Resolution (SISR)においてコンピュータビジョンタスクに大きな可能性を示している。
特徴マップの高さと幅に沿ってウィンドウを逐次拡大することにより、長距離依存をよりよく捉えるために、チャネル分割型注意変換器(CPAT)を提案する。
さらに、空間・周波数相互作用モジュール(Spatial-Frequency Interaction Module, SFIM)を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:31:37 GMT)
Vertical Federated Graph Neural Network for Recommender System [1.8] グラフニューラルネットワーク(GNN)は、フェデレーションレコメンデータシステムにとって有望なアプローチになりつつある。
本研究は, VerFedGNN と呼ばれる垂直結合型 GNN ベースのリコメンデータシステムを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 01:31:35 GMT)
A Comprehensive Survey on Kolmogorov Arnold Networks (KAN) [1.7] Kanは複雑なデータパターンと非線形関係の処理に優れ、広範囲なアプリケーションの可能性を示している。
Kanは、様々な分野における革新的なソリューションの道を開いたいと考えており、複雑な計算問題にどのようにアプローチするかに革命をもたらす可能性がある。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:39:53 GMT)
Enhancing Robustness of Human Detection Algorithms in Maritime SAR through Augmented Aerial Images to Simulate Weather Conditions [1.7] 本稿では,海中SARにおける人間の検出精度を向上させることを目的として,様々な標高と地質的位置を含む頑健なデータセットを評価する。
その結果, 強化データセットを用いたモデルでは, ヒトのリコールスコアが0.891から0.911の範囲で, YOLOv5lモデルでは3.4%向上した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:07:20 GMT)
Optimal universal quantum circuits for unitary complex conjugation [1.6] この研究は、$U_d$のコール数$k$を複素共役$barU_d$に変換するための最適量子回路を示す。
我々の回路は並列実装を認めており、$k$と$d$の平均忠実度が$leftlangleFrightrangle =frack+1d(d-k)$に対して最適であることが証明されている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:24:18 GMT)
MMASD+: A Novel Dataset for Privacy-Preserving Behavior Analysis of Children with Autism Spectrum Disorder [1.6] MMASD+は3D-Skeleton、3D Body Mesh、OCRデータを含む多様なデータモダリティで構成されている。
11種類のアクションタイプとASDの存在を予測するために,マルチモーダルトランスフォーマーフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:05:48 GMT)
Explainable Hierarchical Urban Representation Learning for Commuting Flow Prediction [1.5] 通勤フロー予測は、現実の自治体の業務に欠かせない課題である。
我々は,異なるタイプのODフローを予測するために,意味のある領域埋め込みを生成するヘテロジニアスグラフベースモデルを開発した。
提案モデルでは,一様都市構造の観点から既存モデルよりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:30:01 GMT)
Data-Driven Nonlinear Deformation Design of 3D-Printable Shells [1.5] 本研究では,3次元プリント可能なシェルの設計・性能関係と圧縮力変位挙動を学習するための実験データに基づくニューラルネットワークを提案する。
何千もの物理的実験に基づいて、我々のネットワークは前方および逆設計の両方を補助し、所望の弾塑性および超弾性変形を示す殻を生成する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:30:06 GMT)
What Is Required for Empathic AI? It Depends, and Why That Matters for AI Developers and Users [1.5] 我々は、共感に関連するさまざまな能力の星座が、異なる共感的AIアプリケーションにとって重要であると論じる。
我々は、共感の傘の下で多様な能力に感謝することが、AIクリエイターとユーザーの両方にとって重要である理由を論じて結論付けた。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:27:22 GMT)
A global AI community requires language-diverse publishing [1.5] 我々は、英語の出版要件が、AIにおける幅広い抽出の体制を支え、強化していると論じる。
我々は3つのテーマを中心に組織されたより健康な出版文化のための代替的未来を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:20:10 GMT)
Once and for all: how to compose modules -- The composition calculus [1.4] 技術的なフレームワークでは、相互作用にはモジュールの構成が必要です。
相互作用するモジュールからなるデジタル世界のシステムを特徴付けるために,最小限の仮定セットを提案する。
この主張は、定理、性質、加群の特殊類、ケーススタディの豊富な体によって支持される。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:01:04 GMT)
Essentials of Petri nets [1.4] この貢献は、しばしば無視されるペトリネットのいくつかの概念と側面を強調しているが、著者が重要あるいは興味深いと考えていること、あるいはカール・アダム・ペトリが強調したことを強調している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:10:51 GMT)
Adversarial Manhole: Challenging Monocular Depth Estimation and Semantic Segmentation Models with Patch Attack [1.4] 本稿では,マンホールカバーを模倣してMDEモデルとSSモデルを偽装する実用的パッチを用いた,新たな逆襲攻撃を提案する。
我々はDepth Planar Mappingを使ってこれらのパッチを道路表面に正確に配置し、攻撃の有効性を高める。
以上の結果から,MDEでは相対誤差が43%,SSでは96%であった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:48:21 GMT)
Realtime Compilation for Continuous Angle Quantum Error Correction Architectures [1.3] 大規模量子プログラムを実行するには量子誤り訂正(QEC)が必要である。
本稿では,連続角度システムに対するプログラムのリアルタイムコンパイルを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 00:32:06 GMT)
DIVERSE: A Dataset of YouTube Video Comment Stances with a Data Programming Model [1.2] 本稿では,文調の弱い信号を利用したスタンスラベリング手法を提案する。
そして、最後のスタンスラベルのためのデータプログラミングモデルとこれらの信号を統合します。
国際紛争のとき、国家軍に対する世論の理解は徴兵に不可欠である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:46:31 GMT)
Earth Observation Satellite Scheduling with Graph Neural Networks [1.2] 本稿では,グラフニューラルネットワーク(GNN)と深部強化学習(DRL)に基づく観測結果の選択とスケジューリングを行う新しい手法を提案する。
シミュレーションにより,より大規模な実世界のインスタンスに一般化し,従来の手法と比較して非常に競争力のある性能で学習できることが示唆された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:10:26 GMT)
Text3DAug -- Prompted Instance Augmentation for LiDAR Perception [1.2] 都市シナリオのLiDARデータは、異種特性や固有のクラス不均衡など、ユニークな課題を提起する。
生成モデルを利用した新しいアプローチであるText3DAugを提案する。
Text3DAugはラベル付きデータに依存しておらず、テキストからインスタンスやアノテーションを生成する最初のタイプである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:50:13 GMT)
LyCon: Lyrics Reconstruction from the Bag-of-Words Using Large Language Models [1.2] 本研究では,公開されているBag-of-Wordsデータセットから著作権のない歌詞を生成する新しい手法を提案する。
我々は、有名なソースからのメタデータと一致した、再構成された歌詞のデータセットLyConをコンパイルし、利用可能にしました。
我々は、ムードアノテーションやジャンルなどのメタデータの統合は、歌詞に関する様々な学術実験を可能にすると信じている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:01:48 GMT)
A Computational Analysis of Lyric Similarity Perception [1.2] 人間の知覚との類似性をモデル化するための計算手法の比較分析を行う。
以上の結果から,事前学習したBERTモデルからの埋め込み,歌詞が導出される音声,知覚的歌詞の類似性を示す音声成分の類似性に基づく計算モデルが示唆された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:12:57 GMT)
Multilingual Text Style Transfer: Datasets & Models for Indian Languages [1.1] 本稿では,インド諸言語にまたがるTSTサブタスクである感情伝達に焦点を当てた。
これらの8言語それぞれに対して、1000の正と1000の負のスタイルパラレル文からなる専用データセットを導入する。
並列性,非並列性,クロスランガル性,共有学習アプローチに分類した各種ベンチマークモデルの性能評価を行った。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:51:00 GMT)
User-level Social Multimedia Traffic Anomaly Detection with Meta-Learning [1.1] ユーザレベルのソーシャルマルチメディアトラフィック異常検出のためのメタラーニング手法である textitMeta-UAD を提案する。
提案手法を2つの公開データセット上で評価し,Meta-UADの優位性をさらに証明した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:55:41 GMT)
Comprehensive Performance Evaluation of YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments [1.0] 本研究は, 商業用果樹園における果肉検出のためのYOLOv8, YOLOv9, YOLOv10オブジェクト検出アルゴリズムのすべての構成の性能評価を行った。
YOLOv9 は mAP@50 で YOLOv10 と YOLOv8 を上回り、YOLOv10x は 精度とリコールでテストされた 17 の構成で YOLOv10x を上回ります。
YOLOv8nはテストされた全ての構成の中で最も高い推論速度を示し、処理時間は4.1ミリ秒に達した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:25:47 GMT)
Deep Reinforcement Learning for Multi-Truck Vehicle Routing Problems with Multi-Leg Demand Routes [0.9] 既存のエンコーダ・デコーダのアテンションモデルに新たな拡張を加えて,複数のトラックとマルチレグルーティング要求を処理できるようにした。
私たちのモデルには、少数のトラックやノードに対してトレーニングを行い、大きなサプライチェーンに組み込んで、多数のトラックやノードに対するソリューションを提供するという利点があります。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:36:59 GMT)
Quantum Entanglement and Chocolates [0.9] 2つの統計アンサンブルは、2つの量子絡み合った状態、スピン一重項状態とGHZ状態を模倣するために構成される。
この違いは、量子絡み合いと古典的相関を区別する基本的な特徴を明らかにし、示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:26:44 GMT)
Writing in the Margins: Better Inference Pattern for Long Context Retrieval [0.9] The Margins (WiM) は、検索指向タスクにおける長い入力シーケンスの処理を最適化するために設計された推論パターンである。
提案したパターンが,コンテキスト処理の進捗状況に関する継続的な更新をエンドユーザに提供する対話型検索設計にどのように適合するかを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:34:38 GMT)
Perturbative gadgets for gate-based quantum computing: Non-recursive constructions without subspace restrictions [0.9] 本研究では,非再帰的,非断熱的・非断熱的摂動型ガジェットをサブスペース制約なく汎用的に導入する。
我々の構成では、$r$項からなる$k$ボディハミルトニアンに対して、$rk$追加キュービットが必要である。
また、異なる特性に合わせることができる類似のガジェットを構築するためのレシピも提供します。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:42:07 GMT)
Adversarial Attacks and Defenses in Multivariate Time-Series Forecasting for Smart and Connected Infrastructures [0.9] 時系列予測における敵攻撃の影響について検討する。
トレーニングプロセスへの入力を有害にするために、未ターゲットのホワイトボックスアタックを採用し、効果的にモデルを誤解させる。
これらの攻撃の有効性を実証し、敵の訓練とモデル硬化による堅牢なモデルを構築した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:44:31 GMT)
Conformal Disentanglement: A Neural Framework for Perspective Synthesis and Differentiation [0.8] 宇宙におけるいくつかの異なる視点から、異なる時点における物体の観測を行う。
ソース間で「共通」の完全な図像を合成する必要がある。
両タスクに対応可能なニューラルネットワークオートエンコーダフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:06:45 GMT)
Evaluating the Predictive Features of Person-Centric Knowledge Graph Embeddings: Unfolding Ablation Studies [0.8] そこで本研究では,MIMIC-IIIデータセットから得られた構造化情報と非構造化情報を用いて学習したGNNモデルの結果を体系的に検証する手法を提案する。
本研究は,PKGにおける読み出し予測の課題に対する予測的特徴の同定におけるこのアプローチの堅牢性を示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:48:25 GMT)
Residual-based Adaptive Huber Loss (RAHL) -- Design of an improved Huber loss for CQI prediction in 5G networks [0.7] 我々はResidual-based Adaptive Huber Loss (RAHL)という新しい損失関数を提案する。
RAHLは、不整合データ精度を維持しながら、外れ値に対する堅牢性をバランスさせる。
その結果、RAHLの優位性が確認され、5GネットワークにおけるCQI予測の強化に期待できる道が開かれた。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 00:58:32 GMT)
Packaging Up Media Mix Modeling: An Introduction to Robyn's Open-Source Approach [0.7] オープンソースの計算パッケージRobinnは、デジタル広告計測におけるm/MMMの採用を促進するために設計されている。
本稿では,Robininの基盤となる計算コンポーネントと設計選択について考察する。
広く採用され、積極的にメンテナンスされているオープンソースツールとして、Robinnは継続的な進化を続けている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:09:12 GMT)
Aligning XAI with EU Regulations for Smart Biomedical Devices: A Methodology for Compliance Analysis [0.7] 本研究は、バイオエレクトロニクスにおけるXAI応用とEU規制の厳格な規定の整合における重要なギャップを埋めるものである。
開発者と研究者に実践的なフレームワークを提供し、彼らのAIイノベーションが法的および倫理的基準に準拠していることを保証する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:59:27 GMT)
Benchmarking Reinforcement Learning Methods for Dexterous Robotic Manipulation with a Three-Fingered Gripper [0.7] 強化学習(RL)トレーニングは主に費用対効果と制御されたシミュレーション環境で行われる。
本研究では,厳密な操作を行うための実世界の制御環境におけるRLアルゴリズムの直接訓練について検討する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 02:52:15 GMT)
Automatic 8-tissue Segmentation for 6-month Infant Brains [0.7] 6カ月児脳に対する第1報8分節パイプラインを提案する。
パイプラインは生の6ヶ月の画像を入力として取り、出力として8単位のセグメンテーションを生成する。
DICEスコアは0.92、HD95は1.6、ASSDは0.42である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:58:23 GMT)
Empowering Sign Language Communication: Integrating Sentiment and Semantics for Facial Expression Synthesis [0.7] 本稿では,手話のための表情合成に焦点をあてた新しい手法を提案する。
我々の目標は、表情生成に感情情報を統合することで手話生成を改善することである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:55:18 GMT)
Regional quality estimation for echocardiography using deep learning [0.7] 心エコー画像の画質の推定は、オペレーターを誘導し、臨床測定の精度を確保するのに有用である。
過去の研究はしばしば、心エコー図の視線精度と画質の区別に失敗する。
本研究では,画像品質を推定する3つの手法を開発し,比較した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:09:18 GMT)
DualKanbaFormer: Kolmogorov-Arnold Networks and State Space Model DualKanbaFormer: Kolmogorov-Arnold Networks and State Space Model Transformer for Multimodal Aspect-based Sentiment Analysis [0.6] マルチモーダルアスペクトベースの感情分析(MABSA)は、テキストと画像のような他のデータ型を組み合わせることで感情検出を強化する。
我々はKAN(Kolmogorov-Arnold Networks)とSelective State Space Model(Mamba) Transformer(DualKanbaFormer)を提案する。
我々のモデルは、2つの公開データセットに関する最新技術(SOTA)研究より優れています。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:33:15 GMT)
Practical quantum advantage on partially fault-tolerant quantum computer [0.6] 我々は、早期FTQCデバイスにおける実用的な量子アドバンテージを実現するための代替手法を提案する。
我々のフレームワークは、空間的オーバーヘッドを最小限に抑えるために、部分的にフォールトトレラントな論理演算に基づいている。
フレームワークの潜在能力を生かした,有望なアプリケーションをいくつか紹介する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:58:09 GMT)
Compilation of Trotter-Based Time Evolution for Partially Fault-Tolerant Quantum Computing Architecture [0.6] 2次元ハバードモデルハミルトンの時間発展をシミュレーションする効率的な方法を提案する。
解析の結果, 単純直列コンパイルに比べて10倍以上の高速化が得られた。
物理誤差率が$p_rm phys = 10-4$のデバイスの場合、地上でのエネルギー推定を高速化するためには、およそ6.5倍 104$ の物理量子ビットが必要であると推定する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:07:34 GMT)
On latent dynamics learning in nonlinear reduced order modeling [0.6] 本稿では,パラメータ化非線形時間依存PDEの次数モデリングのための潜在力学モデル(LDM)の数学的枠組みを提案する。
フルオーダーモデル (FOM) 解の LDM 近似に対する誤差と安定性の推定を導出するために, 時間連続的な設定を用いる。
ディープニューラルネットワークは離散LDM成分を近似し、FOMに関して有界近似誤差を提供する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:35:06 GMT)
A Comprehensive Benchmark of Machine and Deep Learning Across Diverse Tabular Datasets [0.6] 本稿では,Deep Learningモデルが優れているデータセットのタイプを特徴付けるためのベンチマークを紹介する。
我々は回帰タスクと分類タスクを含む20の異なるモデルで111のデータセットを評価した。
このベンチマークの結果に基づいて、我々は、DLモデルが86.1%の精度で代替手法より優れているシナリオを予測するモデルを訓練する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:58:52 GMT)
On the Effects of Small Graph Perturbations in the MaxCut Problem by QAOA [0.6] 量子近似最適化アルゴリズム(QAOA)を用いたグラフクラスにおける最大カット(MaxCut)問題について検討する。
特に、グラフ対称性とQAOAシミュレーションによって達成される近似比の関係に関する摂動を考察する。
グラフのスペクトルとその摂動の分析を通じて、対称性がQAOAの性能に与える影響についての貴重な知見を抽出することを目的としている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:38:23 GMT)
A Review of Transformer-Based Models for Computer Vision Tasks: Capturing Global Context and Spatial Relationships [0.6] トランスフォーマーモデルによる自然言語処理(NLP)の展望の変化
これらのモデルは、長距離依存やコンテキスト情報をキャプチャする能力で有名である。
コンピュータビジョンにおけるトランスフォーマーモデルの研究の方向性と応用について論じる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:22:18 GMT)
Measuring the Quality of Answers in Political Q&As with Large Language Models [0.5] 本稿では,政治質問・回答セッションにおける回答の質を評価するための新しいアプローチを提案する。
本稿では,初期質問を正確に推測できる度合いに基づいて,回答の品質を測定することを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 22:51:57 GMT)
Multidimensional Quantum Walks, with Application to $k$-Distinctness [0.5] 時間複雑性に対して$widetildeOleft(n3/4-1/4(2k-1)right)の新たな上限を与える。
この新しい手法を用いて,$O(n)$クエリと$O(n2)$タイムで溶接木を解く方法を示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:49:10 GMT)
Overcoming the fundamental limit of quantum transduction via intraband entanglement [0.5] 量子トランスデューサは、入力信号を離れた周波数帯域の出力プローブに変換する。
キャビティ電気光学・電気光学変換器の効率帯域幅積は、ポンプパワーと非線形結合係数によって基本的に制限されていることを示す。
本研究では、帯域内絡みを消費することで、ノイズのない転送効率を向上させることを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 00:50:14 GMT)
Creating Image Datasets in Agricultural Environments using DALL.E: Generative AI-Powered Large Language Model [0.4] 画像生成のアプローチとして,テキスト・ツー・イメージと画像・ツー・イメージの2つのアプローチを用いた。
画像から画像までの手法で生成した画像は、テキストから画像へのアプローチで生成した画像よりも現実的であった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:43:17 GMT)
Dynamic operator management in meta-heuristics using reinforcement learning: an application to permutation flowshop scheduling problems [0.3] 本研究では,メタヒューリスティックスにおける探索演算子のポートフォリオを動的に管理する強化学習に基づくフレームワークを開発する。
動的に更新されたポートフォリオから最も適切な演算子を選択するために、Qラーニングに基づく適応演算子選択機構を用いる。
提案するフレームワークの性能は,置換フローホップスケジューリング問題への適用を通して解析する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:38:17 GMT)
Optimizing Lung Cancer Detection in CT Imaging: A Wavelet Multi-Layer Perceptron (WMLP) Approach Enhanced by Dragonfly Algorithm (DA) [0.3] 本研究では,CTスキャン画像から肺がんを分類するための最先端のディープラーニングフレームワークを提案する。
この研究には、画像前処理戦略、特にCannyエッジ検出とウェーブレット変換が含まれる。
この手法は99.82%の優れた訓練と検査精度を達成し、肺癌の正確な診断の有効性と信頼性を裏付けている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:27:47 GMT)
Learning from Complementary Features [0.3] 我々は、正確な情報によって定義される特徴を通常の特徴(OF)、補完的な情報によって定義される特徴を補完的特徴(CF)と呼ぶ。
本稿では,理論上保証されたグラフに基づく推定法と,その実用的な近似法を提案し,CFに対応する値の推定を行う。
実世界のデータを用いて数値実験を行った結果,提案手法はCFに対応する値を効果的に推定し,出力ラベルを予測する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 05:28:52 GMT)
Bayesian retrodiction of quantum supermaps [0.3] 量子スーパーマップの量子過程を考慮した量子ベイズ則の高次一般化について検討する。
量子チャネルの信念を更新するためのルールは、"リバース"量子スーパーマップを通じて実装できる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 05:12:02 GMT)
On the effectiveness of smartphone IMU sensors and Deep Learning in the detection of cardiorespiratory conditions [0.2] 本研究は, 心肺疾患の早期スクリーニングのための, 取得プロトコルに基づく革新的な手法を提案する。
5つの異なる身体領域の加速度計とジャイロスコープで得られた呼吸動態を記録したデータセットを臨床的に収集した。
本研究では,早期心肺疾患スクリーニングのためのエンド・ツー・エンドのディープラーニングパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:29:47 GMT)
Comments or Issues: Where to Document Technical Debt? [0.2] Self-Admitted Technical Debt (SATD)は、開発者がソースコードコメント(SATD-C)やイシュー(SATD-I)を使って負債を文書化する技術的負債の一形態である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:47:49 GMT)
Are Large Language Models Actually Good at Text Style Transfer? [0.2] テキストスタイル転送(TST)を用いた大規模言語モデル(LLM)の性能解析を行う。
TSTは、中核的な内容を保持しながら、テキストの言語スタイルを変更することを含む。
我々は、ゼロショットと少数ショットのプロンプトと、公開されているデータセットに対するパラメータ効率の微調整を用いて、事前訓練されたLLMの能力を評価する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:53:16 GMT)
SONICS: Synthetic Or Not -- Identifying Counterfeit Songs [0.2] 我々は、エンドツーエンド合成歌検出(SSD)のための新しいデータセットSONICSを紹介する。
歌唱における時間的長期依存性をモデル化することの重要性を強調した。
提案する新しいモデルSpecTTTraは,CNNやTransformerベースのモデルに比べて最大3倍高速で,メモリ効率が6倍高い。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:14:14 GMT)
Realisation of a Coherent and Efficient One-Dimensional Atom [0.2] コヒーレントで効率的に結合された1次元原子は大きな非線形性を提供し、フォトニック量子ゲートを可能にする。
ここでは、1次元原子の実装として、オープンマイクロキャビティ内の半導体量子ドットを用いる。
この結果は、エキゾチックなフォトニック状態と2光子相ゲートの創出への道を開くものである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:05:37 GMT)
Single-Shot Quantum Error Correction in Intertwined Toric Codes [0.1] ユーザフレンドリーで透過的な方法で単発誤り訂正を行うサブシステムコードを構築する。
以前のコードは単発誤り訂正の特性を共有していたが、ITCは物理的に動機づけられた起源によって区別されている。
ITCのシンドロームは、KubicaとVasmerのシングルショットコードのシンドロームに似ている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 23:07:34 GMT)
A little bit of self-correction [0.1] 有限スピン鎖の低温量子熱力学における安定部分空間の出現について検討する。
準安定部分空間の出現は基底状態の絡み合い構造に直接関係しない
この研究は、非可換な多くの体モデルの熱力学に非自明な量子的挙動が存在することを強調している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:22:38 GMT)
Efficient and Accurate Memorable Conversation Model using DPO based on sLLM [0.1] 本稿では,セッション進行時にメモリを効率的に管理する会話モデルを提案する。
DPOアルゴリズムを用いたモデルでは,BERTScoreの約0.0591のメモリ精度が向上した。
本モデルでは, 精度だけでなく資源利用においても効率性を示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:43:59 GMT)
Low-cost demonstration of the Zeeman effect: From qualitative observation to quantitative experiments [0.1] 基本的な量子現象であるゼーマン効果は、磁場と原子系の相互作用を示す。
ここでは、ゼーマン効果を直接視覚的に観察できる低コストな実験について述べる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:31:00 GMT)
Deep thermalization under charge-conserving quantum dynamics [0.0] 深熱化」は量子多体力学における普遍波動関数分布の出現を記述している。
本研究では, 連続内部対称性と関連する保存則が深部熱化に及ぼす影響について詳細に検討した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:00:01 GMT)
When All Options Are Wrong: Evaluating Large Language Model Robustness with Incorrect Multiple-Choice Options [0.0] LLM(Large Language Models)は、正しい答えなしに複数の質問を検出できる。
この能力は、主題に関する知識の尺度としてだけでなく、批判的思考の指標としても用いられる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:27:43 GMT)
Weakly Fault-Tolerant Computation in a Quantum Error-Detecting Code [0.0] 完全なフォールトトレランスを達成する多くの現在の量子誤り訂正符号は、論理量子ビットと物理量子ビットの比率が低く、大きなオーバーヘッドがある。
我々は,[n,n-2,2]]量子誤り検出符号の構成を,単一故障ゲートから任意の誤りを検出する中間点として提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:25:36 GMT)
Using LLMs for Explaining Sets of Counterfactual Examples to Final Users [0.0] 自動意思決定シナリオでは、因果推論手法は基礎となるデータ生成プロセスを分析することができる。
カウンターファクトな例では、最小限の要素が変更される仮説的なシナリオを探求する。
本稿では,アクションの自然言語説明を生成するために,反事実を用いた新しい多段階パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:13:06 GMT)
Unlikely Organizers: The Rise of Labor Activism Among Professionals in the U.S. Technology Industry [0.0] 2017年以降、テックワーカーの間では労働行動が著しく増加しています。
我々は、その後の労働活動の高度化に先立って、激しい職場社会活動の期間を示す。
この発見は、ファンタジアの合理主義の文化をプロの労働者に広げるものである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:35:59 GMT)
Understanding GNNs for Boolean Satisfiability through Approximation Algorithms [0.0] 本稿では,ブール満足度という文脈におけるグラフニューラルネットワークの解釈可能性について論じる。
目標は、これらのモデルの内部の動作を軽視し、意思決定プロセスに対する洞察力のある視点を提供することです。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:47:09 GMT)
Training-Free Time-Series Anomaly Detection: Leveraging Image Foundation Models [0.0] 画像ベースでトレーニング不要な時系列異常検出(ITF-TAD)手法を提案する。
ITF-TADは、時系列データをウェーブレット変換を用いて画像に変換し、それらを単一の表現に圧縮し、画像基礎モデルを利用して異常検出を行う。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:12:08 GMT)
Towards turbine-location-aware multi-decadal wind power predictions with CMIP6 [0.0] ガウシアン・プロセスのダウンスケーリング時にタービン位置を含めることで,風力予測に有用であることを示す。
この研究は、地球規模の気候モデル出力を用いたマルチデスカルタービン位置対応風力発電予測に向けた第一歩である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:04:08 GMT)
Tipta uzmanlik sinavinda (tus) buyuk dil modelleri insanlardan daha mi basarili? [0.0] 本研究では,トルコの医学的問題に対する3つの異なる人工知能モデルの性能評価を行った。
Geminiは82問、ChatGPT-4は105問、ChatGPT-4oは117問を正解した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:31:09 GMT)
Time-space encoded readout for noise suppression and scalable scanning in optically active solid-state spin systems [0.0] Time to Space (T2S) は光リードアウトからスピン操作をデカップリングする。
時間追跡により、光学的読み出し位置は時間の関数として符号化される。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:15:03 GMT)
The virtual CAT: A tool for algorithmic thinking assessment in Swiss compulsory education [0.0] 本稿では,スイスの強制教育におけるアルゴリズムスキルの評価を目的とした,教師なし評価活動のデジタル適応である仮想クロスアレイタスク(CAT)を紹介する。
このプラットフォームは、スケーラブルで自動化されたアセスメントを提供し、人間の関与を減らし、潜在的なデータ収集エラーを軽減する。
その結果, 多様な年齢, 開発段階, 教育的背景を持つ学生のATスキルを評価するためのプラットフォームの有用性, 習熟度, 適性を示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:02:48 GMT)
The AI-Native Software Development Lifecycle: A Theoretical and Practical New Methodology [0.0] このホワイトペーパーは、完全にAIネイティブなSDLCの出現を提案する。
本稿では,AIを終端から終端まで組み込んだ従来のV-モデルの適応であるV-バウンスモデルを紹介する。
このモデルは、AIが実装エンジンとして機能するバリデータや検証者に至るまで、主要な実装者から人間の役割を再定義する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:10:23 GMT)
Targetin the partition function of chemically disordered materials with a generative approach based on inverse variational autoencoders [0.0] そこで本研究では,生成機械学習を用いて特性評価を行う手法を提案する。
本手法では,エンコーダとデコーダの逆の役割を持つ特定の種類の変分オートエンコーダを用いる。
本稿では, (U, Pu)O2混合酸化物燃料における点欠陥生成エネルギーと濃度の計算によるアプローチについて述べる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:05:37 GMT)
Subgroup Analysis via Model-based Rule Forest [0.0] モデルベースDeep Rule Forests (mobDRF)は、データから透明なモデルを抽出するために設計された解釈可能な表現学習アルゴリズムである。
高齢者の認知機能低下の要因を明らかにするためにmobDRFを適用し,サブグループ分析と局所モデル最適化の有効性を実証した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:40:15 GMT)
Structural Stability Hypothesis of Dual Unitary Quantum Chaos [0.0] 十分なエネルギースケールのスペクトル相関は、ランダム行列理論によって説明される。
この特性の運命は、双対ユニタリから汎用量子回路に移行する際に考慮する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:47:19 GMT)
Strategic Optimization and Challenges of Large Language Models in Object-Oriented Programming [0.0] 本研究ではオブジェクト指向プログラミング(OOP)フレームワークにおけるメソッドレベルのコード生成に焦点を当てる。
我々は,プロンプトにおける文脈情報の範囲を変化させる実験を考案した。
その結果,メソッド呼び出しの詳細が豊富なプロンプトが最もコスト効率が高いことが示唆された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:44:16 GMT)
Stability Analysis of Physics-Informed Neural Networks for Stiff Linear Differential Equations [0.0] 物理インフォームドニューラルネットワーク(PINN)の安定性解析について述べる。
線形微分方程式の数値解として線形ODEと線形放物型PDEの系を考える。
提案したPINNは,様々なステップサイズにおいて,数値近似精度と計算コストの両方において,従来の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 20:33:16 GMT)
Squeezing light to get non-classical work in quantum engines [0.0] 光は、いくつかの相における電場の量子的不確実性を減少させることで、硬化することができる。
簡単な量子光子エンジンにおいて、この純量子効果を用いて、放射圧からネット機械的な働きを抽出する方法を示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:18:36 GMT)
Spectral properties of Levy Rosenzweig-Porter model via supersymmetric approach [0.0] rho(E)$はエルゴディックとフラクタル相の遷移を通してシステムを駆動する制御パラメータに大きく依存することを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:01:18 GMT)
Site-selective cavity readout and classical error correction of a 5-bit atomic register [0.0] サイト選択型ハイパーファインステートキャビティ・リードアウトを10サイトアレイで実現した。
論理的誤りの指数的に抑制し,論理的記憶を1ビットのアイドリング寿命を超えて5倍に拡張することを示した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:00:02 GMT)
Single-shot latched readout of a quantum dot qubit using barrier gate pulsing [0.0] 量子ドット量子ビットを1つの貯水池で単発計測する手法について,ラッチ・リードアウト方式を用いて提案する。
我々のアプローチは、クビット・ツー・レザーバ・トンネルの速度を動的に制御するためにバリアゲートを脈動させることである。
この方法を用いて、Si/SiGe量子ドットハイブリッド量子ビットのコヒーレントラーモア振動の測定において、量子ビット状態ラッチを可能とし、量子ビットリセット時間を短縮する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:39:18 GMT)
Simultaneous Training of First- and Second-Order Optimizers in Population-Based Reinforcement Learning [0.0] 人口ベーストレーニング(PBT)は、トレーニング全体を通してハイパーパラメータを継続的にチューニングすることで、これを実現する方法を提供する。
本稿では,単一個体群内における第1次と第2次の両方を同時に活用することにより,PBTの強化を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:54:26 GMT)
Scalable Supervisory Architecture for Autonomous Race Cars [0.0] 本稿では,自律走行用に設計されたスケーラブルなアーキテクチャを提案する。
モジュール性、さまざまな構成への適応性、パイプラインの並列実行を監視できることを強調している。
結果は、アーキテクチャのスケーラビリティと汎用性を確認し、競争力のある自律レースシステムを開発するための堅牢な基盤を提供する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:19:17 GMT)
SWAP and Transpose by displacements, Stabilizer Renyi entropies for continuous variables and qudits and other applications [0.0] ワイル函数の正規化恒等式を素早く証明するために、どのようにして関係が用いられるかを示す。
ワイル函数の正規化恒等式を素早く証明するために、どのようにして関係が用いられるかを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:58:17 GMT)
Review: Quantum Metrology and Sensing with Many-Body Systems [0.0] 量子センシングのための別のフレームワークが、量子多体システムを利用して開発されている。
多体プローブは平衡と非平衡の両方のシナリオで用いられている。
非平衡のシナリオでは、Floquet、散逸性、および時間結晶相転移に対する量子増強感度が発見された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:00:01 GMT)
Resource theories with completely passive states and passive states as free states [0.0] 量子システムから抽出可能な作業は、いくつかの資源理論に関連付けられるリソースである。
完全に受動的状態と受動的状態を自由状態として考えることにより、最大作業が単調であるような資源理論を定式化する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:35:01 GMT)
Reconstructing the spatial structure of quantum correlations in materials [0.0] 量子相関は多体状態の基本的な性質である。
しかし、それらがいまだに解明され、真の量子材料の認証を妨げている。
中性子散乱による運動量依存的力学挙動は、量子相関の一般の族となることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:52:32 GMT)
Recent Advances in Semiclassical Methods Inspired by Supersymmetric Quantum Mechanics [0.0] 最近の研究では、超対称性量子力学と半古典的手法の正確性の間に深い関係が示されている。
具体的には、従来の形状不変ポテンシャルの数学的形式は、いくつかの関連する状況において正確性を保証する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:57:02 GMT)
Quartered Chirp Spectral Envelope for Whispered vs Normal Speech Classification [0.0] そこで本研究では,発声音声と正常音声を分類するために,クオードチャープスペクトルエンベロープという新機能を提案する。
この機能は、1次元の畳み込みニューラルネットワークでトレーニングされ、スペクトルエンベロープのトレンドをキャプチャする。
提案システムは,ホワイトノイズの存在下で,技術状況よりも優れた性能を発揮する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:56:22 GMT)
Quantum thermodynamics with fast driving and strong coupling via the mesoscopic leads approach [0.0] 熱浴と強く結合した駆動量子系の熱力学を理解することは、量子熱力学とメソスコピック物理学の中心的な焦点である。
メソスコピックリードのアプローチは、最近定常的な熱機械に一般化され、非相互作用極限でランダウアーB"ユティカー理論を再現する能力を持つ。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:47:39 GMT)
Quantum speed limit for states and observables of perturbed open systems [0.0] 乱れのない軌道からの乱れ開き系の分岐について述べる。
弱い結合の場合、発散速度は摂動ハミルトニアンの下での量子フィッシャー情報によって境界づけられていることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:20:11 GMT)
Quantum sensing in Kerr parametric oscillators [0.0] QPTにおける基底状態の変化はパラメータ推定の指標を強化する。
QPTを欠いたシステムでは、励起状態の量子相転移のため、量子感度を向上することができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:04:28 GMT)
Quantum annealing showing an exponentially small success probability despite a constant energy gap with polynomial energy [0.0] 断熱状態はエネルギーギャップと遷移行列の2つの部分からなる。
QAの成功確率は、指数関数的に減少するエネルギーギャップにより指数関数的に減少すると考えられている。
計算コストのスケーリングは従来のQAに比べて2次的に改善されていることを数値的に示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:28:21 GMT)
Quantum Games and Synchronicity [0.0] 非局所的なゲームを拡張して、量子問題と答えを許容する。
方程式はテンソル圏の図式計算を用いて表される。
戦略、相関、同期性を含む標準定義を拡張します。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 23:27:59 GMT)
Quantifying Light-assisted Collisions in Optical Tweezers Across the Hyperfine Spectrum [0.0] 光学的ツイーザを用いた2つの原子間の共鳴-双極子相互作用における超微細構造の役割について検討した。
我々の研究は、レーザー誘起衝突による低温原子や分子の制御において、超微細構造を利用するための重要な洞察を提供する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:41:40 GMT)
Project SHADOW: Symbolic Higher-order Associative Deductive reasoning On Wikidata using LM probing [0.0] 本稿では,連想帰納的推論を用いた中間タスクで訓練された微調整言語モデルであるSHADOWを紹介する。
LM-KBC 2024チャレンジでSHADOWを評価し,F1スコア68.72%でベースライン解を20%上回る結果を得た。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:01:13 GMT)
Phase Transition in the Quantum Capacity of Quantum Channels [0.0] ホワイトノイズによって汚染された場合、量子チャネルの量子容量が消滅することを証明する。
チャネルの正確な形を提供し、それを補体に接続します。
このチャネルのために確立したゼロ容量領域は、これまで知られていたエンタングルメント結合しきい値よりも大幅に大きい。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:08:41 GMT)
Performance of Antenna-based and Rydberg Quantum RF Sensors in the Electrically Small Regime [0.0] ライドバーグ原子電場センサ(Rydberg atom electric field sensor)は、感度無線周波数(RF)測定を行う量子センサーである。
我々は,cmスケールのRydbergセンサの信号検出感度を,同じ大きさの室温小型アンテナと比較した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 00:14:59 GMT)
Pareto Front Approximation for Multi-Objective Session-Based Recommender Systems [0.0] MultiTRONは、マルチオブジェクトセッションベースのレコメンデータシステムに近似技術を適用するアプローチである。
提案手法は,選好ベクトルの学習によるクリックスルーや変換率といった重要な指標間のトレードオフを最適化する。
大規模なオフラインおよびオンライン評価を通じて、モデルの性能を検証する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:07:28 GMT)
Parameter-Efficient Quantized Mixture-of-Experts Meets Vision-Language Instruction Tuning for Semiconductor Electron Micrograph Analysis [0.0] 半導体製造に適した小型ビジョン言語アシスタントであるsLAVAを紹介する。
データ不足の課題に対処し、高品質のエキスパートアノテートされたデータを取得する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:59:26 GMT)
Panoptic Perception for Autonomous Driving: A Survey [0.0] 本調査では,典型的な汎視知覚モデルについて検討し,性能,応答性,資源利用量と比較した。
また、汎視的知覚で直面する一般的な課題を掘り下げ、将来の研究のための潜在的な軌道を探究する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 20:14:42 GMT)
Optimal number of stabilizer measurement rounds in an idling surface code patch [0.0] コードパッチに符号化された論理量子ビットに対する安定化器測定ラウンドの速度を数値的に最適化する。
我々は、ゲート誤差、読み出し誤差、振幅、位相減衰を含む回路レベルの環境騒音をモデル化する。
定性的には、安定した測定ラウンドの最適な数は、より良いキュービットのために小さくなり、より良いゲートやより大きなコードサイズのために大きくなっています。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:34:52 GMT)
One other parameterization of SU(4) group [0.0] Lie $mathfraksu(4)$代数を部分空間の直和に分解する。
$ with $mathfrakk=mathfraksu(2)oplusmathfraksu(2)$と3次元アベリア部分代数の3重項
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:03:14 GMT)
On the Hamiltonian for the Hilbert-Pólya Conjecture [0.0] Hilbert-P'olya Conjecture の候補であるハミルトニアンが導入された。
ここでは、対応する固有函数が二乗可積分であること、そして決定的に、固有値が実であることをエレガントに示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:16:00 GMT)
Non-adiabatic couplings as a stabilization mechanism in long-range Rydberg molecules [0.0] アルカリリドベルク分子では、これらのポテンシャル井戸がレベル反発によって破壊される場合でも、境界振動状態が存在する。
ボルン・オッペンハイマー近似で計算された分子状態を比較することで、非断熱結合が振動エネルギーと寿命に与える影響を評価することができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:47:56 GMT)
Multi-Modal Instruction-Tuning Small-Scale Language-and-Vision Assistant for Semiconductor Electron Micrograph Analysis [0.0] 半導体製造における電子顕微鏡画像の解析と解釈のための新しい枠組みを提案する。
このフレームワークは、訓練済みのマルチモーダルな大規模言語モデルを活用する、ユニークな教師/学生のアプローチを採用している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:50:04 GMT)
Molecular Entanglement Witness by Absorption Spectroscopy in Cavity QED [0.0] 我々は、量子フィッシャー情報を多部交絡証人として研究する。
キャビティ量子力学における超強光-マターカップリングの分子間絡み合いは良好であることを示す。
本研究は, 室温で化学系の分子間絡み合いを検出するための一般的なプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 05:11:57 GMT)
Models of interacting bosons with exact ground states: a unified approach [0.0] 数保存ボソンに対するフラストレーションフリー''相互作用格子量子ハミルトニアンの無限クラスを定義する。
量子二量体モデルやLevin-Wen文字列ネットモデルを含む、既知の様々な可解モデルのボソン表現を得る。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:00:00 GMT)
Measuring text summarization factuality using atomic facts entailment metrics in the context of retrieval augmented generation [0.0] 2022年にChatGPTが導入されて以来、大きな言語モデル(LLM)の利用は大幅に増加した。
本稿では,LLMが生成した要約の事実性を,ソーステキストと比較して推定する手法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:09:56 GMT)
Measuring publication relatedness using controlled vocabularies [0.0] 制御された語彙は関連性を測定するための有望な基盤を提供する。
様々な種類の研究課題に対して、その正確さと適合性に関する包括的かつ直接的なテストは存在しない。
本稿では,既存の測度をレビューし,新しい測度を開発し,TRECゲノミクスデータを用いた測度をトピックの基礎的真理として評価する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:41:37 GMT)
MaskCycleGAN-based Whisper to Normal Speech Conversion [0.0] 本稿では,通常の音声への変換のためのMaskCycleGANアプローチを提案する。
マスクパラメータをチューニングし,音声活動検出器で信号の事前処理を行うことで,性能が向上することがわかった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:07:18 GMT)
Localising the Seizure Onset Zone from Single-Pulse Electrical Stimulation Responses with a CNN Transformer [0.0] てんかんは最も一般的な神経疾患の1つで、薬が発作を制御できない場合に外科的治療を必要とすることが多い。
効果的な外科的結果を得るためには、てんかん原性焦点の正確な局所化が重要であるが、依然として課題である。
本研究では,Single-Pulse Electro Stimulation (SPES) 応答を用いた深層学習のSOZローカライゼーションへの応用を推し進める。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:53:41 GMT)
Literary and Colloquial Dialect Identification for Tamil using Acoustic Features [0.0] 音声技術は、言語の様々な方言が絶滅しないようにする役割を担っている。
現在の研究は、人気のある2つのタミル方言と広く分類されたタミル方言を識別する方法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:00:27 GMT)
Linear gate bounds against natural functions for position-verification [0.0] 量子位置検証スキームは、証明者の空間的位置を検証しようとする。
我々は、$f$-routing(英語版)と$f$-BB84(英語版)として知られる2つのよく研究された位置検証スキームを考える。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:26:04 GMT)
Leveraging RNNs and LSTMs for Synchronization Analysis in the Indian Stock Market: A Threshold-Based Classification Approach [0.0] 本研究は,機械学習と非線形時系列解析を用いて株価の同期を予測するための新しいアプローチを提案する。
この手法を21年間にわたるインド市場からの20の高資本株のデータセットに適用する。
その結果,本手法は株価同期を精度0.98,F1スコア0.83で予測できることがわかった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:08:37 GMT)
Latent Ewald summation for machine learning of long-range interactions [0.0] 本稿では,局所的な原子ディスクリプタから潜伏変数を学習することにより,長距離相互作用を考慮した簡便かつ効率的な手法を提案する。
荷電, 極性, 無極性分子二量体, バルク水, 水蒸気界面などのシステムでは, 標準的な短距離MLIPが非物理的予測に繋がることを示した。
長距離モデルはこれらのアーティファクトを効果的に排除し、短距離MLIPの計算コストの約2倍に過ぎなかった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:03:18 GMT)
Knowledge Discovery in Optical Music Recognition: Enhancing Information Retrieval with Instance Segmentation [0.0] 光音楽認識(OMR)は、画像からMusicXML、MEI、MIDIなどの機械可読フォーマットに音符の書き起こしを自動化する。
本研究では,MAsk R-CNNを用いたサンプルセグメンテーションを適用してOMRにおける知識発見について検討し,楽譜における記号の検出とデライン化を強化する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:34:41 GMT)
Joint estimation of noise and nonlinearity in Kerr systems [0.0] 我々は、コヒーレントプローブを用いたセルフケラー相互作用の存在下での損失チャネルと劣化チャネルのキャラクタリゼーションに対処する。
損失Kerrチャネルについては, 損失特性がKerr非線形性の存在下で向上していることを示す。
カーチャネルを劣化させるためには、2つのパラメータのQFIは非線形性とは独立であり、拡張は観測されない。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:32:57 GMT)
Impact of dark states on the stationary properties of quantum particles with off-centered interactions in one dimension [0.0] 一次元に閉じ込められた非相対論的粒子に対する2体接触相互作用の一般化を提案する。
粒子は距離cが離れているときにのみ相互作用する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:33:28 GMT)
Holographic Foliations: Self-Similar Quasicrystals from Hyperbolic Honeycombs [0.0] 任意の(d+1$)-次元双曲空間の正則テッセルレーションが、自相的な '準結晶' の性質を持つ$d$-次元境界幾何学を自然に持つかを記述する。
特に境界幾何学は局所的で可逆で自己相似な置換によって記述され、共形幾何学を区別するタイリングである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:00:00 GMT)
Gravity from entropy [0.0] 重力はエントロピー的作用結合物質場と幾何学から導かれる。
物質場は時空を曲線とし、物質場によって誘導される計量を定義する。
この場の理論の正準量子化は、量子重力に対する新たな洞察をもたらす可能性がある。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:47:56 GMT)
Graph Attention Inference of Network Topology in Multi-Agent Systems [0.0] 本研究は,マルチエージェントシステムの将来の状態を予測するためのアテンションメカニズムを活用する,機械学習に基づく新しいソリューションを提案する。
次に、注目値の強さからグラフ構造を推定する。
提案したデータ駆動型グラフアテンション機械学習モデルにより,マルチエージェントシステムにおけるネットワークトポロジを同定できることを示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 23:58:51 GMT)
GSIFN: A Graph-Structured and Interlaced-Masked Multimodal Transformer Based Fusion Network for Multimodal Sentiment Analysis [0.0] マルチモーダル感性解析(MSA)における2つの重要な問題を解くために,グラフ構造化・インターラケット型マルチモーダルトランス(GSIFN)を提案する。
All-modal-in-one Transformerベースの核融合を実現し、計算オーバーヘッドを大幅に削減する。
GSIFNは、最先端の手法に比べて計算オーバーヘッドが大幅に小さく、優れた性能を示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 06:44:28 GMT)
GNN: Graph Neural Network and Large Language Model for Data Discovery [0.0] 我々のアルゴリズムであるGNNは、グラフニューラルネットワークと大規模言語モデルを用いて、テキストの型値を理解する。
GNNは、テキストタイプ値とユーザの好みを理解するという点でPLODの拡張と見なすことができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 04:49:46 GMT)
Frustrated Random Walks: A Fast Method to Compute Node Distances on Hypergraphs [0.0] ハイパーグラフ(英: hypergraph)は、実体間の属性共有を考えると自然に現れるグラフの一般化である。
ハイパーグラフ研究におけるオープンな問題は、ハイパーグラフ上のノード距離を正確に効率的に計算する方法である。
我々は,ハイパーグラフノード距離を計算するために,ランダムウォークのヒット時間を用いて提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:42:26 GMT)
From Rule-Based Models to Deep Learning Transformers Architectures for Natural Language Processing and Sign Language Translation Systems: Survey, Taxonomy and Performance Evaluation [0.0] 効率的なサイン駆動型統合エンドツーエンド翻訳システムの必要性が高まっている。
本稿では,リアルタイムのQOL(Quality-of-Service sign language)ma-chine翻訳システムの要件について述べる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 07:11:45 GMT)
Formal relation between Pegg-Barnett and Paul quantum phase frameworks [0.0] ポール形式主義における位相の確率分布は、ペッグ・バーネット形式主義から完全に従うことを示す。
その結果,Paul フレームワークは Pegg-Barnett アプローチの半古典的限界と見なされる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:13:46 GMT)
First-principles construction of symmetry-informed quantum metrologies [0.0] 位置パラメータに同型な量の測定方法のクラスを開発する。
結果のフレームワークは、パラメータ範囲、事前情報、状態を認めます。
これは、どの対称性が最大の無知不変状態を残しているかを特定するための良い戦略の探索を減らす。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:24:24 GMT)
Fine-grained length controllable video captioning with ordinal embeddings [0.0] 細粒度制御のための2つの長さ埋め込み法を提案する。
1つはビット表現で長さを表すビット埋め込みであり、もう1つは順序回帰でよく使われるバイナリ表現を使用する順序埋め込みである。
この方法は、字幕文の長さ制御だけでなく、字幕を読む際の時間制御を可能にする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 23:53:52 GMT)
Feynman 1947 letter on path integral for the Dirac equation [0.0] 1947年、有名なシェルター島会議の4ヶ月前、リチャード・ファインマン(Richard Feynman)は、元MITの同級生セオドア・ウェルトン(Theodore Welton)に長い手紙を書いた。
本論では,本文の書写と編集書,原文文書のファクシミリについて述べる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:57:51 GMT)
FRAMER/Miu: Tagged Pointer-based Capability and Fundamental Cost of Memory Safety & Coherence (Position Paper) [0.0] 研究者はパフォーマンス、検出カバレッジ、相互運用性、精度、検出タイミングのトレードオフを行う。
本研究は,スタンドアロンソフトウェアソリューションと将来のハードウェア設計のためのプロトタイプとして,タグ付きポインタベースの機能システムを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:31:26 GMT)
Exploring the origins of switching dynamics in a multifunctional reservoir computer [0.0] 貯水池コンピュータ(RC)は、同じ訓練された重量のセットを使用して、同時に複数のアトラクションを再構築する。
ある場合、RCが引き金の共存を再構築できなかった場合、転移性を示す。
本稿では,これらスイッチングダイナミクスの起源を,両立問題によるパラダイム設定で考察する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 20:51:48 GMT)
Evaluation of Local Planner-Based Stanley Control in Autonomous RC Car Racing Series [0.0] 本稿では,自動RCカーレースの制御手法を提案する。
実際のLiDARポイントクラウド上では、ローカルパスのみを計画している。
1/10サイズのRCカーでテストし、ベースソリューションから実際のF110thレースにおける最適設定までのチューニング手順を示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:50:31 GMT)
Evaluating Stability of Unreflective Alignment [0.0] 本稿では,将来のLCMにおいて,反射的安定性の問題が発生するメカニズムとして,非現実的優先度変化の安定化を提案する。
以上の結果から,現在のLCMでは,スケールと能力の増大がCPCベースの後退と嗜好の不安定性の増大と関連していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:55:15 GMT)
Evaluating Pre-Training Bias on Severe Acute Respiratory Syndrome Dataset [0.0] この研究は、OpenDataSUSの重症急性呼吸症候群データセットを使用して、3つのトレーニング済みバイアスメトリクスを可視化する。
目的は、異なる領域のバイアスを比較し、保護された属性に注目し、モデルのパフォーマンスとメトリック値を比較することである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 20:49:11 GMT)
Entropy production in the mesoscopic-leads formulation of quantum thermodynamics [0.0] 熱浴と強く結合したシステムのエントロピー生成は、量子熱力学とメソスコピック物理学の中核的な問題である。
近年、メソスコピック・リード・アプローチは、複数の熱浴と強く結合した量子系を研究するための強力な方法として出現している。
一つの浴槽に結合したシステムは, 埋没時の熱的固定点を示すことを数値的に示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:18:43 GMT)
Ensuring Equitable Financial Decisions: Leveraging Counterfactual Fairness and Deep Learning for Bias [0.0] 本研究では,データ拡張に伴う対実的公正性に着目した高度なバイアス緩和手法について検討する。
この研究は、これらの統合アプローチが金融業界、特にローン承認手続きにおけるジェンダーバイアスを緩和する方法について考察している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:28:06 GMT)
Ensemble Prediction via Covariate-dependent Stacking [0.0] 本研究は,CDST (Co-dependent stacking') という,アンサンブル予測の新しい手法を提案する。
従来の積み重ね方式とは異なり、CDSTはモデルウェイトを共変量の関数として柔軟に変化させ、複雑なシナリオにおける予測性能を向上させる。
以上の結果から,CDSTは時間的・時間的予測の問題に特に有用であり,様々なデータ分析分野の研究者や実践者にとって強力なツールとなることが示唆された。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:28:32 GMT)
Enabling Efficient and Scalable DRAM Read Disturbance Mitigation via New Experimental Insights into Modern DRAM Chips [0.0] ストレージ密度は、システムレベルの攻撃によって悪用される回路レベルの脆弱性であるDRAM読み取り障害を悪化させる。
既存の防御は効果がないか、違法に高価である。
1)DRAMベースのシステムの保護は、技術スケーリングが読み取り障害の脆弱性を増大させるにつれてコストが高くなり、2)既存のソリューションの多くはDRAM内部の独自知識に依存している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:12:03 GMT)
Emergent Gauge Fields and the "Choi-Spin Liquids" in Steady States [0.0] リンドブラディアン群の進化の定常状態は、二重ヒルベルト空間の「グッツウィラー射影」波動関数に写像できることを示す。
グッツウィラー射影はスピン液体状態を構成する標準的なアプローチである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 00:00:39 GMT)
Efficient, High-Fidelity Single-Photon Switch Based on Waveguide-Coupled Cavities [0.0] 導波路内で伝播する光子の高忠実性量子スイッチとして, 2レベルエミッタを埋め込んだ導波路結合キャビティが機能することを示す。
単一導波路結合キャビティは入力光子ウェーブパレットをほぼ均一効率と忠実度でルーティングできることがわかった。
このような効率的で高忠実な単一光子ルーティングは、スケーラブルなフォトニック量子技術に不可欠である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:16:45 GMT)
ERX: A Fast Real-Time Anomaly Detection Algorithm for Hyperspectral Line-Scanning [0.0] 本稿では,Exponentially moving RX algorithm (ERX)を導入し,実時間線走査のための既存のRXに基づく異常検出手法と比較する。
ERXはJetson Xavier NX計算モジュールを使用してテストされ、3つの新しいデータセットの速度と検出の最適な組み合わせを実現した。
本研究は, 異常物体の分類・配置, 適応的および自動しきい値選択, 実時間フィールドテストにおける今後の研究の道を開くものである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:44:34 GMT)
Dichroic mirror pulses for optimized higher-order atomic Bragg diffraction [0.0] 我々は,高次ブラッグ回折に特化して設計された原子干渉計のための二色ミラーパルスの実験的実現について述べる。
提案手法は、検出された干渉計出力に共鳴原子経路を選択的に反映し、それらが意図した信号に寄与することを保証する。
寄生虫の経路は鏡によって効率的に伝達され、関連する干渉計の出力に向けられません。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 12:10:45 GMT)
Development of a Large Language Model-based Multi-Agent Clinical Decision Support System for Korean Triage and Acuity Scale (KTAS)-Based Triage and Treatment Planning in Emergency Departments [0.0] 本研究は, 患者トリアージ, 治療計画, 救急管理全般において, LLM駆動型CDSSを用いて, ED医師や看護師を支援することを目的とするものである。
このシステムは、Triage Nuurse、救急医、薬剤師、EDコーディネーターの4つのAIエージェントで構成されている。
トリアージアセスメントにはKTAS(Korea Triage and Acuity Scale)が組み込まれ、医薬品管理にはRxNorm APIが組み込まれている。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:16:06 GMT)
Development of Large Annotated Music Datasets using HMM-based Forced Viterbi Alignment [0.0] 本稿では,任意の楽器のデータセットを生成するための,合理的で効率的な手法を提案する。
書き起こしのオンセットは手作業で検証され、ラベルは最大10ms、平均は5msである。
この方法は、異なる機器のためのATTシステムを構築するための具体的なデータセットを構築するための予備的なステップとして役立つ。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:06:29 GMT)
Detecting quasi-degenerate ground states in 1D topological models via VQE [0.0] Su-シュリーファー-ヘーガー開鎖とキタエフ開鎖の正確な基底状態について検討する。
これらのモデルは、熱力学の極限で単一粒子エネルギーが消滅するエッジモードを特徴とする対称性で保護された位相位相をホストする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 16:24:49 GMT)
Design of a release-free piezo-optomechanical quantum transducer [0.0] 量子マイクロ波-光学変換への有望なアプローチは、中間機械モードとピエゾ-オプトメカニカル相互作用を用いる。
ここでは,非懸濁型圧電オプトメカニカルトランスデューサ(Piezo-optomechanical Transducer)について紹介する。
本稿では,シリコンオンサファイア(SOS)リリースフリートランスデューサの提案と設計を行う。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 15:13:41 GMT)
Decoherence and Brownian motion of a polarizable particle near a surface [0.0] 媒質の存在下での電磁場のゆらぎと相互作用する偏光性粒子の古典的および量子化された中心運動を解析する。
粒子の量子化中心質量に対する位置局在化マスター方程式を導出し、その古典的な中心質量運動量拡散について検討する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 22:21:59 GMT)
Data downlink prioritization using image classification on-board a 6U CubeSat [0.0] 九州工業大学と共同研究員は,ナノサテライトミッションであるVERTECSのジョイントベンチャーを立ち上げた。
主なミッションは、光波長の宇宙背景放射を観測することで星の形成履歴を解明することである。
VERTECS衛星は小型の望遠鏡と高精度の姿勢制御システムを備え、地上での分析のために宇宙データをキャプチャする。
そこで我々は,データダウンリンクの優先順位付けと最適化のために,最適な画像データを自律的に分類し,圧縮するオンオービットシステムを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 08:38:45 GMT)
Data Privacy Vocabulary (DPV) -- Version 2 [0.0] DPVは、W3C ODRLのような既存の標準と共に組み込むことができる語彙を提供することで、最先端のニッチを埋める。
この記事では、DPVのバージョン2イテレーションについて、その内容、方法論、現在の採用と利用、将来の可能性について説明する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 09:24:46 GMT)
Cross-Modal Learning for Chemistry Property Prediction: Large Language Models Meet Graph Machine Learning [0.0] グラフニューラルネットワーク(GNN)の分析能力と大規模言語モデル(LLM)の言語生成・予測能力を利用する多モード融合(MMF)フレームワークを提案する。
本フレームワークは,グラフ構造化データのモデリングにおけるGNNの有効性とLLMのゼロショットおよび少数ショット学習能力を組み合わせることにより,オーバーフィッティングのリスクを低減し,予測の改善を実現する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:10:39 GMT)
Consistent machine learning for topology optimization with microstructure-dependent neural network material models [0.0] 空間的に異なるミクロ構造対称性と異なる異なるマイクロ構造記述子を持つマルチスケール構造のためのフレームワークを提案する。
本研究は,密度に基づく設計最適化と整合性の統合の可能性を明らかにする。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:24:52 GMT)
Comprehensive explanation of ZZ coupling in superconducting qubits [0.0] 超伝導量子コンピュータのスケールアップにおける大きな課題は、量子ビット間の不要な結合である。
本稿では、図式摂動理論と状態割当アルゴリズムを含む解析的および数値的手法を紹介する。
フラックス可変トランスモンカップラで接続された2つの固定周波数トランスモンキュービットからなるシステムに対して,これらの手法を実証する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 20:53:31 GMT)
Compact Pixelated Microstrip Forward Broadside Coupler Using Binary Particle Swarm Optimization [0.0] 3.5-3.8GHz帯で高結合レベルを有する小型フォワード広帯域カプラ(MFBC)を提案する。
測定結果は、3dB結合と0.12ラムダg x 0.10ラムダgのコンパクトサイズを持つ前方結合器を示す。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:14:48 GMT)
Climate change denial and anti-science communities on brazilian Telegram: climate disinformation as a gateway to broader conspiracy networks [0.0] この研究は、ブラジルの陰謀論コミュニティが気候変動や反科学のテーマについて、どのようにTelegramで明らかにされているかという研究課題に答えようとしている。
この研究は、テレグラムにおけるブラジルの陰謀論コミュニティの理解と特徴化を目的とした7つの研究のシリーズの一部であることは注目に値する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:14:27 GMT)
Classifying populist language in American presidential and governor speeches using automatic text analysis [0.0] 我々は,ポピュリスト言語の使用を推定するために,自動分類モデルの訓練と検証を行うパイプラインを開発する。
これらのモデルは、知事演説の84%、大統領演説の89%を含む、ほとんどのスピーチを正しく分類している。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:19:57 GMT)
Catalytic transformations for thermal operations [0.0] この研究は、系、触媒、熱環境の間の最も一般的なエネルギー保存相互作用の下でのエネルギー不整合状態間の変換に焦点を当てている。
唯一の制約は、触媒は他のサブシステムと非飽和で非相関な状態に戻さなければならないことである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 05:58:50 GMT)
Canonical Form and Finite Blocklength Bounds for Stabilizer Codes [0.0] クリフォード群の近縁な正準形式は、時間$O(n3)$ for $n$ qubitsで計算できることが示されている。
コセットを推測する代用としてエラーを推測する引数は存在せず、達成可能性のバウンダリが大幅に向上する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:02:52 GMT)
Blind Evaluation Framework for Fully Homomorphic Encryption and Privacy-Preserving Machine Learning [0.0] Blind Evaluation Framework (BEF) は暗号的にセキュアなプログラミングフレームワークである。
インタラクティブ・ラウンド・オブ・デクリプション・アンド・アセスメント(IRDE)を使わずに、盲目で、正しい、プログラミングロジックの実行を可能にする。
これは、解読ラウンドなしでFHEで機械学習モデルのトレーニングと推論を可能にする最初のフレームワークである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 22:49:02 GMT)
Beam Splitter for Dark and Bright States of Light [0.0] 本稿では,光線を2モードの明暗成分に分離できる新しいビーム分割器を提案する。
本稿では,光学的クロスキャビティシステムと$Lambda$型3レベル原子を共振結合したプロトタイプを提案する。
本研究は光の集合特性を利用したビームスプリッタの新たな応用の道を開くものである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:44:18 GMT)
Bayesian Learning in a Nonlinear Multiscale State-Space Model [0.0] この研究は、異なる時間スケールで相互作用するシステム間の動的相互作用を探索する、新しいマルチスケール状態空間モデルを導入する。
本稿では,このマルチスケールモデルにおける未知のプロセスノイズ共分散を学習することにより,未知の状態の推定を行うためのベイズ学習フレームワークを提案する。
本研究では,提案手法の有効性をシミュレーションし,提案手法の有効性を実証するPGASアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 14:03:15 GMT)
Bayesian Inference of Minimally Complex Models with Interactions of Arbitrary Order [0.0] 最小複雑モデル (Minimally Complex Models, MCM) は、任意の高階の相互作用を最小の複雑さの独立したコンポーネントに分類した単純なモデルである。
MCMに制限されたベイズモデル選択は計算可能であり、多くの利点があることを示す。
MCMは任意の順序の相互作用を持つため、データに重要な高次依存関係が存在することを明らかにすることができる。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:31:46 GMT)
Awes, Laws, and Flaws From Today's LLM Research [0.0] 良質な研究と見なされる基準に基づいて2000以上の研究作品を評価した。
創発的行動の主張の減少や倫理的非難者の存在など、さまざまな傾向が見られる。
本論文は,本分野におけるより精査と厳密さの必要性を浮き彫りにするものである。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 21:19:37 GMT)
Assessing Lower Limb Strength using Internet-of-Things Enabled Chair [0.0] このプロジェクトは、椅子に取り付けられたセンサーで個人の進捗を計測し、評価することを目指している。
圧力センサーは椅子の様々な場所に装着されるが、座席、背もたれ、手、休息、脚に限らない。
そして、データセットとタイミング情報を機械学習モデルに入力して、動きのさまざまなフェーズにおける相対的な強度と弱さを推定する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:24:51 GMT)
Applying ViT in Generalized Few-shot Semantic Segmentation [0.0] 本稿では,汎用的な小ショットセマンティックセマンティックセグメンテーション(GFSS)フレームワーク下でのViTモデルの性能について検討する。
ResNetsやViT(Pretrained Vision Transformer)ベースのモデルなど,バックボーンモデルのさまざまな組み合わせによる実験を行った。
GFSSタスク上での大規模な事前学習型ViTモデルの可能性を示すとともに,テストベンチマークのさらなる改善を期待する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 11:04:53 GMT)
Antivax and off-label medication communities on brazilian Telegram: between esotericism as a gateway and the monetization of false miraculous cures [0.0] 本研究は、テレグラムにおけるブラジルの陰謀論のコミュニティがどのように特徴づけられ、具体化されているかに答えようとするものである。
新世界秩序や黙示録、生存主義といったテーマは、抗ワクチンの物語への重要な入り口として機能している。
排他主義と密教は、非ラベルの薬物コミュニティへの招待の最大の源泉として浮上する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 17:07:10 GMT)
An evidence-based and critical analysis of the Fediverse decentralization promises [0.0] 本稿では,ソーシャルWeb上での商用プラットフォームの集中化と優位性に対抗するためのFederiverseの可能性を検討する。
我々は、Fediverseを支える技術、インスタンス上のFediverseユーザ分布に関する現在の統計データ、および電子メールとWebの2つの古い、類似した分散技術の現状から証拠を収集する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 19:57:35 GMT)
An Improved Anomaly Detection Model for Automated Inspection of Power Line Insulators [0.0] 電力系統の信頼性を確保するためには絶縁体の検査が重要である。
検査プロセスを自動化するために、ディープラーニングがますます活用されています。
本稿では,異常検出とオブジェクト検出の2段階的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 13:55:17 GMT)
Alternatives of entanglement depth and metrological entanglement criteria [0.0] 部分的絡み合い特性の1パラメータファミリーの一般理論と、結果として生じる絡み合いの深さのような量について検討する。
特に、パーティショナビリティの深さ、プロデューサビリティの深さ(あるいは単に絡み合う深さ)、ストレッチビリティの深さがある。
また、より物理的に意味のある性質、例えば、二乗性、強靭性、自由度、およびエントロピー的動機付けのいくつかのものを構築します。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 18:21:33 GMT)
A dissipation-induced superradiant transition in a strontium cavity-QED system [0.0] キャビティ量子電磁力学(QED)では、エミッタと共振器が結合し、量子光-物質相互作用の精密な研究を可能にする。
ここでは、超低温8,8$Sr原子のアンサンブルを用いて、CRFモデルで予測される連続超ラジカル相転移の観測を行う。
我々の観測は、量子状態を生成するために予測された駆動散逸系のより細かい制御への第一歩である。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 03:06:08 GMT)
A Smartphone-Based Method for Assessing Tomato Nutrient Status through Trichome Density Measurement [0.0] トマトにおける肥料によるストレスの早期検出は, タイムリーな作物管理介入と収量最適化に不可欠である。
本研究は,スマートフォンを用いた若葉植物表面のトリコム伸長性毛髪状構造の密度を定量化するための新しい非侵襲的手法を提案する。
論文参考訳(メタデータ) (Tue, 27 Aug 2024 10:50:13 GMT)