Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone [144.9] phi-3-miniは、3.3兆のトークンで訓練された38億のパラメータ言語モデルである。
MMLUでは69%、MTベンチでは8.38である。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:32:33 GMT)
A Survey on Self-Evolution of Large Language Models [116.5] 大規模言語モデル(LLM)は、様々な分野やインテリジェントエージェントアプリケーションにおいて大きく進歩している。
この問題に対処するために、LLMが自律的に獲得し、洗練し、モデル自身によって生成された経験から学ぶことができる自己進化的アプローチが急速に成長している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:43:23 GMT)
Two-tone spectroscopy for the detection of two-level systems in superconducting qubits [108.4] 物理的起源が不明な2レベル系(TLS)は超伝導量子ビットにおけるデコヒーレンスの主要な要因である。
本稿では,マイクロ波駆動と分散読み出しのみを必要とする新しい手法を提案し,固定周波数キュービットも動作させる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:53:00 GMT)
FlashTex: Fast Relightable Mesh Texturing with LightControlNet [105.5] ControlNetアーキテクチャに基づいた新しいテキスト・ツー・イメージモデルであるLightControlNetを紹介した。
本手法は, メッシュを任意の照明環境下で適切に切断し, レンダリングできるように, 結果として生じるテクスチャの材質/反射率を下げるためのものである。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:35:38 GMT)
Preference Fine-Tuning of LLMs Should Leverage Suboptimal, On-Policy Data [102.2] 好みラベルからの学習は、微調整された大きな言語モデルにおいて重要な役割を果たす。
好みの微調整には、教師付き学習、オンライン強化学習(RL)、コントラスト学習など、いくつかの異なるアプローチがある。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:20:18 GMT)
AutoAD III: The Prequel -- Back to the Pixels [96.3] 本稿では,映像データを用いたADデータセット構築のための2つのアプローチと,これを用いたトレーニングと評価データセットの構築を提案する。
我々は,凍結した事前学習されたビジュアルエンコーダと大規模言語モデルを用いて,生動画を取り込み,ADを生成するQ-formerベースのアーキテクチャを開発した。
人間のパフォーマンスによく適合したAD品質をベンチマークするために、新しい評価指標を提供する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:59:57 GMT)
MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies [85.6] SLM(Small Language Models)は、LLM(Large Language Models)に代わるリソース効率の高いモデルである。
我々はMiniCPM、特に1.2Bと2.4Bの非埋め込みパラメータの変種を紹介する。
また、MiniCPM-DPO、MiniCPM-MoE、MiniCPM-128Kを含むMiniCPMファミリーについても紹介する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:26:33 GMT)
Holodeck: Language Guided Generation of 3D Embodied AI Environments [84.2] Holodeckは、ユーザに供給されたプロンプトを完全に自動でマッチさせる3D環境を生成するシステムである。
アンノテータは住宅シーンにおいて,手作業で設計した手続きベースラインよりもホロデックを好むことを示す。
また、Embodied AIにおけるHolodeckのエキサイティングな応用を実演し、人間の構築したデータを使わずに、新しいシーンをナビゲートするエージェントを訓練する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:06:03 GMT)
"Where am I?" Scene Retrieval with Language [78.6] テキスト記述とシーングラフの結合埋め込みを学習し、一致したかどうかを判断する「シーン検索」パイプラインを提案する。
コード、トレーニングされたモデル、データセットが公開されます。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:21:32 GMT)
MERT: Acoustic Music Understanding Model with Large-Scale Self-supervised Training [74.3] 本稿では,MLMスタイルの音響事前学習において,教師モデルと擬似ラベルを組み込んだ大規模自己教師型学習(MERT)を用いた音響音楽理解モデルを提案する。
実験結果から,本モデルでは14曲の楽曲理解タスクを一般化し,性能を向上し,SOTA(State-of-the-art)全体のスコアを達成できることが示唆された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 21:52:17 GMT)
SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation [72.1] 既存の透かしアルゴリズムはトークンレベルの設計のため、パラフレーズ攻撃に弱い。
局所性に敏感なハッシュ(LSH)に基づく頑健な文レベルのセマンティック透かしアルゴリズムSemStampを提案する。
実験結果から,本アルゴリズムは従来手法に比べて,従来手法よりも頑健であるだけでなく,生成品質の維持にも有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:29:38 GMT)
Does Your Neural Code Completion Model Use My Code? A Membership Inference Approach [69.4] 本稿では,現在のニューラルコード補完モデルの法的および倫理的問題について考察する。
私たちは、もともと分類タスクのために作られたメンバシップ推論アプローチ(CodeMIと呼ばれる)を調整します。
我々は,この適応型アプローチの有効性を,多種多様なニューラルコード補完モデルで評価した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:54:53 GMT)
Found in the Middle: Permutation Self-Consistency Improves Listwise Ranking in Large Language Models [63.7] 大規模言語モデル(LLM)は、文脈の使い方に位置バイアスを示す。
我々は,ブラックボックスLLMのランキングリスト出力に対して,自己整合性(permutation self-consistency)を提案する。
LLaMA v2 (70B) では GPT-3.5 では 7-18% , LLaMA v2 (70B) では 8-16% である。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:53:48 GMT)
MaterialSeg3D: Segmenting Dense Materials from 2D Priors for 3D Assets [63.3] 本稿では,2次元のセマンティクスから基礎となる物質を推定する3次元アセット素材生成フレームワークを提案する。
このような先行モデルに基づいて,材料を三次元空間で解析する機構を考案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:00:17 GMT)
Recommender Systems in the Era of Large Language Models (LLMs) [62.0] 大規模言語モデル(LLM)は自然言語処理(NLP)と人工知能(AI)の分野に革命をもたらした。
我々は, プレトレーニング, ファインチューニング, プロンプティングなどの様々な側面から, LLM を利用したレコメンデータシステムの総合的なレビューを行う。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 03:12:39 GMT)
SEED-X: Multimodal Models with Unified Multi-granularity Comprehension and Generation [61.4] 統一的で汎用的な基礎モデル、すなわちSEED-Xを提案する。
SEED-Xは、理解および生成タスクのための多粒度視覚意味論をモデル化することができる。
我々の研究が、現実世界のアプリケーションで多目的なマルチモーダル基盤モデルによって達成できるものについて、将来の研究に刺激を与えることを期待しています。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:56:09 GMT)
SOFTS: Efficient Multivariate Time Series Forecasting with Series-Core Fusion [60.0] 時系列予測は、金融、交通管理、エネルギー、医療など様々な分野で重要な役割を果たしている。
いくつかの方法は、注意やミキサーのようなメカニズムを利用して、チャネル相関をキャプチャすることでこの問題に対処する。
本稿では,効率的なモデルであるSOFTS(Series-cOre Fused Time Series forecaster)を提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:06:35 GMT)
VALOR-EVAL: Holistic Coverage and Faithfulness Evaluation of Large Vision-Language Models [57.4] LVLM(Large Vision-Language Models)は幻覚に悩まされ、このモデルでは可聴音を発生させるが、実際には誤出力を発生させる。
既存のベンチマークはスコープに限られており、主にオブジェクト幻覚に焦点を当てている。
対象,属性,関係を多次元のベンチマークで表現し,連想バイアスに基づいて画像を選択する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:49:22 GMT)
Deep Regression Representation Learning with Topology [57.2] 回帰表現の有効性は,そのトポロジによってどのように影響されるかを検討する。
Information Bottleneck (IB) 原則は、有効性表現を学ぶための重要なフレームワークである。
本稿では,回帰に特有な正則化器PH-Regを導入し,特徴空間の内在次元と位相を対象空間と一致させる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 06:28:41 GMT)
Enabling Natural Zero-Shot Prompting on Encoder Models via Statement-Tuning [55.3] ステートメント・チューニング(英: Statement-Tuning)は、有限文の集合として識別的タスクをモデル化し、潜在的なステートメントを識別してラベルを決定するモデルを訓練する手法である。
実験結果から,ステートメントチューニングは,パラメータが著しく少ない最先端のLLMと比較して,競争性能が向上することが示された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:17:07 GMT)
How Well Can LLMs Echo Us? Evaluating AI Chatbots' Role-Play Ability with ECHO [55.3] チューリングテストに触発された評価フレームワークECHOを紹介する。
この枠組みは、人間と機械が生成した反応を区別するために、対象個人の知名度に係わる。
基礎モデルとして GPT-3.5 と GPT-4 の3つのロールプレイング LLM をECHO を用いて評価した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:00:51 GMT)
KamerRaad: Enhancing Information Retrieval in Belgian National Politics through Hierarchical Summarization and Conversational Interfaces [55.0] KamerRaadは、大きな言語モデルを活用するAIツールで、市民がベルギーの政治情報と対話的に関わるのを助ける。
このツールは、議会の手続きから重要な抜粋を抽出し、簡潔に要約し、次いで生成AIに基づくインタラクションの可能性を示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:01:39 GMT)
How Good Are Low-bit Quantized LLaMA3 Models? An Empirical Study [54.9] MetaのLLaMAファミリーは、最も強力なオープンソースのLarge Language Model(LLM)シリーズの1つになった。
我々はLLaMA3の低ビット幅への量子化能力について検討する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:03:03 GMT)
Bayesian Diffusion Models for 3D Shape Reconstruction [54.7] 本稿では,トップダウン(優先)情報をボトムアップ(データ駆動)手順と密結合することにより,効果的なベイズ推定を行う予測アルゴリズムを提案する。
3次元形状復元作業におけるBDMの有効性を示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 02:13:32 GMT)
How to Craft Backdoors with Unlabeled Data Alone? [54.5] 自己教師型学習(SSL)は、経済的かつスケーラブルな方法でリッチな機能を学ぶことができる。
リリースされたデータセットが悪意ある毒を盛られた場合、テストサンプルにトリガーが注入された場合、バックドアのSSLモデルはひどい振る舞いをする可能性がある。
本稿では, 疑似ラベルを用いたクラスタリングに基づく選別と, 相互情報原理に基づくコントラスト選択の2つの方法を提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 21:27:36 GMT)
X-Ray: A Sequential 3D Representation for Generation [54.2] 我々は,新しい逐次表現を用いた3次元生成の革新的アプローチであるX線を紹介する。
X線は、被写体の外部特徴と内部特徴の両方を捉えるために、X線スキャンの深度測定能力にインスパイアされている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:40:11 GMT)
Unifying Feature and Cost Aggregation with Transformers for Semantic and Visual Correspondence [51.5] 本稿では,高密度マッチングタスク用に設計されたTransformerベースの積分機能とコスト集約ネットワークを提案する。
まず, 特徴集約とコスト集約が異なる特徴を示し, 双方の集約プロセスの司法的利用から生じる実質的な利益の可能性を明らかにした。
本フレームワークは意味マッチングのための標準ベンチマークで評価され,また幾何マッチングにも適用された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:06:54 GMT)
CKD: Contrastive Knowledge Distillation from A Sample-wise Perspective [49.0] 本研究では,試料内およびサンプル間制約によるサンプルワイドアライメント問題として定式化できる,対照的な知識蒸留手法を提案する。
本手法は, 数値を考慮し, 同一試料中のロジット差を最小化する。
CIFAR-100, ImageNet-1K, MS COCOの3つのデータセットについて総合的な実験を行った。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:52:40 GMT)
Quantum copy-protection of compute-and-compare programs in the quantum random oracle model [48.9] 計算・比較プログラム(Computer-and-compare program)として知られる回避関数のクラスに対する量子コピー保護スキームを導入する。
我々は,量子乱数オラクルモデル(QROM)において,完全悪意のある敵に対する非自明なセキュリティを実現することを証明した。
補完的な結果として、「セキュアソフトウェアリース」という,ソフトウェア保護の概念の弱さが示される。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 01:28:37 GMT)
Detecting and Mitigating Hallucination in Large Vision Language Models via Fine-Grained AI Feedback [48.1] 我々は,LVLM(Large Vision Language Models)における幻覚の検出と緩和について,きめ細かいAIフィードバックを用いて提案する。
プロプライエタリモデルによる小型幻覚アノテーションデータセットを生成する。
そこで本研究では,幻覚緩和モデルの訓練のための選好データセットを自動構築する検出テーマ書き換えパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:46:10 GMT)
The Adversarial AI-Art: Understanding, Generation, Detection, and Benchmarking [47.1] 本稿では,AI生成画像(AI-art)を敵のシナリオで理解し,検出するための体系的な試みを提案する。
ARIAという名前のデータセットには、アートワーク(絵画)、ソーシャルメディアイメージ、ニュース写真、災害シーン、アニメ画像の5つのカテゴリに140万以上の画像が含まれている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 21:00:13 GMT)
Unveiling and Mitigating Generalized Biases of DNNs through the Intrinsic Dimensions of Perceptual Manifolds [46.5] 公正なディープニューラルネットワーク(DNN)の構築は、信頼できる人工知能を達成するための重要なステップである。
本稿では,モデルの公平性と性能を高める固有次元正規化(IDR)を提案する。
様々な画像認識ベンチマークテストにおいて、IDRはモデルバイアスを低減し、性能を向上する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:16:40 GMT)
On the Two-sided Permutation Inversion Problem [45.7] オラクルが量子クエリーを、置換の前方方向と逆方向の両方に許容する設定について検討する。
逆問題の結果の変動の硬さを結合するいくつかの定理を証明した。
以上の結果から,逆数に対する逆数アクセスが与えられると,逆数問題はかなり難しくなる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 02:00:33 GMT)
Bridging Stereo Geometry and BEV Representation with Reliable Mutual Interaction for Semantic Scene Completion [45.2] 3Dセマンティックシーン補完(SSC)は、限られた観測から密集した3Dシーンを推定する必要がある不適切な認識課題である。
従来のカメラベースの手法は、固有の幾何学的曖昧さと不完全な観察のため、正確なセマンティックシーンを予測するのに苦労した。
我々は,SSCにおけるステレオマッチング技術と鳥眼ビュー(BEV)表現学習を利用して,そのような問題に対処する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:00:27 GMT)
Optimal control in large open quantum systems: the case of transmon readout and reset [45.0] 本稿では, 随伴状態法と逆時間バックプロパゲーションを組み合わせることで, 極めて大規模なオープンシステム量子制御問題を解く枠組みを提案する。
超伝導量子ビットにおける2つの本質的に散逸する演算を最適化するために、この枠組みを適用した。
システムパラメータの固定化により,制御パルスの形状は両操作の忠実度と持続時間において2倍の改善が得られた。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:16:29 GMT)
TAVGBench: Benchmarking Text to Audible-Video Generation [44.7] 可聴映像生成ベンチマーク(TAVGBench)のための包括的テキストを開発する。
TAVGBenchには170万本以上のクリップがあり、総時間は11.8000時間である。
音声とビデオの両方のコンテンツについて、各ビデオが詳細な記述を確実にするための自動可聴アノテーションパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:36:03 GMT)
Full Event Particle-Level Unfolding with Variable-Length Latent Variational Diffusion [44.6] 生成機械学習モデルは、多数の次元で未結合の展開を実行することを約束している。
生成的展開に対する変動潜在拡散モデル(VLD)アプローチの新たな変更について述べる。
この手法の性能は、大型ハドロン衝突型加速器における半レプトニックトップクォーク対生成の文脈で評価される。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:47:10 GMT)
A User-Centric Benchmark for Evaluating Large Language Models [39.5] 大きな言語モデル(LLM)は、異なるタスクでユーザと協調するために必要なツールである。
実際のユーザによるLLMの利用を意図したベンチマークはほとんどない。
ユーザニーズを満たす上での有効性について10のLCMサービスをベンチマークする。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:32:03 GMT)
Advancing a Consent-Forward Paradigm for Digital Mental Health Data [39.1] サービスのユーザは、自分のデータの収集、共有、あるいはプライベート企業の収益の獲得などについてほとんど意見が得られない。
我々は、この歴史に注意を払っている別のアプローチとして、同意-フォワードパラダイムを提案する。
このパラダイムは、デジタルメンタルヘルスツールやサービスの設計に肯定的な同意の原則を組み込んでいる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 19:39:35 GMT)
DAIC-WOZ: On the Validity of Using the Therapist's prompts in Automatic Depression Detection from Clinical Interviews [39.1] 近年の研究では、インタビュアーのプロンプトをモデルに組み込んだ場合の性能向上が報告されている。
インタビュアーのプロンプトを用いたモデルでは,過去のメンタルヘルス問題に関する質問が質問されるインタビューの特定の領域に焦点を絞ることが分かる。
故意に利用することで0.90F1のスコアを得ることができ、このデータセットで報告された最も高い結果は、テキスト情報のみを用いてである。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:07:50 GMT)
Graphic Design with Large Multimodal Model [39.0] Hierarchical Layout Generation (HLG) はより柔軟で実用的な設定であり、未順序の設計要素の集合からグラフィック合成を生成する。
HLGタスクに取り組むために,大規模なマルチモーダルモデルに基づく最初のレイアウト生成モデルであるGraphistを導入する。
グラフは、RGB-A画像を入力として利用して、HLGをシーケンス生成問題として効率的に再構成する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:20:38 GMT)
Empowering Diffusion Models on the Embedding Space for Text Generation [38.7] 埋め込み空間とデノナイジングモデルの両方で直面する最適化課題について検討する。
データ分散は埋め込みにおいて学習可能であり、埋め込み空間の崩壊と不安定なトレーニングにつながる可能性がある。
以上の解析に基づいて,Transformerに基づく埋め込み拡散モデルであるDifformerを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:50:44 GMT)
Federated Prompt Learning for Weather Foundation Models on Devices [37.9] 天気予報のためのデバイス上のインテリジェンスでは、ローカルなディープラーニングモデルを使用して、集中型クラウドコンピューティングなしで気象パターンを分析する。
本稿では,FedPoD(Federated Prompt Learning for Weather Foundation Models on Devices)を提案する。
FedPoDは、通信効率を維持しながら、高度にカスタマイズされたモデルを得ることができる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 00:50:38 GMT)
SCT: A Simple Baseline for Parameter-Efficient Fine-Tuning via Salient Channels [37.8] そこで本研究では,Salient Channel Tuning (SCT) と呼ばれる簡易かつ効果的な手法を提案する。
実験はVTAB-1Kベンチマークの19タスク中18タスクに対して、VT-Bの0.11Mパラメータを追加することで完全な微調整を行う。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 05:52:44 GMT)
Texture-aware and Shape-guided Transformer for Sequential DeepFake Detection [37.5] Sequential DeepFakeは、順番に操作シーケンスを予測することを目的とした、新たなタスクである。
既存の手法ではイメージ・ツー・シーケンスの問題として定式化され、従来のTransformerアーキテクチャを用いて検出を行う。
検出性能を向上させるために,新しいテクスチャ認識型および形状誘導型トランスを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:47:52 GMT)
Manga109Dialog: A Large-scale Dialogue Dataset for Comics Speaker Detection [37.1] Manga109Dialogは世界最大の漫画話者データセットデータセットであり、132,692対の話者対を含む。
距離に基づく既存手法とは異なり,シーングラフ生成モデルを用いた深層学習手法を提案する。
実験の結果,シーングラフによるアプローチは既存の手法よりも優れており,予測精度は75%以上であることがわかった。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:40:50 GMT)
Text-Tuple-Table: Towards Information Integration in Text-to-Table Generation via Global Tuple Extraction [36.9] リアルタイムのコメンタリーテキストに基づいたコンペの要約表を生成するためのベンチマークデータセットであるLiveSumを紹介する。
我々は,このタスクにおける最先端の大規模言語モデルの性能を,微調整とゼロショットの両方で評価する。
さらに、パフォーマンスを改善するために、$T3$(Text-Tuple-Table)と呼ばれる新しいパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:31:28 GMT)
A Generalized Neural Diffusion Framework on Graphs [36.9] 我々は, 拡散過程とより多くのGNNの関係を正式に確立する, 忠実度項を持つ一般拡散方程式フレームワークを提案する。
高次拡散方程式では、HiD-Netは攻撃に対してより堅牢であり、ホモフィリーグラフとヘテロフィリーグラフの両方で作用する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 02:04:20 GMT)
A Python GPU-accelerated solver for the Gross-Pitaevskii equation and applications to many-body cavity QED [36.1] TorchGPEはGross-Pitaevskii方程式(GPE)を解くために開発された汎用Pythonパッケージである。
この解法は線形ポテンシャルと非線形ポテンシャルのスペクトルにわたって波動関数を統合するように設計されている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:58:34 GMT)
Context-Enhanced Language Models for Generating Multi-Paper Citations [35.8] 本稿では,Large Language Models (LLMs) を用いて多文文を生成する手法を提案する。
提案手法は,複数文の引用文を含むコヒーレントな段落に終止符を打つ,単一のソース・ペーパーと対象論文の集合を包含する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:30:36 GMT)
R-Trans -- A Recurrent Transformer Model for Clinical Feedback in Surgical Skill Assessment [35.3] トレーニングセッションを通して外科医のパフォーマンスを出力するリカレントトランスモデルを開発した。
これらのスコアは、GRS予測を生成するために平均化され、集約される。
我々はSpearman's correlation Coefficient (SCC) を報告し、我々のモデルが全てのタスクにおいてSOTAモデルより優れていることを示した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:33:06 GMT)
Zero-Shot Character Identification and Speaker Prediction in Comics via Iterative Multimodal Fusion [35.3] 本稿では,未注釈の漫画画像のみに基づいて文字を識別し,話者名を予測するためのゼロショット手法を提案する。
本手法ではトレーニングデータやアノテーションは必要とせず,任意のコミックシリーズで使用することができる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:59:35 GMT)
Making Images Real Again: A Comprehensive Survey on Deep Image Composition [34.1] 画像合成タスクは複数のサブタスクに分割でき、各サブタスクは1つ以上の課題を目標とすることができる。
本稿では,サブタスクの包括的調査と画像合成のブレンディングを行う。
それぞれについて、既存のメソッド、利用可能なデータセット、一般的な評価指標を要約する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 05:24:45 GMT)
Self-Supervised Alignment with Mutual Information: Learning to Follow Principles without Preference Labels [33.8] SAMIは、事前訓練された言語モデルに、好みのラベルや実演を必要とせず、行動原理に従うように教える手法である。
シングルターンダイアログと要約では、SAMI訓練ミストラル7bが66%から77%の勝利率で最初の事前学習モデルを上回っている。
この結果から,事前学習したLMは,優先ラベルや実演,人間の監視を使わずに,構成に従うことを学べることが示唆された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:20:36 GMT)
Some things are more CRINGE than others: Iterative Preference Optimization with the Pairwise Cringe Loss [33.8] 本稿では,既存の2値フィードバック手法であるCrynge Lossをペアの選好設定に一般化する方法について述べる。
AlpacaFarmベンチマークでは,PPOやDPOといった最先端の選好最適化アルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 22:51:32 GMT)
An Economic Solution to Copyright Challenges of Generative AI [33.7] 生成人工知能システムは、新しいテキスト、画像、ビデオ、その他のメディアを生成するために訓練されている。
このようなシステムは、データコントリビュータのトレーニングに関する著作権権に侵害されるのではないか、という懸念が高まっている。
本稿では,AI生成コンテンツ作成への貢献に比例して著作権所有者を補償する枠組みを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:10:38 GMT)
Fine-Tuning Large Language Models to Translate: Will a Touch of Noisy Data in Misaligned Languages Suffice? [33.4] 翻訳のための細調整大型言語モデル(LLM)は、32のトレーニングインスタンスで微調整された後、強力な翻訳能力を示す。
方向の選択は重要であり、ターゲット側の英語で微調整されたLLMは、タスクの誤解釈につながる可能性がある。
同様の問題は、特にターゲット言語が十分に表現されている場合に、並列データのターゲット側でノイズが導入されたときに発生する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 12:21:12 GMT)
FreqBlender: Enhancing DeepFake Detection by Blending Frequency Knowledge [32.8] 既存の方法では、色空間内で実際の顔と偽の顔とを混ぜ合わせて合成偽の顔を生成するのが一般的である。
本稿では,周波数知識をブレンドして擬似フェイク顔を生成する新しい手法であるem FreqBlenderを紹介する。
実験により,DeepFake検出の高速化に本手法の有効性が示され,他の手法のプラグ・アンド・プレイ戦略の可能性が確認された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:41:42 GMT)
CLIP-GS: CLIP-Informed Gaussian Splatting for Real-time and View-consistent 3D Semantic Understanding [32.8] コントラスト言語画像事前学習(CLIP)のセマンティクスをガウススプラッティングに統合するCLIP-GSを提案する。
SACはオブジェクト内の固有の統一意味論を利用して、3Dガウスのコンパクトで効果的な意味表現を学ぶ。
また,3次元モデルから得られた多視点一貫性を利用して,3次元コヒーレント自己学習(3DCS)戦略を導入する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:01:32 GMT)
Fair Concurrent Training of Multiple Models in Federated Learning [32.7] フェデレートラーニング(FL)は、複数のクライアント間で協調学習を可能にする。
近年のFLアプリケーションは、複数のFLタスクを同時にトレーニングする必要がある。
現在のMMFLアルゴリズムは、単純平均ベースのクライアントタスク割り当てスキームを使用している。
本稿では,各トレーニングラウンドにおけるタスクに動的にクライアントを割り当てる難易度認識アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 02:41:10 GMT)
Geometric-Facilitated Denoising Diffusion Model for 3D Molecule Generation [32.5] 既存の拡散に基づくデノボ3次元分子生成法は2つの大きな課題に直面している。
本研究では,グローバル空間関係を完全に抽出し,高品質な表現を学習するためのDual-Track Transformer Network(DTN)を提案する。
第2の課題は、エッジを直接潜伏空間に埋め込むのではなく、トレーニング期間中に結合の形成に介入する幾何学的識別損失(GFLoss)を設計することである。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 13:02:20 GMT)
A Concise but High-performing Network for Image Guided Depth Completion in Autonomous Driving [31.9] 本稿では,高速深度補完を実現するため,CENetという高精度で効率的なネットワークを提案する。
他の一般的な複雑なガイダンスモジュールとは異なり、我々のアプローチは直感的で低コストです。
デュアルエンコーダとシングルデコーダの単純な構造に基づいて、CENetは精度と効率のバランスが良くなる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 05:10:57 GMT)
Accelerating Image Generation with Sub-path Linear Approximation Model [31.9] 拡散モデルは、画像、オーディオ、ビデオ生成タスクにおける技術の現状を進歩させた。
高品質な画像生成を維持しながら拡散モデルを高速化するサブパス線形近似モデル(SLAM)を提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 06:25:17 GMT)
Does Gaussian Splatting need SFM Initialization? [31.7] 3次元ガウススプラッティングは、シーン再構成と新規なビュー合成のための汎用的で効果的な方法として受け入れられている。
Structure-from-Motion (SFM) アルゴリズムは克服すべき重要な限界である。
SFMデータへの依存を回避するために、NeRF再構成をどのように利用できるかを示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:35:33 GMT)
PointDifformer: Robust Point Cloud Registration With Neural Diffusion and Transformer [31.0] ポイントクラウド登録は、3Dコンピュータビジョンにおける基本的な技術であり、グラフィック、自律運転、ロボット工学の応用がある。
本稿では,グラフニューラル偏微分方程式(PDE)と熱カーネルシグネチャを利用するロバストポイントクラウド登録手法を提案する。
3Dポイントクラウドデータセットの実証実験により、我々のアプローチは、ポイントクラウド登録のための最先端のパフォーマンスを達成するだけでなく、付加的なノイズや3D形状の摂動に対してより堅牢性を示すことを示した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:50:12 GMT)
Hyp-OC: Hyperbolic One Class Classification for Face Anti-Spoofing [30.7] 顔認識システムは偽造攻撃に対して脆弱であり、容易に回避できる。
フェース・アンチ・スプーフィング (FAS) の最も古い研究は、これを二段階の分類タスクとしてアプローチした。
本研究では,一級視点から顔の偽造防止タスクを再構築し,新しい双曲型一級分類フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:59:18 GMT)
Generalizable Neural Human Renderer [29.5] Generalizable Human Renderer (GNH)は、単眼ビデオからアニマタブルな人間をテスト時間最適化なしでレンダリングする新しい方法である。
我々は、GNHが現在の最先端手法を上回ることを実証し、特にLPIPSの31.3%の改善を実現した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:09:53 GMT)
Bot or Human? Detecting ChatGPT Imposters with A Single Question [29.2] GPT-4のような大規模言語モデルは、最近、自然言語の理解と生成において印象的な能力を示した。
不正行為やサービス拒否攻撃など、悪意のある目的のために悪用される可能性があるという懸念がある。
単一問合せと応答による大規模言語モデル認証をオンラインで検出するFLAIRというフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 00:03:35 GMT)
Surveying Attitudinal Alignment Between Large Language Models Vs. Humans Towards 17 Sustainable Development Goals [29.0] 大規模言語モデル(LLM)は、国連の持続可能な開発目標を推進するための強力なツールとして登場した。
本研究は, LLM の17 SDG に対する態度に関する文献の総合的なレビューと分析を行う。
本研究は,理解と感情,文化的・地域的差異,課題目的の変化,意思決定プロセスにおいて考慮される要因など,潜在的な相違について検討する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 05:12:52 GMT)
Seeing Text in the Dark: Algorithm and Benchmark [28.9] そこで本研究では,暗黒領域におけるテキストのローカライズのための,効率的かつ効果的な単一ステージアプローチを提案する。
テキスト検出器の訓練段階において,制約付き学習モジュールを補助機構として導入する。
様々な場面や言語を含む任意の字形テキストのための包括的低照度データセットを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:08:54 GMT)
Where to Move Next: Zero-shot Generalization of LLMs for Next POI Recommendation [28.6] Next Point-of-interest (POI)レコメンデーションは、ユーザが周囲の環境を探索するための貴重な提案を提供する。
既存の研究は、大規模ユーザのチェックインデータからレコメンデーションモデルを構築することに依存している。
近年,事前訓練された大規模言語モデル (LLM) は,様々なNLPタスクにおいて大きな進歩を遂げている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 19:13:12 GMT)
Mechanistic Interpretability for AI Safety -- A Review [28.4] 本稿では,機械的解釈可能性について概説する。
機械的解釈性は、AIシステムがより強力で精査されるにつれて、破滅的な結果を防ぐのに役立つ。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:01:51 GMT)
Adaptive Compression in Federated Learning via Side Information [28.4] 約$D_KL(q_phi(n) p_theta$ ビットの通信を必要とするフレームワークを提案する。
私たちは、我々のメソッドを既存の圧縮フレームワークに組み込むことで、以前の作業の最大8,2500ドル(約8,500円)の精度で、同じ(そしてしばしば高い)テストの精度を達成することができることを示しています。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 00:14:54 GMT)
When to Show a Suggestion? Integrating Human Feedback in AI-Assisted Programming [28.3] 我々は、プログラマの受け入れやコード提案の拒否に関する信号を活用するメカニズムを追求し、レコメンデーションをガイドする。
我々は、表示を控えるよりも提示する提案について決定を下すためのユーティリティ理論フレームワークを導入する。
人間のフィードバックからの条件付き提案表示は、推奨コードが受け入れられる可能性を提供するモデルのカスケードに依存します。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:12:44 GMT)
Reading Between the Lines: Modeling User Behavior and Costs in AI-Assisted Programming [28.3] GitHub Copilotは、何百万人ものプログラマが毎日使っているコード推奨システムです。
Copilotと対話する際の共通プログラマ活動の分類であるCUPSを開発した。
私たちの洞察は、プログラマがCopilotとどのように相互作用し、新しいインターフェース設計とメトリクスを動機付けるかを明らかにします。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:00:10 GMT)
A Comprehensive Survey and Taxonomy on Point Cloud Registration Based on Deep Learning [28.1] ポイントクラウド登録(PCR)は、1つのポイントクラウドを別のポイントクラウドにアライメントする厳格な変換を決定することを伴う。
優れた深層学習(DL)ベースの登録法が提案されているにもかかわらず、DLベースのPCR技術に関する包括的で体系的な研究はいまだに不足している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 02:05:15 GMT)
Learning the meanings of function words from grounded language using a visual question answering model [28.1] 近年のニューラルネットワークに基づく視覚的質問応答モデルでは,複雑な視覚シーンに関する質問に対する回答の一部として,関数語の使用を学習できることが示されている。
これらのモデルが論理的結合の意味を学べることや、論理的推論に関する事前の知識がないことが分かりました。
本研究は,視覚的に理解された文脈において,機能単語のニュアンス解釈を学習することが可能であることを示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 19:00:51 GMT)
Mélange: Cost Efficient Large Language Model Serving by Exploiting GPU Heterogeneity [27.9] 大規模言語モデル(LLM)は多くのオンラインサービスに統合されている。
LLMのデプロイにおける大きな課題は、高価なGPUインスタンスの使用が主な理由として、そのコストが高いことだ。
我々は、GPUとLLMサービス仕様の多様性をナビゲートするフレームワークであるM'elangeを紹介する。
M'elangeは、単一のGPUタイプのみを使用する場合と比較して、デプロイメントコストを最大77%削減できる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 18:56:18 GMT)
GaussianTalker: Speaker-specific Talking Head Synthesis via 3D Gaussian Splatting [27.7] GaussianTalkerは3D Gaussian Splattingに基づく音声駆動音声ヘッド合成手法である。
話者固有のモーショントランスレータは、普遍化音声特徴抽出により、対象話者固有の正確な唇の動きを達成する。
Dynamic Gaussian Rendererは話者固有のBlendShapesを導入し、潜在ポーズを通じて顔の詳細表現を強化する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:51:43 GMT)
NeLF-Pro: Neural Light Field Probes for Multi-Scale Novel View Synthesis [27.4] NeLF-Proは、様々な自然界の光場をモデル化し、再構成するための新しい表現である。
私たちの中心となる考え方は、シーンの光場を空間的に異なる学習可能な表現に焼くことです。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:05:18 GMT)
Differential contributions of machine learning and statistical analysis to language and cognitive sciences [27.2] データ駆動のアプローチは科学研究に革命をもたらした。
機械学習と統計分析は、この種の研究で一般的に利用されている。
これらの違いを示すために一貫したデータセットを利用する研究はほとんどない。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:06:21 GMT)
AI-Generated Faces in the Real World: A Large-Scale Case Study of Twitter Profile Images [26.9] われわれは,Twitter上でAI生成プロフィール画像の普及状況について,大規模な調査を行った。
約1500万枚のTwitterプロフィール写真を分析したところ、0.052%が人工的に生成され、プラットフォーム上での存在が確認された。
結果は、スパムや政治的増幅キャンペーンなど、いくつかの動機も明らかにしている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:57:17 GMT)
OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework [26.7] 私たちは最先端のオープン言語モデルであるOpenELMをリリースします。
パラメータ予算は約10億のパラメータで、OpenELMはOLMoに比べて精度が2.36%向上している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 23:12:03 GMT)
Mapping Wireless Networks into Digital Reality through Joint Vertical and Horizontal Learning [26.5] VH-Twinは、無線ネットワークをデジタルリアリティーにマッピングする時系列データ駆動フレームワークである。
V-ツインニングは分散学習技術を利用して、ネットワーククラスタから協調的にグローバルツインモデルを初期化する。
一方、H-ツインニングは、ネットワークや環境の変化に応じて動的に双子のモデルを更新する非同期マッピング方式で実装されている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 18:02:17 GMT)
FASTTRACK: Fast and Accurate Fact Tracing for LLMs [26.5] 本稿では,Large Language Models (LLMs) の機能を活用して,クエリに対する支援的エビデンスを検証する新しいアプローチであるFASTTRACKを紹介する。
実験の結果,FASTTRACKは既存の手法よりも精度と効率が優れていることがわかった。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 00:07:55 GMT)
Neuromorphic Face Analysis: a Survey [26.4] イベントカメラ(英: event camera)またはニューロモルフィックセンサー(英: Neuromorphic sensor)は、生物学的視覚系の機能を模倣する撮像装置の一種である。
これらの特性は、有効性とプライバシー保護の観点から、人間の顔のモデリングにおいて興味深いことが証明されている。
本稿では,ニューロモルフィック顔分析分野における機能,課題,新たな応用について概説する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:18:38 GMT)
DSDRNet: Disentangling Representation and Reconstruct Network for Domain Generalization [26.2] 本稿ではDSDRNetと呼ばれるデュアルストリーム分離再構成ネットワークを提案する。
これは、二重ストリーム融合を通じて、インスタンス間およびインスタンス内両方の特徴を統合する、アンタングルメント・リコンストラクションのアプローチである。
4つのベンチマークデータセットの実験により、DSDRNetはドメインの一般化能力において他の一般的なメソッドよりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 03:15:42 GMT)
Drop your Decoder: Pre-training with Bag-of-Word Prediction for Dense Passage Retrieval [26.0] マスケードオートエンコーダの事前学習は,高密度検索システムの初期化・拡張技術として広く普及している。
マスク付きオートエンコーダのデコーダを、完全に単純化されたBag-of-Word予測タスクに置き換えることで、従来のMAEの修正を提案する。
提案手法は,新たなパラメータを必要とせずに,大規模検索ベンチマークにおける最先端の検索性能を実現する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:44:14 GMT)
A Survey on Efficient Inference for Large Language Models [25.6] 大きな言語モデル(LLM)は、様々なタスクにまたがる顕著なパフォーマンスのために、広く注目を集めている。
LLM推論のかなりの計算とメモリ要件は、リソース制約のあるシナリオへの展開に困難をもたらす。
本稿では,LLMの効率的な推論について,既存の文献を包括的に調査する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:53:08 GMT)
LLM-State: Open World State Representation for Long-horizon Task Planning with Large Language Model [25.3] 本研究では,Large Language Model (LLM) を用いたオープンワールド家庭環境における長期タスクプランニングの問題に対処する。
既存の作業は、キーオブジェクトと属性を明示的に追跡することができない。
オブジェクト属性の連続的な拡張と更新を提供するオープンステート表現を提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:35:50 GMT)
Transformer Fusion with Optimal Transport [25.0] Fusionは、独立に訓練された複数のニューラルネットワークをマージして、それらの能力を組み合わせる技術である。
本稿では, トランスポートを利用した2つ以上のトランスフォーマーネットワークを (ソフト) に融合させる手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:38:17 GMT)
Do not think pink elephant! [25.0] 本稿では,近年の安定拡散やDALL-E3のような大規模モデルが,人間の知能の脆弱性を共有していることを示す。
本稿では,LMプロバイダのポリシによって禁止された数字を生成する,シンプルなプロンプトベースの攻撃手法を提案する。
これらの攻撃に対抗するために,認知療法技術に触発された即時防衛戦略を導入する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:28:13 GMT)
Describe-then-Reason: Improving Multimodal Mathematical Reasoning through Visual Comprehension Training [25.0] オープンソースのマルチモーダル大言語モデル(MLLM)は、テキスト入力や視覚入力を含む様々なタスクに優れる。
MLLMは複雑なマルチモーダルな数学的推論に苦慮し、GPT-4V(ision)やGemini-Proといった独自のモデルに遅れを取っている。
本稿では,2段階のトレーニングパイプラインVCARを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 21:59:35 GMT)
Self-Supervised Monocular Depth Estimation in the Dark: Towards Data Distribution Compensation [24.4] 光度一貫性の仮定は、複雑な照明条件下で撮影されたビデオには通常違反するため、自己超越のために夜間画像を使用することは信頼できない。
本研究では,トレーニング中に夜間画像を使用しない夜間単眼深度推定手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 03:39:03 GMT)
Marking: Visual Grading with Highlighting Errors and Annotating Missing Bits [23.7] マーキング(Marking)は、学生の反応の詳細な分析を行うことにより、自動階調システムを強化する新しい階調タスクである。
本稿では,この課題に特化して,主観的課題エキスパートが慎重にキュレートした新しいデータセットを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:00:46 GMT)
Towards Robust Trajectory Representations: Isolating Environmental Confounders with Causal Learning [23.7] 本稿では、因果学習に基づく軌道モデリングフレームワーク(TrajCL)を提案する。
TrajCLは、より優れた一般化と解釈可能性を示しながら、軌道分類タスクのパフォーマンスを著しく向上させる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:34:58 GMT)
CrossScore: Towards Multi-View Image Evaluation and Scoring [23.4] 相互参照画像品質評価法は画像評価景観のギャップを埋める。
本手法は,地上の真理参照を必要とせず,精度の高い画像品質評価を可能にする。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:59:36 GMT)
Benchmarking Multi-Modal LLMs for Testing Visual Deep Learning Systems Through the Lens of Image Mutation [23.2] ビジュアルディープラーニング(VDL)システムは、画像認識、オブジェクト検出、自律運転といった現実世界のアプリケーションで大きな成功を収めている。
VDLの信頼性を評価するために、ソフトウェアテストは画像意味論よりも多様で制御可能な突然変異を必要とする。
MLLM(Multi-modal large language model)の急速な開発により、命令駆動方式による画像突然変異の可能性も導入された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:41:41 GMT)
Planning Ahead in Generative Retrieval: Guiding Autoregressive Generation through Simultaneous Decoding [23.1] 本稿では,文書識別子の自動生成を支援する新しい最適化および復号化手法であるPAGを紹介する。
MSMARCO と TREC Deep Learning Track のデータによる実験の結果,PAG は最先端の生成的検索モデルよりも大きなマージンで優れていることがわかった。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 21:50:01 GMT)
Empirical study of pretrained multilingual language models for zero-shot cross-lingual knowledge transfer in generation [23.0] 言語間の知識伝達により、多言語事前学習言語モデル(mPLM)が他の言語で予測できる。
以前の作業では、間違った言語で頻繁に発生する問題に気付き、通常、mT5をバックボーンモデルとして使用して対処するためのアプローチを提案する。
本研究では,mBART や NLLB-200 などの代替 mPLM を,アダプタを用いた完全微調整およびパラメータ効率の高い微調整により検証する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:10:45 GMT)
Zero-shot cross-lingual transfer in instruction tuning of large language models [22.9] 我々は、LLMを英語のみのデータで指導し、他の言語でユーザプロンプトでテストする場合、ITにおけるゼロショットの言語間移動について研究する。
モデルトレーニングのすべての段階が英語中心であっても、ITにおいて言語間の移行が成功していることが分かっています。
英語で訓練されたLLMは、他の言語で正しい言語、包括的で有用な応答を生成することができるが、事実性が低いため、時々流布エラーが発生することがある。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:44:21 GMT)
Key ingredients for effective zero-shot cross-lingual knowledge transfer in generative tasks [22.9] ゼロショットの言語間知識伝達により、ある言語でタスクを微調整し、他の言語でタスクの予測を行う多言語事前学習言語モデルが可能になる。
以前の作業では、間違った言語で頻繁に発生する問題に気付き、通常、mT5をバックボーンモデルとして使用して対処するためのアプローチを提案する。
本研究では,mBARTやNLLB-200といった代替バックボーンモデルを含む,統一された設定で文献から提案されるさまざまなアプローチを比較した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:32:00 GMT)
SnapKV: LLM Knows What You are Looking for Before Generation [22.1] SnapKVは、キーバリューキャッシュサイズを効率的に最小化する、微調整不要のアプローチである。
現実世界のアプリケーションで同等のパフォーマンスを提供する。
さらなる研究は、SnapKVの実用的な応用の可能性を示している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:42:58 GMT)
SAFDNet: A Simple and Effective Network for Fully Sparse 3D Object Detection [22.1] SAFDNetは、完全にスパースな3Dオブジェクト検出のための単純かつ高効率なアーキテクチャである。
オープン、nuScenes、Argoverse2データセットについて広範な実験を行った。
SAFDNetは以前の最高のハイブリッド検出器HEDNetを2.1倍高速で2.6%のmAPで上回った。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:43:09 GMT)
Efficient Reinforcement Learning for Routing Jobs in Heterogeneous Queueing Systems [21.9] 我々は、中央キューに到着するジョブをヘテロジニアスサーバのシステムに効率的にルーティングする問題を考察する。
均質なシステムとは異なり、キュー長が一定のしきい値を超えた場合、ジョブを遅いサーバにルーティングするしきい値ポリシーは、ワンファストワンスローの2サーバシステムに最適であることが知られている。
本稿では,低次元ソフトしきい値パラメータ化を用いた効率的なポリシー勾配に基づくアルゴリズムであるACHQを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 01:59:47 GMT)
Scene Coordinate Reconstruction: Posing of Image Collections via Incremental Learning of a Relocalizer [21.8] シーンを描写した画像からカメラパラメータを推定するタスクに対処する。
学習に基づく再ローカライズ手法であるシーン座標回帰により、未提示画像から暗黙的なニューラルシーン表現を構築することができることを示す。
提案手法であるACE0 (ACE Zero) は,新規なビュー合成によって示される特徴ベースのSfMに匹敵する精度でカメラのポーズを推定する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:02:33 GMT)
LIGO operates with quantum noise below the Standard Quantum Limit [21.8] LIGO A+のアップグレードにより、検出器の量子ノイズが標準量子限界以下で最大3dBまで低減され、ブロードバンド感度が向上したことを示す。
ハイゼンベルクの不確実性原理は、物体の位置と運動量の両方を正確に測定できないと規定する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:32:18 GMT)
Dual Model Replacement:invisible Multi-target Backdoor Attack based on Federal Learning [21.6] 本稿では,フェデレート学習に基づくバックドア攻撃手法を設計する。
バックドアトリガの隠蔽を目的としたエンコーダデコーダ構造を備えたトロイジャンガンステガノグラフィーモデルが設計されている。
フェデレート学習に基づく二重モデル置換バックドア攻撃アルゴリズムを設計する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:44:02 GMT)
HOIST-Former: Hand-held Objects Identification, Segmentation, and Tracking in the Wild [21.5] HOIST-Formerは、互いに特徴を反復的にプーリングすることで、空間的および時間的に手や物体を分割することができる。
HOISTは4,125本のビデオで,有界ボックス,セグメンテーションマスク,ハンドヘルドオブジェクトのIDを追跡する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 01:42:45 GMT)
Trees versus Neural Networks for enhancing tau lepton real-time selection in proton-proton collisions [21.4] 本稿では,陽子-陽子衝突器におけるハドロン崩壊したタウレプトンのリアルタイム選択(トリガリング)のための教師あり学習手法を紹介する。
このような実装が選択エネルギー閾値を低くする可能性を示し、新しい現象の探索の感度を高めることに寄与する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:46:51 GMT)
Protecting Your LLMs with Information Bottleneck [20.9] 本稿では,情報ボトルネック原理に基づく防御機構であるIBProtector(Information Bottleneck Protector)を紹介する。
IBProtectorは、軽量で訓練可能な抽出器によって促進されるプロンプトを選択的に圧縮し、摂動する。
IBProtectorはジェイルブレイク対策において,現在の防御方法よりも優れていた。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:16:07 GMT)
Towards Fairness-aware Crowd Management System and Surge Prevention in Smart Cities [20.7] 我々は,全個人の多様なニーズを考慮に入れた,急激なイベントに続く公正避難戦略の実施を提唱する。
次に,アトラクション位置の調整とステージ演奏の切り替えを含む予防的アプローチを提案する。
本研究は, 公正避難戦略が安全対策および傾斜度に及ぼす影響を実証し, 平均41.8%の公正度向上効果を示した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:51:47 GMT)
Text in the Dark: Extremely Low-Light Text Image Enhancement [20.6] 低照度テキスト画像は自然の場面で一般的であり、シーンテキストの検出と認識が困難である。
強調中のシーンテキスト領域に注目するエッジ対応アテンションモジュールを備えた新しいエンコーダデコーダフレームワークを提案する。
提案手法は,新しいテキスト検出とエッジ再構成の損失を利用して,低レベルなシーンテキストの特徴を強調し,テキスト抽出に成功した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 12:39:12 GMT)
DrawTalking: Building Interactive Worlds by Sketching and Speaking [19.4] そこで我々はDrawTalkingを紹介した。DrawTalkingは、スケッチと音声による対話的世界の構築と制御のためのアプローチである。
ユーザコントロールと柔軟性を強調し、コードを必要としないプログラミングのような機能を提供する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 05:04:26 GMT)
Automated Long Answer Grading with RiceChem Dataset [19.3] 教育自然言語処理分野における新たな研究分野について紹介する:ALAG(Automated Long Answer Grading)
ALAGは、事実に基づく長い答えの複雑さと多面的な性質のために、ユニークな課題を提示している。
本稿では, 自然言語推論モデルを用いて, ALAG に対する新たなアプローチを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:28:09 GMT)
Distributional Black-Box Model Inversion Attack with Multi-Agent Reinforcement Learning [19.2] 本稿では,ターゲットのプライバシデータを検索する確率的潜在空間を構築することで,DBB-MI(Distributedal Black-Box Model Inversion)攻撃を提案する。
潜在確率分布は、潜在空間におけるターゲットプライバシデータと密接に一致しているため、回収されたデータは、ターゲットモデルのトレーニングサンプルのプライバシを著しくリークする。
多様なデータセットやネットワーク上で行った実験から,現在のDBB-MIは,攻撃精度,Kアレスト近傍の特徴距離,Pak Signal-to-Noise比よりも優れた性能を示している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:18:38 GMT)
Holistic Safety and Responsibility Evaluations of Advanced AI Models [18.3] 高度なAIモデルの安全性と責任評価は、研究と実践の重要な分野である。
Google DeepMindの高度なAIモデルの開発において、安全評価に幅広いアプローチを革新し、適用しました。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:26:49 GMT)
UVEB: A Large-scale Benchmark and Baseline Towards Real-World Underwater Video Enhancement [18.0] 最初の大規模高解像度水中ビデオ強調ベンチマーク(UVEB)を構築した。
1,308対のビデオシーケンスと453,000以上の高解像度のUHD(Ultra-High-Definition)4Kフレームペアを含んでいる。
UVE-Netは、現在のフレーム情報を畳み込みカーネルに変換し、隣接するフレームに渡して効率的なフレーム間情報交換を行う。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 19:29:12 GMT)
Representing Anatomical Trees by Denoising Diffusion of Implicit Neural Fields [17.9] 解剖学的木は臨床診断と治療計画において中心的な役割を果たす。
伝統的な木構造表現法は、医学的画像を用いて捉えられ、解像度、柔軟性、効率の制限による欠点を示す。
暗黙的神経表現(INR)を用いた解剖学的木表現の新しい手法を提案する。
解剖学的樹木の複雑な地形や地形を任意の解像度で正確に把握する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:58:52 GMT)
Scoring Intervals using Non-Hierarchical Transformer For Automatic Piano Transcription [17.7] 本稿では,変圧器の注目度に類似したスケール内積演算を用いた簡易スコアリング手法を提案する。
エンコーダのみの非階層型トランスフォーマーバックボーンを低解像度の特徴マップでのみ動作させ,ピアノの音符やペダルを高精度かつ高精度に書き起こせることを示した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:54:08 GMT)
Optimal Design for Human Feedback [17.5] 学習嗜好モデルにおけるデータ収集の問題について検討する。
提案するアイデアの汎用性を示すため,リスト内の項目に対する絶対的および相対的フィードバックについて検討する。
設定と解析の両方に効率的なアルゴリズムを設計する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 06:05:35 GMT)
LLM-Personalize: Aligning LLM Planners with Human Preferences via Reinforced Self-Training for Housekeeping Robots [17.3] 大型言語モデル (LLM) はロボット工学の応用に大きな可能性を示している。
これらのモデルの個々のユーザの好みに対するパーソナライズには、重要なギャップが残っている。
LLMプランナを家庭用ロボティクス向けにパーソナライズするための最適化パイプラインを備えた新しいフレームワークであるLLM-Personalizeを紹介した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:35:33 GMT)
Multi-Agent Hybrid SAC for Joint SS-DSA in CRNs [17.2] 機会論的スペクトルアクセスは、認知無線ネットワーク(CRN)におけるスペクトル利用の効率を高める可能性がある
CRNでは、スペクトルセンシングとリソース割り当て(SSRA)の両方がシステムスループットの最大化に不可欠である。
我々は,ハイブリッドソフトアクター批評家MHSACのマルチエージェント実装を開発した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:30:03 GMT)
If It's Not Enough, Make It So: Reducing Authentic Data Demand in Face Recognition through Synthetic Faces [17.0] 大規模な顔データセットは、主にWebベースのイメージから作成され、明示的なユーザの同意が欠如している。
本稿では,合成顔データを用いて効果的な顔認識モデルの訓練を行う方法について検討する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 23:15:32 GMT)
Offensive AI: Enhancing Directory Brute-forcing Attack with the Use of Language Models [16.9] Offensive AIは、AIベースの技術をサイバー攻撃に統合するパラダイムである。
そこで本研究では,AIがディレクトリ列挙プロセスを強化し,新しい言語モデルベースのフレームワークを提案する。
実験は、異なるWebアプリケーションドメインから100万のURLからなるテストベッドで実施され、平均パフォーマンスが969%向上したLMベースの攻撃の優位性を実証した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 12:40:38 GMT)
Multi-Objective Fine-Tuning for Enhanced Program Repair with LLMs [16.9] 大規模言語モデル(LLM)は、幅広い下流タスクにおいて顕著な機能を示した。
プログラム修復のためのLLMファインチューニングの学習焦点に関する新しい視点を提案する。
我々はMORepairを、サイズやアーキテクチャの異なる4つのオープンソースLCMの微調整に応用する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 06:21:39 GMT)
A New Optimization Model for Multiple-Control Toffoli Quantum Circuit Design [16.8] 本稿では,従来の量子コンピューティングの背景を前提とせずに,可逆ブール関数に対するMCT量子回路設計問題を紹介する。
最大7量子ビットと最大15個の量子ゲートを使った実験は、よく知られたベンチマークのためのいくつかの新しい最もよく知られた回路をもたらす。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:37:17 GMT)
360VOTS: Visual Object Tracking and Segmentation in Omnidirectional Videos [16.4] 我々は全方向ビデオオブジェクトセグメンテーション(360VOS)と呼ばれる新しいコンポーネントを組み込んだ包括的なデータセットとベンチマークを提案する。
360VOSデータセットは、高密度のピクセルワイドマスクを伴い、290のシーケンスを含み、幅広いターゲットカテゴリをカバーする。
我々は最先端のアプローチをベンチマークし、提案した360度トラッキングフレームワークとトレーニングデータセットの有効性を実証する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:54:53 GMT)
No General Code of Ethics for All: Ethical Considerations in Human-bot Psycho-counseling [16.3] 本稿では,人間ロボットの心理カウンセリングに特化した実証的倫理原則を提案する。
EVA2.0, GPT-3.5, GPT-4.0の反応を心理カウンセリングと精神健康調査の文脈で検討した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:29:04 GMT)
Large Language Model as a Policy Teacher for Training Reinforcement Learning Agents [16.2] LLM(Large Language Models)は、高レベルの命令を提供することによって、シーケンシャルな意思決定タスクに対処することができる。
LLMは、特にリアルタイムな動的環境において、特定のターゲット問題に対処する専門性を欠いている。
LLMベースの教師エージェントからの指示を用いて、より小規模で専門的なRLエージェントを訓練することで、これらの課題に対処する新しいフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:17:58 GMT)
Information Re-Organization Improves Reasoning in Large Language Models [16.1] 大規模言語モデル(LLM)の推論能力を高める情報再構成(InfoRE)手法を提案する。
まず、文書や段落などの文脈内容の再編成処理を行い、論理的関係を得る。
これにより、LLMはこれらの論理的関係を明確に認識することで、文脈的内容の理解を深めることができる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:47:27 GMT)
Towards Better Text-to-Image Generation Alignment via Attention Modulation [16.0] 本研究では,拡散モデルに対する注意の変調による学習自由な位相ワイズ機構である属性焦点機構を提案する。
クロスアテンションモジュールには、オブジェクト指向マスキングスキームと位相ワイドダイナミックウェイトコントロール機構が組み込まれている。
様々なアライメントシナリオにおける実験結果から,我々のモデルは最小の計算コストでより優れた画像テキストアライメントを実現することができた。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 06:18:37 GMT)
Global OpenBuildingMap -- Unveiling the Mystery of Global Buildings [16.0] 我々は今までに作られた最も高解像度で高精度なビルディングマップ、Global OpenBuildingMap(Global OBM)を作成しました。
ビルマップと太陽ポテンシャルの合同分析により、屋上太陽エネルギーは、合理的なコストで地球規模のエネルギー消費の需要を供給できることが示されている。
また,建築領域と重要社会経済変数の空間的相関も明らかにした。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 06:43:18 GMT)
SemEval-2024 Task 9: BRAINTEASER: A Novel Task Defying Common Sense [16.0] SemEval Task 9: BRAIN-TEASER(S)は、システムの推論と横方向の思考能力をテストするために設計された、このコンペティションにおける最初のタスクである。
本稿では,競争結果のきめ細かいシステム解析と,それがシステムに横方向の推論能力にどのような意味を持つのかを考察する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:21:27 GMT)
Improving Group Robustness on Spurious Correlation Requires Preciser Group Inference [15.9] 標準経験的リスク(ERM)モデルは、素早い特徴と真のラベルの間の学習の素早い相関を優先する。
GICは,グループラベルを正確に推測する手法であり,グループ性能が向上する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 01:28:35 GMT)
Neural Radiance Field in Autonomous Driving: A Survey [15.8] 本稿では、自律運転の文脈におけるNeRFの応用に関する包括的調査を行う。
本調査は,知覚,3次元再構成,同時局所化とマッピング(SLAM),シミュレーションなど,NeRFの自律運転(AD)への応用を分類するために構成されている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 01:36:50 GMT)
A Multimodal Feature Distillation with CNN-Transformer Network for Brain Tumor Segmentation with Incomplete Modalities [15.8] 本稿では,CNN-Transformer Hybrid Network (MCTSeg) を用いたマルチモーダル特徴蒸留法を提案する。
CNN-Transformer ネットワークと Transformer の畳み込みブロックを併用して提案するモジュールの重要性について検討した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:33:44 GMT)
Time Series Continuous Modeling for Imputation and Forecasting with Implicit Neural Representations [15.8] 本稿では,実世界のデータでしばしば発生する課題に対処するために,時系列計算と予測のための新しいモデリング手法を提案する。
本手法はシリーズの進化力学の連続時間依存モデルに依存する。
メタラーニングアルゴリズムによって駆動される変調機構は、観測されたタイムウインドウを超えて、見えないサンプルや外挿への適応を可能にする。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 13:10:58 GMT)
Hidden Flaws Behind Expert-Level Accuracy of GPT-4 Vision in Medicine [15.5] GPT-4V(Generative Pre-trained Transformer 4 with Vision)は、医学的課題において、医師よりも優れる。
本研究は,GPT-4Vのイメージ理解の理論的根拠,医用知識の想起,ステップバイステップのマルチモーダル推論を包括的に分析することにより,現在の範囲を拡大する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 23:04:41 GMT)
BCFPL: Binary classification ConvNet based Fast Parking space recognition with Low resolution image [15.4] 我々はBCFPLという軽量な設計構造を持つ二元畳み込みニューラルネットワークを提案し、低解像度の駐車空間画像でトレーニングすることができる。
実験の結果,BCFPLの精度は元の解像度画像と比較して低下しないことがわかった。
また、BCFPLはハードウェア要件が低く、プライバシー要件を満たす間に認識速度が速いため、インテリジェントな都市建設や自動運転分野にも応用できる可能性がある。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:07:42 GMT)
Quantum state engineering in a five-state chainwise system by coincident pulse technique [15.1] 5状態連鎖系の解は、等価な3状態$Lambda$-type 1に還元できることを示す。
それぞれのステップにおける4つの入射パルスは全て同じ時間依存性を持つが、特定の大きさを持つ。
この結果は、高忠実度多状態量子制御が不可欠であるアプリケーションに潜在的に興味を持つ。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:10:11 GMT)
Moral Sparks in Social Media Narratives [14.0] 実生活における倫理的シナリオにおける人間の道徳的判断を理解するために,ソーシャルメディア上でのインタラクションを検討する。
具体的には、r/AmITheAssholeと呼ばれるRedditの人気のサブレディット(サブコミュニティ)の投稿を調べる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 01:23:59 GMT)
Exploring Platform Migration Patterns between Twitter and Mastodon: A User Behavior Study [13.4] 最近、TwitterからMastodonなど他のプラットフォームに移行するユーザの急増により、移行パターンが何かという疑問が持ち上がった。
本研究では、Twitterのオーナーシップ変更後、最初の10週間でTwitterからMastodonに移行した1万人以上のユーザーからデータを収集して、これらの質問を調査する方法について詳しく述べる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 18:11:26 GMT)
Beyond the Edge: An Advanced Exploration of Reinforcement Learning for Mobile Edge Computing, its Applications, and Future Research Trajectories [13.1] Mobile Edge Computing (MEC)は、中央ネットワークを超えて計算とストレージの範囲を広げる。
リアルタイムで高品質なサービスを必要とするアプリケーションの出現は、低レイテンシ、高いデータレート、信頼性、効率、セキュリティなど、いくつかの課題をもたらしている。
本稿では,これらの問題を緩和する特定のRL手法を提案し,その実践的応用について考察する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:47:42 GMT)
DLoRA-TrOCR: Mixed Text Mode Optical Character Recognition Based On Transformer [13.0] 複数のフォント、混合シーン、複雑なレイアウトは、従来のOCRモデルの認識精度に深刻な影響を及ぼす。
本稿では,事前学習したOCR変換器,すなわちDLoRA-TrOCRに基づくパラメータ効率の良い混合テキスト認識手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:45:18 GMT)
On Prediction Feature Assignment in the Heckman Selection Model [12.9] MNARサンプル選択バイアスが欠如している場合、予測モデルの性能は劣化することが多い。
本稿では,MNARサンプル選択バイアスの古典的な例に焦点をあてる。
我々は,Heckmanモデルの予測機能を得るための新しいデータ駆動フレームワークとして,Heckman-FAを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:31:02 GMT)
An Adversarial Approach to Evaluating the Robustness of Event Identification Models [12.9] 本稿では,事象分類の特徴を抽出する物理に基づくモーダル分解法について考察する。
得られた分類器は、その堅牢性を評価するために、逆アルゴリズムに対してテストされる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:56:01 GMT)
Quantum Monte Carlo algorithm for solving Black-Scholes PDEs for high-dimensional option pricing in finance and its complexity analysis [12.9] 我々は,高次元オプション価格の相関で高次元のブラックショルズPDEを解く量子モンテカルロアルゴリズムを提案する。
有界なペイオフ関数に対しては,従来のモンテカルロ法と比較して,アルゴリズムの高速化が期待できる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:54:48 GMT)
General Item Representation Learning for Cold-start Content Recommendations [12.7] 冷間開始レコメンデーションのためのドメイン/データに依存しない表現学習フレームワークを提案する。
提案するモデルは、分類ラベルから完全に自由なエンドツーエンドのトレーニングが可能である。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 00:48:56 GMT)
CT-NeRF: Incremental Optimizing Neural Radiance Field and Poses with Complex Trajectory [12.5] ポーズや深度入力を伴わないRGB画像のみを用いた逐次再構成最適化パイプラインであるCT-NeRFを提案する。
実世界の2つのデータセットであるNeRFBusterとFree-DatasetにおけるCT-NeRFの性能を評価する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 06:07:06 GMT)
Choosing Wisely and Learning Deeply: Selective Cross-Modality Distillation via CLIP for Domain Generalization [12.3] ドメイン一般化(Domain Generalization, DG)は、複数のドメインにまたがるモデルをトレーニングし、見えないドメインでテストする。
ドメイン一般化のための選択的クロスモーダル蒸留法(Selective Cross-Modality Distillation for Domain Generalization, SCMD)を提案する。
SCMDは大規模な視覚言語モデル、特にCLIPの機能を活用して、より効率的なモデルをトレーニングする。
SCMDのパフォーマンスを様々なベンチマークで評価し、ResNet50に最先端のパフォーマンスを提供する権限を与えます。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 03:32:18 GMT)
ADELT: Transpilation Between Deep Learning Frameworks [12.3] Adversarial DEep Learning Transpiler (ADELT)は、ディープラーニングフレームワーク間のソースからソースへのトランスパイラのための新しいアプローチである。
コードスケルトントランスパイレーションでは、大きな言語モデル(LLM)で数発のプロンプトを使用するが、APIキーワードマッピングでは、コード固有のBERTからのコンテキスト埋め込みを使用する。
ADELTは、手作りのルールや並列データに頼ることなく、ラベルなしのWebcrawled Deep Learning Corpusでトレーニングされている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 18:18:15 GMT)
1st Place Solution to the 1st SkatingVerse Challenge [12.2] 本稿では,1stVerse Skating Challengeの優勝ソリューションを提案する。
我々は、DINOフレームワークを利用して、興味領域(ROI)を抽出し、生のビデオ映像の正確なトリミングを行う。
ログに基づいて予測結果をアンサンブルすることで、我々のソリューションは95.73%という印象的なリーダーボードスコアを得た。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:50:05 GMT)
Random Walk in Random Permutation Set Theory [11.7] ランダムウォーク(英: Random walk)は、自然過程を分子レベルでモデル化するための説明可能なアプローチである。
最近の調査はランダム置換集合論とランダムウォークとの有望な結びつきを示している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:18:14 GMT)
BAMBOO: a predictive and transferable machine learning force field framework for liquid electrolyte development [11.7] 本稿では,分子動力学(MD)シミュレーションのための新しいフレームワークであるBAMBOOを紹介し,リチウム電池用液体電解質の文脈でその能力を実証する。
BamBOOは密度、粘性、イオン伝導率などの主要な電解質特性を予測するための最先端の精度を示す。
この研究は、一般的な有機液体の性質をシミュレートできる「ユニバーサルMLFF」への道を開くことを目的としている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:44:12 GMT)
Large Language Models Can Learn Temporal Reasoning [11.6] 本稿では,言語に基づく時間的推論のための新しいフレームワークTG-LLMを提案する。
元の文脈を推論する代わりに、TR学習を容易にする潜在表現である時間グラフ(TG)を採用する。
合成データセット (TGQA) は, このテキストからTGへの翻訳作業において, LLMを微調整するために構築される。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:00:00 GMT)
Think Twice Before Selection: Federated Evidential Active Learning for Medical Image Analysis with Domain Shifts [11.6] 多様なドメインから得られたローカルデータの情報性を評価するための最初の試みを行う。
本稿では,ドメインシフト下でのデータ評価を校正する新しい手法であるFederated Evidential Active Learning(FEAL)を提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 13:11:56 GMT)
TeamTrack: A Dataset for Multi-Sport Multi-Object Tracking in Full-pitch Videos [11.4] マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な課題である。
スポーツにおけるMOTに特化したベンチマークデータセットであるTeamTrackを紹介する。
TeamTrackは、サッカー、バスケットボール、ハンドボールなど、さまざまなスポーツのフルピッチビデオデータを集めたコレクションだ。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:33:40 GMT)
OccFusion: A Straightforward and Effective Multi-Sensor Fusion Framework for 3D Occupancy Prediction [11.3] 本稿では,3次元占有率を予測するための簡易かつ効率的なセンサ融合フレームワークであるOccFusionを紹介する。
ライダーやサラウンドビューレーダなどの付加センサの機能を統合することで、我々のフレームワークは占有率予測の精度と堅牢性を高めることができる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:34:09 GMT)
Boter: Bootstrapping Knowledge Selection and Question Answering for Knowledge-based VQA [11.2] BoterはMLLM(Multimodal Large Language Model)の頑健なマルチモーダル認識機能を活用した知識選択と質問応答のための新しいフレームワークである。
我々のフレームワークは、挑戦的なオープンドメイン知識ベースのVQAベンチマークOK-VQAのベースラインの性能を大幅に向上させ、62.83%の最先端精度を実現した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:44:20 GMT)
Learning Control Barrier Functions and their application in Reinforcement Learning: A Survey [11.2] 強化学習は、新しいロボット行動を開発するための強力な技術である。
安全性の考慮事項を取り入れ、実際のロボットへの迅速な移動を可能にし、生涯の学習を容易にすることを目的としている。
安全な強化学習における有望なアプローチの1つは、制御障壁関数の使用である。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 22:52:14 GMT)
Unsupervised Learning of the Total Variation Flow [11.1] 総変動(TV)フローは、テレビ機能に基づいた画像のスケール空間表現を生成する。
TVflowNETは、初期画像とタイムインスタンスが与えられたTVフローの解を近似するための教師なしニューラルネットワークアプローチである。
また,TVflowNETは,画像サイズや画像の種類に応じて,高い忠実度でTVフロー解を近似することを示した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:41:38 GMT)
PeLiCal: Targetless Extrinsic Calibration via Penetrating Lines for RGB-D Cameras with Limited Co-visibility [11.0] 本稿では,RGB-Dカメラシステムのラインベースキャリブレーション手法であるPeLiCalについて述べる。
提案手法は,周辺環境からの長い線の特徴を活かし,新しい収束投票アルゴリズムを用いて外れ値のフィルタリングを行う。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:50:24 GMT)
Bored to Death: Artificial Intelligence Research Reveals the Role of Boredom in Suicide Behavior [10.8] この研究は、自殺行為を誘発または悪化させる隠れた危険因子を明らかにするために、AI方法論を活用することを目的としている。
ほぼ完全に自動化されたAI誘導研究パイプラインは、自殺のリスクを予測するFacebookのトピック4つを生み出した。
この研究は、抑うつによらず自殺行為を引き起こす可能性のある、不適応な「不注意」として退屈を示唆している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:16:02 GMT)
Collaborative Filtering Based on Diffusion Models: Unveiling the Potential of High-Order Connectivity [10.7] CF-Diffは新しい拡散モデルに基づく協調フィルタリング手法である。
マルチホップの隣人と一緒に、協調的な信号を完全に活用することができる。
最高の競争相手に比べて7.29%も上昇している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:49:46 GMT)
New Solutions Based on the Generalized Eigenvalue Problem for the Data Collaboration Analysis [10.6] データコラボレーション分析(Data Collaboration Analysis, DCA)は、計算コストと通信負荷の点で効率が良くなっている。
必要な協調機能を決定するための既存の最適化問題は、課題に直面している。
本研究では,行列を列ベクトルに分割することで最適化問題を定式化する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 13:26:42 GMT)
Noiseless linear amplification-based quantum Ziv-Zakai bound for phase estimation and its Heisenberg error limits in noisy scenarios [10.5] 本研究では, 位相推定性能が, 光子損失と位相拡散のケースを含む雑音のシナリオで著しく向上するかどうかを考察した。
以上の結果から,光子損失や位相拡散の場合,NLAゲインファクタの増加によりQZZBの位相推定性能が著しく向上することが示唆された。
我々の発見は、より複雑な量子情報処理タスクを達成するための有用なガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 13:41:38 GMT)
Multi-view Disentanglement for Reinforcement Learning with Multiple Cameras [10.3] 自己中心型カメラを含む複数のカメラを同時に訓練することで、異なるカメラ視点からの情報を活用して強化学習(RL)の性能を向上させることができる。
トレーニングセットから任意のカメラに対してゼロショットの一般化を実現するためのポリシーを,複数のカメラを用いて学習する多視点ディスタングル(MVD)を提案する。
提案手法は、複数のカメラから不整合表現を学習するRLの自己教師型補助タスクであり、全カメラにまたがって一台のカメラへの一般化を可能にする共有表現と、カメラ固有のプライベート表現とを有する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:21:41 GMT)
MultiBooth: Towards Generating All Your Concepts in an Image from Text [10.2] 本稿では,テキストからの画像生成において,マルチコンセプトをカスタマイズするための新しい,効率的な手法であるMultiBoothを紹介する。
単一概念学習フェーズでは,多モード画像エンコーダと効率的な概念符号化技術を用いて,各概念の簡潔かつ識別的な表現を学習する。
多概念統合フェーズでは、有界ボックスを用いて、相互注意マップ内の各概念の生成領域を定義する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:47:54 GMT)
A Survey on the Real Power of ChatGPT [9.8] ChatGPTはAIコミュニティを変え、ChatGPTのパフォーマンス評価を活発に研究している。
評価の重要な課題は、ChatGPTが依然としてクローズドソースであり、従来のベンチマークデータセットがトレーニングデータとしてChatGPTによって使用された可能性があることだ。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 23:31:28 GMT)
Gorgeous: Create Your Desired Character Facial Makeup from Any Ideas [9.6] $Gorgeous$は、新しい拡散ベースのメイクアップメソッドである。
参照画像に顔が存在する必要はない。
$Gorgeous$は、選択したテーマの参照画像にインスパイアされた、特徴的な顔のメイクを効果的に生成できる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:40:53 GMT)
Guess The Unseen: Dynamic 3D Scene Reconstruction from Partial 2D Glimpses [9.5] 本研究では,モノクロ映像から世界と複数の動的人間を3次元に再構成する手法を提案する。
キーとなるアイデアとして、最近出現した3Dガウススプラッティング(3D-GS)表現を通じて、世界と複数の人間の両方を表現します。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:59:50 GMT)
Non-Uniform Exposure Imaging via Neuromorphic Shutter Control [9.5] 動作のぼやけを回避し,瞬時雑音を軽減する新しいニューロモルフィックシャッター制御(NSC)システムを提案する。
本稿では,SNR(Inconsistent Signal-to-Noise Ratio)を安定化させるために,自己教師付き学習パラダイム内でのイベントベース画像復調ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:28:41 GMT)
Quantum master equation for many-body systems: Derivation based on the Lieb-Robinson bound [9.5] 我々はリーブ-ロビンソン境界に基づいて局所ゴリーニ-コサコフスキー-スダルシャン-リンドブラッド(GKSL)量子マスター方程式を導出する。
一次元強結合フェルミオン鎖に対する導出局所GKSL方程式の有効性を数値的に検証する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:25:04 GMT)
Surgical-DeSAM: Decoupling SAM for Instrument Segmentation in Robotic Surgery [9.5] 安全クリティカルな外科的タスクでは、教師あり学習のためのフレーム単位のプロンプトが欠如しているため、プロンプトは不可能である。
リアルタイムトラッキングアプリケーションのフレーム単位でのプロンプトは非現実的であり,オフラインアプリケーションのアノテートには費用がかかる。
実時間ロボット手術において,SAMを分離するための自動バウンディングボックスプロンプトを生成するために,手術用デSAMを開発した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:53:55 GMT)
HashPoint: Accelerated Point Searching and Sampling for Neural Rendering [9.4] レンダリングとレイトレーシングの2つの典型的なアプローチが採用されている。
ボリューム化ベースの手法は、メモリの増大と忠実度低下を犠牲にしてリアルタイムレンダリングを可能にする。
対照的に、レイトレーシングに基づく手法は優れた品質を得るが、より長い時間を要求する。
我々はこの2つの戦略を組み合わせたHashPoint法によりこの問題を解決する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:57:53 GMT)
Stochastic waveform estimation at the fundamental quantum limit [9.3] 我々は、基本的な精度限界、拡張されたチャネル量子Cram'er-Rao境界、それに到達する最適なプロトコルを導出する。
我々は、この非ガウス的プロトコルが量子重力、重力波、および軸イオンダークマターの探索を改善する方法について論じる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:31:56 GMT)
PGAHum: Prior-Guided Geometry and Appearance Learning for High-Fidelity Animatable Human Reconstruction [9.2] 我々はPGAHumを紹介した。PGAHumは、高忠実でアニマタブルな人体再構成のための、事前ガイダンス付き幾何学および外観学習フレームワークである。
我々はPGAHumの3つの主要モジュールにおける3次元人体前駆体を徹底的に利用し、複雑な細部と見えないポーズのフォトリアリスティックなビュー合成による高品質な幾何再構成を実現する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:22:30 GMT)
Typos that Broke the RAG's Back: Genetic Attack on RAG Pipeline by Simulating Documents in the Wild via Low-level Perturbations [9.2] Retrieval-Augmented Generation (RAG) は、Large Language Models (LLM) の限界に対処するための有望なソリューションである。
本研究では,RAGのロバスト性評価における2つの未解明点について検討する。
本稿では,RAG(textitGARAG)を標的とした新たな攻撃手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:49:36 GMT)
A Note on Output Length of One-Way State Generators and EFIs [9.0] 本研究では,一方向状態発生器(OWSG)の出力長,より弱い変種,EFIの出力長について検討する。
我々は、$O(log lambda)$-qubit出力を持つOWSGは存在しないことを示した。
また、$O(log lambda)$-qubit EFIが存在しないことも証明します。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:38:40 GMT)
Navigating the Path of Writing: Outline-guided Text Generation with Large Language Models [8.9] 本稿では,Large Language Models (LLMs) をユーザ整列テキスト生成のガイドとして,明示的なアウトラインを用いたLinging Pathを提案する。
我々のアプローチは、構造化された記述計画と推論パスからインスピレーションを得て、書き込みプロセス全体を通してユーザの意図を捉え、反映することに重点を置いています。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 06:57:43 GMT)
Image Hijacks: Adversarial Images can Control Generative Models at Runtime [8.6] 推論時に視覚言語モデルの振る舞いを制御する画像ハイジャック, 逆画像を検出する。
Prompt Matching法を考案し、任意のユーザ定義テキストプロンプトの動作にマッチしたハイジャックをトレーニングする。
我々は、Behaviour Matchingを使って、4種類の攻撃に対してハイジャックを作らせ、VLMは敵の選択の出力を生成し、コンテキストウィンドウから情報をリークし、安全トレーニングをオーバーライドし、偽の声明を信じるように強制する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:18:47 GMT)
Closing the Gap in High-Risk Pregnancy Care Using Machine Learning and Human-AI Collaboration [8.4] 高リスク妊娠(英: High-risk pregnant)は、母親や乳児の結果に悪影響を及ぼす要因によって複雑な妊娠である。
本研究は、合併症のリスクがある妊婦の特定において、ケアマネージャを支援するための現実のMLベースのシステムの実装を提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:27:58 GMT)
Latency-Distortion Tradeoffs in Communicating Classification Results over Noisy Channels [8.2] 本研究では,確率ベクトルをノイズチャネル上で伝達する必要があるシナリオについて検討する。
伝送遅延と歪みのトレードオフを分析する。
以上の結果から,ソース歪み(f-ディバージェンスによって測定される確率ベクトルの歪み)とその後のチャネル符号化/復号パラメータとの間には興味深い相互作用があることが示唆された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 21:22:12 GMT)
Two-timescale Extragradient for Finding Local Minimax Points [8.1] ミニマックス問題の解法として, 2時間スケールのエクストラグレード法が有効であることを示す。
この研究は、局所ミニマックス点の発見に関する過去のすべての結果に対して、確実に改善する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 12:06:46 GMT)
Fairness Incentives in Response to Unfair Dynamic Pricing [8.0] 我々は基本的な模擬経済を設計し、公正な価格設定の行動を採用するよう企業にインセンティブを与えるために法人税のスケジュールを作成する。
可能な政策シナリオを網羅するため、我々は、ソーシャルプランナーの学習問題を、マルチアームバンディット、コンテキストバンディット、およびフル強化学習(RL)問題として定式化する。
社会的福祉はフェアネス非依存ベースラインのそれよりも改善し,マルチアームおよびコンテキストバンディット設定のための分析学的に最適なフェアネス対応ベースラインにアプローチすることを発見した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 23:12:58 GMT)
Accurate Chemical Reaction Modeling on Noisy Intermediate-Scale Quantum Computers Using a Noise-Resilient Wavefunction Ansatz [7.9] このプロトコルのパワーは、最大10個の原子を持つ系の数値的な結果によって示される。
結果は、NISQ時代の量子ユーティリティの実現における重要な一歩である。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:52:50 GMT)
Investigation of the effectiveness of applying ChatGPT in Dialogic Teaching Using Electroencephalography [6.3] 大規模言語モデル(LLM)には、知識を解釈し、質問に答え、文脈を考える能力がある。
この研究は、34人の大学生を参加者として募集し、ランダムに2つのグループに分けられた。
実験群はChatGPTを用いて対話型指導を行い,コントロール群は人間教師と対話した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:48:00 GMT)
C2F-SemiCD: A Coarse-to-Fine Semi-Supervised Change Detection Method Based on Consistency Regularization in High-Resolution Remote Sensing Images [6.2] 高精度特徴抽出モデルは変化検出(CD)に不可欠である
整合正則化(C2F-SemiCD)に基づく粗大な半教師付きCD法を提案する。
C2F-SemiCD法の有効性と有効性を検討した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 02:34:50 GMT)
CNN-Based Equalization for Communications: Achieving Gigabit Throughput with a Flexible FPGA Hardware Architecture [6.1] 本稿では、現代の光通信システムのスループット要件を満たすANNベースの等化器の高性能FPGA実装について述べる。
この実装は、アルゴリズムからハードウェアアーキテクチャへの最適化を特徴とする層間設計アプローチに基づいている。
FPGAの実装は40GB以上のスループットを実現し、高性能なグラフィックス処理ユニットより優れている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:13:47 GMT)
Benchmarking Advanced Text Anonymisation Methods: A Comparative Study on Novel and Traditional Approaches [5.9] 本稿では,変圧器モデルと大規模言語モデルの性能を,テキスト匿名化のための従来のアーキテクチャと比較する。
本研究は, 従来の手法と現代手法の有効性について, それぞれのアプローチの長所と短所を明らかにした。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 12:06:54 GMT)
WangLab at MEDIQA-M3G 2024: Multimodal Medical Answer Generation using Large Language Models [5.8] タスクの英語圏における2つのスタンドアロン解について結果を報告する。
我々は,多段階LLM法とCLIP画像分類法を,今後の研究の道筋として捉えた。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:29:58 GMT)
WangLab at MEDIQA-CORR 2024: Optimized LLM-based Programs for Medical Error Detection and Correction [5.8] 3つのサブタスクすべてでトップパフォーマンスを達成したアプローチを提示する。
微妙な誤りを含むMSデータセットに対して,検索に基づくシステムを開発した。
UWデータセットでは、より現実的な臨床ノートを反映して、エラーを検出し、ローカライズし、修正するためのモジュールのパイプラインを作成しました。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 19:31:45 GMT)
Prove Symbolic Regression is NP-hard by Symbol Graph [5.7] 本稿では,数式空間全体の包括的表現としての記号グラフの概念を紹介する。
我々は適度に調整されたSteiner Arborescence (DCSAP) を同定する。
NPハードであることが証明されたDCSAPの複雑さは、直接的に、SR問題のNPハードの性質を意味する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 01:48:58 GMT)
Generating $k$ EPR-pairs from an $n$-party resource state [5.6] LOCCプロトコルは任意の$k$不随意のパーティ間でEPRペアを作成することができることを示す。
例えば、$k=n/2$であれば、当事者は少なくとも$Omega(loglog n)$ qubitsを持つ必要がある。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:52:51 GMT)
Neural Inventory Control in Networks via Hindsight Differentiable Policy Optimization [5.6] 我々は、在庫管理が深層強化学習(DRL)アルゴリズムを確実に適用し、評価するユニークな機会であると主張している。
ひとつはHendsight Differentiable Policy Optimization (HDPO)で、政策性能を最適化するために勾配降下を行う。
第2の手法は、ポリシー(神経)ネットワーク構造と在庫ネットワークの構造を整合させることである。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:07:31 GMT)
Learning A Physical-aware Diffusion Model Based on Transformer for Underwater Image Enhancement [5.6] 本稿では,拡散過程の導出に物理知識を活用するための新しいUIEフレームワークであるPA-Diffを紹介する。
拡散過程を導くための物理の事前知識を利用することで、PDTブランチは水中認識能力を獲得し、現実世界の水中シーンにおける複雑な分布をモデル化することができる。
INRブランチは、暗黙の神経表現を通じて多様な水中画像から堅牢な特徴表現を学習することができるため、PDTブランチの復元が困難になる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:13:48 GMT)
PhyPlan: Generalizable and Rapid Physical Task Planning with Physics Informed Skill Networks for Robot Manipulators [5.4] 物理推論の既存の方法は、実世界固有の複雑さと不確実性に苦しむデータハングリーである。
本稿では,物理インフォームドニューラルネットワーク(PINN)と修正モンテカルロ木探索(MCTS)を組み合わせた物理インフォームド計画フレームワークであるPhyPlanについて述べる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 06:35:08 GMT)
A General Continuous-Time Formulation of Stochastic ADMM and Its Variants [5.3] 我々は、一般化ADMMと呼ばれる統一的なアルゴリズムフレームワークを導入する。
継続的分析によって、ADMMと変種に関する新たな洞察が得られます。
適切なスケーリングの下では、ADMMの軌道は小さい雑音を持つ微分方程式の解に弱収束することが証明される。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:12:58 GMT)
Optimal Task Assignment and Path Planning using Conflict-Based Search with Precedence and Temporal Constraints [5.3] 本稿では,TAPF-PTC問題におけるタスク割り当てと経路探索について検討する。
我々は、競合ベースの検索(CBS)を拡張して、優先度と時間的制約に従うタスク割り当てと衝突のない経路を同時に生成する。
実験により,我々のアルゴリズムであるCBS-TA-PTCは,優先度と時間的制約を効果的に解決できることを示した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 00:46:34 GMT)
Random and Safe Cache Architecture to Defeat Cache Timing Attacks [5.1] キャッシュは、メモリアクセスの処理に要する時間が異なるため、秘密情報を漏洩するために悪用されている。
攻撃と防御の空間を体系的に把握し、既存の防御がすべてのキャッシュタイミング攻撃に対処していないことを示す。
我々はRandom and Safe(RaS)キャッシュアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 02:15:38 GMT)
On diffusion-based generative models and their error bounds: The log-concave case with full convergence estimates [5.1] 我々は,強い対数空間データ分布を仮定して,拡散に基づく生成モデルの収束挙動を理論的に保証する。
我々は、モチベーションの例を通して、未知の平均を持つガウス分布からサンプリングし、我々のアプローチの強力さを実証する。
この手法はサンプリングアルゴリズムにおいて最もよく知られた収束率をもたらす。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:53:29 GMT)
A Survey of Decomposition-Based Evolutionary Multi-Objective Optimization: Part I-Past and Future [5.1] 進化的多目的最適化の文脈では分解は適切に研究されなかった。
MoEA/Dは、この領域の最新の開発をレビューするために、分解ベースのEMOの代表である。
第1部では,MOEA/Dの発展を起源から現在までの包括的調査を行う。
最終段階では、今後の発展に向けての新たな方向性に光を当てています。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:34:46 GMT)
Differentially Private Kernel Inducing Points using features from ScatterNets (DP-KIP-ScatterNet) for Privacy Preserving Data Distillation [5.0] プライバシ保存データ蒸留のための差分プライベートカーネル誘導点(DP-KIP)を導入する。
無限大の畳み込みニューラルタンジェントカーネル(conv-NTK)を用いたKIPは、完全に接続されたNTKを用いたKIPよりも優れた性能を示す。
本稿では、conv-NTKではなく、Scattering Network(ScatterNet)のウェーブレット機能を利用するDP-KIP-ScatterNetを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:13:07 GMT)
Adapting to time: why nature evolved a diverse set of neurons [5.0] よりリッチなポテンシャル力学を持つネットワークは、時間的構造を持つタスクをより簡単かつ堅牢に学習できることを示す。
また,様々なパラメータ間の強い相互作用と,入力や重みのノイズに対処する際の時間的パラメータの適応の利点を示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:38:38 GMT)
MARIO Eval: Evaluate Your Math LLM with your Math LLM--A mathematical dataset evaluation toolkit [5.0] 大規模言語モデル (LLM) は数学的問題の解法を含む様々な推論タスクにおいて研究されている。
我々は,ピソン型計算機代数システム(CAS)をその数値精度に活用するだけでなく,オプションのLCMも組み込んだ総合的な数学的評価ツールキットを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:03:44 GMT)
Soft-constrained Schrodinger Bridge: a Stochastic Control Approach [4.9] シュル「オーディンガー橋」は、最適に制御された拡散過程を見つけることを目標とする連続時間制御問題と見なすことができる。
本稿では,両分布間のKulback-Leiblerの相違を罰し,端末分布を目標と異なるものにすることで,この問題を一般化することを提案する。
1つの応用は、堅牢な生成拡散モデルの開発である。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:50:48 GMT)
Heterogeneous Face Recognition Using Domain Invariant Units [4.9] 教師ネットワークとして事前訓練された顔認識モデルを用いてドメイン不変ネットワーク層(DIU)を学習する。
提案したDIUは、対照的な蒸留フレームワークを用いて、限られた量のペアトレーニングデータでも効果的に訓練することができる。
提案手法は、事前訓練されたモデルを強化する可能性があり、より広い範囲のデータに適応できる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:58:37 GMT)
From Modalities to Styles: Rethinking the Domain Gap in Heterogeneous Face Recognition [4.9] 本研究では,既存の顔認識ネットワークにシームレスに適合する条件適応型インスタンス変調(CAIM)モジュールを提案する。
CAIMブロックは中間特徴写像を変調し、ソースモダリティのスタイルに効率よく適応し、ドメインギャップをブリッジする。
我々は,提案手法を様々な挑戦的HFRベンチマークで広く評価し,最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:00:51 GMT)
U Can't Gen This? A Survey of Intellectual Property Protection Methods for Data in Generative AI [4.6] トレーニングデータの知的財産権に関する懸念について検討する。
我々は、潜在的なIP違反につながる誤用を可能にする生成モデルの性質に焦点を当てる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:09:21 GMT)
QuantumAnnealing: A Julia Package for Simulating Dynamics of Transverse Field Ising Models [4.6] QuantumAnnealing.jlは、アナログ量子コンピュータを古典的なハードウェア上でシミュレーションするためのツールキットを提供する。
このパッケージには、Transverse Field Ising Modelの時間進化をシミュレーションする機能が含まれている。
興味深い振る舞いを示すと期待されるモデルの高速なプロトタイピング、量子デバイスの性能検証、量子デバイスが期待する振る舞いと小さなシステムに対する古典的なアプローチとの簡単に比較できる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 18:03:19 GMT)
Decoding the MITRE Engenuity ATT&CK Enterprise Evaluation: An Analysis of EDR Performance in Real-World Environments [4.6] エンドポイント検出と応答(EDR)システムの重要性が高まる中、多くのサイバーセキュリティプロバイダが独自のソリューションを開発してきた。
ユーザがこれらの検出エンジンの能力を評価して、どの製品を選ぶべきかを判断することが重要です。
本稿では,MITREの評価結果を徹底的に分析し,実世界のシステムに関するさらなる知見を得る。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:42:27 GMT)
CloudFort: Enhancing Robustness of 3D Point Cloud Classification Against Backdoor Attacks via Spatial Partitioning and Ensemble Prediction [4.5] バックドア攻撃に対する3Dポイントクラウド分類器の堅牢性を高めるために設計された,新しい防御機構であるCloudFortを提案する。
以上の結果から,CloudFortは,良質なサンプルの精度を損なうことなく,3Dポイントクラウド分類モデルのセキュリティを著しく向上させることがわかった。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:55:50 GMT)
A Survey of Decomposition-Based Evolutionary Multi-Objective Optimization: Part II -- A Data Science Perspective [4.3] 5,400以上の論文,10,000人の著者,400の会場,1600のMOEA/D研究機関をカプセル化したナレッジグラフを構築します。
また、MOEA/Dの協調と引用ネットワークを探求し、文学の成長に隠れたパターンを明らかにする。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:38:58 GMT)
Autoencoder-assisted Feature Ensemble Net for Incipient Faults [3.6] Autoencoder-assisted Feature Ensemble Net (AE-FENet)は、教師なしのオートエンコーダを使用して機能変換を行うディープ機能アンサンブルフレームワークである。
AE-FENetはテネシー・イーストマン・プロセス(TEP)における断層3, 9, 15の最先端平均精度を96%以上達成している
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:34:28 GMT)
Dynamic Cross Attention for Audio-Visual Person Verification [3.6] 本研究では,動的クロスアテンション(DCA)モデルを提案する。
特に、コンディショナルゲーティング層は、クロスアテンション機構の寄与を評価するように設計されている。
Voxceleb1データセットで大規模な実験を行い、提案モデルの堅牢性を実証した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:04:55 GMT)
GeoAI Reproducibility and Replicability: a computational and spatial perspective [3.5] 本稿では,このトピックを計算的,空間的両面から詳細に分析することを目的とする。
まず,GeoAI研究を再現するための主要な目標,すなわち検証(再現性),類似あるいは新しい問題の解法(再現性)の学習と適応,研究成果の一般化可能性(再現性)について検討する。
次に、GeoAI研究におけるR&Rの欠如の原因となる要因について、(1)トレーニングデータの選択と使用、(2)GeoAIモデル設計、トレーニング、デプロイメント、推論プロセスに存在する不確実性について論じる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:53:08 GMT)
On Support Relations Inference and Scene Hierarchy Graph Construction from Point Cloud in Clustered Environments [3.5] 3Dシーンでは、リッチな空間幾何学的・トポロジ的情報はしばしばRGBベースのシーン理解アプローチによって無視される。
本研究では,物体間の関係を推定する場面理解のためのボトムアップ手法を開発した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 02:42:32 GMT)
Structure-preserving neural networks for the regularzied entropy-based closure of the Boltzmann moment system [3.4] 本研究では,エントロピー閉包法に対するニューラルネットワークに基づく近似を導出し,検討する。
主な考え方は、正規化エントロピー閉包の構造保存ニューラルネットワーク近似を、元のエントロピー閉包の2段階近似として解釈することである。
本手法のメモリフットプリントは,競合時間とシミュレーション精度で従来の手法よりもはるかに少ないことを示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:16:06 GMT)
Discussing the Spectrum of Physics-Enhanced Machine Learning; a Survey on Structural Mechanics Applications [3.4] 物理学と機械学習の交わりは、物理学の強化された機械学習(PEML)パラダイムを生み出した。
PEMLは、データまたは物理のみの手法の能力を向上し、個々の欠点を減らすことを目的としている。
本論文は, 科学・工学研究の限界を推し進める上で, PEMLの重要性を浮き彫りにするものである。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:42:02 GMT)
Exploring Kinetic Curves Features for the Classification of Benign and Malignant Breast Lesions in DCE-MRI [3.3] 胸部良性病変と悪性病変の分類精度を高めるため, 運動曲線および放射線学的特徴の動的特性を活用することを提案する。
提案手法は,200個のDCE-MRIスキャンと298個の乳腺腫瘍を含む社内データセットを用いて評価した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:08:13 GMT)
A Unified Framework for Microscopy Defocus Deblur with Multi-Pyramid Transformer and Contrastive Learning [3.3] マルチピラミド変圧器 (MPT) と拡張周波数コントラスト正規化 (EFCR) は、顕微鏡欠陥の2つの課題に対処するために提案されている。
MPTは、各ネットワークステージに明示的なピラミッド構造を採用し、クロススケールウィンドウアテンションを統合している。
EFCRは、異なる周波数帯域からの潜伏遅延信号を探索することで、データ不足の問題に対処する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:15:46 GMT)
Multilevel Geometric Optimization for Regularised Constrained Linear Inverse Problems [3.3] 我々は、様々な離散化レベルを持つモデルの階層を考察する。フィナーモデルは正確だが計算に費用がかかるが、粗いモデルは正確ではなく計算に安価である。
細かなレベルで作業する場合、マルチレベル最適化は、細かなレベルで更新を高速化する粗いモデルに基づいて探索方向を計算する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:11:18 GMT)
Shifting Focus with HCEye: Exploring the Dynamics of Visual Highlighting and Cognitive Load on User Attention and Saliency Prediction [3.3] 本稿では,視覚強調(永続的・動的)と両タスクによる認知負荷が視線行動に及ぼす影響について検討する。
認知負荷の異なる場合、最先端のサリエンシモデルにより、その性能が向上することを示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:45:30 GMT)
Effective dynamics of quantum fluctuations in field theory: with applications to cosmology [3.2] フィールド理論における量子ゆらぎを記述するための新しい枠組みを開発する。
我々の発見は、初期の宇宙の量子ゆらぎと、大規模CMB異常に対する潜在的な説明に新たな洞察を与える。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:35:38 GMT)
Robustness and Visual Explanation for Black Box Image, Video, and ECG Signal Classification with Reinforcement Learning [3.1] 本稿では,異なるモデルタイプに対する敵対的攻撃を実現するために最適化された汎用強化学習フレームワークを提案する。
このフレームワークは、センシティブな領域を特定し、最小限の歪みで誤分類を誘発することに焦点を当てている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:49:36 GMT)
Topological States Decorated by Twig Boundary in Plasma Photonic Crystals [3.1] グラフェン様構造における小枝の縁状態は、ジグザグ、ひげを生やし、アームチェアと相補する4番目の状態と見なされている。
我々は, 量子ホール相, 量子スピンホール相, 絶縁相など, システムの異なる位相に存在することを示す。
以上の結果から, トウィッグエッジとインタフェース工学は, より柔軟な電磁波操作の新たな機会をもたらす可能性が示唆された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 02:18:29 GMT)
Causality Extraction from Nuclear Licensee Event Reports Using a Hybrid Framework [3.1] 本稿では,核ライセンスイベントレポートからの因果検出と抽出のためのハイブリッドフレームワークを提案する。
因果関係分析のための20,129のテキストサンプルを用いたLERコーパスをコンパイルし,因果関係検出のための深層学習に基づくアプローチを構築した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:25:20 GMT)
A Design Framework for the Simulation of Distributed Quantum Computing [3.0] 大規模量子コンピュータの需要増加は分散量子コンピューティング(DQC)の研究を推し進めている
最近の実験的試みは、そのような設計のためのビルディングブロックのいくつかを実証している。
DQCシステムは、量子ネットワークのインフラによって接続された量子処理ユニットのクラスタである。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:09:21 GMT)
Relational superposition measurements with a material quantum ruler [2.9] 位置測定装置として機能する拡張材料量子システムを記述するためのモデルを提案する。
我々は「位置の重畳」に対応する量子計測手順を定義することができることを示す。
なぜなら、唯一有意な変数は、支配者とシステムの間の相対的な位置であるからである。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 02:25:28 GMT)
Rethinking Legal Compliance Automation: Opportunities with Large Language Models [2.9] 我々は、(テキスト)法的アーティファクトの試験は、まず文よりも広い文脈で行うべきであると論じる。
これらの制約に対処するために,コンプライアンス分析手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:10:27 GMT)
FGeo-HyperGNet: Geometric Problem Solving Integrating Formal Symbolic System and Hypergraph Neural Network [2.9] 我々は,人間のような幾何学的推論を自動的に行うニューラルシンボリックシステムを構築した。
フォーマルなgeo7kデータセットでは、ステップワイズ精度87.65%、全体的な精度85.53%を達成しました。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:31:15 GMT)
Walia-LLM: Enhancing Amharic-LLaMA by Integrating Task-Specific and Generative Datasets [2.8] タスク固有および生成データセットを統合することでLLaMA-2-Amharicモデルの強化に注力する。
我々はAmharic命令の微調整データセットとLLaMA-2-Amharicモデルをコンパイルする。
微調整されたモデルは、異なるNLPタスクで有望な結果を示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:29:23 GMT)
Rapid Deployment of DNNs for Edge Computing via Structured Pruning at Initialization [2.7] エッジ機械学習(ML)は、デバイス上のデータのローカライズされた処理を可能にする。
ディープニューラルネットワーク(DNN)は、実際のコンピューティング、メモリ、エネルギー要件のため、デバイス上で簡単に動作できない。
エッジ配置に適したプルーニングモデルを生成するシステムであるReconveneを開発した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:57:54 GMT)
Nonadiabatic evolution and thermodynamics for a boundary-driven system with a weak intrasubsystem interaction [2.7] 外部駆動システムに対する時間依存マスター方程式を導出する。
局所的および非断熱的マスター方程式によって生じる熱力学的不整合の根底にある根本的な理由を考察する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:55:43 GMT)
From LLM to NMT: Advancing Low-Resource Machine Translation with Claude [2.7] 2024年3月にArthropicがリリースした大規模言語モデル(LLM)であるClaude 3 Opusは、他のLLMよりも強力な機械翻訳能力を示している。
我々は、低リソースの機械翻訳におけるClaudeの有効性を裏付ける新しいベンチマークをキュレートする。
クロードを用いて合成データを生成することにより、ヨルバ語訳における知識蒸留が最先端の最先端技術であることを示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 01:22:23 GMT)
A Unified Framework for Model Editing [2.6] ROME と MEMIT という2つの主要な "位置と編集" モデル編集テクニックを,単一の概念的な傘の下で実現する統一フレームワークを紹介します。
本稿では,新しいバッチメモリ編集アルゴリズムであるTransformers や EMMET に対して,品質制約付きマスモデル編集アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:56:13 GMT)
PGNAA Spectral Classification of Aluminium and Copper Alloys with Machine Learning [2.6] この研究では、臭化セリウム(CeBr$_3$)と高純度ゲルマニウムHPGeの2つの検出器のデータを比較した。
また、CeBr$_3$は短い測定時間で優れ、HPGeは長い測定時間で優れた性能を発揮した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:52:23 GMT)
Jack of All Trades, Master of Some, a Multi-Purpose Transformer Agent [2.4] Jack of All Trades (JAT) は、シーケンシャルな意思決定タスクとマルチモーダルなデータタイプを扱うために最適化された、トランスフォーマーベースのモデルである。
JATは、そのタイプの最初のオープンソースモデルであり、先駆的な汎用データセットを含む。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:47:31 GMT)
Africa-Centric Self-Supervised Pre-Training for Multilingual Speech Representation in a Sub-Saharan Context [2.3] アフリカ語のみに特化して訓練された最初の自己教師型多言語音声モデルを提案する。
このモデルは、サハラ以南のアフリカで話されている21の言語と方言で、6万時間近い未ラベルの音声セグメントから学習された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:18:44 GMT)
Asymptotic Validity and Finite-Sample Properties of Approximate Randomization Tests [2.3] 我々の理論的な重要な貢献は、ノイズレスデータを用いた近似ランダム化テストのサイズと元のランダム化テストのサイズとの差に非漸近的境界を持つことである。
線形回帰における有意性のテストを含むいくつかの例を通して、我々の理論を解説する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:33:54 GMT)
Explicit Lipschitz Value Estimation Enhances Policy Robustness Against Perturbation [2.2] ロボット制御タスクでは、シミュレーションにおいて強化学習(RL)によって訓練されたポリシーは、物理ハードウェアにデプロイされた場合、しばしばパフォーマンス低下を経験する。
リプシッツ正則化は、近似値関数勾配の条件付けに役立ち、訓練後のロバスト性の向上につながる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 05:01:29 GMT)
MixLoRA: Enhancing Large Language Models Fine-Tuning with LoRA based Mixture of Experts [2.2] MixLoRAは、リソース効率の良いスパースMoEモデルの構築を目的とした革新的なアプローチである。
実験では、MixLoRAは、シングルタスクとマルチタスクの学習シナリオの両方で、すべての評価指標の可読性を達成する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 02:15:52 GMT)
Difficulties in Dynamic Analysis of Drone Firmware and Its Solutions [2.2] ドローン部門は商業目的と軍事目的の両方で大きな注目を集めている。
IoTデバイスに対する脅威を軽減するセキュリティ研究のほとんどは、主にネットワーク、ファームウェア、モバイルアプリケーションに焦点を当てている。
本稿では,ドローンファームウェアを動的に解析することの課題について論じ,潜在的な解決策を提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:34:42 GMT)
Integrating Chemistry Knowledge in Large Language Models via Prompt Engineering [2.1] 本稿では,科学領域における大規模言語モデル(LLM)の性能向上を目的として,ドメイン固有の知識の統合について検討する。
ベンチマークデータセットは、小さな分子の複雑な物理化学的性質、薬理学の薬物性、酵素や結晶材料の機能的特性に適合する。
提案したドメイン知識組み込みのプロンプトエンジニアリング手法は,従来のプロンプトエンジニアリング手法よりも優れた性能を発揮する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:55:44 GMT)
Adaptive Bayesian Optimization for High-Precision Motion Systems [2.1] 低レベル制御パラメータをオンラインチューニングすることで、適応制御のためのリアルタイム純粋データ駆動モデルフリーアプローチを提案する。
我々は安全かつサンプル効率のよいベイズ最適化アルゴリズムであるGoOSEをベースとした。
半導体産業に応用した実精度運動システムにおけるアルゴリズムの性能評価を行った。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 21:58:23 GMT)
Data-Driven Performance Guarantees for Classical and Learned Optimizers [2.0] 連続最適化アルゴリズムの性能を解析するためのデータ駆動型手法を提案する。
パラメトリック最適化問題のファミリーを解くために古典と学習を研究した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 02:06:35 GMT)
Integrating Disambiguation and User Preferences into Large Language Models for Robot Motion Planning [2.0] フレームワークは、時間要素を含む人間のナビゲーションコマンドを解釈し、自然言語命令をロボットの動き計画に変換する。
本稿では,自然言語命令のあいまいさを解消し,ユーザの好みを捉える手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 19:38:37 GMT)
On-the-Fly Point Annotation for Fast Medical Video Labeling [1.9] 医学研究において、ディープラーニングモデルは高品質な注釈付きデータに依存している。
2つのコーナーを調整する必要があるため、プロセスは本質的にフレーム単位で行われる。
そこで本研究では,ライブビデオアノテーションのオンザフライ方式を提案し,アノテーションの効率を向上させる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:59:43 GMT)
Hierarchical localization with panoramic views and triplet loss functions [1.9] 本研究の目的は,Triplet Convolutional Neural Networks を用いた移動ロボットのローカライゼーション問題に対処することである。
我々はパノラマ形式に変換された動的条件下で捉えた屋内環境からの全方位画像を用いた。
実験セクションでは、三重項ニューラルネットワークが屋内環境における移動ロボットのローカライゼーションに対処するための効率的で堅牢なツールであることを証明している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 12:07:10 GMT)
DPTraj-PM: Differentially Private Trajectory Synthesis Using Prefix Tree and Markov Process [1.8] DPTraj-PMは,差分プライバシーの枠組みの下でトラジェクトリデータセットを合成する手法である。
DPTraj-PMは、生の軌跡を隣接する細胞に識別し、プレフィックスツリー構造とm次マルコフ過程を組み合わせてモデル化する。
DPTraj-PMが作成した出力トレースは、個人の移動行動のパターンと変動性を保持するだけでなく、個人のプライバシーも保護している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:52:11 GMT)
MambaUIE&SR: Unraveling the Ocean's Secrets with Only 2.8 FLOPs [1.8] 水中画像強調(UIE)技術は,光吸収・散乱による水中画像劣化問題に対処することを目的としている。
近年、畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースの手法が広く研究されている。
MambaUIEは、グローバルおよびローカル情報を効率的に合成することができ、非常に少数のパラメータを高い精度で保持する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 05:12:11 GMT)
Investigating child sexual abuse material availability, searches, and users on the anonymous Tor network for a public health intervention strategy [1.7] 未成年児童性的虐待材料(CSAM)は、26の最も使われているTor検索エンジンのうち21つを使って容易に入手できる。
CSAMを年齢別に検索すると、40.5%が11歳以下を検索している。
CSAM利用者の65.3%が子どものころ初めてこの素材を見たが、回答者の半数が誤ってその素材を見た。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:58:02 GMT)
Designing forecasting software for forecast users: Empowering non-experts to create and understand their own forecasts [1.7] 本研究は,非エキスパートユーザを支援する予測ソフトウェアの設計方法に焦点をあてる。
本研究では,ユーザが最先端の予測手法をどのように活用するか,ドメイン知識を組み込む方法,生成した予測に対する理解と信頼を構築する方法について検討する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:53:08 GMT)
Regional Style and Color Transfer [1.6] 本稿では,地域スタイル移行の分野への新たな貢献について述べる。
既存の手法は、画像全体にわたって均一にスタイルを適用するという欠点に悩まされることが多い。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 05:07:02 GMT)
Fast and Robust Normal Estimation for Sparse LiDAR Scans [1.5] メカニカルLiDARは、厳格に装着されたレーザーの集合を回転させる。
このようなレーザーの1つの発射は、各点の近傍が知られている点の配列を生成する。
この知識を使ってこれらの点を隣人と接続し、それらの点を接続する線の角度を使ってラベル付けします。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:29:28 GMT)
Swap It Like Its Hot: Segmentation-based spoof attacks on eye-tracking images [1.5] 生体認証は、物理的またはデジタル操作によって偽造される可能性がある。
Liveness Detectionは、視線データをリアルまたはフェイクと分類し、物理的な表示攻撃を検出するのに十分である。
我々はアイリススワップを、視線に基づく生活度検出の新しい攻撃として提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 01:59:48 GMT)
A Cross-Platform Execution Engine for the Quantum Intermediate Representation [1.4] 我々は、複数のハードウェアプラットフォームでQIRを解析、解釈、実行するためのQIR実行エンジン(QIR-EE)を記述し、実演する。
我々は、XACC量子ハードウェア加速器ライブラリを用いて、異なる商用量子プラットフォームと数値シミュレータ上で量子プログラムをディスパッチする実装を実証する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:59:41 GMT)
Efficient and practical Hamiltonian simulation from time-dependent product formulas [1.3] 本稿では,製品公式を用いた量子システムの時間進化手法を提案する。
我々のアルゴリズムは、進化演算子を量子コンピュータ上で直接実装可能な単純なユニタリの積に分解する。
理論的スケーリングは最先端のアルゴリズムと比較すると最適ではないが,提案するアルゴリズムの性能は実際は極めて競争力が高い。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:41:27 GMT)
A mean curvature flow arising in adversarial training [1.2] 我々は、二項分類のための対角訓練を、決定境界に対する幾何学的進化方程式に結びつける。
このスキームは単調かつ一貫したものであり、敵の予算が消滅し、周辺がローカライズされると証明する。
このことは、対人訓練の有効性は、決定境界の長さを局所的に最小化することによる可能性があることを強調している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:58:36 GMT)
Distributed Learning for Wi-Fi AP Load Prediction [1.2] 分散学習の2つの基礎、すなわちフェデレートラーニング(FL)と知識蒸留(KD)の適用について検討する。
分散学習により、予測精度を最大93%向上し、通信オーバーヘッドとエネルギーコストを80%削減できることを示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:37:35 GMT)
Decoupled Weight Decay for Any $p$ Norm [1.2] トレーニング中の正規化に$L_p$のブリッジをベースとした,スパーシフィケーションに対する単純かつ効果的なアプローチを検討する。
我々は、標準の$L$重み崩壊を任意の$p$ノルムに一般化する新しい重み崩壊スキームを導入する。
標準的な$L$正規化に匹敵する性能を維持しながら、非常に疎結合なネットワークにつながることを実証的に実証した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:31:04 GMT)
Nonreciprocal PT-symmetric phase transition in a non-Hermitian chiral quantum optical system [1.1] 非エルミート量子電磁力学系における非相互パリティ-時対称相転移を示す。
結果は非相互および非エルミート量子物理学の基本的な洞察を深めることができる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 02:19:12 GMT)
Solutions to Elliptic and Parabolic Problems via Finite Difference Based Unsupervised Small Linear Convolutional Neural Networks [1.1] 線形畳み込みニューラルネットワークを用いてPDEの有限差分解を直接推定するために、トレーニングデータを必要としない完全に教師なしのアプローチを提案する。
提案手法は、類似の有限差分に基づくアプローチよりもパラメータを著しく少なくし、また、いくつかの選択された楕円型および放物型問題に対する真の解に匹敵する精度を示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:43:55 GMT)
Teaching Scrum with a focus on compliance assessment [1.1] 本研究は,コンピュータ工学におけるM.Sc. Degreeの中で,ソフトウェア工学(SE)コースの5つのエディションの経験を報告する。
コースの主な教育目的は、学生にスクラムでソフトウェア開発プロジェクトを管理するスキルを提供することです。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:44:44 GMT)
Follow-Me AI: Energy-Efficient User Interaction with Smart Environments [1.1] この記事では、スマート環境とのユーザインタラクションを強化するために設計されたコンセプトであるFollow-Me AIを紹介します。
Follow-Me AIは、ユーザの同意に基づいてデータ管理を交渉し、環境制御を調整し、ユーザの好みに応じて、環境内で利用可能なリソースを計算します。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 19:20:33 GMT)
Designing open quantum systems with known steady states: Davies generators and beyond [1.0] 対象定常状態(混合状態)を持つ非平衡量子力学の一般モデルを構築するための体系的枠組みを提供する。
我々は、安定的ハミルトン主義者のギブス状態に注目し、散逸過程とユニタリ過程の速度を制限することによって、局所リンドブラディアンと相容れないものを特定する。
例えば、測定可能な2点関数は、横磁場の臨界比と測定とフィードバックの速度で、距離でクリティカルな(負の)スケーリングを示す「測定誘起位相遷移」を提供する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 19:21:34 GMT)
Prediction of flow and elastic stresses in a viscoelastic turbulent channel flow using convolutional neural networks [0.9] 粘弾性乱流における壁面近傍の瞬時流れの予測にはニューラルネットワークモデルが用いられている。
壁面上の数値シミュレーションデータを用いて3つの壁面正規位置における瞬時速度変動と高分子ストレス変動を予測する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 12:19:00 GMT)
Lessons Learned in Performing a Trustworthy AI and Fundamental Rights Assessment [0.8] 試験飛行は2022年5月から2023年1月まで行われた。
Fryslan県からのディープラーニングアルゴリズムの実践的応用が評価された。
AIは、自然保護区を監視するために衛星画像を用いて草地をマッピングする。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:19:09 GMT)
DynaMMo: Dynamic Model Merging for Efficient Class Incremental Learning for Medical Images [0.8] 継続学習は、学習した情報を保持しながら新しいデータから知識を得る能力であり、機械学習における根本的な課題である。
本研究では,モデル学習の異なる段階で複数のネットワークをマージし,より優れた計算効率を実現するDynaMMOを提案する。
我々はDynaMMoを3つの公開データセット上で評価し、既存のアプローチと比較してその効果を実証した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:37:35 GMT)
Using explainable AI to investigate electrocardiogram changes during healthy aging -- from expert features to raw signals [0.8] 我々は、さまざまな年齢の健康な個人の頑健なデータセットからECGデータを分析するために、ディープラーニングモデルとツリーベースモデルを用いています。
木系分類器を用いて解析したところ, 年齢による呼吸速度の低下がみられた。
これらの発見は、年齢に関するECGの変化に新たな光を当て、従来の機能ベースのアプローチを超越した洞察を与えました。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:04:18 GMT)
Experimental Validation of Ultrasound Beamforming with End-to-End Deep Learning for Single Plane Wave Imaging [0.8] 超高速超音波イメージングは、多くの集束波ではなく、異なるビームステアリング角度で複数の平面波の1つまたは1つの組み合わせで媒体を照射する。
深層学習アプローチは、特に単一平面波のイメージングにおいて、この欠点を軽減するために提案されている。
本稿では,従来の画像形成手法を取り入れたデータ・ツー・イメージ・ネットワークを,ネットワークアーキテクチャにおける識別可能なレイヤとして検討する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 13:58:36 GMT)
The Great Ban: Efficacy and Unintended Consequences of a Massive Deplatforming Operation on Reddit [0.7] Reddit上で2000近いコミュニティに影響を与えた大規模なデプラットフォーム運用であるThe Great Banの有効性を評価した。
14ヶ月の間に17万のユーザーが投稿した16万のコメントを分析して、望ましい結果とそうでない結果の両方について、微妙な結果を提供する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:50:08 GMT)
Calc-CMU at SemEval-2024 Task 7: Pre-Calc -- Learning to Use the Calculator Improves Numeracy in Language Models [0.7] 本稿では,エンコーダのみのアーキテクチャとエンコーダデコーダアーキテクチャの両方で計算機を利用するための,簡単な事前学習目的であるPre-Calcを提案する。
我々は,MAWPS,SVAMP,AsDiv-Aデータセットを用いて,識別計算機用BERTとRoBERTaを事前訓練し,生成計算機用Flan-T5を作成した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:07:25 GMT)
Exploring Feedback Generation in Automated Skeletal Movement Assessment: A Comprehensive Overview [0.7] 生成可能なフィードバックの種類を説明し、自動フィードバック生成のための既存のソリューションをレビューし、今後の研究方向性について議論する。
我々の知る限り、骨格運動評価におけるフィードバック生成の総合的なレビューはこれが初めてである。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:52:32 GMT)
A Comparative Study on Enhancing Prediction in Social Network Advertisement through Data Augmentation [0.6] 本研究では,ソーシャルネットワーク広告データの生成的拡張フレームワークを提示し,検討する。
データ拡張のための3つの生成モデル - GAN(Generative Adversarial Networks)、VAE(variantal Autoencoders)、Gaussian Mixture Models(GMM) - を探索する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 01:16:11 GMT)
Machine Learning Techniques for MRI Data Processing at Expanding Scale [0.5] 世界中のイメージングサイトは、より多用途で手頃な価格のテクノロジーで、より多くの医療スキャンデータを生成する。
これらの大規模なデータセットは人間の健康に関する情報をエンコードし、機械学習のトレーニングと分析にかなりの可能性を秘めている。
本章は、現在進行中の大規模研究と、それら間の分散シフトの課題について考察する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:38:41 GMT)
What do Transformers Know about Government? [0.5] 特に,BERTが文中の構成要素間の政府関係をエンコードする方法について検討する。
我々の実験は、政府に関する情報がトランスフォーマーのすべての層にエンコードされていることを示しているが、主にモデルの初期段階にある。
私たちは、実験で言語における数千のレムマに関する政府関係を定義するデータセットであるGovernment Bankをリリースします。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:15:50 GMT)
Expert Router: Orchestrating Efficient Language Model Inference through Prompt Classification [0.5] 大規模言語モデル(LLM)は、科学や産業の領域で広く採用されている。
本稿では,複数のエキスパートモデルを効率的に編成するシステムであるExpert Routerを紹介する。
Expert Routerは、入ってくるリクエストを分散する中央ルーティングゲートウェイを備えた並列推論システムである。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:33:42 GMT)
A Novel Approach to Chest X-ray Lung Segmentation Using U-net and Modified Convolutional Block Attention Module [0.5] 本稿では,胸部X線像におけるU-netと注意機構を統合した肺分画の新しいアプローチを提案する。
提案手法は,CBAM(Convolutional Block Attention Module)を組み込むことで,U-netアーキテクチャを向上する。
CBAMとU-netアーキテクチャの採用は、医用画像の分野で大きな進歩を見せている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:33:06 GMT)
Revolutionizing student course selection: Exploring the application prospects and challenges of blockchain token voting technology [0.4] 本稿では,学生コース選択システムにおけるブロックチェーントークン投票技術の利用について検討する。
コンセンサスメカニズムやスマートコントラクトなど、ブロックチェーン技術のメリットについては、詳しく議論されている。
この技術は、透明性、公正性、データセキュリティ、プライバシ保護、システム効率の改善といった利点を提供する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:06:28 GMT)
Extract Universal Corner Entanglement Entropy in a Single Quantum Monte Carlo Simulation [0.4] 量子臨界点(QCP)の普遍的特性を明らかにするために、エンタングルメントエントロピー(EE)における下降角対数補正が不可欠である
計算コストを抑えて,EEにおけるコーナーコントリビューションを直接測定する手法を開発した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:52:56 GMT)
Challenges in automatic and selective plant-clearing [0.3] 持続可能な森林環境下では, 自動的, 選択的プラントクリーニングの課題に対処する。
このような自律システムは、安価でメンテナンスが容易でありながら、気象条件、植物の多様性、地形、雑草に対する高い堅牢性を必要とする。
特に、スペクトル画像の堅牢性の欠如について論じ、参照データベースのサイズの影響を調査し、制御されていない環境で動作しているAIシステム特有の問題について論じる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:01:14 GMT)
Chain of trust: Unraveling the references among Common Criteria certified products [0.3] 本研究では,Common Criteria認定商品の参照グラフ構築のための新しい手法を提案する。
結果の参照グラフの助けを借りて、この作業では、エコシステム全体の少なくとも10%が依存している認証済みのコンポーネントをわずか10個特定する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:59:35 GMT)
Paved2Paradise: Cost-Effective and Scalable LiDAR Simulation by Factoring the Real World [0.3] Paved2Paradiseは、スクラッチからライダーデータセットを生成するためのシンプルで費用対効果の高いアプローチである。
Paved2Paradise合成データのみを訓練したモデルが果樹園におけるヒトの検出に極めて有効であることを示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:38:05 GMT)
Towards Multi-Morphology Controllers with Diversity and Knowledge Distillation [0.2] 本稿では, シングルタスク/シングルモーフィオロジーの教師コントローラを1つのマルチモーフィオロジーのコントローラに蒸留するパイプラインを提案する。
蒸留された制御装置は、教師/形態学の数とうまくスケールし、創発的な特性を示す。
ゼロショットで見えなくなる形態を一般化し、形態的摂動に対する頑健さと即時損傷回復を提供する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 23:40:03 GMT)
Tree of Reviews: A Tree-based Dynamic Iterative Retrieval Framework for Multi-hop Question Answering [0.2] マルチホップ質問応答のための動的検索フレームワークであるTree of Reviews (ToR)を提案する。
ToRは検索および応答生成の両方において最先端の性能を達成する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:25:05 GMT)
Security flaws from time-varying active encoding in high-speed measurement-device-independent quantum key distribution [0.2] 量子鍵分布(QKD)は、秘密鍵を原則として情報理論セキュリティで送信することができる。
実用機器における帯域制限は、高速(GHz)QKDシステムのセキュリティを脅かす。
能動符号化を用いた場合のサイドチャネルの提案と特徴付けを行う。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:31:40 GMT)
SwinFuSR: an image fusion-inspired model for RGB-guided thermal image super-resolution [0.2] 超高分解能(SR)法は、高周波の詳細が欠如しているため、しばしば熱画像に苦しむ。
SwinFusionにインスパイアされたSwinFuSRは、Swin変換器をベースとしたガイド付きSRアーキテクチャである。
提案手法は,Pak Signal to Noise Ratio (PSNR) とStructure SIMilarity (SSIM) の両面において,少ないパラメータと性能を有する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 19:01:18 GMT)
Swap distance minimization beyond entropy minimization in word order variation [0.1] エントロピーとスワップ距離は、異なる言語構造において著しく小さい。
転がり実験に関してエントロピーの最小化とスワップ距離の最小化の強い証拠を見出した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:01:09 GMT)
MMT: Mutation Testing of Java Bytecode with Model Transformation -- An Illustrative Demonstration [0.1] 突然変異テストは、テストスイートの堅牢性をチェックするアプローチである。
本稿では,Javaバイトコードの変異をモデル変換によって柔軟に定義できるモデル駆動型アプローチを提案する。
MMTと呼ばれるツールは、オブジェクト指向構造を変更するための高度な突然変異演算子によって拡張されている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:33:21 GMT)
Optimally scrambling chiral spin-chain with effective black hole geometry [0.0] ブラックホールの時空幾何学におけるディラックフェルミオンの挙動を,平均場理論が効果的に捉えたカイラルスピン鎖について検討する。
ブラックホールの内部を記述した鎖の領域では、強い相関関係が強くなり、多体カオス力学がもたらされる。
我々の発見は、ブラックホールの幾何学と量子カオスの相互作用の深い理解に寄与し、量子重力の基本的な側面に関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 18:00:00 GMT)
Evaluation Framework for Quantum Security Risk Assessment: A Comprehensive Study for Quantum-Safe Migration [0.0] 大規模量子コンピューティングの台頭は、従来の暗号セキュリティ対策に重大な脅威をもたらす。
量子攻撃は、現在の非対称暗号アルゴリズムを損なう。
本研究では、量子セーフ暗号状態への移行の課題について検討する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 22:13:29 GMT)
What AIs are not Learning (and Why): Bio-Inspired Foundation Models for Robots [0.0] 便利なロボットを作るのは難しいし、堅牢で汎用的な自律ロボットを作るのが難しい。
現在のロボットは、手動プログラミング、数学的モデル、計画フレームワーク、強化学習を使って構築されている。
本稿では,サービスロボットが知るべきことに焦点を当てる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:21:50 GMT)
Unraveling the Autism spectrum heterogeneity: Insights from ABIDE I Database using data/model-driven permutation testing approaches [0.0] 自閉症スペクトラム条件(Autism Spectrum Condition、ASC)は、コミュニケーション、社会的相互作用、制限的または反復的な行動の障害を特徴とする神経発達状態である。
本研究では,Autism Brain Imaging Data Exchange I (ABIDE I)データベースからの構造的磁気共鳴画像(sMRI)データに焦点をあてる。
その結果、特定の中心内の限られたサンプルサイズ、ノイズ効果、自閉症のような異種状態における多中心性の問題などの要因により、どの脳領域にも統計的に有意な差がないことが明らかとなった。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 13:21:57 GMT)
Understanding the role of FFNs in driving multilingual behaviour in LLMs [0.0] 本稿では,大規模言語モデル群における多言語機能の詳細な分析を行う。
異なるレイヤにおけるモデルの多言語的振る舞いを探索する新しいメトリクスを導入し、多言語処理におけるアーキテクチャ選択の影響について光を当てる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 03:47:00 GMT)
Ultra-short-term multi-step wind speed prediction for wind farms based on adaptive noise reduction technology and temporal convolutional network [0.0] 本研究では、データノイズ低減技術、時間畳み込みネットワーク(TCN)、ゲートリカレントユニット(GRU)に基づく新しい風速予測モデルを提案する。
提案モデルは山東省の3つの風力発電所で検証された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:53:08 GMT)
Training of Neural Networks with Uncertain Data -- A Mixture of Experts Approach [0.0] ニューラルネットワーク(NN)をベースとした予測モデルにおいて,アレータティックな不確実性に対処することを目的とした新しいソリューションとして,「エキスパートの不確実性認識混合(uMoE)」がある。
本研究は,データ不確実性を効果的に管理するために,ベースライン法よりもuMoEの方が優れていることを示す。
この革新的なアプローチは、バイオメディカル信号処理、自律運転、生産品質管理など、様々なda-ta-drivenドメインに適用可能である。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 05:49:58 GMT)
Towards smallers, faster decoder-only transformers: Architectural variants and their implications [0.0] 本稿では,デコーダのみのトランスアーキテクチャであるParallelGPT(p-gpt),LinearlyCompressedGPT(lc-gpt),ConvCompressedGPT(cc-gpt)の3つの変更点を紹介する。
これらの変種は、モデルのサイズを減らし、トレーニング時間を短縮することで、コード生成タスクにおける従来のアーキテクチャと同等のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 06:19:46 GMT)
Towards Proxy Staking Accounts Based on NFTs in Ethereum [0.0] 本稿では,NFTAA(Non-fungible token)に基づくブロックチェーンネットワークに対する革新的なアプローチについて述べる。
この記事では、NFTAAを使用して、NFTのユニークな特性を活用して、オーナーシップをよりよく管理し、効果的に分離して、セキュリティ、透明性、さらには相互運用性の可能性を改善します。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:35:26 GMT)
Toward Routing River Water in Land Surface Models with Recurrent Neural Networks [0.0] 陸面モデル(LSM)における河川ルーティングのためのリカレントニューラルネットワーク(RNN)の性能について検討する。
我々は、地球にまたがる河川流域のデータを用いてモデルを訓練し、流れのヒンドキャストでテストする。
LSM-RNNの予測と、類似したデータセットで校正された既存の物理ベースモデルを比較し、LSM-RNNが物理ベースモデルより優れていることを示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:21:37 GMT)
The effect of frames on engagement with quantum technology [0.0] 量子をエニグマティックとしてフレーミングすることは、エンゲージメントに影響しないが、量子物理学を説明することは一般的な関心にポジティブに影響を及ぼす。
量子技術の利点を強調することは、参加者の内部効果を高める一方、量子技術の利点とリスクの両方を強調することは、認識される知識を減少させる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:51:00 GMT)
Temporal Entanglement Profiles in Dual-Unitary Clifford Circuits with Measurements [0.0] 本研究では,空間的ユニタリティを保った確率的測定により,両単位クリフォード回路の時間的絡みについて検討した。
浴槽サイズによる時間的絡み合いの初期弾道的成長は拡散性に変化していることを示す。
時間的絡み合い障壁のピーク値は、すべての測定速度に対して体積-法則スケーリングを示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:24:40 GMT)
TICE and normalisation, pour une r{é}novation universitaire dans les pays du Sud [0.0] サハラ以南のアフリカ諸国は、制度的な枠組みと特定の種類の大学組織を提示している。
この文書は、標準と相互運用性標準の達成に焦点を当てたリフレクションとアクションフレームワークの道を提供する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:38:30 GMT)
Superoscillations in High Energy Physics and Gravity [0.0] 古典場理論と量子場理論の文脈における超振動を探索する。
本稿では、場の第二量子化の手順と超振動状態を含むフォック空間の構築方法について述べる。
我々は、超振動の量子トンネル、散乱、粒子の混合、圧縮状態、レーザー干渉計のポテンシャル発展への応用を拡張した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:12:55 GMT)
Spontaneous breaking of time translation symmetry in a system without periodic external driving [0.0] 外部駆動を伴わない原子空洞系における時間変換対称性の自発的破壊を予測した。
共振器の2つのバイパス後にのみシステム状態が初期状態に戻るパラメータ範囲が存在することを示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:55:46 GMT)
SpaceByte: Towards Deleting Tokenization from Large Language Modeling [0.0] トークン化は、パフォーマンスが大幅に向上するため、大きな言語モデルで広く使用されている。
バイトレベルとサブワード自動回帰言語モデリングのパフォーマンスギャップを埋める新しいバイトレベルデコーダアーキテクチャであるSpaceByteを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:59:29 GMT)
Short-term wind speed forecasting model based on an attention-gated recurrent neural network and error correction strategy [0.0] この論文は、改良されたゲートリカレントニューラルネットワーク(AtGRU)による注意点に基づく1つの短期風速予測パターンを提起する。
提案したSSA-AtGRU-VMD-GRUモデルは、ウッドバーン、セントトーマス、サンタクルーズの3つのケーススタディにおいて比較モデルより優れている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:21:31 GMT)
Scalable Circuits for Preparing Ground States on Digital Quantum Computers: The Schwinger Model Vacuum on 100 Qubits [0.0] 格子シュウィンガーモデルの真空は、IBMのイーグルプロセッサ量子コンピュータの最大100キュービットで作られる。
ギャップ付き翻訳不変系の基底状態を作成する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:49:55 GMT)
Roots and Requirements for Collaborative AIs [0.0] コラボレーションの夢としてのAIは、人間の知性(IA)を増強するコンピュータツールや、中間的な人間のコラボレーションとは異なる。
AIの政府諮問グループとリーダーは、AIは透明で効果的な協力者であるべきだと長年主張してきた。
AIチームメイトは、ソリューションの一部なのか?人工知能(AI)はどのようにして存在するべきか?
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:56:24 GMT)
Research on Robot Path Planning Based on Reinforcement Learning [0.0] 本研究は,視覚SLAMに基づくロボット経路計画に関する研究である。
二次元経路計画に適した地図は、地図変換により得られる。
強化学習に基づく経路計画アルゴリズムに関する研究
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:49:46 GMT)
Rapid Virtual Simulations: Achieving 'Satisficing Learning Impact' with 'Realistic-Enough' Activities in Health Science Education [0.0] この原稿は、バーチャル教育シミュレーションを作成するための専門家の自主性を促進する新しい技術教育活動であるRapid Virtual Simulationsの概念を紹介している。
それは、最小の複雑なシミュレーションの開発を追求しつつ、満足度(あるいは十分十分な)学習インパクトを確実にするリアル・エナフ哲学に基礎を置いている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 10:03:29 GMT)
Quantum Information reveals that orbital-wise correlation is essentially classical in Natural Orbitals [0.0] 本研究では,古典的,量子的実例の波動関数における軌道方向電子相関の性質について検討する。
分子系における古典的相互情報と量子的相互情報との区別が顕著である。
この発見は、適切な軌道基底を通して見れば、波動関数の相関は主に古典的であることを示唆している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:26:56 GMT)
Quantum Convolutional Neural Networks for the detection of Gamma-Ray Bursts in the AGILE space mission data [0.0] この作業は、2007年にイタリア宇宙機関によって打ち上げられたAGILEの宇宙ミッションのコンテキストに該当する。
我々は、AGILEに搭載されている機器が取得したデータを分析し、スカイマップや光曲線からガンマ線バーストを検出するために、異なる量子畳み込みニューラルネットワーク(QCNN)を実装した。
我々はQCNNを用いたスカイマップで95.1%の精度を達成し、古典的手法では98.8%を同じデータで達成した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 12:34:53 GMT)
Pricing of European Calls with the Quantum Fourier Transform [0.0] 我々は、幅広い資産モデルにまたがるヨーロッパのコールオプションの価格設定のための量子アルゴリズムを導入、分析する。
我々は、この新しいアルゴリズムをオプション価格で既存の量子アルゴリズムと比較する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 12:03:49 GMT)
Preserving linear invariants in ensemble filtering methods [0.0] 非ガウスフィルタ問題の線形不変量を自動的に保存する非線形アンサンブルフィルタの一般クラスを導入する。
アンサンブルカルマンフィルタの既存の正規化手法と線形不変量の保存法を組み合わせる方法について述べる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:39:32 GMT)
Prepotential Approach: a unified approach to exactly, quasi-exactly, and rationally extended solvable quantal systems [0.0] ポテンシャル的アプローチ(prepotential approach)と呼ばれる、単純で統一的な方法の概要を簡潔に説明する。
1次元シュラー・オーディンガー方程式の正確な解法と準コンパクト解法の両方を扱う。
我々は、実エネルギーを持つエルミートおよび非エルミートハミルトンのいくつかのパラダイム的な例によるアプローチを説明する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 16:20:44 GMT)
Predicting the Geothermal Gradient in Colombia: a Machine Learning Approach [0.0] 地熱勾配の決定は 特定の地域の地熱エネルギーポテンシャルを評価するのに 不可欠です
我々は、教師付き機械学習と利用可能な直接測定の最近の進歩を活用する別のアプローチを提案する。
我々は,本モデルの予測精度が12%以内であり,他の著者による独立測定値が本モデルとよく一致していることを示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 05:42:33 GMT)
Pour une interop{é}rabilit{é} s{é}mantique en {é}ducation : les mod{è}les normatifs de l'ISO/IEC JTC1 SC36 [0.0] コンテンツの意味論は、革新的な教育システムのモデルの本質的な構成要素の1つである。
技術産業、電気通信、IT、言語工学、情報科学の文書化などにおける様々なアクターによる規範的な取り組みに基づいて徐々に構築される。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:39:34 GMT)
Pixels and Predictions: Potential of GPT-4V in Meteorological Imagery Analysis and Forecast Communication [0.0] OpenAIのGPT-4V大規模言語モデルのような生成AIは、急速に主流の話題になってきた。
本研究は,GPT-4Vの気象図を適切に解釈し,気象リスクを適切に伝達する能力を評価する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:36:33 GMT)
Photon distillation schemes with reduced resource costs based on multiphoton Fourier interference [0.0] 本研究では,光子を減らして不識別性を改善する光子蒸留方式について検討した。
これらの結果は、大規模フォトニック量子コンピュータに応用できるかもしれない。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:11:25 GMT)
Optimization of Algorithmic Errors in Analog Quantum Simulations [0.0] 本稿では,実世界のデバイス制約による近似時間進化シミュレーションから生じる誤差と,実世界のデバイス制約による誤差の相互関係について検討する。
誤差はアイジング・ハミルトンによって記述されたアナログ量子デバイス上のハイゼンベルク型システムで研究される。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:15:47 GMT)
LLMs as Writing Assistants: Exploring Perspectives on Sense of Ownership and Reasoning [0.0] 執筆におけるオーナシップの感覚は、思考、時間、貢献の投資を制限し、アウトプットへのアタッチメントにつながります。
すべてのタスクが同等であっても、創造的なタスクでは、LLM(Large Language Models)を信用する傾向があります。
我々は,これらの問題を調査し,その基礎となる認知過程を理解して,書面における人間とコンピュータの相互作用についてより深い知識を得るための簡単な調査を行う。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:30:30 GMT)
Interferometric sorting of temporal Hermite-Gauss modes via temporal Gouy phase [0.0] 我々は,マッハ・ツェンダー干渉計を$mで構成し,各モードで得られた時間的グーイ位相を調整して,第1の時間的ハーマイト・ガウスモードの光通過のソートを実現する装置を提案する。
自発パラメトリックダウンコンバージョンで発生する光子対のシュミットモードを2つの干渉計でソートし、5.5%のクロストーク確率で理論的に低い結合を求める。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:33:22 GMT)
Ink and Individuality: Crafting a Personalised Narrative in the Age of LLMs [0.0] LLMベースの筆記アシスタントへの依存が高まると、創造性と個性は時間とともに悪化する。
本研究は,様々な視点と概念を探索するための簡単な調査を行うことにより,これらの懸念について検討する。
これらの課題に対処することは、人間とコンピュータのインタラクションシステムを改善し、パーソナライズとパーソナライズのためのアシスタントを書くために不可欠である。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 08:30:28 GMT)
In the Shadow of Smith`s Invisible Hand: Risks to Economic Stability and Social Wellbeing in the Age of Intelligence [0.0] AI資本と労働者の比率が適度に上昇しても、現在の2倍の労働力不足が増す可能性がある。
未使用量の推定増加による一人当たりの使い捨て所得の減少を防止するためには、新規雇用創出率の少なくとも10.8倍の増加が必要である。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 06:16:48 GMT)
Estimation Sample Complexity of a Class of Nonlinear Continuous-time Systems [0.0] 本稿では, 大規模非線形系のパラメータ推定法について述べる。
正規化線形回帰を用いて力学を直接反転させることにより未知パラメータを解く手法は、微分フィルタと正規化最小二乗の新たな設計と解析のアイデアに基づいている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 22:03:37 GMT)
Electric Field Gradient Calculations for Ice VIII and IX using Polarizable Embedding: A Comparative Study on Classical Computers and Quantum Simulators [0.0] 明示的な環境、波動関数、異なる基底集合のサイズを含むことは、ゲート数に直接影響しない。
VTailorE-SCFでは、環境の包含と異なる基底集合のサイズがゲート数に直接影響しないことが分かる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 18:59:07 GMT)
Dynamical quantum Ansatz tree approach for the heat equation [0.0] 熱方程式の離散化バージョンを考え、量子コンピュータ上でその解に対処する。
本手法を線形方程式系に拡張し, 実時間依存熱方程式に対処する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 11:44:48 GMT)
Dynamical heterogeneity and large deviations in the open quantum East glass model from tensor networks [0.0] 数値テンソルネットワークを用いた散逸量子東モデルの非平衡ダイナミクスについて検討する。
我々は行列積状態を用いて、正確な対角化にアクセスできるものを超える大きさの量子ジャンプなき大きさの進化を表現する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 15:01:36 GMT)
Dismantling Common Internet Services for Ad-Malware Detection [0.0] インターネット上で誰がアドマルウェアを定義するかを評価する。
クローリング中に見つかったドメインの最大0.47%は、DNSプロバイダによって疑わしいとラベル付けされている。
これらのドメインの約0.7%から3.2%のみがアドマルウェアに分類される。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 13:59:37 GMT)
Differentiating Viral and Bacterial Infections: A Machine Learning Model Based on Routine Blood Test Values [0.0] Virus vs.bacteriuma"モデルは、機械学習を活用して感染管理を最適化し、高度な診断ツールの道を開く。
このモデルは精度82.2 %、感度79.7 %、特異度84.5 %、ブライアスコア0.129、ROC曲線0.905の領域を達成し、CRPベースの決定規則を上回った。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 19:28:22 GMT)
Decoherence of a charged Brownian particle in a magnetic field : an analysis of the roles of coupling via position and momentum variables [0.0] 我々は, 振動するブラウン粒子の位置および運動量結合を介して, オーミック熱浴に結合したブラウン粒子の力学について検討した。
位置結合と運動量結合の両方の存在は環境との相互作用を強くし、コヒーレンスの損失を速くする。
さらに、磁場は、システムと浴とのカップリングの性質に関係なく、システムからの情報の損失を遅くする。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 05:10:02 GMT)
Conditional disclosure of secrets with quantum resources [0.0] 秘密の条件開示(英: Conditional revealsure of Secrets、CDS)は、通信、ランダム性、セキュリティの関係を研究する最も単純な暗号設定の一つである。
近年、CDQSと呼ばれるプリミティブの量子アナログが定義され、量子位置検証の文脈で研究される$f$-routingに関連している。
我々は,情報理論設定におけるプライバシと量子リソースの関係をよりよく理解することを目的として,CDQSの体系的研究を開始した。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 18:00:04 GMT)
Collaborative Perception Datasets in Autonomous Driving: A Survey [0.0] この論文は様々なデータセットを体系的に分析し、多様性、センサーの設定、品質、公開可用性、下流タスクへの適用性といった側面に基づいて比較する。
データセット開発におけるプライバシとセキュリティの懸念に対処することの重要性は、データ共有とデータセット生成に関して強調されている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:36:17 GMT)
Brain-Inspired Continual Learning-Robust Feature Distillation and Re-Consolidation for Class Incremental Learning [0.0] 本稿では, 特徴蒸留と再固化という2つの基本概念からなる新しい枠組みを提案する。
ロバスト・リハーサル(Robust Rehearsal)と名付けられた我々のフレームワークは、継続的な学習システムに固有の破滅的な忘れ込みの課題に対処する。
CIFAR10、CIFAR100、実世界のヘリコプター姿勢データセットで実施された実験は、ロバスト・リハーサルで訓練されたCLモデルの優れた性能を示す。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 21:30:11 GMT)
Beyond Personhood: Agency, Accountability, and the Limits of Anthropomorphic Ethical Analysis [0.0] 私たちは、それが(倫理的な)エージェントであることの意味について、2つの競合するビジョンを与えます。
倫理的に重要な行動の文脈では、AIはエージェントではなく、政治プロセスの結果と見なされるべきである。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 04:19:24 GMT)
Bell Correlations via Constrained Colliders -- a Path from W to V [0.0] この記事は提案に対する新たな議論の概要である。
これは、遅延チョイスエンタングルメントスワップを含む特別な(W字型)ベル実験に対してどのように有効かを説明し、一般的な(V字型)ケースに拡張できると主張している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:04:51 GMT)
Applying BioBERT to Extract Germline Gene-Disease Associations for Building a Knowledge Graph from the Biomedical Literature [0.0] 本稿では,ジェムリン遺伝子と疾患を結合する知識グラフ構築手法SimpleGermKGを提案する。
遺伝子および疾患の抽出には、バイオメディカルコーパス上でトレーニング済みのBERTモデルであるBioBERTを用いる。
記事,遺伝子,疾患間の意味的関連性について,部分的関係性アプローチを実装した。
知識グラフには297の遺伝子、130の疾患、46,747のトリプルが含まれている。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:26:25 GMT)
Adaptive Local Binary Pattern: A Novel Feature Descriptor for Enhanced Analysis of Kidney Abnormalities in CT Scan Images using ensemble based Machine Learning Approach [0.0] 腎機能低下を特徴とする腎不全は、嚢胞、石、腫瘍などの要因によって引き起こされる。
慢性腎臓病は早期に発症し、進行期に達するまで治療を受けない症例が生じることがある。
ダッカの複数の病院で撮影された12,427枚の画像からなるデータセットは、嚢胞、腫瘍、石、正常の4つのグループに分類された。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 20:15:43 GMT)
AI and the Problem of Knowledge Collapse [0.0] 特定の知識モードへのアクセスコストを削減することにより、AIが公衆の理解をパラドックス的に損なう可能性のある条件を特定する。
学習者やイノベーターのコミュニティが従来の手法を使うか、割引されたAI支援プロセスに頼るというシンプルなモデルを提供する。
我々のデフォルトモデルでは、AI生成コンテンツに対する20%の割引は、ディスカウントがない場合よりも真実から2.3倍の信条を生成する。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 14:18:42 GMT)
A unified theory of tunneling times promoted by Ramsey clocks [0.0] トンネル工事後のRamseyシークエンスで読み取る時間について検討した。
1つのアプローチでトンネル遅延の定義を統一する。
超音速トンネルや即時トンネルは存在しない。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 17:36:34 GMT)
A survey of air combat behavior modeling using machine learning [0.0] 本調査では, 空気戦闘行動のモデル化における機械学習手法の適用について検討する。
従来の行動モデリングは労働集約的であり、開発ステップ間で重要なドメイン知識を失う傾向があります。
この調査では、応用、行動モデルタイプ、一般的な機械学習手法、適応的で現実的な行動エージェントの開発における技術的および人間的課題について調査している。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 07:54:56 GMT)
A Simple Quantum Blockmodeling with Qubits and Permutations [0.0] 量子コンピュータにおけるブロックモデリングの解法を示す。
モデルでは、小さな量子ビットのグループの測定結果が、適合度値を示すためにマッピングされる。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 09:16:35 GMT)
A Non-Expert's Introduction to Data Ethics for Mathematicians [0.0] データ倫理に関する背景情報と社会的文脈から始めます。
私は、データ倫理、社会、社会的善に関するいくつかの取り組みを、私の自宅や他の施設で簡単に強調します。
次に、研究におけるオープンデータ、研究の複製性、その他の研究における倫理的問題について議論します。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 01:46:08 GMT)
A Data-to-Product Multimodal Conceptual Framework to Achieve Automated Software Evolution for Context-rich Intelligent Applications [0.0] 本研究では,ソフトウェアの自動進化を実現するための概念的枠組みを提案する。
概念的枠組みに基づいて選択的シーケンススコープモデル(3S)モデルを開発する。
この研究はインテリジェントなアプリケーションに関するものだが、フレームワークと分析方法は、AIが彼らのライフサイクルにより多くのインテリジェンスをもたらすため、他のタイプのソフトウェアに適用される可能性がある。
論文参考訳(メタデータ) (Mon, 22 Apr 2024 05:38:01 GMT)