Large Language Model Based Generative Error Correction: A Challenge and Baselines for Speech Recognition, Speaker Tagging, and Emotion Recognition [110.8] 生成音声の書き起こし誤り訂正(GenSEC)の課題について紹介する。
この課題は、(i)ASR後の転写補正、(ii)話者タグ付け、(iii)感情認識という、3つのASR後の言語モデリングタスクを含む。
本稿では,ベースライン評価から得られた知見と,今後の評価設計における教訓について論じる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:32:04 GMT)
LPT++: Efficient Training on Mixture of Long-tailed Experts [107.8] ++は3つのコアコンポーネントを統合することで、凍結されたビジョントランスフォーマー(ViT)を強化する。
1つ目は、長い尾のプロンプトと視覚的アダプタを集約して、トレーニング済みのモデルを対象のドメインに適応させる、普遍的な長い尾の適応モジュールである。
2つ目は、長い尾を持つエキスパートフレームワークと、より正確な予測を生成するために、視覚のみと視覚言語(VL)の両方のモデルエキスパートからの信頼度スコアに対する再重み付け係数を適応的に計算するMoEスコアラーの混合である。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:19:11 GMT)
Phidias: A Generative Model for Creating 3D Content from Text, Image, and 3D Conditions with Reference-Augmented Diffusion [59.0] 3Dモデリングでは、デザイナはしばしば既存の3Dモデルを使って新しいものを作成する。
このプラクティスは、参照付加3D生成に拡散を利用する新しい生成モデルであるPhidiasの開発にインスピレーションを与えている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:59:33 GMT)
Exploring Concept Depth: How Large Language Models Acquire Knowledge at Different Layers? [57.0] 大規模言語モデル(LLM)は、幅広いタスクで顕著なパフォーマンスを示している。
しかし、これらのモデルが様々な複雑さのタスクを符号化するメカニズムは、いまだに理解されていない。
我々は、より複雑な概念が一般的により深い層で取得されることを示すために、概念深さの概念を紹介します。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:37:18 GMT)
A Survey of Machine Unlearning [56.0] 最近の規制では、要求に応じて、ユーザに関する個人情報をコンピュータシステムから削除する必要がある。
MLモデルは古いデータをよく記憶します。
機械学習に関する最近の研究は、この問題を完全に解決することはできなかった。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 11:55:58 GMT)
Contrastive Learning in Memristor-based Neuromorphic Systems [55.1] スパイクニューラルネットワークは、現代のバックプロパゲーションによって訓練されたディープネットワークに直面する重要な制約の多くを横取りする、ニューロンベースのモデルの重要なファミリーとなっている。
本研究では,前向き・後向き学習のニューロモルフィック形式であるコントラッシブ・シグナル依存型塑性(CSDP)の概念実証を設計し,検討する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 04:48:45 GMT)
Promptriever: Instruction-Trained Retrievers Can Be Prompted Like Language Models [54.3] 本稿では,LMのように誘導できる最初の検索モデルであるPromptrieverを紹介する。
Promptrieverは、標準的な検索タスクで高いパフォーマンスを達成し、命令に従う。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:42:55 GMT)
Towards Effective User Attribution for Latent Diffusion Models via Watermark-Informed Blending [54.3] 我々は、ウォーターマークインフォームドブレンディング(TEAWIB)による潜伏拡散モデルに対する効果的なユーザ属性に向けた新しいフレームワークを提案する。
TEAWIBは、ユーザ固有の透かしを生成モデルにシームレスに統合する、ユニークな準備可能な構成アプローチを取り入れている。
TEAWIBの有効性を検証し、知覚的品質と帰属精度で最先端の性能を示す実験を行った。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 07:52:09 GMT)
The Sample Complexity of Smooth Boosting and the Tightness of the Hardcore Theorem [53.4] スムースブースターは任意の例にあまり重みを付けない分布を生成する。
もともとは耐雑音性のために導入されたが、そのようなブースターは微分プライバシー、軽度、量子学習理論にも応用されている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 23:09:25 GMT)
Towards Fair RAG: On the Impact of Fair Ranking in Retrieval-Augmented Generation [53.3] 本稿では,公正ランキングと統合されたRAGシステムの最初の体系的評価について述べる。
本稿では,RAGシステムで活用されるランキングにおいて,各項目の公正な露出を測定することに焦点を当てる。
以上の結果から,RAGシステムは高い世代品質を維持でき,多くの場合,従来のRAGシステムよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 23:10:04 GMT)
Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think [53.3] 認識された非効率性は、これまで気付かれなかった推論パイプラインの欠陥によって引き起こされたことを示している。
タスク固有の損失を伴う単一ステップモデル上でエンドツーエンドの微調整を行い、他の拡散に基づく深さモデルや正規推定モデルよりも優れた決定論的モデルを得る。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:58:52 GMT)
Design Optimization of NOMA Aided Multi-STAR-RIS for Indoor Environments: A Convex Approximation Imitated Reinforcement Learning Approach [51.6] 非直交多重アクセス(Noma)により、複数のユーザが同じ周波数帯域を共有でき、同時に再構成可能なインテリジェントサーフェス(STAR-RIS)を送信および反射することができる。
STAR-RISを屋内に展開することは、干渉緩和、電力消費、リアルタイム設定における課題を提示する。
複数のアクセスポイント(AP)、STAR-RIS、NOMAを利用した新しいネットワークアーキテクチャが屋内通信のために提案されている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:02:12 GMT)
Laugh Now Cry Later: Controlling Time-Varying Emotional States of Flow-Matching-Based Zero-Shot Text-to-Speech [51.5] EmoCtrl-TTSは感情制御可能なゼロショットTSであり、あらゆる話者に対してNVで高い感情的な音声を生成することができる。
高品質な感情音声生成を実現するために、EmoCtrl-TTSは擬似ラベルに基づく27,000時間以上の表現データを用いて訓練される。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:40:11 GMT)
MURRE: Multi-Hop Table Retrieval with Removal for Open-Domain Text-to-SQL [51.5] MURRE (Multi-hop table search with removal) は、未検索のテーブルへ誘導するために、質問から以前検索した情報を削除する。
2つのオープンドメインのテキスト・ツー・レトリバーデータセットの実験は、以前の最先端結果よりも平均5.7%改善したことを示している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:25:27 GMT)
S$^3$Attention: Improving Long Sequence Attention with Smoothed Skeleton Sketching [51.4] 本稿ではスムースなスケルトンスケッチに基づくアテンション構造S$3$Attentionを提案する。
S$3$Attentionは、線形複雑性をシーケンス長に保ちながら、ノイズの影響を効果的に最小化する2つのメカニズムを持つ。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:30:46 GMT)
SIFToM: Robust Spoken Instruction Following through Theory of Mind [51.3] 本稿では,認知にインスパイアされた音声指導モデルであるSIFToMを提案し,多様な音声条件下でロボットが人間の指示を実践的に追従できるようにする。
結果から,SIFToMモデルは現状の音声モデルや言語モデルよりも優れており,課題に追従する音声命令に対する人間レベルの精度に近づいていることがわかった。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:36:10 GMT)
AI-Assisted Human Evaluation of Machine Translation [51.1] 我々は、リコール指向の自動品質推定でエラーアノテーションをプリフィルすることでアノテータを支援する。
このAIアシストにより、アノテーションごとの時間を半分に減らしながら、同じ品質レベルでアノテーションを得ることができます。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:18:11 GMT)
fMRI-3D: A Comprehensive Dataset for Enhancing fMRI-based 3D Reconstruction [50.5] 我々は15人の参加者のデータを含むfMRI-3Dデータセットを提示し、合計4768個の3Dオブジェクトを展示する。
我々は,fMRI信号から3次元視覚情報を復号化するための新しいフレームワークMinD-3Dを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:13:59 GMT)
Manipulating and Mitigating Generative Model Biases without Retraining [49.6] モデル再学習を伴わないリッチ言語埋め込み空間を利用して,T2Iモデルバイアスの動的かつ効率的な操作を提案する。
基礎ベクトル代数を利用することで、T2Iモデルの出力をシフトさせる言語モデルの埋め込みを便利に制御できることを示す。
副産物として、この制御は正確なプロンプト工学の一形態として機能し、通常のテキストプロンプトを使って一般的には理解できない画像を生成する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:07:58 GMT)
Improving Speech Emotion Recognition in Under-Resourced Languages via Speech-to-Speech Translation with Bootstrapping Data Selection [49.3] 音声感情認識(SER)は、人間とコンピュータの自然な相互作用が可能な汎用AIエージェントを開発する上で重要な要素である。
英語や中国語以外の言語でラベル付きデータが不足しているため、堅牢な多言語SERシステムの構築は依然として困難である。
本稿では,低SERリソース言語におけるSERの性能向上のための手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:36:45 GMT)
Depth-based Privileged Information for Boosting 3D Human Pose Estimation on RGB [48.3] ヒートマップに基づく3Dポーズ推定器は、推定時に与えられるRGBフレームから深度情報を幻覚することができる。
深度情報は、RGBベースの幻覚ネットワークを強制して、深度データのみに基づいて事前訓練されたバックボーンに類似した特徴を学習することによって、トレーニング中にのみ使用される。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 11:59:34 GMT)
Adaptive Large Language Models By Layerwise Attention Shortcuts [46.8] LLMライクなセットアップにより、最終レイヤはアテンションメカニズムを通じて適合すると考えられるすべての中間レイヤに出席することができる。
音響トークン,自然言語,シンボリック音楽の4つの異なるデータセットを紹介し,GPTアーキテクチャの優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 03:46:01 GMT)
Music auto-tagging in the long tail: A few-shot approach [45.9] マルチラベル音楽の自動タグ付けに少数ショット学習手法を統合することを提案する。
実験により,事前学習した特徴を持つ簡易モデルにより,最先端モデルに近い性能が得られることを示した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 00:48:38 GMT)
Machine Learning and Theory Ladenness -- A Phenomenological Account [45.0] 両者の立場は単純すぎるし、MLメソッドとドメイン理論間の相互作用の理解を前進させるものではない、と我々は主張する。
分析の結果、モデルの構築はドメイン理論とは比較的独立しているが、特定のドメイン内でのモデルの実装と解釈は、基本的な理論的仮定と背景知識に依存していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:29:14 GMT)
ImageFlowNet: Forecasting Multiscale Image-Level Trajectories of Disease Progression with Irregularly-Sampled Longitudinal Medical Images [44.1] ImageFlowNetは、空間的詳細を保存しながら、初期画像から疾患軌跡を予測するために設計された新しいモデルである。
我々は、ODEの定式化を支援し、高レベルの視覚的特徴を含む正規化を動機付ける理論的洞察を提供する。
私たちのコントリビューションには、ImageFlowNetの開発、実世界のデータセットに関する理論的および実証的な検証が含まれています。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:19:19 GMT)
A Dynamical System View of Langevin-Based Non-Convex Sampling [44.0] 非サンプリングは機械学習における重要な課題であり、ディープラーニングにおける非レート最適化の中心であり、その重要性を近似する。
既存の保証は通常、より望ましい最終段階の反復よりも平均距離のみを保持する。
我々は、理論システムからいくつかのツールを活用することにより、上記の問題を解消する新しいフレームワークを開発する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:03:42 GMT)
PDMX: A Large-Scale Public Domain MusicXML Dataset for Symbolic Music Processing [43.6] PDMX: スコア共有フォーラムMuseScoreから収集した250万以上のパブリックドメイン MusicXML スコアからなる大規模なオープンソースデータセット。
このデータセットは、私たちの知識にとって最大の著作権のないシンボリック音楽データセットです。
我々は、PDMXの異なる代表部分集合が下流モデルにおける異なる挙動にどのように寄与するかを評価するマルチトラック音楽生成実験を行う。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:48:42 GMT)
Obfuscation Based Privacy Preserving Representations are Recoverable Using Neighborhood Information [43.1] プライバシ保護ローカライゼーションの研究は、クエリ画像キーポイントとシーンマップの3Dポイントに対する逆攻撃を防ぐことに重点を置いている。
これらの難読化の共通の弱点を指摘し、既知の近傍の仮定の下で元の点位置の近似を復元できるようにする。
以上の結果から,プライバシ保護を主張されているにもかかわらず,これらのスキームはプライバシ保護とはみなしてはならないことが示唆された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 20:13:54 GMT)
Transferable-guided Attention Is All You Need for Video Domain Adaptation [42.6] ビデオにおける教師なし適応(UDA)は、画像ベースのUDA技術に比べ、まだ十分に検討されていない課題である。
我々のキーとなる考え方は、トランスフォーマー層を特徴エンコーダとして使用し、空間的および時間的伝達可能性の関係をアテンション機構に組み込むことである。
Transferable-Guided Attention (TransferAttn)フレームワークが開発され、トランスフォーマーの能力を利用してドメイン間の知識を適応する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:35:46 GMT)
Deep Learning Based 3D Segmentation: A Survey [42.4] 3Dセグメンテーションは、自律運転とロボット工学の応用でコンピュータビジョンの根幹的で難しい問題である。
近年、ディープラーニング技術が3Dセグメンテーションタスクの選択ツールとなっている。
本稿では,ディープラーニングに基づく3Dセグメンテーション技術の最近の進歩を包括的に調査する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:48:38 GMT)
Task Arithmetic for Language Expansion in Speech Translation [41.7] 我々は,新しい言語ペアと既存のモデルで訓練されたモデルを組み合わせることで,新しい言語ペアを拡張することを提案する。
また,STに対するタスク演算の直接適用により,マージされたモデルが命令に従わないことが判明した。
言語を混乱させないために,追加の言語制御モデルとマージする拡張タスク演算法を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:25:11 GMT)
Context-Dependent Interactable Graphical User Interface Element Detection for VR Applications [41.6] 仮想現実感アプリのための最初のゼロショットcOntext-sensitive inteRactable GUI ElemeNT dEtectionフレームワークOrienterを提案する。
人間の振る舞いを模倣することで、OrienterはまずVRアプリのシーンの意味的コンテキストを観察し、理解し、次に検出を実行する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 00:58:00 GMT)
EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage [40.8] 本稿では,敵の標的,制約,攻撃シナリオについて議論する脅威モデルを提案する。
ユーザ固有の個人識別情報(PII)を盗むか,あるいはユーザ要求全体を盗む。
これらの目的を達成するために,環境注入攻撃(EIA)と呼ばれる新しい攻撃手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:49:44 GMT)
LoRa Communication for Agriculture 4.0: Opportunities, Challenges, and Future Directions [40.1] スマート農業の新興分野は、IoT(Internet of Things)を活用して農業プラクティスに革命をもたらす。
本稿では,農業用IoTシステムにおける長距離無線通信の鍵となるLong Range(LoRa)技術の転換可能性について検討する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 13:55:44 GMT)
Advanced Model Consistency Restoration with Higher-Order Short-Cut Rules [39.6] 我々は、同期中に、より複雑なSC規則をオンザフライで計算する手法を開発した。
これらの高階のSCルールは、複数の変更を1ステップで処理しなければならない場合に、より複雑なシナリオに対処することができます。
評価により、高次SCルールのオンザフライでの計算のオーバーヘッドは許容可能であり、時には全体的な性能も向上することが示された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 13:27:38 GMT)
Learning Spatially-Aware Language and Audio Embedding [38.3] マルチモーダルコントラスト学習を用いて学習した空間認識音声およびテキスト埋め込みモデルを提案する。
ELSAは音声の空間的・意味的要素を記述する非空間的音声、空間的音声、オープン語彙の字幕をサポートする。
特に、ELSAはベースライン上のオーディオ・トゥ・テキストとテキスト・トゥ・オーディオのR@1を+2.8%、ベースライン上の3Dソースのローカライゼーションにおいて-11.6degの平均・絶対エラーを上回ります。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:17:25 GMT)
Watch Your Steps: Observable and Modular Chains of Thought [36.8] プログラムトレースプロンプティング(Program Trace Prompting)と呼ばれる,思考の連鎖(CoT)の変種を提案する。
CoTのパワー、一般性、柔軟性を保ちながら、より観察可能な説明をする。
Program Trace Promptingは多くのタスクに適用でき、BIG-Bench Hardベンチマークの23種類のタスクに対して強力な結果が得られる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 23:47:20 GMT)
A Systematic Review of Generalization Research in Medical Image Classification [36.3] 本稿では,Deep Learning(DL)に基づく分類モデルのための既存の領域一般化手法について検討する。
それは彼らが解決しようとしているシフトタイプに基づいた分類法を提案する。
本研究の結果から,両タイプの学習手法が出現していることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:27:07 GMT)
StuGPTViz: A Visual Analytics Approach to Understand Student-ChatGPT Interactions [35.9] 本稿では、学生のプロンプトの時間パターンとChatGPTの応答の質を複数のスケールで追跡・比較する視覚分析システム、StuGPTVizを提案する。
その結果、StuGPTVizがChatGPTの教育的価値に対する教育者の洞察を高める能力があることが確認された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:32:02 GMT)
Multi-modal Generative Models in Recommendation System [34.5] 多くのレコメンデーションシステムは、ユーザ入力をテキスト文字列やクリックや購入などの行動信号に制限する。
生成AIの出現により、ユーザーはより豊富なレベルのインタラクションを期待するようになった。
今後のレコメンデーションシステムは、製品に対するマルチモーダルな理解の恩恵を受けるだろう、と我々は主張する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:55:50 GMT)
Unveiling Entity-Level Unlearning for Large Language Models: A Comprehensive Analysis [32.5] 大規模言語モデルのアンラーニングは、セキュリティとプライバシの懸念に対処する可能性から、注目を集めている。
この研究の多くは、機密コンテンツを含む事前定義されたインスタンスの削除を対象とする、インスタンスレベルの未学習に集中している。
本稿では,対象モデルからエンティティ関連知識を完全に消去することを目的とした,エンティティレベルのアンラーニングという新しいタスクを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:00:10 GMT)
HLTCOE JHU Submission to the Voice Privacy Challenge 2024 [31.9] 音声プライバシチャレンジのためのシステムをいくつか紹介する。
音声変換システムは感情的コンテンツをよりよく保存するが、半ホワイトボックス攻撃のシナリオでは話者の身元を隠すのに苦労している。
本稿では,2種類のシステムの強みと弱みのバランスをとるために,ランダムな混合システムを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:39:44 GMT)
Self-Translate-Train: Enhancing Cross-Lingual Transfer of Large Language Models via Inherent Capability [31.0] 自己翻訳-トレイン(Self-Translate-Train)は、大規模言語モデルがトレーニングデータをターゲット言語に翻訳し、自身の生成されたデータに基づいてモデルを微調整する手法である。
自己翻訳-トレインがゼロショット転送より優れていることを示すことによって、LLMの言語間機能を引き出すためのより良い手法のさらなる探索を奨励する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:04:22 GMT)
Enhancing Multilingual Speech Generation and Recognition Abilities in LLMs with Constructed Code-switched Data [31.0] 本論文では,MutltiLingual MultiTask (MLMT)モデルを提案する。
我々は,異なる言語からの単語を分割し,CSデータに頼ることなくCS能力を備えた合成を行う,効果的なデータ構築手法を開発した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:11:07 GMT)
Temporal As a Plugin: Unsupervised Video Denoising with Pre-Trained Image Denoisers [31.0] 本稿では,TAP (Temporal As aTAP) という,教師なしのビデオデノベーションフレームワークを提案する。
時間的加群を組み込むことで、ノイズの多いフレームをまたがる時間的情報を活用することができ、空間的 denoising のパワーを補完することができる。
他の教師なしビデオ復号化手法と比較して,本フレームワークは,SRGBと生ビデオ復号化データセットの両方において優れた性能を示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:05:33 GMT)
A Dataset and Benchmark for Shape Completion of Fruits for Agricultural Robotics [30.5] 本稿では,農業用視覚システムのための3次元形状補完データセットを提案する。
果実の3次元形状を推定するためのRGB-Dデータセットを提供する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:16:57 GMT)
OSV: One Step is Enough for High-Quality Image to Video Generation [29.8] 一貫性蒸留とGANトレーニングを効果的に組み合わせた2段階トレーニングフレームワークを提案する。
また,ビデオラテントを復号化する必要のない新しいビデオ識別器の設計を提案する。
本モデルでは,高画質映像を1ステップで生成可能であり,多段精細化の柔軟性が期待できる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:16:37 GMT)
Linguistic Bias in ChatGPT: Language Models Reinforce Dialect Discrimination [29.2] ChatGPTは、英語の10の方言(Standard American English、Standard British English、および世界中で広く話されている8つの非標準品種)をカバーしている。
GPT-3.5 Turbo と GPT-4 を各品種の母語話者のテキストで誘導し,言語的特徴アノテーションと母語話者評価を用いて応答を解析した。
GPT-3.5 Turbo と GPT-4 は,非標準型話者に対する言語識別を永続的に行うことができる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 05:29:50 GMT)
GenQ: Quantization in Low Data Regimes with Generative Synthetic Data [28.8] 我々は、高度な生成AIモデルを用いて高分解能合成データを生成する新しいアプローチであるGenQを紹介する。
データの可用性が限られている場合、実際のデータは合成データ生成プロセスのガイドに使用される。
厳密な実験を通じて、GenQはデータフリーおよびデータスカース量子化の新しいベンチマークを確立する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:49:21 GMT)
TTT-Unet: Enhancing U-Net with Test-Time Training Layers for biomedical image segmentation [28.2] TTT-Unetは、テストタイムトレーニング層をバイオメディカルイメージセグメンテーションのための従来のU-Netアーキテクチャに統合する新しいフレームワークである。
TTT-Unetは,CTおよびMR画像における3次元腹部臓器の分画,内視鏡画像における計器の分画,顕微鏡画像における細胞分画など,複数の医用画像データセット上で評価される。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:52:40 GMT)
Measuring and Enhancing Trustworthiness of LLMs in RAG through Grounded Attributions and Learning to Refuse [27.3] RAGフレームワークにおけるLCMの信頼性を総合的に評価する新たな指標であるTrust-Scoreを導入する。
本研究では,LLMをRAGタスクに効果的に適応させるには,文脈内学習などの様々なプロンプト手法が不十分であることを示す。
我々は,LLMをより高い信頼スコアに整合させるフレームワークであるTrust-Alignを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:47:33 GMT)
Mind the Uncertainty in Human Disagreement: Evaluating Discrepancies between Model Predictions and Human Responses in VQA [27.0] 本研究は,視覚質問応答(VQA)タスクに焦点をあてる。
視覚言語モデルが人間の反応の分布とどのように相関するかを評価する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 13:44:25 GMT)
SpMis: An Investigation of Synthetic Spoken Misinformation Detection [26.2] 我々は,オープンソースのデータセットであるSpMisを導入して,合成音声誤情報検出の初期研究を行う。
SpMisには、5つの共通トピックにわたる1,000人以上の話者から合成された音声が含まれており、最先端のテキスト音声システムを利用している。
以上の結果から,有望な検出能力を示すとともに,実装上の課題も明らかにした。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:05:09 GMT)
AMEGO: Active Memory from long EGOcentric videos [26.0] 非常に長いエゴセントリックなビデオの理解を深めるための新しいアプローチであるAMEGOを紹介する。
AMEGOは、人間が単一の視聴から情報を維持する能力に触発され、一つの自我中心のビデオから自己完結した表現を構築することに焦点を当てる。
この表現はセマンティックフリーであり、視覚的コンテンツ全体を再処理することなく、複数のクエリを容易にする。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 06:18:47 GMT)
Larger Language Models Don't Care How You Think: Why Chain-of-Thought Prompting Fails in Subjective Tasks [25.6] In-Context Learning (ICL) in Large Language Models (LLM) が自然言語処理の主流の手法として登場した。
ICLはタスク先行の検索に大きく依存しており、タスクを実行するための"学習"は少なくなっている。
驚くべきことに、CoT(Chain-of-Thought)は、大きな言語モデルではICLと同じ後方崩壊に悩まされている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:42:26 GMT)
ULOC: Learning to Localize in Complex Large-Scale Environments with Ultra-Wideband Ranges [25.2] 我々はUWB(Ultra-Wideband)に基づくローカライゼーションのためのULOCという学習ベースのフレームワークを提案する。
まず、アンカーは実際の位置を知ることなく環境に展開される。
そこで我々は,複雑な大規模環境下でUWBの帯域幅パターンを学習するMAMBAに基づくネットワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:20:46 GMT)
Unleashing the Potential of Mamba: Boosting a LiDAR 3D Sparse Detector by Using Cross-Model Knowledge Distillation [22.7] FASDと呼ばれる高速LiDAR3Dオブジェクト検出フレームワークを提案する。
高速シーケンスモデリングのための変換器のキャパシティをFLOPの低いMambaモデルに蒸留し,知識伝達による精度の向上を実現することを目的とする。
我々は,データセットとnuScenesのフレームワークを評価し,リソース消費の4倍の削減と,現在のSoTA手法よりも1-2%の性能向上を実現した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:30:43 GMT)
Towards flexible perception with visual memory [22.6] ニューラルネットワークのトレーニングはモノリシックな取り組みであり、知識を石に彫ることに似ている。
我々は、ディープニューラルネットワークの表現力とデータベースの柔軟性を組み合わせることで、シンプルで魅力的な代替手段を探究する。
私たちは、以下の重要な機能を持つシンプルで柔軟なビジュアルメモリを構築します。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 13:35:04 GMT)
Preference Tuning with Human Feedback on Language, Speech, and Vision Tasks: A Survey [22.5] 優先度調整は、深層生成モデルと人間の嗜好を整合させる重要なプロセスである。
この調査は、最近の嗜好調整の進歩と人間のフィードバックの統合を概観するものである。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 21:28:51 GMT)
AraDiCE: Benchmarks for Dialectal and Cultural Capabilities in LLMs [22.1] 本稿ではアラビア方言と文化評価のベンチマークであるAraDiCEを紹介する。
湾岸地域、エジプト地域、レバント地域の文化意識を評価するために設計された最初のきめ細かいベンチマーク。
本研究で検証した方言翻訳モデルとベンチマークをリリースする。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:59:25 GMT)
Zero-resource Hallucination Detection for Text Generation via Graph-based Contextual Knowledge Triples Modeling [22.1] オープンな回答を持つテキスト生成のための幻覚検出はより困難である。
外部資源のない長いテキストにおける幻覚の検出に関する最近の研究は、一貫性の比較を行っている。
テキスト生成のためのグラフベースの文脈認識(GCA)幻覚検出を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:38:36 GMT)
PSFHS Challenge Report: Pubic Symphysis and Fetal Head Segmentation from Intrapartum Ultrasound Images [21.0] 第26回医用画像コンピューティング・コンピュータ支援介入国際会議(MICCAI 2023)に先立ち、公衆衛生・胎児頭に関するグランドチャレンジ(PSFHS)が開催された。
この課題は、国際規模での自動セグメンテーションアルゴリズムの開発を強化することを目的としており、5,101個のパルタ内超音波画像でこれまでで最大のデータセットを提供する。
このアルゴリズムは、パルタ内超音波画像から自動PSFHSの最先端性を向上した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:24:34 GMT)
GenCRF: Generative Clustering and Reformulation Framework for Enhanced Intent-Driven Information Retrieval [20.8] 我々は,多種多様な意図を適応的に捉えるための生成クラスタリング・改革フレームワークGenCRFを提案する。
我々はGenCRFが,nDCG@10で従来のクエリ修正SOTAを最大12%上回り,最先端のパフォーマンスを実現していることを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 05:59:32 GMT)
Flash STU: Fast Spectral Transform Units [19.9] 本稿では、スペクトル変換ユニットの効率的でオープンソースのPyTorch実装について述べる。
本研究では,言語,ロボット工学,シミュレートされた力学系を含むいくつかのモードにおけるシーケンス予測タスクについて検討する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:01:14 GMT)
RenderWorld: World Model with Self-Supervised 3D Label [19.9] 視覚のみのエンドツーエンド自動運転フレームワークであるRenderWorldを提案する。
自己監督型ガウス型Img2Occモジュールを用いて3次元占有ラベルを生成する。
AM-VAEによってラベルを符号化し、予測と計画に世界モデルを使用する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:00:52 GMT)
Towards No-Code Programming of Cobots: Experiments with Code Synthesis by Large Code Models for Conversational Programming [18.3] LLM(Large Language Models)は、対話型コード生成のためのコンテキスト内学習を行うように設計されている。
本研究は,テキスト中の実例から,このようなコードを合成するための最先端のLLMの性能を評価する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:04:50 GMT)
Surveying the MLLM Landscape: A Meta-Review of Current Surveys [17.4] MLLM(Multimodal Large Language Models)は、人工知能分野における変革の原動力となっている。
本研究の目的は,MLLMのベンチマークテストと評価方法の体系的レビューを提供することである。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:35:38 GMT)
AACessTalk: Fostering Communication between Minimally Verbal Autistic Children and Parents with Contextual Guidance and Card Recommendation [17.3] タブレットベースのAI通信システムであるAACessTalkについて述べる。
MVAの子供と親との有意義な交換を促進する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:16:16 GMT)
Linear Recency Bias During Training Improves Transformers' Fit to Reading Times [16.6] 本稿では,アテンションスコアに付加される電流バイアスであるALiBiを用いたTransformerモデルの変更について検討する。
ALiBiのスロープの混合 -- 各アテンションヘッドのメモリ減衰率を決定する -- は、ALiBiのモデルがさまざまな言語的依存関係を追跡するのを助ける役割を果たす可能性がある。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:57:51 GMT)
Beyond Relevance: Improving User Engagement by Personalization for Short-Video Search [16.5] 我々は,ショートビデオ検索をパーソナライズするための新鮮で包括的なソリューションである$textPR2$を紹介した。
具体的には、$textPR2$はクエリ関連コラボレーティブフィルタリングとパーソナライズされた高密度検索を利用する。
私たちは近年,ユーザエンゲージメントの改善を最も目覚ましいものにしています。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:37:51 GMT)
An Overview of Machine Learning-Enabled Optimization for Reconfigurable Intelligent Surfaces-Aided 6G Networks: From Reinforcement Learning to Large Language Models [16.4] RIS支援6Gネットワークに対する機械学習(ML)対応最適化の概要について述べる。
既存の研究と異なり、大規模言語モデル(LLM)がRLとどのように組み合わせてネットワーク最適化問題に対処できるかをさらに議論する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:57:36 GMT)
Versatile Incremental Learning: Towards Class and Domain-Agnostic Incremental Learning [16.3] インクリメンタルラーニング(IL)は、逐次入力タスクから知識を蓄積することを目的としている。
私たちはVersatile Incremental Learning (VIL) という,より挑戦的で現実的で,未探索のILシナリオを考えています。
Incremental with Shift cONtrol (ICON) という,シンプルで効果的なILフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 07:44:28 GMT)
AI Suggestions Homogenize Writing Toward Western Styles and Diminish Cultural Nuances [16.3] 本稿では,西洋中心のAIモデルが,異なる文化的背景を持つユーザに対して提案書を提示した場合に何が起こるかを検討する。
インドと米国からの参加者118名を対象に、異文化間制御実験を行った。
分析の結果、AIはインド人に比べて、アメリカ人の効率が向上したことがわかった。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:07:30 GMT)
Robust Multimodal Learning with Missing Modalities via Parameter-Efficient Adaptation [16.2] 本稿では,事前学習型マルチモーダルネットワークに対するシンプルでパラメータ効率の良い適応手法を提案する。
このような適応は、モダリティの欠如による性能低下を部分的に補うことができることを示す。
提案手法は,様々なタスクやデータセットにまたがる汎用性を実証し,モダリティの欠如による頑健なマルチモーダル学習法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 04:16:42 GMT)
ExploreSelf: Fostering User-driven Exploration and Reflection on Personal Challenges with Adaptive Guidance by Large Language Models [15.9] We present ExploreSelf, a LLM-driven application designed to empower users to control their reflective journey。
以上の結果から,参加者は指導的支援と行動の自由のバランスに重きを置いていることがわかった。
本研究は, ユーザエンパワーメントを効果的に促進するLCM駆動型ツールの設計の意義を考察する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:44:34 GMT)
NCT-CRC-HE: Not All Histopathological Datasets Are Equally Useful [15.1] 本稿では,NCT-CRC-HE-100Kの大腸癌データセットの解析を行った。
このデータセットと得られた結果の両方が、データ固有のバイアスの影響を受けている可能性がある。
画像あたりの3つの特徴しか使用していない最も単純なモデルでさえ、この9クラスデータセットで50%以上の精度を示すことができる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 20:36:03 GMT)
Can Many-Shot In-Context Learning Help LLMs as Evaluators? A Preliminary Empirical Study [14.9] 大規模言語モデル(LLM)における潜在的なバイアスを軽減するために,評価者を支援するため,多発性ICLプロンプトを2つ検討した。
設計したプロンプトに基づいて,テキスト内サンプルのスケーリングが評価結果の一貫性と品質に与える影響について検討する。
GPT-4oのような高度なLCMは、ゼロショット方式よりも多ショット方式の方が優れていることを示す実験結果が得られた。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:04:27 GMT)
Less is More: A Simple yet Effective Token Reduction Method for Efficient Multi-modal LLMs [14.5] MLLMの効率向上を目的とした新しい手法であるTRIM(CLIP Metric)を導入する。
視覚質問応答(VQA)タスクにおける人間の注意パターンにインスパイアされたTRIMは、画像トークンの選択と縮小について、新たな視点を示す。
その結果,一貫した性能を維持しながら計算オーバーヘッドを著しく低減した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:56:27 GMT)
Integrating Reinforcement Learning and Model Predictive Control with Applications to Microgrids [14.4] 本研究では,強化学習とモデル予測制御(MPC)を統合し,混合力学系における最適制御問題の解法を提案する。
提案手法は, MPC手法のオンライン計算時間を著しく短縮し, 最適性ギャップが小さく, 実現可能性が高いポリシーを生成する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:17:16 GMT)
ShapeAug++: More Realistic Shape Augmentation for Event Data [14.2] ランダムに生成された多角形と曲面運動を含むShapeAugの拡張版を提案する。
複数のDVS分類データセットにおいて,提案手法の優位性を示し,トップ1の精度を最大3.7%向上させた。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 11:05:53 GMT)
BoViLA: Bootstrapping Video-Language Alignment via LLM-Based Self-Questioning and Answering [14.2] 自己調査と回答を通じて,学習中の質問サンプルを増強する自己学習フレームワークであるBoViLAを提案する。
我々は,不確実性を推定し,自己生成質問の品質を評価するために,Evidential Deep Learning (EDL)を導入した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 05:17:37 GMT)
Retinal Vessel Segmentation with Deep Graph and Capsule Reasoning [14.2] 本稿では,CNNにカプセル畳み込みをマージして局所的特徴とグローバル的特徴の両方をキャプチャするGraph Capsule Convolution Network (GCC-UNet)を提案する。
我々のアプローチは広く使われている公開データセットの実験を通じて厳格に検証され、アブレーション研究は各コンポーネントの有効性を確認している。
特に、この研究は、医療画像セグメンテーションの領域におけるバニラ、グラフ、カプセル畳み込み技術の最初の統合である。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:22:29 GMT)
Efficient and Personalized Mobile Health Event Prediction via Small Language Models [14.0] SLM(Small Language Models)は、プライバシーと計算の問題を解決するための候補である。
本稿では、ステップ、カロリー、睡眠時間、その他の重要な統計データなどの健康データを正確に分析する能力について検討する。
以上の結果から,SLMはウェアラブルやモバイルデバイス上でリアルタイムの健康モニタリングに活用できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:57:57 GMT)
OATH: Efficient and Flexible Zero-Knowledge Proofs of End-to-End ML Fairness [14.0] Zero-Knowledge Proofs of Fairnessは、サービスプロバイダが彼らのモデルが多様な人口動態を公平に提供できることを検証することによって、フェアネスの非準拠に対処する。
OATHはクライアント対面通信とオフライン監査フェーズを効果的にデプロイできるフレームワークである。
OATHは、ニューラルネットワークZKPoFの以前の作業よりも、ランタイムを1343倍改善し、はるかに大きなモデルにスケールアップする。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:00:35 GMT)
Investigating Context-Faithfulness in Large Language Models: The Roles of Memory Strength and Evidence Style [14.0] 記憶力とエビデンス提示が外的エビデンスに対するLarge Language Modelsの受容性に及ぼす影響について検討する。
メモリの強度が高い問題では、特に GPT-4 のようなより大きな LLM では LLM は内部メモリに依存しやすい。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 07:44:06 GMT)
Enhancing Low-Resource Language and Instruction Following Capabilities of Audio Language Models [13.9] 本稿では,タイ語を用いた未保存言語における既存の音声言語モデルの性能について検討する。
多言語バックボーン上に構築されているにもかかわらず、音声言語モデルは言語間の創発能力を示すものではない。
本稿では,音声理解と音声指示追従機能を単一統一モデルに統合する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:04:03 GMT)
Entity-Level Sentiment: More than the Sum of Its Parts [13.8] 文レベルでの感情の算術的アグリゲーションとは,エンティティに対する読者の知覚的感情がしばしば異なることを示す。
我々のデータセットは、長いテキストでエンティティ固有の感情の複雑さを明らかにします。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:07:01 GMT)
Watt For What: Rethinking Deep Learning's Energy-Performance Relationship [13.5] 深層学習モデルのモデル精度と消費電力のトレードオフについて検討する。
使用電力単位当たりの精度を評価することにより、より小型でエネルギー効率の高いモデルが研究を著しく高速化できることを示す。
この研究は、より公平な研究環境に寄与し、より小さなエンティティはより大きなエンティティと効果的に競合できる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:30:04 GMT)
Fuse4Seg: Image-Level Fusion Based Multi-Modality Medical Image Segmentation [13.5] 現在の機能レベルの融合戦略は、セマンティックな不整合やミスアライメントを引き起こす傾向がある、と我々は主張する。
画像レベルでの融合に基づく新しい医用画像分割法Fuse4Segを提案する。
得られた融合画像は、すべてのモダリティからの情報を正確にアマルガメートするコヒーレントな表現である。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:35:24 GMT)
An Empirical Study of Sensitive Information in Logs [13.0] ソフトウェアログにおける機密情報の存在は、重大なプライバシー上の懸念を生じさせる。
この研究は、複数の観点からソフトウェアログのプライバシーを包括的に分析する。
当社の調査結果は、ログのプライバシーに関するさまざまな視点に光を当て、業界の課題を明らかにしました。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:12:23 GMT)
MED-VT++: Unifying Multimodal Learning with a Multiscale Encoder-Decoder Video Transformer [12.5] 本稿では,ビデオ中の高密度な予測タスクに着目した,エンドツーエンドのトレーニング可能なマルチスケールエンコーダ・デコーダ変換器を提案する。
提示されたMED-VT(Multiscale-Decoder Video)は、ビデオ全体にわたってマルチスケール表現を使用し、ビデオ以外の任意の入力を使用する。
本稿では,時間的に一貫したビデオ予測を提供するため,多対多のラベル伝搬によるトランスダクティブ学習方式を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:10:16 GMT)
GlobalMapNet: An Online Framework for Vectorized Global HD Map Construction [12.5] 高精細(HD)マップは自律運転システムに不可欠である。
伝統的に、HDマップを構築するために高価で労働集約的なパイプラインが実装されている。
我々はベクトル化されたグローバルマップを直接生成するための新しい手法、すなわちグローバルマップ構築を提供する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 06:46:21 GMT)
A Comprehensive Evaluation of Quantized Instruction-Tuned Large Language Models: An Experimental Analysis up to 405B [11.8] 本稿では、7Bから405Bのモデルにおける命令調整型LLMの性能を評価する。
我々は6つのタスクタイプ(常識Q&A、知識と言語理解、指示追従、幻覚検出、数学、対話)のパフォーマンスを評価する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:31:37 GMT)
CORE-Bench: Fostering the Credibility of Published Research Through a Computational Reproducibility Agent Benchmark [11.8] CORE-Benchは3つの分野(コンピュータ科学、社会科学、医学)にわたる90の科学論文に基づく270のタスクからなるベンチマークである。
エージェントの精度を高速かつ並列に測定する評価システムを提案する。
最高のエージェントは、最も難しいタスクにおいて21%の精度を達成した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:13:19 GMT)
An Anti-disguise Authentication System Using the First Impression of Avatar in Metaverse [11.8] 本稿では,古い友人を認識するために,物理世界から最初の印象のアイデアを導出するアンチディグライズ認証手法を提案する。
具体的には、メタバースの最初のミーティングシナリオを格納し、アバター間の認証を支援するためにリコールする。
提案した署名暗号化機構は、セキュリティ要件だけでなく、公衆の検証可能性にも適合する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:37:44 GMT)
Information That Matters: Exploring Information Needs of People Affected by Algorithmic Decisions [11.4] XAInovice Question Bankは、AI初心者に必要な情報カタログを含むXAI Question Bankの拡張である。
「XAInovice Question Bank」には、雇用予測と健康モニタリングの2つのユースケースにおいて、AI初心者に必要な情報のカタログが含まれている。
我々の研究は、情報ニーズ、目標、課題を強調することで、説明可能性へのAI初心者の関与を支援することを目的としています。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:08:00 GMT)
Trends, Advancements and Challenges in Intelligent Optimization in Satellite Communication [11.4] 本稿では、衛星通信のインテリジェントな最適化分野における現在の研究の概要について述べる。
テキストマイニングに基づく文献レビューを行い,本論文を数学的にクラスタ化し分析した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:01:11 GMT)
Chess Rating Estimation from Moves and Clock Times Using a CNN-LSTM [11.3] 現在の格付けシステムは段階的に格付けを更新し、常にプレイヤーの真の強さを正確に反映するとは限らない。
これを解決するために,ゲームの動きや時計時間から直接プレイヤーの格付けを推定する方法を探索する。
このモデルは、手作りの機能を使わずにチェスのレーティングを推定し、また、各動きのレーティング予測を出力した最初のモデルである。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:19:16 GMT)
Charting the Landscape of Nefarious Uses of Generative Artificial Intelligence for Online Election Interference [11.3] 本稿では,GenAIの悪用を探求し,民主的プロセスの破壊の可能性を明らかにする。
悪質な俳優はこれらの技術を利用して有権者の行動に影響を与え、偽情報を広め、選挙制度に対する大衆の信頼を損なう。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 22:00:36 GMT)
Towards Secure and Usable 3D Assets: A Novel Framework for Automatic Visible Watermarking [11.2] 3Dモデル(特にAI生成モデル)は、エンターテイメントなどさまざまな業界で最近急増している。
我々は、透かしの品質と資産性という2つの競合する側面から、3D視覚的な透かしを自動化するための新しいタスクを厳格に定義する。
そこで本稿では,任意の3D資産上に配置する適切な位置,向き,個数を自動的に決定する透かしを埋め込む手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 21:26:09 GMT)
Multi-Microphone and Multi-Modal Emotion Recognition in Reverberant Environment [11.1] 本稿では,難聴時の感情認識精度を高めるために,マルチモーダル感情認識(MER)システムを提案する。
提案手法は,マルチチャンネル音声処理のための階層型音声変換器(HTS-AT)とビデオ解析のためのR(2+1)D畳み込みニューラルネットワーク(CNN)モデルを組み合わせたものである。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 18:08:56 GMT)
CountChain: A Decentralized Oracle Network for Counting Systems [11.0] システムカウントのための分散型オラクルネットワークであるCountChainを提案する。
CountChainでは、データはすべてのオラクルノードから受信され、任意のノードが命題要求を送信できる。
Trueの結果による提案は、スマートコントラクトでカウンタをインクリメントする。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 22:52:44 GMT)
Towards Semantic Versioning of Open Pre-trained Language Model Releases on Hugging Face [11.0] モデルレジストリプラットフォームにおけるPTLMの現在のリリースプラクティスは、さまざまな不整合に悩まされています。
本研究は,52,227個のPTLMを,最もよく知られたモデルレジストリHF上でリリースするための混合手法を用いて解析する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 21:58:36 GMT)
Chiral Bell-state transfer via dissipative Liouvillian dynamics [10.7] 例外点近傍の閉ループに沿ったキラル状態移動は、非エルミート物理学における多くの反直観的な観測の1つである。
完全量子リウィリア動力学による一重項と三重項ベル状態のキラル状態変換を実証する。
ポストセレクションによる量子ジャンプの除去は、当初分離可能な状態からベル状態にほぼ完全であることを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:46:16 GMT)
SOAP: Improving and Stabilizing Shampoo using Adam [10.6] この研究はシャンプーとアダファクトの間の公式な関係を確立している。
AdafactorはAdamのメモリ効率の近似である。
シャンプーのプレコンディショナーの固有ベイズにおいて,シャンプーがAdafactorを実行することと等価であることを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:18:05 GMT)
D2Vformer: A Flexible Time Series Prediction Model Based on Time Position Embedding [10.5] 時間位置埋め込みは時間ステップの位置情報をキャプチャし、しばしば時系列モデルの予測能力を高める補助的な入力として機能する。
本稿では,予測シーケンスが入力シーケンスに隣接しないシナリオを扱うために,D2Vformerと呼ばれる新しいモデルを提案する。
D2Vformerは、固定長および可変長の予測タスクにおいて最先端のメソッドを超越する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:39:37 GMT)
A Joint Spectro-Temporal Relational Thinking Based Acoustic Modeling Framework [10.4] リレーショナル思考は人間の音声理解において重要な役割を担っているが、人工音声認識システムではまだ活用されていない。
本稿では,スペクトル時間的関係思考に基づく音響モデリングフレームワークを提案する。
このフレームワーク上に構築されたモデルは、TIMITデータセットよりも7.82%の音素認識タスクを改善した最先端システムを上回っている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 05:45:33 GMT)
Towards Optimal Branching of Linear and Semidefinite Relaxations for Neural Network Robustness Certification [10.3] 本研究では,ReLUニューラルネットワークの逆入力摂動に対する堅牢性を検証する。
入力不確実性集合を分割し,各部分の緩和を個別に解くために,分岐とバウンドのアプローチをとる。
提案手法は緩和誤差を低減し,ReLUアクティベーションの性質を活かしたパーティションを用いてLP緩和を行うことによって完全に誤差を除去することを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:15:57 GMT)
Learning-Augmented Frequency Estimation in Sliding Windows [10.3] 我々は、スライディングウインドウアルゴリズムを改善するために機械学習アプローチを利用する方法を示す。
我々の研究は、予測器が難易度の高いスライディングウインドウ設定に有用であることを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:38:48 GMT)
GoSurf: Identifying Software Supply Chain Attack Vectors in Go [9.9] 本稿では,Go言語に適した12個の異なる攻撃ベクトルの分類法とそのパッケージライフサイクルを提案する。
私たちの研究は、Goエコシステム内のオープンソースのソフトウェアサプライチェーンを確保するための予備的な洞察を提供します。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:18:14 GMT)
Vision Mamba for Classification of Breast Ultrasound Images [9.9] MambaベースのモデルであるVMambaとVimは、最近のビジョンエンコーダのファミリーであり、多くのコンピュータビジョンタスクで有望なパフォーマンス改善を提供する。
本稿では,乳房超音波BUSIデータセットと乳房超音波Bデータセットを用いて,マンバモデルと従来の畳み込みニューラルネットワーク(CNN)と視覚変換器(ViT)を比較した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 04:37:16 GMT)
Concentration of Contractive Stochastic Approximation: Additive and Multiplicative Noise [9.8] 我々は,契約演算子の下で近似(SA)によって生成される反復体に対して最大濃度境界を確立する。
本稿では,有界乗法雑音を持つ SA と準ガウス加法雑音を持つ SA の2つの条件について考察する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:23:33 GMT)
Online Combinatorial Allocations and Auctions with Few Samples [9.7] 本稿では,O(1)競合アルゴリズムの実現可能性について,基礎となる入札者分布から限られた数のサンプルにしかアクセスできないという現実的な制約の下で検討する。
最初の主な貢献は, サブモジュール/XOS評価のためのO(1)競合アルゴリズムを得るのに, 各入札者分布からのサンプルだけで十分であることを示している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 11:43:55 GMT)
When Cars meet Drones: Hyperbolic Federated Learning for Source-Free Domain Adaptation in Adverse Weather [9.7] フェデレートラーニング(FL)では、複数のクライアントがプライベートデータを共有せずにグローバルモデルを共同でトレーニングする。
我々は、車とドローンの両方のクライアントが共存し協力する、新しいフェデレーションセマンティックセマンティックセグメンテーション・セグメンテーション・セグメンテーション・セッティングを導入する。
具体的には、バッチノーム気象対応戦略を利用して、異なる気象条件にモデルを動的に適応させる新しい手法を提案する。
最後に,航空車両の悪天候データを用いた最初のセマンティックセグメンテーションデータセットであるFLYAWAREを紹介する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:18:50 GMT)
Self-Evolutionary Large Language Models through Uncertainty-Enhanced Preference Optimization [9.6] 反復的選好最適化は、最近、大規模言語モデル(LLM)のデファクトトレーニングパラダイムの1つになっている。
我々は、信頼性の高いフィードバックでLLMを自己進化させる不確実性のあるtextbfPreference textbfOptimizationフレームワークを提案する。
筆者らのフレームワークは,ノイズ問題を大幅に軽減し,反復的選好最適化の性能を向上させる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:05:58 GMT)
Preventing Representational Rank Collapse in MPNNs by Splitting the Computational Graph [9.5] 複数の有向非巡回グラフ上での操作が常に我々の条件を満たすことを示し、ノードの厳密な部分順序付けを定義することによってそれらを得る提案をする。
我々は、より情報的なノード表現を実現するために、マルチリレーショナルグラフ上での操作の利点を確認する包括的な実験を行う。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:16:03 GMT)
Schrodinger's Memory: Large Language Models [9.5] 記憶はすべての人間の活動の基礎である。
LLM(Large Language Models)の開発に伴い、言語能力は人間に匹敵するものになりつつある。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:10:49 GMT)
CoT Rerailer: Enhancing the Reliability of Large Language Models in Complex Reasoning Tasks through Error Detection and Correction [9.4] CoT(Chain-of-Thought)により、LLM(Large Language Models)の複雑な推論能力が向上する。
我々は,これらの課題に対処するために,自己整合性とマルチエージェントの議論システムを用いたCoTリレーラを提案する。
様々な知識領域における多様な質問応答データセットにまたがるアプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 22:19:17 GMT)
Improving LLM Reasoning with Multi-Agent Tree-of-Thought Validator Agent [9.4] Tree of Thoughts (ToT) 法は複雑な質問応答タスクの推論を改善する可能性を示している。
マルチエージェント推論における重要な制限は、'Reasoner'エージェントによる推論経路の浅い探索である。
ToTをベースとしたReasonerエージェントとThought Validatorエージェントを組み合わせた新しいアプローチを提案する。
提案手法は,GSM8Kデータセットを用いた場合,既存の手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:54:37 GMT)
Navigating High-Degree Heterogeneity: Federated Learning in Aerial and Space Networks [8.8] フェデレーション学習は、空と宇宙のネットワークにおけるネットワークとデータプライバシの課題に対して、魅力的なソリューションを提供する。
本稿では,ASNsに基づくフェデレーション学習の性能を低下させるクラス不均衡に対する不均一性の影響について検討する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:14:33 GMT)
Quantum optical coherence theory based on Feynman's path integral [8.7] 本稿では、ファインマンの経路積分に基づく量子光コヒーレンス理論を紹介し、レビューする。
2つの独立した光の過渡的な1次干渉の結果から、熱光の電界の古典的モデルが正確でない可能性があると予測されている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:04:12 GMT)
Super-dephasing in Collective Atom-Atom Interactions Mediated by Near-Field Electromagnetic Fluctuations [8.6] 材料近傍のフォトニック環境で発生するナノ・EMスーパーデフォーカス現象について紹介する。
オフ共鳴・低周波EMゆらぎの長距離相関は、多体交絡状態における集合的加速(super-)または抑制(sub-)減退(sub-)を誘導する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 06:44:51 GMT)
Image Hijacks: Adversarial Images can Control Generative Models at Runtime [8.6] 推論時に視覚言語モデルの振る舞いを制御する画像ハイジャック, 逆画像を検出する。
Prompt Matching法を考案し、任意のユーザ定義テキストプロンプトの動作にマッチしたハイジャックをトレーニングする。
我々は、Behaviour Matchingを使って、4種類の攻撃に対してハイジャックを作らせ、VLMは敵の選択の出力を生成し、コンテキストウィンドウから情報をリークし、安全トレーニングをオーバーライドし、偽の声明を信じるように強制する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:56:09 GMT)
Towards Gaussian Process for operator learning: an uncertainty aware resolution independent operator learning algorithm for computational mechanics [8.5] 本稿では、パラメトリック微分方程式を解くための新しいガウス過程(GP)に基づくニューラル演算子を提案する。
ニューラル演算子を用いて学習した潜在空間でGPカーネルを定式化するニューラル演算子埋め込みカーネル'を提案する。
本研究は, 不確実性評価におけるロバスト性を維持しつつ, 複雑なPDEを解く上で, この枠組みの有効性を強調した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:12:38 GMT)
Diversify and Conquer: Diversity-Centric Data Selection with Iterative Refinement [8.5] 命令データ上での大規模言語モデルの微調整は、事前訓練された知識の強化と命令追従能力の向上に不可欠である。
この作業は問題に対処する: 効果的なトレーニングのために、データの最適なサブセットをどうやって決定できるのか?
提案手法では,k平均クラスタリングを用いて,選択したサブセットが全データセットを効果的に表現できるようにする。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:25:31 GMT)
JARViS: Detecting Actions in Video Using Unified Actor-Scene Context Relation Modeling [8.5] 2段階ビデオローカライゼーション(英語: Two-stage Video Localization, VAD)は、ビデオクリップの空間的および時間的次元内のアクションの局所化と分類を含む、強迫的なタスクである。
JARViS(Joint Actor-scene context Relation Modeling)と呼ばれる2段階のVADフレームワークを提案する。
JARViSは、トランスフォーマーアテンションを用いて、空間的および時間的次元にわたって世界中に分布するクロスモーダルアクションセマンティクスを集約する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 06:25:38 GMT)
Prompt Obfuscation for Large Language Models [8.4] 本研究では,従来のシステムプロンプトの代替案を提案する。
システムプロンプトの抽出を防止するために,プロンプト難読化を導入する。
提案手法は,知的財産権の保護に有効な手法でありながら,本来のシステムプロンプトと同じ実用性を維持しつつも有効であることを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:43:29 GMT)
Discrete Unit based Masking for Improving Disentanglement in Voice Conversion [8.3] 話者符号化前の入力に新しいマスキング機構を導入し,音素クラスと高い対応性を持つ特定の個別音声単位をマスキングする。
提案手法は,複数のVC手法間の絡み合いと変換性能を44%向上させ,客観的インテリジェンスを相対的に向上させる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 21:17:59 GMT)
Learning a Terrain- and Robot-Aware Dynamics Model for Autonomous Mobile Robot Navigation [8.3] 本稿では,確率的,地形的,ロボット対応のフォワードダイナミクスモデル(TRADYN)を学習するための新しいアプローチを提案する。
本研究では, 空間的に異なる摩擦係数を持つ地形特性を持つ一サイクル動的ロボットの2次元ナビゲーションシミュレーションにおいて, 提案手法の評価を行った。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:46:39 GMT)
VGG-Tex: A Vivid Geometry-Guided Facial Texture Estimation Model for High Fidelity Monocular 3D Face Reconstruction [8.2] VGG-Texは、高忠実度モノクロ3D顔再構成用に設計された新しいモデルである。
このアプローチの核心は、二次元紫外線テクスチャ推定の結果を高めるために、3Dパラメトリック先行値を活用することである。
本手法はテクスチャ再構築性能を既存の最先端手法と比較して大幅に向上させる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:00:50 GMT)
Golden Ratio Search: A Low-Power Adversarial Attack for Deep Learning based Modulation Classification [8.2] 深層学習に基づく自動変調分類(AMC)のための最小パワー・ホワイトボックス対向攻撃を提案する。
提案手法の有効性を,既存の攻撃手法との比較により評価した。
実験の結果、提案した攻撃は強力で、最小限の電力を必要とし、より少ない時間で発生可能であることが示された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:17:54 GMT)
Several families of entanglement criteria for multipartite quantum systems based on generalized Wigner-Yanase skew information and variance [7.9] 本稿では,多部量子状態や高次元量子状態における絡み合いを検出するための絡み合い基準のいくつかのファミリを提案する。
絡み合い基準の組み合わせは、より強力な検出能力を有することを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:24:48 GMT)
Quantifying nonclassical correlation via the generalized Wigner-Yanase skew information [7.9] 我々は、重要な特性を持つ情報の族、すなわち一般化されたウィグナー・ヤネーゼスキュー情報の概念を導入する。
両部量子状態の非古典的相関を定量化するための2つの異なる指標形式を提案する。
これらの2種類の指標は、両分極純状態の絡み合いを減少させる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 13:54:20 GMT)
SEDMamba: Enhancing Selective State Space Modelling with Bottleneck Mechanism and Fine-to-Coarse Temporal Fusion for Efficient Error Detection in Robot-Assisted Surgery [7.9] 選択的状態空間モデル(SSM)を外科的誤り検出に組み込んだSEDMambaという新しい階層モデルを提案する。
SEDMambaは、長期ビデオにおける外科的エラーの検出と時間的局所化のために、ボトルネック機構と微細から粗い時間的融合(FCTF)を備えた選択的SSMを強化する。
我々の研究は、実際の手術症例におけるエラー検出を支援するために、第一種、フレームレベル、生存中の外科的エラーデータセットにも貢献する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 23:32:57 GMT)
RoMath: A Mathematical Reasoning Benchmark in Romanian [7.8] 本稿では、3つのデータセットからなるルーマニアの数学的推論ベンチマークスイートであるRoMathを紹介する。
独特な言語特徴を持つ低リソース言語であるルーマニア語に焦点を当てることで、RoMathはアングロ中心モデルの限界に対処する。
いくつかのオープンウェイト言語モデルをベンチマークし、表現不足言語のためのリソースを作成することの重要性を強調した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 11:03:46 GMT)
GEIC: Universal and Multilingual Named Entity Recognition with Large Language Models [7.7] ジェネレーションベース抽出とテキスト内分類(GEIC)の課題について紹介する。
次に,多言語GEICフレームワークであるCascadeNERを提案する。
我々はまた、Large Language Models(LLMs)用に特別に設計された最初のNERデータセットであるAnythingNERを紹介します。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:32:12 GMT)
GINTRIP: Interpretable Temporal Graph Regression using Information bottleneck and Prototype-based method [7.6] 本稿では,時間グラフ回帰モデルの解釈可能性を高める新しい手法を提案する。
IB原則の適用性をグラフ回帰タスクに拡張する、相互情報(MI)に基づく新たな理論的境界を導出する。
本モデルは実世界のトラフィックデータセットに基づいて評価され,予測精度と解釈可能性関連指標の両方において既存手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:58:40 GMT)
SynthSOD: Developing an Heterogeneous Dataset for Orchestra Music Source Separation [7.4] そこで本研究では,シミュレーション手法を用いて現実的なトレーニングセットを作成する,SynthSODと呼ばれる新しいマルチトラックデータセットを提案する。
合成データセットw.r.tをトレーニングしたベースライン音楽分離モデルのよく知られたEnsembleSetへの適用を実演する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:58:33 GMT)
Implicit Reasoning in Deep Time Series Forecasting [7.4] この研究は、ディープ時系列予測モデルの推論能力を評価するための最初の一歩を踏み出した。
系統的に編成されたアウト・オブ・ディストリビューションシナリオにおいて,ある線形なパッチベーストランスフォーマーモデルが効果的に一般化できることが判明した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:11:19 GMT)
Ultrasound Image Enhancement with the Variance of Diffusion Models [7.4] 超音波画像の強調にはコントラスト、解像度、スペックル保存の微妙なバランスが必要である。
本稿では,適応ビームフォーミングと拡散型分散イメージングを併用した新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:29:33 GMT)
A Deep Learning Approach for User-Centric Clustering in Cell-Free Massive MIMO Systems [7.2] ユーザクラスタリング問題を解決するために,ディープラーニングに基づくソリューションを提案する。
提案手法は,ユーザ数に応じて効果的に拡張可能であり,長期のメモリセルを再トレーニングを必要とせずに動作させることができる。
その結果,パイロット汚染による不完全なチャネル状態情報が存在する場合でも,提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:12:54 GMT)
Integrating Knowledge Retrieval and Large Language Models for Clinical Report Correction [7.1] 本研究では,大規模言語モデル (LLM) と検索拡張生成技術 (RAG) を利用した放射線学報告における誤り訂正手法を提案する。
提案フレームワークは,新たな内外的検索機構を用いて,関心事報告と外部知識ソースから関連する医療機関と関係を抽出する。
アプローチの有効性は、ドメインの専門家がガイドした現実的なエラーで実世界の放射線学レポートを破損させたベンチマークデータセットを用いて評価される。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 18:57:49 GMT)
Balancing Optimality and Diversity: Human-Centered Decision Making through Generative Curation [7.0] 本稿では,量的・質的両面を統合することにより,決定オプションの真の望ましさを最適化する生成キュレーションという新しい枠組みを導入する。
提案手法は,多種多様な準最適動作を効率的にサンプリングするための分配$pi$を生成する生成ニューラルネットワークアーキテクチャと,反復的に解を生成する逐次最適化手法である。
提案手法を広範囲なデータセットで検証し,複雑な環境にまたがる意思決定プロセスの強化の有効性を実証する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 20:13:32 GMT)
Optimizing TinyML: The Impact of Reduced Data Acquisition Rates for Time Series Classification on Microcontrollers [7.0] 本稿では,時系列分類におけるデータ取得率の低減がTinyMLモデルに与える影響について検討する。
データサンプリング頻度を下げることで、RAM使用量、エネルギー消費、レイテンシ、MAC操作を約4倍に削減することを目指している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 07:21:49 GMT)
Unveiling the Flaws: A Critical Analysis of Initialization Effect on Time Series Anomaly Detection [6.9] 時系列異常検出(TSAD)のための深層学習は,過去10年間で大きな注目を集めている。
近年の研究はこれらのモデルに疑問を呈し、その成果は欠陥評価技術に寄与している。
本稿では,TSADモデルの性能に対する影響を批判的に分析する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:14:40 GMT)
KVPruner: Structural Pruning for Faster and Memory-Efficient Large Language Models [6.9] 性能を維持しながらモデル効率を向上させるため,KVPrunerを提案する。
オリジナルのモデルと比較して、KVPrunerはランタイムメモリ使用量を50%削減し、スループットを35%以上向上させた。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:35:30 GMT)
Machine Learning Applications of Quantum Computing: A Review [6.6] このレビューでは、高度なデータ処理とアプリケーションに焦点を当てた、量子コンピューティングと機械学習の相互作用について論じている。
主にサイバーセキュリティにおける量子コンピューティングの重要性の増大に焦点を当てている。
このレビューは、量子化された機械学習アルゴリズムの進歩とサイバーセキュリティなどの分野における潜在的な応用を強調している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:04:45 GMT)
An Asymptotically Optimal Coordinate Descent Algorithm for Learning Bayesian Networks from Gaussian Models [6.5] 線形ガウス構造方程式モデルに基づいて連続観測データからネットワークを学習する問題について検討する。
本稿では,$ell$penalized max chanceの最適目標値に収束する新しい座標降下アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 18:14:39 GMT)
Decentralized Biometric Authentication based on Fuzzy Commitments and Blockchain [6.5] 本稿では,ブロックチェーンベースのバイオメトリック認証プロトコルを提案する。プライバシや個人情報,特にユーザの生体特性を保護しながら,分散化とレジリエンスを実現する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:58:06 GMT)
Survey of Data-driven Newsvendor: Unified Analysis and Spectrum of Achievable Regrets [6.4] Newsvendor の問題では、ある分布から引き出される数を推測することが目的である。
データ駆動バージョンでは、分散は未知であり、分散からのサンプルを扱う必要がある。
本稿では、これらの変種の組み合わせをすべて研究し、文献の多くのギャップを埋め、多くの証明を単純化する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:31:04 GMT)
Jailbreaking Large Language Models with Symbolic Mathematics [6.3] AI安全性の最近の進歩は、安全でないコンテンツ生成を緩和するために、大規模な言語モデル(LLM)のトレーニングと再チームの強化につながっている。
本稿では, シンボル数学におけるLLMの高度な能力を利用して, 安全機構を回避した新しいジェイルブレイク手法であるMathPromptを紹介する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 03:39:45 GMT)
Generating Synthetic Free-text Medical Records with Low Re-identification Risk using Masked Language Modeling [6.2] Masked Language Modeling (MLM) を用いた合成自由テキスト医療記録を生成するシステムを提案する。
本システムは,重要な多様性を導入し,再識別リスクを最小限に抑えつつ,記録の重要な情報を保存するように設計されている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 11:18:37 GMT)
On the generalization ability of coarse-grained molecular dynamics models for non-equilibrium processes [6.2] 非平衡過程に対するある種の一般化能力を保ったCGMDモデルを構築するためのデータ駆動型アプローチを提案する。
予備選択されたCG変数に基づく従来のCGモデルとは異なり、現在のCGモデルは補助的なCG変数の集合を求める。
これにより、広い範囲の非平衡条件下での未解決変数の分布が、平衡条件下での変数に近づくことが保証される。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:42:50 GMT)
Latent mixed-effect models for high-dimensional longitudinal data [6.1] LMM-VAEは,長手データに対するスケーラブルで解釈可能で識別可能なモデルである。
我々は,GPに基づく手法と理論的な関係を強調し,この手法の統一的な枠組みを提供する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:16:38 GMT)
Accelerating Point Cloud Ground Segmentation: From Mechanical to Solid-State Lidars [6.1] まず、点ベース、グリッドベース、範囲画像ベースグラウンドセグメンテーションアルゴリズムをベンチマークする。
以上の結果から,レンジ画像に基づく手法は優れた性能とロバスト性をもたらすことが示唆された。
提案したアルゴリズムをFPGA上で実装することにより,処理速度と資源使用量のスケーラビリティが大幅に向上したことを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 18:23:16 GMT)
Improving the Efficiency of Visually Augmented Language Models [5.9] 本稿では,LMを視覚的に拡張するために明示的な画像は必要ないことを示す。
代わりに、よく知られたCLIPマルチモーダルシステムから得られる視覚的なテキスト表現を使用する。
BLIND-VALMは、VALM for Visual Language Understanding (VLU)、Natural Language Understanding (NLU)、Language Modelingタスクと同等に動作することを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 13:02:19 GMT)
Enriching Datasets with Demographics through Large Language Models: What's in a Name? [5.9] LLM(Large Language Models)は、特殊なデータに基づいてトレーニングされた振る舞いモデルだけでなく、パフォーマンスも向上する。
香港の認可された金融専門家の実際のデータセットを含む、さまざまなデータセットにこれらのLCMを適用します。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 18:40:49 GMT)
Large Language Models are Good Multi-lingual Learners : When LLMs Meet Cross-lingual Prompts [5.5] 本稿では,MLプロンプトという新しいプロンプト戦略を提案する。
MLPromptは、LLMが他の言語に追従するのに苦労するエラーを起こしやすいルールを翻訳する。
本稿では,MLPromptを構造化データ生成の自動チェック機構に統合するフレームワークと,テキストからMIPインスタンスへの特定のケーススタディを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:33:27 GMT)
State Machine Mutation-based Testing Framework for Wireless Communication Protocols [5.5] 本稿では,プロトコルステートマシンであるProteusを提案する。
Proteusは、有意義なだけでなく、望ましい性質に違反する確率の高いテストケースを生成することで、その予算意識を維持している。
影響を受けたベンダーは、5つのCVEを通じて14の脆弱性を認めている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:12:03 GMT)
Estimating the history of a random recursive tree [5.4] ヨルダン中心度尺度に基づく順序推定器を提案する。
提案した推定器が次数ベースおよびスペクトル順序付け法より優れていることを数値的に示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:47:27 GMT)
Unsupervised Hybrid framework for ANomaly Detection (HAND) -- applied to Screening Mammogram [5.4] マンモグラムスクリーニングに使用されるAIモデルの一般化を促進するためには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
我々は,大規模デジタル検診マンモグラムからOODを検出する新しいバックボーン,HANDを開発した。
Hand Pipelineは、外部スクリーニングマンモグラムにおけるドメイン固有の品質チェックのための、自動化された効率的な計算ソリューションを提供する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 20:12:50 GMT)
PREVENT: An Unsupervised Approach to Predict Software Failures in Production [5.2] PreVENTは、教師なしのテクニックを組み合わせることで、分散エンタープライズアプリケーションの障害を予測し、ローカライズするためのアプローチである。
その結果、PreVENTは、長く、しばしば失敗を伴う非現実的なトレーニングを必要とせず、教師付き学習アプローチよりも早い段階で、より安定的で信頼性の高い予測を提供することがわかった。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:02:28 GMT)
TSELM: Target Speaker Extraction using Discrete Tokens and Language Models [5.2] TSELMは、離散トークンと言語モデルを活用する新しいターゲット話者抽出ネットワークである。
我々は,TSELMが音声品質の優れた結果と,音声の可聴性に匹敵する結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:41:32 GMT)
MonoCoder: Domain-Specific Code Language Model for HPC Codes and Tasks [5.1] ソフトウェア開発におけるAIのトレンドは、様々なプログラミングタスクに対処する大規模言語モデル(LLM)を開発することである。
ハイパフォーマンスコンピューティング(HPC)領域のタスクに適用されるLLMでさえ、巨大なサイズであり、トレーニングに高価な計算リソースを必要とする。
これは、HPCタスク用のLLMが、いくつかの自然および/またはプログラミング言語をサポートする既存のLLMを微調整することによって得られるためである。
既存のLMよりも桁違いに小さいが,非HPCおよびHPCコードでは性能が向上するMonoCoderという,HPC固有のLMを構築している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:29:03 GMT)
Motion-Guided Dual-Camera Tracker for Endoscope Tracking and Motion Analysis in a Mechanical Gastric Simulator [5.1] 運動誘導型デュアルカメラ・ビジョン・トラッカーは内視鏡先端の3次元位置の頑健かつ正確な追跡を実現するために提案される。
提案したトラッカーは、最先端のビジョントラッカーに対して優れた性能を示し、平均誤差と最大誤差において、第2ベット法に対して42%と72%の改善を達成している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:53:42 GMT)
Synthetic data augmentation for robotic mobility aids to support blind and low vision people [5.0] 視覚障害者のためのロボットモビリティ支援(BLV)は、深層学習に基づく視覚モデルに大きく依存している。
これらのモデルの性能は、実世界のデータセットの可用性と多様性によって制約されることが多い。
本研究では,Unreal Engine 4を用いて生成した合成データの有効性について検討した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 13:17:28 GMT)
VALO: A Versatile Anytime Framework for LiDAR-based Object Detection Deep Neural Networks [5.0] 本研究は,LDARオブジェクト検出ディープニューラルネットワーク(DNN)における動的期限条件の適用という課題に対処する。
VALO(Versatile Anytime Algorithm for LiDAR Object Detection)は3次元LiDARオブジェクト検出DNNの任意の時間計算を可能にする新しいデータ中心のアプローチである。
本研究では,最先端の3次元LiDARオブジェクト検出ネットワーク,すなわちCenterPointとVoxelNextにVALOを実装し,その動的適応性を広範囲の時間制約に適用できることを実証する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 20:30:35 GMT)
A Unified Framework to Classify Business Activities into International Standard Industrial Classification through Large Language Models for Circular Economy [4.5] 本稿では,Large Language Models(LLMs)を利用して,経済活動に関するテキストデータを国際標準産業分類(ISIC)に分類する。
提案手法は, GPT-2モデルを微調整した182ラベルテストデータセットに対して95%の精度で達成する。
この研究は、持続可能な循環経済の実践を促進するグローバルな取り組みに寄与する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 05:30:08 GMT)
Wave-U-Mamba: An End-To-End Framework For High-Quality And Efficient Speech Super Resolution [4.5] SSR(Speech Super-Resolution)は、高周波数成分の欠如を回復させることにより低分解能音声信号を強化するタスクである。
従来の手法では、通常、対数メルの特徴を再構成し、次いで波形領域で高分解能な音声を生成するボコーダが続く。
本稿では,SSRを時間領域で直接実行するWave-U-Mambaという手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:33:57 GMT)
Perceptions of Edinburgh: Capturing Neighbourhood Characteristics by Clustering Geoparsed Local News [4.4] 地域ニュース記事を用いて近隣住民を特徴付ける手法を提案する。
具体的には、NLP(Natural Language Processing)を用いて、近隣地域に関するさらなる情報をアンロックする方法を示す。
私たちの仕事は、地域に合わせて調整された街路レベルのジオパーシングと、完全なニュース記事のクラスタリングを組み合わせることで、新しくなっています。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:17:57 GMT)
Towards Goal-oriented Prompt Engineering for Large Language Models: A Survey [4.4] 大規模言語モデル(LLM)は、様々な下流タスクで顕著なパフォーマンスを示している。
本稿では,人為的仮定に基づく設計プロンプトの限界を明らかにすることを目的とする。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 04:56:03 GMT)
Unsupervised End-to-End Training with a Self-Defined Target [4.3] 本稿では,エンドツーエンドの教師あり学習用に設計されたネットワークやハードウェアが,高性能な教師なし学習を実現する方法を提案する。
我々はこの手法を半教師付き学習に拡張し、データ型に基づいて目標を調整し、600のラベル付きMNISTサンプルを多層パーセプトロンで96.6%の精度で検出する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:44:32 GMT)
The Invalsi Benchmarks: measuring Linguistic and Mathematical understanding of Large Language Models in Italian [4.3] Invalsi MATE to evaluate model performance on mathematical understanding in Italian, Invalsi ITA to evaluate language understanding in Italian and Olimpiadi MATE for more complex mathematical understanding。
Invasli MATEでは,Llama 3.1 70bインストラクションで,Invalsi ITAでは88%の精度で,10の強力な言語モデルを評価した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:27:07 GMT)
Uncertainty and Prediction Quality Estimation for Semantic Segmentation via Graph Neural Networks [4.3] グラフニューラルネットワーク(GNN)を用いて、あるセグメントの品質との関係を、あるセグメントのメトリクスの関数としてモデル化する。
異なるGNNアーキテクチャを比較し、顕著なパフォーマンス改善を実現しています。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:20:21 GMT)
CodePori: Large-Scale System for Autonomous Software Development Using Multi-Agent Technology [4.3] 大規模言語モデル(LLM)とGPT(Generative Pre-trained Transformer)は、ソフトウェア工学の分野を変えました。
我々は,大規模かつ複雑なソフトウェアプロジェクトのコード生成を自動化するように設計された,新しいシステムであるCodePoriを紹介する。
結果: CodePoriは、典型的なソフトウェア開発プロセスに合わせて、大規模プロジェクトの実行コードを生成することができる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:57:06 GMT)
WER We Stand: Benchmarking Urdu ASR Models [3.7] 本稿では,Urdu Automatic Speech Recognition(ASR)モデルの総合評価を行う。
単語誤り率(WER)を用いた3種類のASRモデル(Whisper, MMS, Seamless-M4T)の性能解析を行った。
読み上げ音声データセットでは、スムーズな広さが他のASRモデルより優れているのに対し、ささやきの広さは会話音声データセットでは最高であることがわかった。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:00:31 GMT)
Bridging Social Media and Search Engines: Dredge Words and the Detection of Unreliable Domains [3.7] 我々はWebグラフとソーシャルメディアのコンテキストを統合したWebサイト信頼性分類・発見システムを開発した。
本稿では,信頼できないドメインが検索エンジン上で高いランクを付けるような単語,用語,フレーズの概念を紹介する。
私たちは、ソーシャルメディアとオンラインコマースプラットフォームとの強いつながりを強調した、ドレッジワードの新たなデータセットをリリースしました。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:20:53 GMT)
Shaking the Fake: Detecting Deepfake Videos in Real Time via Active Probes [3.6] 生成AIの一種であるリアルタイムディープフェイク(Real-time Deepfake)は、ビデオ内の既存のコンテンツ(例えば、顔を別のものと交換する)を「生成する」ことができる。
金融詐欺や政治的誤報など、悪意ある目的のためにディープフェイクビデオを作るのに誤用されている。
本研究では,物理干渉に適応できないディープフェイクモデルを利用した新しいリアルタイムディープフェイク検出手法であるSFakeを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 04:58:30 GMT)
TopoMaskV2: Enhanced Instance-Mask-Based Formulation for the Road Topology Problem [3.6] TopoMaskは、センターライン予測を強化する新しいアプローチである。
本稿では,フロー情報を用いたマスクインスタンスの強化を目的とした,クワッド指向ラベル表現を提案する。
TopoMaskはOpenLane-V2データセットで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:22:38 GMT)
Rank Collapse Causes Over-Smoothing and Over-Correlation in Graph Neural Networks [3.6] 深さが大きくなると、ノード表現はアグリゲーション関数に依存するが特徴変換には依存しない低次元部分空間に支配されることが示される。
すべてのアグリゲーション関数について、ノード表現のランクは崩壊し、特定のアグリゲーション関数に対して過度に滑らかになる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:19:17 GMT)
Control-flow Reconstruction Attacks on Business Process Models [3.6] この研究は、プロセスモデルに基づいて、このような再構築の試みを経験的に調査した最初のものである。
本稿では,プロセスツリーからの制御フローを再構築する様々なプレイアウト戦略を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:42:55 GMT)
Challenging Fairness: A Comprehensive Exploration of Bias in LLM-Based Recommendations [3.5] 大言語モデル(LLM)ベースのレコメンデーションシステムは、従来のシステムよりも包括的なレコメンデーションを提供する。
これらのシステムは、しばしばバイアスを示し、主流のコンテンツを好む一方で、歪んだトレーニングデータのために非伝統的な選択肢を疎外する。
本研究では,LLMに基づくレコメンデーションシステムとバイアスの関係について検討した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:37:57 GMT)
The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives [3.5] 本稿では,ジェネレーティブ・人工知能(GenAI)を利用した子ども向けのストーリーテリングを支援する教育ツールのコンセプトを紹介する。
このシステムは、GenAIによる物語の共創、テキストから音声への変換、およびテキストからビデオへの生成を組み合わせることで、学習者にとって魅力的な体験を生み出す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:10:23 GMT)
Do Language Models Exhibit Human-like Structural Priming Effects? [3.4] 本稿では,言語モデル予測に影響を与える言語要因について検討する。
我々は、構造的プライミングのパラダイムを利用し、最近の構造への露出は、同じ構造の処理を容易にする。
これらの効果は、人間のプライミングで知られている逆周波数効果によって説明でき、プライミング効果はプライミング効果を増大させる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:17:36 GMT)
Testing GPT-4 with Wolfram Alpha and Code Interpreter plug-ins on math and science problems [3.4] GPT-4は、高校と大学レベルで、科学と数学の105のオリジナルの問題でテストされた。
以上の結果から,プラグインはGPTの問題解決能力を大幅に向上させる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 20:04:51 GMT)
An Examination of the Alleged Privacy Threats of Confidence-Ranked Reconstruction of Census Microdata [3.2] 提案手法は, 著者が主張する情報開示に有効でないことを示す。
提案するランキングが再確認や情報開示攻撃を導くことができないことを示す実証的な結果が報告される。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:49:19 GMT)
Norm of Mean Contextualized Embeddings Determines their Variance [3.2] コンテキスト化された埋め込みは、同じトークンであってもコンテキストによって異なり、埋め込み空間内の分布を形成する。
トランスフォーマーモデルの層が深まるにつれて、埋め込みは原点から遠く離れていることが示される。
これらの結果は、層間の埋め込み空間の異方性に関する既存の研究と一致している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:02:23 GMT)
Uncertainty Estimation of Transformers' Predictions via Topological Analysis of the Attention Matrices [3.1] トランスフォーマーベースの言語モデルは、幅広いNLPタスクに新しいベンチマークを設定している。
予測の不確実性を確実に見積もるのは 重要な課題です
モデル信頼度を評価するために,複数の頭部・層にまたがるアテンションマップの幾何学的特徴を活用することで,これらの制約に対処する。
提案手法は,アクセプタビリティ判定と人工テキスト検出のためのベンチマークにおいて,既存の不確実性推定手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:44:27 GMT)
Multi-Cohort Framework with Cohort-Aware Attention and Adversarial Mutual-Information Minimization for Whole Slide Image Classification [3.1] 本稿では,腫瘍の多様性を生かしたマルチコホートWSI解析手法を提案する。
我々はCohort-Aware Attentionモジュールを導入し、共有および腫瘍特異的な病理パターンのキャプチャを可能にした。
また,コホート不均衡を緩和し,偏りのない学習を促進するために,階層的なサンプルバランス戦略を開発する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:18:00 GMT)
Fine-Grained Representation Learning via Multi-Level Contrastive Learning without Class Priors [3.1] クラス事前に依存することなく表現を学習するフレームワークであるtextitContrastive Disentangling (CD) を提案する。
CDは多段階のコントラスト学習戦略を採用し、インスタンスレベルの損失と特徴レベルの損失を正規化エントロピーの損失と統合し、意味的にリッチできめ細かな表現を学習する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:29:58 GMT)
MEMO-QCD: Quantum Density Estimation through Memetic Optimisation for Quantum Circuit Design [3.0] 本稿では,密度推定のための効率的な量子回路設計手法を提案する。
この戦略は、密度推定のための量子インスパイアされたアルゴリズムと、メメティックアルゴリズムに基づく回路最適化ルーチンに基づいている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 22:02:41 GMT)
UltimateDO: An Efficient Framework to Marry Occupancy Prediction with 3D Object Detection via Channel2height [3.0] 現代の自律運転システムでは、作業と3Dオブジェクト検出が標準的な2つのタスクである。
高速な3次元物体検出と占有予測(UltimateDO)を実現する手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 13:14:13 GMT)
CROSS: A Contributor-Project Interaction Lifecycle Model for Open Source Software [3.0] Cross Modelは、オープンソースソフトウェアのための新しいコントリビュータ/プロジェクトインタラクションライフサイクルモデルである。
特にEoS/オフボードのシナリオにおいて、コントリビュータの関与に関するさまざまなアーキティパルケースを説明し、研究ギャップを強調します。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 13:50:16 GMT)
Pauli spin blockade at room temperature in S/Zn-codoped silicon tunnel field effect transistors [2.7] パウリスピン遮断(英: Pauli spin blockade、PSB)は、量子ドット(QD)と量子ビットの読み出しにおけるスピンに関する基礎研究に用いられている。
ここでは、電界効果トランジスタのチャネル内の1つの深いドーパントが室温QDとして機能することを確認する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 04:23:39 GMT)
Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification [2.5] 網膜疾患診断のための堅牢なディープラーニングモデルの開発には、トレーニングのためのかなりのデータセットが必要である。
より小さなデータセットで効果的に一般化する能力は、依然として永続的な課題である。
さまざまなデータソースを組み合わせて、パフォーマンスを改善し、新しいデータに一般化しています。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:22:35 GMT)
Unmasking the Imposters: How Censorship and Domain Adaptation Affect the Detection of Machine-Generated Tweets [2.4] 4つの著名な大規模言語モデル(LLM)の生成能力を調べるために,9つのTwitterデータセットを作成する手法を提案する。
これらのデータセットは、3つのオープンソースLCMの7Bおよび8Bパラメータベースインストラクションモデルを含む、検閲されていない4つの5つのモデル構成を含んでいる。
評価の結果,「アンセンソルド」モデルが自動検出手法の有効性を著しく損なうことが明らかとなった。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 21:29:13 GMT)
How to Determine the Preferred Image Distribution of a Black-Box Vision-Language Model? [2.4] 本稿では,視覚言語モデル(VLM)に好適な画像分布を特定するための,新しい一般化可能な手法を提案する。
これを異なる3次元オブジェクトのレンダリングタイプに適用することにより、複雑な構造の正確な解釈を必要とする様々な領域で有効性を示す。
特殊なドメインにおけるベンチマークの欠如を解決するために,CAD関連視覚質問応答タスク上でVLMを評価するための新しいデータセットであるCAD-VQAを導入する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 23:25:27 GMT)
Does Biomedical Training Lead to Better Medical Performance? [2.4] 大規模言語モデル(LLM)は、患者のケア、診断、管理プロセスに大きく貢献することが期待されている。
本研究では, バイオメディカルトレーニングが6つの実践的医療課題の文脈に及ぼす影響について検討した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:19:59 GMT)
MMLU-Pro+: Evaluating Higher-Order Reasoning and Shortcut Learning in LLMs [2.4] 大規模言語モデル(LLM)の既存のベンチマークは、パフォーマンスの高いモデル間の差別化にますます苦労している。
本稿では,MMLU-Proをベースとした,ショートカット学習と高次推論のための拡張ベンチマークであるMMLU-Pro+を紹介する。
以上の結果から,MMLU-Pro+はMMLU-Proの難易度を維持しつつ,より厳密なモデル判別試験を行っていることがわかった。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 22:26:51 GMT)
GOSt-MT: A Knowledge Graph for Occupation-related Gender Biases in Machine Translation [2.3] 機械翻訳(MT)システムにおけるジェンダーバイアスは、しばしば有害なステレオタイプを補強する重大な課題を引き起こす。
本稿では,GOSt-MTナレッジグラフの作成を通じて,職業関連性バイアスを研究する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:44:20 GMT)
Development and Benchmarking of Multilingual Code Clone Detector [2.3] 多言語コードクローン検出器は、ターゲット言語のみの構文情報を提供することで、新しい言語のサポートを追加しやすくする。
ANTLR生成に基づく多言語コードブロック抽出法を提案し、多言語コードクローン検出器(MSCCD)を実装した。
最先端の10の検出器と比較して、MSCCDは平均レベルで動作し、さらに多くの言語をサポートしている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 06:31:20 GMT)
Use the Force, Bot! -- Force-Aware ProDMP with Event-Based Replanning [2.3] FA-ProDMPは,確率的運動プリミティブ(probabilistic Dynamic Movement Primitives, ProDMP)に力覚を取り入れた新しいアプローチである。
FA-ProDMPは、測定と所望の力を考慮に入れ、実行中に軌道に適応する。
FA-ProDMPを確実に評価するために、POEMPELと呼ばれるモジュール式3Dプリントタスクスイートを導入する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:54:41 GMT)
LLM-as-a-Judge & Reward Model: What They Can and Cannot Do [2.2] 自動評価器の総合的な分析を行い、非英語環境での行動に関する重要な知見を報告する。
まず、英語による評価能力が言語特有の能力に大きく影響していることを発見し、英語で訓練された評価者が、そのスキルを他の言語に簡単に移行できるようにする。
第2に,LLMが事実的不正確さ,文化的誤表現,不必要な言語の存在など,誤りを検出し,罰せられない重大な欠点を特定する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:40:02 GMT)
Can GPT-O1 Kill All Bugs? An Evaluation of GPT-Family LLMs on QuixBugs [2.2] この作業は、最近のGPT-o1モデルの公開リリースにインスパイアされている。
自動プログラム修復(APR)におけるGPTファミリーモデルの異なるバージョンの有効性の比較を行った。
O1の修復機能は、以前のGPTファミリーモデルよりも優れており、ベンチマークで40のバグを修正できた。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:49:17 GMT)
Four-qubit photonic system for publicly verifiable quantum random numbers and generation of public and private key [2.2] 本研究では,4量子フォトニクスシステムを用いて,公に検証可能な量子乱数を生成する実験を行った。
また、4量子状態からのサンプルビットの97.9%が絡み合い検証に合格している。
このことは、量子セーフなアプリケーションのための小規模マルチキュービットフォトニクスシステムの実用性を実証している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 06:41:23 GMT)
Fast and Post-Quantum Authentication for Real-time Next Generation Networks with Bloom Filter [2.2] 従来の暗号システムは、ポスト量子(PQ)セキュアな暗号に置き換える必要がある。
我々は、TVPD-HORS(Time Valid Probabilistic Data Structure HORS)と呼ばれる新しい署名を提案する。
TVPD-HORSの検証はHORSよりも2.7倍、5倍高速である。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:13:26 GMT)
Crosscap states and duality of Ising field theory in two dimensions [1.9] 2次元イジング場理論に対して、2つの異なるクロスキャップ状態を提案する。
これらの2つのクロスキャップ状態は、反ポッド点におけるイジングスピンまたは双対スピンを同定し、クラマース・ワニエ双対変換を通して関連していることを示す。
我々はマヨラナ自由場表現を導出し、ボゾン化法を拡張して、2次元イジング共形場理論の相関関数を計算する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:11:54 GMT)
Open-Source Web Service with Morphological Dictionary-Supplemented Deep Learning for Morphosyntactic Analysis of Czech [1.8] チェコ語形態素解析のためのオープンソースのWebサービスを提案する。
このシステムは、推論時の高精度な形態素辞書による深層学習モデルと再構成を組み合わせる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 07:58:03 GMT)
Anti-ESIA: Analyzing and Mitigating Impacts of Electromagnetic Signal Injection Attacks [1.7] 電磁信号注入攻撃(Electronic Signal Injection Attacks, ESIA)と呼ばれる脅威は、重要なインテリジェントシステムに重大なリスクをもたらす。
ESIAは、攻撃者がリモートでカメラが捉えた画像を操作でき、悪意のある行為や破滅的な結果をもたらす可能性がある。
本稿では,2つの異なる点,すなわち画素損失とカラーストリップから電磁界Aを解析することにより,これらのギャップに対処することを目的とする。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 06:42:24 GMT)
CAST: Cross-modal Alignment Similarity Test for Vision Language Models [1.7] 視覚言語モデル(VLM)は通常、視覚質問回答(VQA)タスクで評価される。
本稿では,モダリティ間の自己整合性を求めるために,CAST(Cross-modal Alignment similarity Test)を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:14:45 GMT)
AgileFormer: Spatially Agile Transformer UNet for Medical Image Segmentation [1.7] 視覚変換器をベースとしたUNet(ViT-UNet)セグメンテーションモデルの現在の設計は、不均一な外観を効果的に扱えない。
本稿では,空間動的成分をViT-UNetに導入するための構造化手法を提案する。
この適応により、モデルは様々な外観のターゲットオブジェクトの特徴を効果的に捉えることができる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:48:54 GMT)
Outlier Detection with Cluster Catch Digraphs [1.6] 本稿では,クラスタ・キャッシュ・ダイグラフ(CCD)に基づく異常検出アルゴリズムを新たに導入する。
そこで我々は,Uniformity-based CCD with Mutual Catch Graph (U-MCCD), The Uniformity- and Neighbor-based CCD with Mutual Catch Graph (UN-MCCD), and their shape-adaptive variants (SU-MCCD and SUN-MCCD)を提案する。
以上の結果から,これらのアルゴリズムは,外乱検出の精度と適応性を大幅に向上させることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 23:08:53 GMT)
Dynamic Range Reduction via Branch-and-Bound [1.5] ハードウェアアクセラレーターを強化するための主要な戦略は、算術演算における精度の低下である。
本稿ではQUBO問題における精度向上のための完全原理分岐境界アルゴリズムを提案する。
実験は、実際の量子アニール上でのアルゴリズムの有効性を検証する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 03:07:56 GMT)
LOLA -- An Open-Source Massively Multilingual Large Language Model [1.5] LOLAは160以上の言語で訓練された多言語大言語モデルである。
私たちのアーキテクチャと実装の選択は、言語多様性を活用するという課題に対処します。
学習したエキスパート・ルーティング機構は、暗黙の系統パターンを利用して、多言語性の呪いを和らげる可能性があることを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:23:08 GMT)
LLM-Powered Ensemble Learning for Paper Source Tracing: A GPU-Free Approach [1.4] 我々は,KDD CUP 2024紙ソース追跡コンテストに参加し,第3位を獲得した。
このコンペティションは参加者に対して、与えられた学術論文の参考資料(ref-sources)を特定するよう指示した。
トレーニング済みのニューラルネットワークモデルを微調整することでこの問題に対処しているほとんどのチームとは異なり、私たちの主要なアプローチはクローズドソースの大規模言語モデルを使用していました。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:35:25 GMT)
Advances in APPFL: A Comprehensive and Extensible Federated Learning Framework [1.4] Federated Learning(FL)は、データプライバシを保持しながら協調的なモデルトレーニングを可能にする分散機械学習パラダイムである。
本稿では,統合学習のためのフレームワークおよびベンチマークスイートであるAPPFLの開発における最近の進歩について述べる。
本稿では, 通信効率, プライバシー保護, 計算性能, 資源利用など, FLの様々な側面を評価する広範な実験を通じて, APPFLの能力を実証する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 22:20:26 GMT)
Three Approaches to the Automation of Laser System Alignment and Their Resource Implications: A Case Study [1.4] 3つの異なる自動化アプローチを特定し,検討する。
それらは、人工知能、手動アライメントのプラクティスを模倣するプラクティス主導、第一原理からモデリングするデザイン主導である。
我々は、人的資源において異なる自動化アプローチが著しく異なることを示し、サンプリング予算を計測する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 11:41:33 GMT)
3DFacePolicy: Speech-Driven 3D Facial Animation with Diffusion Policy [1.3] 本稿では,3次元表情予測のための拡散ポリシーモデルである3DFacePolicyを提案する。
方法は、変動的で現実的な人間の顔の動きを生成する。
実験により,本手法は顔面運動の変動や動的動作に有効であることが確認された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:30:34 GMT)
Visual grounding for desktop graphical user interfaces [1.3] グラフィカルユーザインタフェース(GUI)におけるオブジェクト識別のためのマルチモーダルソリューションIVGを提案する。
IVGは、命令が実行される画面上の要素の座標を特定する。
最初の方法は3部構成のアーキテクチャで、LLM(Large Language Model)とオブジェクト検出モデルの組み合わせに依存している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:15:07 GMT)
The Tensor as an Informational Resource [1.3] テンソル(英: tensor)は、データの保存、計算関係のエンコード、量子絡み合いの表現に使用できる数列である。
テンソル上の情報理論的に構築された事前順序の族を提案し、テンソルを互いに比較し、それらの間の変換の存在を評価する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 06:56:57 GMT)
Robot Manipulation in Salient Vision through Referring Image Segmentation and Geometric Constraints [1.3] 言語表現からの微細粒界と構造セグメンテーションのための軽量参照画像セグメンテーションモデルを提案する。
実世界におけるロボット制御を実現するために,視覚サーボシステムにモデルを配置する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:40:28 GMT)
Fault Detection for agents on power grid topology optimization: A Comprehensive analysis [1.0] 我々は,電力グリッドシミュレーションの故障に着目し,パターンを特定し,事前に検出する。
クラスタ化によって、5つの異なるクラスタを検出し、一般的な障害タイプを特定します。
故障を事前に検出し、5種類の予測モデルを評価するためのマルチクラス予測手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:54:29 GMT)
Testing for racial bias using inconsistent perceptions of race [1.0] 人種バイアス試験は、異なる人種の2人が異なる扱いを受けるかどうかを一般的に評価する。
根本的な課題は、2人が様々な点で異なるため、人種以外の要因が治療の違いを説明する可能性があることである。
そこで本研究では,異なる人種が認識されている場合に,同一人物が別々に扱われているかどうかを評価することによって,比較の難しさを回避できるバイアステストを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:18:46 GMT)
Small Language Models can Outperform Humans in Short Creative Writing: A Study Comparing SLMs with Humans and LLMs [1.0] 我々は、細調整された小言語モデル(SLM)、BART Largeの創作小説の執筆能力を評価し、その性能を人間と2つの大言語モデル(LLM)、GPT-3.5とGPT-4oと比較した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 20:40:02 GMT)
Improving threshold for fault-tolerant color code quantum computing by flagged weight optimization [0.9] 回路レベルのノイズの下での色符号の閾値は、その高重安定化器発生器のために比較的低い。
フラグ量子ビットの測定結果に条件付き誤差確率を用いて,そのような誤差の影響を抑える手法を提案する。
この方法は、他の重みベースのデコーダにも適用でき、QECの実験的な実装の候補として、より有望なカラーコードが得られる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:46:20 GMT)
The Bayan Algorithm: Detecting Communities in Networks Through Exact and Approximate Optimization of Modularity [0.8] 最適性と近似保証を提供するアルゴリズムを含む30のコミュニティ検出手法を比較した。
提案手法は, 2つの標準ベンチマークにおいて, 最大モジュラリティ分割の精度と安定性を, 多くの代替品よりも高い速度で評価した。
他の29のアルゴリズムのパーティションと比較すると、最大モジュラリティパーティションは、記述の長さ、カバレッジ、パフォーマンス、平均コンダクタンス、クラスタ度に最も適している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 18:51:45 GMT)
No Saved Kaleidosope: an 100% Jitted Neural Network Coding Language with Pythonic Syntax [0.8] 我々は,C++,LLVM,Cudaを用いてニューラルネットワークを学習するためのjittedコンパイラを開発した。
オブジェクト指向の特徴、強い型付け、データ前処理のための並列ワーカー、式のためのピソニック構文、PyTorchのようなモデル宣言、自動微分などが特徴である。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 23:15:39 GMT)
Hardware-Efficient Preparation of Graph States on Near-Term Quantum Computers [0.8] 高度に絡み合った量子状態のスケールと忠実度は、特殊なコンパイル法によって改善することができる。
提案手法は,7ビットグラフを平均3.5倍の誤差で作成する際の誤差を低減する。
以上の結果から,ゲートベース量子コンピューティングハードウェア上での高忠実度あるいは大規模グラフ状態の生成が可能となった。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 00:51:22 GMT)
SC-Phi2: A Fine-tuned Small Language Model for StarCraft II Macromanagement Tasks [0.8] 本稿では,マクロ管理タスクのための小型言語モデルであるSC-Phi2を紹介する。
Phi2、Gemma、DistilBERTのような小さな言語モデルは、大きな言語モデル(LLM)の合理化バージョンであり、実行に必要な電力とメモリを少なくする。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:50:32 GMT)
DiffESM: Conditional Emulation of Temperature and Precipitation in Earth System Models with 3D Diffusion Models [0.8] 地球系モデル(Earth System Models、ESM)は、人間の活動と地球の気候の間の相互作用を理解するために不可欠である。
ESMは、しばしば実行可能なシミュレーションの数を制限し、極端な気象イベントに関連するリスクのロバストな分析を妨げる。
生成型ディープラーニングモデルのクラスである拡散モデルを用いて、毎月のESM出力を1日あたりの周波数に効果的にダウンスケールする。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 23:20:05 GMT)
Automating proton PBS treatment planning for head and neck cancers using policy gradient-based deep reinforcement learning [0.8] 本稿では,PPOアルゴリズムと線量分布に基づく報酬関数を用いた自動治療計画モデルを提案する。
実験的なルールのセットは、ターゲットのボリュームとリスクのある臓器から補助的な計画構造を作成するために使用される。
PPOを用いて訓練された意思決定ポリシーネットワークを開発し、連続的な行動空間において、関連する計画目標パラメータを反復的に調整する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 22:01:56 GMT)
An Enhanced Online Certificate Status Protocol for Public Key Infrastructure with Smart Grid and Energy Storage System [0.7] スマートグリッド環境におけるOCSPクエリコストを最適化するためのOCSPステープリング手法を提案する。
実験の結果,OCSPステープリングにより効率とセキュリティが向上し,スマートグリッドのより堅牢なアーキテクチャが実現された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 06:57:17 GMT)
A Review of Prominent Paradigms for LLM-Based Agents: Tool Use (Including RAG), Planning, and Feedback Learning [0.6] ツールの使用、計画、フィードバック学習は、現在、LLM(Large Language Model)ベースのエージェントを開発するための3つの重要なパラダイムである。
この調査では、これらのフレームワークを体系的にレビューし、議論するための統合された分類法を導入している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:02:29 GMT)
A Human-Centered Risk Evaluation of Biometric Systems Using Conjoint Analysis [0.6] 本稿では, コンジョイント分析を用いて, 監視カメラなどのリスク要因が攻撃者のモチベーションに与える影響を定量化するために, 新たな人間中心型リスク評価フレームワークを提案する。
本フレームワークは、False Acceptance Rate(FAR)とアタック確率を組み込んだリスク値を算出し、ユースケース間の総合的な比較を可能にする。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:18:21 GMT)
Time-Series Forecasting, Knowledge Distillation, and Refinement within a Multimodal PDE Foundation Model [0.6] 我々は,SymPyに基づく新しいトークンライブラリを提案し,時系列モデルに対する追加のモダリティとして差分予測方程式を符号化する。
このアプローチは最小限のコストを発生させ、自動化され、タスクの予測に高い精度を維持する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 23:53:34 GMT)
Multi-Domain Data Aggregation for Axon and Myelin Segmentation in Histology Images [0.6] 組織像における軸索とミエリンの性質の定量化は、神経変性疾患による微細構造変化に関する有用な情報を提供することができる。
ディープラーニングの進歩により、このタスクは最小限のオーバーヘッドで迅速かつ信頼性が高くなっていますが、ある研究グループによってトレーニングされたディープラーニングモデルは、他のグループによって利用されることがほとんどありません。
研究者がワークフローを円滑に実行し、加速するためにAIを利用できるようにする必要があるが、公開モデルは不十分で、メンテナンスが不十分である。
我々のアプローチは、複数の画像モダリティからのデータを集約して、アクソンとミエリンセグメンテーションのためのオープンソースで耐久性のあるツールを作成することである。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 20:47:32 GMT)
Hackphyr: A Local Fine-Tuned LLM Agent for Network Security Environments [0.6] 大規模言語モデル(LLM)は、サイバーセキュリティなど、さまざまな分野において顕著な可能性を示している。
我々は、ネットワークセキュリティ環境において、レッドチームエージェントとして使用されるローカルな微調整LDMであるHackphyrを紹介する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:28:25 GMT)
SkinMamba: A Precision Skin Lesion Segmentation Architecture with Cross-Scale Global State Modeling and Frequency Boundary Guidance [0.6] 皮膚病変のセグメンテーションは早期皮膚癌を同定するための重要な方法である。
我々は、SkinMambaと呼ばれるMambaとCNNをベースとしたハイブリッドアーキテクチャを提案する。
強力な長距離依存性モデリングとローカル機能抽出機能を提供しながら、線形複雑性を維持している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 05:02:38 GMT)
Corner Charge Fluctuation as an Observable for Quantum Geometry and Entanglement in Two-dimensional Insulators [0.5] 相互作用粒子の一般格子系では、角電荷のゆらぎは量子幾何学に直接関係していることを示す。
この効果を解析的に説明するために、コンパクトな閉塞原子絶縁体のモデルが導入された。
チャーン絶縁体モデルの数値検証により、有限サイズの量子シミュレータにおけるコーナー電荷変動の実験的妥当性がさらに証明される。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:34:10 GMT)
Order Parameter Discovery for Quantum Many-Body Systems [0.5] 我々は、様々な量子系の位相図を構築するために、RFSベクトル場(reduced fidelity susceptibility)を用いている。
次に、確立されたモデルの位相図を既知の順序パラメータで再現する効果を示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:20:48 GMT)
Improving the Performance of Digitized Counterdiabatic Quantum Optimization via Algorithm-Oriented Qubit Mapping [0.5] 本稿では,ディジタル化された反断熱量子最適化アルゴリズムの性能向上戦略を提案する。
提案手法は,誤差軽減を伴わない平均4.49$times$の近似比を増大させる。
本研究は,量子ビットマッピングとアルゴリズムパラメータの最適化に適したアルゴリズム実装の符号設計に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:31:56 GMT)
Scale generalisation properties of extended scale-covariant and scale-invariant Gaussian derivative networks on image datasets with spatial scaling variations [0.5] 本稿では,スケール共変およびスケール不変ガウス微分ネットワークのスケール一般化特性を詳細に解析する。
ガンマデリバティブネットワークは、Fashion-MNISTとCIFAR-10データセットの新たな再スケールバージョンで評価される。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:51:04 GMT)
Towards Time Series Reasoning with LLMs [0.4] 本稿では,ゼロショット性能の強い領域にまたがる一般化可能な情報を学習する,新しいマルチモーダル時系列LPM手法を提案する。
提案モデルでは,特定の時系列特徴を反映した潜時表現を学習し,ゼロショット推論タスクのセットにおいてGPT-4oより優れることを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:23:44 GMT)
A Systematization of the Wagner Framework: Graph Theory Conjectures and Reinforcement Learning [0.3] アダム・ゾルト・ワグナー(Adam Zsolt Wagner)はReinforcement Learning (RL) を用いたグラフ理論の予想を解き放つアプローチを提案した。
様々なRLアルゴリズムを用いた4つの異なるシングルプレイヤーグラフ構築ゲームを提案する。
また、任意の予想に対して最も適切なニューラルネットワークアーキテクチャを選択するための原則的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:42:43 GMT)
Harnessing AI data-driven global weather models for climate attribution: An analysis of the 2017 Oroville Dam extreme atmospheric river [0.3] この分析は、2017年2月、カリフォルニア州北部で起きたオロビルダムの流出事故に繋がった、極端に大気中の川のエピソードに基づいている。
過去と将来のシミュレーションは、インダストリアル前と21世紀後半の気温変化信号で初期条件を摂動することで生成される。
全体として、AIモデルは有望な結果を示し、現在のオロビルダムにおける統合水蒸気は、工業以前のものに比べて5-6%増加したと予測している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 23:34:39 GMT)
Learning from Complementary Features [0.3] 我々は、正確な情報によって定義される特徴を通常の特徴(OF)、補完的な情報によって定義される特徴を補完的特徴(CF)と呼ぶ。
本稿では,理論上保証されたグラフに基づく推定法と,その実用的な近似法を提案し,CFに対応する値の推定を行う。
実世界のデータを用いて数値実験を行った結果,提案手法はCFに対応する値を効果的に推定し,出力ラベルを予測する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:03:38 GMT)
A Reinforcement Learning Environment for Automatic Code Optimization in the MLIR Compiler [0.1] 本稿では,MLIRコンパイラ研究の促進を目的とした,MLIRコンパイラの最初のRL環境について紹介する。
また、より単純なアクション部分空間の積として作用空間の新たな定式化を提案し、より効率的かつ効率的な最適化を可能にした。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:49:45 GMT)
Initial Guessing Bias: How Untrained Networks Favor Some Classes [0.1] 深層ニューラルネットワーク(DNN)の構造は、トレーニング開始前であっても、全ての予測を同じクラスに割り当てるようにモデルを条件付けることができることを示す。
この現象の存在は,データセット前処理手法を含むモデル選択の影響を受けていることを実証する。
ノード置換対称性の分解や自己回避の違反など理論的な結果を強調した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 22:18:09 GMT)
OneEncoder: A Lightweight Framework for Progressive Alignment of Modalities [0.1] クロスモーダルアライメント学習は、テキスト、画像、オーディオ、ビデオなどのさまざまなモダリティからの情報を統合して、統一されたモデルを作成する。
現在のテクニックは、大規模なモダリティ固有のエンコーダに依存しており、広範囲に整列したデータセット上で、スクラッチから微調整やトレーニングを必要とする。
OneEncoderは4つのモダリティを徐々に表現し調整する軽量フレームワークである。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:38:46 GMT)
Estimating the distribution of numerosity and non-numerical visual magnitudes in natural scenes using computer vision [0.1] 数値性は累積領域や凸殻など,多くの連続的な等級と強く相関していることを示す。
これは、なぜ数奇心がこれらの非数奇心の影響をしばしば受けているのかを説明できるかもしれない。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:49:29 GMT)
Enhanced segmentation of femoral bone metastasis in CT scans of patients using synthetic data generation with 3D diffusion models [0.1] 本稿では,3次元拡散確率モデル(DDPM)を用いた自動データパイプラインを提案する。
5675巻を新たに作成し,実データと合成データに基づいて3次元U-Netセグメンテーションモデルを訓練し,セグメンテーション性能を比較した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:21:19 GMT)
Elsevier Arena: Human Evaluation of Chemistry/Biology/Health Foundational Large Language Models [0.0] エルゼビアで行われた生物医学領域(健康・生物学・化学・薬学)に焦点を当てた人体評価実験について述べる。
比較的小さな (135B トークン) データセットでトレーニングされたデコーダのみの基礎変換器は OpenAI の GPT-3.5-turbo と Meta の基本 7B パラメータ Llama 2 モデルと比較される。
結果は、一般的にIRRスコアが低かったとしても、GPT-3.5-turboが好まれており、会話能力を持つモデルが好まれており、非常に大きなデータセットでトレーニングされていることを示している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 11:41:28 GMT)
WaterQualityNeT: Prediction of Seasonal Water Quality of Nepal Using Hybrid Deep Learning Models [0.0] 本稿では,ネパールの季節的な水質を予測するためのハイブリッド深層学習モデルを提案する。
このモデルは、畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)を統合し、データの時間的および空間的パターンを活用する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 05:26:59 GMT)
Violation of no-signaling on a public quantum computer [0.0] 我々は、IBM Quantumデバイスからの量子ビットのバイパーティライトシステムにおいて、非常に大きな統計量で符号付けをテストした。
IBM Quantumの時間と空間スケールは原則としてサブルミナル通信を除外することはできないが、信号伝達に繋がる明らかな物理的メカニズムは存在しない。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:51:52 GMT)
Validating Traces of Distributed Programs Against TLA+ Specifications [0.0] 本稿では,分散プログラムのトレースをTLA+で記述された高レベル仕様に関連付けるためのフレームワークを提案する。
この問題は、TLCモデルチェッカーを用いて実現した制約付きモデルチェック問題に還元される。
提案手法を複数の分散プログラムに適用し,すべてのケースにおいて仕様と実装の相違を検出する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:52:15 GMT)
Unsupervised state learning from pairs of states [0.0] 各キュービットの余分なコピーが供給された場合、すなわち、1つのキュービットではなく、同じ状態の2組のキュービットを受け取ることが示される。
次に、量子ビット対の列の測定を数値的にシミュレートし、未知の状態とその発生確率を高精度に知ることができることを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:19:56 GMT)
Unlocking NACE Classification Embeddings with OpenAI for Enhanced Analysis and Processing [0.0] 欧州共同体における経済活動統計分類(英: Statistical Classification of Economic Activity in the European Community, NACE)は、欧州連合内の経済活動と産業活動の分類の標準分類体系である。
本稿では,NACE分類を低次元埋め込みに変換するための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:49:46 GMT)
Training Datasets Generation for Machine Learning: Application to Vision Based Navigation [0.0] 視覚ベースのナビゲーションは、画像から情報を抽出した後、GNCの精密センサーとしてカメラを利用する。
宇宙アプリケーションにおける機械学習の採用を可能にするために、利用可能なトレーニングデータセットがアルゴリズムの検証に適していることの実証が障害のひとつだ。
本研究の目的は,機械学習アルゴリズムの学習に適した画像とメタデータのデータセットを作成することである。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:34:24 GMT)
Towards Novel Malicious Packet Recognition: A Few-Shot Learning Approach [0.0] Deep Packet Inspection (DPI)は、ネットワークセキュリティを強化する重要な技術として登場した。
本研究では,大規模言語モデル(LLM)と少数ショット学習を活用する新しいアプローチを提案する。
提案手法は,マルウェアの種類によって平均精度86.35%,F1スコア86.40%の有望な結果を示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:02:32 GMT)
Towards Ethical Personal AI Applications: Practical Considerations for AI Assistants with Long-Term Memory [0.0] パーソナルAIの仲間やアシスタントは、AIとの対話の仕方に大きな変化を約束する。
本稿では、LTM機能を備えたパーソナルAIアプリケーションの構築とデプロイに関する、より広範な意味について考察する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 13:48:29 GMT)
Time Crystals from single-molecule magnet arrays [0.0] 時間結晶はユニークな非平衡量子現象であり、現在の量子技術に期待できる。
ここでは、周期的に駆動される分子磁石アレイにおける離散時間結晶を理論的に予測する。
驚いたことに、時間-結晶応答周波数は個々の磁石のエネルギーレベルと相関している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:21:14 GMT)
The Role of AI Safety Institutes in Contributing to International Standards for Frontier AI Safety [0.0] 我々は、AI安全研究所(AISI)が、AI安全のための国際標準設定プロセスに貢献するように適切に設定されていると論じる。
我々は、ソウル宣言署名者、米国(およびその他のソウル宣言署名者)、中国、グローバル包括的3つのモデルを提案し、評価する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:12:54 GMT)
The Jaynes-Cummings model and its descendants [0.0] Jaynes-Cummings(JC)モデルは、現在まで約60年間、量子光学の最前線にある。
この本は、特定の物理系における幅広い応用を見据えて、その形式主義の基本的な一般化を提起する。
この展示は、量子光学と凝縮物質物理学をインターレースする活気のある場を通して読者を導く。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 18:12:44 GMT)
Technical Upgrades to and Enhancements of a System Vulnerability Analysis Tool Based on the Blackboard Architecture [0.0] このシステムでは、ブラックボードアーキテクチャのルールファクトパラダイムに基づく一般化ロジックが実装された。
本稿は,マルチスレッディングの実装を含む今後の研究の道筋について論じる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 05:06:42 GMT)
THaMES: An End-to-End Tool for Hallucination Mitigation and Evaluation in Large Language Models [0.0] 事実的に誤ったコンテンツの生成である幻覚は、大規模言語モデルにおいてますます困難になっている。
本稿では,このギャップに対処する統合フレームワークとライブラリであるTHaMESを紹介する。
THaMES は LLM における幻覚の評価と緩和のためのエンドツーエンドのソリューションを提供する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:55:25 GMT)
SuperCoder2.0: Technical Report on Exploring the feasibility of LLMs as Autonomous Programmer [0.0] SuperCoder2.0は、人工知能によるソフトウェア開発を強化するために設計された高度な自律システムである。
システムは、AIネイティブな開発アプローチとインテリジェントエージェントを組み合わせて、完全に自律的なコーディングを可能にする。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 13:44:42 GMT)
Strategic Insights in Human and Large Language Model Tactics at Word Guessing Games [0.0] 2022年の初めには、単純な言い回しゲームが嵐で世界を席巻した。
本稿では,2年以上に渡り発展してきた日常的なゲームプレイヤーの戦略を考察する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:06:05 GMT)
Statistical Jump Model for Mixed-Type Data with Missing Data Imputation [0.0] 混合型データに対する統計的ジャンプモデルを提案する。
このフレームワークには、状態持続性、解釈可能性の向上、状態スイッチの頻度の削減が含まれている。
本研究では, 広範囲なシミュレーション研究と, 空気質データへの実証的応用を通して, 本手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:42:50 GMT)
Sparks of Artificial General Intelligence(AGI) in Semiconductor Material Science: Early Explorations into the Next Frontier of Generative AI-Assisted Electron Micrograph Analysis [0.0] 我々は、ジェネレーティブAIの最近の進歩を活用する、完全に自動化されたエンドツーエンドパイプラインを導入します。
提案手法では,GPT-4V などの大規模マルチモーダルモデル (LMM) と DALLE-3 のようなテキスト・ツー・イメージモデルを用いる。
我々は、GPT-4ガイド付き視覚質問応答法(VQA)を統合し、ナノマテリアル画像を分析し、DALLE-3を介して合成ナノマテリアル画像を生成し、GPT-4Vで数発のプロンプトによるインコンテキスト学習を用いて正確なナノマテリアル識別を行う。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 04:25:27 GMT)
Solving the Hele-Shaw flow using the Harrow-Hassidim-Lloyd algorithm on superconducting devices: A study of efficiency and challenges [0.0] 実用的な流体流問題を扱う量子プロセッサの開発は、遠いが有望なフロンティアを表している。
量子アルゴリズム、特に線形解法における最近の進歩は、古典的な流体解法に対する量子解への道のりを照らしている。
本研究では,古典型QLSA,Harrow-Hassidim-Lloyd (HHL) アルゴリズムを用いて,理想化された流体流動問題を管理する線形方程式のシステムを正確に解く能力について検討する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:44:08 GMT)
Security Camera Movie and ERP Data Matching System to Prevent Theft [0.0] 日本では万引きの被害総額が450億円に達する。
クラウドとデータ分析技術に基づいて,小店舗の防犯カメラとERPデータチェックの画像解析による万引き防止サービスを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 03:55:21 GMT)
Sample Complexity Bounds for Linear System Identification from a Finite Set [0.0] 我々は、真のシステムを特定するために、最大可能性推定器を使用する。
情報理論のツールを活用して、サンプルの複雑さを低くする。
得られたサンプル複雑性境界を解析的および数値的に解析する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:52:16 GMT)
SIG: A Synthetic Identity Generation Pipeline for Generating Evaluation Datasets for Face Recognition [0.0] 我々は、顔認識評価のための倫理的バランスの取れたデータセットをターゲットとするSIG(Synthetic Identity Generation Pipeline)を導入する。
我々のパイプラインは、人種、性別、年齢など、制御可能なポーズ、顔の特徴、人口特性を持つ合成アイデンティティの高品質な画像を生成する。
また、人種、性別、年齢間でバランスのとれた3,336のユニークな合成アイデンティティの10,008の顔画像からなる、ControlFace10kというオープンソースの評価データセットもリリースしました。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 18:19:24 GMT)
REG: Refined Generalized Focal Loss for Road Asset Detection on Thai Highways Using Vision-Based Detection and Segmentation Models [0.0] 本稿では,タイの高速道路における重要道路資産の検出・分断のための新しい枠組みを提案する。
提案手法は,最先端の視覚に基づく検出・セグメンテーションモデルに統合され,クラス不均衡と,未表現の道路要素の局所化の課題に効果的に対処する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:30:22 GMT)
Quantum-limited optical lever measurement of a torsion oscillator [0.0] トルク感度10-20,textN m/sqrttextHz$およびゼロ点スペクトル密度10-10,textrad/sqrttextHz$を有するSi$_3$N$_4$ナノリボンの光レバー計測について述べる。
我々の研究は、新しいねじり量子光学のクラスの可能性を示している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:56:02 GMT)
Quantum jumps in amplitude bistability: tracking a coherent and invertible state localization [0.0] オープン駆動Jaynes-Cummingsモデルにおける光の巨視的準安定状態間の量子ジャンプについて検討する。
その結果、[H. J. Carmichael, Phys. Rev. X 5, 031028] で考慮されたゼロ自然放出の限界において、高光子状態から真空状態へのジャンプには2つの段階があることがわかった。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:08:48 GMT)
Quantum Machine Learning in the Cognitive Domain: Alzheimer's Disease Study [0.0] アルツハイマー病(英語: Alzheimer's disease、AD)は、神経変性疾患の1つである。
認知障害に影響されるタスクの1つは手書きである。
古典的人工知能(AI)手法の最近の進歩は、手書き解析によるADの検出において有望であることを示している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:03:28 GMT)
ProSLM : A Prolog Synergized Language Model for explainable Domain Specific Knowledge Based Question Answering [0.0] ニューロシンボリックアプローチは説明可能なシンボル表現を取り入れることで、不透明な神経系に堅牢性を加えることができる。
本稿では,大規模言語モデルの堅牢性と信頼性を向上させるために,ニューロシンボリックな新しいフレームワークであるシステム名を提案する。
我々の研究は、ニューロシンボリックな生成AIテキスト検証とユーザパーソナライゼーションの新しい領域を開く。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 22:34:33 GMT)
Practical Aspects on Solving Differential Equations Using Deep Learning: A Primer [0.0] このプライマーはDeep Galerkin法に関する技術的および実践的な洞察を提供することを目的としている。
一次元の熱方程式を段階的に解く方法を示す。
また、通常の微分方程式や積分方程式の系にディープ・ガレルキン法を適用する方法を示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:25:51 GMT)
PReLU: Yet Another Single-Layer Solution to the XOR Problem [0.0] 本稿では,Parametric Rectified Linear Unit (PReLU) を用いた単一層ニューラルネットワークが,XOR問題を解くことができることを示す。
以上の結果から, 単層PRELUネットワークは, より広範な学習率で100%の成功率を達成することができることがわかった。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:28:40 GMT)
Operational Wind Speed Forecasts for Chile's Electric Power Sector Using a Hybrid ML Model [0.0] チリの火力発電所における風と太陽からの断続的な発電の増加の影響を定量化する。
本稿では,チリの2つのカスタムMLモデルを組み合わせたハイブリッド風速予測手法を提案する。
提案手法は,短期予測では4~21%,中期予測では5~23%,最も正確な運用決定システムより優れている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 00:25:49 GMT)
On the Similarity of Deep Learning Representations Across Didactic and Adversarial Examples [0.0] 野におけるアドリラルな例は、正確に予測モデリングを行う上で、必然的に有害であることを示すかもしれない。
入力空間における逆例の頻度に応じて,表現的類似性と性能が変化することを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:01:42 GMT)
Non-Universality from Conserved Superoperators in Unitary Circuits [0.0] 量子制御理論における重要な結果は、2ドルの局所ユニタリゲートの「ユニバーサリティ」である。
近年の研究では、普遍性は対称性の存在下で崩壊する可能性があることが示されている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:59:42 GMT)
Neural Networks with LSTM and GRU in Modeling Active Fires in the Amazon [0.0] 本研究は,ブラジルのアマゾンにあるAQUA_M-T衛星によって検出された活動点の歴史的時系列をモデル化し,予測するための包括的方法論を提案する。
このアプローチでは、Long Short-Term Memory(LSTM)とGated Recurrent Unit(GRU)アーキテクチャを組み合わせた混合リカレントニューラルネットワーク(RNN)モデルを採用して、毎日検出されたアクティブファイアスポットの月次蓄積を予測する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:12:11 GMT)
Neural Networks for Vehicle Routing Problem [0.0] ルート最適化はニューラルネットワークの新たな課題と見なすことができる。
機械学習の最近の進歩は、複雑な問題に対処するための新しいツールセットを提供する。
ニューラルネットワークを応用する主な領域は、分類と回帰の領域である。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:45:30 GMT)
Navigating Process Mining: A Case study using pm4py [0.0] 本稿では,Python の pm4py ライブラリを用いた道路交通管理プロセスの包括的解析を行う。
フィルタリングと統計的解析により、プロセスの実行における重要なパターンとバリエーションを明らかにする。
発見されたモデルを視覚化して、プロセス内のワークフロー構造と依存関係を理解します。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:48:46 GMT)
Multiphoton interference in a single-spatial-mode quantum walk [0.0] 多光子干渉は多くのフォトニック量子技術にとって重要である。
ここでは、最大24個の超高速時間ビンを備えた、高度に安定で低損失なマルチポート干渉計で量子ウォークを実装した。
以上の結果から,超高速時間ビンは大規模多光子干渉を観測する上で有望なプラットフォームであることが示された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 18:14:54 GMT)
Multipartite entanglement vs nonlocality for two families of $N$-qubit states [0.0] 多重量子ビットの量子状態は、量子ビット間の絡み合いがあるときにベル型不等式に反し、相関の非局所的な振る舞いを示す。
Svetlichnyの不等式違反を特徴とする多部構造と真の多部構造非局所性の関係を,N-$qubit状態の2つのファミリに対して解析した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 04:51:41 GMT)
Modified Jarzynski equality in a microcanonical ensemble [0.0] 従来のジャジンスキーの等式はマイクロカノニカルアンサンブルで用意されたシステムには当てはまらないことを示す。
マイクロカノニカルな作業のゆらぎとエントロピー生産を結合する修正等式を導出する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 00:56:51 GMT)
Modeling a frustrated Ising square lattice with the D-Wave Quantum Annealer [0.0] より複雑なIsingモデルとして、D-Wave量子アニールの実装方法を示す。
このシステムの力学はフラストレーションのため、単純なイジングモデルよりもリッチである。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:07:34 GMT)
Mobility-GNN: a human mobility-based graph neural network for tracking and analyzing the spatial dynamics of the synthetic opioid crisis in the USA, 2013-2020 [0.0] オピオイド(Opioids)は、アメリカ合衆国で最も一般的な薬物である。
2018年、薬物過剰摂取死の約70%がオピオイドであり、オピオイド関連死亡の67%が合成オピオイドである。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 03:18:25 GMT)
Mesh-based Super-Resolution of Fluid Flows with Multiscale Graph Neural Networks [0.0] メッシュベースの流体の3次元超解像を可能にするグラフニューラルネットワーク(GNN)アプローチが本研究で導入された。
このフレームワークでは、GNNは一度に完全なメッシュベースのフィールドでではなく、要素(またはセル)の局所的なメッシュで動くように設計されている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:05:17 GMT)
Manipulating Two-Photon Absorption of Molecules through Efficient Optimization of Entangled Light [0.0] ベイズ最適化に基づく新しい包括的最適化プロトコルが本研究で開発されている。
チオフェンデンドリマーの絡み合った2光子吸収確率を最大20倍に向上させることができる。
最適化に加えて、小さな絡み合い時間限界における2光子吸収の絡み合いについて検討した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:17:01 GMT)
Machine Learning for Public Good: Predicting Urban Crime Patterns to Enhance Community Safety [0.0] 本稿では,都市部における犯罪の空間的・時間的パターンを予測するML手法の有効性について検討する。
研究目標は、呼び出しを優先度レベルに分類する際の高い精度を達成することである。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:07:14 GMT)
Lite-FBCN: Lightweight Fast Bilinear Convolutional Network for Brain Disease Classification from MRI Image [0.0] 現在のディープラーニング手法は、精度と計算要求のバランスをとるのに苦労することが多い。
軽量高速双線形畳み込みネットワークLite-FBCNを提案する。
Lite-FBCNはクロスバリデーションで98.10%、ホールドアウトデータで69.37%の精度を実現している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 07:40:06 GMT)
Leveraging Distillation Techniques for Document Understanding: A Case Study with FLAN-T5 [0.0] 本稿では,LLM ChatGPTから文書理解知識をFLAN-T5に抽出する手法を提案する。
本研究は, 実世界のシナリオにおける高度言語モデルの展開を促進する蒸留技術の可能性を明らかにするものである。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:37:56 GMT)
Learning Unstable Continuous-Time Stochastic Linear Control Systems [0.0] 有限長状態軌跡に基づく連続時間力学におけるシステム同定の問題について検討する。
適切なランダム化制御入力を用いて不安定なオープンループ行列を推定する手法を提案する。
我々は,推定誤差が軌道長,励起率,信号対雑音比で減衰することを示す理論的性能保証を確立する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:24:51 GMT)
Large language models can replicate cross-cultural differences in personality [0.0] 我々は大規模な実験を行い、GPT-4がビッグファイブの異文化間差異を再現できるかどうかを検証した。
私たちはアメリカと韓国を文化のペアとして使いました。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:47:51 GMT)
Inferno: An Extensible Framework for Spiking Neural Networks [0.0] InfernoがCPUとGPUの両方でトレーニング可能な不均一遅延をどのようにサポートしているかを示す。
Infernoは、新しいモデルや技術のための"書き込み1回、適用至るところで"開発方法論を可能にするかを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 21:44:40 GMT)
In-situ measurements of light diffusion in an optically dense atomic ensemble [0.0] 本研究は, 低温原子の光学的に厚いアンサンブル内での光輸送をその場で調査するための新しい手法を提案する。
大型原子雲の中心に光励起を生成する方法を示す。
雲の大きさが輸送平均自由経路よりもかなり大きい場合、拡散状態が同定される。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 12:14:59 GMT)
Improve Machine Learning carbon footprint using Parquet dataset format and Mixed Precision training for regression algorithms [0.0] この研究は私の修士論文の2番目だった。
回帰MLモデルをトレーニングしながら、Comma-Separated-Values(CSV)とparquetデータセットフォーマットを使用した消費電力を、デフォルトの浮動小数点(32bit)とNvidiaの混合精度(16bitと32bit)と比較した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:53:03 GMT)
Image-to-Image Translation Based on Deep Generative Modeling for Radiotherapy Synthetic Dataset Creation [0.0] 本研究の目的は、深部生成モデルに基づく画像画像変換(I2I)による合成EPIDデータの改善である。
この強化された合成データは、放射線治療における自動エラー検出とエラー分類のためのニューラルネットワークのトレーニングのような下流タスクを改善することが期待されている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 11:51:41 GMT)
IBM Quantum Computers: Evolution, Performance, and Future Directions [0.0] IBM Quantumはハードウェアとソフトウェアの両面で大きな進歩を遂げており、2016年からIBM Cloudを通じて量子ハードウェアへのアクセスを提供している。
我々は、IBM Quantumのプロセッサの進化と進化を、1000キュービットの障壁を超えた最近のブレークスルーを含む世代にわたって要約する。
この論文は、様々なハードウェアのパフォーマンス指標の詳細をレビューし、時間とともにその進化をトレースし、IBM Quantumがノイズの多い中間スケール量子(NISQ)コンピューティング時代からフォールトトレラントな量子コンピューティング能力へ移行したことを強調した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 07:50:50 GMT)
High School Summer Camps Help Democratize Coding, Data Science, and Deep Learning [0.0] 本研究は,高校生がコーディング,データサイエンス,深層学習に導入するサマーキャンプシリーズの影響について報告する。
キャンプは没入的な大学経験を提供し、技術スキル、コラボレーション、インスピレーションを育んでいる。
調査データによると、AIとデータサイエンスのキャリアへの関心が68.6%と、コーディングに対する自信が増している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:59:39 GMT)
Harvesting magic from the vacuum [0.0] この手紙は、初期真空状態の量子場と相互作用する3レベルのUnruh-DeWitt検出器(量子ビット)によって魔法を収穫できることを示している。
量子場理論(QFT)から資源を抽出するという考え方は、絡み合いの収穫から生まれたものであるが、この結果は、石英を非魔法の状態から魔法の状態へと進化させるためのプロトコルを拡張した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 18:02:20 GMT)
HEARTS: A Holistic Framework for Explainable, Sustainable and Robust Text Stereotype Detection [0.0] HEARTS (Holistic Framework for Explainable, Sustainable, and Robust Text Stereotype Detection)は、モデル性能を高め、炭素フットプリントを最小化し、透過的で解釈可能な説明を提供するフレームワークである。
我々は、LGBTQ+や地域ステレオタイプなど、6つのグループにわたる57,201のラベル付きテキストからなるEMGSD(Expanded Multi-Grain Stereotype dataset)を確立する。
そして、SHAPを用いて微調整された炭素効率のALBERT-V2モデルを解析し、トークンレベルの重要度を生成し、人間の理解と整合性を確保し、SHAPとLIMEを比較して説明可能性の信頼性スコアを算出する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 22:06:46 GMT)
Good Grasps Only: A data engine for self-supervised fine-tuning of pose estimation using grasp poses for verification [0.0] ビンピッキングのためのポーズ推定の自己教師型微調整法を提案する。
本手法により,手動ラベリングを使わずにトレーニングデータを自動的に取得できる。
私たちのパイプラインは、プロセス実行中にシステムを微調整し、学習フェーズの必要性を排除します。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:26:21 GMT)
Fundamentals of legislation for autonomous artificial intelligence systems [0.0] 本稿では、自律型コーポレートマネジメントシステムのための専用の運用コンテキストを構築する方法を提案する。
運用のコンテキストの重要な部分は、企業が運営する規制と法的環境である。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:50:23 GMT)
Flatbands in tight-binding lattices with anisotropic potentials [0.0] ブラヴェス格子上の強結合モデルは、ある方向に沿って変化し、横方向に沿って一定である異方性オンサイトポテンシャルを持つ。
反$mathcalPT$対称ハミルトニアンのフラットバンドに関するこれまでの研究に触発され、ホッピングとポテンシャルの形状を調整して反$mathcalPT$フラットバンドを構築する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:37:35 GMT)
Fault Detection and Identification via Monitoring Modules Based on Clusters of Interacting Measurements [0.0] 本研究は,対話的計測のクラスタからなるモジュールをベースとした,制御対応の分散プロセス監視手法を提案する。
この手法は、モニタリングモジュールの完全な主成分分析(f-PCA)を使用して、テネシー・イーストマン・プロセスのベンチマークで検証されている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:17:56 GMT)
Fast characterization of multiplexed single-electron pumps with machine learning [0.0] 単一電子ポンプデバイスを現在の量子化方式にチューニングするための機械学習に基づく効率的な自動化フレームワークを提案する。
GaAs/AlGaAsマルチプレクサアレイに配列された28個のデバイスを特徴付けることで,フレームワークのロバスト性を示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:06:31 GMT)
Fast Analysis of the OpenAI O1-Preview Model in Solving Random K-SAT Problem: Does the LLM Solve the Problem Itself or Call an External SAT Solver? [0.0] 私は、モデルが直接解決するのではなく、外部SATソルバを呼び出しインスタンスを解決できることを示します。
我々は,OpenAI O1-previewモデルがインテリジェンスの火花を示すかどうかを定量化する分析法を提案し,提示する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:29:03 GMT)
Evaluation of pretrained language models on music understanding [0.0] その結果, 言語モデル(LLM)は, 1) アクセシビリティ, 2) 否定をモデル化できないこと, 3) 特定の単語の存在に対する感受性に悩まされていることがわかった。
我々はこれらの特性を三重項に基づく精度として定量化し、階層的オントロジーにおいてラベルの相対的類似性をモデル化する能力を評価した。
比較的高い精度が報告されているにもかかわらず、6つのモデルすべてに矛盾があることは明らかであり、既製のLLMは使用前に音楽に適応する必要があることを示唆している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:44:49 GMT)
Evaluating the Impact of Compression Techniques on Task-Specific Performance of Large Language Models [0.0] 大規模言語モデル(LLM)は強力な能力を提供するが、かなりの計算コストがかかる。
本研究では,LLaMA-2-7Bモデルに対する圧縮法の影響について検討した。
SparseGPTとWandaは50%の間隔でも難易度を保っているが,下流タスクでは著しく低下している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:34:11 GMT)
Evaluating Modifications to Classifiers for Identification of Higgs Bosons [0.0] ヒッグス粒子は、2012年にATLASとCMSの実験によって大型ハドロン衝突型加速器(LHC)の衝突データによって発見された。
本稿では、量子機械学習(QML)を用いて、この分類問題に取り組むことを目的とする。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 05:41:30 GMT)
Evaluating Investment Risks in LATAM AI Startups: Ranking of Investment Potential and Framework for Valuation [0.0] この研究は、テクノロジースタートアップ投資の新興勢力のランキングの開発を通じて、この地域におけるAI主導のスタートアップの可能性と収益性を強調している。
本稿は、スタートアップが直面する政治的、経済的、競争的なリスクについても検討し、投資リターンを最大化するためにこれらのリスクを軽減するための戦略的洞察を提供する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 22:31:46 GMT)
Estimating the Unobservable Components of Electricity Demand Response with Inverse Optimization [0.0] 価格に対する電力需要の反応を理解し予測することは、システムオペレーター、小売業者、規制当局にとって重要な活動である。
ソーラー・プラス・ストレージ・システムや電気自動車といった柔軟な資産を持つアクティブ・コンシューマーの出現は、新たな課題をもたらす。
我々は、需要の主成分であるベースロード、フレキシブル、セルフジェネレーションを定義し、それぞれが市場価格信号に対する非線形応答を持つ。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:17:31 GMT)
Entanglement-assisted classical capacities of some channels acting as radial multipliers on fermion algebras [0.0] 我々は$mathrmM_2k$上の新しい単位量子計算チャネルのクラスについて検討する。
有限次元フェルミオン代数を持つ行列代数 $mathrmM_2k$ を同定する。
我々の計算はフェルミオンオルンシュタイン-ウレンベック半群の作用素に適用できる正確な値を得る。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 18:39:57 GMT)
Enhancing Security Testing Software for Systems that Cannot be Subjected to the Risks of Penetration Testing Through the Incorporation of Multi-threading and and Other Capabilities [0.0] SONARRは複雑なミッションクリティカルシステムのためのシステム脆弱性解析ツールである。
本稿では,マルチスレッドSONARRアルゴリズムと他の拡張アルゴリズムの性能について述べる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 05:09:10 GMT)
Enhancing Mental Health Support through Human-AI Collaboration: Toward Secure and Empathetic AI-enabled chatbots [0.0] 本稿では、スケーラブルなソリューションとしてのAI対応チャットボットの可能性について検討する。
メンタルヘルスの文脈で共感的で有意義な反応を提供する能力を評価する。
本稿では,データプライバシを保証し,バイアスを低減し,臨床医による継続的検証を統合して応答品質を向上させるためのフェデレート学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 20:49:13 GMT)
Enhancing ICT Literacy and Sustainable Practices in the Hospitality Industry: Insights from Mnquma Municipality [0.0] 本研究は,南アフリカ共和国ケープ州東部農村部におけるICTリテラシーとICT導入の意義について考察した。
21人の小規模選手(BnBs、ゲストハウス、非サービス施設)のランダムなサンプルが選択された。
データを記述統計とKruskal-Wallis H Testを用いて解析し,ICT使用率の差について検討した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:41:34 GMT)
Enhancement of efficiency in the Dicke model quantum heat engine [0.0] 我々は、全ディックモデルで記述された量子熱エンジンを解析する。
量子相転移に関連する基底状態縮退と最大効率の関係について検討した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 05:05:51 GMT)
Egalitarian Language Representation in Language Models: It All Begins with Tokenizers [0.0] すべてのトークンライザが、Tamil、Sinhala、Hindiといった複雑なスクリプト言語に対して公正な表現を提供するわけではないことを示す。
本稿では,Grapheme Pair と呼ばれるグラフエムを組み込むことにより,Byte Pair アルゴリズムの改良を提案する。
実験の結果, 文字抽出は複雑なスクリプトに対して, バイトレベルのトークン化器よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:05:37 GMT)
Efficient Numerical Calibration of Water Delivery Network Using Short-Burst Hydrant Trials [0.0] 本研究は,WDNの圧力勾配を増大させる短時間水和剤試験を用いたキャリブレーション法を提案する。
WDNゾーンのユニークな実世界のケーススタディでは、日々の使用量に基づくキャリブレーションと比較して、我々の手法の統計的に有意な優位性を示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 11:49:26 GMT)
Early Detection of Coronary Heart Disease Using Hybrid Quantum Machine Learning Approach [0.0] 冠動脈疾患(CHD)は重症心疾患であり,早期診断が不可欠である。
量子コンピューティングと機械学習(ML)技術の主流となる開発は、CHD診断の性能に実用的な改善をもたらす可能性がある。
医療業界における量子的な飛躍は、処理能力を高め、複数のモデルを最適化する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 07:08:39 GMT)
Direct experimental observation of sub-poissonian photon statistics by means of multi-photon scattering on a two-level system [0.0] 半無限導波路に強く結合した2レベル超伝導人工原子のカスケードは、量子非線形光学において非自明な現象を観測するための有望なツールである。
我々は、コヒーレントcw励起源からの非古典光とプローブに作用する他のコヒーレント波との波動混合を実験的に実証した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:15:48 GMT)
Digital Ecosystem for FAIR Time Series Data Management in Environmental System Science [0.0] 本稿では時系列データを管理する汎用的で転送可能なデジタルエコシステムを提案する。
システムは高度に適応可能で、クラウド対応で、幅広い設定でデプロイするのに適しています。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 13:25:12 GMT)
Detecting and protecting entanglement through nonlocality, variational entanglement witness, and nonlocal measurements [0.0] エンタングルメント(Entanglement)は、計算、通信などにおける量子力学における鍵となる概念である。
我々は,Cluser-Horne-Shimony-Holtの不等式をエンタングルメント尺度として使用し,より完全な検出のための変分エンタングルメント証人を導入する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 02:38:58 GMT)
Deep Learning with CNNs: A Compact Holistic Tutorial with Focus on Supervised Regression (Preprint) [0.0] このチュートリアルは、畳み込みニューラルネットワーク(CNN)と教師付き回帰に焦点を当てている。
最も関連する概念を要約するだけでなく、それぞれを深く掘り下げて、完全なアジャイルのアイデアセットを提供する。
本チュートリアルは,Deep Learningの基礎を理解することに関心のある学生,教授,研究者にとって最適な情報源となることを目的としている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:22:18 GMT)
Cyber Protection Applications of Quantum Computing: A Review [0.0] スキャン検査は 815件の論文を 検討して行われました。
サイバー保護のための多くの量子コンピューティングアプリケーションと、データとプライバシを保護するための多くのテクニックが同定された。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:03:38 GMT)
Cost-informed dimensionality reduction for structural digital twin technologies [0.0] 本稿では,構造資産管理における次元削減に関する決定論的アプローチを定式化する。
識別情報が失われる可能性があるため、誤分類コストを最小限に抑えることが目的である。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:37:00 GMT)
Contextual Breach: Assessing the Robustness of Transformer-based QA Models [0.0] 文脈問合せモデルは、入力コンテキストに対する逆の摂動に影響を受けやすい。
異なる7種類の対立雑音を文脈に組み込んだユニークなデータセットを導入する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:00:11 GMT)
Constructive Apraxia: An Unexpected Limit of Instructible Vision-Language Models and Analog for Human Cognitive Disorders [0.0] 本研究は、視覚言語モデル(VLM)と人間の認知障害、特に建設的失語症との予期せぬ平行関係を明らかにする。
コンストラクティブ・アプラキシアの臨床的評価において,基本的空間推論を必要とするポンゾイリュージョンの画像を生成する能力について,25種類の最先端のVLMを検証した。
注目すべきは、25モデル中24モデルが2本の水平線を視界の背景に対して正しくレンダリングできなかったことだ。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 18:46:57 GMT)
Complex-valued convolutional neural network classification of hand gesture from radar images [0.0] 本稿では,すべてのビルディングブロック,前方および後方操作,および複雑な領域における導関数を含む完全なCV-CNNを提案する。
本稿では,2組のCVハンドジェスチャーレーダ画像の分類モデルについて,等価なRVモデルと比較検討する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 11:49:14 GMT)
Competing topological phases in a non-Hermitian time-reversal symmetry-broken Bernevig-Hughes-Zhang model [0.0] スピン依存非エルミート平衡ゲイン/ロスポテンシャルの包含は、これらの第1次位相と第2次位相の競合を引き起こすことを示す。
驚くべきことに、ナノリボンの再表面におけるそれまで休眠していた1次ヘリカルエッジ状態は、非エルミート効果が増大する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 17:02:32 GMT)
Clinical Validation of a Real-Time Machine Learning-based System for the Detection of Acute Myeloid Leukemia by Flow Cytometry [0.0] フロー内の機械学習(ML)モデルは、エラー率を低減し、効率を向上し、臨床実験室の効率を向上する可能性がある。
このようなモデルの臨床的展開についてはほとんど研究されていない。
急性骨髄性白血病(AML)の検出のためのMLモデルと臨床実装を支えるインフラについて述べる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:53:47 GMT)
Challenging Excited States from Adaptive Quantum Eigensolvers: Subspace Expansions vs. State-Averaged Strategies [0.0] ADAPT-VQEは分子の基底状態を得るための単一の参照手法である。
MORE-ADAPT-VQEは、避けられた交差と異なる対称性の状態間の交差の両方を正確に記述することができる。
これらの改善は、難しい励起状態問題に対する量子コンピュータの使用に向けた有望な方向を示唆している。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 14:03:27 GMT)
Capturing Differences in Character Representations Between Communities: An Initial Study with Fandom [0.0] 本研究は,物語物語界の不可欠な部分であるキャラクタの再解釈に焦点を当てる。
オンラインファンダムをデータとして利用し、2つのコミュニティ間のキャラクター表現の変化を探索するために計算手法を適用した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 13:24:29 GMT)
Bypassing the Popularity Bias: Repurposing Models for Better Long-Tail Recommendation [0.0] 我々は,オンラインコンテンツプラットフォーム上で,パブリッシャー間でより公平な露出分布を実現することを目的としている。
そこで本稿では,産業推薦システムの既存コンポーネントを再利用して,表現不足の出版社に価値ある露出を提供する手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:40:55 GMT)
Bio-Inspired Mamba: Temporal Locality and Bioplausible Learning in Selective State Space Models [0.0] Bio-Inspired Mambaは、生物学習の原則とMambaアーキテクチャを統合する、選択的な状態空間モデルのための新しいオンライン学習フレームワークである。
BIMはリアルタイム・リカレント・ラーニング(RTRL)とSpike-Timing-Dependent Plasticity(STDP)のようなローカル・ラーニング・ルールを組み合わせることで、スパイキングニューラルネットワークのトレーニングにおける時間的局所性と生物学的妥当性の課題に対処する。
言語モデリング,音声認識,バイオメディカル信号解析におけるBIMの評価を行い,生物学習の原則を順守しつつ,従来の手法と競合する性能を実証した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 15:11:39 GMT)
Beyond principlism: Practical strategies for ethical AI use in research practices [0.0] 生成的人工知能の急速な普及は、倫理的ガイドラインの開発を上回っている。
既存のアプローチは、科学研究の実践においてAIの倫理的課題に取り組むための実践的なガイダンスをほとんど提供しない。
本稿では,抽象的原則と日々の研究実践のギャップを埋めるために,ユーザ中心の現実主義に着想を得たアプローチを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 11:46:03 GMT)
Beyond Algorithmic Fairness: A Guide to Develop and Deploy Ethical AI-Enabled Decision-Support Tools [0.0] 人工知能(AI)と最適化の統合は、エンジニアリングシステムの効率性、信頼性、レジリエンスを向上させるための大きな約束を持っている。
本稿では,AIと最適化の交差点にアルゴリズムを配置する際に必要となる倫理的考察を明らかにする。
本論文は,ルールの規範的セットを提供するのではなく,研究者間のリフレクションと意識を高めることを目的としている。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 18:37:53 GMT)
AutoFlow: An Autoencoder-based Approach for IP Flow Record Compression with Minimal Impact on Traffic Classification [0.0] 本稿では,深層学習,特にオートエンコーダを用いたIPフローレコードの圧縮手法を提案する。
本研究では,大規模な実世界のネットワークトラフィックデータセットを用いた大規模な実験を通じて,本手法の有効性を実証する。
この作業の影響は、より効率的なネットワーク監視、リソース制約のある環境でのリアルタイム分析、スケーラブルなネットワーク管理ソリューションにまで及んでいる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 11:24:22 GMT)
Analysis of Convolutional Neural Network-based Image Classifications: A Multi-Featured Application for Rice Leaf Disease Prediction and Recommendations for Farmers [0.0] 本研究では,8つの異なる畳み込みニューラルネットワーク(CNN)アルゴリズムを用いて,イネの病原性分類を改善する新しい方法を提案する。
この最先端のアプリケーションの助けを借りて、農家はタイムリーでインフォームドな意思決定ができる。
注目すべき結果は、ResNet-50の75%の精度、DenseNet121の90%の精度、VGG16の84%の精度、MobileNetV2の95.83%の精度、DenseNet169の91.61%の精度、InceptionV3の86%の精度である。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 05:32:01 GMT)
American Sign Language to Text Translation using Transformer and Seq2Seq with LSTM [0.0] アメリカ手話(American Sign Language)は、手話の一つ。
ニューラルマシン翻訳技術の開発は手話翻訳に向けて進んでいる。
Transformerは自然言語処理の最先端となった。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 04:00:33 GMT)
Advancing Cyber Incident Timeline Analysis Through Rule Based AI and Large Language Models [0.0] 本稿では,ルールベース人工知能(R-BAI)アルゴリズムとLarge Language Models(LLM)を組み合わせた新しいフレームワークGenDFIRを紹介する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:16:14 GMT)
Active learning for energy-based antibody optimization and enhanced screening [0.0] 本研究では,特定の目標に対するエネルギー関数を学習するために,ディープラーニングモデルを効率的に訓練する能動的学習ワークフローを提案する。
本手法はRDE-NetworkディープラーニングモデルとRosetaのエネルギー関数に基づくFlex ddGを統合し,Flex ddGに結合するミュータントを効率的に探索する。
HER2結合型Trastuzumab変異株を対象としたケーススタディでは,ランダム選択よりもスクリーニング性能が有意に向上した。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:01:58 GMT)
A short trajectory is all you need: A transformer-based model for long-time dissipative quantum dynamics [0.0] 深層人工知能ニューラルネットワークは、散逸環境に結合した量子システムの長時間の人口動態を予測することができることを示す。
我々のモデルは、リカレントニューラルネットワークのような古典的な予測モデルよりも正確です。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 16:17:52 GMT)
A remark on quantum measuring systems and the holographic principle [0.0] 量子測定対象の連続性は、バルク空間の量子状態の古典化後のホログラフィック原理の基本的な結果であると主張する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 22:59:47 GMT)
A quantum protocol for applying arbitrary phase transformations [0.0] 我々は、$|psirangle=sumpsi(x),|xrangle$を$|psi'rangle=sumpsi(x),eialpha|phi(x)|2,|xrangle$に変換する量子プロトコルを提案する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 09:32:00 GMT)
A logical alarm for misaligned binary classifiers [0.0] 直感は二分分類タスクを実行したエージェントを評価するために形式化されています。
これは、二項応答子のすべての評価によって普遍的に従わなければならない公理の集合を確立することによってなされる。
このアプローチと形式的ソフトウェア検証の類似点と,近年の安全保証AIの課題に対する実用性について論じる。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 10:19:22 GMT)
A Machine Learning-Driven Wireless System for Structural Health Monitoring [0.0] 本稿では,炭素繊維強化ポリマー(CFRP)構造体の構造健康モニタリング(SHM)のための機械学習(ML)モデルを統合した無線システムを提案する。
このシステムは、CFRPクーポンに埋め込まれたカーボンナノチューブ(CNT)センサーを介してデータを収集し、これらのデータを中央サーバーにワイヤレスで送信して処理する。
ディープニューラルネットワーク(DNN)モデルは、機械的特性を予測し、構造的障害を予測できるように拡張し、積極的にメンテナンスし、安全性を高める。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 08:08:38 GMT)
A Framework for Ranking Content Providers Using Prompt Engineering and Self-Attention Network [0.0] 本稿では,クリックやリアクションなどの明示的なユーザフィードバックと,書き込みスタイルやパブリッシュ頻度などのコンテンツベースの特徴を活用して,あるトピックのコンテンツプロバイダをランク付けするフレームワークを提案する。
オンライン実験を用いて,本フレームワークの評価を行い,ユーザが推奨するコンテンツの質,信頼性,多様性を向上できることを示す。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 19:25:58 GMT)
A Comprehensive Survey of Threshold Signatures: NIST Standards, Post-Quantum Cryptography, Exotic Techniques, and Real-World Applications [0.0] 高度な特徴を持つしきい値と分散シグネチャを包括的かつ体系的に調査する。
我々は、多数の署名ファミリーに対して、(セキュアなマルチパーティ計算による)汎用的およびカスタムなしきい値設定手法について検討する。
論文参考訳(メタデータ) (Tue, 17 Sep 2024 01:23:30 GMT)