xGen-VideoSyn-1: High-fidelity Text-to-Video Synthesis with Compressed Representations [120.5] xGen-SynVideo-1(xGen-SynVideo-1)は、テキスト記述からリアルなシーンを生成することができるテキスト・ツー・ビデオ(T2V)生成モデルである。
VidVAEはビデオデータを空間的にも時間的にも圧縮し、視覚トークンの長さを大幅に削減する。
DiTモデルは、空間的および時間的自己アテンション層を取り入れ、異なる時間枠とアスペクト比をまたいだ堅牢な一般化を可能にする。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 05:12:09 GMT)
FENICE: Factuality Evaluation of summarization based on Natural language Inference and Claim Extraction [85.3] 自然言語推論とクレーム抽出(FENICE)に基づく要約のファクチュアリティ評価を提案する。
FENICEは、ソース文書内の情報と、要約から抽出されたクレームと呼ばれる一連の原子的事実との間のNLIベースのアライメントを利用する。
我々の測定基準は、事実性評価のためのデファクトベンチマークであるAGGREFACTに関する新しい技術状況を設定する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 07:30:59 GMT)
A Survey of Neural Code Intelligence: Paradigms, Advances and Beyond [85.0] この調査は、コードインテリジェンスの発展に関する体系的なレビューを示す。
50以上の代表モデルとその変種、20以上のタスクのカテゴリ、および680以上の関連する広範な研究をカバーしている。
発達軌道の考察に基づいて、コードインテリジェンスとより広範なマシンインテリジェンスとの間の新たな相乗効果について検討する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 17:46:10 GMT)
A Hybrid Transformer-Mamba Network for Single Image Deraining [70.6] 既存のデラリング変換器では、固定レンジウィンドウやチャネル次元に沿って自己アテンション機構を採用している。
本稿では,多分岐型トランスフォーマー・マンバネットワーク(Transformer-Mamba Network,TransMamba Network,Transformer-Mamba Network)を提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 10:03:19 GMT)
AdaNAT: Exploring Adaptive Policy for Token-Based Image Generation [65.0] 非自己回帰変換器(NAT)は、少数のステップで良好な品質の画像を合成することができる。
そこで我々はAdaNATを提案する。AdaNATは、生成されたサンプルごとに適切なポリシーを自動的に設定する学習可能なアプローチである。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 03:53:57 GMT)
Thinking Racial Bias in Fair Forgery Detection: Models, Datasets and Evaluations [63.5] 最初に、Fair Forgery Detection(FairFD)データセットと呼ばれる専用のデータセットをコントリビュートし、SOTA(Public State-of-the-art)メソッドの人種的偏見を証明する。
我々は、偽りの結果を避けることができる平均的メトリクスと実用正規化メトリクスを含む新しいメトリクスを設計する。
また,有効で堅牢な後処理技術であるBias Pruning with Fair Activations (BPFA)も提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:28:20 GMT)
ConSiDERS-The-Human Evaluation Framework: Rethinking Human Evaluation for Generative Large Language Models [53.0] 生成型大規模言語モデル(LLM)の人間による評価は多分野にわたる作業であるべきだと論じる。
認知バイアスが、流動的な情報や真理をいかに説明するか、そして、認識の不確実性が、Likertのような評価スコアの信頼性にどのように影響するかを強調します。
本稿では,ConSiDERS-The-Human評価フレームワークを提案する。一貫性,スコーリング基準,差別化,ユーザエクスペリエンス,責任,スケーラビリティの6つの柱からなる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 05:17:17 GMT)
Exploring Parent's Needs for Children-Centered AI to Support Preschoolers' Interactive Storytelling and Reading Activities [52.8] AIベースのストーリーテリングと読書技術は、幼児の生活の中でますます普及しつつある。
本稿では,実践的なストーリーテリングや読書のシナリオでどのように機能するか,親,最も重要な利害関係者,経験,知覚について考察する。
我々の研究結果は、AIベースのストーリーテリングと読書技術は、より没入的で活発な相互作用を提供するが、一連の対話的でアルゴリズム的な課題のために、両親の期待を満たすことはできないことを示唆している。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 07:19:20 GMT)
Fire-Flyer AI-HPC: A Cost-Effective Software-Hardware Co-Design for Deep Learning [50.0] 我々は、シナジスティックなハードウェアとソフトウェアの共同設計フレームワークであるFire-Flyer AI-HPCアーキテクチャとそのベストプラクティスを紹介する。
ディープラーニング(DL)トレーニングでは、1万のPCIe A100 GPUでFire-Flyer 2をデプロイし、DGX-A100の性能評価を達成し、コストを半分に削減し、エネルギー消費を40%削減しました。
HaiScaleや3FS,HAI-Platformといったソフトウェアスタックを通じて,計算処理と通信を重複させることで,大幅なスケーラビリティを実現しました。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 13:33:22 GMT)
Toward a More Complete OMR Solution [49.7] 光音楽認識は、音楽の表記をデジタル形式に変換することを目的としている。
OMRに取り組む1つのアプローチは、画像内の視覚音楽の表記要素を最初に検出するマルチステージパイプラインである。
YOLOv8に基づく音楽オブジェクト検出器を導入し,検出性能を向上する。
第2に、検出出力に基づいて記法組立段階を完了する教師付きトレーニングパイプラインを導入する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 01:09:12 GMT)
VA-learning as a more efficient alternative to Q-learning [49.5] 本稿では,ブートストラップを用いたベネフィット関数と値関数を直接学習するVA学習について紹介する。
VAラーニングは政治から学び、Qラーニングと同様の理論的な保証を享受する。
優位関数と値関数の直接学習により、VA学習はQ学習よりもサンプル効率を向上させる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:28:05 GMT)
Multi-Output Distributional Fairness via Post-Processing [47.9] 本稿では,タスクに依存しない公平度尺度である分散パリティを高めるために,マルチ出力モデルに対する後処理手法を提案する。
提案手法では, モデル出力を実験的なワッサーシュタインバリセンタへ移動させるため, 最適トランスポートマッピングを用いる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 22:41:26 GMT)
OpenRANet: Neuralized Spectrum Access by Joint Subcarrier and Power Allocation with Optimization-based Deep Learning [47.5] 次世代RANは、無線セルラーネットワークのためのAIネイティブインターフェースを備える。
本稿では,OpenRANetにおける共同サブキャリア電力配分の課題に対処する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 13:10:48 GMT)
Towards Tracing Trustworthiness Dynamics: Revisiting Pre-training Period of Large Language Models [47.4] プレトレーニング中のLLMの信頼性の探索を開拓した。
信頼性、プライバシー、毒性、公平性、堅牢性という5つの重要な側面に注目します。
我々は、同様の2相現象、すなわちフィッティングと圧縮を初めて観測した。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 11:31:02 GMT)
Geometric Prior Guided Feature Representation Learning for Long-Tailed Classification [47.1] そこで,本論文では,よく表現されたヘッドクラスの特徴分布の幾何学的情報を活用し,モデルにテールクラスの基盤となる分布を学習させる手法を提案する。
パータード機能は、可能な限りテールクラスの基盤となる分布をカバーし、テスト領域におけるモデルの一般化性能を向上させることを目的としている。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 06:24:18 GMT)
Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.8] 本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 14:15:27 GMT)
Rethinking Backdoor Detection Evaluation for Language Models [45.3] バックドア攻撃は、公開された言語モデルに依存する実践者にとって大きなセキュリティリスクをもたらす。
バックドア検出方法は、リリースされたモデルにバックドアが含まれているかどうかを検出することを目的としている。
既存のバックドア検出手法は標準ベンチマークでバックドアモデルを検出するのに高い精度を持っているが、野生のバックドアを堅牢に識別できるかどうかは不明である。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 09:19:39 GMT)
Gradient-Free Method for Heavily Constrained Nonconvex Optimization [43.9] ゼロ階数(ZO)法は,制約の明示的表現が困難あるいは実現不可能な最適化問題を解くための強力な手法であることが示されている。
本稿では,運動量適応的なステップサイズを持つ2次勾配ゼロ階法(DS)を提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 13:46:54 GMT)
Second-Order Fine-Tuning without Pain for LLMs:A Hessian Informed Zeroth-Order Optimizer [43.9] 古典的な1次メモリを備えた細調整の大型言語モデル(LLM)は、バックプロパゲーションプロセスによって禁止的なGPUを必要とする。
最近の研究は微調整のためのゼロオーダーに変化しており、2つのフォワードパスを使用することでかなりのメモリを節約している。
本研究では, 対角的ヘッセン情報に基づくゼロ階軌道であるHiZOOを提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:36:32 GMT)
An experimental evaluation of Deep Reinforcement Learning algorithms for HVAC control [40.7] 近年の研究では、Deep Reinforcement Learning (DRL)アルゴリズムが従来のリアクティブコントローラより優れていることが示されている。
本稿では,HVAC制御のためのいくつかの最先端DRLアルゴリズムについて,批判的かつ再現可能な評価を行う。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:46:34 GMT)
StimuVAR: Spatiotemporal Stimuli-aware Video Affective Reasoning with Multimodal Large Language Models [39.6] Video Affective Reasoning(ビデオ影響推論)は、ビデオが人間にどのように感じられるかを予測するためのフレームワークである。
Stimu-MLは多言語モデル(LMLM)を用いたビデオ影響推論(「映像影響推論」)のためのフレームワークである。
Stimu-MLには、フレームレベルの認識とトークンレベルの認識という、2段階の刺激認識機構が組み込まれている。
我々は、ビデオに対する視聴者の感情反応を理解し、一貫性と洞察に富んだ説明を提供する上で、Stimu-MLの優位性を実証する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 00:00:50 GMT)
Convex Hull Prediction for Adaptive Video Streaming by Recurrent Learning [38.6] 本稿では,コンテンツ認識凸船体予測の深層学習に基づく手法を提案する。
再帰的畳み込みネットワーク(RCN)を用いて,映像の複雑さを暗黙的に解析し,その凸殻を予測する。
提案するモデルでは, 最適凸殻の近似精度が向上し, 既存の手法と比較して, 競争時間の節約が期待できる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 18:11:08 GMT)
Long-term Causal Inference Under Persistent Confounding via Data Combination [38.0] 実験データと観測データの両方が利用可能である場合の長期治療効果の同定と推定について検討した。
長期の成果は長期間の遅延後にのみ観測されるため、実験データでは測定されず、観測データでのみ記録される。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 02:01:02 GMT)
Suspicion-Agent: Playing Imperfect Information Games with Theory of Mind Aware GPT-4 [37.6] GPT-4は、大規模受動的データに基づいて訓練された最近の大規模言語モデル(LLM)のブレークスルーであり、その知識検索と推論能力で有名である。
本稿では,不完全な情報ゲームに対するGPT-4の学習知識の適用性について述べる。
本稿では,不完全な情報ゲームにおけるGPT-4の能力を活用する革新的なエージェントであるSuspicion-Agentを紹介する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 11:50:41 GMT)
BaseMirror: Automatic Reverse Engineering of Baseband Commands from Android's Radio Interface Layer [35.0] 本稿では,独特な観点から,ベースバンドのセキュリティ問題を明らかにするための新しいアプローチを提案する。
私たちは、ベンダー固有のRILバイナリからベースバンドコマンドを自動的にリバースする静的バイナリ解析ツールBaseMirrorを設計、開発しました。
当社の手法は28のベンダーRILライブラリに適用され,Samsung Exynosのスマートフォンモデルが市場に出回っている。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:14:56 GMT)
Accurate Compression of Text-to-Image Diffusion Models via Vector Quantization [33.2] 最先端のテキスト・トゥ・イメージモデルは、実際はアクセスしにくくなっている。
後学習量子化(PTQ)は、事前訓練されたモデルの重みを低ビット表現に圧縮することでこの問題に対処する。
この研究は、より汎用的なベクトル量子化(VQ)が大規模テキスト・画像拡散モデルに対して高い圧縮率を達成することを実証している。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 16:09:20 GMT)
Translating Images to Road Network: A Sequence-to-Sequence Perspective [32.4] 道路網は高精細地図の生成に不可欠である。
既存のメソッドは、2つのタイプのデータドメインを効果的にマージするのに苦労しています。
我々は、ユークリッドデータと非ユークリッドデータの両方をRoadNet Sequenceと呼ばれる整数列に投影することで、両方のデータ領域の統一表現を提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 06:35:17 GMT)
InfiniBench: A Comprehensive Benchmark for Large Multimodal Models in Very Long Video Understanding [31.1] InfiniBenchは、数分間から数時間の長いビデオを理解するためのベンチマークである。
1) ビデオの長さは, 平均52.59分, 2) 最大数の質問対108.2K, 3) 異なる9つのスキルを検査し, 複数選択の質問とオープンエンドの質問の両方を含む質問の多様性 4) 映像ソースは映画やテレビ番組から来る人間中心である。
GPT-4oやGemini 1.5 Flashのような主要なAIモデルでさえ、長時間のビデオ理解において高いパフォーマンスを達成する上で課題に直面している。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 10:34:37 GMT)
DAP: Diffusion-based Affordance Prediction for Multi-modality Storage [31.1] 本稿では,多モードオブジェクト記憶問題に対する拡散型Affordance予測パイプラインを提案する。
我々の実験は、DAPが現在最先端のRDDiffよりも優れた性能と訓練効率を示すものである。
我々の貢献は、計算効率が高く、現実の変動性を扱うことができるソリューションを提供することで、ロボット操作研究のギャップを埋める。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 16:37:29 GMT)
Post-OCR Text Correction for Bulgarian Historical Documents [31.1] 我々は、最初の標準ブルガリア正書法であるドリノフ正書法で書かれた歴史的ブルガリア文書のOCRテキスト補正を評価するための最初のベンチマークデータセットを作成する。
次に、直近のLLMとエンコーダ・デコーダ・フレームワークを用いて、斜めの注意損失とコピー・アンド・カバー機構を増強し、OCR後のテキスト修正を改善する。
提案手法は,認識時に導入された誤りを低減し,文書の品質を25%向上させる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 19:27:46 GMT)
Testing and Evaluation of Large Language Models: Correctness, Non-Toxicity, and Fairness [30.6] 大規模言語モデル(LLM)は、過去数年間、人々の仕事や日常生活に急速に浸透してきた。
この論文は、ソフトウェアテストと自然言語処理の両方の観点から、LSMの正当性、非毒性、公平性に焦点を当てている。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 22:21:04 GMT)
Aligning Medical Images with General Knowledge from Large Language Models [30.4] ViPは、医用画像解析のための視覚症状誘導学習フレームワークである。
viPは視覚症状発生器(VSG)とデュアルプロンプトネットワークという2つの重要なコンポーネントから構成される。
viPは、2つの挑戦的なデータセットで最先端のメソッドより優れている。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 03:49:57 GMT)
Palantir: Towards Efficient Super Resolution for Ultra-high-definition Live Streaming [29.6] Palantirは、きめ細かいパッチレベルのスケジューリングを備えた、最初のニューラルネットワークで強化されたUHDライブストリーミングシステムである。
Palantirは、エンドツーエンドのレイテンシの5.7%未満で、無視可能なスケジュール遅延を発生させる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:32:50 GMT)
SMAFormer: Synergistic Multi-Attention Transformer for Medical Image Segmentation [28.5] SMAFormerはトランスフォーマーをベースとしたアーキテクチャで,腫瘍や臓器のセグメンテーションを強化するために複数の注意機構を融合する。
まず、Pixel Attention、Channel Attention、Spatial Attention for Feature Enrichmentの利点を生かしたSMAトランスフォーマーブロックを提案する。
第2に,注目機構遷移と特徴融合の間に生じる情報損失の課題に対処するため,我々は特徴融合変調器を設計する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 04:23:33 GMT)
Compositional 3D-aware Video Generation with LLM Director [27.6] 本稿では,3次元表現において各概念を個別に生成し,大言語モデルと2次元拡散モデルから先行概念を合成する新しいパラダイムを提案する。
本手法では,テキストから高忠実度映像を生成でき,各概念を柔軟に制御できる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 23:07:22 GMT)
Online-Score-Aided Federated Learning: Taming the Resource Constraints in Wireless Networks [26.7] 我々は,無線アプリケーションに関連するタスクを学習するために,OSAFLと呼ばれる新しいFLアルゴリズムを提案する。
当社の大規模なシミュレーションでは,3つの異なるデータセットを持つ2つのタスクについて,OSAFLの有効性を4つの一般的なMLモデルで検証しています。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 21:11:40 GMT)
ToddlerAct: A Toddler Action Recognition Dataset for Gross Motor Development Assessment [26.2] ToddlerActは幼児の運動行動認識データセットである。
本稿では,データ収集プロセス,アノテーション方法論,データセットの特徴について述べる。
本研究は,幼児期における運動機能発達の正確性を評価するための領域特異的データセットの重要性を明らかにするものである。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 04:31:46 GMT)
Foundations of Multivariate Distributional Reinforcement Learning [24.8] 本研究は,多変量分布動的計画法と時間差分学習を実証的に収束させる,最初のオラクルフリーで計算可能なアルゴリズムを導入する。
驚いたことに、報酬次元が1ドルより大きい場合、分類的TD学習の標準解析は失敗し、これは質量1ドルの符号付き測度空間に新しい射影で解決する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 02:10:04 GMT)
EraseDraw: Learning to Insert Objects by Erasing Them from Images [24.6] 以前の作業は、画像のグローバルな変更、非現実的な空間的な場所へのオブジェクト挿入、不正確な光の詳細の生成によって失敗することが多い。
我々は、最先端のモデルではオブジェクト挿入が不十分であるが、オブジェクトを削除し、自然画像の背景を非常によく消し去ることができることを観察した。
様々な領域にまたがる多様な挿入プロンプトと画像について,説得力のある結果を示す。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 18:37:48 GMT)
RI-MAE: Rotation-Invariant Masked AutoEncoders for Self-Supervised Point Cloud Representation Learning [24.5] マスク付きポイントモデリング手法は,最近,ポイントクラウドデータの自己教師付き学習において大きな成功を収めている。
これらの手法は回転に敏感であり、回転変動に遭遇するときにしばしば鋭い性能低下を示す。
本稿では,2つの課題に対処するために,回転不変マスク付きオートエンコーダ(RI-MAE)を提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 05:17:55 GMT)
Training-Free Sketch-Guided Diffusion with Latent Optimization [22.9] 本稿では,既存のテキスト・画像生成モデルを拡張してスケッチを付加条件として組み込む,革新的なトレーニングフリーパイプラインを提案する。
入力スケッチによく似たレイアウトと構造を持つ新しい画像を生成するために,これらのスケッチの中核となる特徴を拡散モデルのクロスアテンションマップを用いて追跡できることを見出した。
本稿では, 生成過程の中間段階において, 雑音に富んだ遅延を洗練させる手法である潜時最適化を導入する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 00:44:03 GMT)
Evaluating Large Language Models for Health-related Queries with Presuppositions [18.7] UPHILLは健康関連クエリーからなるデータセットで、予測の度合いは様々である。
InstructGPT, ChatGPT, BingChatモデルの実際の精度と一貫性を評価する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 16:56:50 GMT)
Predicting the Target Word of Game-playing Conversations using a Low-Rank Dialect Adapter for Decoder Models [16.3] 我々は、LoRDDと呼ばれるアーキテクチャのデコーダモデルに方言アダプタの考え方を拡張した。
LoRDDはタスクアダプタと方言アダプタを組み合わせており、後者はMD-3からの擬似並列会話に対照的な学習を取り入れている。
両モデル(Mistral と Gemma)における en-IN 会話の結果, LoRDD は TWP の 4 つのベースラインを上回り, en-US とのパフォーマンスギャップは単語類似度で 12% ,精度で 25% 向上した。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 05:53:39 GMT)
Multi-scale Multi-instance Visual Sound Localization and Segmentation [15.6] 本稿では,M2VSLという新しいマルチスケール視覚音像定位フレームワークを提案する。
M2VSLは入力画像から音源に関連するマルチスケール意味的特徴を学習し,音像の局所化を行う。
我々は,VGGSound-Instruments,VGG-Sound Sources,AVSBenchベンチマークについて広範な実験を行った。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:43:22 GMT)
Hidden flaws behind expert-level accuracy of multimodal GPT-4 vision in medicine [15.5] GPT-4V(Generative Pre-trained Transformer 4 with Vision)は、医学的課題において、医師よりも優れる。
本研究は,GPT-4Vのイメージ理解の理論的根拠,医用知識の想起,ステップバイステップのマルチモーダル推論を包括的に分析することにより,現在の範囲を拡大する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 23:51:14 GMT)
Expanding self-orthogonal codes over a ring $\Z_4$ to self-dual codes and unimodular lattices [15.4] 長さが4ドルから8ドルを超える自己双対コードは、この方法で構築可能であることを示す。
Z_4$の長さが27ドル、29ドル、29ドル、33ドル、34ドルという5つの新しい自己双対コードを見つけました。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 09:38:42 GMT)
UDGS-SLAM : UniDepth Assisted Gaussian Splatting for Monocular SLAM [15.4] 近年の単眼神経深度推定の進歩により、単眼SLAMのためのガウススプラッティングフレームワークにUniDepthを統合する研究が進められている。
本研究は,ガウススティングフレームワークにおける深度推定のためのRGB-Dセンサの不要な新しいアプローチであるUDGS-SLAMを提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 06:18:46 GMT)
Do Concept Bottleneck Models Respect Localities? [14.8] 概念に基づく手法は、人間の理解可能な概念を用いてモデル予測を説明する。
ローカリティ(Localities)とは、概念の価値を予測する際に、関連する機能のみを使用することである。
CBMは、独立概念が重複しない特徴部分集合に局所化されている場合でも、局所性を捉えない。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 20:03:49 GMT)
TrackSSM: A General Motion Predictor by State-Space Model [14.7] 現在のモーションモデルは、異なるアプリケーションシナリオで効率的かつ効果的であるのに苦労しています。
本稿では,最近普及しているエンコーダ・デコーダ・モーション・フレームワークである状態空間モデル(SSM)にインスパイアされたTrackSSMを提案する。
TrackSSMはさまざまなトラッキングシナリオに適用可能で、複数のベンチマークで優れたトラッキング性能を実現している。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:45:56 GMT)
A rapid approach to urban traffic noise mapping with a generative adversarial network [14.7] 本研究では,GANを代理モデルとして利用する都市交通騒音の高速マッピング手法を開発した。
トレーニングされたモデルはGrasshopperにツールとして統合され、トラフィックノイズマップの迅速な生成を容易にする。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:16:32 GMT)
DER-GCN: Dialogue and Event Relation-Aware Graph Convolutional Neural Network for Multimodal Dialogue Emotion Recognition [14.6] 本稿では,多モーダル感情認識(DER-GCN)のための新しい対話・イベント関係対応グラフ畳み込みニューラルネットワークを提案する。
話者間の対話関係をモデル化し、潜在イベント関係情報をキャプチャする。
DER-GCNモデルの有効性を検証したIEMOCAPおよびMELDベンチマークデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:41:30 GMT)
CILF-CIAE: CLIP-driven Image-Language Fusion for Correcting Inverse Age Estimation [14.6] 年齢推定タスクは、画像中の顔の特徴を分析して、個人の年齢を予測することを目的としている。
既存のCLIPベースの年齢推定手法では、高いメモリ使用量が必要であり、エラーフィードバック機構が欠如している。
逆年齢推定(CILF-CIAE)のための新しいCLIP駆動画像言語融合法を提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:56:28 GMT)
Adversarial Representation with Intra-Modal and Inter-Modal Graph Contrastive Learning for Multimodal Emotion Recognition [14.6] マルチモーダル感情認識 (AR-IIGCN) 法に対して, モーダル内およびモーダル間グラフコントラストを用いた新しい適応表現を提案する。
まず、ビデオ、オーディオ、テキストの特徴を多層パーセプトロン(MLP)に入力し、それらを別々の特徴空間にマッピングする。
第2に,逆表現による3つのモーダル特徴に対するジェネレータと判別器を構築する。
第3に、モーダル内およびモーダル間相補的意味情報を取得するために、コントラッシブグラフ表現学習を導入する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:49:43 GMT)
TSO: Self-Training with Scaled Preference Optimization [14.4] 我々は、追加の報酬モデルを訓練することなく、自己学習による選好学習を行う、選好最適化のためのフレームワークTSOを提案する。
TSOは、モデル行列を構築し、人間の嗜好応答を取り入れることで、応答の多様性を高める。
実験の結果、TSOは様々なアライメント評価ベンチマークにおいて、既存の主流手法よりも優れていた。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 05:37:01 GMT)
HSF: Defending against Jailbreak Attacks with Hidden State Filtering [14.0] 隠れ状態フィルタ(HSF)に基づくジェイルブレイク攻撃防御戦略を提案する。
HSFは、推論プロセスが始まる前に、モデルが相手の入力をプリエンプティブに識別し、拒否することを可能にする。
不正なユーザクエリに対する応答を最小限に抑えながら、Jailbreak攻撃の成功率を大幅に低下させる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 06:50:07 GMT)
YA-TA: Towards Personalized Question-Answering Teaching Assistants using Instructor-Student Dual Retrieval-augmented Knowledge Fusion [13.2] そこで,本研究では,講義に基礎を置く学生に対して,理解し易い回答を提供するために,YA-TA(Virtual Teaching Assistant, VTA)を提案する。
本稿では、教師と学生の知識と知識の二重検索を組み込んだDual Retrieval-augmented Knowledge Fusion(DRAKE)フレームワークについて紹介する。
YA-TAのさらなる拡張として、Q&Aボードや自己実践ツールが提供され、全体的な学習体験が向上します。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 05:37:51 GMT)
Fairness in Survival Analysis with Distributionally Robust Optimization [13.2] 本稿では,全てのサブ集団における最悪のエラーを最小限に抑えるため,生存分析モデルにおける公平性向上のための一般的なアプローチを提案する。
このアプローチは、既存の生存分析モデルの多くを、公平性を同時に促進するモデルに変換するために使用することができる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:03:20 GMT)
Tripartite entanglement and tripartite steering in three-qubit pure states induced by vacuum--one-photon superpositions [12.8] 本稿では,$leftvert psi rightrangle _123$ の真の三部構造エンタングルについて,コンカレンスフィリングの尺度を用いて検討する。
状態 $leftvert psi rightrangle _123$ は絡み合いを示すが、パラメータ空間のかなりの部分ではステアリングは達成不可能である。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 00:03:29 GMT)
Dynamical system prediction from sparse observations using deep neural networks with Voronoi tessellation and physics constraint [12.6] 本稿では,Voronoi Tessellation (DSOVT) フレームワークを用いたスパース観測からの動的システム予測について紹介する。
ボロノイテッセルレーションと深層学習モデルを統合することで、DSOVTは疎く非構造的な観測で力学系の予測に適している。
純粋にデータ駆動モデルと比較して、我々の物理学に基づくアプローチは、明示的に定式化された力学の中で物理法則を学習することができる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 13:43:52 GMT)
Enhancing Transferability of Adversarial Attacks with GE-AdvGAN+: A Comprehensive Framework for Gradient Editing [12.1] 転送可能な敵攻撃は、ディープニューラルネットワークに重大な脅威をもたらす。
本稿では、GE-AdvGAN+という、勾配編集に基づく転送可能な攻撃のための新しいフレームワークを提案する。
我々のフレームワークは、ほとんどすべての主流攻撃手法を統合し、転送可能性を高めながら、計算資源の消費を大幅に削減する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 09:38:41 GMT)
FBD-SV-2024: Flying Bird Object Detection Dataset in Surveillance Video [11.8] このデータセットは483のビデオクリップで構成され、合計28,694フレームである。
そのうち23,833体は28,366羽の空飛ぶ鳥を含む。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 01:11:57 GMT)
PSLF: A PID Controller-incorporated Second-order Latent Factor Analysis Model for Recommender System [11.7] 2次ベースHDIモデル(SLF)解析はグラフ学習において特に高次および不完全因子データレートにおいて優れた性能を示す。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 13:01:58 GMT)
Towards Secure and Usable 3D Assets: A Novel Framework for Automatic Visible Watermarking [11.2] 3Dモデル(特にAI生成モデル)は、エンターテイメントなどさまざまな業界で最近急増している。
我々は、透かしの品質と資産性という2つの競合する側面から、3D視覚的な透かしを自動化するための新しいタスクを厳格に定義する。
そこで本稿では,任意の3D資産上に配置する適切な位置,向き,個数を自動的に決定する透かしを埋め込む手法を提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 00:52:29 GMT)
A Survey for Foundation Models in Autonomous Driving [10.9] 大規模言語モデルは、自動運転における計画とシミュレーションに寄与する。
ビジョンファウンデーションモデルは、3Dオブジェクトの検出やトラッキングといった重要なタスクに適応している。
多様な入力を統合するマルチモーダル基礎モデルは、例外的な視覚的理解と空間的推論を示す。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 02:28:20 GMT)
Evolutionary Algorithms Are Significantly More Robust to Noise When They Ignore It [10.2] 再評価の必要性は過大評価される可能性があり、実際は有害である。
この進化的アルゴリズムの最初の分析は、再評価なしに単一目的雑音の問題を解くことで、そのようなアルゴリズムが以前考えられていたよりもずっと良いノイズに対処できることを示している。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 00:10:10 GMT)
How Does Diverse Interpretability of Textual Prompts Impact Medical Vision-Language Zero-Shot Tasks? [10.1] 近年の医用視力訓練の進歩は、ゼロショットの医療用視力タスクを大幅に強化した。
これらのタスクのパフォーマンスは、カテゴリを記述するテキストプロンプトの変動性に大きく影響される。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 20:43:06 GMT)
First Competition on Presentation Attack Detection on ID Card [9.9] バイオメトリックス国際会議(IJCB2024)におけるIDカードの提示検出(PAD-IDCard)に関するコンペティションを要約する。
この競技会には、学業と産業の両方から合計10の登録チームが集まった。
要約すると、「匿名」を選択したチームは74.80%の最高ランキングに達し、続いて77.65%の「IDVC」チームが続いた。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 07:24:19 GMT)
GSpect: Spectral Filtering for Cross-Scale Graph Classification [9.8] クロススケールグラフ分類タスクのための高度なスペクトルグラフフィルタリングモデルであるGSpectを提案する。
オープンデータセットでは、GSpectは分類精度を平均1.62%改善し、ProteINSでは最大3.33%向上した。
GSpectは、クロススケールグラフ分類研究のギャップを埋め、脳疾患の診断のような応用研究を支援する可能性がある。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 03:26:32 GMT)
Breaking Down Financial News Impact: A Novel AI Approach with Geometric Hypergraphs [9.6] 急激で不安定な金融市場では、金融ニュースに基づく株価の動きを正確に予測することが投資家やアナリストにとって重要である。
伝統的なモデルは、しばしばニュースイベントと市場の反応の間の複雑なダイナミックな関係を捉えるのに苦労する。
本稿では、金融ニュースが市場行動に与える影響を分析するために、説明可能な人工知能(XAI)を活用した新しいアプローチを提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:18:45 GMT)
An Enhanced Batch Query Architecture in Real-time Recommendation [9.1] Webサイトやアプリの産業レコメンデーションシステムでは、ユーザの関心事に関連するトップnの結果をリコールし、予測することが不可欠である。
我々は,リアルタイムレコメンデーションシステムのための高性能バッチクエリアーキテクチャの設計と実装を行った。
このアーキテクチャは1年以上にわたってbilibiliレコメンデーションシステムにデプロイされ、最小限のリソース増加を伴う10倍のモデルをサポートする。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 09:19:41 GMT)
Adaptive Split Balancing for Optimal Random Forest [8.9] そこで本研究では,新しい適応型分割バランス法を用いて木を構築するランダムフォレストアルゴリズムを提案する。
本手法は,データから木構造を適応的に学習しながら,シンプルでスムーズなシナリオで最適性を実現する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 03:23:50 GMT)
Graph Information Bottleneck for Remote Sensing Segmentation [8.9] 本稿では、画像をグラフ構造として扱い、リモートセンシングセグメンテーションのための単純なコントラスト視覚GNNアーキテクチャを提案する。
具体的には,ノードマップとエッジマップのグラフビューを構築し,最適なグラフ構造表現を得る。
UNetの畳み込みモジュールをSC-ViGモジュールに置き換え、セグメンテーションと分類タスクを完成させる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:53:19 GMT)
Data Augmentation for Image Classification using Generative AI [8.7] データ拡張はデータセットのサイズを拡大するための有望なソリューションである。
最近のアプローチでは、生成AIモデルを使用してデータセットの多様性を改善している。
我々はAGA(Automated Generative Data Augmentation)を提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 21:16:43 GMT)
Multi-label Zero-Shot Audio Classification with Temporal Attention [8.5] 本研究では,マルチラベルゼロショット音声分類を行う手法を提案する。
我々は時間的注意を適応させ、その音響的および意味的適合性に基づいて、異なる音声セグメントに重みを割り当てる。
その結果,時間的注意がマルチラベルシナリオにおけるゼロショット音声分類性能を向上させることがわかった。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 09:49:41 GMT)
Efficient Long-distance Latent Relation-aware Graph Neural Network for Multi-modal Emotion Recognition in Conversations [8.1] 会話におけるマルチモーダル感情認識のための高効率長距離遅延関係認識グラフニューラルネットワーク(ELR-GNN)を提案する。
ELR-GNNはIEMOCAPとMELDのベンチマークで最先端のパフォーマンスを実現し、それぞれ実行時間を52%と35%削減した。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:44:38 GMT)
Statistical and dynamical aspects of quantum chaos in a kicked Bose-Hubbard dimer [7.7] 本研究は, 繰り返し変調された2サイト型ボース・ハバードモデル (Bose-Hubbard dimer) について検討した。
Floquet演算子のスペクトル統計を解析することにより、システムは相互作用強度を増大させ、規則性からカオスへの移行を行うことを明らかにした。
半古典的分析は、カオス状態のシステムは初期状態の選択によって異なる動的挙動を示す可能性があることを示唆している。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 07:18:11 GMT)
S3E: A Mulit-Robot Multimodal Dataset for Collaborative SLAM [7.5] 拡張型マルチモーダルデータセットであるS3Eを紹介する。
S3Eは4つの異なる共同軌道パラダイムを横断する無人地上車両群によって捕獲され、13の屋外および5つの屋内シーケンスを含んでいる。
これらのシーケンスは、360度LiDAR点雲、高分解能ステレオ画像、高周波慣性測定ユニット(IMU)、UWB(Ultra-wideband)の相対観測を含む、細心の同期と空間的に校正されたデータストリームを特徴としている。
我々のデータセットは、スケール、シーンの多様性、データの複雑度に関する過去の取り組みを上回るだけでなく、協調的なSLAM方法論と個別のSLAM方法論の徹底的な分析とベンチマークも提供しています。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 13:35:33 GMT)
Multi-Task Combinatorial Bandits for Budget Allocation [7.5] 今日のトップ広告主は、通常、数百のキャンペーンを同時に管理し、年間を通じて一貫して新しいキャンペーンをローンチします。
マーケティングマネージャにとって重要な課題は、累積リターンを最大化するために、各キャンペーンにおいて様々な広告ラインで限られた予算を最適に割り当てることである。
本稿では,マルチタスクバンディット問題として予算配分を定式化し,新たなオンライン予算配分システムを提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 23:19:49 GMT)
The Foundational Capabilities of Large Language Models in Predicting Postoperative Risks Using Clinical Notes [7.4] 各種微調整戦略を用いて,大言語モデル(LLM)の術後6つのリスク予測における性能について検討した。
事前訓練されたLLMは、AUROCが38.3%、AUPRCが33.2%で従来の単語の埋め込みよりも優れていた。
最高性能は統一された基礎モデルで達成され、AUROCは3.6%、AUPRCは2.6%改善された。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 19:42:31 GMT)
FORAY: Towards Effective Attack Synthesis against Deep Logical Vulnerabilities in DeFi Protocols [7.4] 我々は,DeFiプロトコルの深い論理的バグに対して,非常に効果的な攻撃合成フレームワークであるForayを紹介する。
DSLに基づいて、まず指定されたDeFiプロトコルをトークンフローグラフにコンパイルします。
そこで我々は,特定の攻撃目標に対する攻撃スケッチを合成する効率的なスケッチ生成手法を設計した。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 01:48:25 GMT)
Graph-Jigsaw Conditioned Diffusion Model for Skeleton-based Video Anomaly Detection [7.1] スケルトンに基づくビデオ異常検出(SVAD)はコンピュータビジョンにおいて重要な課題である。
本稿では,Skeleton-based Video Anomaly Detection (GiCiSAD) のためのグラフ-Jigsaw条件付き拡散モデル(Graph-Jigsaw Conditioned Diffusion Model)を提案する。
広く使われている4つの骨格ベースのビデオデータセットの実験では、GiCiSADはトレーニングパラメータが大幅に少ない既存の手法よりも優れていた。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 02:36:11 GMT)
CoRA: Optimizing Low-Rank Adaptation with Common Subspace of Large Language Models [7.1] Low-Rank Adaptation (LoRA) 戦略は、微調整された大型モデルにおける効率と性能のバランスをとる。
我々は、共有知識を活用してLoRAトレーニングを最適化するtextbfCoRAを提案する。
実験の結果,最初のアプローチは,パラメータの半減よりも効率が良く,元のLoRAファインチューニングと同じ効果が得られることがわかった。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:48:27 GMT)
Exploring the Problems, their Causes and Solutions of AI Pair Programming: A Study on GitHub and Stack Overflow [6.7] AIプログラマペアであるGitHub Copilotは、コードスニペットの大規模なコーパスでトレーニングされた機械学習モデルを使用して、コード提案を生成する。
ソフトウェア開発で人気があるにもかかわらず、Copilotと仕事をする実践者の実際の経験に関する実証的な証拠は限られている。
473のGitHubイシュー、706のGitHubディスカッション、142のStack Overflowポストからデータを収集しました。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:46:51 GMT)
With Good MT There is No Need For End-to-End: A Case for Translate-then-Summarize Cross-lingual Summarization [6.6] 単純なテキストトランスレート・サマライズパイプライン設計は、大量の並列データにアクセス可能なエンドツーエンドシステムでも一貫して性能が向上することを示す。
近年の出版動向とは対照的に,モノリンガル要約と翻訳タスクの個々の進歩は,エンド・ツー・エンドシステムよりも優れた性能をもたらすことが示唆されている。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 10:44:16 GMT)
A Novel ICD Coding Method Based on Associated and Hierarchical Code Description Distillation [6.5] ICD符号化は、ノイズの多い医療文書入力による多ラベルテキスト分類の問題である。
近年のICD符号化の進歩により、医療用ノートやコードに付加的なデータや知識ベースを組み込むことで、性能が向上した。
コード表現学習の改善と不適切なコード代入の回避を目的とした,関連および階層型コード記述蒸留(AHDD)に基づく新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 07:52:40 GMT)
Towards a theory of how the structure of language is acquired by deep neural networks [6.4] 木のような生成モデルを用いて、自然言語で見られる階層構造の多くをキャプチャする。
トークンとトークンの相関は文法の隠れ変数の表現を構築するのに有効であることを示す。
トレーニングセットのサイズと効果的な相関範囲の関係は、我々の合成データセットを超えていると推測する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 16:36:58 GMT)
Learning linear acyclic causal model including Gaussian noise using ancestral relationships [6.3] LiNGAMは因果モデルに対して線形性と連続的な非ガウス的障害を仮定する。
PCアルゴリズムは因果モデルへの忠実性以外の仮定をしない。
本稿では,線形因果モデルの分布等価パターンを低時間で学習するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 11:07:15 GMT)
Self-supervised Fusarium Head Blight Detection with Hyperspectral Image and Feature Mining [6.3] フサリウムヘッドブライト(Fusarium Head Blight、FHB)は小麦(ダラムを含む)、大麦、オート麦、その他の小さな穀物、トウモロコシに深刻な菌類病である。
伝統的に、訓練された農学者や測量士は、労働集約的で非現実的でスケールが難しい手動の識別を行う。
ディープラーニングとハイパースペクトルイメージング(HSI)とリモートセンシング(RS)技術の進歩により、ディープラーニング、特にコナールニューラルネットワーク(CNN)が有望なソリューションとして登場してきた。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 09:09:02 GMT)
Lyapunov Neural ODE Feedback Control Policies [6.2] 本稿では,Lyapunov-NODE制御(L-NODEC)による連続時間最適制御問題の解法を提案する。
我々は,L-NODECが制御システムの指数的安定性を保証するとともに,不確実な初期条件に対する対角的ロバスト性を保証することを確立する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 08:59:18 GMT)
3D Gaussian Splatting for Large-scale 3D Surface Reconstruction from Aerial Images [6.1] AGS(Aerial Gaussian Splatting)という3DGSに基づく空中画像の大規模再構成手法を提案する。
本研究では,大規模空中画像に適したデータチャンキング手法を提案する。
また、大域的幾何整合性を高め、再構成精度を向上させるため、多視点幾何整合性制約を導入する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 08:17:24 GMT)
Security Loophole Induced by Photorefractive Effect in Continous-variable Quantum Key Distribution System [4.8] フォトリフラクティブ・エフェクト(PE)によるCVQKDのセキュリティ・抜け穴の解析を行った。
PEによる変調器の屈折率変化は、最終秘密鍵レートの過大評価または過小評価につながる可能性がある。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 16:25:54 GMT)
Mastoidectomy Multi-View Synthesis from a Single Microscopy Image [4.8] 単一CI顕微鏡画像から合成多視点映像を生成することができる新しいパイプラインを提案する。
本研究は, 術前CT検査を用いて, 乳頭切除後の表面を予測し, 本目的のために設計した方法である。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 16:45:24 GMT)
WikiCausal: Corpus and Evaluation Framework for Causal Knowledge Graph Construction [4.6] 本稿では,因果知識グラフ構築のためのコーパス,タスク,評価フレームワークを提案する。
この評価は、Wikidataの既存の因果関係を用いて部分的に実施され、リコールを測定する。
コーパスと評価フレームワークによって、各タスクに適したモデルが効果的に見つけることができることを示す。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 02:21:39 GMT)
Exact zeros of fidelity in finite-size systems as a signature for probing quantum phase transitions [4.4] 有限サイズ系における完全零点の出現は, 量子相転移の検出に応用できることを示す。
我々の研究は、有限サイズの系の忠実性の計算によって量子相転移を検出する実践的な方法を提供する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 06:55:12 GMT)
Streamlining Forest Wildfire Surveillance: AI-Enhanced UAVs Utilizing the FLAME Aerial Video Dataset for Lightweight and Efficient Monitoring [4.3] 本研究では,災害対応シナリオにおけるリアルタイムデータ処理の必要性を認識し,航空映像理解のための軽量かつ効率的なアプローチを提案する。
提案手法は、ポリシーネットワークを介してビデオ内の冗長部分を識別し、フレーム圧縮技術を用いて余分な情報を除去する。
ベースラインと比較して,提案手法は計算コストを13倍以上削減し,精度を3$%向上させる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 17:26:53 GMT)
Learning Co-Speech Gesture Representations in Dialogue through Contrastive Learning: An Intrinsic Evaluation [4.2] 対面対話では, 文脈的要因によって, 話し言葉の形式的意味の関係が変化する。
ジェスチャーの多様性と音声との関係を考慮した意味あるジェスチャー表現の学習法
本稿では,自己指導型コントラスト学習技術を用いて,骨格情報と音声情報からジェスチャー表現を学習する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 08:53:18 GMT)
GMFL-Net: A Global Multi-geometric Feature Learning Network for Repetitive Action Counting [4.1] GMFL-Net(Global Multi-geometric Feature Learning Network)を提案する。
具体的には,多幾何学的特徴を融合させて情報表現を改善するMIAモジュールを設計する。
また、ポイントワイド素子とチャネルワイド素子の相互依存性を高めるGBFLモジュールを設計する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 02:18:26 GMT)
Contrastive Augmentation: An Unsupervised Learning Approach for Keyword Spotting in Speech Technology [4.1] 教師なしコントラスト学習と拡張一意的手法を組み合わせた新しい手法を提案する。
我々の方法では、ニューラルネットワークがラベルのないデータセットでトレーニングすることができ、下流タスクのパフォーマンスが向上する可能性がある。
本稿では,ボトルネック層の特徴と音声再構成情報との類似性を利用した音声強化に基づく教師なし学習手法を提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 05:40:37 GMT)
Slug Mobile: Test-Bench for RL Testing [4.1] Slug Mobileは、AVのシミュレートと現実のギャップに対処するために作られた、第10の自動運転車だ。
他の10倍のAVで見つかった従来のセンサーに加えて、Dynamic Vision Sensorも搭載しました。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 00:02:32 GMT)
Discovery of Small Ultra-short-period Planets Orbiting KG Dwarfs in Kepler Survey Using GPU Phase Folding and Deep Learning Detection System [4.0] ケプラー測光データに対して, GPFC法と呼ばれる畳み込みニューラルネットワークを組み合わせた新しいGPU位相Foldingアルゴリズムを用いる。
現在までに、5つの地球下短周期の候補を特定している。
我々の3つの発見のうち、K01821.b、K01522.c、K03404.bはケプラーデータセットでG小星を公転していると確認された全てのUSPの中で最小の惑星である。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 18:36:53 GMT)
ActionPose: Pretraining 3D Human Pose Estimation with the Dark Knowledge of Action [3.9] 2次元から3次元の人間のポーズリフトは、深さのあいまいさと閉塞性により不適切な問題である。
本稿では,アクションラベルのテキスト埋め込みとモーション埋め込みを連携させることにより,アクション知識を活用するフレームワークであるActionPoseを提案する。
実験は、公開データセット上での3Dポーズ推定における最先端のパフォーマンスを達成するActionPoseの有効性を実証する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 13:03:26 GMT)
Geospatial foundation models for image analysis: evaluating and enhancing NASA-IBM Prithvi's domain adaptability [3.8] 本稿では,NASAが最近リリースしたNASA-IBM GFM Prithviの高レベル画像解析における予測性能について評価する。
Prithviは、高解像度のリモートセンシング画像の時系列に基づいてトレーニングされた最初のオープンソースのGFMの1つである。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:51:23 GMT)
Mapping earth mounds from space [3.6] 植生の規則的なパターンは広い景観と見なされているが、その世界的な範囲は推定されていない。
その中でも、斑点のある風景は、気候変動の文脈に特に関心がある。
本稿は、いくつかの地形と地理的領域における最先端のディープネットワークをベンチマークする。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 18:08:37 GMT)
Digit Recognition using Multimodal Spiking Neural Networks [3.0] スパイキングニューラルネットワーク(SNN)は、生物学的にデータ処理にインスパイアされた第3世代のニューラルネットワークである。
SNNは、そのニューロモルフィック性のためにイベントベースのデータを処理するために使用される。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 22:27:40 GMT)
Demo: FedCampus: A Real-world Privacy-preserving Mobile Application for Smart Campus via Federated Learning & Analytics [2.9] FedCampusは、アンダーライン学習(FL)とフェデレーション分析(FA)を備えたスマートアンダーラインキャンパスのためのプライバシ保護モバイルアプリである。
私たちのアプリは、FedCampusバックエンドプラットフォームを通じてFL/FAに処理パラメータが使用されるスマートウォッチからの差分プライバシ(DP)を介して、プライバシを保存する処理データを統合しています。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 01:58:36 GMT)
From Prediction to Application: Language Model-based Code Knowledge Tracing with Domain Adaptive Pre-Training and Automatic Feedback System with Pedagogical Prompting for Comprehensive Programming Education [2.9] 本稿では,言語モデルに基づくコード知識追跡(CodeLKT)を紹介する。
CodeLKTは、言語モデルに基づく知識追跡(LKT)のプログラミング教育への革新的な応用である。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 01:36:38 GMT)
Rapid Gyroscope Calibration: A Deep Learning Approach [2.9] 我々は,ディープラーニング手法を用いて,低コストジャイロスコープ校正時間を削減することに注力する。
本稿では,複数の実・仮想ジャイロスコープを用いた深層学習フレームワークを提案する。
この研究の重要な成果の1つは、3つの低コストジャイロスコープを使用してジャイロスコープの校正時間を最大89%削減することである。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:47:31 GMT)
Plant detection from ultra high resolution remote sensing images: A Semantic Segmentation approach based on fuzzy loss [2.6] 超高解像度(UHR)リモートセンシング画像から植物種を識別する課題に取り組む。
我々のアプローチは、ミリレベルの空間分解能を特徴とするRGBリモートセンシングデータセットの導入である。
UHRデータセットと公開データセットの両方で得られた最初の実験結果が提示され、提案手法の妥当性が示された。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 17:40:17 GMT)
Sparse Mamba: Reinforcing Controllability In Structural State Space Models [2.6] 我々は、自然言語処理(NLP)アプリケーションのためのSparse-Mamba(S-Mamba)において、制御可能性と可観測性の概念をMアンバアーキテクチャに適用する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 23:25:12 GMT)
Is There No Such Thing as a Bad Question? H4R: HalluciBot For Ratiocination, Rewriting, Ranking, and Routing [2.6] 提案するHaluciBotは,クエリが生成前に幻覚する確率を推定するモデルである。
HalluciBotは、クエリ書き換えのためのプロキシ報酬モデルとして機能する。
複数質問に対して95.7%の出力精度が得られることを示す。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 17:18:29 GMT)
Studying the Effects of Self-Attention on SAR Automatic Target Recognition [2.4] 我々は、注目モジュールがトップ1の精度を高め、入力の堅牢性を向上し、MSTARデータセットで定性的に説明可能であることを示す。
我々は、注目モジュールがトップ1の精度を高め、入力の堅牢性を向上し、MSTARデータセットで定性的に説明可能であることを示す。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:04:06 GMT)
Comparative Analysis of Modality Fusion Approaches for Audio-Visual Person Identification and Verification [2.2] 音声と顔の2つのモダリティを処理し,個人識別と検証における3つのモダリティ融合戦略を比較した。
1次元畳み込みニューラルネットワークは、音声からのxベクトル抽出に使用される。
予め訓練したVGGFace2ネットワークと転送学習を顔のモダリティに活用する。
ガンマトネグラムは、ダークネット19の事前訓練ネットワークとの関わりにおいて、音声表現として使用される。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 23:22:30 GMT)
An Empirical Study on Context Length for Open-Domain Dialog Generation [2.2] 近年,トランスフォーマーベースのオープンドメインダイアログモデルが普及している。
文脈で適切な発話数を維持するための基準はない。
文脈長の選択がモデルにどのように影響するかを明らかにする。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 00:56:36 GMT)
The Drama Machine: Simulating Character Development with LLM Agents [2.0] 本稿では,多言語モデル (LLM) エージェントを用いたドラマティックシナリオにおける複雑な動的キャラクタのシミュレートについて検討する。
本稿では,異なる「エゴ」と「スーパーエゴ」の心理的役割を演じるLLMエージェント間の相互作用を協調するドラママシンフレームワークを提案する。
結果として、このマルチエージェントアプローチは、対話的なターンの連続を通して進化する、よりニュアンスで適応的な物語を生み出すことができることが示唆された。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 04:27:08 GMT)
Simbanex: Similarity-based Exploration of IEEE VIS Publications [2.0] 本研究では,複数の埋め込みを類似性計算に用いて,バイオロメトリやサイエントメトリに適用する。
MVNを個別に埋め込み可能なアスペクトに分割することにより、類似性に基づくクラスタリングの新しい手法の入力として使用する柔軟なベクトル表現を得ることができる。
これらの前処理のステップに基づいて、我々はSimbanexというビジュアル分析アプリケーションを開発し、基礎となる出版物における類似パターンのインタラクティブなビジュアル探索を目的としている。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:26:01 GMT)
Public Transit Arrival Prediction: a Seq2Seq RNN Approach [1.9] バス到着時刻予測(BATP)は特に発展途上国では難しい問題である。
現在の作業において、BATP(リアルタイム)に対して、リカレントニューラルネットワーク(RNN)に基づく新しいデータ駆動モデルを提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 18:00:40 GMT)
LightPure: Realtime Adversarial Image Purification for Mobile Devices Using Diffusion Models [1.6] 本稿では,敵画像の清浄性を高める新しい方法であるLightPureを紹介する。
既存の浄化法の精度を向上し、スピードと計算効率を著しく向上させる。
以上の結果から,LightPureは既存のメソッドを最大10倍のレイテンシで上回ることができることがわかった。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 03:45:57 GMT)
Evaluating the Effectiveness of Large Language Models in Representing and Understanding Movement Trajectories [1.4] 本研究は,運動軌跡を表現するAI基盤モデルの能力を評価することに焦点を当てる。
大規模言語モデルの一つ (LLM) を用いて, トラジェクトリの文字列形式を符号化し, トラジェクトリデータ解析における LLM に基づく表現の有効性を評価する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 02:57:25 GMT)
CMAB: A First National-Scale Multi-Attribute Building Dataset in China Derived from Open Source Data and GeoAI [1.4] 本稿では,3,667の空間都市,2,900万の建物,213億平方メートルの屋上を対象とする全国規模のマルチアトリビュート・ビルディング・データセット(CMAB)について述べる。
何十億もの高解像度のGoogle Earth画像と6000万のストリートビュー画像(SVI)を使って、各ビルの屋上、高さ、機能、年齢、品質特性を生成しました。
我々のデータセットと結果は、グローバルSDGと都市計画にとって不可欠である。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 02:52:26 GMT)
AI-powered test automation tools: A systematic review and empirical evaluation [1.3] 既存のAIベースのテスト自動化ツールが提供する機能について検討する。
私たちは、AI機能がテストの有効性と効率にどのように役立つかを実証的に評価します。
AIベースのテストツールにおけるAI機能の制限についても検討する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 10:10:45 GMT)
The Winnability of Klondike Solitaire and Many Other Patience Games [1.3] ソリティアカードゲーム「クロンダイク」の勝利率の無知は、「応用数学の恥ずかしさの1つ」と評されている。
ここでは、Solvitaire'という単一の汎用人工知能プログラムを用いて、95%の信頼区間+/-0.1%以上を有する35種類のシングルプレイヤーカードゲームにおいて、73種類の勝利率を決定できることを示す。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 16:47:39 GMT)
Primal-dual extrapolation methods for monotone inclusions under local Lipschitz continuity [1.1] 単調な包摂問題の解法として, 単調な外挿法を提案する。
提案手法は$cal O(log epsilon-1)$の演算複雑性を享受する。
また、凸円錐最適化の $varepsilon$-KKT や $varepsilon$-residual の解を求めるためにも得られる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 13:59:23 GMT)
Characterizing Online Toxicity During the 2022 Mpox Outbreak: A Computational Analysis of Topical and Network Dynamics [1.0] 2022年のムポックスの流行は、当初は「モンキーポックス」と呼ばれていたが、その後、関連するスティグマや社会的懸念を緩和するために改名された。
我々は660万以上のユニークツイートを収集し、コンテキスト、範囲、コンテンツ、話者、意図といった5つの次元から分析しました。
我々は、Twitter上での有害なオンライン談話(46.6%)、病気(46.6%)、健康政策と医療(19.3%)、ホモフォビア(23.9%)、政治など、高レベルのトピックを5つ特定した。
有毒なコンテンツのリツイートが広まっていたのに対して、影響力のあるユーザはリツイートを通じてこの有毒な行為に関わったり、反対したりすることはめったにない。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 17:34:43 GMT)
FADE: Few-shot/zero-shot Anomaly Detection Engine using Large Vision-Language Model [0.9] 製造業界における品質検査には,少ないショット・ゼロショット異常検出が重要である。
視覚言語CLIPモデルを利用したFew-shot/zero-shot Anomaly Engine Detection (FADE)を提案する。
FADEは、ゼロショットで89.6%(91.5%)、ノーマルショットで95.4%(97.5%)の異常セグメンテーションにおいて、他の最先端の手法よりも優れている。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 23:05:56 GMT)
Explainable AI: Comparative Analysis of Normal and Dilated ResNet Models for Fundus Disease Classification [0.8] 本稿では網膜基底像からの疾患分類のための拡張Residual Network(ResNet)モデルを提案する。
拡張畳み込みフィルタは、ResNetモデルの上位層における通常の畳み込みフィルタを置き換えるために使用される。
拡張されたResNetモデルは、平均F1スコアが0.71、0.70、0.69、0.67、0.70の通常のResNetと比較して有望な結果を示す。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 20:26:49 GMT)
Density Adaptive Attention-based Speech Network: Enhancing Feature Understanding for Mental Health Disorders [0.8] DAAMAudioCNNLSTMとDAAMAudioTransformerを導入する。
両モデルとも、抑うつ検出に音声信号を利用する際の重要な説明可能性と効率は、より信頼性が高く、臨床的に有用な診断ツールへの飛躍を表している。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 08:50:28 GMT)
Large Language Models-Enabled Digital Twins for Precision Medicine in Rare Gynecological Tumors [0.8] 希少な婦人科腫瘍 (RGTs) は大きな臨床的課題を呈する。
明確なガイドラインの欠如は、至適管理と予後不良につながる。
本研究では,大規模言語モデル(LLM)を用いて,RGTにおける精密医療のためのディジタルツインの構築について検討する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 21:14:09 GMT)
A method for detecting dead fish on large water surfaces based on improved YOLOv10 [0.7] 死んだ魚は水質の悪化、生態系の損傷、病気の伝染などの重大な問題を引き起こす可能性がある。
本稿では,拡張YOLOv10フレームワーク上に構築したエンドツーエンド検出モデルを提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 08:43:37 GMT)
Fish Tracking Challenge 2024: A Multi-Object Tracking Competition with Sweetfish Schooling Data [0.7] 魚追跡チャレンジ2024では、学校用サツマイモの行動に焦点を当てた多目的追跡コンペティションが導入されている。
SweetFishデータセットを使用することで、参加者は10種のサツマイモの位置を同時に正確に監視する高度な追跡モデルの開発を任される。
ビデオデータとバウンディングボックスアノテーションを活用することで、このコンペティションは自動検出と追跡アルゴリズムの革新を促進することを目指している。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 03:26:53 GMT)
RevCD -- Reversed Conditional Diffusion for Generalized Zero-Shot Learning [0.7] コンピュータビジョンでは、視覚的特徴と利用可能なセマンティック情報の関係を利用して、目に見えないカテゴリからの知識を未知のカテゴリに転送する。
本稿では,視覚入力から意味的特徴を生成することで,この問題を緩和する逆条件拡散モデル(RevCD)を提案する。
我々のRevCDモデルは、正弦波時間スケジュールのクロスアダマール・アドデッション埋め込みと、注意誘導型埋め込みのためのマルチヘッド視覚変換器からなる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 17:37:26 GMT)
Complementary Relationships between Entanglement and Measurement [0.6] 量子ビット系では、単一系における測定と二部系における測定の両方が絡み合いに関して考慮される。
例えば$overlineE+Dle 1$は、$overlineE$が測定後の平均絡み合いであることを示す。
得られた乱れ量や情報取得量は、絡み合いによって厳密に制限されていると結論付けている。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 19:24:40 GMT)
Two-Stage Hierarchical and Explainable Feature Selection Framework for Dimensionality Reduction in Sleep Staging [0.6] 脳波は睡眠研究において重要な役割を果たす。
脳波信号データシーケンスの高次元特性のため、異なる睡眠段階のデータの可視化とクラスタリングが課題となっている。
本稿では,特徴選択アルゴリズムを取り入れた2段階の階層的かつ説明可能な特徴選択フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 23:54:53 GMT)
The Authentication Gap: Higher Education's Widespread Noncompliance with NIST Digital Identity Guidelines [0.5] パスワードの有効期限、パスワード構成規則、知識に基づく認証の標準に広く準拠していないことが判明した。
これらの結果は、専門家のサイバーセキュリティ勧告が高等教育機関の政策に十分な影響を与えていないという覚醒電話だ。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 21:15:41 GMT)
Decoding Knowledge Claims: The Evaluation of Scientific Publication Contributions through Semantic Analysis [0.3] 本稿では,RWMD(Relaxed Word Mover's Distance)という意味的テキスト類似度尺度を用いて,論文の新規性を評価する。
我々は,1)H-Index関連論文,2)サイエントメトリック研究,3)非関連論文の3つのグループでRWMDの結果を比較し,冗長な文献や誇大広告を真のイノベーションから識別することを目的とした。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 19:26:21 GMT)
Kolmogorov-Arnold Network for Online Reinforcement Learning [0.2] Kolmogorov-Arnold Networks (KANs)は、ニューラルネットワークにおけるMLP(Multi-Layer Perceptrons)の代替としての可能性を示している。
Kansはパラメータが少なく、メモリ使用量が減ったユニバーサル関数近似を提供する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 21:01:06 GMT)
CURLing the Dream: Contrastive Representations for World Modeling in Reinforcement Learning [0.2] Curled-Dreamerは、コントラスト学習をDreamerV3フレームワークに統合する、新しい強化学習アルゴリズムである。
我々の実験では、Curled-Dreamerは最先端のアルゴリズムより一貫して優れています。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 21:20:16 GMT)
Type-Based Verification of Connectivity Constraints in Lattice Surgery [0.2] 格子演算を用いたフォールトトレラント量子計算はグラフ上の演算として抽象化できる。
$mathcalQ_LS$は手術手術の実行モデルを形式化する一階量子プログラミング言語である。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 19:31:19 GMT)
Using Deep Learning to Design High Aspect Ratio Fusion Devices [0.0] 我々は機械学習モデルをトレーニングし、良好な閉じ込め特性を持つ構成を構築する。
この方法で最適化された構成を確実に生成できることが示されている。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 23:28:10 GMT)
Universal bound on the relaxation rates for quantum Markovian dynamics [0.0] 最大速度はヒルベルト空間の次元で割られたすべての緩和率の和によって上から有界であることを示す。
この制約は普遍的であり(エネルギー準位が有限の全ての量子系に対して有効である)、厳密である(改善できない)。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:15:45 GMT)
UFO, universe, reptilians and creatures communities on Brazilian Telegram: when the sky is not the limit and conspiracy theories seek answers beyond humanity [0.0] 本研究は,ブラジルの陰謀論コミュニティをテレグラム上で理解し,特徴付けることを目的とした7つの研究のシリーズの一部である。
UFOと宇宙に関する議論はパンデミックの間に大きく成長し、地球外現象への新たな関心を反映した。
レプティリア人は陰謀論において重要なサブカルチャーであり、パンデミック期には顕著な成長を遂げた。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 01:53:20 GMT)
Towards understanding Diffusion Models (on Graphs) [0.0] 拡散モデルは、その根底にある原則に固有の洞察を与える。
我々は、最も顕著なアプローチの概要を示し、それらの顕著な類似点に注意を向ける。
本研究の目的は,拡散モデルの理解を深め,グラフ機械学習への応用を長期にわたって進めることである。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 07:40:11 GMT)
The potential functions of an international institution for AI safety. Insights from adjacent policy areas and recent trends [0.0] OECD、G7、G20、ユネスコ、欧州評議会はすでに倫理的かつ責任あるAIガバナンスのためのフレームワークの開発を始めている。
この章は、国際AI安全機関が実行可能な機能について考察する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 10:04:53 GMT)
The MERIT Dataset: Modelling and Efficiently Rendering Interpretable Transcripts [0.0] 本稿では,学校レポートの文脈における完全ラベル付きデータセットであるMERITデータセットを紹介する。
その性質上、MERITデータセットは、制御された方法でバイアスを含む可能性があるため、言語モデル(LLM)で誘導されるバイアスをベンチマークするための貴重なツールである。
データセットの有用性を示すため,トークン分類モデルを用いたベンチマークを行い,SOTAモデルにおいてもデータセットが重要な課題となることを示す。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:56:38 GMT)
Statistics of punctuation in experimental literature -- the remarkable case of "Finnegans Wake" by James Joyce [0.0] 本研究は, 句読点パターンの分析を世界文学のより実験的な部分にまで拡張する。
個別のワイブル分布と句読点間の距離のコンプライアンスは、典型的にはここでも適用される。
ジェームズ・ジョイス(James Joyce)による作品のいくつかはこの点において、関連する分布の尾部がかなり厚くなっているという意味で、異なるものである。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:30:51 GMT)
Separation of Body and Background in Radiological Images. A Practical Python Code [0.0] 2次元および3次元の放射線画像において,身体と背景領域を分離するように設計されたPythonコードを提案する。
脳,頸部,腹部の様々な部位のMRIおよびCT画像を用いて,このアルゴリズムを検証した。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:30:52 GMT)
Reproducibility Study Of Learning Fair Graph Representations Via Automated Data Augmentations [0.0] リンク予測タスクにおけるGraphairフレームワークの性能について検討する。
我々の発見はグラフベースの学習において、Graphairが広く採用される可能性を示している。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 11:28:22 GMT)
Probabilistic Variational Causal Approach in Observational Studies [0.0] 本報告では,観測研究における事象の出現頻度と頻度を,根本的問題との関連性に基づいて考慮した新たな因果的手法を提案する。
本研究では,確率的変動因果効果(PACE)と呼ばれる直接因果効果測定法と,非二項処理と二項処理の両方に適用可能な特定の仮定に付着した変分法を提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 19:50:46 GMT)
Predicting Femicide in Veracruz: A Fuzzy Logic Approach with the Expanded MFM-FEM-VER-CP-2024 Model [0.0] この記事は、メキシコのベラクルスにおける殺虫剤の緊急問題と、MFM_FEM_VER_CP024モデルの開発に焦点を当てている。
このモデルは、強制管理、非人道化、暴力のサイクルといったリスク要因を形式化し、性別に基づく暴力に固有の複雑さと不確実性に対処する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 06:00:49 GMT)
Objective Features Extracted from Motor Activity Time Series for Food Addiction Analysis Using Machine Learning [0.0] 本研究は、食品依存症(FA)を診断し、確認された症状(SC)を評価するための機械学習アルゴリズムについて検討する。
FAおよびSCをYale Food Addiction Scale(YFAS)を用いて測定した参加者81名(平均年齢:21.5歳、範囲:18-61歳、女性77.8%)のデータを収集した。
本研究は, FAおよびSCに関連する生理指標のリアルタイムモニタリングと分析を行う健康デジタル支援機能を備えた,IoTデバイスとMLセンサからなるヒトバイオニックスイートのコンセプトをサポートする。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 00:33:17 GMT)
Machine Learning Framework for High-Resolution Air Temperature Downscaling Using LiDAR-Derived Urban Morphological Features [0.0] 本研究では,UrbClimが生成したデータセットを用いて,大気温度をダウンスケールするためのデータ駆動型フレームワークを提案する。
都市形態特徴を抽出するために,まず,LiDARデータとディープラーニングモデルを用いて3次元ビルディングモデルを構築した。
この枠組みは高分解能で空気温度を推定し、街路レベルでの局所的な空気温度パターンの同定を可能にした。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 12:59:21 GMT)
Low-depth, compact and error-tolerant photonic matrix-vector multiplication beyond the unitary group [0.0] 非単体転送行列を実装可能なフォトニック回路のアーキテクチャを提案する。
我々のアーキテクチャは、バルクで完全に連結されたミキシングブロックではなく、小型の低深さビームスプリッターメッシュを利用する。
我々のアーキテクチャで設計されたフォトニック回路は、標準回路よりも奥行きが低く、ハードウェアエラーに非常に耐性があることが示されている。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 14:25:47 GMT)
Generative artificial intelligence usage by researchers at work: Effects of gender, career stage, type of workplace, and perceived barriers [0.0] 近年, 次世代人工知能技術の研究環境への統合が盛んに行われている。
本稿では,プロの環境における研究者間の生成AIの利用頻度の要因を探究する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 22:00:21 GMT)
Explaining Explanations in Probabilistic Logic Programming [0.0] ほとんどのアプローチでは、システムはブラックボックスと見なされており、適切な説明を生成することは困難である。
確率論的論理プログラミング(PLP)は、知識表現のための論理プログラミングと不確実性をモデル化する確率を組み合わせたパラダイムである。
本稿では,証明に「選択表現」をラベル付けした PLP の新しいクエリ駆動推論機構の定義に基づく説明法を提案する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 16:23:44 GMT)
Evaluation of Prosumer Networks for Peak Load Management in Iran: A Distributed Contextual Stochastic Optimization Approach [0.0] 本稿では,イランにおけるピーク負荷軽減を目的とした新しいプロシューマーネットワークフレームワークを提案する。
コスト指向の統合予測と最適化手法を提案する。
数値的な結果から,最適化とコンテキスト情報共有ネットワークの実装による予測の統合は,ピーク負荷と総コストを著しく削減することがわかった。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 16:09:38 GMT)
Evaluating the Performance of Large Language Models in Competitive Programming: A Multi-Year, Multi-Grade Analysis [0.0] 本研究は,ルーマニア語インフォマティクス・オリンピアード(Olympiad)における競合プログラミング問題の解法における大規模言語モデル(LLM)の性能について考察する。
2002年から2023年までの304の課題からなるデータセットを収集,分析した。
解析結果から,LLMの性能はグレードや問題の種類によって大きく異なっていた。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 10:39:54 GMT)
Estimation of Optimal Dynamic Treatment Assignment Rules under Policy Constraints [0.0] 本研究は,各段階の個人に対して,その履歴に基づいて最適な治療課題を導出する最適動的治療体制の推定について検討する。
提案手法は, 下位帰納的帰納的帰納的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属的帰属
論文参考訳(メタデータ) (Sat, 31 Aug 2024 02:00:56 GMT)
Dynamic Moiré-like pattern in non-Hermitian Wannier-Stark ladder system [0.0] 非エルミティア・ワニエ・スタークはしご系の動的挙動について検討した。
線形外部場が存在する場合、エネルギー準位が磁場に敏感であることが分かる。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 08:08:49 GMT)
CyberNFTs: Conceptualizing a decentralized and reward-driven intrusion detection system with ML [0.0] この研究は、最先端のWeb3技術と情報セキュリティの相乗効果を調べる分析的および比較的手法を用いている。
提案モデルには、ブロックチェーンの概念、サイバー非偽造トークン(cyberNFT)報酬、機械学習アルゴリズム、パブリッシュ/サブスクライブアーキテクチャが含まれている。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 21:15:26 GMT)
Climate change denial and anti-science communities on brazilian Telegram: climate disinformation as a gateway to broader conspiracy networks [0.0] この研究は、ブラジルの陰謀論コミュニティが気候変動や反科学のテーマについて、どのようにTelegramで明らかにされているかという研究課題に答えようとしている。
この研究は、テレグラムにおけるブラジルの陰謀論コミュニティの理解と特徴化を目的とした7つの研究のシリーズの一部であることは注目に値する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 02:12:19 GMT)
Chatting Up Attachment: Using LLMs to Predict Adult Bonds [0.0] GPT-4とClaude 3 Opusを使用して、さまざまなプロファイル、子供時代の記憶、アタッチメントスタイルを持つ大人をシミュレートするエージェントを作成します。
我々は,同一の面接プロトコルを施行し,精神保健専門家によって分析・ラベル付けされた9人のヒトの転写データセットを用いて,我々のモデルを評価した。
以上の結果から,合成データのみを用いたモデルトレーニングは,人間のデータを用いたモデルトレーニングに匹敵する性能を発揮することが示唆された。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 04:29:19 GMT)
BreachSeek: A Multi-Agent Automated Penetration Tester [0.0] BreachSeekはAI駆動のマルチエージェントソフトウェアプラットフォームで、人間の介入なしに脆弱性を特定し、悪用する。
予備評価では、BreachSeekはローカルネットワーク内の悪用可能なマシンの脆弱性をうまく利用した。
今後の開発は、その能力を拡大し、サイバーセキュリティの専門家にとって欠かせないツールとして位置づけることを目指している。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 19:15:38 GMT)
Beyond Flashcards: Designing an Intelligent Assistant for USMLE Mastery and Virtual Tutoring in Medical Education (A Study on Harnessing Chatbot Technology for Personalized Step 1 Prep) [0.0] 学生の質問に対するオンザフライソリューションを提供することで、このギャップを埋めるインテリジェントAIコンパニオンを提案する。
私はジェネレーティブAIを使って、動的で正確で人間らしく反応し、知識の保持と応用に役立ててきました。
私は、ユーザのニーズに最も適したアドビタム応答を生成できる品質アシスタントを作成できるようになりました。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 17:20:27 GMT)
Apocalypse, survivalism, occultism and esotericism communities on Brazilian Telegram: when faith is used to sell quantum courses and open doors to harmful conspiracy theories [0.0] 本研究は,ブラジルの陰謀論コミュニティをテレグラム上で理解し,特徴付けることを目的とした7つの研究のシリーズの一部である。
占拠と密教の共同体は黙示録理論の入り口として機能する。
黙示録に関する議論は、他の陰謀論の出発点となり、その到達範囲を広げた。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 01:55:32 GMT)
Antivax and off-label medication communities on brazilian Telegram: between esotericism as a gateway and the monetization of false miraculous cures [0.0] 本研究は、テレグラムにおけるブラジルの陰謀論のコミュニティがどのように特徴づけられ、具体化されているかに答えようとするものである。
新世界秩序や黙示録、生存主義といったテーマは、抗ワクチンの物語への重要な入り口として機能している。
排他主義と密教は、非ラベルの薬物コミュニティへの招待の最大の源泉として浮上する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 02:13:24 GMT)
Anti-woke agenda, gender issues, revisionism and hate speech communities on Brazilian Telegram: from harmful reactionary speech to the crime of glorifying Nazism and Hitler [0.0] 本研究は,ブラジルの陰謀論コミュニティをテレグラム上で理解し,特徴付けることを目的とした7つの研究のシリーズの一部である。
反煙コミュニティはブラジルの陰謀エコシステムの中心的な勢力として出現する。
危機の間、ヘイトスピーチとリビジョン主義の言及は著しく増加した。
反woke、アンチジェンダー、リビジョン主義の相互接続性は憎悪のエコシステムを強化する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 01:56:19 GMT)
Adversarial Domain Adaptation for Cross-user Activity Recognition Using Diffusion-based Noise-centred Learning [0.0] HAR(Human Activity Recognition)は、人間とコンピュータの相互作用や医療モニタリングなど、様々な用途において重要な役割を担っている。
本稿では,拡散に基づく雑音中心型適応型適応(Diff-Noise-Adv-DA)という新しいフレームワークを提案する。
生成拡散モデリングと逆学習技術を活用することで,これらの課題に対処する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 23:33:10 GMT)
Advancing Machine Learning in Industry 4.0: Benchmark Framework for Rare-event Prediction in Chemical Processes [0.0] 本稿では,様々な複雑さのMLアルゴリズムを比較し,レアイベント予測のための新しい総合的ベンチマークフレームワークを提案する。
異常事象を予測するための最適ML戦略を特定し,より安全で信頼性の高いプラント操作を実現する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 15:41:10 GMT)
A long-distance quantum-capable internet testbed [0.0] 本稿では,新しい物理中心のスタックベースの量子ネットワークパラダイムを用いた,量子可能なインターネットプロトタイプの実装について述べる。
この概念を,ストーニーブルック大学とブルックヘイブン国立研究所の大規模量子ネットワークを用いて実証する。
論文参考訳(メタデータ) (Sat, 31 Aug 2024 03:37:47 GMT)