DiScoFormer (Density and Score Transformer) is a new model from AI2 that estimates both the probability density and score of a distribution from a finite sample in a single forward pass, without retraining per distribution. Built on transformer architecture with cross-attention, it analytically generalizes kernel density estimation (KDE) and outperforms it significantly in high dimensions — cutting score error by ~6.5x and density error by ~37x in 100 dimensions. Trained on Gaussian Mixture Models (which have closed-form densities), it generalizes to unseen distributions including Laplace and Student-t. A consistency loss between the density and score heads enables test-time adaptation to out-of-distribution inputs. The model targets shared infrastructure for generative modeling, Bayesian inference, and scientific computing.
Nguồn: https://huggingface.co/blog/allenai/discoformer. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
Đội kỹ thuật của Gusto xây dựng bộ phân loại chuyển tiếp AI-sang-người cho hệ thống hỗ trợ khách hàng bằng cách bắt đầu với prompt LLM, sử dụng dữ liệu sản xuất để tạo dataset 3.500 lượt hội thoại, sau đó tinh chỉnh mô hình BERT nhẹ đạt 94% precision và 93% recall. Phương pháp LLM-đầu-tiên-sau-chuyên-biệt phù hợp cho quyết định ổn định, khối lượng lớn như phân loại intent, nhưng không hiệu quả với sinh văn bản mở hoặc quy tắc thay đổi.
Lập trình viên nên đọc bài này để hiểu cách chuyển từ việc sử dụng mô hình LLM trực tiếp sang xây dựng hệ thống chuyên biệt hiệu quả, đặc biệt là trong trường hợp phân loại quyết định cụ thể như phân luồng hỗ trợ khách hàng, giúp tối ưu hóa chi phí và tốc độ triển khai.
Google Cloud vừa giới thiệu TPU Developer Hub, một nền tảng giáo dục tập trung dành cho nhà phát triển ML sử dụng TPU, bao gồm kiến trúc phần cứng, stack phần mềm (XLA, Pallas kernels), công cụ gỡ lỗi XProf, chiến lược tối ưu hóa (như offloading KV cache) cùng networking và bảo mật. Nội dung đa dạng từ Colabs tương tác, mã nguồn mở đến tài liệu chuyên sâu, hỗ trợ tích hợp AI-assisted development.
Lập trình viên ML nên đọc để hiểu cách tối ưu hóa hiệu suất và chi phí của mô hình trên TPU với các công cụ mới như XLA, Pallas và các chiến lược parallelism, từ đó tiết kiệm thời gian và nguồn lực trong triển khai sản phẩm AI.

Netflix giới thiệu hai mô hình chỉnh sửa video AI giai đoạn đầu là Vera và VOID. Vera sử dụng mô hình diffusion phân lớp, chỉ tái tạo vùng chỉnh sửa (kèm alpha matte) thay vì toàn bộ clip, bảo toàn nội dung chưa chỉnh sửa. VOID chuyên xóa vật thể trong video với kỹ thuật inpainting hợp lý vật lý, tái tạo cảnh thực tế khi vật thể bị loại bỏ. Cả hai mô hình đều vượt trội so với các phương pháp hiện có trong nghiên cứu.
Lập trình viên muốn phát triển các giải pháp AI tiên tiến trong xử lý video nên tham khảo để hiểu cách thiết kế mô hình hiệu quả như Vera và VOID, từ kiến trúc đặc biệt đến kỹ thuật điều khiển chi tiết để nâng cao chất lượng và tính khả thi của các ứng dụng AI video trong tương lai.
WiMi Hologram Cloud is researching neural network models to optimize parameter selection in twin-field quantum key distribution (TF-QKD) systems. Three models were evaluated: BPNN, RBFNN, and GRNN. RBFNN and GRNN showed higher prediction accuracy in high-dimensional parameter spaces, while BPNN offered the fastest computation speed. Compared to traditional local search algorithms (LSA), neural network-based prediction reduced computation time by multiple orders of magnitude. Future work will explore deep learning and reinforcement learning approaches, with plans to integrate the technology into quantum communication hardware for practical deployment.
An end-to-end classical NLP experiment on Kaggle's Spooky Author Identification task, progressively building from a Vowpal Wabbit word baseline to a tuned stacked ensemble. The pipeline covers style-aware feature engineering (punctuation, character n-grams, TF-IDF), NB-SVM-style logistic regression, and stacking with out-of-fold predictions to avoid leakage. A representation survey compares sparse features (Bag-of-Words, BM25) against dense embeddings (Word2Vec, FastText), finding that sparse n-gram features outperform averaged dense vectors for short-text authorship attribution. The final stacked model achieves 0.8687 accuracy and 0.3504 log loss on a 70/30 holdout, and 0.30414 private log loss on Kaggle.
MIT Architecture alumnus Alexandros Haridis discusses his exhibition 'Beyond Data-Driven Aesthetics' at MIT's Keller Gallery, which traces the history of computational aesthetics from the 1930s through today. The exhibition translates dense algorithmic research — covering topics like George Birkhoff's mathematical aesthetic measure and the AICAN machine learning system — into physical installations and interactive visualizations. Haridis argues that many questions now framed as novel AI challenges around creativity and aesthetic judgment have deep roots in 20th-century computing research. The work is organized around five themes: Aesthetic Measure, Aesthetic Guidelines, Algorithmic Aesthetics, Aesthetic Appropriation, and Aesthetic Novelty, using design itself as an interpretive method to make opaque computational systems legible and experiential.
Hexora v0.3 is a Python library for detecting malicious PyPI packages using static analysis. The new release adds a gradient boosting machine learning model that analyzes code structure, semantic features, and static analysis results to assess entire Python files. The ML model's primary role is filtering false positives — previously yielding 5-10 false positives per real finding. Running against newly published PyPI packages, it now detects 2-10 malicious packages daily. Remaining false positives mostly come from AI-related projects that use dynamic code execution, base64-inlined assets, or telemetry.
Researchers at Princeton have developed AI-driven methods to automate the design of radio-frequency integrated circuits (RFICs), a process traditionally considered a 'dark art' requiring years of expert experience. Using reinforcement learning to determine circuit architecture and topology from scratch, combined with an AI emulator that predicts electromagnetic behavior without running full simulations, the team produced a 5G millimeter-wave power amplifier that outperformed state-of-the-art human designs. They also applied diffusion models to make AI-generated circuit structures more interpretable by engineers. The approach eliminates reliance on human-designed templates, dramatically reduces design time from months to minutes, and has been validated for multiport circuits and sub-terahertz amplifiers. Key remaining challenges include reducing AI hallucinations, improving generalizability, and building open datasets — since most simulation data is locked behind NDAs.