ZLUDA v6 has been released, bringing PhysX support for older games on AMD GPUs, texture support, and improved Windows compatibility. However, the project has lost its commercial funding from an unnamed backer, reverting it to a weekend side project for lead developer Andrzej Janik. While some machine learning improvements are included, the focus has shifted away from AI/ML toward gaming use cases like PhysX. The release demonstrates promising benchmark results, such as improved performance in Mafia II on AMD hardware.
Nguồn: https://www.phoronix.com/news/ZLUDA-6-Released. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
Phân tích chi phí sơ lược cho thấy suy luận (inference) AI thực sự sinh lời, với chi phí ước tính khoảng 1 USD cho mỗi triệu token đầu ra, thấp hơn nhiều so với mức giá 4,5 USD trở lên của các nhà cung cấp như OpenAI, qua đó đạt biên lợi nhuận gộp 70–80%. Suy luận AI có lợi nhuận, nhưng các phòng thí nghiệm AI như OpenAI và Anthropic sử dụng khoản lợi nhuận này để bù đắp chi phí đào tạo mô hình tốn kém.
Là người phát triển muốn tối ưu chi phí cho ứng dụng AI của mình, bài viết này giúp bạn hiểu rõ về lợi nhuận thực tế của quá trình inference AI, từ đó có thể xây dựng mô hình kinh doanh hiệu quả và tránh bỏ lỡ cơ hội tiết kiệm chi phí mà không phụ thuộc vào sự hỗ trợ từ các công ty lớn.
OpenAI và Broadcom hợp tác phát triển chip AI tùy chỉnh Jalapeño nhằm cạnh tranh với Nvidia Blackwell và Google TPU, nhắm vào workloads inference. Chip này đã được thử nghiệm với mô hình GPT-5.3-Codex-Spark và dự kiến triển khai vào cuối năm 2025, trong khi tình trạng thiếu hụt HBM đang ảnh hưởng đến biên lợi nhuận của Broadcom.
Lập trình viên nên đọc bài này để hiểu cách các công ty lớn như OpenAI và Broadcom hợp tác phát triển chip AI chuyên dụng, giúp tối ưu hóa hiệu suất cho các mô hình lớn như GPT-5.3, ảnh hưởng trực tiếp đến hiệu năng và chi phí của các ứng dụng AI trong tương lai.
Giá DDR2 tăng 55-60% trong Q2/2026 do thiếu hụt DRAM trầm trọng khi các nhà sản xuất chuyển sản lượng wafer sang sản xuất HBM cho AI, dự báo tiếp tục tăng 35-40% trong Q3. Các hãng phần cứng buộc phải hạ cấp từ DDR4 xuống DDR3, rồi DDR3 xuống DDR2 để đảm bảo nguồn cung, ảnh hưởng đến hệ thống nhúng, thiết bị công nghiệp và mạng. Nguồn cung DDR2 không thể cải thiện trước năm 2027-2028 khi các nhà máy mới của SK Hynix và Micron đi vào hoạt động.
Lập trình viên nên đọc bài này vì nó giúp bạn hiểu rõ về những thách thức về nguồn cung cấp bộ nhớ DDR2, ảnh hưởng đến thiết kế phần cứng cho các ứng dụng embedded và hệ thống AI, từ đó có thể tối ưu hóa kiến trúc phần mềm và dự đoán chi phí phát triển sản phẩm trong tương lai.
Qt Canvas Painter giới thiệu QCanvasPath và nhóm path nhằm tối ưu hiệu suất render 2D, tiết kiệm ~60% bộ nhớ nhờ định dạng SoA thân thiện cache, hỗ trợ tái sử dụng giữa các frame và tương thích API với QCanvasPainter. Nhóm path cho phép GPU lưu trữ đỉnh (vertex) tĩnh, giúp xử lý biến đổi, màu sắc hay gradient mà không cần cập nhật buffer, đồng thời chứng minh khả năng render tiến triển 60fps trên thiết bị nhúng với tải CPU/GPU thấp hơn. Tính năng này sẽ trở thành module chính thức trong Qt 6.12.
Lập trình viên muốn tối ưu hiệu suất rendering 2D trên Qt nên đọc bài này để khám phá cách sử dụng QCanvasPath và path groups để giảm chi phí CPU/GPU, giảm bộ nhớ và cải thiện trải nghiệm 60FPS trên thiết bị embedded.

GPU-as-a-Service (GPUaaS) addresses the common problem of expensive, underutilized GPUs in organizations by enabling self-service reservation of GPU slices. The approach uses Red Hat OpenShift with Kueue (a Kubernetes queueing and quota system) and NVIDIA Multi-Instance GPU (MIG) technology. MIG allows a single physical GPU to be partitioned into isolated slices of varying sizes, while Kueue manages resource pools, fair sharing, and quota enforcement via ClusterQueues. A custom OpenShift web console plug-in lets developers book GPU time slots through a calendar UI without writing YAML, generating native Kueue resources under the hood. Once a reservation is made, developers can deploy models from the OpenShift AI model catalog using preconfigured hardware profiles that tie deployments to their reserved MIG slice. This enables long-running inference workloads and batch jobs like fine-tuning to share GPU resources elastically under defined access policies.
Linux 7.3 sẽ bổ sung thuộc tính DRM "color format" mới cho các kết nối hiển thị, cho phép user-space yêu cầu định dạng màu đầu ra cụ thể như RGB, YUV 4:4:4, YUV 4:2:2, YUV 4:2:0. Tính năng này đã được hỗ trợ ban đầu bởi driver AMDGPU, còn Weston compositor của Wayland và driver Intel, Rockchip có thể được bổ sung trước cửa sổ merge 7.3.
Lập trình viên phát triển ứng dụng hoặc driver cho hệ thống Linux với GPU AMD nên đọc bài này để hiểu cách tối ưu hóa chất lượng hình ảnh và tương thích với các định dạng màu mới trong DRM, giúp cải thiện trải nghiệm người dùng trên các ứng dụng như game, đồ họa, hoặc hệ thống hỗ trợ hình ảnh cao độ.

Linux 7.2-rc1 vừa được phát hành, với khoảng 1/3 bản vá đến từ định nghĩa thanh ghi GPU AMD. Bản cập nhật bổ sung các tính năng như Cache Aware Scheduling (CAS), hỗ trợ HDMI 2.1 FRL cho AMDGPU, driver camera AMD ISP4, cùng nhiều cải tiến khác, nâng tổng số dòng code lên hơn 43 triệu. Bản ổn định dự kiến ra mắt sau 8 tuần.
Lập trình viên cần đọc để hiểu cách kernel Linux 7.2 tích hợp các cải tiến quan trọng như AMDGPU HDMI 2.1 FRL và ISP4, giúp tối ưu hóa hiệu suất cho các thiết bị mới, đồng thời cập nhật các driver và cơ chế mới như Cache Aware Scheduling (CAS), giúp nâng cao hiệu suất xử lý đa nhiệm và hiệu quả hơn trong các ứng dụng thực tế.
Unconventional AI, founded by former Databricks AI chief Naveen Rao, has released Un-0, an image generation model running on a software simulation of a novel oscillator-based computing architecture. Unlike conventional digital logic using transistors, the approach uses coupled ring oscillators to encode and process information through physics, with Rao claiming it could reduce AI power consumption by 1000x. The model performs comparably to established diffusion models like Stable Diffusion, but currently runs only on a simulated version of hardware that doesn't yet exist. The company, backed by $475M in seed funding at a $4.5B valuation from Lightspeed, a16z, and Sequoia, plans to release chip schematics soon and eventually operate as a compute provider. The 1000x efficiency claim remains theoretical until physical hardware is built and validated.