OpenAI unveiled Jalapeño, its first custom AI chip, designed in partnership with Broadcom for inference workloads. Built in a record nine-month tape-out cycle — partly using OpenAI's own AI models — the chip targets efficiency gains in serving user queries rather than training. OpenAI is already running early samples on Codex workloads, with commercial deployment at Microsoft and other partners expected by end of 2026 and full volume in 2027. The move is framed as a bid for full-stack control and reduced dependence on Nvidia, joining Google, Amazon, and Microsoft who already run custom silicon alongside Nvidia GPUs. Broadcom, which also backs Google's TPUs and has a compute pact with Anthropic, is emerging as the key partner in the industry's post-Nvidia chip diversification. Caveats remain: Jalapeño covers only inference, Nvidia still dominates training, and performance claims are self-reported pending an independent technical report.
Nguồn: https://thenextweb.com/news/openai-jalapeno-chip-broadcom-nvidia. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
Tổng giám đốc Microsoft Satya Nadella cảnh báo rằng các công ty AI không thể vừa dự đoán …
OpenAI và Broadcom hợp tác phát triển chip AI tùy chỉnh Jalapeño nhằm cạnh tranh với Nvidia Blackwell và Google TPU, nhắm vào workloads inference. Chip này đã được thử nghiệm với mô hình GPT-5.3-Codex-Spark và dự kiến triển khai vào cuối năm 2025, trong khi tình trạng thiếu hụt HBM đang ảnh hưởng đến biên lợi nhuận của Broadcom.
Lập trình viên nên đọc bài này để hiểu cách các công ty lớn như OpenAI và Broadcom hợp tác phát triển chip AI chuyên dụng, giúp tối ưu hóa hiệu suất cho các mô hình lớn như GPT-5.3, ảnh hưởng trực tiếp đến hiệu năng và chi phí của các ứng dụng AI trong tương lai.
Qt Canvas Painter giới thiệu QCanvasPath và nhóm path nhằm tối ưu hiệu suất render 2D, tiết kiệm ~60% bộ nhớ nhờ định dạng SoA thân thiện cache, hỗ trợ tái sử dụng giữa các frame và tương thích API với QCanvasPainter. Nhóm path cho phép GPU lưu trữ đỉnh (vertex) tĩnh, giúp xử lý biến đổi, màu sắc hay gradient mà không cần cập nhật buffer, đồng thời chứng minh khả năng render tiến triển 60fps trên thiết bị nhúng với tải CPU/GPU thấp hơn. Tính năng này sẽ trở thành module chính thức trong Qt 6.12.
Lập trình viên muốn tối ưu hiệu suất rendering 2D trên Qt nên đọc bài này để khám phá cách sử dụng QCanvasPath và path groups để giảm chi phí CPU/GPU, giảm bộ nhớ và cải thiện trải nghiệm 60FPS trên thiết bị embedded.
NVIDIA ra mắt NVIDIA Agent Toolkit, một nền tảng mã nguồn mở và mô-đun giúp doanh nghiệp xây dựng các tác nhân AI chuyên biệt đáng tin cậy. Bộ công cụ tích hợp các mô hình Nemotron (tùy chỉnh lý luận), NemoClaw (đảm bảo hành vi an toàn) và OpenShell (thực thi bảo mật), được triển khai trong các lĩnh vực như y tế, an ninh mạng và thiết kế chip.
Lập trình viên chuyên về AI nên đọc bài này để hiểu cách xây dựng các hệ thống agent chuyên dụng, an toàn và có thể kiểm soát được, giúp họ ứng dụng kiến thức về mô hình open-source, bảo mật và tích hợp vào các dự án doanh nghiệp thực tế.
Giá DDR2 tăng 55-60% trong Q2/2026 do thiếu hụt DRAM trầm trọng khi các nhà sản xuất chuyển sản lượng wafer sang sản xuất HBM cho AI, dự báo tiếp tục tăng 35-40% trong Q3. Các hãng phần cứng buộc phải hạ cấp từ DDR4 xuống DDR3, rồi DDR3 xuống DDR2 để đảm bảo nguồn cung, ảnh hưởng đến hệ thống nhúng, thiết bị công nghiệp và mạng. Nguồn cung DDR2 không thể cải thiện trước năm 2027-2028 khi các nhà máy mới của SK Hynix và Micron đi vào hoạt động.
Lập trình viên nên đọc bài này vì nó giúp bạn hiểu rõ về những thách thức về nguồn cung cấp bộ nhớ DDR2, ảnh hưởng đến thiết kế phần cứng cho các ứng dụng embedded và hệ thống AI, từ đó có thể tối ưu hóa kiến trúc phần mềm và dự đoán chi phí phát triển sản phẩm trong tương lai.
IBM tham gia chương trình Đối tác Cyber Daybreak của OpenAI và ra mắt dịch vụ bảo mật ứng dụng dựa trên AI, sử dụng mô hình của OpenAI để phát hiện lỗ hổng phần mềm nhanh hơn các trình quét truyền thống. Dịch vụ này hoạt động trong môi trường của khách hàng với quyền truy cập chỉ đọc mã nguồn để giảm cảnh báo sai. IBM cũng hỗ trợ Project Lightwell, sáng kiến 5 tỷ USD cùng Red Hat nhằm tăng cường bảo mật chuỗi cung ứng open-source bằng các mô hình AI tiên tiến.
Lập trình viên nên đọc để hiểu cách AI tiên tiến như OpenAI đang thay đổi cách phát hiện lỗ hổng an ninh phần mềm, giúp tối ưu hóa hiệu quả phát triển ứng dụng và bảo mật mà không cần phụ thuộc vào công cụ truyền thống.
Reddit hợp tác cùng OpenAI để ChatGPT truy cập nội dung Reddit, nhằm đa dạng hóa nguồn thu và tăng doanh thu quảng cáo.
Lập trình viên nên đọc bài này để hiểu cách AI như ChatGPT có thể tích hợp với các nền tảng xã hội lớn, giúp phát triển các giải pháp tương tác tự động hóa và tăng hiệu quả cho các ứng dụng tương tương tương tác.

An AMD engineer has contributed an ONNX Runtime backend to FFmpeg's DNN (Deep Neural Network) processing filter. The addition enables inferencing across multiple GPU and NPU platforms, including NVIDIA CUDA, Windows DirectML for all major GPU vendors, and AMD Ryzen AI NPU support via the ONNX Runtime VitisAI execution provider. This marks AMD's effort to make the Ryzen AI NPU useful within FFmpeg workflows.