NVIDIA's new Ruben architecture AI servers use a fully closed-loop liquid cooling system that eliminates the need for evaporative chillers. The system circulates a glycol-water mix through waterblocks on every chip, with coolant only needing to stay below 45°C on the cold side and 55°C on the hot side. This modest temperature differential means standard dry radiators can reject heat to ambient air without consuming or evaporating any water. The primary driver is cost savings — roughly $4 million per year for a 50 MW hyperscaler — rather than environmental concern, though the elimination of freshwater consumption is a notable side benefit.
Nguồn: https://hackaday.com/2026/06/26/nvidias-new-ai-servers-run-on-hotub-coolant-and-dont-need-evaporators. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
OpenAI và Broadcom hợp tác phát triển chip AI tùy chỉnh Jalapeño nhằm cạnh tranh với Nvidia Blackwell và Google TPU, nhắm vào workloads inference. Chip này đã được thử nghiệm với mô hình GPT-5.3-Codex-Spark và dự kiến triển khai vào cuối năm 2025, trong khi tình trạng thiếu hụt HBM đang ảnh hưởng đến biên lợi nhuận của Broadcom.
Lập trình viên nên đọc bài này để hiểu cách các công ty lớn như OpenAI và Broadcom hợp tác phát triển chip AI chuyên dụng, giúp tối ưu hóa hiệu suất cho các mô hình lớn như GPT-5.3, ảnh hưởng trực tiếp đến hiệu năng và chi phí của các ứng dụng AI trong tương lai.
NVIDIA ra mắt NVIDIA Agent Toolkit, một nền tảng mã nguồn mở và mô-đun giúp doanh nghiệp xây dựng các tác nhân AI chuyên biệt đáng tin cậy. Bộ công cụ tích hợp các mô hình Nemotron (tùy chỉnh lý luận), NemoClaw (đảm bảo hành vi an toàn) và OpenShell (thực thi bảo mật), được triển khai trong các lĩnh vực như y tế, an ninh mạng và thiết kế chip.
Lập trình viên chuyên về AI nên đọc bài này để hiểu cách xây dựng các hệ thống agent chuyên dụng, an toàn và có thể kiểm soát được, giúp họ ứng dụng kiến thức về mô hình open-source, bảo mật và tích hợp vào các dự án doanh nghiệp thực tế.
Micron Technology ký thỏa thuận nhiều năm cung cấp HBM, DRAM, SSD cho trung tâm dữ liệu của Anthropic, cùng hợp tác tối ưu kiến trúc bộ nhớ cho AI, và đầu tư chiến lược vào vòng Series H của Anthropic. Thỏa thuận này phản ánh xu hướng ngành khi các nhà sản xuất chip và đám mây vừa là nhà cung cấp vừa là cổ đông của các phòng thí nghiệm AI.
Lập trình viên nên đọc bài này để hiểu cách các công nghệ xử lý bộ nhớ (HBM, DRAM) và kiến trúc lưu trữ mới đang định hình hiệu suất, tiết kiệm năng lượng cho các mô hình AI lớn, từ đó tìm hiểu cách tối ưu hóa ứng dụng của mình với những tiến bộ này.
xLight, a California startup chaired by former Intel CEO Pat Gelsinger, is raising $350m to build a free-electron laser-based EUV light source that could challenge ASML's monopoly on chipmaking equipment. The company has already secured a $150m CHIPS Act award and plans a prototype at Albany NanoTech by 2028. Separately, Dutch startup Euclyd is seeking €200m to build AI inference chips it claims run 100x more efficiently than Nvidia's latest hardware. Both raises reflect a broader surge of investment into deep-tech chip hardware, driven by geopolitical competition over semiconductor supply chains between the US, Europe, and China.
A performance comparison between NVIDIA's GB10 chip (featuring 10 Cortex-X925 and 10 Cortex-A725 cores, 128GB LPDDR5x, 140W TDP) and NVIDIA's Vera CPU (88 custom Olympus cores, 176 threads, 450W TDP). Benchmarks cover single-threaded, multi-threaded, and per-core multi-threaded performance using the Dell Pro Max GB10 and Ubuntu with Linux 6.17 kernel. The comparison highlights the per-core performance difference between NVIDIA's in-house Olympus cores and ARM Cortex IP, noting these are chips designed for different use cases (desktop/workstation vs. high-end server).
Slack's engineering blog details how its AI serving infrastructure evolved through four phases: from self-managed Amazon SageMaker in an escrow VPC, to Amazon Bedrock for reduced operational overhead, then a hybrid Bedrock Provisioned Throughput and On-Demand model to handle 10× traffic swings, and finally a multi-cloud architecture adding Google Cloud Vertex AI. The final setup introduced a provider-agnostic serving layer with secretless authentication, API normalization, unified observability, and intelligent routing based on latency and error metrics. Results include roughly 10% quality improvement on complex reasoning tasks and ~67% latency reduction for short prompts, alongside improved geographic failover and reduced single-provider dependency.
Malaysian customs seized 72 servers containing AI chips worth $13 million at Kuala Lumpur International Airport. The shipment was declared as ordinary computer components and was destined for re-export to an undisclosed Asian country via Malaysia's free trade zone. Investigators believe a smuggling syndicate was using Malaysia as a transit waypoint to circumvent US export controls on high-performance chips, which restrict advanced semiconductors from reaching certain markets. Malaysia imposed its own export controls on US-origin chips in 2025 under Washington pressure. The case highlights how Southeast Asian logistics hubs are being exploited by networks seeking to route restricted AI hardware around sanctions, and demonstrates that Malaysia's enforcement mechanisms are operational.
China is pushing its data centre industry to connect directly to renewable energy sources rather than drawing from a coal-heavy public grid. The flagship project is a 500MW solar farm in Ningxia's Zhongwei desert, commissioned by China Datang Corp, which uses dedicated 110kV lines to supply a data centre cluster — described as the country's first large-scale direct green-power supply for computing. The full first phase pairs the solar array with a 1.5GW wind farm and storage, targeting 4.3 TWh of annual generation against a projected 2.29 TWh data centre demand. The initiative is part of Beijing's 'east data, west computing' strategy and a national goal to source roughly 80% of AI data centre power from renewables by 2030, up from about 10% in 2023. Significant challenges remain, including curtailment, grid bottlenecks, and intermittency, with the wind component still under construction and due in September.