Runpod, a cloud startup renting GPU compute to AI developers, has raised $100M led by Summit Partners at a $1bn valuation — a tenfold increase from its ~$100M seed valuation in 2024. The company reports $240M in annualized revenue, over 1 million developers on the platform, and 20 billion inference requests processed. Unlike rivals focused solely on inference, Runpod offers the full ML lifecycle: experimentation, training, fine-tuning, and deployment. It uses an asset-light model, renting capacity rather than owning data centers, and supports both Nvidia and AMD chips. The company says it turned down buyout offers exceeding $500M to remain independent. Key risks include reliance on third-party hardware, margin pressure when chips are scarce, and well-funded competitors like CoreWeave.
Nguồn: https://thenextweb.com/news/runpod-100m-summit-partners-1bn-valuation. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
Các nhà nghiên cứu từ MIT và Microsoft đã phát triển Murakkab, một hệ thống tự động tối ưu hóa quy trình làm việc của AI agent bằng cách tự động lựa chọn mô hình, công cụ và cấu hình phần cứng dựa trên mô tả ngôn ngữ tự nhiên từ nhà phát triển, đồng thời điều chỉnh linh hoạt theo ưu tiên như chi phí hay tốc độ. Trong thử nghiệm, Murakkab tiết kiệm tới ~65% tài nguyên tính toán, ~73% năng lượng và trên 75% chi phí so với phương pháp truyền thống mà vẫn duy trì hiệu suất ổn định.
Lập trình viên nên đọc bài này vì Murakkab không chỉ tiết kiệm chi phí và năng lượng cho AI mà còn giúp họ thiết kế các hệ thống thông minh hiệu quả hơn bằng cách tự động tối ưu hóa các quyết định kỹ thuật từ đầu, cho phép họ tập trung vào logic kinh doanh thay vì chi tiết kỹ thuật phức tạp.
OpenAI và Broadcom hợp tác phát triển chip AI tùy chỉnh Jalapeño nhằm cạnh tranh với Nvidia Blackwell và Google TPU, nhắm vào workloads inference. Chip này đã được thử nghiệm với mô hình GPT-5.3-Codex-Spark và dự kiến triển khai vào cuối năm 2025, trong khi tình trạng thiếu hụt HBM đang ảnh hưởng đến biên lợi nhuận của Broadcom.
Lập trình viên nên đọc bài này để hiểu cách các công ty lớn như OpenAI và Broadcom hợp tác phát triển chip AI chuyên dụng, giúp tối ưu hóa hiệu suất cho các mô hình lớn như GPT-5.3, ảnh hưởng trực tiếp đến hiệu năng và chi phí của các ứng dụng AI trong tương lai.
Qt Canvas Painter giới thiệu QCanvasPath và nhóm path nhằm tối ưu hiệu suất render 2D, tiết kiệm ~60% bộ nhớ nhờ định dạng SoA thân thiện cache, hỗ trợ tái sử dụng giữa các frame và tương thích API với QCanvasPainter. Nhóm path cho phép GPU lưu trữ đỉnh (vertex) tĩnh, giúp xử lý biến đổi, màu sắc hay gradient mà không cần cập nhật buffer, đồng thời chứng minh khả năng render tiến triển 60fps trên thiết bị nhúng với tải CPU/GPU thấp hơn. Tính năng này sẽ trở thành module chính thức trong Qt 6.12.
Lập trình viên muốn tối ưu hiệu suất rendering 2D trên Qt nên đọc bài này để khám phá cách sử dụng QCanvasPath và path groups để giảm chi phí CPU/GPU, giảm bộ nhớ và cải thiện trải nghiệm 60FPS trên thiết bị embedded.
Oracle đã cắt giảm 13% lực lượng lao động (khoảng 21.000 nhân viên) trong năm tài chính 2026, tiêu tốn 1,84 tỷ USD chi phí thôi việc, chủ yếu do tự động hóa bằng AI và tái cấu trúc chiến lược. Song song, hãng đầu tư mạnh 70 tỷ USD vào cơ sở hạ tầng cloud, ký hợp đồng lớn với OpenAI và Meta, đồng thời huy động 40 tỷ USD từ nợ và vốn mới.
Lập trình viên nên đọc bài này để hiểu rõ cách AI và cloud computing đang thay đổi mô hình công việc, từ đó cập nhật kiến thức về xu hướng công nghệ mới và cách ứng dụng chúng trong việc phát triển ứng dụng, tối ưu hóa hệ thống, và chuẩn bị cho tương lai của ngành IT.
Giá DDR2 tăng 55-60% trong Q2/2026 do thiếu hụt DRAM trầm trọng khi các nhà sản xuất chuyển sản lượng wafer sang sản xuất HBM cho AI, dự báo tiếp tục tăng 35-40% trong Q3. Các hãng phần cứng buộc phải hạ cấp từ DDR4 xuống DDR3, rồi DDR3 xuống DDR2 để đảm bảo nguồn cung, ảnh hưởng đến hệ thống nhúng, thiết bị công nghiệp và mạng. Nguồn cung DDR2 không thể cải thiện trước năm 2027-2028 khi các nhà máy mới của SK Hynix và Micron đi vào hoạt động.
Lập trình viên nên đọc bài này vì nó giúp bạn hiểu rõ về những thách thức về nguồn cung cấp bộ nhớ DDR2, ảnh hưởng đến thiết kế phần cứng cho các ứng dụng embedded và hệ thống AI, từ đó có thể tối ưu hóa kiến trúc phần mềm và dự đoán chi phí phát triển sản phẩm trong tương lai.
Micron Technology ký thỏa thuận nhiều năm cung cấp HBM, DRAM, SSD cho trung tâm dữ liệu của Anthropic, cùng hợp tác tối ưu kiến trúc bộ nhớ cho AI, và đầu tư chiến lược vào vòng Series H của Anthropic. Thỏa thuận này phản ánh xu hướng ngành khi các nhà sản xuất chip và đám mây vừa là nhà cung cấp vừa là cổ đông của các phòng thí nghiệm AI.
Lập trình viên nên đọc bài này để hiểu cách các công nghệ xử lý bộ nhớ (HBM, DRAM) và kiến trúc lưu trữ mới đang định hình hiệu suất, tiết kiệm năng lượng cho các mô hình AI lớn, từ đó tìm hiểu cách tối ưu hóa ứng dụng của mình với những tiến bộ này.
Amazon announced a $13 billion investment to expand AWS data center capacity in India through 2030, bringing its total India investment commitments to $48 billion. The announcement followed a meeting between CEO Andy Jassy and Prime Minister Modi. This is Amazon's third major India commitment in three years. The move is part of a broader wave of global tech investment in India's AI infrastructure, with Microsoft pledging $17.5 billion and Google $15 billion. Amazon is also expanding its retail and quick-commerce operations in India, planning 20+ fulfillment centers and extending its Amazon Now service to 300+ cities.
China is pushing its data centre industry to connect directly to renewable energy sources rather than drawing from a coal-heavy public grid. The flagship project is a 500MW solar farm in Ningxia's Zhongwei desert, commissioned by China Datang Corp, which uses dedicated 110kV lines to supply a data centre cluster — described as the country's first large-scale direct green-power supply for computing. The full first phase pairs the solar array with a 1.5GW wind farm and storage, targeting 4.3 TWh of annual generation against a projected 2.29 TWh data centre demand. The initiative is part of Beijing's 'east data, west computing' strategy and a national goal to source roughly 80% of AI data centre power from renewables by 2030, up from about 10% in 2023. Significant challenges remain, including curtailment, grid bottlenecks, and intermittency, with the wind component still under construction and due in September.