Nvidia has announced a new revenue-sharing and credit-support model that allows AI cloud providers to access large volumes of GPUs without paying the full cost upfront. Instead, Nvidia collects standard product revenue on chips plus a share of the cloud revenue generated from renting them out. Two early partners — Sharon AI and Firmus — are already operating under this model, with Firmus building a 360-megawatt AI factory in Indonesia housing up to 170,000 GPUs. The arrangement targets AI-native companies like Baseten, Fireworks AI, and Together AI that need elastic compute access without the balance-sheet risk of building data centers. For Nvidia, it creates a recurring usage-linked income stream on top of hardware sales, though it also exposes the company to AI demand slowdowns through both chip sales and shared cloud revenue.
Nguồn: https://thenextweb.com/news/nvidia-offers-ai-startups-compute-now-payment-later. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
NVIDIA BioNeMo Agent Toolkit tích hợp các khả năng khoa học GPU-accelerated (như NVIDIA Parabricks, RAPIDS-singlecell, nvMolKit) vào Claude Science, cho phép các nhà nghiên cứu mô tả nhiệm vụ bằng ngôn ngữ tự nhiên (như dự đoán cấu trúc protein) để AI orchestrate thực hiện. Toolkit này là mã nguồn mở, framework-agnostic, có sẵn trên GitHub, trong khi Claude Science đang trong giai đoạn public beta.
Lập trình viên chuyên về AI sinh học nên đọc để khám phá cách tích hợp công nghệ GPU cao cấp của NVIDIA vào các pipeline nghiên cứu sinh học sinh thái, giúp tối ưu hóa hiệu suất và mở rộng khả năng tự động hóa cho các dự án liên quan đến gen, phân tử và dữ liệu sinh học thông minh.
OpenAI và Broadcom hợp tác phát triển chip AI tùy chỉnh Jalapeño nhằm cạnh tranh với Nvidia Blackwell và Google TPU, nhắm vào workloads inference. Chip này đã được thử nghiệm với mô hình GPT-5.3-Codex-Spark và dự kiến triển khai vào cuối năm 2025, trong khi tình trạng thiếu hụt HBM đang ảnh hưởng đến biên lợi nhuận của Broadcom.
Lập trình viên nên đọc bài này để hiểu cách các công ty lớn như OpenAI và Broadcom hợp tác phát triển chip AI chuyên dụng, giúp tối ưu hóa hiệu suất cho các mô hình lớn như GPT-5.3, ảnh hưởng trực tiếp đến hiệu năng và chi phí của các ứng dụng AI trong tương lai.
Các mô hình Claude của Anthropic giờ đây đã sẵn sàng trên Microsoft Foundry, chạy trên GPU NVIDIA GB300 Blackwell Ultra kết nối qua Quantum-X800 InfiniBand trên Azure. Điều này giúp doanh nghiệp triển khai các tác nhân AI tự động và chuyên biệt với hiệu suất suy luận cải thiện và chi phí sở hữu thấp hơn.
Lập trình viên nên đọc bài này để khám phá cách kết hợp GPU Blackwell Ultra của NVIDIA với các mô hình AI như Claude của Anthropic, giúp tối ưu hóa hiệu suất xử lý và giảm chi phí cho các ứng dụng tự động hóa AI chuyên dụng trong doanh nghiệp.
Vytautas Savickas, CEO của Oxylabs, cho rằng cạnh tranh tiếp theo của AI sẽ dựa vào cơ sở hạ tầng chứ không phải kích thước mô hình. Ông nhấn mạnh rằng hệ thống AI trong kỷ nguyên agent cần truy cập dữ liệu web thời gian thực, xử lý tự động hóa trình duyệt và kết nối thông tin cập nhật, thay vì chỉ tập trung vào mô hình lớn hơn.
Lập trình viên nên đọc bài này để hiểu cách xây dựng hệ thống AI mạnh mẽ không chỉ dựa trên kiến trúc mô hình lớn mà là vào khả năng kết nối với dữ liệu thực thời và cơ sở hạ tầng đáng tin cậy, giúp ứng dụng hoạt động hiệu quả hơn trong thế giới agentic.
NVIDIA ra mắt NVIDIA Agent Toolkit, một nền tảng mã nguồn mở và mô-đun giúp doanh nghiệp xây dựng các tác nhân AI chuyên biệt đáng tin cậy. Bộ công cụ tích hợp các mô hình Nemotron (tùy chỉnh lý luận), NemoClaw (đảm bảo hành vi an toàn) và OpenShell (thực thi bảo mật), được triển khai trong các lĩnh vực như y tế, an ninh mạng và thiết kế chip.
Lập trình viên chuyên về AI nên đọc bài này để hiểu cách xây dựng các hệ thống agent chuyên dụng, an toàn và có thể kiểm soát được, giúp họ ứng dụng kiến thức về mô hình open-source, bảo mật và tích hợp vào các dự án doanh nghiệp thực tế.
Micron Technology ký thỏa thuận nhiều năm cung cấp HBM, DRAM, SSD cho trung tâm dữ liệu của Anthropic, cùng hợp tác tối ưu kiến trúc bộ nhớ cho AI, và đầu tư chiến lược vào vòng Series H của Anthropic. Thỏa thuận này phản ánh xu hướng ngành khi các nhà sản xuất chip và đám mây vừa là nhà cung cấp vừa là cổ đông của các phòng thí nghiệm AI.
Lập trình viên nên đọc bài này để hiểu cách các công nghệ xử lý bộ nhớ (HBM, DRAM) và kiến trúc lưu trữ mới đang định hình hiệu suất, tiết kiệm năng lượng cho các mô hình AI lớn, từ đó tìm hiểu cách tối ưu hóa ứng dụng của mình với những tiến bộ này.
GeForce NOW is adding 12 new games to its cloud gaming service throughout July 2026, headlined by Monopoly: Star Wars Heroes vs. Villains. Other notable additions include Assassin's Creed Black Flag Resynced, Heave Ho 2, ZeroSpace, and several Game Pass titles. Additionally, 10 more games from June were added to the platform. NVIDIA is also running a Summer Sale offering $35 off a 12-month Performance membership and $70 off a 12-month Ultimate membership, which provides RTX 4080/5080-class cloud gaming performance with DLSS and ray tracing.
NVIDIA đang phát triển định dạng nhị phân firmware mới có tên TLV (Tag-Length-Value) cho driver Nova, thay thế cấu trúc hỗn hợp hiện tại gồm header nhị phân và file ELF nhằm đơn giản hóa việc phân tích trong Rust. Định dạng TLV sử dụng các trường lặp tag/length/value và được xử lý bởi script Python (extract-firmware-nova.py).
Lập trình viên muốn mở rộng hoặc sửa đổi driver GPU Nova-Core nên đọc để hiểu cách chuyển đổi sang định dạng TLV giúp giảm thiểu phức tạp trong việc giải析 và tương tác với firmware, từ đó tối ưu hóa hiệu suất phát triển.