Google Cloud announces several Confidential Computing updates aimed at securing AI workloads. Key highlights include: Confidential G4 VMs with NVIDIA RTX PRO 6000 Blackwell GPUs now in preview across all supported regions; open-source Prompt Encryption SDKs on GitHub for end-to-end encrypted AI inference; a collaboration with Apple to run Private Cloud Compute on Google Cloud using Intel TDX and NVIDIA Blackwell GPUs; Intel TDX support coming to C4 machine series; Live Migration for C3D Confidential VMs now generally available; and Confidential Space updates including Intel Trust Authority integration for independent attestation and NVIDIA H100 GPU support for secure multi-party AI workloads.
Nguồn: https://cloud.google.com/blog/products/identity-security/verifiable-trust-in-the-ai-era-whats-new-in-confidential-computing. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
OpenAI và Broadcom hợp tác phát triển chip AI tùy chỉnh Jalapeño nhằm cạnh tranh với Nvidia Blackwell và Google TPU, nhắm vào workloads inference. Chip này đã được thử nghiệm với mô hình GPT-5.3-Codex-Spark và dự kiến triển khai vào cuối năm 2025, trong khi tình trạng thiếu hụt HBM đang ảnh hưởng đến biên lợi nhuận của Broadcom.
Lập trình viên nên đọc bài này để hiểu cách các công ty lớn như OpenAI và Broadcom hợp tác phát triển chip AI chuyên dụng, giúp tối ưu hóa hiệu suất cho các mô hình lớn như GPT-5.3, ảnh hưởng trực tiếp đến hiệu năng và chi phí của các ứng dụng AI trong tương lai.
NVIDIA ra mắt NVIDIA Agent Toolkit, một nền tảng mã nguồn mở và mô-đun giúp doanh nghiệp xây dựng các tác nhân AI chuyên biệt đáng tin cậy. Bộ công cụ tích hợp các mô hình Nemotron (tùy chỉnh lý luận), NemoClaw (đảm bảo hành vi an toàn) và OpenShell (thực thi bảo mật), được triển khai trong các lĩnh vực như y tế, an ninh mạng và thiết kế chip.
Lập trình viên chuyên về AI nên đọc bài này để hiểu cách xây dựng các hệ thống agent chuyên dụng, an toàn và có thể kiểm soát được, giúp họ ứng dụng kiến thức về mô hình open-source, bảo mật và tích hợp vào các dự án doanh nghiệp thực tế.
Google giới thiệu tầm nhìn tương lai về cơ sở dữ liệu với sự tích hợp AI agent và truy vấn không chính xác (inexact queries) thông qua ngôn ngữ tự nhiên, thay vì chỉ SQL truyền thống. Họ đang nhúng các chức năng AI (như AI.IF sử dụng Gemini) trực tiếp vào Google SQL trên các nền tảng Spanner, AlloyDB và BigQuery, đồng thời phát triển "proxy models" để giảm chi phí và độ trễ khi gọi LLM. Trong 3-5 năm tới, người dùng có thể chuyển từ tương tác trực tiếp sang điều phối các agent, thay thế dashboard truyền thống bằng phân tích hội thoại.
Những công nghệ mới từ Google như proxy models và AI tích hợp trực tiếp vào cơ sở dữ liệu sẽ giúp tối ưu hóa hiệu suất và chi phí khi xử lý các truy vấn phức tạp, đồng thời mở ra khả năng tương tác tự nhiên thông qua ngôn ngữ, giúp lập trình viên tìm hiểu cách ứng dụng AI vào hệ thống dữ liệu hiện đại.
NVIDIA's GeForce NOW is running summer membership discounts alongside the Steam Summer Sale, offering $70 off a 12-month Ultimate membership and $35 off a Performance membership. The Ultimate tier delivers RTX 4080/5080-class cloud performance at up to 4K/120fps with DLSS and ray tracing. Six new games join the GeForce NOW library this week, headlined by Devolver Digital's Dark Scrolls and Square Enix's The Adventures of Elliot: The Millennium Tales.
MIT Technology Review's daily newsletter covers the launch of its Engineering issue, featuring stories on subsea tunneling, ASML chipmaking machines, and geoengineering. Key news includes China reclaiming the world's fastest supercomputer title with Shenzhen's LineShine overtaking El Capitan, Anthropic's Mythos AI model being suspended after reportedly finding flaws in classified US government systems, a $500 million nonprofit backed by Stripe, Anthropic, OpenAI, and Bill Gates to combat respiratory viruses, SpaceX's secretive Starfall orbital delivery spacecraft test flight, and Nvidia's banned AI chips doubling in price on China's black market.
NVIDIA and AWS have announced several joint infrastructure advancements for enterprise AI at scale. New Amazon EC2 G7 instances powered by NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs deliver up to 4.6x AI inference performance and 2.1x graphics performance over G6 instances, with support for up to 8 GPUs and 700 Gbps networking. Amazon OpenSearch Serverless now uses NVIDIA cuVS for GPU-accelerated vector indexing by default, enabling up to 10x faster vector indexing at a quarter of the CPU-only cost, making billion-scale vector databases buildable in under an hour. Additionally, AWS has achieved NVIDIA Exemplar Cloud status for GB300 training workloads, certifying that AWS meets NVIDIA's rigorous performance benchmarks for large-scale AI training.
SK Hynix has filed to raise up to $29 billion through American depositary receipts on Nasdaq, tentatively set for July 10. If priced at the top of its range, the deal would surpass Alibaba's 2014 record as the largest ADR offering ever. The entire raise is earmarked for chip fabrication capacity — including a fab in Yongin, an advanced-packaging facility in Cheongju, and EUV lithography equipment — with nothing going to shareholders or debt repayment. SK Hynix holds 60–70% of HBM4 volume allocated to Nvidia's Vera Rubin platform and recently surpassed Samsung to become South Korea's most valuable listed company. The company crossed $1 trillion in market cap in May, joining Nvidia and TSMC. HBM capacity for 2026 is sold out with shortages forecast into 2027, though the cyclical nature of memory markets remains a key risk.
The RTX 50 series launched with headline features like Multi Frame Generation, Ray Reconstruction, and Neural Texture Compression that were either unfinished or lacked broad software adoption. Months after launch, major fixes and updates are still arriving, and the most compelling exclusive features primarily benefit 4K gaming — a niche most PC gamers don't occupy. RTX 40-series owners already receive the biggest DLSS 4.5 image quality improvements, leaving the 50 series in an awkward middle ground. The author argues the generation feels like a transitional stepping stone, with the upcoming RTX 60 series (Rubin) positioned to be the hardware that fully realizes Nvidia's long-term rendering ambitions.