Micron Technology ký thỏa thuận nhiều năm cung cấp HBM, DRAM, SSD cho trung tâm dữ liệu của Anthropic, cùng hợp tác tối ưu kiến trúc bộ nhớ cho AI, và đầu tư chiến lược vào vòng Series H của Anthropic. Thỏa thuận này phản ánh xu hướng ngành khi các nhà sản xuất chip và đám mây vừa là nhà cung cấp vừa là cổ đông của các phòng thí nghiệm AI.
Vì sao nên đọc: Lập trình viên nên đọc bài này để hiểu cách các công nghệ xử lý bộ nhớ (HBM, DRAM) và kiến trúc lưu trữ mới đang định hình hiệu suất, tiết kiệm năng lượng cho các mô hình AI lớn, từ đó tìm hiểu cách tối ưu hóa ứng dụng của mình với những tiến bộ này.
Nguồn: https://thenextweb.com/news/micron-and-anthropic-sign-a-multi-year-ai-memory-supply-deal. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
Anthropic cáo buộc phòng thí nghiệm Qwen của Alibaba đã thực hiện chiến dịch "distillation" (tinh chỉnh mô hình) quy mô lớn nhất từ trước đến nay chống lại Claude, sử dụng gần 25.000 tài khoản giả mạo để tương tác 29 triệu lần trong giai đoạn 4-6/2026. Họ kêu gọi chính phủ Mỹ hành động, bao gồm kiểm soát xuất khẩu chip AI và trừng phạt hành vi distillation, trong bối cảnh chuẩn bị IPO và đang đối mặt lệnh hạn chế xuất khẩu từ chính phủ Mỹ.
Những thông tin về chiến dịch distillation quy mô lớn của Alibaba nhằm xâm phạm khả năng kỹ thuật của Claude không chỉ là cảnh báo về rủi ro cạnh tranh công nghệ mà còn là cảnh báo về những thách thức pháp lý, chính trị và chiến lược mới đối với các công ty AI, đặc biệt khi họ đang chuẩn bị IPO và đối mặt với các hạn chế xuất khẩu từ chính phủ.
Tổng giám đốc Microsoft Satya Nadella cảnh báo rằng các công ty AI không thể vừa dự đoán …
Mô hình AI Mythos của Anthropic đã phát hiện lỗ hổng trong các hệ thống bí mật của chính phủ Mỹ trong một cuộc thử nghiệm kiểm tra đỏ có kiểm soát, chứ không phải do tấn công từ bên ngoài. Kết quả này nhấn mạnh khả năng của Mythos trong việc tìm ra hàng nghìn lỗ hổng zero-day trên các hệ điều hành và trình duyệt lớn, dù chính phủ Mỹ từng hạn chế công khai mô hình này sau một vụ jailbreak riêng.
Những phát hiện về khả năng phát hiện lỗ hổng trong hệ thống an ninh quốc gia của Mỹ cho thấy AI mạnh mẽ như Mythos có thể trở thành công cụ quan trọng trong bảo mật, nhưng cũng đặt ra thách thức về kiểm soát và ứng dụng công bằng—là vấn đề cần thảo luận để xây dựng hệ sinh thái an toàn và minh bạch cho công nghệ AI.
Anthropic ra mắt Claude Tag, tích hợp Claude vào Slack như một thành viên nhóm thường trực, cho phép gọi bằng @Claude trong kênh được chỉ định. Tính năng này duy trì ngữ cảnh và bộ nhớ chia sẻ giữa các phiên, hỗ trợ quản trị viên kiểm soát quyền truy cập vào tài liệu, API, datasets và kho mã. Claude Tag hoạt động theo workflow bất đồng bộ, giúp nhóm ủy quyền nhiệm vụ nhiều bước và nhận kết quả mà không cần nhắc liên tục.
Là người phát triển muốn tối ưu hóa hiệu quả làm việc nhóm và tự động hóa công việc phức tạp trong môi trường DevOps hoặc team kỹ thuật, Claude Tag sẽ giúp bạn tiết kiệm thời gian và cải thiện chất lượng giải pháp thông qua AI tích hợp sẵn trong Slack.
Arm-sponsored content arguing that CPUs play a critical but underappreciated role in agentic AI infrastructure. While accelerators handle model performance, CPUs act as the control plane — managing data movement, workload scheduling, and secure isolation. Arm's Neoverse platform underpins custom silicon from AWS (Graviton), Google (Axion), Microsoft (Azure Cobalt), and NVIDIA (Grace Hopper/Blackwell), all reflecting a shift toward purpose-built Arm-based processors in cloud and AI datacenters. The piece introduces the Arm AGI CPU, built with Meta, targeting rack-level density for agentic AI deployments.
Frontier AI models are powerful but increasingly expensive, with token limits becoming a real constraint. A hybrid approach pairs frontier models (like Claude Opus) for planning, architecture, and complex task definition with locally run models (like Qwen3-27B via llama.cpp) for executing well-defined, simpler tasks. An experiment building a simple blog app showed Qwen completed the implementation in roughly the same time as Opus, produced acceptable results, and cost nothing versus $4.08 for Opus. The key is finding the complexity threshold your local model can handle reliably, then reserving frontier model tokens for higher-order work.
MIT Technology Review's daily briefing covers several major stories: IBM has unveiled a prototype chip with ~100 billion transistors on a fingernail-sized area, doubling transistor density from 2021 and potentially extending Moore's Law by building transistors upward rather than shrinking them. Europe is experiencing a record heat wave straining power grids, with some plants offline during historically planned maintenance windows. Anthropic has accused Alibaba of illicitly extracting Claude's capabilities via model distillation, calling it the largest known distillation attack. OpenAI and Broadcom revealed their first jointly designed AI chip called Jalapeño. Additional items cover the EU joining a US pact against Chinese AI, data center-driven inflation in memory chips, and companies struggling to control AI token spending costs.
China is pushing its data centre industry to connect directly to renewable energy sources rather than drawing from a coal-heavy public grid. The flagship project is a 500MW solar farm in Ningxia's Zhongwei desert, commissioned by China Datang Corp, which uses dedicated 110kV lines to supply a data centre cluster — described as the country's first large-scale direct green-power supply for computing. The full first phase pairs the solar array with a 1.5GW wind farm and storage, targeting 4.3 TWh of annual generation against a projected 2.29 TWh data centre demand. The initiative is part of Beijing's 'east data, west computing' strategy and a national goal to source roughly 80% of AI data centre power from renewables by 2030, up from about 10% in 2023. Significant challenges remain, including curtailment, grid bottlenecks, and intermittency, with the wind component still under construction and due in September.