A Guardian investigation reveals OpenAI apparently never visited a key site earmarked for its Stargate UK data centre project before the initiative was publicly announced. The project, a partnership between OpenAI, Nvidia, and cloud provider Nscale, was unveiled in September 2025 with promises of up to 8,000 Nvidia GPUs deployed in north-east England by Q1 2026. A March 2026 investigation found the designated supercomputer site in Loughton, Essex was still a functioning scaffolding yard with no construction underway, and land records showed no evidence of Nscale's claimed ownership. The UK government had issued a press release describing a £1.9 billion investment contract with Nscale that had never been signed, and admitted it was not auditing these commitments. OpenAI formally paused Stargate UK in April 2026, citing electricity costs roughly four times higher than in the US and Nordic countries, plus unresolved AI copyright regulation. Meanwhile, Nscale redirected €695 million to a Microsoft data centre campus in Portugal. The episode highlights a structural weakness in how the UK government counts AI investment — tallying pledges at announcement without verification, producing what the Guardian calls 'phantom investments.'
Nguồn: https://thenextweb.com/news/openai-apparently-never-visited-the-site-of-its-flagship-uk-ai-project. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
Function calling cho phép các mô hình ngôn ngữ lớn (LLMs) tương tác với hệ thống bên ngoài thông qua việc gọi các API hoặc hàm đã định nghĩa dựa trên đầu vào của người dùng, thay vì chỉ dừng lại ở sinh văn bản. Bài viết giải thích khái niệm, minh họa cách hoạt động bằng ví dụ JSON có cấu trúc, và cung cấp hướng dẫn Python hoàn chỉnh sử dụng GPT-4 của OpenAI để xây dựng hệ thống lọc email tự động lưu trữ thư quảng cáo và đánh dấu sao thư cá nhân hoặc công việc.
Là lập trình viên muốn tự động hóa công việc hoặc tích hợp AI vào ứng dụng thực tế, bài này sẽ giúp bạn hiểu cách biến mô hình ngôn ngữ lớn thành công cụ thực hành thông qua gọi hàm, từ đó tối ưu hóa hiệu suất và tính linh hoạt của hệ thống.
Trong tuần ngắn trước Ngày Độc lập, cổ phiếu chip AI mất 12% trong hai phiên giao dịch liên tiếp do báo cáo về việc SK Hynix chậm mở rộng sản xuất HBM và báo cáo việc làm yếu. Nhà đầu tư chuyển hướng sang các công ty phần mềm doanh nghiệp như ServiceNow, Snowflake và Palantir, kỳ vọng doanh thu thực tế từ AI.
Lập trình viên nên đọc bài này để hiểu rõ cách thị trường chuyển hướng từ các công ty vật lý AI (chip, bộ nhớ) sang phần mềm AI, giúp xác định những cơ hội mới trong ngành công nghệ và dự đoán xu hướng đầu tư thực sự có lợi cho tương lai.
Cơ chế ReAct (Reason + Act + Observe) là nền tảng hoạt động của hầu hết các AI agent. Thay vì gọi song song các công cụ (tool) khi đã biết trước đầu vào, ReAct cho phép mô hình gọi công cụ theo từng bước, quan sát kết quả, rồi quyết định hành động tiếp theo dựa trên thông tin mới thu thập. Điều này giúp tối ưu chi phí và độ chính xác bằng cách bỏ qua các bước không cần thiết khi kết quả trước đó đã đủ.
Lập trình viên nên đọc bài này để hiểu cách các AI agent hiện đại sử dụng chu trình ReAct để tối ưu hóa hiệu suất và chính xác khi xử lý nhiệm vụ phức tạp, từ đó giúp xây dựng các ứng dụng tự động hóa thông minh và tiết kiệm chi phí hơn.
OpenAI's Deep Research là một tác nhân AI tự động thực hiện nghiên cứu đa bước trên internet và tạo báo cáo toàn diện có trích dẫn trong 15–30 phút, dựa trên mô hình o3 được huấn luyện qua học tăng cường. Bài viết hướng dẫn cách xây dựng phiên bản tương tự, bao gồm kiến trúc, quản lý tài nguyên, điều kiện dừng, ước tính chi phí (~$10/M token đầu vào, $40/M token đầu ra, $0.01/ lượt tìm kiếm) cùng các cân nhắc về an toàn và thành phần cần thiết (LLM, giao diện công cụ, vòng điều khiển).
Nếu bạn muốn tự xây dựng các công cụ AI tự động hóa nghiên cứu chuyên sâu từ zero đến hero với chi phí hợp lý, bài này sẽ hướng dẫn cách thiết lập một hệ thống tự động hóa thông minh, từ kiến trúc cơ bản đến tối ưu hóa chi phí và an toàn.

Khi phân phối các cuộc gọi LLM trên các worker PySpark bằng mapInPandas, MLflow's openai.autolog() không ghi lại traces do ba vấn đề: worker không kế thừa URI theo dõi và tên experiment từ driver, xuất traces bất đồng bộ gây xung đột thread khi kết thúc process, và không hỗ trợ liên kết trace cha-con. Giải pháp là thiết lập tracking URI, experiment name và tắt MLFLOW_ENABLE_ASYNC_TRACE_LOGGING=false trong hàm worker. Sau khi hoạt động, việc theo dõi từng cuộc gọi phát hiện chi phí ẩn do Spark lazy evaluation thực thi lại nhiều lần các cuộc gọi LLM.
Lập trình viên muốn tối ưu hóa và theo dõi hiệu suất mô hình ML trên Spark với OpenAI, đặc biệt khi sử dụng mapInPandas, nên đọc bài này để khắc phục lỗi trace không hoạt động và khám phá cách khắc phục vấn đề tái thực hiện LLM nhiều lần do tính chất lazy evaluation của Spark.
Tổng giám đốc Microsoft Satya Nadella cảnh báo rằng các công ty AI không thể vừa dự đoán mất việc hàng loạt vừa đòi quyền kiểm soát hạ tầng vô hạn, nhấn mạnh nhu cầu xây dựng một hệ sinh thái AI phân tán thay vì tập trung vào vài mô hình thống trị. Microsoft ủng hộ xu hướng này bằng cách tung ra các mô hình AI giá rẻ và cân nhắc lưu trữ DeepSeek, nhằm cạnh tranh với OpenAI và Anthropic trước các đợt IPO sắp tới.
Những lập trình viên muốn xây dựng tương lai công nghệ bền vững và cạnh tranh trong thị trường AI đang phát triển nên đọc bài này để hiểu cách cân bằng lợi ích kinh tế với trách nhiệm xã hội, tránh rủi ro về tập trung quyền lực và tìm kiếm giải pháp công bằng trong cuộc cách mạng trí tuệ nhân tạo.
Phân tích chi phí sơ lược cho thấy suy luận (inference) AI thực sự sinh lời, với chi phí ước tính khoảng 1 USD cho mỗi triệu token đầu ra, thấp hơn nhiều so với mức giá 4,5 USD trở lên của các nhà cung cấp như OpenAI, qua đó đạt biên lợi nhuận gộp 70–80%. Suy luận AI có lợi nhuận, nhưng các phòng thí nghiệm AI như OpenAI và Anthropic sử dụng khoản lợi nhuận này để bù đắp chi phí đào tạo mô hình tốn kém.
Là người phát triển muốn tối ưu chi phí cho ứng dụng AI của mình, bài viết này giúp bạn hiểu rõ về lợi nhuận thực tế của quá trình inference AI, từ đó có thể xây dựng mô hình kinh doanh hiệu quả và tránh bỏ lỡ cơ hội tiết kiệm chi phí mà không phụ thuộc vào sự hỗ trợ từ các công ty lớn.
OpenAI's tính năng nén ngữ cảnh native giảm tới ~86% lượng token đầu vào mà không ảnh hưởng đáng kể đến chất lượng tổng thể trong phân tích malware tự động, dù mô hình hóa đối tượng miền có giảm nhẹ. Bài viết phân biệt rõ memory làm việc (xử lý bởi nén ngữ cảnh) và storage bền vững (lưu trữ artifacts chính xác), đồng thời hướng dẫn sử dụng hai kiểu API nén (server-side và standalone) kèm ví dụ code, nhấn mạnh tầm quan trọng của "context engineering" trong workflow bảo mật agentic lâu dài.
Những lập trình viên phát triển hệ thống an ninh tự động cần đọc để tối ưu hóa hiệu suất và độ chính xác của các agent AI trong phân tích malware bằng cách hiểu cách điều khiển bộ nhớ và ngữ cảnh hiệu quả, từ đó giảm chi phí tính toán và bảo đảm chất lượng kết quả.