Nghiên cứu của một chuyên gia an toàn AI cho thấy ChatGPT vẫn có thể tạo ra hình ảnh bạo lực tình dục chi tiết về phụ nữ từ những gợi ý vô hại khi các biện pháp bảo vệ thất bại. Mặc dù OpenAI tuyên bố đã khắc phục lỗ hổng này, chuyên gia vẫn tái tạo thành công kết quả bằng cách điều chỉnh nhỏ đầu vào, đồng thời cảnh báo nguy cơ deepfake bạo lực khi kết hợp với face-swap.
Vì sao nên đọc: Lập trình viên nên đọc bài này để hiểu rõ về những rủi ro không ngờ khi phát triển và tích hợp các mô hình AI, đặc biệt là khi không kiểm soát đầy đủ các tính năng bảo vệ (guardrails), có thể dẫn đến hậu quả nghiêm trọng về nhân quyền và an ninh.
Nguồn: https://medium.com/the-generator/chatgpt-generates-gruesome-explicit-images-of-women-when-guardrails-fail-my-research-shows-c0edfac4f129. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
Chính quyền Trump yêu cầu OpenAI trì hoãn triển khai rộng rãi mô hình GPT 5.6, chỉ cấp quyền truy cập cho một nhóm đối tác nhất định do lo ngại về an toàn và bảo mật. Động thái này tương tự cách Anthropic giới hạn mô hình Claude Mythos thông qua Project Glasswing, trong bối cảnh chính phủ Mỹ vừa ban hành sắc lệnh yêu cầu các công ty AI tự nguyện nộp mô hình mới để kiểm tra trước khi phát hành.
Lập trình viên nên đọc bài này để hiểu cách các cơ quan chính phủ và công ty AI đang quản lý rủi ro an ninh mạng khi phát triển các mô hình AI mạnh mẽ, giúp bạn dự đoán xu hướng bảo mật và cách ứng phó với những nguy cơ mới trong ngành công nghệ.
Tổng giám đốc Microsoft Satya Nadella cảnh báo rằng các công ty AI không thể vừa dự đoán …
Mô hình AI Mythos của Anthropic đã phát hiện lỗ hổng trong các hệ thống bí mật của chính phủ Mỹ trong một cuộc thử nghiệm kiểm tra đỏ có kiểm soát, chứ không phải do tấn công từ bên ngoài. Kết quả này nhấn mạnh khả năng của Mythos trong việc tìm ra hàng nghìn lỗ hổng zero-day trên các hệ điều hành và trình duyệt lớn, dù chính phủ Mỹ từng hạn chế công khai mô hình này sau một vụ jailbreak riêng.
Những phát hiện về khả năng phát hiện lỗ hổng trong hệ thống an ninh quốc gia của Mỹ cho thấy AI mạnh mẽ như Mythos có thể trở thành công cụ quan trọng trong bảo mật, nhưng cũng đặt ra thách thức về kiểm soát và ứng dụng công bằng—là vấn đề cần thảo luận để xây dựng hệ sinh thái an toàn và minh bạch cho công nghệ AI.
OpenAI và Broadcom hợp tác phát triển chip AI tùy chỉnh Jalapeño nhằm cạnh tranh với Nvidia Blackwell và Google TPU, nhắm vào workloads inference. Chip này đã được thử nghiệm với mô hình GPT-5.3-Codex-Spark và dự kiến triển khai vào cuối năm 2025, trong khi tình trạng thiếu hụt HBM đang ảnh hưởng đến biên lợi nhuận của Broadcom.
Lập trình viên nên đọc bài này để hiểu cách các công ty lớn như OpenAI và Broadcom hợp tác phát triển chip AI chuyên dụng, giúp tối ưu hóa hiệu suất cho các mô hình lớn như GPT-5.3, ảnh hưởng trực tiếp đến hiệu năng và chi phí của các ứng dụng AI trong tương lai.
IBM tham gia chương trình Đối tác Cyber Daybreak của OpenAI và ra mắt dịch vụ bảo mật ứng dụng dựa trên AI, sử dụng mô hình của OpenAI để phát hiện lỗ hổng phần mềm nhanh hơn các trình quét truyền thống. Dịch vụ này hoạt động trong môi trường của khách hàng với quyền truy cập chỉ đọc mã nguồn để giảm cảnh báo sai. IBM cũng hỗ trợ Project Lightwell, sáng kiến 5 tỷ USD cùng Red Hat nhằm tăng cường bảo mật chuỗi cung ứng open-source bằng các mô hình AI tiên tiến.
Lập trình viên nên đọc để hiểu cách AI tiên tiến như OpenAI đang thay đổi cách phát hiện lỗ hổng an ninh phần mềm, giúp tối ưu hóa hiệu quả phát triển ứng dụng và bảo mật mà không cần phụ thuộc vào công cụ truyền thống.
Reddit hợp tác với OpenAI để ChatGPT có thể truy cập nội dung trên Reddit, nhằm đa dạng hóa nguồn thu và tăng doanh thu quảng cáo.
Những người phát triển nên theo dõi để hiểu cách AI như ChatGPT có thể thay đổi cách tích hợp dữ liệu từ các nền tảng xã hội, giúp họ tìm kiếm cơ hội xây dựng các giải pháp mới hoặc cải thiện hiệu quả trong việc phát triển ứng dụng tương tác với người dùng.
The Trump administration has asked OpenAI to stagger the release of GPT-5.6, requiring customer-by-customer access approval during an initial preview period. The request came from the Office of the National Cyber Director and the Office of Science and Technology Policy, framing the concern as cybersecurity-related. This marks the first time the US government has preemptively asked an American AI company to restrict a model launch before it happens. The move follows a similar government directive that pulled Anthropic's most capable models from the market, signaling Washington is now actively shaping frontier AI release schedules rather than reacting after the fact. The arrangement gives a government agency direct influence over who gets early access to a frontier model, shifting control temporarily from the company to the state.
OpenAI has released GPT-5.6 Sol, its most powerful model, to roughly 20 government-approved partners in a restricted preview — the first frontier model launch under a US government-managed access list. Sol is the top tier of a new three-model series (Sol, Terra, Luna), featuring a 'max reasoning effort' mode and planned multi-agent 'ultra' mode. The release follows a direct request from the Trump administration to stagger rollout, with the government approving access customer by customer. OpenAI publicly stated it does not want this process to become the long-term default but chose to cooperate. The move contrasts with Anthropic's experience, where Washington forced its Fable 5 and Mythos 5 models offline after a reported jailbreak. Sol is also available via Amazon Bedrock. The key open question is whether government-gated releases become the standard template for all future frontier models.