Cloudflare is setting a September 15 deadline to block AI training crawlers from ad-supported pages by default. New and free-tier sites will automatically block bots that scrape content for AI training or agents, unless site owners opt in. Mixed-use crawlers that bundle search and training cannot be separated will also be blocked. Alongside blocking, Cloudflare is evolving its Pay Per Crawl model into Pay Per Use, paying publishers when their content influences an AI-generated answer, with early partners including Ceramic.ai and You.com. A new dashboard will show publishers which bots are taking their content and how little traffic is returned. The move responds to bots now driving over half of all web traffic and AI-generated answers cutting publisher click-through rates by roughly 40%. Cloudflare frames this as protecting the open web's economic model, though Google, Apple, and Microsoft crawlers present a dilemma since blocking them risks disappearing from search results.
Nguồn: https://thenextweb.com/news/cloudflare-block-ai-crawlers-pay-publishers. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
Alook là nền tảng mã nguồn mở cho phép xây dựng một "công ty AI" đa tác nhân với cấu trúc tổ chức, mỗi tác nhân có vai trò riêng và hộp thư email ảo, phối hợp qua email. Hướng dẫn triển khai 4 tác nhân (CEO, PM, kỹ sư, vận hành) để tự động xây dựng công cụ theo dõi giá cạnh tranh bằng Bright Data CLI, lên lịch và gửi cảnh báo khi giá thay đổi chỉ với một lệnh từ tác nhân cấp cao.
Lập trình viên nên đọc bài này để hiểu cách xây dựng hệ sinh thái tự động hóa AI với cơ chế tổ chức công ty thực tế, từ đó áp dụng kiến thức về multi-agent và tự động hóa quy trình để tạo ra giải pháp thông minh, hiệu quả hơn trong công việc.
Nhóm Cloudflare Images phát hiện lỗi điều kiện chạy (race condition) trong thư viện hyper HTTP (phiên bản 0.14–1.8) khi chuyển đổi sang sử dụng Unix sockets, khiến dữ liệu ảnh lớn bị cắt xén ngẫu nhiên do vòng lặp xử lý không chờ Poll::Pending từ poll_flush. Lỗi chỉ xuất hiện trong môi trường sản xuất với tải cao, không thể tái hiện bằng curl hay thử nghiệm cục bộ. Nhóm đã khắc phục bằng cách bổ sung 4 dòng lệnh vào poll_shutdown để đảm bảo dữ liệu được ghi hết trước khi đóng kết nối.
Lập trình viên cần đọc bài này để hiểu cách một lỗi race condition trong thư viện HTTP phổ biến (hyper) có thể gây ra vấn đề nghiêm trọng trong ứng dụng thực tế, đặc biệt khi kết hợp với các điều kiện concurrency và giao thức socket, và cách team phát hiện, debug và fix bằng cách quan sát syscall thực tế.
Hướng dẫn từng bước xây dựng một agent nghiên cứu web AI cục bộ bằng Ollama, mô hình Qwen3.5:4b và Python. Agent này nhận lệnh nghiên cứu, tìm kiếm 5 kết quả web hàng đầu qua API tìm kiếm web của Ollama, trích xuất văn bản bằng BeautifulSoup, sau đó tóm tắt bằng mô hình Qwen chạy cục bộ. Kết quả được lưu dưới dạng file Markdown có dấu thời gian, hoạt động hoàn toàn trên thiết bị mà không tốn phí API hay xâm phạm quyền riêng tư.
Lập trình viên muốn tự động hóa công việc nghiên cứu web một cách hiệu quả, tiết kiệm chi phí và bảo mật dữ liệu cá nhân nên đọc bài này để xây dựng một hệ thống AI cá nhân hoạt động trên thiết bị riêng của mình.
Vytautas Savickas, CEO của Oxylabs, cho rằng cạnh tranh tiếp theo của AI sẽ dựa vào cơ sở hạ tầng chứ không phải kích thước mô hình. Ông nhấn mạnh rằng hệ thống AI trong kỷ nguyên agent cần truy cập dữ liệu web thời gian thực, xử lý tự động hóa trình duyệt và kết nối thông tin cập nhật, thay vì chỉ tập trung vào mô hình lớn hơn.
Lập trình viên nên đọc bài này để hiểu cách xây dựng hệ thống AI mạnh mẽ không chỉ dựa trên kiến trúc mô hình lớn mà là vào khả năng kết nối với dữ liệu thực thời và cơ sở hạ tầng đáng tin cậy, giúp ứng dụng hoạt động hiệu quả hơn trong thế giới agentic.
Sắc lệnh hành pháp 14409 của Mỹ yêu cầu các cơ quan liên bang và nhà thầu phải chuyển sang mã hóa hậu lượng tử (PQC) vào năm 2030 và xác thực hậu lượng tử vào năm 2031, nhằm ngăn chặn các cuộc tấn công "thu thập giờ đây giải mã sau". Cloudflare khuyến nghị cần làm rõ tiêu chuẩn "chuyển đổi", ưu tiên khả năng thích ứng mật mã (crypto agility) và thúc đẩy sự thống nhất toàn cầu về thuật toán NIST để tránh phân mảnh.
Lập trình viên nên đọc bài này để hiểu cách chuyển đổi sang các giải pháp mã hóa chống lượng tử (post-quantum) không chỉ là một yêu cầu pháp lý mà là một chiến lược bảo mật cấp hệ thống, giúp bảo vệ ứng dụng của bạn trước các mối đe dọa tương lai từ máy tính lượng tử trong thời gian ngắn nhất.
Cloudflare is positioning itself as the economic infrastructure layer between publishers and AI companies. The company announced Pay Per Use (publishers get paid when content appears in AI answers, not just when crawled), new crawler classification rules requiring AI companies to separate indexing, training, and agent traffic, and an Answer Engine Optimization dashboard. Starting September 15, new and free-tier sites will block AI training and agent crawlers by default on ad-supported pages. Cloudflare argues its existing position between websites and the internet gives it a unique advantage to manage access, attribution, and payments in the emerging AI-driven web economy.
A step-by-step guide to hosting a PHP web project at zero cost using Wasmer (a WebAssembly-based cloud platform with sub-90ms cold starts), a free eu.org domain, and Cloudflare for DNS management. Covers creating a Wasmer account, deploying a PHP app from GitHub, setting up Cloudflare DNS with a CNAME record, and registering a free eu.org subdomain. The motivation is building a sustainable open-source project website that can outlive its creator without recurring costs.
A practical guide to monitoring Cloudflare Workers in production using console.log, the observability configuration in wrangler.jsonc, and live log streaming with wrangler tail. Covers enabling persistent searchable logs, live tailing for active debugging, sampling strategies for high-traffic workers, and the difference between logs (what happened) and traces (why it was slow).