AlloyDB now offers new AI functions and major performance improvements for running LLM calls directly within SQL queries. Three new functions are introduced: ai.summarize, ai.agg_summarize, and ai.analyze_sentiment, joining the existing GA functions (ai.generate, ai.rank, ai.if, ai.forecast). Two key performance breakthroughs are highlighted: Smart Batching, which intelligently groups AI function calls to reduce prompt overhead and achieve up to 2,400x throughput improvement; and Optimized AI Functions, which train a lightweight proxy model on your data to process decisions locally, achieving up to 100,000 rows/sec (23,000x improvement) and 6,000x cost reduction. Both features are currently in preview for ai.if and ai.rank.
Nguồn: https://cloud.google.com/blog/products/databases/boost-performance-and-lower-costs-with-alloydb-ai-functions. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
Meta vừa công bố phiên bản 2 của hệ thống Brain2Qwerty, sử dụng máy quét MEG không xâm lấn để giải mã các câu văn bản từ hoạt động não bộ. Hệ thống đạt độ chính xác 61% cho từng từ (tối đa 78% ở người tham gia tốt nhất), vượt trội so với các hệ thống không xâm lấn trước đây chỉ đạt vài phần trăm. Mặc dù sử dụng pipeline LLM tương tự ChatGPT để tái tạo câu từ tín hiệu não nhiễu, hệ thống vẫn còn hạn chế lớn như thiết bị cồng kềnh, không hoạt động theo thời gian thực và yêu cầu người dùng phải gõ bàn phím để huấn luyện. Các phương pháp xâm lấn vẫn dẫn đầu về độ chính xác với 92% cho toàn bộ câu.
Lập trình viên nên đọc bài này để hiểu cách kết hợp mô hình ngôn ngữ lớn (LLM) và giải mã não bộ để tạo ra hệ thống mới trong lĩnh vực AI não-giao tiếp, giúp mở rộng ứng dụng của trí tuệ nhân tạo trong y tế và tương tác người-máy.

Bài viết đưa ra các khuyến nghị sử dụng công cụ AI sinh lời dựa trên LLM (Large Language Model) có trách nhiệm trong đóng góp phần mềm tự do nguồn mở (FOSS), nhằm giảm thiểu tác hại và khám phá cách những công cụ này có thể thúc đẩy mục tiêu FOSS.
Lập trình viên nên đọc bài này để khám phá cách sử dụng công nghệ AI sinh tạo có dựa trên mô hình ngôn ngữ để hợp tác hiệu quả với cộng đồng mã nguồn mở mà vẫn bảo vệ nguyên tắc tự do và trách nhiệm.
Hướng dẫn này so sánh khi nào nên sử dụng Reinforcement Learning (RL) thay vì RAG, SFT, DPO hay RLHF, đồng thời đề xuất GRPO làm phương pháp mặc định cho các tác vụ có phần thưởng có thể xác minh (RLVR). Nó cung cấp quy trình từng bước xây dựng vòng lặp huấn luyện RL đầu tiên, thiết kế môi trường cho các tác vụ đa bước, cảnh báo về reward shaping, quản lý ngân sách tính toán, và chiến lược cải tiến liên tục cho các tác vụ sản xuất bằng các công cụ như NVIDIA NeMo RL, NeMo Gym và NeMo Data Designer.
Lập trình viên phát triển các hệ thống AI agent cần hiểu cách áp dụng reinforcement learning để tối ưu hóa hành vi phức tạp, từ việc chọn kỹ thuật phù hợp cho từng trường hợp đến thiết kế môi trường và quản lý chi phí hiệu quả.
Google Cloud vừa ra mắt tiện ích mở rộng Workbench Notebooks cho VS Code, giúp nhà khoa học dữ liệu và lập trình viên quản lý Jupyter notebooks trên cloud trực tiếp từ IDE cục bộ. Tiện ích này kết nối VS Code với cơ sở hạ tầng tối ưu AI của Google Cloud, giảm thiểu sự chuyển đổi ngữ cảnh giữa thử nghiệm cục bộ và điện toán đám mây.
Lập trình viên AI/ML sẽ tiết kiệm thời gian và hiệu suất khi sử dụng công cụ này để chạy và quản lý notebooks trên Google Cloud từ VS Code, tránh mất thời gian chuyển đổi giữa môi trường cài đặt địa phương và cloud.
Anthropic vừa ra mắt Claude Sonnet 5, phiên bản tầm trung với khả năng điều phối tác vụ tự động, sử dụng công cụ và hoàn thành nhiệm vụ đa bước được cải thiện đáng kể. Mức giá 2$/10 triệu token (vào/ra) cho đến 31/8, sau đó tăng lên 3$/10 triệu, rẻ hơn so với Opus 4.8, GPT-5.5 và Gemini 3.1 Pro nhưng hiệu suất gần tương đương Opus 4.8 trên hầu hết tiêu chuẩn đánh giá.
Lập trình viên nên đọc bài này để hiểu cách các mô hình AI mới như Claude Sonnet 5 có thể tự động hóa và tối ưu hóa công việc lập trình, từ việc lập kế hoạch tự động cho đến xử lý các nhiệm vụ đa bước với chi phí thấp hơn nhiều so với các mô hình cao cấp khác.
Hầu hết các MCP server hiện nay đều là giao diện sản phẩm chưa cần thiết, khi API nên tập trung vào mục đích người dùng thay vì cấu trúc database. Thay vì xây dựng MCP server, các team nên ưu tiên phát triển skill (hướng dẫn cho agent) hoặc chỉ triển khai MCP khi có nhu cầu từ nhiều client AI không kiểm soát. Bài viết cũng cảnh báo về chi phí ẩn như tiêu thụ token, rủi ro bảo mật, và sự phân mảnh giữa các công cụ.
Lập trình viên nên đọc bài này để tránh xây dựng các server MCP không cần thiết mà thay vào đó tìm cách tối ưu hóa quy trình bằng cách tập trung vào thiết kế API theo ý định người dùng và sử dụng các công cụ tự động hóa (như agent) để tiết kiệm chi phí và tránh rủi ro về bảo mật và hiệu suất.
Nghiên cứu định tính từ nhóm Rust về cách các nhà phát triển học ngôn ngữ Rust thông qua …

Amazon SageMaker AI vừa bổ sung hỗ trợ tùy chỉnh serverless cho các model Gemma 4 E4B và 31B của Google DeepMind, cho phép fine-tuning có giám sát (SFT), tối ưu hóa ưu tiên trực tiếp (DPO) và fine-tuning tăng cường (RFT) mà không cần quản lý hạ tầng. Người dùng chỉ trả tiền theo lượt sử dụng và có thể triển khai qua SageMaker Studio hoặc SDK Python.
Lập trình viên AI nên đọc để khám phá cách tối ưu hóa chi phí và tăng hiệu quả khi huấn luyện các mô hình lớn như Gemma 4 trên AWS với các phương pháp fine-tuning tiên tiến mà không phải lo về quản lý hạ tầng.