The Agent Toolkit for AWS ships three layers: an MCP server with 300+ AWS APIs, 20+ domain-specific skills, and a rules file. Without the rules file, agents have passive access to skills but won't proactively load them before answering. A 17-line rules file in the repo's rules/ directory instructs the agent to check for relevant skills before starting any AWS task, use retrieve_skill to load them, and verify against documentation rather than guessing. Adding the file changed agent behavior from generic architecture advice to specific, justified recommendations — including which API Gateway variant to use and why, exact constraints like the 30s timeout and 10 MB payload limit, and best-practice patterns like one function per route.
Nguồn: https://thenewstack.io/aws-agent-toolkit-rules-file. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
Weaviate 1.38 ra mắt với các tính năng mới như HFresh (chỉ số vector dựa trên đĩa, tối ưu bộ nhớ cho streaming) và MCP Server tích hợp cho phép LLMs tương tác trực tiếp. Bản cập nhật cũng bổ sung async replication mặc định, Boost API (tái xếp hạng truy vấn), nested object filtering, cùng nhiều cải tiến khác như quản lý replica, cấu hình chỉ số vector, và module text2vec-digitalocean.
Lập trình viên phát triển ứng dụng AI hoặc hệ thống vector search cần đọc để cập nhật về MCP Server và Boost API, giúp tối ưu hóa giao tiếp trực tiếp giữa LLM với cơ sở dữ liệu vector và cải thiện hiệu suất tìm kiếm bằng cách xếp hạng kết quả một cách linh hoạt mà không mất bất kỳ dữ liệu nào.
Hướng dẫn từng bước xây dựng một MCP server dựa trên HTTP bằng ASP.NET, sử dụng gói NuGet ModelContextProtocol.AspNetCore. Bài viết bao gồm thiết lập dự án, đăng ký server trong Program.cs, tạo lớp công cụ với các thuộc tính McpServerToolType và McpServerTool, viết chú thích tham số mô tả để AI client khám phá và gọi công cụ, đồng thời kết nối server với các client AI như GitHub Copilot hoặc VS Code thông qua tệp .mcp.json. Ví dụ minh họa là tìm kiếm danh mục sản phẩm, thể hiện cách câu hỏi ngôn ngữ tự nhiên được chuyển thành lời gọi công cụ và trả về câu trả lời dễ đọc.
Lập trình viên cần đọc bài này để hiểu cách triển khai một gói công cụ AI tích hợp sẵn trên ASP.NET, giúp tự động hóa các tác vụ cụ thể mà không cần viết mã thủ công, từ đó tiết kiệm thời gian và nâng cao hiệu suất trong phát triển ứng dụng.
JetBrains vừa bổ sung kỹ năng dottrace-analyze cho AI Assistant trong Rider 2026.2 EAP 8, giúp AI agent phân tích trực tiếp các snapshot .dtp từ dotTrace thay vì đoán mò bottleneck dựa trên source code. Kết quả benchmark trên 80 lượt chạy và 8 kịch bản .NET cho thấy độ chính xác tăng vọt từ 4.71 lên 8.15/10, đặc biệt cải thiện mạnh mẽ trong trường hợp UI freeze của Avalonia (từ 1.6/10 lên 10/10). Tính năng này yêu cầu subscription dotUltimate hoặc All Products Pack.
Lập trình viên nên đọc bài này vì JetBrains Rider 2026.2 EAP mới giới thiệu công cụ phân tích hiệu suất chính xác hơn bằng cách kết hợp dữ liệu thực tế từ dotTrace thay vì chỉ dựa vào các dấu hiệu giả định từ mã nguồn, giúp tiết kiệm thời gian và cải thiện hiệu suất ứng dụng một cách đáng kể.
Heron là công cụ phân tích mạng thụ động dành cho AI agents, sử dụng eBPF để giải mã lưu lượng TLS (LLM) thành plaintext mà không cần SDK hay proxy. Phiên bản 0.7.0 bổ sung kiến trúc OpenTelemetry-native, lọc tự động sidecar an ninh Claude Code, và xuất sẵn SFT trajectory cho fine-tuning, chạy dưới dạng binary Rust duy nhất.
Lập trình viên phát triển ứng dụng AI nên đọc để khám phá cách Heron giúp theo dõi và debug giao thức TLS bí mật của các agent AI một cách hiệu quả, từ đó tối ưu hóa hiệu suất và bảo mật mà không cần phụ thuộc vào SDK hoặc proxy phức tạp.
AWS giới thiệu Lambda MicroVMs, một giải pháp compute mới kết hợp tính cô lập cấp VM (qua Firecracker), khởi động nhanh từ snapshot đã khởi tạo sẵn, và phiên session kéo dài tới 8 giờ. Khác biệt so với Lambda tiêu chuẩn, MicroVMs cung cấp endpoint HTTPS bền vững, hỗ trợ HTTP/2, gRPC, WebSockets, cũng như truy cập shell và Docker bên trong VM, nhằm mục đích chạy code do AI hoặc người dùng cung cấp trong môi trường sandbox. Tuy nhiên, giải pháp này chỉ hỗ trợ ARM64, có sẵn ở 5 vùng (region) và có mức giá tương tự Fargate. Bài viết cũng so sánh Lambda MicroVMs với AgentCore Runtime: AgentCore là nền tảng agent quản lý có sẵn giao thức tích hợp, trong khi Lambda MicroVMs là giải pháp nguyên thủy cấp thấp mang lại toàn quyền kiểm soát VM.
Là người phát triển cần tìm giải pháp an toàn cho các ứng dụng yêu cầu môi trường VM hoàn toàn riêng biệt, như chạy mã AI hoặc code từ người dùng trong môi trường sandbox, thì Lambda MicroVMs từ AWS sẽ cung cấp giải pháp hiệu quả hơn so với các phương pháp truyền thống.
Các nhà nghiên cứu từ MIT và Microsoft đã phát triển Murakkab, một hệ thống tự động tối ưu hóa quy trình làm việc của AI agent bằng cách tự động lựa chọn mô hình, công cụ và cấu hình phần cứng dựa trên mô tả ngôn ngữ tự nhiên từ nhà phát triển, đồng thời điều chỉnh linh hoạt theo ưu tiên như chi phí hay tốc độ. Trong thử nghiệm, Murakkab tiết kiệm tới ~65% tài nguyên tính toán, ~73% năng lượng và trên 75% chi phí so với phương pháp truyền thống mà vẫn duy trì hiệu suất ổn định.
Lập trình viên nên đọc bài này vì Murakkab không chỉ tiết kiệm chi phí và năng lượng cho AI mà còn giúp họ thiết kế các hệ thống thông minh hiệu quả hơn bằng cách tự động tối ưu hóa các quyết định kỹ thuật từ đầu, cho phép họ tập trung vào logic kinh doanh thay vì chi tiết kỹ thuật phức tạp.
Google tích hợp khả năng xem và điều khiển màn hình (screen-seeing & control) trực tiếp vào Gemini 3.5 Flash, thay thế mô hình tách biệt trước đây, nhằm phục vụ tự động hóa doanh nghiệp như kiểm thử phần mềm liên tục hay tác vụ trình duyệt đa bước. Tính năng này đi kèm các biện pháp an toàn tùy chọn như xác nhận người dùng trước hành động nhạy cảm hay dừng tự động khi phát hiện prompt injection, nhưng Google thừa nhận không có giải pháp bảo mật nào là hoàn hảo. Động thái này cạnh tranh trực tiếp với các sản phẩm tương tự của Anthropic (Claude Computer Use) và OpenAI, trong đó câu chuyện an toàn cho doanh nghiệp là điểm khác biệt chính.
Lập trình viên nên đọc để hiểu cách Gemini 3.5 Flash mở rộng khả năng tự động hóa công việc phát triển, từ kiểm thử liên tục đến điều khiển giao diện người dùng, giúp tiết kiệm thời gian và tăng hiệu suất trong các dự án doanh nghiệp.
Databricks nhấn mạnh tầm quan trọng của hệ sinh thái mở (Frontier Ecosystem) trong việc xây dựng hệ điều hành cho các tác nhân AI doanh nghiệp. Họ giới thiệu Omnigent, một meta-harness mã nguồn mở giúp chuẩn hóa API cho các coding agent như Claude Code, Codex và Cursor, hỗ trợ phiên làm việc liên tục, cộng tác và kiểm soát bảo mật. Ngoài ra, Databricks đề cập đến LTAP (Lake Transactional/Analytical Processing) nhằm hợp nhất workload giao dịch và phân tích, cũng như thảo luận về chiến lược mô hình Mosaic và vai trò của dữ liệu được tổ chức tốt trong việc tái định nghĩa phần mềm truyền thống.
Những lập trình viên xây dựng hệ thống AI hoặc ứng dụng doanh nghiệp nên đọc để hiểu cách kết hợp kiến trúc mở, quản lý dữ liệu hiệu quả và bảo mật thông minh để xây dựng các agent AI tự động hóa công việc một cách bền vững và tuân thủ.