
A step-by-step guide for creating a custom ServiceNow CMDB Discovery Pattern for Red Hat OpenShift Virtualization (KubeVirt) VMs. The approach avoids the clutter of standard Kubernetes discovery by defining a custom CI class (u_cmdb_ci_openshift_virtual_machines) that extends cmdb_ci_vm_instance, setting an independent identification rule based on cluster/namespace/VM name tuple, and implementing a Cloud Resource Discovery Pattern that performs HTTP GETs against the virtualmachines and virtualmachineinstances endpoints with a LEFT join to preserve stopped VMs. The result is a clean one-to-one CMDB mapping per VM, with lifecycle states (Running, Stopped, Absent) tracked automatically and no extraneous Kubernetes CI rows generated.
Nguồn: https://developers.redhat.com/articles/2026/06/30/openshift-virtualization-servicenow-custom-discovery-pattern. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
Bài viết chia sẻ kinh nghiệm từ 31 lần thử nghiệm quản lý GitOps quy mô lớn trên hơn 15.000 cluster bằng Argo CD, vCluster, Sveltos và kubara, chỉ ra rằng bộ nhớ của Argo CD tăng phi tuyến khi số lượng object vượt 15.000–20.000 do cơ chế cache theo cluster, trong khi Sveltos chỉ tiêu tốn ~2GB RAM (so với 21GB của Argo CD) và triển khai nhanh hơn đáng kể. Kết luận: ở quy mô siêu lớn (1.000+ cluster, 5.000+ ứng dụng), kiến trúc phân tán (như Sveltos) hiệu quả hơn so với việc tối ưu hóa đơn thuần Argo CD.
Lập trình viên muốn triển khai và quản lý hệ thống Kubernetes quy mô lớn nên đọc bài này để hiểu cách tối ưu hóa GitOps bằng kiến thức về các giải pháp phân tán và cách tránh rủi ro về bộ nhớ khi áp dụng Argo CD trên hàng ngàn cluster.
Một nhà phát triển xây dựng công cụ quét lỗ hổng container với giao diện web dựa trên ConfigHub bằng cách tái sử dụng phần lớn cấu trúc từ ứng dụng RBAC Manager trước đó, chỉ thay đổi logic chuyên biệt: trình quét Go tùy chỉnh phân tích lớp image, đọc cơ sở dữ liệu gói OS và so khớp với cơ sở dữ liệu CVE thống nhất (GitHub Advisory, CVE List V5, OSV.dev). Kết quả quét được ghi vào annotations của Kubernetes Deployment, còn chính sách ngăn chặn (Trigger) hoạt động mà không cần admission webhook. Giao diện React tái sử dụng ~80% codebase RBAC Manager, chỉ thay đổi model, truy vấn snapshot và thành phần trang. Bài viết giới thiệu mẫu 5 bước xây dựng công cụ nội bộ trên ConfigHub: định nghĩa đối tượng, tải snapshot, hiển thị view, tương tác API và quản lý chính sách.
Lập trình viên nên đọc bài này để tìm cách tiết kiệm thời gian và công sức xây dựng công cụ chuyên dụng từ khung cơ sở đã tồn tại, giảm thiểu sự phức tạp bằng cách tái sử dụng logic chung và tập trung vào logic riêng biệt.
Grafana Cloud's Kubernetes Monitoring có hai hệ thống cảnh báo riêng biệt: cảnh báo quản lý bởi data source (Mimir/Prometheus) và cảnh báo quản lý bởi Grafana. Việc cài đặt lại app sẽ tự động chuyển quy tắc cảnh báo sang hệ thống Grafana, có thể làm gián đoạn các tuyến thông báo đã cấu hình trong Alertmanager. Bài viết hướng dẫn cách nhận diện hệ thống cảnh báo đang sử dụng, nguyên nhân ngừng hoạt động sau khi cài đặt lại, và các phương pháp tốt nhất như sử dụng nút Update thay vì cài đặt lại, sao lưu quy tắc tùy chỉnh trước khi nâng cấp, và lưu ý rằng cảnh báo quản lý bởi data source (Prometheus/Loki) sẽ ngừng hoạt động từ tháng 4/2026.
Lập trình viên cần đọc bài này để tránh mất hiệu suất cảnh báo trong Kubernetes khi tái cài đặt Grafana Cloud, vì nó có thể phá hủy cấu hình thông báo hiện có và cảnh báo cũ sẽ chuyển sang hệ thống quản lý mới, gây mất liên lạc với các hệ thống cảnh báo bên ngoài.

Khi xây dựng hệ thống chỉ quan tâm giá trị mới nhất, cơ chế chặn mặc định của Go channels trở thành hạn chế. Bài viết giới thiệu hai cách giải quyết: gửi không chặn bằng select/default (bỏ qua giá trị khi buffer đầy, an toàn cho nhiều producers) và xả buffer trước khi gửi (đảm bảo consumer nhận dữ liệu mới nhất, nhưng yêu cầu single producer). Các ví dụ kèm biểu đồ ASCII minh họa ưu nhược điểm của từng phương pháp.
Một lập trình viên nên đọc bài này để hiểu cách xử lý hiệu quả các kênh Go khi chỉ cần lưu giữ thông tin mới nhất, tránh rủi ro về dữ liệu cũ bị giữ lại trong buffer và chọn lựa giải pháp phù hợp với từng trường hợp sử dụng cụ thể.
Bài viết hướng dẫn xây dựng một runtime AI agent sản xuất có khả năng chịu lỗi, phục hồi sau sự cố nhờ Temporal, tự động scale dựa trên độ sâu queue bằng KEDA, triển khai trên Kubernetes, và tích hợp công cụ qua Composio. Kiến trúc bao gồm workflow Temporal, FastAPI gateway, container hóa bằng Docker multi-stage, triển khai trên k3d, cùng cấu hình KEDA ScaledObjects để scale-to-zero khi không có tác vụ.
Lập trình viên muốn triển khai một hệ thống AI sản xuất có độ bền cao và tự động hóa quy mô theo nhu cầu thực tế sẽ tìm hiểu cách kết hợp Temporal, KEDA và Kubernetes để giải quyết vấn đề xử lý nhiệm vụ dài hạn, tự động hóa quy mô và đảm bảo sự ổn định trong môi trường cloud-native.
Bài viết giới thiệu các loại workload AI trên Kubernetes như huấn luyện (training) và suy luận (inference), giải thích lý do Kubernetes phù hợp cho huấn luyện AI nhờ quản lý tài nguyên hiệu quả, đồng thời đề cập tầm quan trọng của ngữ cảnh trong tùy chỉnh mô hình AI và các kỹ thuật fine-tuning, prompt engineering.
Lập trình viên AI nên đọc bài này để hiểu cách Kubernetes tối ưu hóa quản lý tài nguyên cho các công việc huấn luyện và dự đoán mô hình, giúp tiết kiệm chi phí và tăng hiệu suất trong môi trường cloud.

GPU-as-a-Service (GPUaaS) addresses the common problem of expensive, underutilized GPUs in organizations by enabling self-service reservation of GPU slices. The approach uses Red Hat OpenShift with Kueue (a Kubernetes queueing and quota system) and NVIDIA Multi-Instance GPU (MIG) technology. MIG allows a single physical GPU to be partitioned into isolated slices of varying sizes, while Kueue manages resource pools, fair sharing, and quota enforcement via ClusterQueues. A custom OpenShift web console plug-in lets developers book GPU time slots through a calendar UI without writing YAML, generating native Kueue resources under the hood. Once a reservation is made, developers can deploy models from the OpenShift AI model catalog using preconfigured hardware profiles that tie deployments to their reserved MIG slice. This enables long-running inference workloads and batch jobs like fine-tuning to share GPU resources elastically under defined access policies.
AWS bổ sung tính năng "Customer-routed control plane egress" cho EKS, cho phép lưu lượng điều khiển Kubernetes ra ngoài hoàn toàn qua VPC riêng của khách hàng thay vì internet công cộng. Tính năng này yêu cầu kích hoạt bằng lệnh update-cluster-config (không thể hoàn tác) và đòi hỏi khách hàng tự quản lý routes, security groups cùng endpoints. Kết hợp với Cluster Private Endpoint, EKS giờ hỗ trợ mạng hoàn toàn riêng tư, tương đương khả năng của Azure và GCP.
Lập trình viên cần hiểu cách AWS nâng cấp tính riêng tư của Kubernetes bằng công nghệ mới này để tối ưu hóa an ninh, giảm chi phí và quản lý lưu lượng mạng hiệu quả hơn trong các ứng dụng cloud.