Vision AI agents are increasingly used to extract operational intelligence from video data in factories, cities, and warehouses. Three common blockers — data gaps causing accuracy plateaus, lack of fine-tuning expertise, and complex agent assembly — can be addressed using NVIDIA Metropolis blueprints, NVIDIA Omniverse for OpenUSD-based synthetic data generation, and NVIDIA TAO for model fine-tuning. Three real-world workflows illustrate the approach: Roboflow and Corning used synthetic defect images to achieve 95% average precision from just eight real training samples; Linker Vision cut smart city development effort by 85% and incident response times by 80% using the VSS blueprint; and DeepHow's SOP Verification agent at Foxconn improved first-pass yield by 3% and achieved 99% task-level accuracy on assembly line operations.
Nguồn: https://blogs.nvidia.com/blog/vision-ai-agent-skills-omniverse-metropolis. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.

Netflix giới thiệu hai mô hình chỉnh sửa video AI giai đoạn đầu là Vera và VOID. Vera sử dụng mô hình diffusion phân lớp, chỉ tái tạo vùng chỉnh sửa (kèm alpha matte) thay vì toàn bộ clip, bảo toàn nội dung chưa chỉnh sửa. VOID chuyên xóa vật thể trong video với kỹ thuật inpainting hợp lý vật lý, tái tạo cảnh thực tế khi vật thể bị loại bỏ. Cả hai mô hình đều vượt trội so với các phương pháp hiện có trong nghiên cứu.
Lập trình viên muốn phát triển các giải pháp AI tiên tiến trong xử lý video nên tham khảo để hiểu cách thiết kế mô hình hiệu quả như Vera và VOID, từ kiến trúc đặc biệt đến kỹ thuật điều khiển chi tiết để nâng cao chất lượng và tính khả thi của các ứng dụng AI video trong tương lai.

AI is transforming video surveillance by enabling natural language queries over massive video streams. Unlike older tools limited to preset searches, new AI systems let intelligence officers search for complex behavioral patterns — such as a person changing clothes multiple times or a vehicle repeatedly passing the same spot. This shift from object-based to behavior-based surveillance represents a qualitative leap in mass monitoring capabilities, with real-world deployments reported in Israel, Iran, and Russia.
Một modder tên Ray Foss phát triển công cụ Auto-Charge Tracker dựa trên trình duyệt, sử dụng camera tracking và động cơ rung để tự động điều hướng Steam Controller quay trở lại dock sạc. Dự án được chia sẻ trên GitHub.
Lập trình viên nên đọc bài này để khám phá cách kết hợp camera tracking và haptic feedback—các kỹ thuật cơ bản trong AI và IoT—để tạo ra giải pháp tự động hóa thú vị cho thiết bị ngoại vi, mở rộng kiến thức về cách ứng dụng công nghệ sensor và haptic trong thiết kế phần mềm thực tế.
Tesla has quietly settled a lawsuit stemming from a 2023 fatal crash involving its Full Self-Driving (Supervised) system in Arizona, where a 71-year-old pedestrian was struck and killed by a Model Y. The settlement terms were not disclosed. However, the NHTSA federal investigation — escalated to an engineering analysis in March 2026 — remains open and could result in a software recall. The agency found Tesla's system fails to detect and warn drivers under degraded visibility conditions like sun glare and airborne dust. Compounding Tesla's troubles, a separate fatal crash in Texas involving Autopilot has triggered additional NHTSA and NTSB investigations, and another inquiry is examining FSD running red lights and drifting into wrong lanes. Tesla's camera-only approach faces mounting regulatory and legal scrutiny as the company positions FSD as central to its AI and robotics identity.
Researchers at ETH Zurich have created the first bidirectional pixel — a single chip element that can both emit and detect light, including phase and polarization. Using interference and Fourier analysis, the pixel can display images and analyze incoming light simultaneously. Potential applications include camera-displays with no notch, holographic displays, optical communication, and optical computing where calculations happen in light rather than silicon. Current limitations include requiring laser light and being fixed in what each pixel can display, with scaling to full pixel matrices as the next challenge.
Người đam mê nhà thông minh tự lưu trữ đã tích hợp một LLM cục bộ (Qwen3.6-35B-A3B qua llama-server) với Frigate NVR và Home Assistant để tạo ra các bản tóm tắt sự kiện camera thông minh có ý nghĩa nhờ AI. Hệ thống sử dụng tích hợp Frigate HACS, tích hợp LLM Vision với adapter MMPROJ, cùng blueprint AI Event Summary để tự động gửi thông báo chi tiết khi camera phát hiện hoạt động, hoàn toàn không phụ thuộc vào dịch vụ đám mây.
Lập trình viên muốn tự chủ hóa hệ thống an ninh thông minh và tối ưu hóa hiệu suất AI trên thiết bị cá nhân sẽ tìm hiểu cách kết hợp LLM với Frigate và Home Assistant để tự động hóa cảnh báo thông minh từ camera mà không cần phụ thuộc vào dịch vụ cloud.
Berlin startup Almetra (formerly Deltia) has raised €16.3M in Series A funding to expand its AI-powered factory floor analytics platform. The company mounts cameras above assembly lines at manufacturers like Bosch, Siemens Energy, and ABB, converting video footage into live production data — cycle times, output rates, equipment utilisation — without requiring IT system integration. Customers report productivity gains of 15–19%. The round was led by blisce/, with participation from Merantix Capital and others. Almetra has been accepted into Google DeepMind's Robotics Accelerator and an AWS/Nvidia/MassRobotics Physical AI Fellowship, positioning it as a potential data source for industrial robotics. The company plans to use the funding to expand into the US and build out robotics applications.
Flock Safety vận hành hơn 100.000 camera nhận diện biển số tự động trên khắp nước Mỹ, sử dụng Android biến thể và AI để tìm kiếm bằng ngôn ngữ tự nhiên. Hệ thống chia sẻ dữ liệu toàn quốc cho phép cảnh sát truy cập dữ liệu từ các bang khác, trong khi lỗ hổng bảo mật nghiêm trọng (như 70 camera không mật khẩu) và lạm dụng theo dõi cá nhân đã bị phát hiện. Dù thiếu bằng chứng giảm tội phạm, mạng lưới vẫn mở rộng bất chấp phản đối.
Những lỗ hổng bảo mật và sử dụng sai mục đích của hệ thống giám sát plate reader Flock Safety cho thấy cần cảnh giác về sự phát triển nhanh chóng của công nghệ giám sát đại trà và cách bảo vệ quyền riêng tư cũng như an ninh dữ liệu trong thời đại số.