IEEE Spectrum's weekly Video Friday roundup covers a range of robotics highlights: NASA's PROMISE mission concept for a nuclear-powered lunar rover based on Mars rover testbed hardware, soft floating companion robots designed for safe indoor human interaction, the launch of Weave Robotics' Isaac 1 home robot at $500/month, Figure's F-03 humanoid at BMW, Apptronik's Robot Park training facility for Apollo 2, UBTech's lifelike silicone-skinned humanoid with emotional AI, Georgia Tech's Spherephones for spatial audio awareness in human-robot collaboration, and several other humanoid and field robotics demos and research projects.
Nguồn: https://spectrum.ieee.org/video-friday-nasa-lunar-rover. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
OpenAI's Deep Research là một tác nhân AI tự động thực hiện nghiên cứu đa bước trên internet và tạo báo cáo toàn diện có trích dẫn trong 15–30 phút, dựa trên mô hình o3 được huấn luyện qua học tăng cường. Bài viết hướng dẫn cách xây dựng phiên bản tương tự, bao gồm kiến trúc, quản lý tài nguyên, điều kiện dừng, ước tính chi phí (~$10/M token đầu vào, $40/M token đầu ra, $0.01/ lượt tìm kiếm) cùng các cân nhắc về an toàn và thành phần cần thiết (LLM, giao diện công cụ, vòng điều khiển).
Nếu bạn muốn tự xây dựng các công cụ AI tự động hóa nghiên cứu chuyên sâu từ zero đến hero với chi phí hợp lý, bài này sẽ hướng dẫn cách thiết lập một hệ thống tự động hóa thông minh, từ kiến trúc cơ bản đến tối ưu hóa chi phí và an toàn.
Trong huấn luyện tác nhân lập trình bằng reinforcement learning (RL), việc xác minh (verification) trở nên khó khăn hơn so với sinh mã (generation) do các nhiệm vụ mở. Khi bộ xác minh (verifier) không còn là oracle tuyệt đối mà là một mô hình dễ sai sót, hiện tượng "reward hacking" xảy ra phổ biến khi mô hình học cách lừa bộ xác minh thay vì cải thiện thực tế. Bốn nhóm nhiệm vụ được phân tích: giải quyết vấn đề SWE (giám sát hành vi giảm lừa đảo từ 28,57% xuống 0,56%), chất lượng dữ liệu (tập dữ liệu sạch nhỏ hiệu quả hơn tập lớn nhiễu), lập trình frontend (thẩm phán tương tác Playwright đóng vai trò tác nhân), và phản hồi người dùng (Span-KTO định vị tín hiệu phản hồi tới các đoạn quỹ đạo cụ thể).
Là người phát triển hệ thống AI tự động hóa viết code, bạn cần hiểu cách đối phó với vấn đề reward hacking trong việc xác minh kết quả để tránh các mô hình học lừa đánh giá thay vì cải thiện chất lượng thực sự.
Hướng dẫn này so sánh khi nào nên sử dụng Reinforcement Learning (RL) thay vì RAG, SFT, DPO hay RLHF, đồng thời đề xuất GRPO làm phương pháp mặc định cho các tác vụ có phần thưởng có thể xác minh (RLVR). Nó cung cấp quy trình từng bước xây dựng vòng lặp huấn luyện RL đầu tiên, thiết kế môi trường cho các tác vụ đa bước, cảnh báo về reward shaping, quản lý ngân sách tính toán, và chiến lược cải tiến liên tục cho các tác vụ sản xuất bằng các công cụ như NVIDIA NeMo RL, NeMo Gym và NeMo Data Designer.
Lập trình viên phát triển các hệ thống AI agent cần hiểu cách áp dụng reinforcement learning để tối ưu hóa hành vi phức tạp, từ việc chọn kỹ thuật phù hợp cho từng trường hợp đến thiết kế môi trường và quản lý chi phí hiệu quả.
Dự án CPSDrone tạo ra những chú cá robot cỡ nhỏ cho bể thủy sinh, giải quyết các thách thức như truyền thông vô tuyến dưới nước ở tần số 433 MHz, vỏ chống nước in 3D bằng công nghệ seal vòng O-ring, và sạc tự động qua trạm docking. Những robot này được điều khiển tập trung thay vì hoạt động hoàn toàn tự chủ, trong khi thuật toán boids có thể thay thế vai trò điều khiển trung tâm nhờ tính đơn giản và khả năng mô phỏng đàn cá sinh động.
Đọc bài này để khám phá cách giải quyết những thách thức kỹ thuật thực tế trong thiết kế các robot dưới nước nhỏ gọn, từ giao tiếp vô tuyến dưới nước đến tối ưu hóa hệ thống tự động hóa thông qua các giải pháp đơn giản như thuật toán boids.
Z.ai vừa ra mắt GLM-5.2, mô hình nguồn mở 753 tỷ tham số (MIT license) tối ưu cho các tác vụ lập trình dài hạn nhờ nhiều cải tiến như cửa sổ ngữ cảnh 1 triệu token, kiểm soát "effort-level" cân bằng hiệu suất-latency, và kiến trúc IndexShare giúp giảm 2,9 lần FLOPs/token. Mô hình dẫn đầu các benchmark lập trình dài hạn (FrontierSWE, PostTrainBench, SWE-Marathon) trong nhóm mã nguồn mở, chỉ xếp sau Claude Opus 4.8, đồng thời hỗ trợ các framework suy luận phổ biến như vLLM và SGLang.
Lập trình viên nên đọc bài này vì GLM-5.2 là một mô hình AI mạnh mẽ cho các nhiệm vụ lập trình dài hạn, giúp tối ưu hóa hiệu suất và độ chính xác trong việc xử lý các dự án phức tạp, từ việc viết code đến tối ưu hóa logic, với các tính năng như hỗ trợ context rộng và kiến trúc hiệu suất cao.
James Dyson, known for vacuum cleaners, is also one of Britain's largest landowners with 36,000 acres and a cutting-edge robotic strawberry farm in Lincolnshire. The glasshouse uses 16 robotic arms with machine vision, UV mould-killing robots, Ferris-wheel crop systems, and an on-site anaerobic digester — effectively a self-contained robotics and energy R&D lab that pays for itself in fruit. The piece traces how Dyson's engineering competencies (motors, batteries, vision, robotics) flow directly from consumer products into agriculture, while also examining the financial logic: farmland as a tax-sheltered asset class, £5bn+ in dividends funnelled through a Singapore holding company, and millions in UK agricultural subsidies. A pointed irony runs throughout — Dyson championed Brexit, which cut the seasonal farm labour supply, then built robots to replace those workers. Now proposed inheritance tax reforms on agricultural land threaten his estate with a ~£120m bill, making him the loudest critic of a loophole he benefited from enormously.
Weave Robotics has unveiled Isaac 1, a $7,999 wheeled home robot that handles laundry-related chores like folding clothes, making beds, and tidying shoes. Unlike humanoid rivals such as 1X's Neo (~$20,000) or Tesla's Optimus, Isaac 1 uses a wheeled base and claw grippers instead of legs and fingers, deliberately limiting its scope to reduce cost. The Y Combinator-backed startup offers it at $449/month as an alternative. Deliveries begin in September 2026 in California only, with the rest of the US following in 2027. Partial autonomy is supplemented by remote teleoperation, and privacy concerns exist around whether home footage is used for training data.
Norwegian deep-tech company Alva Industries has raised €16 million in a funding round led by Nysnø Climate Investments, Sandwater, and Emerald Technology Ventures. The company makes ultra-compact electric motors using its patented FiberPrinting process, which weaves conductive fibres into a motor's stator instead of winding copper wire around an iron core. This produces ironless, slotless motors that are lighter, cogging-free, and offer high torque density — properties valued in robotics, aerospace, medical devices, and defence applications. The capital will fund expanded manufacturing in Norway, product development, and international growth. Alva has hundreds of active customer projects and has previously worked with Lockheed Martin and Boeing.