Pick n Pay has launched an AI shopping assistant called Penny inside its asap! app, built on Google's Gemini models. Penny allows customers to build grocery baskets via voice, text, or photo — including snapping a handwritten shopping list or requesting a recipe and getting ingredient options. It handles re-orders, meal planning, and substitutions, but does not yet place orders autonomously. Retail executive Enrico Ferigolli explains why Gemini was chosen over other LLMs, how Penny integrates with the app's own search and order history rather than directly querying databases, and the roadmap for multilingual support including South African languages.
Nguồn: https://techcentral.co.za/tcs-pick-n-pay-enrico-ferigolli-penny-ai-shops-for-you/283341. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
Kỹ sư mabl chia sẻ ba năm kinh nghiệm xây dựng AI agents cho kiểm thử phần mềm sản xuất, từ những thất bại ban đầu với PaLM 2023 đến việc tận dụng sức mạnh LLM như LLM-as-judge, RAG với Gemini 2, và quản lý trạng thái đa nền tảng. Họ rút ra bài học: giao diện UI đơn giản vẫn khó điều hướng, nhóm ngữ nghĩa hiệu quả hơn so khớp từ, dữ liệu kiểm thử tĩnh không phù hợp cho AI xác suất, và CoT cứng nhắc phản tác dụng khi nâng cấp lên Gemini 2.5.
Bạn nên đọc bài này để hiểu cách chuyển đổi từ những thất bại ban đầu trong ứng dụng AI như PaLM sang xây dựng các hệ thống agent hiệu quả trong thực tế, từ đó tránh những sai lầm về cách tiếp cận và tối ưu hóa kiến trúc cho các ứng dụng AI trong sản xuất.
Phòng thí nghiệm AI mới Thinking Machines đề xuất mô hình "interaction model" thay thế kiến trúc turn-based truyền thống bằng cách tích hợp tương tác trực tiếp vào mô hình, sử dụng các micro-turns (200ms) và phối hợp hai mô hình (tương tác nhanh + suy luận nền). Mô hình 276B tham số (12B tham số hoạt động) của họ thể hiện khả năng dịch thuật live, đếm nhịp real-time và sửa lỗi codeswitching giữa câu, nhưng vẫn gặp hạn chế về quản lý ngữ cảnh dài, yêu cầu kết nối và độ trễ.
Lập trình viên AI nên đọc bài này để hiểu cách thiết kế lại mô hình tương tác thực tế bằng cách loại bỏ giới hạn của hệ thống dựa trên vòng lặp ngôn ngữ truyền thống, giúp tối ưu hóa hiệu suất và khả năng tương tác đa phương tiện trong ứng dụng AI hiện đại.
Google tích hợp khả năng xem và điều khiển màn hình (screen-seeing & control) trực tiếp vào Gemini 3.5 Flash, thay thế mô hình tách biệt trước đây, nhằm phục vụ tự động hóa doanh nghiệp như kiểm thử phần mềm liên tục hay tác vụ trình duyệt đa bước. Tính năng này đi kèm các biện pháp an toàn tùy chọn như xác nhận người dùng trước hành động nhạy cảm hay dừng tự động khi phát hiện prompt injection, nhưng Google thừa nhận không có giải pháp bảo mật nào là hoàn hảo. Động thái này cạnh tranh trực tiếp với các sản phẩm tương tự của Anthropic (Claude Computer Use) và OpenAI, trong đó câu chuyện an toàn cho doanh nghiệp là điểm khác biệt chính.
Lập trình viên nên đọc để hiểu cách Gemini 3.5 Flash mở rộng khả năng tự động hóa công việc phát triển, từ kiểm thử liên tục đến điều khiển giao diện người dùng, giúp tiết kiệm thời gian và tăng hiệu suất trong các dự án doanh nghiệp.
Flipkart mở rộng dịch vụ giao hàng siêu tốc Minutes lên 1.000 trung tâm micro-fulfillment chỉ sau hai năm, dự kiến đạt 1.500 vào cuối 2026, với doanh số tăng 400% mỗi năm, mở rộng từ thực phẩm sang điện tử, mỹ phẩm. Amazon cũng đẩy mạnh Amazon Now tại 15+ thành phố với 500 trung tâm, nhắm tới 100 thành phố. Cả hai ghi nhận tăng trưởng mạnh ở các thành phố nhỏ, khi Flipkart phủ sóng 130+ thành phố và 70% thành viên Prime mới của Amazon đến từ thị trường nhỏ. Ấn Độ hiện có hơn 5.500 dark store, dự báo tăng lên 7.500 vào 2030.
Những chiến lược mở rộng nhanh chóng của Flipkart và Amazon về dịch vụ giao hàng nhanh ở Ấn Độ sẽ giúp lập trình viên hiểu rõ về mô hình kinh doanh dark store và cách tối ưu hóa hệ thống giao hàng tự động, từ đó có thể ứng dụng vào các dự án công nghệ tương tự trong tương lai.
AI video is shifting from a fidelity race to an interactivity race. A three-level framework defines interactive avatar models: Level 1 avatars can only talk (one-way generation), Level 2 can talk and listen (reacting to user audio in real time with nods, expressions, and vocal cues), and Level 3 can talk, listen, and see (responding to posture, gesture, and facial expression via camera feed). The critical leap is Level 1 to Level 2, because an avatar that talks without listening feels uncanny and worse than audio-only systems. Achieving convincing listening requires joint modeling of audio and motion rather than stacking separate systems. Level 3 represents full human-to-human interaction replication, including contextual cues like a person standing up to end a conversation.
Google has launched two new generative AI models: Nano Banana 2 Lite, a fast and cost-efficient image generation model (~4 seconds, ~$0.034 per 1K images) optimized for high-volume pipelines, and Gemini Omni Flash, a multimodal video generation model supporting conversational editing via text, images, audio, and existing video inputs. Together, they enable an image-to-video AI pipeline where images generated by Nano Banana 2 Lite can be animated using Gemini Omni Flash. Both are available through Google AI Studio and the Gemini API, targeting developers and enterprises building creative AI applications at scale.
VTEX is a cloud-native, multi-tenant SaaS commerce platform that natively handles B2C, B2B, and multi-vendor marketplace workloads on a single codebase. Key differentiators include a built-in OMS (no third-party integration needed), native B2B account hierarchies with cost-center billing and contract pricing, and VTEX IO — a React/Node.js developer layer with workspace isolation for headless storefront builds. The platform uses GMV-based pricing rather than flat licensing, which aligns costs to revenue growth but requires careful negotiation at enterprise scale. A detailed comparison against Shopify Plus, Adobe Commerce, and commercetools shows VTEX wins when brands need marketplace, B2B, and OMS consolidation in one platform, but is overkill for small DTC brands or teams wanting maximum composable freedom.
Pick n Pay is launching Penny, an AI shopping assistant built on Google's Gemini models, within its asap! delivery app. Penny lets customers build grocery baskets via text, voice, or photo — for example, asking for a recipe and getting ingredient options added to the cart. It supports multilingual input, can reference order history and Smart Shopper points via APIs, and is billed as South Africa's first conversational grocery shopping experience. Penny assembles baskets but does not yet place orders autonomously. The feature rolls out from 6 July. Pick n Pay also noted a retail-media layer is coming, allowing manufacturers to bid on conversational search terms. Rival Checkers Sixty60 launched a similar AI assistant called Pixie in April, though with a different philosophy focused on predictive replenishment rather than open conversation.