Чт. Січ 23rd, 2025

Як Fozzy Group використовує власну нейромережу KISSA, які її особливості та чому супермаркети Сільпо ніколи не стануть аналогом безкасового Amazon Go.

Розвиток штучного інтелекту в групі компаній Fozzy почався з жарту на 1 квітня 2017 року, коли мережа супермаркетів Сільпо заявила про впровадження самонавчальної програми KISSA (Key Intellectual Silpo System Assistant). Вона включала роботу з Big Data, інтеграцію з CRM и ERP-системами Сільпо, використання даних геолокаційних сервісів та супутників зв’язку, щоб підвищити якість взаємодії з покупцями, а також допомогти автоматизувати бізнес-процеси. Таким чином, планували скоротити витрати від 20% до 25% за рахунок оптимізації процесів та збільшити ефективність логістичних процесів на 40%.

u0420u0438u0442u0435u0439u043b u0432 u0422u0435u043bu0435u0433u0440u0430u043c

На кілька років про жарт забули, поки у 2021 році не почали справжні тестування власної нейромережі. Назву KISSA залишили і наразі вона повноцінно працює у кафе Кантін на Лівому березі Києва. В колонці для Speka керівник «Лабораторії Зі», R&D-підрозділу TemaBit Fozzy Group Андрій Янбухтін розповів про те, як рішення виросло за ці роки. RAU обрала з матеріалу ключове.

TemaBit займається в Сільпо напрямком сomputer vision. Це фотографії, картинки, відео та робота з оптичними об?єктами. У нас працює кафе Кантін у бізнес-центрі Silver Breeze – це формат швидкого ресторану: берете тацю, самі обираєте страви, потім ставите тацю у так званий портал, де ШІ розпізнає замовлення і виставляє ціну. Портал — це конструкція з підсвіткою та камери. Камера робить знімок, що потрапляє до нейромережі, яка визначає та класифікує страви на таці. Ми підсвічуємо на екрані, які страви обрав гість, їхню порційність тощо.

Алгоритм доволі складний: ми рахуємо пельмені, площу пюре на тарілці, щоб визначити, порція це чи половина порції, і виводимо суму на екран гостеві. Все відбувається в автоматичному режимі, час на класифікацію страв — приблизно 2-3 секунди. У систему Kissa завантажено майже 200 страв і стільки ж SKU.

Як система на основі computer vision розпізнає їжу Над проєктом від ідеї до MVP працювали приблизно півтора роки, а перший портал був просто дерев?яною рамкою. Коли все тільки починалося, у команді було кілька людей: ми носили з їдальні борщі на тацях і вчили “нейронку” визначати, з якою стравою вона має справу. На першому порталі ми встановили три камери. Зараз використовуємо одну-дві. Додаткова камера дозволяє побачити продукт з іншого ракурсу, якщо даних з першої камери бракує.

Головна складність полягала в тому, що ми створювали своє рішення з нуля. Звісно, у світі були аналогічні рішення, зокрема, у китайців, але вони прив?язувалися до тарілок певного розміру: тобто кожну страву треба було класти в окрему тарілку. Але ж ми так не любимо: треба скласти в одну тарілку пюре, котлету, підливу та салат. І ШІ повинен був визначити, що там таке під усією цією підливою.

Як виглядає ШІ-портал від Fozzy Group

Сьогодні точність упізнавання більшості наших страв сягає майже 98%. Ми зробили екран інтерактивним, щоб у разі помилки з боку ШІ можна було за два кліки змінити порцію на половину порції. Коли змінюється дизайн певного товару, наприклад, пляшки Моршинська, ми одразу завантажуємо фотографії нового дизайну у систему і донавчаємо, таким чином, “нейронку”.

Коли ми тільки починали, то думали: що більше даних — то краще, але зрештою зупинилися на золотій середині. Адже існує таке поняття, як перенавчити нейромережу, коли вона має так багато інформації, що починає помилятися через її надлишок.

Орієнтуємося на досвід Amazon Go та його рішення, які дозволяють ШІ визначати, скільки покупець узяв товарів у магазині, і дають розплатитись без каси та без касира. Це рішення чудово підходить для невеликих магазинів, а для великих супермаркетів, як Сільпо, це невиправдано дорого. Кількість камер для рішень, які зі стелі відстежують конкретну людину та що вона бере, це близько п’яти штук на квадратний метр. Тож якщо брати наші розміри та кількість магазинів, це виходить надто дорого.

Важливо розуміти, що штучний інтелект — це не панацея. Якщо вам потрібен результат на рівні підрахунку в Excel, навіщо залучати ШІ? Усе можна зробити набагато простіше. Навіть якщо ручний результат дає 80% за Паретто, а 20% додає ШІ, варто замислитися, чи потрібні тут ці 20%, а отже, штучний інтелект.