02 November 2023

Как математик из Владикавказа выручил 175 млн рублей на обучении нейросетей

Как математик из Владикавказа выручил 175 млн рублей на обучении нейросетей

К 25 годам выпускник механико-математического факультета Московского государственного университета им. М. В. Ломоносова Георгий Каспарьянц успел внести вклад в разработку сразу двух вирусных приложений. Среди них — Gradient, позволявший найти свою копию среди знаменитостей. Работая в этом стартапе в 2019 году, он запустил собственный проект — LabelMe, по подготовке данных для обучения нейросетей. Рекордный рост компании пришелся на 2022 год — тогда ее годовая выручка выросла в четыре раза и достигла 175 млн рублей. В этому году он прошел акселератор Sber500 и привлек $200 000 от венчурного фонда Altair Capital

Сервис разметки данных LabelMe запустил математик Георгий Каспарьянц в 2019 году, когда возглавлял отдел искусственного интеллекта в мобильном приложении Gradient. Изначально проект помогал выполнять внутренние задачи компании. Но уже в 2020-м у него появились внешние заказчики. А еще спустя два года на сервис обратили внимание Альфа-банк, МТС и другие крупные российские компании. Это позволило стартапу нарастить выручку в четыре раза, до 175 млн рублей, а прибыль — до 68 млн рублей.

В 2023-м LabelMe прошел в акселератор Sber500 и запустил пилотные проекты с сервисом доставки «Самокат», площадкой для поиска вакансий «Работа.ру» и другими заметными игроками. Компания также привлекла $200 000 от международного венчурного фонда Игоря Рябенького Altair Capital.

Как команде это удалось?

Быстрый старт

25-летний Георгий Каспарьянц родился во Владикавказе. Его любимым школьным предметом была математика, поэтому он регулярно участвовал в олимпиадах. Став призером Всероссийской олимпиады по математике, он автоматом поступил на механико-математический факультет Московского государственного университета им. М. В. Ломоносова. В том же 2017 году вышел на первую работу дата-сайнтистом в стартап Teleport, основанный российскими предпринимателями Виктором Кохом, Богданом Матвеевым и Владиславом Уразовым. С последним Каспарьянц познакомился на одной из математических конференций в Москве.

Компания разрабатывала фоторедактор на основе нейросетей. Он позволял мгновенно обрабатывать фотографии пользователя — например, менять цвет волос или фон на портретах. Приложение появилось в сети 24 июля 2017 года. И на волне популярности Instagram (принадлежат Meta, которая признана в России экстремистской и запрещена) быстро собрало аудиторию: уже к 1 августа его скачали более 1,5 млн человек, писали «Ведомости». 

 

В 2018 году основатели продали Teleport. Часть команды, которая работала над функцией замены фона на фото, за $8 млн выкупила американская компания Snap Inc, разработчик популярного мессенджера Snapchat. Эта команда перешла в Snap Inc и эмигрировала в США и Великобританию, писал Inc. Вторую часть, отвечавшую за функцию перекрашивания волос, приобрел армянский разработчик одноименного фото- и видеоредактора PicsArt (летом 2021 года компания достигла оценки в $1 млрд), рассказал Forbes близкий к сделке источник, не раскрывая детали. Эта покупка публично не освещалась. 

Каспарьянц перешел в PicsArt, так как там ему предложили повышение — позицию главного дата-сайентиста в стартапе. Но уже в 2019 году он ушел в стартап по разработке фоторедакторов — Ticket to the Moon, который незадолго до этого запустили его бывшие работодатели Уразов и Матвеев. Каспарьянц вспоминает, что согласился уйти из PicsArt при условии, что займет высокую должность в новой компании. Предприниматели предложили ему взять на себя обучение нейросетей, а также долю в проекте.

В июне 2019 года команда выпустила приложение Gradient. Оно среди прочего определяло, на какую знаменитость похож пользователь — эта функция называлась Who's your twin. Как и Teleport, этот сервис быстро взлетел — за первые два дня его скачали более 3 млн раз, делился Уразов с изданием vc.ru. Приложение привлекло в том числе знаменитостей — свои изображения из Gradient публиковали рэпер Тимати, комики Гарик Харламов, Михаил Галустян и другие. А в сентябре того же года о виральной разработке рассказали в популярном шоу «Вечерний Ургант».

В основе приложения лежала нейросеть, которая автоматически анализировала изображение пользователя и подбирала похожее по чертам лицо известной личности. Для этого ее предварительно обучали на портретах знаменитостей, а каждый элемент лица — нос, рот, глаза — выделяли и маркировали с помощью тегов. Этот процесс называется разметкой. Ее делают обученные люди с помощью специальных программ. Среди самых популярных — CVAT от Intel и Label Studio. Последняя принадлежит американской компании с российскими корнями HumanSignal (бывшая Heartex). Ее в 2019 году запустили разработчики Михаил Малюк, Максим Ткаченко и Николай Любимов. В том же году стартап стал одним из победителей акселератора Сбербанка и 500 Startups. Размечать можно как изображения, так видео, текст и другие объекты.

В 2019 году на рынке было несколько «мелких компаний», которые помогали найти разметчиков под проект. Самым крупным игроком была Toloka (ранее «Яндекс Толока»), которую в 2014 году запустила российская IT-компания «Яндекс». Каспарьянц делал заказы через Toloka, когда работал в PicsArt. Но его не устраивало качество разметки. Найденные там фрилансеры часто совершали ошибки, поясняет предприниматель. Это наблюдение подтверждает Георгий Брегман, генеральный директор стартапа AI Disraei, разработчика аналога чат-бота ChatGPT от американской компании Open AI.

Каспарьянц решил сформировать собственный пул разметчиков, которые на постоянной основе собирали бы и размечали данные под его контролем. На старте он привлек 10 фрилансеров, разместив объявления в интернете и расклеив листовки в московских вузах. Чтобы минимизировать человеческие ошибки, он придумал двухступенчатую систему работы. Так, часть разметчиков классифицировала данные, а вторые проверяли готовую разметку. Кроме того, предприниматель ввел систему мотивации: пока проверяющий не помечал задачу как выполненную корректно, разметчик не получал за нее оплату. Часть задач фрилансеры выполняли с помощью готовых решений вроде CVAT. Каспарьянц также программировал собственные инструменты, которые помогали специалистам быстрее обрабатывать различные типы данных: текст, аудио, видео и изображения. 

За обработку одной единицы (например, картинки) он платил от двух рублей до 150 рублей в зависимости от сложности работы и общего количества объектов. «Если у клиента проект на 1000 фотографий, то это были копейки», — вспоминает он.

Свободное плавание 

Потребность в разметке данных для новых функций в Gradient появлялась в среднем раз в месяц. Из-за небольшой нагрузки фрилансеры часто уходили в другие проекты, вспоминает Каспарьянц. Из-за этого ему приходилось постоянно искать новых подрядчиков. Чтобы решить эту проблему, осенью 2019 года он получил статус индивидуального предпринимателя и начал через знакомых привлекать заказы от сторонних клиентов. 

Одним из первых внешних клиентов стал разработчик сервиса виртуальной примерки обуви TryFit. Компания планировала добавить в свое приложение функцию, которая определяла бы формы стоп пользователей по фото. Для этого требовались размеченные данные. В разговоре с Forbes основатель TryFit Ваган Мартиросян вспоминает, что проект Каспарьянца ему порекомендовали знакомые, поэтому других подрядчиков он не рассматривал. Разметка одного изображения обошлась ему в 10–15 рублей. Общий бюджет проекта насчитывал сотни тысяч рублей. Работа над ним продлилась два-три месяца. 

К концу 2019 года у предпринимателя уже было около 20 внешних клиентов, которые узнавали о его услугах благодаря сарафанному радио. Они делали заказы на разметку различных типов данных, но чаще всего изображений или видео. Такой фокус основатель объясняет своим бэкграундом в области фоторедакторов. 

Компании платили за проект — сбор и разметку данных под конкретную задачу. Стоимость зависела от количества собранных данных и сроков исполнения. В среднем она была вдвое выше, чем получали за работу фрилансеры, говорит Каспарьянц, не уточняя детали. Сейчас цена заказа может достигать и 3–4 млн рублей. По итогам 2019 года выручка проекта составила около 14 млн рублей, из них 2 млн рублей принесли сторонние заказы. Общая прибыль достигла 7 млн рублей. 

В начале следующего года предприниматель запустил сайт под брендом LabelMe. При этом он оставался кофаундером Ticket to the Moon. Когда он вышел из компании, он уточнять отказался. К январю 2020-го с проектом сотрудничали уже более 40 разметчиков, следует из поста на странице стартапа в VK. Все они работали на фрилансе. Каспарьянц также нанял первого менеджера по продажам. Это помогло нарастить выручку до 22 млн рублей. Половину принесли уже внешние заказы. Прибыль составила порядка 10 млн рублей. 

За следующий год компания выросла еще вдвое, до 40 млн рублей. А прибыль достигла 15 млн рублей. Увеличить показатели удалось благодаря новым клиентам. Прилечь их помогали контекстная реклама и реклама в соцсетях — в 2021 году стартап нанял двух маркетологов и начал вкладываться в продвижение, по 150 000–200 000 рублей в месяц. Кроме того, в команде появились второй менеджер по продажам, HR-директор и два проектных менеджера, которые подбирали под клиентов пул фрилансеров и следили за исполнением работы. Пул разметчиков вырос в несколько раз, утверждает предприниматель. Это позволило ускорить работу: минимальный срок исполнения заказа сократился до недели.

Новое решение 

В 2022 году часть клиентов LabelMe покинула Россию на фоне «спецоперации»*. Но они продолжали делать заказы. Тогда Каспарьянцу пришла идея открыть зарубежное юрлицо, которое бы привлекали клиентов на международном рынке. В том же году он зарегистрировал компанию в PieData AI в американском городе Делавэре, популярной юрисдикции среди стартаперов, и запустил рекламу. С учетом этих расходов стартовые вложения составили не менее $100 000. Сейчас среди его клиентов — мобильный фоторедактор PicsArt, мессенджер SnapChat, разработчик программного обеспечения IT&T. Подробности развития этого направления предприниматель раскрывать отказывается, ссылаясь на потенциальные сложности у проекта в связи с геополитической ситуацией.

В том же году к LabelMe стали обращаться крупные российские игроки — Альфа-банк, производитель электроники LG, IT-компания «КРОК», МТС и другие. Предприниматель связывает их интерес с желанием заместить зарубежное программное обеспечение, ушедшее на фоне «спецоперации». Для его разработки требовались размеченные данные. Назвать конкретные иностранные решения Каспарьянц не смог, но отметил, что это были среди прочего сервисы видеоаналитики. Связаться с LG Forbes не удалось. «КРОК», Альфа-банк и МТС на запросы издания не ответили. Благодаря притоку крупных заказчиков финансовые показатели компании выросли в четыре раза: ее выручка достигла 175 млн рублей, а прибыль — 68 млн рублей. 

С ростом объемов заказчиков Каспарьянц решил снять с себя операционные задачи и сфокусироваться на технической стороне стартапа. Для этого требовался партнер. Выбор пал на знакомого Федора Пылаева, у которого был опыт в бизнесе и фандрайзинге. До этого он два года, с 2020-го по 2021-й, развивал социальную сеть для геймеров Flexer, которая в 2020-м привлекла $200 000 от Altair Capital. В LabelMe Пылаев получил долю. Но ее размер партнеры на раскрыли. Согласно базе данных СПАРК, 100% российского юрлица ООО «Лейблми», зарегистрированного в мае 2023 года, принадлежит Каспарьянцу.

Благодаря Пылаеву к лету 2022 года стартап привлек первые инвестиции — $50 000 от бизнес-ангелов. В стартап вложились Вячеслав Солоницын, основатель сингапурского венчурного фонда Ruvento Ventures и американской компании по 3D-печати домов Mighty Buildings. С ним Пылаев познакомился, когда искал деньги на Flexer. Солоницын рассказал о LabelMe своему партнеру по Mighty Buildings Дмитрию Стародубцеву, а также номинанту рейтинга Forbes «30 до 30» 2021 года, основателю компаний Out of Cloud и Food Rocket Виталию Александрову и его партнеру по бизнесу Антону Самутину. Все они также стали инвесторами проекта. Александров, по собственным словам, вложил в стартап $20 000. Интерес к проекту он объяснил «сильной командой» проекта и отдельно «большой насмотренностью и технологической экспертизой» Каспарьянца. 

Эти средства позволили предпринимателям разработать новый продукт — B2B-платформу для разметки. В разговоре с Forbes Пылаев поясняет, что за последние годы у команды накопилось много разрозненных инструментов для разметчиков. Но каждый помогал решить одну задачу, например, размечать аудиоданные и отдельно видеофайлы. «Мы решили, что пришло время объединить их в единый продукт», — говорит он. По замыслу партнеров, компания-заказчик могла бы покупать доступ к ней по лицензии и самостоятельно ставить задачи фрилансерам. На LabelMe оставались бы техническая поддержка сервиса и поиск и контроль фрилансеров. 

Пока платформа ориентирована на российский рынок, поскольку международный достаточно конкурентный, считают партнеры. Там, например, уже работает HumanSignal. Насыщенность глобального рынка решений для разметки подтверждает младший научный сотрудник Центра искусственного интеллекта в химии научного кластера SCAMT Университета ИТМО Никита Серов. По его наблюдениям, за рубежом есть целая плеяда игроков. Это американские Labelbox, Scale AI, Clarifai,  Superb AI, Alegion, TrainingData.io, Snorkel AI, SuperAnnotate, британский V7 Darwin и вьетнамский Pure Moderation. Все они фокусируются на отдельных типах данных. Например, Automation AI и TrainingData.io — на изображениях, а Snorkel — на текстах.

LabelMe представила свою разработку в 2023 году и прошла с ней летом в акселератор Sber500. Благодаря участию в программе стартап запустил первые пилоты по использованию платформы со «Сравни.ru», сервисом доставки продуктов «Самокат», рекрутинговой платформой «Работа.ру», провайдером облачных технологий и ИИ-решений Cloud.ru. Управляющий директор «Сбера» по работе со стартапами Наталья Магидей подтвердила Forbes, что несколько компаний-партнеров акселератора уже протестировали или готовятся тестировать решение стартапа. «Сервис показывает хорошие результаты на данных разного формата, включая  аудио, видео, на задачах разной сложности, что показывает, насколько решение адаптивно», — отметила она. 

По словам Каспарьянца, в текущем году компания также привлекла $200 000 от международного венчурного фонда Altair Capital Игоря Рябенького. Деньги пойдут на доработку платформы. У Каспарьянца, по собственным словам, по итогам раунда осталось 90% стартапа. Рябенький от комментариев отказался.

Быстрый и точный 

По мнению Магидей, разметка данных — перспективный рынок. Это связано с высоким темпом развития технологий искусственного интеллекта. «Он только в начале своего массового применения и такие стартапы, как LabelMe, которые уже сейчас предлагают сильный продукт, получат преимущество [перед конкурентами]», — заключает она.

Сейчас в России LabelMe опережает других игроков, предлагая самые быстрые сроки исполнения, от недели до нескольких месяцев, утверждает Георгий Даньщин, глава отдела Data Science рекрутингового сервиса HeadHunter. Он сотрудничал со стартапом в начале 2023 года. По его словам, с компанией оказалось проще и дешевле запускать проект, чем с другими подобными сервисами. «Остальные предлагают очень много предварительных созвонов, а нам нужно быстро получить результат», — поясняет он. Раскрывать названия конкурентов LabelMe он отказался. 

По мнению большинства опрошенных Forbes экспертов, главным конкурентом LabelMe на российском рынке последние годы была Toloka. Но она уступала проекту с точки зрения сервиса, считает генеральный директор стартапа AI Disraei и технический директор ИИ-стартапа Kale (занимаются обработкой текстов на естественном языке и компьютерным зрением) Георгий Брегман. По его словам, в LabelMe есть персональные менеджеры, которым можно делегировать любую задачу, связанную с разметкой. Они в том числе подбирают фрилансеров под проект и контролируют их работу. У Tolokа же они доступны только при крупных заказах, от 1 млн рублей. К тому же команда LabelMe предлагает более высокое качество разметки. Но у стартапа есть и недостатки — более высокая стоимость услуг. Она в полтора-два раза выше, чем в Toloka. В последней отказались от комментариев. 

Впрочем, сейчас рынок меняется. Например, летом в «Яндексе» объявили об уходе Toloka из России — сервис сосредоточится на международном рынке. На смену ему пришел сервис «Яндекс Задания». Он доступен с июля 2023 года. С  учетом темпов развития искусственного интеллекта в нише могут появиться и другие корпоративные игроки, которые обгонят LabelMe за счет внутренних ресурсов корпораций, считает Дмитрий Стародубцев. Но он уверен, что компания может сохранить позиции благодаря высокой технологической экспертизы. 

По данным Каспарьянца, выручка компании по предоплаченным заказам на текущий момент составляет порядка 80 млн рублей. Столько же стартап должен получить на постоплате до конца года. За I квартал 2024 года компания рассчитывает завершить все пилотные проекты и запустить продажи годовой лицензии на использование платформы. Ее стоимость составит 100 млн рублей. За счет этого стартап рассчитывает нарастить выручку втрое по сравнению с 2023 годом и увеличить прибыль в пять раз до конца 2024-го. 

Компания также намерена привлечь новый раунд инвестиций под доработку платформы. Одним из потенциальных инвесторов компании может стать Евгений Кузнецов, основатель и гендиректор фонда Orbita Capital. Он заявил, что рассматривает LabelMe для инвестиций, на демодне по окончанию Sber500. В разговоре с Forbes он подтвердил, что изучает такую возможность. Каспарьянц признается, что в будущем хотел бы продать бизнес крупному игроку. Но это не текущий приоритет, уверяет Пылаев: «Пока нам нравится общаться с клиентами и улучшать для них наш продукт».