На фоне революции в ИИ-индустрии Эдвин Чен, бывший сотрудник Google, Facebook (принадлежит Meta, признанной в России экстремистской и запрещенной) и Twitter, незаметно для всех создал свою компанию Surge AI, специализирующуюся на маркировке данных. Теперь самый молодой участник рейтинга 400 богатейших людей Америки 2025 года по версии Forbes готов выйти из тени и заявить о себе
Проведя утро за просмотром набора данных, чтением научных статей и экспериментами с передовыми моделями ИИ в своей квартире на Манхэттене, Эдвин Чен отправился на небольшую прогулку до стильной трехэтажной кофейни Starbucks Reserve Roastery на Девятой авеню.
Одетый в темно-синюю футболку от Vuori и с холщовым шоппером с тигром через плечо, Чен спустился вниз, заняв столик в укромном уголке. Его выбор пал на маленькую чашку зеленого чая, «поскольку кофе в этом месте слишком дорогой». В этом уединенном месте основатель и гендиректор компании Surge AI, специализирующейся на маркировке данных и обучении ИИ, положил начало двухчасовой бесконечной дискуссии, затронувшей все возможные темы: от культуры Кремниевой долины (которую он ненавидит) до своих конкурентов («они все — лишь конвейер с не самыми лучшими специалистами») и того, как люди могли бы наладить контакт с инопланетянами, если бы те прилетели на Землю. «Они не говорят по-английски. Так как же с ними общаться? Как расшифровать их язык? Надеюсь, для этого есть какой-нибудь математический способ», — рассуждает он.

Эдвин Чен (Фото Guerin Blask для Forbes)
Проблема установления контакта с инопланетными формами жизни также рассматривается в любимом рассказе Чена «История твоей жизни», изданном в 1998 году писателем-фантастом Тедом Чаном. Это произведение стало основой для фильма «Прибытие», в котором лингвист пытается найти способ общения с инопланетянами, выявляя закономерности в их речи и письменности. По словам Чена, эта тема также частично вдохновила его на создание Surge AI в 2020 году, добавив, что он хочет, чтобы его компания по маркировке данных смогла захватить «все разнообразие человеческой природы». Для этой цели он привлекает умнейших людей (включая профессоров из Стэнфордского, Принстонского и Гарвардского университетов) для обучения ИИ, превращая их узкоспециализированные знания в двоичный код, лежащий в основе больших языковых моделей. В дополнение к гениям из Лиги плюща Чен собирает армию из более чем миллиона так называемых гиг-работников из более чем 50 стран мира, которые помогают придумывать сложные вопросы для ИИ, оценивать ответы моделей и составлять критерии, помогающие ИИ генерировать идеальный ответ. «Я правда считаю, что наша работа критически важна для всех моделей ИИ. Без нас AGI [общий искусственный интеллект, технический термин, обозначающий концепцию ИИ, способного соответствовать или даже превосходить человеческие способности] просто никогда не станет реальностью, — говорит Чен. — А мне очень хочется, чтобы мы достигли этого».
Чен, обожающий пускаться в длинные рассуждения и отличающийся гениальными и эксцентричными решениями, пожалуй, является самым успешным технологическим предпринимателем, о котором практически никому не известно. Однако до недавнего времени это и было его желание — оставаться в тени, несмотря на свою популярность в кругах ИИ-энтузиастов. Будучи опытным специалистом по обработке данных, работавшим в Twitter (теперь X), Google и Facebook (принадлежит Meta, признанной в России экстремистской), Чен отказался от традиционного венчурного капитала и семь лет назад покинул так называемый «аквариум» области залива Сан-Франциско, решив самостоятельно заняться финансированием Surge AI, начав с «пары миллионов» сбережений, накопленных за десять лет работы в технологических гигантах. «Одна из причин, почему мы решили все начать без чьей-либо помощи, заключается в том, что меня всегда отталкивали эти статусные игры в Кремниевой долине», — говорит Чен, описывая типичный стартап, поддерживаемый венчурным капиталом, как «схему быстрого заработка». Он также выступает против идеи привлечения крупных инвестиций, которые потом необходимо тратить на что-то. По его мнению, это приводит к массовому найму лишних сотрудников. Он отмечает, что в Surge AI работает всего 250 специалистов, включая штатных и внештатных сотрудников, а также консультантов, в то время как у того же Scale AI, одного из крупных конкурентов компании, их в четыре раза больше (и с более низким доходом).
Surge AI, которая помогает технологическим компаниям получать высококачественные данные, необходимые для улучшения их моделей ИИ, принесла в 2024 году — меньше, чем через пять лет после своего основания — доход в размере $1,2 млрд благодаря таким клиентам, как Google, Meta (признана в России экстремистской и запрещена), Microsoft и ИИ-лаборатории Anthropic и Mistral. Компания также помогала в обучении Gemini от Google и Claude от Anthropic. По словам Чена, компания практически с самого первого дня своего существования приносила прибыль.
Решение Чена самостоятельно заниматься финансированием Surge AI принесло ему огромную прибыль: его доля в компании, составляющая примерно 75%, оценивается в $18 млрд, что сделало его самым богатым новичком в рейтинге 400 богатейших людей США по версии Forbes USA. В свои 37 лет он также стал самым молодым членом рейтинга этого года.
Surge AI утверждает, что подход их компании отличается от старых форм маркировки данных, при которых людям — часто из менее развитых стран глобального Юга — платят копейки за то, что они, сидя перед компьютерами, определяют разницу между кошкой и собакой. Вместо этого аннотаторы данных (специалисты, занимающиеся разметкой данных для обучения моделей машинного обучения. — Forbes) Чена, среди которых есть высококвалифицированные специалисты и профессора, следуют набору инструкций по взаимодействию с онлайн чат-ботами. Их могут попросить спровоцировать чат-бота на выдачу неправильного или оскорбительного ответа. Затем они исправляют выданный результат на более подходящий ответ. Их также могут попросить сравнить разные ответы ИИ на один и тот же вопрос и объяснить, какой из них лучше и почему.
По объему выручки Surge AI в настоящее время является крупнейшей ИИ-компанией, однако ее конкуренты, включая Scale AI (49% акций которой Meta приобрела в июне за $14 млрд), Turing, Mercor и Invisible AI, стремительно набирают обороты. По оценкам технологической исследовательской фирмы International Data Corporation, в 2024 году компании потратили $104 млрд на инфраструктуру ИИ, и в этом году темпы расходов только растут. «Данные — важная часть этой инфраструктуры, так же как вычислительные мощности [«сырая» вычислительная мощность] и энергия, — говорит Джонатан Сиддхарт, гендиректор компании Turing, базирующейся в Пало-Альто, Калифорния. — Я считаю, что для компании имеет смысл тратить на данные 10–20% из своих расходов на вычислительные мощности». Все пытаются урвать свой кусок пирога: в мае Джефф Безос стал ведущим инвестором в раунде финансирования на $72 млн нидерландской компании Toloka, специализирующейся на маркировке данных. В 2024 году гигант каршеринга Uber начал маркировать свои собственные данные. Устоявшиеся игроки, включая австралийскую компанию Appen, которая все чаще обслуживает китайских производителей моделей ИИ, также начинают менять вид деятельности, переориентируясь на генеративный ИИ.
В течение всего этого времени Чен незаметно развивал свою компанию, укрепляя ее репутацию. «Мне кажется, [Surge AI] просто не хочет раскрывать подробности своей деятельности», — считает нынешний исследователь Meta. Однако по мере развития индустрии Чен решил выйти из тени. Его очень беспокоит тот факт, что современные модели ИИ оптимизированы для неправильных целей и затягивают пользователей в «безумное зазеркалье» — подобно тому как алгоритмы YouTube и Twitter были в основном оптимизированы для создания кликбейта, когда он работал в этих компаниях. Его цель состоит в том, чтобы Surge AI помогла «направлять ИИ-индустрию» — для этого компания должна выступить в роли идеологического лидера. По словам исследователя, это давно пора было сделать. «Surge AI действительно хорошая компания, и многие это знают. Я как-то даже поинтересовался у [Чена], почему, по его мнению, о нем еще никто не знает», — добавил он.
Немного о Чене
Чен вырос в Кристал-Ривер, Флорида (население 3400 человек), на побережье Мексиканского залива — месте, более известном своим большим количеством ламантинов и пенсионеров, чем технологическими миллиардерами. Его родителям, мигрантам из Тайваня, принадлежал ресторан китайско-тайско-американской кухни Peking Garden, где Чен подрабатывал в подростковом возрасте.
По-настоящему Чен увлекался с детства лингвистикой и математикой, а также их взаимосвязью. По его словам, его «всегда интересовали математические основы языка». В детстве он хотел выучить «примерно 20 языков» и обожал участвовать в конкурсах по правописанию (spelling bee). Сегодня он все еще немного помнит французский, испанский и китайский (хинди и немецкий остались в прошлом). Математика давалась ему легко, но по-настоящему эта наука захватила его воображение только тогда, когда он начал замечать характерные закономерности в числах, «особенно в числе три», которые он встречал повсюду — от цветочных лепестков до гор.
Он приступил к изучению высшей математики в восьмом классе и получил полную стипендию на последние два года обучения в элитной школе-пансионе Choate Rosemary Hall в Коннектикуте, среди выпускников которой — такие известные личности, как Джон Кеннеди, Джон Дос Пассос и Иванка Трамп. Изучив всю математическую программу школы, он провел большую часть своего последнего года обучения за исследованиями интересующих его тем под руководством профессоров Йельского университета (признан в России нежелательной организацией), которые также преподавали в Choate Rosemary Hall. Затем он поступил в Массачусетский технологический институт (MIT), где выбрал математическую специализацию, стал соучредителем лингвистического общества и перешел на полифазный режим сна, который предполагает разделение сна на несколько коротких периодов отдыха — например, 30-минутный сон каждые шесть часов вместо одного восьмичасового сна.
После трех лет обучения в MIT Чен прошел стажировку в бывшем хедж-фонде, принадлежащем Питеру Тилю и базирующемуся в Сан-Франциско. Он пришел в восторг от этой работы и больше не вернулся в университет. Завершив все необходимые курсы, подал заявку на получение степени. Затем работал в Twitter, Google и Facebook, где занимал различные позиции, связанные с модерацией контента и алгоритмами рекомендаций. На каждой должности Чен сталкивался с одной и той же проблемой: было сложно получить в больших объемах высококачественные данные, маркированные людьми. В 2020 году он ушел со своей последней работы в Twitter, чтобы самостоятельно решить эту проблему — в том же году он основал компанию Surge AI. «В течение последних десять лет я был занят созданием ранних версий этой системы», — говорит Чен.
Все свои решения предприниматель принимает осознанно. Будучи веганом и проходя почти каждый день 20 000 шагов, он считает, что некоторые из его лучших идей возникли именно во время прогулок по Нью-Йорку. Раз или два в неделю он прогуливается до Таймс-сквер в полночь. «Мне нравится наблюдать за этой мини-репрезентацией человечества — актерами Бродвея, туристами со всего мира, работниками ночной смены, художниками — в окружении огней, технологий и инфраструктуры города», — говорит он. Чен является большим поклонником Эминема, но в тот момент он решил процитировать слова из песни Jay-Z и Алиши Киз Empire State of Mind: «На этих улицах ты почувствуешь себя новым человеком, яркие огни зажгут внутри тебя пламя (These streets will make you feel brand new, big lights will inspire you)».
Свое дело
Чен был сыт по горло наборами маркированных данных, которые «никуда не годились» и были сделаны людьми, которым либо не платили нормально, чтобы их по-настоящему заботила эта работа, либо они не обладали необходимыми культурными или политическими знаниями, чтобы выносить обоснованное суждение. Например, аннотатор, не знакомый с процессом выборов в США, может пометить комментарий в соцсетях «Вперед, Брэндон!» (Let’s go Brandon! — лозунг, выступающий в качестве замены фразе F**k Joe Biden) как «положительный». Surge AI искала специалистов, которые вникали в контекст и обладали глубоким знанием языка. В 2021 году Чен получил интересное письмо от брата инженера-программиста, которого он пытался нанять. Этот человек, Скотт Хайнер, почти не имел опыта в сфере технологий, он более десяти лет был барабанщиком и тур-менеджером инди-поп-исполнителей, таких как Алек Бенджамин. Однако к электронному письму было приложено знаменитое эссе Дэвида Фостера Уоллеса, в котором обсуждалось, кто имеет право определять, что является «правильным» английский языком. Чена заинтересовало это письмо, и в октябре того же года он нанял Хайнера в качестве пятого сотрудника Surge AI, несмотря на то что тот не имел никакого технологического опыта. По словам Хайнера, Чен — «совершенно уникально мыслящий человек».
В ходе собеседования Чен с одинаковой вероятностью может попросить соискателя обсудить как работы Уоллеса или лингвистику, так и написать код или решить сложную задачу. Примерно 20% сотрудников Surge AI имеют нетрадиционное для этой индустрии образование. «Мы ценим креативность», — говорит Чен.
Чен применяет свой подход и в других сферах бизнеса. Отказавшись от традиционных методов продаж и маркетинга, он выбрал метод общения через свой популярный блог, посвященный науке о данных, который он начал вести в свободное время более десяти лет назад. По его словам, именно там Surge AI нашла своих первых клиентов, хотя не уточняет, кого именно. Тем не менее среди первых клиентов были такие компании, как Airbnb, Twitch и Twitter, его бывший работодатель. Чен пытается напрямую обращаться к специалистам по обработке данных из технологических компаний, полагая, что они смогут по-настоящему оценить качество данных Surge AI и будут более склонны за них платить. По данным двух исследователей, Surge AI взимает за свои услуги от полутора до десяти раз больше, чем ее конкуренты.
Золотые годы
Среди богатейших людей США подавляющее большинство находится в довольно пожилом возрасте. Средний возраст членов рейтинга 400 богатейших людей США по версии Forbes USA за последние 25 лет вырос с 61 до 70 лет — на 30 лет больше среднего возраста гражданина США, который составляет 39 лет. Среди участников этого года 99 представителей достигли 70 лет, что составляет 24,8% рейтинга, 85 человек — 80 лет (21,3%) и 23 человека — старше 90 лет (5,8%). Самый пожилой участник — 96-летний земельный и лесопромышленный магнат Арчи Олдис Эммерсон.
Даже самые молодые участники рейтинга становятся старше. В 1982 году 27-летний Стив Джобс был самым молодым self-made участником первого рейтинга — в этом году самым молодым в рейтинге стал Эдвин Чен. Самым молодым членом рейтинга за все время его существования был наследник издательской империи Дэниел Зифф, которому в 1994 году исполнилось 22 года. Улучшение здравоохранения в сочетании с резким ростом минимального состояния, необходимого для попадания в рейтинг, которое выросло на 424% с $725 млн 25 лет назад ($1,4 млрд по современному курсу) до $3,8 млрд в этом году, в значительной степени объясняет увеличение возраста участников. Сейчас нужно больше времени, чтобы заработать такое состояние.
Скрытность стартапов
Однажды майским субботним вечером в 2023 году один из исследователей Google порекомендовал своим коллегам связаться с Ченом. В то время семейство моделей ИИ Gemini от Google было «в довольно печальном состоянии». Разговор длился более двух часов. Вскоре после этого Google подписал с Surge AI контракт, сумма которого выросла до более чем $100 млн в год. «В одном случае вы ощущаете, что платите за качество, а в другом — просто оплачиваете чье-то рабочее время», — говорит исследователь, который с тех пор ушел из Google и попросил не указывать его имя.
ИИ-стартапы редко делятся информацией о себе, но даже по сравнению со своими конкурентами Surge AI выходит на новый уровень. Крупнейшие клиенты компании не имеют понятия, как именно она улучшает качество данных. С другой стороны, Surge AI и его конкуренты практически не имеют представления о том, чьи данные в конечном итоге используются для обучения таких моделей, как Gemini, Claude или GPT от OpenAI. Surge AI не раскрывает, как компания подбирает участников для проектов, собирает данные и как происходит маркировка. Все, что получают клиенты за свои миллионы, — ссылка на набор данных.
Подобный подход позволяет Surge AI более тщательно контролировать работу аннотаторов с помощью тайных проверок, ручной проверки более опытными аннотаторами и (конечно же) алгоритмов машинного обучения, которые, по словам Чена, оптимизируют «производительность» и могут быть довольно «придирчивыми». Он утверждает, что секретом успеха Surge AI являются строгий контроль качества и глубокая техническая экспертиза.
По словам Чена, высокий уровень секретности в Surge AI не был преднамеренным — компания просто «слишком занята, чтобы обсуждать свою работу публично». Кроме того, Surge AI действует в соответствии с соглашениями о неразглашении информации (NDA) со своими клиентами. Аннотаторов компания нанимает через дочернюю компанию DataAnnotation Tech, которая полностью принадлежит Surge AI. Ни в списке вакансий, ни на веб-сайте, используемом аннотаторами, не упоминается название Surge AI, что означает, что работники могут даже не знать, что за каким-либо проектом стоит Surge AI. Оплата работы равняется не менее $20 в час — за более специализированные задачи предлагают более $40 в час, что не кажется высокой ценой за лучших специалистов. «Мы хотим быть платформой, где хорошие, очень умные работники, обладающие глубокими знаниями, могли бы работать на полную ставку», — говорит Чен.
Детские склоки
Предприниматели в сфере ИИ, может быть, и гении, но это не значит, что они выше мелких перепалок.
«Я бы сказал, что Scale AI совсем увязла в трясине, разве нет?... Просто вспомните, с чего начинали Turing и Mercor — они же буквально работали как конвейер, не заботясь об уровне специалистов», — говорит гендиректор Surge AI Эдвин Чен. «Если бы Эдвин уделял меньше времени нападкам в сторону Scale AI, он, возможно, наконец-то смог бы завершить свой затянувшийся инвестиционный раунд», — парирует представитель Scale AI Джо Осборн.
«Не каждый день твой главный конкурент среди стартапов за одну ночь терпит крах», — говорит технический директор Mercor Адарш Хиремат, комментируя сделку между Meta и Scale AI. «Неудивительно, что именно Mercor распространяет ложь о своем главном конкуренте», — отмечает представитель Scale AI Джо Осборн.
«[В Scale AI] они пытаются превратить мусор в золото. Похоже, будто они лезут куда угодно, лишь бы доход получить», — считает Марсель Сантилли, бывший руководитель отдела маркетинга Scale AI, который в настоящее время перешел в Surge AI.
«Сегодня мы представляем уникальную категорию, поскольку другие компании придерживаются подхода с маркировкой данных. Такие ИИ-лаборатории, как Scale AI и Surge AI, просто «присылают каких-то людей», — добавляет гендиректор Turing Джонатан Сиддхарт.
В редких случаях Surge AI принимает некоторых аннотаторов в штат, как это было с Джульеттой Стэнтон, бывшим профессором лингвистики Нью-Йоркского университета, получившей докторскую степень в MIT. Стэнтон начала сотрудничать с Surge AI в апреле 2024 года, «чтобы немного подзаработать», а теперь является штатным сотрудником. По ее словам, компания ищет людей, «способных к аналитическому и творческому мышлению». Она также добавила, что Чен хочет, чтобы аннотаторы помогали ИИ улавливать различные культурные и социальные контексты на разных языках. Например, язык, который люди используют со своими друзьями, отличается от лексики при разговоре с начальником. В некоторых языках даже выделяются разные слова для романтических и неромантических контекстов — всем этим деталям аннотаторы могут помочь научить ИИ.
Тем не менее армия почасовых фрилансеров, не получающих никаких льгот, несмотря на то что для многих из них маркировка данных является основной работой, также служит мишенью для возникновения судебных исков. Компании Surge AI и Scale AI столкнулись с коллективными исками в Калифорнии, в которых утверждается, что они неправомерно классифицировали постоянных работников как независимых подрядчиков, чтобы уклониться от расходов на отпуска и медстрахование. «Умышленное решение Surge AI эксплуатировать своих работников для получения прибыли является частью более широкой тенденции, которая будет продолжать развиваться, пока технологические гиганты борются за доминирование в сфере ИИ, если мы не привлечем их к ответственности, — говорилось в заявлении для Forbes USA Гленна Данаса, партнера юридической фирмы Clarkson Law Firm, базирующейся в Лос-Анджелесе. — По сути, Surge AI занимается массовым хищением заработной платы». «Мы считаем, что иск не имеет под собой никаких оснований», — отвечает Чен на обвинения. Он и представитель Scale AI Джо Осборн заявляют, что намерены решительно отстаивать свои компании: оба дела находятся на стадии рассмотрения.
Перед многими компаниями, подобными Surge AI, стоит экзистенциальный вопрос: наступит ли время, когда вместе с развитием ИИ исчезнет надобность в аннотаторах-людях? По словам исследователя Meta, модель Llama 4 от Meta, выпущенная в апреле, уже в значительной степени полагалась на ИИ, создавая и маркируя свои собственные данные, которые получили название «синтетические данные». Surge AI использует гибридный вариант этого подхода с участием человека, называемый human-in-the-loop (HITL), при котором ИИ генерирует свои собственные данные и маркирует их, но люди оценивают его работу. Чен твердо убежден, что люди незаменимы в этом процессе. По его мнению, когда люди и ИИ работают вместе, они превосходят любой результат, которого каждый из них мог бы достичь по отдельности. Тем не менее, даже если люди будут лишь косвенно участвовать в процессе маркировки данных, больший упор на самообучение машин повлияет на прибыль компании, поскольку обучение станет значительно дешевле.
Другая проблема Surge AI — цунами венчурных инвестиций, обрушивающееся на конкурентов. Имея в распоряжении большие денежные средства, они не должны особо беспокоиться о прибыльности (по крайней мере в краткосрочной перспективе), что оказывает понижательное давление на маржу во всей отрасли. Surge AI уже потеряла двух своих ключевых клиентов. Представитель OpenAI подтвердил, что компания прекратила сотрудничество с Surge AI (конкуренты компании — Mercor и Invisible — заявили, что OpenAI является их клиентом). ИИ-лаборатория Cohere, которая была одним из первых клиентов Surge AI, практически перевела весь процесс маркировки данных на внутренний уровень. В конечном итоге производители моделей ИИ не отличаются особой верностью, если вообще обладают ею. Большинство клиентов Surge AI также параллельно заключают контракты с ее конкурентами: Meta по-прежнему использует данные Surge AI, несмотря на приобретение половины Scale AI, на которое компания потратила миллиарды.
«Это не тот рынок, на котором победитель получает все», — считает Ашу Гарг, инвестор Turing и партнер Foundation Capital. По его мнению, если компании в области ИИ и маркировки данных смогут получить бюджет IT-сферы, который имеют крупнейшие мировые компании, и отвоевать часть рынка у традиционных игроков в сфере IT-услуг, этот рынок может превратиться в рынок с оборотом в триллионы долларов.
Независимо от вектора развития отрасли Чен планирует занимать руководящую должность в Surge AI до появления общего искусственного интеллекта (AGI) — если такое вообще случится. Сэм Альтман уверен, что мир вскоре увидит AGI, но Чен более трезво смотрит на подобную возможность. По его мнению, это произойдет примерно через 20 лет.
Рассуждая о будущем, Чен заявил, что он «в принципе не заинтересован в поглощении» и не имеет намерения проводить IPO. «Зачем кому-то проводить IPO? Главная проблема публичных компаний в том, что им всегда приходится беспокоиться о краткосрочной перспективе», — добавил он. Руководитель продуктового направления Ник Хайнер выдвигает другую теорию: «Если бы Surge AI не существовало, чем бы Эдвин занимался в свое удовольствие? Скорее всего, он бы все равно маркировал данные и обучал ИИ. К счастью для него, это просто оказалось прибыльным делом сейчас. Можно сказать, что это как наблюдать за [баскетболистом] Майклом Джорданом, выполняющим слэм-данк. Этот парень был рожден для этого».
Перевод Ксении Лычагиной