Куда двигаться, чтобы искусственный интеллект не заменил тебя на рабочем месте? Стоит ли уже сейчас переквалифицироваться или риски не так высоки? Может ли уже сейчас AI выполнять функции разработчика? Обсудила ✨звёздная команда ✨участников круглого стола.
Модератор: Алекс Светкин, Technical Program Manager в Yandex.Ads, экс-VK
Спикеры:
Таня Савельева, Forbes 30/30, consultant, экс-CEO EVAAI, Yandex.SupportAI (TG-канал Тани).
Александр Грановский, Yandex, руководитель dev-отдела, экс-FB*, экс-VK
Станислав Гуменюк, рукводитель команд разработки Островок! / ex-VK / ex-Semrush
Сергей Дуканов, CTO стартапа в области AI dubbing. Опыт в VoiceTech 5 лет
Андрей Мурашев, Head of AI Airs.ai, ex-Staff ML инженер в Meta*,
Алексей Воропаев, руководитель исследовательской группы в SberAutoTech
UnionVK
Материал подготовлен на основе онлайн-встречи UnionVK, сообщества текущих и бывших сотрудников группы компаний VK. Присоединяйся к комьюнити, если тоже являешься выпускником группы VK :) А полную запись встречи можно посмотреть по ссылке на нашем YouTube канале.
AI – это что вообще такое?
Алекс: Мы так часто о нём говорим, но давайте определим границы этого понятия.
Алексей: Искусственный интеллект – это базворд., С момента появления термина им называли всё самое передовое, чем пытались заменить человека в каком-либо аспекте его жизни. От самоходной тележки да Винчи до современных нейронок.
Таня: ИИ – это система правил и алгоритмов, которая умеет принимать решения. Но ИИ ≠ ML: искусственный интеллект не всегда самообучаем. Мне кажется, важно ответить и на другой вопрос: зачем ИИ нам нужен? Мой ответ – не для замены человека, а для того, чтобы делать различные операции на несколько порядков эффективнее. Ведь у ИИ есть два преимущества перед человеком: большой массив данных и огромные вычислительные мощности.
Алекс: Мне кажется, ИИ – это не про любую автоматизацию, а про случаи, когда машина заменяет своей деятельностью человеческое интеллектуальное усилие. В этом его цель.
Про LLM
Алекс: Отдельно хочется поговорить про LLM. Какие возможности и перспективы у них есть?
Андрей: Главная задача LLM – предсказывать следующее слово по имеющемуся контексту. Звучит просто. Однако чтобы это сделать корректно, нейронке нужно иметь представление о мире. Ближе всего к фигуре стандартного офисного работника с такими представлениями сейчас подошла GPT-4o, с видео и аудио. Конечно, пока она не умеет полноценно взаимодействовать с человеком: не сможет передать степлер или скотч.
Представители FB AI Research шутят, что LLM – это попытка выйти в открытый космос на самолёте. Конечно, LLM способен взлететь высоко, но сверхсильным ИИ, который заменит 100% работы человека, он вряд ли станет.
Алекс: А как вообще устроены LLM? Что позволяет им точно отвечать на мои вопросы?
Таня: Большая часть текущих моделей построена на архитектуре «Трансформер», которая появилась в 2017 году.
Она устроена следующим образом. Сверху лежит модель с кучей слоёв. Ей мы скармливаем все тексты 😋. В определённых слоях лежит механизм self-attention. С помощью коэффициентов он определяет, как и насколько какое-либо слово в анализируемом предложении сочетается с другими. Это прорывной, по сравнению с рекуррентными нейросетями, подход к обучению. LLM проходит путь ребёнка по освоению языка: от «кто такой я» и «какие предметы можно назвать синими» до анализа соседних предложений в тексте. Как она получает этот навык? Один из способов – Supervised learning (обучение с «учителем», где в роли учителя – пробы и ошибки).
В этом подходе модель по размеченному контексту может определить нужные слова или по одному предложению предсказать следующее за ним второе. Когда эта конструкция обучилась, в ней образовались эмбеддинги, т.е. математические векторы элементов речи. Если слова в языке связаны, эти векторы будут расположены в модели близко друг к другу. То же самое – с предложениями.
После этого модели с архитектурой «Трансформер» сами генерируют ответ на заданный человеком запрос, а этот ответ размечают живые люди. Их фидбек – критерий, по которому работает ещё одна модель. Её задача – анализ работы первой на основе человеческой обратной связи и генерация еще более успешного ответа
Это позволяет новому поколению нейронок быть такими успешными, и даже достаточно убедительно врать… 😕
Кажется, не существует фундаментальных ограничений в том, что может посчитать компьютер – возможно, не текущее поколение нейронок. Может, он будет долго учиться танцевать балет, но это и не самое важное. Важнее, например, решать задачу уменьшения энтропии. Может, он создаст собственные копии на солнечных батареях на Марсе – в общем, поможет ответить на вопросы, важные в долгосрочной перспективе для жизни в целом (включая искусственную), а не только для человечества – это только один из видов, аномально распространенный сейчас.
Алекс: А насколько современный AI ведёт себя как машина? Может ли нейросеть пройти тест Тьюринга?
Андрей: Может, причём с результатом более 99%. Иногда человек не справляется с этим тестом настолько успешно, насколько AI.

💰 Дорогое удовольствие
Таня: Будущее AI не так безоблачно, есть проблемы с поддержкой их развития. Стоимость оптимизации тех же «Трансформеров» растет вместе с увеличением параметров. На текущий момент число инвестиций в AI только растёт.
До конца этого года в развитие ИИ могут вложить больше 100 миллиардов долларов. При этом общая денежная масса в мире – $ 20-25 трлн. Есть риск, что через определённое число итераций количество денег, вложенных в AI-проекты, приблизится к значению в 10% от общемирового.
Станислав: А может ли быть такое, что весь рынок AI – большой финансовый пузырь, как доткомы? Насколько вероятно, что в будущем один из ключевых игроков введёт пару локальных изменений, обойдясь без глобальных оптимизаций, и заберёт все деньги себе в карман?
Таня: Это очень интересный вопрос. Мы живём в эпоху, когда хэджирвание, т.е. страхование инвестиций в случае сильной просадки, достигло исторического максимума. Поэтому возможна ситуация, при которой OpenAI понесёт убытки, а та же NVIDIA заработает на этом от общих с OpenAI инвесторов. Конечно, хайпа в мире ИИ очень много, и всё же тренд пока восходящий.
Главные бенефициары такого положения – это инвестиционные компании.
Алекс: А можно ли к ним приблизиться? Как перешагнуть порог входа в закрытый клуб AI? И будет ли он таким закрытым? Может, через год уже у каждой крупной компании будет по 2 модели?
Андрей: Тут важно проследить ретроспективу. В 2018 году у Google появился Duplex, ИИ, который мог, судя по рекламе, забронировать столик в ресторане. Это была 2B модель (с 2 млрд параметров), что по нынешним меркам смехотворно мало. Но наличие Google Duplex объясняет, почему у ребят из Маунтин-Вью появилась Gemini с 1,6 трлн параметров.
А теперь посчитаем, насколько это затратно.
Есть несколько уровней.
✨ Lvl 1. Модель по типу gpt 3,5 с 7 млрд параметров. Цена одного только compute’а для неё – $10 млн. В результате ты теряешь много денег и получаешь модель хуже, чем на рынке. Профит? Я бы так не сказал. Дорого? Безусловно! Но это только начало.
⭐ Lvl 2. Сотни миллионов – и welcome to the club buddy! Ты получаешь табурет в комнате, где за большим столом сидят крупные игроки.
Рядом с тобой на табуретках:
🪑 Mistral AI, над которыми в своё время все смеялись: пяти программистам потребовалось $100 млн для своей модели. Но именно столько и было нужно, чтобы всё получилось.
🪑 Яндекс, который, судя по слухам, планирует потратить порядка $500 млн на свою GPT в ближайшие 5 лет.
🌟 Lvl 3. Тот самый большой стол, за которым восседает Microsoft.
Всё предыдущее звучало бы масштабно, если бы мы не обращались к кейсу компании Билла Гейтса. В планах – выделить $100 млрд (!) на OpenAI.
И все эти деньги идут только на обучение (без других расходов, например, на железо).
Так что хочешь быть в топе – готовь кошелёк!
LMM и AI в 2024 году
Алекс: Какие задачи могут решать LMM здесь и сейчас? Стоят ли они этих вложений?
Сергей: AI уже может выполнять скучные рутинные задачи программиста. Например, умный autocomplete c помощью Copilot. По данным исследований этот инструмент улучшает производительность опытных разработчиков на 10-15%, а джунам помогает повышать скорость работы в разы. Но у нас есть страх: не заберёт ли AI самое интересное?
Станислав: У меня есть смешная история про внедрение Copilot и Chat GPT.
Одна аутсорс-компания занималась разработкой, активно используя AI. Ребята добились и ускорения производительности, и роста продаж. Но появилась проблема: когда заказчик приходил с правками или замечал ошибку, разработчики не знали, что делать: Copilot ничего не мог предложить или начинал бредить. Ребятам пришлось нанять сеньоров. Теперь они вычитывают код, который сгенерила AI.
Их найм нивелировал все заработки за те полтора года, в течение которых Copilot «оптимизировал» работу команды 👍
Андрей: История классная, но я бы сделал другой вывод. Да, сегодня мы фиксируем ошибки того же Copilot’а. Но этот фидбек может стать базой для его обучения. Тогда через 5 лет мы получим модель совсем другого уровня.
Сможет ли ИИ написать симфонию, или о будущем и пределах искусственного интеллекта

Андрей: Считается, что предел AI – это человеческие возможности. Думаю, в ближайшие 5-15 лет ИИ может заменить человека в той или иной мере во всех сферах интеллектуального труда. И надо понимать: в человеческой истории такое уже было.
В 90-е, до компьютерной революции, около 50 специалистов требовалось, чтобы выполнить операцию MapReduce с помощью перфокарт. Затем их всех заменило 1 устройство. Эта специальность просуществовала не более 20-30 лет.
Другое дело – творческие профессии. Хотя уже сейчас ИИ может отличить работу Дюшана от простого унитаза лучше, чем среднестатистический человек.
Так что GPT-6 сможет выполнить задачу точнее, быстрее и, вероятно, дешевле, чем человек.
Сергей: Хочу вернуться к истории Станислава про Copilot. При таком раскладе программисты станут в разы больше читать код, чем писать. Ведь пока нет (и вряд ли будет) инструмента, которому можно будет доверить абстрактную задачу, не спускаясь до конкретных функций. Нам, как ответственным copilot-инженерам, придётся проверять всё, что пишется. И чем дальше мы двигаемся, тем больший объём кода предстоит ревьюить.
Я думаю, может возникнуть безвыходная ситуация: объём кода для ревью станет невозможно огромным. При этом мы не будем готовы, чтобы Copilot принимал решение за программиста уровня сеньора. В ситуации недостатка доверия к ИИ и ограниченных ресурсов сеньоров могут настать тёмные времена для этой технологии.
Алекс: А где границы задач, которые решает программист? Может ли весь комплекс его действий быть заменён AI?
Сергей: Я считаю, нет. Ты, как программист, не только выполняешь таски из Jira. Ты, наравне с коллегами, увлечён процессом, понимаешь цели, компетенцию (в той или иной мере) ребят вокруг тебя, осознаёшь мотивы бизнеса и делаешь полезные выводы из разговоров в курилке. Как в нейронку внедрить этот опыт? Может быть, если OpenAI повесит на нас микрофоны и будет записывать всё, что мы говорим, ИИ к этому приблизится, но пока – точно нет: разработчик – слишком омниканальная модель.
Алекс: А кейс с Devin AI? Удачная ли это попытка создать такого разработчика? Скам или не скам?
Андрей: Не скам! Во-первых, их поддержал Андрей Карпаты, сооснователь Open AI. Во-вторых, они не говорили о полной замене разработчика. Ребята заявляли, что Devin сможет выполнить около 14% задач. И всё-таки система имеет довольно примитивные функции.
Если сравнивать живого разработчика с какой-либо программой, то он скорее чат – чат для менеджера: «РазработчикGPT».
Сторона 1: AI заменят программистов в ближайшем будущем
Андрей: И всё-таки, если получится передать GPT все функции сеньора-разработчика, это может сработать, но не в IT, а например, в банковском секторе. Там есть важная должность технического аналитика: он договаривается, переводит, объясняет. Разработчик там – это маленькая шестерёнка в большом механизме. Поэтому комбинация теханалитика с GPT, которая хорошо пишет код, может заработать в банкинге. А затем – и в других сферах.
Итак, мой прогноз: от 20 до 40% программистов заменят AI. Конечно, не в ближайшем будущем, но это вполне вероятно.
Алексей: А откуда мы знаем, что технология сегодняшнего дня продолжит развиваться в том же направлении? Но давайте вспомним, с чего начался бум нейронок? С ImageNet, а затем AlexNet, которые распознавали котиков в картинках 200x200. Это была настоящая революция, которая случилась всего лишь 12 лет назад. Через 3 года AlphaGo заставила всех ходить с выпученными глазами после победы над титулованными игроками. Ещё через 4 года, в 2019, появилась GPT-2, которая уже генерила тексты, хоть и далёкие от совершенства. И сейчас – GPT-4o. Прогресс колоссальный. И тренд не меняется. Поэтому предсказать, что будет завтра и когда наступит сингулярность, невозможно.
Во многом AI схожа с человеком. Давайте тогда сравним её с системами психики, которые выделил Даниэль Канеман. Современные LMM умеют думать и принимать решения быстро, но её результаты поверхностны и всегда ориентированы на свой прошлый опыт – это Система 1, по Канеману. Система 2 думает медленно, действует шаг за шагом, анализируя, критикуя, углубляясь. Это то, что в мире LLM называют агентностью. Говорят, именно она станет главной фишкой GPT-5.
Андрей: Но к агентной системе есть претензии: она работает на всего 90%. Через какое-то количество итераций мы точно получим ошибку. Многие пытаются это решить невероятным количество костылей, например, ребята из FractalGPT. Все эти костыли через несколько лет можно будет изящно поместить в одну модель. Тогда проблема может решиться.
При этом модели не будут понимать архитектуру процессов. Логика LLM такова: «я не знаю, как это работает, но после огромного количества итераций код почему-то начал работать на 20% быстрее». Пусть человек работает эффективнее, но скорость тоже решает. И дальше – только больше.
Алексей: Итак, мой прогноз такой: через 5 лет в IT-отрасли начнутся сокращения. Под него могут попасть и сеньоры. Какими темпами это сокращение будет идти и с чего начнётся, я не знаю, но готов поставить на этот исход бутылку хорошего коньяка!
Сторона 2: AI не заменят программистов в ближайшем будущем
Сергей: Не соглашусь. По крайней мере, это произойдёт не так быстро и не везде. В университете я занимался распознаванием заболеваний по рентгенограммам. Ещё 10 лет назад эта система имела точность, сравнимую с выводами профессиональных докторов. Кто сейчас использует эту технологию? Никто. Да и если AI всё-таки отхватит какую-то часть рынка, то и сам рынок вырастет, и будут нужны люди.
Алекс: Я тоже не со всем согласен: вряд ли AI сможет заменить сеньоров. Я тестировал нейронку на решении сложных олимпиадных задач. Модель тратит не более 30 секунд на поиск медианы в потоке и другие сложные кейсы. Человек решает задачу такого типа около получаса.
Да, перформанс задач, которые, судя по всему, попали в обучающий датасет ИИ, на уровне 95%. Но как только мы берём самые свежие задания, неизбежно драматичное падение результативности до 0.
Конечно, очень хороши AI в решении задач, сформулированных как промпт. Например: «вам дан список слов; найдите самое длинное слово, начинающееся на А». И даже здесь успешность – не 100-процентная. Что уж говорить про роль сеньора на серьёзном проекте.
AI – это выгодно?
Алекс: Предположим, что мы с вами Google. Мы покупаем подписку на тот же Copilot всем своим сотрудникам, ускоряем производительность и тратим сумму денег. А будет ли вообще профит?
Андрей: Всё дело в том, как подойти к обучению. Ты платишь 100 миллиардов и получаешь фундаментальную модель с базовыми знаниями. Но дальше тебе достаточно потратить около 100 тысяч – 1 млн долларов на файнтюн под задачу. В масштабах общих затрат это не так много.
Пример – Llama*, которую дообучили писать SQL: она выдаёт запросы по имеющемуся материалу лучше 95% аналитиков и эффективнее, чем GPT-4.
Когда я занимался созданием Маруси, мы понимали, что ориентируем её на 3-5-летних детей. Им интересно с ней общаться. Мы предполагали, что рост этого поколения будет синхронизировать с ростом технологий: взрослеют дети – совершенствуются модели, на которые мы их подсадили. А получилось, что мы очень быстро скакнули на 10 лет вперёд: сегодняшняя GPT-4 может поддержать разговор с людьми в 16-летнего возраста. А этого юношу уже можно научить программировать. Так что выгода есть и с точки зрения потенциальных кадров, которым, кстати, не нужен обед и сон.
🤌 💸 Невидимая рука GPT, или как AI изменит рынок труда и продаж
Андрей: Мне кажется, GPT имеет высокий потенциал в сфере продаж. Но есть большая проблема – отсутствие трейнсета по Sales для AI. Из-за этого модель пока не заменит продажников, например, в работе с B2B или при запросе «где сходить в баньку».
Может выручить «клонирование специалистов». В «Билайне» был Sales менеджер с коэффициентом удержания клиентов 50%. При этом среднее число – 13%. Этот специалист так и не смог никого обучить. Его бы диалоги скормить нейронке, получилась бы модель-продажник с конверсией по крайней мере в 20%!
Алексей: Есть ещё одна история. Мой товарищ 10 лет был копирайтером, пока случайно не выиграл грин-карту.Зная,, что русские копирайтеры там никому не нужны – стал заниматься ML. По его словам, 90% задач копирайтинга, для которых раньше нужен был человек, сейчас выполняют модели. Потребность рынка есть либо в специалистах топ-уровня, либо у недогадливых компаний. Ситуация с рынком копирайтинга – это упрощенный пример того, через что в будущем придётся пройти программистам.
Таня: Текущий рынок труда – это временная аномалия. Так будет недолго. Например, как только ИИ научится выполнять обязанности Sales менеджера, специалисты в этой области, которые и появились-то не так давно, перестанут существовать как класс. Возникнет другой способ маркетинга.
Алекс: А может, рынка вообще не будет. Останется ИИ, который сам будет производить и потреблять. 😀
Когда люди перестанут писать код? Если Copilot дропнет базу данных, кто несёт ответственность? Появится ли возможность создать свою GPT без вложений? – вопросов остаётся больше, чем ответов.
Сбудутся ли прогнозы наших спикеров? Время покажет. А мы – расскажем! Оставайтесь с нами, чтобы не пропустить обсуждения ключевых тем эпохи ML и нейросетей.
*признана экстремистской организацией, запрещена на территории РФ