Блог UnionVK

Заменит ли AI айтишников? О карьере и перспективных направлениях индустрии

Куда двигаться, чтобы искусственный интеллект не заменил тебя на рабочем месте? Стоит ли уже сейчас переквалифицироваться или риски не так высоки? Может ли уже сейчас AI выполнять функции разработчика? Обсудила ✨звёздная команда ✨участников круглого стола.

Модератор: Алекс Светкин, Technical Program Manager в Yandex.Ads, экс-VK

Спикеры:

Таня Савельева, Forbes 30/30, consultant, экс-CEO EVAAI, Yandex.SupportAI (TG-канал Тани).

Александр Грановский, Yandex, руководитель dev-отдела, экс-FB*, экс-VK

Станислав Гуменюк, рукводитель команд разработки Островок! / ex-VK / ex-Semrush

Сергей Дуканов, CTO стартапа в области AI dubbing. Опыт в VoiceTech 5 лет

Андрей Мурашев, Head of AI Airs.ai, ex-Staff ML инженер в Meta*,

Алексей Воропаев, руководитель исследовательской группы в SberAutoTech

UnionVK

Материал подготовлен на основе онлайн-встречи UnionVK, сообщества текущих и бывших сотрудников группы компаний VK. Присоединяйся к комьюнити, если тоже являешься выпускником группы VK :) А полную запись встречи можно посмотреть по ссылке на нашем YouTube канале.

AI – это что вообще такое?

Алекс: Мы так часто о нём говорим, но давайте определим границы этого понятия.

Алексей: Искусственный интеллект – это базворд., С момента появления термина им называли всё самое передовое, чем пытались заменить человека в каком-либо аспекте его жизни. От самоходной тележки да Винчи до современных нейронок.

Таня: ИИ – это система правил и алгоритмов, которая умеет принимать решения. Но ИИ ≠ ML: искусственный интеллект не всегда самообучаем. Мне кажется, важно ответить и на другой вопрос: зачем ИИ нам нужен? Мой ответ – не для замены человека, а для того, чтобы делать различные операции на несколько порядков эффективнее. Ведь у ИИ есть два преимущества перед человеком: большой массив данных и огромные вычислительные мощности.

Алекс: Мне кажется, ИИ – это не про любую автоматизацию, а про случаи, когда машина заменяет своей деятельностью человеческое интеллектуальное усилие. В этом его цель.

Про LLM

Алекс: Отдельно хочется поговорить про LLM. Какие возможности и перспективы у них есть?

Андрей: Главная задача LLM – предсказывать следующее слово по имеющемуся контексту. Звучит просто. Однако чтобы это сделать корректно, нейронке нужно иметь представление о мире. Ближе всего к фигуре стандартного офисного работника с такими представлениями сейчас подошла GPT-4o, с видео и аудио. Конечно, пока она не умеет полноценно взаимодействовать с человеком: не сможет передать степлер или скотч.

Представители FB AI Research шутят, что LLM – это попытка выйти в открытый космос на самолёте. Конечно, LLM способен взлететь высоко, но сверхсильным ИИ, который заменит 100% работы человека, он вряд ли станет.

Алекс: А как вообще устроены LLM? Что позволяет им точно отвечать на мои вопросы?

Таня: Большая часть текущих моделей построена на архитектуре «Трансформер», которая появилась в 2017 году.

Она устроена следующим образом. Сверху лежит модель с кучей слоёв. Ей мы скармливаем все тексты 😋. В определённых слоях лежит механизм self-attention. С помощью коэффициентов он определяет, как и насколько какое-либо слово в анализируемом предложении сочетается с другими. Это прорывной, по сравнению с рекуррентными нейросетями, подход к обучению. LLM проходит путь ребёнка по освоению языка: от «кто такой я» и «какие предметы можно назвать синими» до анализа соседних предложений в тексте. Как она получает этот навык? Один из способов – Supervised learning (обучение с «учителем», где в роли учителя – пробы и ошибки).

В этом подходе модель по размеченному контексту может определить нужные слова или по одному предложению предсказать следующее за ним второе. Когда эта конструкция обучилась, в ней образовались эмбеддинги, т.е. математические векторы элементов речи. Если слова в языке связаны, эти векторы будут расположены в модели близко друг к другу. То же самое – с предложениями.

После этого модели с архитектурой «Трансформер» сами генерируют ответ на заданный человеком запрос, а этот ответ размечают живые люди. Их фидбек – критерий, по которому работает ещё одна модель. Её задача – анализ работы первой на основе человеческой обратной связи и генерация еще более успешного ответа

Это позволяет новому поколению нейронок быть такими успешными, и даже достаточно убедительно врать… 😕

Кажется, не существует фундаментальных ограничений в том, что может посчитать компьютер – возможно, не текущее поколение нейронок. Может, он будет долго учиться танцевать балет, но это и не самое важное. Важнее, например, решать задачу уменьшения энтропии. Может, он создаст собственные копии на солнечных батареях на Марсе – в общем, поможет ответить на вопросы, важные в долгосрочной перспективе для жизни в целом (включая искусственную), а не только для человечества – это только один из видов, аномально распространенный сейчас.

Алекс: А насколько современный AI ведёт себя как машина? Может ли нейросеть пройти тест Тьюринга?

Андрей: Может, причём с результатом более 99%. Иногда человек не справляется с этим тестом настолько успешно, насколько AI.

💰 Дорогое удовольствие

Таня: Будущее AI не так безоблачно, есть проблемы с поддержкой их развития. Стоимость оптимизации тех же «Трансформеров» растет вместе с увеличением параметров. На текущий момент число инвестиций в AI только растёт.

До конца этого года в развитие ИИ могут вложить больше 100 миллиардов долларов. При этом общая денежная масса в мире – $ 20-25 трлн. Есть риск, что через определённое число итераций количество денег, вложенных в AI-проекты, приблизится к значению в 10% от общемирового.

Станислав: А может ли быть такое, что весь рынок AI – большой финансовый пузырь, как доткомы? Насколько вероятно, что в будущем один из ключевых игроков введёт пару локальных изменений, обойдясь без глобальных оптимизаций, и заберёт все деньги себе в карман?

Таня: Это очень интересный вопрос. Мы живём в эпоху, когда хэджирвание, т.е. страхование инвестиций в случае сильной просадки, достигло исторического максимума. Поэтому возможна ситуация, при которой OpenAI понесёт убытки, а та же NVIDIA заработает на этом от общих с OpenAI инвесторов. Конечно, хайпа в мире ИИ очень много, и всё же тренд пока восходящий.

Главные бенефициары такого положения – это инвестиционные компании.

Алекс: А можно ли к ним приблизиться? Как перешагнуть порог входа в закрытый клуб AI? И будет ли он таким закрытым? Может, через год уже у каждой крупной компании будет по 2 модели?

Андрей: Тут важно проследить ретроспективу. В 2018 году у Google появился Duplex, ИИ, который мог, судя по рекламе, забронировать столик в ресторане. Это была 2B модель (с 2 млрд параметров), что по нынешним меркам смехотворно мало. Но наличие Google Duplex объясняет, почему у ребят из Маунтин-Вью появилась Gemini с 1,6 трлн параметров.

А теперь посчитаем, насколько это затратно.

Есть несколько уровней.

✨ Lvl 1. Модель по типу gpt 3,5 с 7 млрд параметров. Цена одного только compute’а для неё – $10 млн. В результате ты теряешь много денег и получаешь модель хуже, чем на рынке. Профит? Я бы так не сказал. Дорого? Безусловно! Но это только начало.

⭐ Lvl 2. Сотни миллионов – и welcome to the club buddy! Ты получаешь табурет в комнате, где за большим столом сидят крупные игроки.

Рядом с тобой на табуретках:

🪑 Mistral AI, над которыми в своё время все смеялись: пяти программистам потребовалось $100 млн для своей модели. Но именно столько и было нужно, чтобы всё получилось.

🪑 Яндекс, который, судя по слухам, планирует потратить порядка $500 млн на свою GPT в ближайшие 5 лет.

🌟 Lvl 3. Тот самый большой стол, за которым восседает Microsoft.

Всё предыдущее звучало бы масштабно, если бы мы не обращались к кейсу компании Билла Гейтса. В планах – выделить $100 млрд (!) на OpenAI.

И все эти деньги идут только на обучение (без других расходов, например, на железо).

Так что хочешь быть в топе – готовь кошелёк!

LMM и AI в 2024 году

Алекс: Какие задачи могут решать LMM здесь и сейчас? Стоят ли они этих вложений?

Сергей: AI уже может выполнять скучные рутинные задачи программиста. Например, умный autocomplete c помощью Copilot. По данным исследований этот инструмент улучшает производительность опытных разработчиков на 10-15%, а джунам помогает повышать скорость работы в разы. Но у нас есть страх: не заберёт ли AI самое интересное?

Станислав: У меня есть смешная история про внедрение Copilot и Chat GPT.

Одна аутсорс-компания занималась разработкой, активно используя AI. Ребята добились и ускорения производительности, и роста продаж. Но появилась проблема: когда заказчик приходил с правками или замечал ошибку, разработчики не знали, что делать: Copilot ничего не мог предложить или начинал бредить. Ребятам пришлось нанять сеньоров. Теперь они вычитывают код, который сгенерила AI.

Их найм нивелировал все заработки за те полтора года, в течение которых Copilot «оптимизировал» работу команды 👍

Андрей: История классная, но я бы сделал другой вывод. Да, сегодня мы фиксируем ошибки того же Copilot’а. Но этот фидбек может стать базой для его обучения. Тогда через 5 лет мы получим модель совсем другого уровня.

Сможет ли ИИ написать симфонию, или о будущем и пределах искусственного интеллекта

Андрей: Считается, что предел AI – это человеческие возможности. Думаю, в ближайшие 5-15 лет ИИ может заменить человека в той или иной мере во всех сферах интеллектуального труда. И надо понимать: в человеческой истории такое уже было.

В 90-е, до компьютерной революции, около 50 специалистов требовалось, чтобы выполнить операцию MapReduce с помощью перфокарт. Затем их всех заменило 1 устройство. Эта специальность просуществовала не более 20-30 лет.

Другое дело – творческие профессии. Хотя уже сейчас ИИ может отличить работу Дюшана от простого унитаза лучше, чем среднестатистический человек.

Так что GPT-6 сможет выполнить задачу точнее, быстрее и, вероятно, дешевле, чем человек.

Сергей: Хочу вернуться к истории Станислава про Copilot. При таком раскладе программисты станут в разы больше читать код, чем писать. Ведь пока нет (и вряд ли будет) инструмента, которому можно будет доверить абстрактную задачу, не спускаясь до конкретных функций. Нам, как ответственным copilot-инженерам, придётся проверять всё, что пишется. И чем дальше мы двигаемся, тем больший объём кода предстоит ревьюить.

Я думаю, может возникнуть безвыходная ситуация: объём кода для ревью станет невозможно огромным. При этом мы не будем готовы, чтобы Copilot принимал решение за программиста уровня сеньора. В ситуации недостатка доверия к ИИ и ограниченных ресурсов сеньоров могут настать тёмные времена для этой технологии.

Алекс: А где границы задач, которые решает программист? Может ли весь комплекс его действий быть заменён AI?

Сергей: Я считаю, нет. Ты, как программист, не только выполняешь таски из Jira. Ты, наравне с коллегами, увлечён процессом, понимаешь цели, компетенцию (в той или иной мере) ребят вокруг тебя, осознаёшь мотивы бизнеса и делаешь полезные выводы из разговоров в курилке. Как в нейронку внедрить этот опыт? Может быть, если OpenAI повесит на нас микрофоны и будет записывать всё, что мы говорим, ИИ к этому приблизится, но пока – точно нет: разработчик – слишком омниканальная модель.

Алекс: А кейс с Devin AI? Удачная ли это попытка создать такого разработчика? Скам или не скам?

Андрей: Не скам! Во-первых, их поддержал Андрей Карпаты, сооснователь Open AI. Во-вторых, они не говорили о полной замене разработчика. Ребята заявляли, что Devin сможет выполнить около 14% задач. И всё-таки система имеет довольно примитивные функции.

Если сравнивать живого разработчика с какой-либо программой, то он скорее чат – чат для менеджера: «РазработчикGPT».

Сторона 1: AI заменят программистов в ближайшем будущем

Андрей: И всё-таки, если получится передать GPT все функции сеньора-разработчика, это может сработать, но не в IT, а например, в банковском секторе. Там есть важная должность технического аналитика: он договаривается, переводит, объясняет. Разработчик там – это маленькая шестерёнка в большом механизме. Поэтому комбинация теханалитика с GPT, которая хорошо пишет код, может заработать в банкинге. А затем – и в других сферах.

Итак, мой прогноз: от 20 до 40% программистов заменят AI. Конечно, не в ближайшем будущем, но это вполне вероятно.

Алексей: А откуда мы знаем, что технология сегодняшнего дня продолжит развиваться в том же направлении? Но давайте вспомним, с чего начался бум нейронок? С ImageNet, а затем AlexNet, которые распознавали котиков в картинках 200x200. Это была настоящая революция, которая случилась всего лишь 12 лет назад. Через 3 года AlphaGo заставила всех ходить с выпученными глазами после победы над титулованными игроками. Ещё через 4 года, в 2019, появилась GPT-2, которая уже генерила тексты, хоть и далёкие от совершенства. И сейчас – GPT-4o. Прогресс колоссальный. И тренд не меняется. Поэтому предсказать, что будет завтра и когда наступит сингулярность, невозможно.

Во многом AI схожа с человеком. Давайте тогда сравним её с системами психики, которые выделил Даниэль Канеман. Современные LMM умеют думать и принимать решения быстро, но её результаты поверхностны и всегда ориентированы на свой прошлый опыт – это Система 1, по Канеману. Система 2 думает медленно, действует шаг за шагом, анализируя, критикуя, углубляясь. Это то, что в мире LLM называют агентностью. Говорят, именно она станет главной фишкой GPT-5.

Андрей: Но к агентной системе есть претензии: она работает на всего 90%. Через какое-то количество итераций мы точно получим ошибку. Многие пытаются это решить невероятным количество костылей, например, ребята из FractalGPT. Все эти костыли через несколько лет можно будет изящно поместить в одну модель. Тогда проблема может решиться.

При этом модели не будут понимать архитектуру процессов. Логика LLM такова: «я не знаю, как это работает, но после огромного количества итераций код почему-то начал работать на 20% быстрее». Пусть человек работает эффективнее, но скорость тоже решает. И дальше – только больше.

Алексей: Итак, мой прогноз такой: через 5 лет в IT-отрасли начнутся сокращения. Под него могут попасть и сеньоры. Какими темпами это сокращение будет идти и с чего начнётся, я не знаю, но готов поставить на этот исход бутылку хорошего коньяка!

Сторона 2: AI не заменят программистов в ближайшем будущем

Сергей: Не соглашусь. По крайней мере, это произойдёт не так быстро и не везде. В университете я занимался распознаванием заболеваний по рентгенограммам. Ещё 10 лет назад эта система имела точность, сравнимую с выводами профессиональных докторов. Кто сейчас использует эту технологию? Никто. Да и если AI всё-таки отхватит какую-то часть рынка, то и сам рынок вырастет, и будут нужны люди.

Алекс: Я тоже не со всем согласен: вряд ли AI сможет заменить сеньоров. Я тестировал нейронку на решении сложных олимпиадных задач. Модель тратит не более 30 секунд на поиск медианы в потоке и другие сложные кейсы. Человек решает задачу такого типа около получаса.

Да, перформанс задач, которые, судя по всему, попали в обучающий датасет ИИ, на уровне 95%. Но как только мы берём самые свежие задания, неизбежно драматичное падение результативности до 0.

Конечно, очень хороши AI в решении задач, сформулированных как промпт. Например: «вам дан список слов; найдите самое длинное слово, начинающееся на А». И даже здесь успешность – не 100-процентная. Что уж говорить про роль сеньора на серьёзном проекте.

AI – это выгодно?

Алекс: Предположим, что мы с вами Google. Мы покупаем подписку на тот же Copilot всем своим сотрудникам, ускоряем производительность и тратим сумму денег. А будет ли вообще профит?

Андрей: Всё дело в том, как подойти к обучению. Ты платишь 100 миллиардов и получаешь фундаментальную модель с базовыми знаниями. Но дальше тебе достаточно потратить около 100 тысяч – 1 млн долларов на файнтюн под задачу. В масштабах общих затрат это не так много.

Пример – Llama*, которую дообучили писать SQL: она выдаёт запросы по имеющемуся материалу лучше 95% аналитиков и эффективнее, чем GPT-4.

Когда я занимался созданием Маруси, мы понимали, что ориентируем её на 3-5-летних детей. Им интересно с ней общаться. Мы предполагали, что рост этого поколения будет синхронизировать с ростом технологий: взрослеют дети – совершенствуются модели, на которые мы их подсадили. А получилось, что мы очень быстро скакнули на 10 лет вперёд: сегодняшняя GPT-4 может поддержать разговор с людьми в 16-летнего возраста. А этого юношу уже можно научить программировать. Так что выгода есть и с точки зрения потенциальных кадров, которым, кстати, не нужен обед и сон.

🤌 💸 Невидимая рука GPT, или как AI изменит рынок труда и продаж

Андрей: Мне кажется, GPT имеет высокий потенциал в сфере продаж. Но есть большая проблема – отсутствие трейнсета по Sales для AI. Из-за этого модель пока не заменит продажников, например, в работе с B2B или при запросе «где сходить в баньку».

Может выручить «клонирование специалистов». В «Билайне» был Sales менеджер с коэффициентом удержания клиентов 50%. При этом среднее число – 13%. Этот специалист так и не смог никого обучить. Его бы диалоги скормить нейронке, получилась бы модель-продажник с конверсией по крайней мере в 20%!

Алексей: Есть ещё одна история. Мой товарищ 10 лет был копирайтером, пока случайно не выиграл грин-карту.Зная,, что русские копирайтеры там никому не нужны – стал заниматься ML. По его словам, 90% задач копирайтинга, для которых раньше нужен был человек, сейчас выполняют модели. Потребность рынка есть либо в специалистах топ-уровня, либо у недогадливых компаний. Ситуация с рынком копирайтинга – это упрощенный пример того, через что в будущем придётся пройти программистам.

Таня: Текущий рынок труда – это временная аномалия. Так будет недолго. Например, как только ИИ научится выполнять обязанности Sales менеджера, специалисты в этой области, которые и появились-то не так давно, перестанут существовать как класс. Возникнет другой способ маркетинга.

Алекс: А может, рынка вообще не будет. Останется ИИ, который сам будет производить и потреблять. 😀

Когда люди перестанут писать код? Если Copilot дропнет базу данных, кто несёт ответственность? Появится ли возможность создать свою GPT без вложений? – вопросов остаётся больше, чем ответов.

Сбудутся ли прогнозы наших спикеров? Время покажет. А мы – расскажем! Оставайтесь с нами, чтобы не пропустить обсуждения ключевых тем эпохи ML и нейросетей.

*признана экстремистской организацией, запрещена на территории РФ

Читай далее

Инженерная культура Microsoft

Карьера в Product менеджменте

"Привет, Сири!" Как оценить качество работы голосовых помощников?

2024-05-21 11:57 Карьера ML/AI