Более 10 лет работает в области искусственного интеллекта. Успел защитить кандидатскую диссертацию по обработке естественного языка, а также поработать в Яндексе и VK. Сейчас работает в Noah’s Ark Lab — исследовательском подразделении компании Huawei, где занимается вопросно-ответными системами.
Занималась созданием нейросетей BLOOM, mGPT, ruDALL-E и ruGPT3, рейтинга русскоязычных ИИ-систем Russian SuperGLUE и корпуса для машинного обучения Taiga.
Кандидат филологических наук, выпускница МГУ имени М. В. Ломоносова, ФКН и Школы лингвистики НИУ ВШЭ. Автор более 50 научных публикаций в ведущих журналах в области лингвистики и ИИ, с которыми выступала на крупных научных конференциях.
Руководит командой претрейна YandexGPT — семейства больших языковых моделей, которые уже используются в большинстве продуктов Яндекса. Успех внедрений напрямую зависит от того, насколько умной является исходная модель. Задача команды — сделать максимально умную модель, которая будет способна с минимальным дообучением ответить на любой вопрос пользователя.
Пришел в Яндекс разработчиком в 2017 году. Руководил разработкой YandexGPT, сервисами Tune the Ads и Tune the Model. Успел принять участие в разработке Яндекс Телефона, Алисы и быстрых ответов в Поиске.
Большую часть своей карьеры внедряет ML в индустриальные продукты: e-commerce, advertising, fulfillment & delivery.
Развивал и управлял ключевыми ML-продуктами в командах от 5 до 30 человек. За время работы в ML нанял более 40 исследователей и разработчиков. Преподавал и был одним из соавторов курса по дизайну ML-продуктов в Ozon Masters. Увлекается чтением профессиональной и художественной литературы, музыкой и спортом.
Решает задачи, связанные с построением поисковой базы товаров, её обогащением (кластеризацией, атрибутами) и качеством ранжирования товаров. Это помогает сделать поиск Яндекса самым удобным и полным инструментом для выбора товарных предложений.
Занимается улучшением ранжирования в поиске Яндекс Маркета.
Ранее занимался прикладными исследованиями в Yandex Research в области information retrieval, learning-to-rank, gradient boosting.
Окончил МФТИ, работал исследователем в Межведомственном суперкомпьютерном центре РАН, развивал технологии распознавания лиц как ведущий исследователь и разработчик NTechLab. Профессиональные интересы: глубокое обучение, компьютерное зрение, информационный поиск. Собирался исследовать компьютерные сети, а занялся нейронными.
Отвечает в Яндексе за Alignment языковых моделей — путь, который модель проходит от предобученной стадии до состояния безопасной и полезной модели, которая делает то, что ей скажут. Начинал работу в Яндексе с улучшения модуля поддержания диалога в Алисе, а 2.5 года назад участвовал в создании первой версии YaLM, с тех пор занимается её дальнейшей разработкой. Закончил магистратуру по направлению «Анализ данных» в Московском физико-техническом институте. Области профессиональных интересов: DL, NLP и RL.
Руководит проектами в области компьютерного зрения, мультимодальных архитектур. Занимается разработкой и исследованием алгоритмов обнаружения искажений на мультимедийных данных в рамках докторантуры. Среди профессиональных достижений: релиз моделей Kandinsky 2.X, RUDOLPH, GHOST и других; защита диссертации на соискание учёной степени кандидата технических наук.
Имеет более 60 публикаций в крупных научных журналах и сборниках тезисов международных конференций, индексируемых базами Scopus, Web of Science. Любит чтение и автомобильные путешествия. Увлекается настольным теннисом и баскетболом.
Помогает развивать и улучшать CatBoost и другие ML-инструменты, в том числе платформу для трекинга экспериментов и управления жизненным циклом ML-моделей. Снимает на плёнку, коллекционирует виниловые пластинки и увлекается игрой на музыкальных инструментах.
Окончил Санкт-Петербургский государственный университет и Computer Science Center (Санкт-Петербургское отделение ШАД). C 2014 года работает в Яндексе, занимается развитием технологий вокруг машинного обучения, высокопроизводительными вычислениями на GPU. Работал над библиотекой машинного обучения CatBoost, был основным разработчиком GPU-версии библиотеки.
Сейчас отвечает за направление ML-сервисов Yandex Cloud, в частности за технологию облачного синтеза и распознавания речи Yandex SpeechKit.
Выпускник ФМЛ 30 и СПбГУ, защитил научную степень в области информационного поиска. С 2002 года работал в JetBrains, где разрабатывал ядро IntelliJ IDEA. Затем перешел в Яндексе, где отвечал за оценку качества поиска, разрабатывал факторы ранжирования, тренировал формулы релевантности и отвечал за мобильный поиск. После небольшого перерыва снова вернулся в Яндекс — ответственным за машинное обучение в Yandex Cloud (SpeechKit, DataSphere). Сейчас руководит лабораторией облачных технологий Huawei в Санкт-Петербурге. Занимается исследованиями машинного обучения, распределенных вычислений и информационного поиска, пишет статьи и читает лекции в НИУ ВШЭ.
Улучшает рекомендации в Алисе, Поиске, Маркете и Шедевруме. Развивает внутреннюю платформу Яндекса для построения рекомендательных систем. До этого работал в SberDevices, где отвечал за качество поиска. Увлекается музыкой и картингом.
Занимается в Яндексе RnD для рекомендаций. Внедрял трансформеры для персонализации в самые разные сервисы Яндекса: веб-поиск, рекламу, Маркет, Музыку.
Окончил МГУ и ШАД. С 2017 года занимается беспилотными автомобилями в Яндексе, вместе с проектом прошел путь от первых прототипов до запуска сервиса беспилотного такси в московском Ясенево. Руководит разработкой систем прикладного уровня: локализации, восприятия, планирования и управления.
Окончил Санкт-Петербургский государственный университет и Computer Science Center (Санкт-Петербургское отделение ШАД). C 2014 года работает в Яндексе, занимается развитием технологий вокруг машинного обучения, высокопроизводительными вычислениями на GPU. Работал над библиотекой машинного обучения CatBoost, был основным разработчиком GPU-версии библиотеки.
Сейчас отвечает за направление ML-сервисов Yandex Cloud, в частности за технологию облачного синтеза и распознавания речи Yandex SpeechKit.
Работает в отделе исследований Яндекса с 2013 года, руководит им с 2019 года. Основные научные результаты получены в области поиска по большим объемам изображений, в сфере генеративных моделей в компьютерном зрении и нейросетевых моделей для табличных данных. Большинство результатов опубликовано на ведущих мировых конференциях ICML/ICLR/NeurIPS/CVPR/ICCV/ECCV.
Работает в Яндексе последние 12 лет. За это время успела позаниматься разными направлениями исследований, основной фокус сейчас — машинное обучение на графах. Окончила мехмат МГУ, кандидат физико-математических наук. В 2021 году защитила докторскую диссертацию по компьютерным наукам.
Автор более 10 публикаций на ведущих международных конференциях по машинному обучению и обработке естественного языка. Председатель рабочей группы по масштабируемому обучению в международной научной коллаборации BigScience, которая обучила BLOOM — самую большую многоязычную языковую модель в открытом доступе. Создатель курса по эффективным системам глубинного обучения в Школе анализа данных Яндекса и на факультете компьютерных наук Высшей школы экономики.
Занимается развитием базовых технологий компьютерного зрения в Яндексе. Интересуется дискриминативными моделями для анализа изображений.
Выпускник ВМК МГУ и ШАДа. В Яндексе работает с 2015 года, а с 2017 года занимается развитием технологии беспилотного вождения. Сейчас отвечает за нейронные сети для планирования движения беспилотного автомобиля и для предсказания поведения других участников дорожного движения. Читает лекции в курсе по беспилотным автомобилям и ведет семинары в курсе ШАД по глубинному обучению.
Выпускник механико-математического факультета МГУ им М. В. Ломоносова. C 2020 года руководит как научными, так и инженерными исследованиями в области компьютерного зрения, мультимодального обучения и генеративного искусственного интеллекта. Под его руководством в Sber AI были обучены первые русскоязычные text2image трансформерные модели ruDALL-E 1.3B (Malevich) и ruDALL-E 12B (Kandinsky 1.0), диффузионные модели Kandinsky 2.0, 2.1, 2.2, бимодальная мультизадачная модель RUDOLPH, модель GHOST по созданию one-shot дипфейков и модель Digital Пётр по распознаванию рукописного текста Петра I и любого рукописного текста.
Активно публикует результаты научных исследований в журналах и тезисах международных конференций. Сейчас пишет кандидатскую по строго математическим вопросам, которые касаются статистического оценивания f-дивергенций и кластеризации на основе этих оценок.
Развивает бренд машинного обучения Яндекса. До этого занимался ML в Lamoda, Mail.ru и HeadHunter. Преподавал в ВШЭ и МГТУ им. Баумана. Был одним из создателей сообщества ODS. Помогает делать такие конференции как HighLoad, Pycon, DUMP, DataFest.
С 2020 года работает в техпиаре, где помогает компаниям рассказывать о своих успехах так, чтобы разработчики захотели в них работать. ML Brand Manager Яндекс Поиска, ex-DevRel Яндекса по направлениям ML и мобильной разработки. С нуля построила внешнее сообщество ML-специалистов, перезапустила сообщество мобильных разработчиков и подготовила больше 100 спикеров Яндекса к выступлению на отраслевых конференциях. Более 8 лет продюсирует международные фестивали и форумы, в числе TEDxMoscow, выездную Ассамблея ООН (ЮНВТО), Moscow Urban Forum, Российскую креативная неделя. Влюблена в AI и ML.