Программа
конференции;

YfD */
09:00

Регистрация и сбор гостей

10:20
GenAI
Дани Эль-Айясс Исполнительный директор, SberDevices

GigaChat: наш опыт обучения LLM

Большие языковые модели (LLM) являются новым этапом развития интеллектуальных систем, решающих задачи на естественном языке. Помимо глубокого понимания структуры языка, LLM также формируют знания о мире во время обучения на больших корпусах текста, что выводит их на новый качественный уровень, открывая новые эмерджентные способности, такие как подходы, основанные на нулевом или крайне мало числе примеров (Few-Shot/Zero-Shot Learning/Prompting) и построение рассуждений (Reasoning).

Но обучение подобных моделей является сложной задачей, требующей большого количества ресурсов и тонкой настройки. В докладе мы хотим поделится нашим опытом обучения модели ruGPT-3.5 — большой языковой модели от Сбера, лежащей в основе генеративного сервиса GigaChat, начиная с предобучения и заканчивая RLHF-пайплайном.

Смотреть

11:05
Hardware
Валерий Ильин Руководитель группы разработки компьютерного зрения и бизнес-процессов на роботе, Яндекс Маркет

Компьютерное зрение в Роботах на складах Маркета

Доклад будет посвящен системам сканирования на базе компьютерного зрения в серии роботов Яндекс Маркета: в роботе Spectro для проведения палетной инвентаризации на складах Маркета и системе для определения положения коробок.

Смотреть

11:50

Перерыв

12:10
Research
Юлий
Шамаев
Data Science Team Lead, Банк ВТБ

Геоэмбеддинги: векторное представление контекста в пространственной аналитике

В задачах пространственной или геоаналитики очень важно правильно учесть окружение исследуемого объекта. Так, например, стоимость объекта недвижимости может зависеть от удалённости от метро, а нагрузка на банкомат будет выше в торговом центре.

Схожая проблематика возникает и в других доменах машинного обучения. Контекст предложения влияет на значение слова в NLP, а взаимное расположение пикселей — на содержание изображения в Computer Vision. В нашем подходе мы используем современную архитектуру трансформера в приложении к геоданным, чтобы получить векторное представление.

Смотреть

13:00

Обед

14:00
NLP
Никита Драгунов Разработчик отдела NLP группы YandexGPT Alignment, Яндекс Поиск

Alignment языковых моделей. Prompt engineering & supervised fine-tuning

Как правило, GPT-подобные языковые модели обучаются в 2 этапа. На первом этапе модель предобучается на обширном корпусе текстов. Считается, что после предобучения модель хранит в себе разнообразные знания об окружающем мире. Однако не все эти знания желательны к использованию. Так, например, модель может увидеть неэтичную информацию, но, вероятнее всего, создателям модели не нужно, чтобы их продукт делился такой информацией с пользователем. Для этого необходим второй этап — alignment (выравнивание) языковой модели под требуемый домен.

В докладе основное внимание уделяется двум техникам выравнивания: prompt engineering и supervised fine-tuning. Рассказывается, как с использованием этих техник сделать модель этичной, привнести в неё персонажность, память и наделить её некоторыми другими полезными свойствами. Доклад основан на опыте работы автора над YandexGPT и генеративной моделью Алисы.

Смотреть

14:45
Research
Сергей Лаврушкин Старший научный сотрудник, Институт ИИ МГУ

Как выбрать метрику в Loss, или Бенчмарк устойчивости современных метрик качества к состязательным атакам

Современные нейросетевые методы оценки качества изображений и видео обходят традиционные метрики по корреляции с визуальными оценками. Однако такие методы также более уязвимы к состязательным атакам, позволяющим искусственно повысить значение метрики путём предобработки изображений или видео без улучшения визуального качества.

Во-первых, пользуясь уязвимостью метрик, разработчики видеокодеков и других алгоритмов обработки могут (и внедряют) такие атаки для накрутки своих результатов в сравнениях. Во-вторых, риск заточиться под неустойчивую метрику есть, даже если вы не ставите такой цели при разработке своего метода и оцениваете его качество одной метрикой или добавляете её в функцию потерь (так называемый непреднамеренный взлом, когда метрика стала выше, а реальное качество — ниже). Вопрос «Что лучше ставить в Loss?» с новыми метриками оказывается намного сложнее, чем хотелось бы.

В докладе будут продемонстрированы результаты сравнения устойчивости 15+ современных методов оценки качества к различным состязательным атакам. Мы расскажем об устройстве нашего бенчмарка, а также выделим наиболее устойчивые к атакам метрики. Бета бенчмарка опубликована в июле по ссылке.

Смотреть

15:30
NLP
Даниил Водолазский Руководитель направления по исследованию данных, SberDevices

Мультимодальные генеративные модели для обработки документов

DocVQA (Document Visual Question Answering) — это подход, который позволяет разработать универсальную модель для извлечения информации из любых документов — от договоров до чеков и презентаций.

Традиционные решения ограничены текстовыми данными и экстрактивными архитектурами. Они не могут ответить, например, в каком углу страницы расположена подпись. В то же время генеративные языковые модели, способные воспринимать текст, геометрию и изображение, справляются с такими задачами.

В докладе я поделюсь опытом создания модели ruUDOP: как готовили данные, проводили эксперименты, строили вопросно-ответную систему для сервиса SberIDP Query и какие преимущества получили от мультимодальности.

Смотреть

16:15

Перерыв

16:40
MLOps
Александр Сахнов Head of DA/DS, управление мультивариативного анализа, X5 Tech

Модельный риск: подход к централизованному управлению и мониторингу моделей машинного обучения в X5

В докладе рассматривается система мониторинга модельного риска в X5, предназначенная для оценки, мониторинга и управления рисками, связанными с моделями машинного обучения. Мы обсудим методы актуализации, информирования и внедрение централизованной системы управления для регистрации и отслеживания всех моделей в компании.

Поделюсь кейсами, где контроль модельного риска помог предотвратить финансовые потери, и покажу, как наш опыт может быть адаптирован и применён в различных компаниях.

Доклад нацелен на специалистов машинного обучения, Data Scientist, ML-инженеров, а также product- и project-менеджеров в сфере DS.

Смотреть

17:25
NLP, RecSys
Дмитрий Меркушов Руководитель Машинного Обучения Почты и Антиспама, Mail.ru
Дмитрий Калашников Программист-исследователь команды ML-Продукта в Почте, Mail.ru

Как адаптировать технологию под много NLP‑задач разом. Дважды

Важным свойством ML-решений является универсальность, которая заключается в возможности переиспользовать эти решения в разных задачах. В рамках доклада мы расскажем, как, делая упор на универсальность, мы в Почте Mail.ru пришли к двум важным NLP-механикам: качественным текстовым представлениям и быстрым контентным кластерам.

Доклад будет состоять из двух частей. В первой мы поделимся историей создания текстовых эмбедингов и расскажем, какими свойствами должна обладать модель, чтобы качественно решать сразу все задачи. Во второй будет показано, как универсальные представления помогли нам решить задачу онлайн-кластеризации в парадигме semantic hashing, и как это повлияло на жизнь Антиспама.

Смотреть

18:10
Ecomm
Иван Максимов ML Team Lead, Яндекс Лавка

Путь прогноза спроса в Яндекс Лавке: от бейзлайна до Time2Boost

Прогноз спроса — классическая задача, но мало кто умеет её хорошо решать в продакшене. На Kaggle можно подсмотреть блендинг моделей с 200+ фичами, а в статьях из индустрии — скорее, общий подход без деталей. Я же расскажу, как пошагово строился прогноз спроса в Лавке. От определения метрик качества и первого бейзлайна до специфичной схемы бустинга над временными рядами — Time2Boost. Не пропустим и то, как больно бьёт feedback loop, какие из фич сработали и где можно применить маленькие трюки, ускоряющие код в 4–5 раз.

Смотреть

19:00

Закрытие

19:15

Афтерпати и нетворкинг

09:00

Регистрация и сбор гостей

10:00
Алексей Гусаков Руководитель управления машинного интеллекта и исследований, Яндекс
Дмитрий Масюк Директор бизнес-группы Поиска и рекламных технологий, Яндекс

Keynote

«Под капотом YandexGPT»

«LLM-модели: от технологии к массовому продукту»

10:40

Перерыв

11:00
GenAI
Светлана Маргасова Разработчик отдела NLP группы YandexGPT Alignment, Яндекс Поиск
Александр Кайгородов Разработчик отдела NLP группы YandexGPT Alignment, Яндекс Поиск

Генеративные модели и внешняя информация

Современные генеративные модели способы галлюцинировать и путать факты. Одно из решений этих проблем — использовать доступ к внешней информации, опираясь на которую, мы можем выполнять как обусловленную генерацию (Retrieval Augmented Generation), так и фактологическую оценку имеющихся генераций (Fact-Check). В докладе обсудим опыт работы с такими пайплайнами в Яндексе.

Смотреть

11:45
CV
Денис Димитров Исполнительный директор по исследованию данных в Sber AI, научный консультант в Институте искусственного интеллекта AIRI

Kandinsky: развитие моделей генерации изображений и видео по тексту

Последние несколько лет без преувеличения можно назвать расцветом генеративных моделей, при этом работающих с самими разными модальностями. Доклад будет посвящен одним из самых трудоемких и сложных задач этого направления — задачам синтеза изображений и видео по текстам на естественном языке и основным подходам к их решению.

В первой части доклада обсудим задачу генерации изображений (в основном условной генерации по тексту). Остановимся на истории задачи, подробно обсудим основные методы и архитектуры для её решения, на каких данных такие архитектуры обычно учатся, поговорим о метриках для оценки качества генераций. Также поговорим о развитии моделей Kandinsky: от трансформерных архитектур (Malevich, Kandinsky 1.0) до диффузионных (Kandinsky 2.X и 3.X). Поговорим про ключевые результаты последних релизов моделей Kandinsky 2.1 и 2.2, обсудим планы развития линейки моделей Kandinsky.

Во второй части доклада затронем задачу генерации видео по текстовому описанию (причем обсудим как создание различных видов анимации, так и end-to-end генерацию полноценных видеороликов по тексту), основные трудности обучения моделей и способы оценки их качества. Немного поговорим и о нашей новой модели генерации видео: Video-Kandinsky.

Смотреть

12:30

Обед

13:30
Ecomm
Александр Воронцов Руководитель группы машинного обучения рекламной платформы, Яндекс Маркет

Как устроены механизмы CPA продвижения на поиске Маркета

Для каждого продавца товаров на маркетплейсе ключевым фактором успеха является получение максимального трафика в поисковой выдаче. Расскажем, как устроено продвижение в поиске Яндекс Маркета, рассмотрим классический tradeoff «качество — покрытие» и покажем, как выглядит размен продуктовых метрик при внедрении в продакшен новых факторов.

Смотреть

14:15
RecSys
Андрей Зимовнов ML директор, Дзен

Переосмысление item2item-рекомендаций в Дзене

Item2item — классика коллаборативной фильтрации, однако на разреженных данных это очень слабый бейзлайн. Мы вдохновились классикой и придумали уникальный масштабируемый и гибкий алгоритм построения item2item-рекомендаций. В докладе поговорим о постановке ML-задачи, о том, как из этого сделать высоконагруженный сервис, и о последних наших достижениях в рамках этого фреймворка.

Смотреть

15:00
MLOps
Алексей Морозов Руководитель группы модернизации нейронных сетей, Яндекс Рекламные технологии

Zero-cost fault tolerance в распределённом глубоком обучении

Поделимся опытом, как можно полностью инкапсулировать от ML’щика и исследователя заботу о fault tolerance, распределённой транзакционной записи в storage, асинхронности и минимизации простоев GPU. Дать возможность пользователю автоматически масштабироваться и вообще не думать об инфраструктурных вопросах.

Смотреть

15:45

Перерыв

16:10
CV
Евгений Сидоров Head of AI, Third Opinion

Multi-view pathology detection on medical images

Принятие решений на основе множественных проекций — распространённая практика в анализе медицинских снимков, позволяющая компенсировать недостаток трёхмерной информации. В рамках доклада поговорим о том, как создать SOTA-архитектуру end-to-end-анализа нескольких изображений, используя схожий опыт в беспилотных автомобилях.

Смотреть

16:55
MLOps
Артём
Гойлик
Разработчик системы распределённых вычислений ʎzy платформы DataSphere, Yandex Cloud
Владислав Волох Разработчик платформы MLOps, Yandex Cloud

Удаленное исполнение кода в ML: подходы и инструменты

Поделимся вариантами сбора окружения для удаленного исполнения, рассмотрим их плюсы и минусы. Расскажем про то, какие бывают модули в Python и как их можно собирать, а также про наши разработки, позволяющие упростить работу с обучением ML моделей

Смотреть

17:40
Ecomm
Александр Ледовский Руководитель команды DS и аналитики в монетизации, Авито

Рекламные аукционы и автобиддинг в продуктах продвижения Авито

В конце 2022 года мы внедрили в продукты продвижения скрытый VCG-аукцион для топовых позиций в поиске. В выступлении расскажу, как архитектурно работает система и какие в ней есть компоненты, как мы реализовали автобиддинг, и поделюсь инсайтами, какие идеи показали себя хорошо, а какие плохо.

Смотреть

19:00

Закрытие

19:15

Афтерпати и нетворкинг

Программа мастер-классов будет доступна только для офлайн участников конференции
11:45
Дмитрий Рыбалко Консультант Data Science, Yandex Cloud
Дмитрий Сошников Доцент МАИ / НИУ ВШЭ, технический руководитель лаборатории генеративного ИИ Школы дизайна НИУ ВШЭ, консультант Yandex Cloud

Голосовой чат-бот на базе YandexGPT и других ML-сервисов Yandex Cloud

На мастер-классе расскажем и покажем на практике, как с помощью технологий машинного обучения Yandex Cloud создавать чат-бота для решения любых задач. Поделимся возможностями сервисов распознавания и синтеза речи Yandex SpeechKit и перевода Yandex Translate, а также среды для ML-разработчиков Yandex DataSphere. У участников мастер-класса будет уникальная возможность протестировать работу технологии YandexGPT, находящейся в стадии приватного тестирования.

Запасайтесь ноутбуком и приходите, будет интересно! Ссылка на регистрацию, количество мест ограничено.

Смотреть

13:15

Обед

14:00
CV
Елизавета Петрова ML Engineer RnD CV

Deaf lives matter: распознавание русского жестового языка

Прогресс в развитии сервисов перевода позволяет нам общаться с людьми с другого конца планеты, но не помогает в общении с теми, кто живет совсем рядом — с глухими и слабослышащими людьми в России. Узнайте, чем РЖЯ (русский жестовый язык) отличается от простого русского языка, в чем сложности перевода с одного языка на другой и зачем по телевизору показывают сурдоперевод, если есть субтитры. Мы расскажем о проблемах и особенностях русского жестового языка и как мы решаем эту задачу в нашей команде. В качестве бонуса выкладываем первый открытый датасет РЖЯ, что поможет ускорить реализацию AI-сервисов распознавания и генерации РЖЯ в бизнесе и социальной сфере!

Смотреть

14:45
MLOps
Роза Айсина MLOps Engineer, SberMarket

Как не надо сёрвить модели со Spark Streaming

Сейчас ML модели — это уже не просто предрассчитанные датасеты с предсказаниями, а полноценные веб-сервисы — с метриками, мониторингами и хайлоадом. А теперь представьте, что у вас не одна модель, а сотни! Как можно унифицировать выкатку и эксплуатацию таких моделей? За это отвечает MLOps практика Model Serving. В своем мастер-классе я расскажу, как можно построить высоконагруженный сёрвинг моделей с нуля с упором на практическую реализацию — тестирование Spark Structured Streaming в Scala и работы с Kafka в Python в условиях высокой нагрузки и низкого latency. Мы пройдемся от идеи до постепенного усложнения архитектуры сервиса потоковой обработки в режиме request/response. Будет много деталей работы со Spark, а также историй с расследованиями «бутылочных горлышек»!

Смотреть

15:30
Ecomm
Никита Лалиев Эксперт Flexitech.ai

Атрибуция более чем 100 млн товаров технологиями ML без обучения модели: кейс крупнейшего китайского маркетплейса

Наш клиент, крупный маркетплейс товаров из Китая, определил «цвет», как один из самых важных атрибутов на сайте, именно этот параметр встречается в 23 категориях из 30.

Однако в нашем случае, фильтрация товаров по цвету является сложной задачей, потому что, карточки товаров заполняют не представители маркетплейса, а продавцы конкретных товаров.

Предварительная оценка показала, что только в 31% товаров цвет был заполнен одним из корректных значений. Кроме того, товаров очень много — более 100 млн.

Фишкой данного решения является минимальное использование обучающих данных для достижения высокой точности в классификации изображений. В докладе мы подробно расскажем про технологию CLIP (Contrastive Language-Image Pretraining), которая предназначена для zero-shot и one-shot обучения, заходите!

Смотреть

Место проведения;

Москва, Loft Hall 4,
2-ой Кожуховский пр., 29к6
Wed Sep 06 2023 14:10:32 GMT+0300 (Moscow Standard Time)