Наша команда занимается R&D и бизнес внедрением метрики Cltv (Client Life-Time Value) по клиентам физическим лицам Сбербанка. Мы ищем Data Scientista для работы с моделями последовательностей событий (Transformer, Lstm, Rnn) и c классическим машинным обучением на табличных данных (gradient boosting, Rf), который сможет имплементировать Sota Ml-решения в модели прогнозирования Cltv.
Обязанности
Основные зоны ответственности в рамках направления:
Разработка Ml-моделей для базы 100+ млн розничных клиентов Сбербанка
Создание и тестирование представлений клиентов (embeddings) для использования в моделях
Работа с огромными массивами данных (Spark, Hadoop, GreenPlum)
Разработка подхода по расчету чувствительности прогнозов к изменению входных параметров (эластичность к действиям банка/свойствам клиента)
Взаимодействие с командой внешних R&D исследователей
Поиск, объединение и нормализация данных
Работа с командой Ds-разработчиков, менторство, постановка задач на разработку
Отличные знания в области классического data science / математики / статистики
Опыт работы с BigData (Hadoop, hdfs, pyspark) преимущество
Опыт A/B тестирования преимущество
Понимание принципа работы банковского или финансового бизнеса преимущество
Требования
Отличные знания в области классического data science / математики / статистики
Опыт работы с BigData (Hadoop, hdfs, pyspark) преимущество
Опыт A/B тестирования преимущество
Понимание принципа работы банковского или финансового бизнеса преимущество
Условия
Конкурентную компенсацию
Гибридный график работы при желании (1-2 дня работа из дома) Огромные массивы данных
Дружную команду профессионалов (Мфти, Вшэ, Мгу, Рэш, Сколтех)
Комфортабельный офис недалеко от метро Кутузовская с корпоративным фитнесом
Оформление по Тк Рф
Дмс
Бесплатный спортзал
Бесплатный кофе/печенки на этаже
Возможность развития и участия в Ds/Da сообществе Сбербанка (более 1000 Ds/Da банка)
Требуется junior ds