Центр компетенций по подготовке данных для машинного обучения
Оказывает внутренний сервис командам Банка по разметке данных. Помогает получить качественные датасеты для дальнейшего использования в машинном обучении.
Обязанности
- Выстраивание pipeline по сбору и обработки данных
- Создание новых алгоритмов для работы с данными и их автоматизация
- Проектирование и разработка Etl-потоки данных, перемещение и хранение информационных массивов
- Организация поставки данных, настройки, интеграции и создания витрин данных
- Написание скриптов и запросов в различные источники данных
Требования
- Опыт создания Etl процессов
- Python для анализа и преобразования(pandas, numpy)
- Sql( уверенное владение, написание сложных запросов, оптимизация запросов)
- Опыт обработки объемных файлов (json, csv)
- Работа с Api
Будет плюсом:
- Pyspark, Hadoop
- Знаете JavaScript
- Понимание технологии и процесса разметки данных для Ml
Условия
- Ипотека выгоднее на 4% для каждого сотрудника и льготные условия кредитования;
- Бесплатная подписка СберПрайм+;
- Скидки на продукты компаний-партнеров;
- Дмс с первого дня и льготное страхование для близких;
- Корпоративная пенсионная программа;
- Обучение за счет Компании: онлайн курсы в Виртуальной школе Сбера и неограниченный доступ к библиотеке, обучение в Корпоративном университете, Тренинги, митапы и возможность получить новую квалификацию;
- Крупнейшее Ds&Ai community - более 600 Ds банка, включая: регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих Вузов и экспертов технологических компаний, дайджест о самых последних разработках в области Ds&Ai и отчеты с крупнейших конференций мира, регулярные внутренние митапы.
Требуется etl разработчик
Web-разработчик, web-программист, инженер-разработчик, программист python, разработчик golang, разработчик, web-developer, программист, developer python, developer