
Senior data engineer
Чем предстоит заниматься
В Департамент продвинутой аналитики ищем Инженера данных на задачи по созданию и поддержке решений по подготовке больших данных, а так же созданию инструментов обработки больших данных в интересах развития Продвинутой Аналитики в Банке.
- создание и поддержка многоэтапных ETL-процессов загрузки данных в Datalake из IT-систем Банка для применения в моделях;
- создание и поддержка сложных витрин-предагрегатов и витрин с аналитическими признаками (features) на основании требований хабов аналитики;
- создание и поддержка витрин для мониторинга моделей машинного обучения
- создание и контроль работы проверок КД для крититических элементов данных;
- выполнение функций владельца данных по витринам Datalake, созданных для;
Наши пожелания к кандидатам
- Python - уверенное знание структур данных и алгоритмов, эффективное применение принципов ООП и ФП (Функциональное программирование), опыт написания модульных и интеграционных тестов, знание и опыт применения библиотек обработки и анализа данных - numpy, pandas;
- Опыт разработки и внедрения в промышленную эксплуатацию сервисов загрузки и обработки неструктурированных и слабо структурированных данных (текст, xml, json) из внешних источников;
- Способность разобраться с API поставщиков данных, используя доступную документацию;
- SQL - умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности, опыт работы с БД Oracle, Postgres, Greenplum, Cassandra;
- Уверенное знание и опыт работы с инструментами разработки, планирования и мониторинга рабочих процессов (workflow engines) пакетной обработки данных - Airflow/Oozie;
- Опыт разработки сложных, высоконагруженных приложений обработки данных на основе Spark (scala, pyspark), уверенное знание настроек Spark и их влияния на производительность приложений Spark, умение профилировать приложения Spark для оптимизации их производительности;
- Опыт разработки приложений и сервисов потоковой обработки данных (real-time) на основе Kafka, Flink;
- Владеть навыком ориентироваться в коде, написанном другими разработчиками;
- Linux: продвинутые навыки работы с командной строкой. Опционально:
- понимает процессы Data Goverment, Data Quality;
- имеет опыт решения задач с BI-инструментами (PowerBI/Tableau);
Что мы предлагаем
- Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования + квартальная премия по результатам KPI;
- Гибридный формат работы (офис+удаленка), сезонный коворкинг в Сочи;
- Сложные и интересные задачи, современный стек технологий;
- Заботу о вашем здоровье: программа ДМС с первых дней работы, куда входит стоматология, обслуживание в лучших клиниках города, страхование и компенсация 10-ти дней больничного;
- Возможность вертикального и горизонтального карьерного роста: регулярно проходят тренинги, вебинары, митапы и демо-дни;
- Доступ к бесплатным корпоративным библиотекам Alpina Digital, MyBook и бизнес-изданий;
- Предложения от Банка только для сотрудников: собственные спортзалы (Москва, Санкт-Петербург, Екатеринбург), а также скидки на услуги туристических агентств, продукты питания, в рестораны, бары, магазины.
Как с нами связаться
По всем интересующим вопросам обращайтесь к сотруднику отдела по подбору персонала: Пономарева Анастасия Сергеевна
APONOMAREVA7@ALFABANK.RUОткликнуться на вакансию
Расскажите нам о себе и мы обязательно свяжемся с вами