Ваш город ?

Senior data engineer

  • Data Science
  • Москва
  • 1-5 лет
Чем предстоит заниматься
В Департамент продвинутой аналитики ищем Инженера данных на задачи по созданию и поддержке решений по подготовке больших данных, а так же созданию инструментов обработки больших данных в интересах развития Продвинутой Аналитики в Банке.
  • создание и поддержка многоэтапных ETL-процессов загрузки данных в Datalake из IT-систем Банка для применения в моделях;
  • создание и поддержка сложных витрин-предагрегатов и витрин с аналитическими признаками (features) на основании требований хабов аналитики;
  • создание и поддержка витрин для мониторинга моделей машинного обучения
  • создание и контроль работы проверок КД для крититических элементов данных;
  • выполнение функций владельца данных по витринам Datalake, созданных для;
Наши пожелания к кандидатам
  • Python - уверенное знание структур данных и алгоритмов, эффективное применение принципов ООП и ФП (Функциональное программирование), опыт написания модульных и интеграционных тестов, знание и опыт применения библиотек обработки и анализа данных - numpy, pandas;
  • Опыт разработки и внедрения в промышленную эксплуатацию сервисов загрузки и обработки неструктурированных и слабо структурированных данных (текст, xml, json) из внешних источников;
  • Способность разобраться с API поставщиков данных, используя доступную документацию;
  • SQL - умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности, опыт работы с БД Oracle, Postgres, Greenplum, Cassandra;
  • Уверенное знание и опыт работы с инструментами разработки, планирования и мониторинга рабочих процессов (workflow engines) пакетной обработки данных - Airflow/Oozie;
  • Опыт разработки сложных, высоконагруженных приложений обработки данных на основе Spark (scala, pyspark), уверенное знание настроек Spark и их влияния на производительность приложений Spark, умение профилировать приложения Spark для оптимизации их производительности;
  • Опыт разработки приложений и сервисов потоковой обработки данных (real-time) на основе Kafka, Flink;
  • Владеть навыком ориентироваться в коде, написанном другими разработчиками;
  • Linux: продвинутые навыки работы с командной строкой. Опционально:
  • понимает процессы Data Goverment, Data Quality;
  • имеет опыт решения задач с BI-инструментами (PowerBI/Tableau);
Что мы предлагаем
  • Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования + квартальная премия по результатам KPI;
  • Гибридный формат работы (офис+удаленка), сезонный коворкинг в Сочи;
  • Сложные и интересные задачи, современный стек технологий;
  • Заботу о вашем здоровье: программа ДМС с первых дней работы, куда входит стоматология, обслуживание в лучших клиниках города, страхование и компенсация 10-ти дней больничного;
  • Возможность вертикального и горизонтального карьерного роста: регулярно проходят тренинги, вебинары, митапы и демо-дни;
  • Доступ к бесплатным корпоративным библиотекам Alpina Digital, MyBook и бизнес-изданий;
  • Предложения от Банка только для сотрудников: собственные спортзалы (Москва, Санкт-Петербург, Екатеринбург), а также скидки на услуги туристических агентств, продукты питания, в рестораны, бары, магазины.
Как с нами связаться
По всем интересующим вопросам обращайтесь к сотруднику отдела по подбору персонала: Пономарева Анастасия Сергеевна
APONOMAREVA7@ALFABANK.RU

Откликнуться на вакансию

Расскажите нам о себе и мы обязательно свяжемся с вами

Фамилия*
Имя*
Отчество*
Электронная почта*
Телефон*
* – поля обязательные для заполнения
Вы можете  своим резюме тут (.doc,.pdf,.docx,.rtf)

Перед отправкой резюме убедитесь, что во вложенном файле указаны контактные данные (email, телефон) для обратной связи

Или вставьте ссылку на резюме hh.ru или superjob.ru
Поделиться вакансией