Студенческий проект: что удалось сделать за три месяца работы с SAP HANA

Николай Грушин, руководитель студенческого проекта Виртуальной лаборатории ROI, делится своими впечатлениями.

Наша компания  (Return on Intelligence, ROI) уже много лет работает со студентами, в том числе проводя летние практики и помогая реализовать первые в их жизни ИТ-проекты. В этом году совместно с  кафедрой вычислительной техники факультета КТИ Санкт-Петербургского Государственного Электротехнического Университета (ЛЭТИ) мы запустили Виртуальную лабораторию — новое направление нашей университетской программы.
В рамках лаборатории  магистры  1-го года обучения реализуют проекты по разработке  в 4-х областях:

  • Java
  • .Net
  • Мобильные приложения
  • Математические методы прогнозного анализа (Big Data).

ROI обеспечивает программное обеспечение для разработки и выделяет инженеров-наставников для успешной работы студентов. Лаборатория работает непрерывно, обеспечивая конвейер  проектов, имитирующих ИТ-стартапы. В феврале 2015 года стартовали первые проекты в рамках Виртуальной лаборатории, а уже 14 мая прошла защита студенческих проектов.

Я руководил одной группой, которая работала над темой: Нахождение основных внешних и внутренних факторов, влияющих на количество проектов в организации методами математической статистики на основе исторических данных.
Используемые технологии: SAP HANA + R.  

SAPHana

Была поставлена типовая задача проекта, не предполагающая научной новизны. Основными целями работы было научить будущих инженеров работать в команде, включая все этапы специфичные для методологии Agile, и ознакомить их с технологиями SAP и возможностями языка статистического программирования R.

Целью проекта было найти внешние и внутренние факторы, максимально влияющие на количество проектов в компании. Для анализа были взяты данные из внутренних и внешних систем компании. Сами данные cодержали факты как явно влияющие на количество проектов (например, количество предварительных договоренностей с клиентами и контрактов на стадии согласования), так и явно не влияющие (например, температурные колебания в регионе).
Архитектурой были выбраны средства, которые используются в реальных продуктовых средах для такого рода задач: SAP HANA и R. Ребятам было необходимо не только разобраться с тем, как работают эти системы, научиться работать с внутренним языком и методологиями работы, но и суметь настроить их для совместной работы.
Именно настройка систем вызвала наибольшие затруднения у студентов. Вот что написал один из участников проекта, Дмитрий: «Ужасные танцы с бубном вокруг SAP HANA. Все по-настоящему, не на учебный проект». Основные сложности были в настройке среды разработки, которая в то же время является и системой управления сервисом. Для студентов, знакомых только со «стандартными» «компиляторными» студиями разработки ПО, такими как Visual Studio, Eclipse, работа и настройка среды в Hana Studio (которая тоже работает на базе Eclipse) вызвала ряд  затруднений. Основные сложности возникли  в переключении между перспективами для разных задач, настройке и разграничении прав доступа (некоторые задачи можно решить, только используя пользователей со специальными правами).

Документация по HANA. В этом пункте у нас были как «плюсы», так и «минусы». Документация очень подробная и полностью обновляется к каждой новой версии HANA, и это замечательно! Но изучать ее надо целиком, что, учитывая объем информации, требует очень много времени. И чтобы найти ответ на конкретный специализированный вопрос, приходится пролистывать весь документ. Было бы здорово иметь еще комплект сжатых подсказок по разделам. По итогам работы с инструментами разработки студенты создали документ «Руководство по развертыванию HANA и R», призванный помочь другим студенческим командам на старте проектов с аналогичным инструментарием.
Динамичность развития HANA оставила двоякое впечатление. Радует, что продукт постоянно развивается, в нем быстро исправляются ошибки, неизбежные при разработке. Но базовая инструкция к продукту не всегда успевает за сменой версий. В процессе работы наша студенческая команда столкнулась с рядом проблем:

  • совместимость R-сервера с программно-аппаратным окружением. Не все версии продукта корректно работали с сервером;
  • необходимость ручного переноса данных из исходных источников в HANA из-за нестабильной работы внутреннего инструмента для загрузки данных. Мы пользовались учебной версией с ограниченным уровнем доступа, из-за этого приходилось использовать ряд дополнительных сервисов, что немного снизило итоговую скорость обработки данных, являющуюся конкурентным преимуществом HANA.

За три месяца, отведенные на проект, ребята решили начальную задачу только частично. Одна из основных причин: недооценка сложности и временных затрат.

Тем не менее, мы планируем завершить проект и использовать его результаты в качестве одной из составных частей комплексного фреймворка для решения типовых бизнес-задач заказчиков.

Подводя итоги, я готов сформулировать свои впечатления от работы студентов / junior-специалистов с SAP HANA:

  • SAP HANA является подходящей средой для реализации проекта начинающими специалистами с базой технического вуза.
  • Для успешной реализации такого проекта необходимо курирование младших инженеров опытным специалистом на протяжении всего проекта где самыми эффективными оказываются очные встречи, скорость решения проблем возрастает в разы.
  • HANA имеет подробную техническую документацию, достаточное количество видеоуроков, оперативно выделяет ресурсы для работы студентов.
  • Следует учитывать большие объемы информации, необходимые для освоения работы с HANA и закладывать значительное время на обучение работе с продуктом.

И в качестве заключительного аккорда я хотел бы отметить вовлекаемость и возрастающий интерес по мере освоения технологий цитатой из отзыва Дмитрия (одного из студентов, работавших в группе): «Одно из болезненных ощущений после проекта связано с тем, что не все удалось применить, не во всех метриках и прочем инструментарии удалось разобраться, и еще научился думать обо всех задачах как о проектах с путями решений. Очень хочется научиться. По общему мнению моих друзей из других команд этого курса — это самый удачный курс в году, один из самых удачных во всем нашем обучении вообще, и нам очень нужны такие курсы еще и еще. Лучшая форма обучения — все хорошие студенты, особенно много работающие, согласны с этим!»

Николай Грушин, BI/DB Technical Lead, Return On Intelligence

Print Friendly, PDF & Email