Все о профессии дата-сайентиста от ключевых навыков до тонкостей трудоустройства

Что из себя представляет его работа и что должен знать хороший дата-сайентист, чтобы получать от 100 тыс. рублей в месяц, рассказывает основательница международной школы анализа данных и разработки Mathshub, преподаватель AI-программ Айра Монгуш.

Все о профессии дата-сайентиста от ключевых навыков до тонкостей трудоустройства

Дата-сайентист: что это за профессия

Дата-сайентист (Data Scientist) создает модели и алгоритмы извлечения информации из баз данных, чтобы позже их проанализировать и полученный отчет использовать для решения задач бизнеса. Ведь для бизнеса ценны не столько сами таблички с данными, сколько их готовая интерпретация: какие есть повторяющиеся места в поведении пользователей приложения или, наоборот, аномалии.

На основе этого анализа дата-сайентист строит прогнозы и определяет тенденции, например, в поведении пользователей, чтобы позже этой информацией могли пользоваться разработчики и маркетологи для улучшения ленты рекомендаций при выборе товара в интернет-магазине. Чем обширнее база, тем больше сложностей в очистке и обработке информации. 

Чем отличается дата-сайентист от других ИТ-специальностей

Дата-сайентисту наобходимо разбираться в трех сферах:

  • в разработке, 
  • математике и статистике,
  • бизнес-процессах.

Только так он сможет работать одновременно с техкомандой продукта и с теми, кто занимается продвижением и продажами. 

Иногда дата-сайентиста путают с дата-аналитиком, поскольку оба специалиста работают с уже готовыми базами и занимаются их анализом. Однако дата-сайентист стоит на ступень выше именно потому, что предлагает собственные модели извлечения данных с учетом знаний о продукте и его стоимости.

В этом ему помогают знания о том, как устроено машинное и глубокое обучение (Machine Learning, Deep Learning). Аналитик же работает по готовым моделям, но у него есть шанс вырасти в дата-сайентиста. 

Все сервисы и компании, связанные с релокацией, на одной карте

Где работают дата-сайентисты

Компетенции дата-сайентиста нужны в любой сфере, собирающей большое количество баз данных.

  • В финтехе дата-сайентисты работают с отчетами, транзакциями, кредитными оценками, чтобы предлагать инвестиционные стратегии, прогнозировать рынок и оценивать риски.
  • В доказательной медицине анализ генетических данных, клинических исследований и медицинских записей используют для определения эффективности лекарств или методов лечения.
  • В логистике обрабатываются данные о транспортных потоках для оптимизации маршрутов и расписаний, а также улучшения безопасности на дорогах.

Медиа и реклама, образование, e-commerce, тяжелое машиностроение — перечисление можно продолжать долго.

Читать по теме: Как проходит рабочий день инженера данных в крупной технологической компании

Плюсы и минусы профессии

Сегодня специализация в технологиях, основанных на работе ИИ, имеет ряд преимуществ: 

  • Высокий спрос на рынке труда, поскольку цифровизация предприятий и бизнеса вышла из модного тренда и становится уже must-have для производств.
  • Высокая зарплата. Зарплата в РФ может значительно варьироваться в зависимости от опыта и уровня квалификации, а также от компании и региона.

Например, на момент написания статьи на сайте hh.ru размещено 219 вакансий Data Scientist с указанным размером дохода, из них 159 (72,6%) — с зарплатой от 100 тыс. рублей. Это выше средней во многих регионах.

  • Интеллектуальный вызов. Работа дата-сайентиста — это всегда интересные и сложные задачи, ведь глобальная цель его профессии в том, чтобы сделать жизнь клиентов проще и удобнее, а бизнес — прибыльнее. А это подразумевает баланс между желанием прогресса и техноэтикой, чтобы не переходить черту, за которой будут в опасности персональные данные людей, денежные средства и т. д.
  • Широкие возможности карьерного роста. У дата-сайентистов есть разделение на джуниор-, мидл- и сеньор-уровни. Кроме того, у них есть большие перспективы стать продакт-менеджерами, поскольку их стык знаний и накопленный опыт в перспективе поможет управлять развитием продукта или услуги в целом. Еще один вариант развития карьеры — переход в ML-инженера, чтобы проектировать и оптимизировать уже не просто модели извлечения информации из базы данных, но и сами базы.

Однако эта профессия имеет и существенные недостатки:

  • Необходимость постоянного обучения. Инструменты ИИ постоянно обновляются, и чтобы оставаться востребованными, придется постоянно обновлять собственную экспертизу и следить за тем, что делают конкуренты. Появление и массовое распространение ChatGPT — образец того, как одна компания заставила напрячься всех техногигантов, включая «Большую четверку».
  • Неопределенность в работе. У дата-сайентистов могут быть очень разнообразные задачи, в которых не всегда очевидно как решение, так и результат. Это может повлиять на повышение уровня фонового стресса, ведущего, в свою очередь, к профессиональному выгоранию и общему ухудшению здоровья.
  • Высокий риск ошибок. При обработке и анализе большого объема данных риск допустить ошибку с серьезными последствиями выше. В работе дата-сайентистов ошибки могут быть к тому же сопряжены с прямыми финансовыми потерями бизнеса. 

Читать по теме: Специалист по данным: как эта профессия изменилась за 10 лет

Необходимые навыки дата-сайентиста, где на него учиться

У каждого вида дата-сайентистов есть свой специфический набор навыков и инструментов, но в самом общем виде каждому из типов пригодятся:

  • Математическое мышление и знание математики в целом;
  • Статистический анализ — без него никуда при программировании и пользовании Python и языка запросов SQL;
  • Умение обращаться с базами данных, знать основные инструменты обработки больших данных вроде Hadoop Mapreduce и Apache Spark;
  • Понимание, как визуально представлять полученные данные, строить модели
  • Знания английского языка для изучения технической литературы;
  • Усидчивость. Работа дата-сайентиста — это многочасовое времяпрепровождение наедине с монитором или двумя. 
  • Знание специфики компании и ее отрасли — строить одни и те же модели для металлургического завода и приложения с рецептами будет практически невозможно.

Из «мягких» навыков помогут умение работать в команде и презентации результатов работы. 

Конечно, проще всего стать дата-сайентистами тем, кто уже имеет опыт в программировании или хотя бы математический бэкграунд из вуза. Если такого нет и хочется понять, ваше ли это направление, лучше всего взять бесплатные курсы по программированию.

Среди англоязычных — гарвардский курс по основам программирования CS50, на русском языке есть «Поколение Python» на Stepik, введению в Machine Learning mlcourse.ai. Начать стоит именно с технической части, поскольку она будет составлять большую часть работы.

На одних только компетенциях в организации бизнес-процессов продержаться нереально. Но если вы изучите технические инструменты, опыт в бизнесе будет козырем при трудоустройстве. 

Если вы поняли, что Data Science — это ваше, берите полноценные курсы по выбранной специализации в ИИ на обучающих платформах. Время обучения с нуля и до мидл-уровня варьируется от 9 до 24 месяцев.

При выборе обращайте внимание на то, чтобы в программе были все три компонента, необходимые для дата-сайентиста: Python и SQL, математика и статистический анализ, разбор бизнес-процессов. 

Где найти работу и заказчиков

Для поиска работы можно использовать следующие источники:

  • Cайты вроде LinkedIn, Indeed, Glassdoor, если вне РФ; HeadHunter, SuperJob, Geekjob, Careerspace и другие внутри РФ.
  • Порталы, специализирующиеся на предоставлении проектов фрилансерам. За пределами России работают Upwork, Freelancer, Fiverr. В России работают fl.ru, Kwork, Freelance.ru, Avito, Profi.ru и т. д.
  • Сайты компаний, которые работают в сфере аналитики данных, машинного обучения, искусственного интеллекта и других связанных с этим областях. Те же «Яндекс», VK, «Сбер», «Тинькофф» регулярно обновляют на своих порталах список вакансий
  • Конференции, семинары и вебинары, где можно встретить работодателей и потенциальных заказчиков.

Конечно же, без опыта найти работу будет сложно, но это не значит, что вам нечего показать потенциальному работодателю. Оформите свои соцсети под поиск работы, создайте портфолио из, к примеру, выполненных тестовых заданий или учебных заданий с курса по Data Science. Удача улыбается тому, кто действует.

Читать по теме: С какими IT-профессиями легче всего переехать в другую страну: список

Источник: rb.ru

Понравилась новость? Поделитесь с друзьями:
AdMarket News