Один день із життя дослідника даних

Посібник з кар’єри Data Scientist від BrainStation може допомогти вам зробити перші кроки до прибуткової кар’єри в галузі науки про дані. Читайте далі, щоб отримати огляд того, як науковці даних проводять свої дні на роботі.

Станьте спеціалістом із даних

Поговоріть із консультантом із навчання, щоб дізнатися більше про те, як наші навчальні табори та курси можуть допомогти вам стати спеціалістом із даних.



Натиснувши Надіслати, ви приймаєте наші Умови .



Подати

Не вдалося надіслати! Оновити сторінку та спробувати ще раз?

Дізнайтеся більше про наш навчальний табір Data Science

Дякую!

Ми зв'яжемося найближчим часом.



Перегляньте сторінку Data Science Bootcamp

Один день із життя дослідника даних

З усіх дисциплін, які досліджуються в опитуванні Brainstation Digital Skills Survey, наука про дані може охоплювати найширший спектр застосувань. Але хоча наука про дані існує десятиліттями, вона лише нещодавно розквітла. Оскільки доступність даних розширилася, компанії зрозуміли, наскільки важливою може бути наука про дані, — каже Бріана Браунелл, засновник і генеральний директор Pure Strategy, а також науковець даних протягом 13 років. Зараз кожній компанії необхідно частково зосередитися на технологіях. Лише цього тижня, наприклад, McDonald’s заплатив приблизно 300 мільйонів доларів США за придбання власної компанії з великих даних.

Тому не дивно, що конкуренція серед науковців даних неймовірно висока. Очікується, що лише за два роки попит зросте на 28 відсотків, що еквівалентно приблизно 2,7 мільйонам нових робочих місць. Це більше вакансій, ніж нові випускники зможуть заповнити — це означає, що технічним працівникам в інших сферах доведеться підвищити свої навички та перейти до даних, щоб задовольнити цей попит.

Насправді, наше опитування показує, що це вже відбувається. Приблизно четверо з п’яти спеціалістів з обробки даних почали свою кар’єру, займаючись чимось іншим, і 65 відсотків усіх спеціалістів із обробки даних працюють у цій сфері протягом п’яти років або менше. Цей величезний приплив нових розумів має двосторонній ефект, каже Браунелл; з одного боку, з’являється багато нових ідей, каже вона. Коли я дивлюся на деякий вміст, що надходить із спільноти науки про дані, я дивуюся, наскільки багато інновацій. Зворотною стороною, однак, є тенденція до винаходу велосипеда.



Високий попит на Data Scientists є чудовим, якщо ви такий (або плануєте ним стати), але для роботодавців найм може бути складним завданням. Тут перенавчання є очевидним рішенням; може бути рентабельніше перенавчати нинішнього співробітника в галузі науки про дані, ніж шукати нового.

Але навіть якщо ви плануєте найняти нову команду з вивчення даних, вашій організації в цілому може знадобитися підвищити рівень грамотності даних, попереджає Браунелл. Кожен хоче працювати над чимось, що впливає на їхнє робоче місце, що покращує життя людей, каже вона. Якщо культура вашої компанії не є такою, щоб [ваші спеціалісти з обробки даних] могли вплинути, найняти на роботу майже неможливо. Керівництво має бути здатним не лише повідомляти потенційним працівникам, як вони зможуть внести свій внесок, а й розуміти пропозиції, які їхня команда науки в кінцевому підсумку висуває.

На жаль, каже Браунелл, незручна більшість – це компанії, які ще не зрозуміли. Наше опитування підтверджує це: більшість респондентів (52 відсотки) охарактеризували рівень грамотності даних у своїх організаціях як базовий, а проміжний – наступний за поширеністю (31 відсоток). Це говорить про те, що деяка базова підготовка з науки про дані може бути корисною для значної більшості компаній, особливо для керівництва.



Ця потреба в покращенні грамотності даних — і комунікації — посилюється завдяки тому, як структурована більшість команд із науки про дані: як окрема команда, як правило, з 10 осіб або менше (згідно з 71 відсотком респондентів), і часто п’ять або менше (38 відсотків). ). Ці згуртовані команди не можуть дозволити собі бути ізольованими. Особи, які працюють у великих компаніях, зазвичай входять до невеликої групи, яка спеціалізується на наукових даних, а їхні клієнти — внутрішні — інші частини організації, пояснює Браунелл, тому це команда, яка має працювати в багатьох різних сферах організації.

Що таке наука про дані?

Браунелл каже, що поширене сприйняття (про те, що Data Scientists перевіряють цифри) не так вже й далеко. Існує багато наборів даних, для яких потрібно розкрити інформацію, і це включає в себе багато кроків, як-от створення моделі та очищення даних, і навіть просто вирішувати, які дані вам потрібні. Однак, зрештою, ці зусилля спрямовані на досягнення мети: по суті, вам потрібно щось робити з даними.

З цього приводу дані не завжди є числами. Хоча більшість респондентів (73 відсотки) вказали, що вони працюють з числовими даними, 61 відсоток сказали, що вони також працюють із текстом, 44 відсотки зі структурованими даними, 13 відсотків із зображеннями та 12 відсотків із графікою (а невеликі меншини навіть працюють із відео та аудіо). —6 відсотків і 4 відсотки відповідно). Ці результати опитування натякають на те, як наука про дані виходить далеко за межі фінансових таблиць, залучаючи людей для таких проектів, як максимізацію задоволеності клієнтів або отримання цінних ідей із пожежного шланга соціальних мереж.

Як наслідок, існує величезна різноманітність у галузі науки про дані, каже Браунелл. Кожна галузь має власний погляд на типи даних, над якими працюють спеціалісти з даних, типи результатів, які вони очікують, і як це вписується в структуру керівництва їхньої компанії. Однак у кожному разі мета полягає в тому, щоб використовувати дані, щоб допомогти компанії приймати кращі рішення. Це може бути покращення продуктів, розуміння ринку, на який вони хочуть вийти, утримання більшої кількості клієнтів, розуміння використання їхньої робочої сили, розуміння того, як правильно наймати працівників — усе різне.

Робота з науки про дані

У деяких галузях технологій стати фахівцем загального профілю може бути найкращим кроком у двері — це не так з наукою про дані. Роботодавці зазвичай шукають навички, що спеціалізуються на своїй галузі. Оскільки наука про дані доступна в багатьох різновидах, наше опитування було глибше, досліджуючи п’ять основних категорій посад: аналітик даних, дослідник, бізнес-аналітик, менеджер даних та аналітики та власне науковець з даних.

З огляду на всі ці посади, сперечання та очищення даних займають основну частину часу, але з якою метою? Найчастіше метою є оптимізація існуючої платформи, продукту чи системи (45 відсотків) або розробка нових (42 відсотки). Копаючи глибше, ми виявили, що оптимізація існуючих рішень, як правило, припадає на бізнес-аналітиків і аналітиків даних, тоді як розробка нових рішень частіше припадає на науковців і дослідників даних.

Методики, які використовують Data Scientists, також відрізняються в різних спеціалізаціях. Лінійна регресія була поширеним інструментом для всіх категорій, на що посилалися 54 відсотки респондентів, але було кілька сюрпризів, коли ми подивилися на програмне забезпечення, яке використовують люди.

Excel — ця робоча конячка для маніпуляції з наборами даних — є практично повсюдно, на що посилається 81 відсоток усіх респондентів, і є найпопулярнішим інструментом у кожній категорії, окрім власне Data Scientists (які найчастіше покладаються на Python), а також посилаються на більший інструментарій, ніж інші категорії. ). Що робить Excel таким неминучим навіть у 2019 році?

Мені подобається в Excel те, що він дозволяє вам бачити дані та інтуїтивно їх відчувати, пояснив Браунелл. Ми також використовуємо багато Python, і в такому випадку, коли ви робите аналітику файлу даних, він прихований; якщо ви спеціально не запрограмуєте частину свого коду для візуалізації вихідних даних, які ви аналізуєте, ви цього не побачите. У той час як з Excel це прямо перед вами. Це має багато переваг. Іноді ви можете помітити проблеми з файлом даних. Я не бачу, щоб Excel коли-небудь зникав з аналізу.

Тим не менш, існує довгий список інших програм, які використовуються в цій галузі, що не дивно, враховуючи їх різноманітність. SQL (43 відсотки) і Python (26 відсотків) лідирують за популярністю, а Tableau (23 відсотки), R (16 відсотків), Jupyter Notebooks (14 відсотків) та кілька інших мають значні показники, не кажучи вже про величезні 32 відсотки респондентів, які посилалися на інші інструменти, навіть враховуючи цей і без того довгий список.

Яке майбутнє науки про дані?

Нарешті, ми запитали, які тенденції будуть формувати цифровий ландшафт протягом наступних 5-10 років. Машинне навчання та штучний інтелект, обидва з яких мають застосування в галузі науки про дані, були переважно розробками, які респонденти очікують мати найбільший вплив — 80% і 79% відповідно. І це незважаючи на те, що менше чверті (23 відсотки) з них наразі працюють з ШІ.

Штучний інтелект може абсолютно трансформувати науку про дані, підтверджує Браунелл, чия компанія розробляє продукти штучного інтелекту. Це справді слава методів навчання без нагляду. У нас лише стільки часу, щоб переглянути ці набори даних, а особливо з великими, дуже важко зробити все. Інструменти штучного інтелекту можуть допомогти виявити те, що ви, можливо, і не думали б шукати. У нас це точно траплялося.

Інші тенденції Data Scientists очікують домінувати в найближчому майбутньому: Інтернет речей (51 відсоток), блокчейн (50 відсотків) і електронна комерція (36 відсотків), доповнена реальність і віртуальна реальність (38 відсотків і 27 відсотків), і навіть голос на основі досвіду (25 відсотків) — усі значущі результати та всі області, де наука про дані може бути використана з користю.

Kategori: Новини