Запитання на інтерв’ю з науки про дані

Посібник з кар’єри Data Scientist від BrainStation може допомогти вам зробити перші кроки до прибуткової кар’єри в галузі науки про дані. Читайте далі, щоб ознайомитися з поширеними запитаннями на співбесіді для роботи з даними та як найкраще на них відповісти.

Станьте спеціалістом із даних

Поговоріть із консультантом із навчання, щоб дізнатися більше про те, як наші навчальні табори та курси можуть допомогти вам стати спеціалістом із даних.



Натиснувши Надіслати, ви приймаєте наші Умови .



Подати

Не вдалося надіслати! Оновити сторінку та спробувати ще раз?

Дізнайтеся більше про наш навчальний табір Data Science

Дякую!

Ми зв'яжемося найближчим часом.



Перегляньте сторінку Data Science Bootcamp

Процеси проведення інтерв’ю щодо науки про дані можуть відрізнятися залежно від компанії та галузі. Як правило, вони включають первинну телефонну перевірку з менеджером з найму, а потім одне або кілька співбесід на місці.

Вам доведеться відповісти на запитання співбесіди з технічних і поведінкових наукових даних і, швидше за все, завершите проект, пов’язаний з навичками. Перед кожним співбесідою ви повинні переглянути своє резюме та портфоліо, а також підготуватися до потенційних запитань на співбесіду.

Запитання на співбесіді з наукою про дані перевірять ваші знання та навички зі статистики, програмування, математики та моделювання даних. Роботодавці оцінюватимуть ваші технічні та практичні навички, а також те, наскільки добре ви б вписувалися в їхню компанію.



Підготувавши деякі поширені запитання та відповіді на інтерв’ю з науки про дані, ви можете впевнено брати участь у співбесіді. Існує кілька різних типів запитань Data Scientist, з якими ви можете зіткнутися під час співбесіди з Data Science.

Список запитань на інтерв'ю Data Science: питання, пов'язані з даними

Роботодавці шукають кандидатів, які добре володіють методами та концепціями науки про дані. Питання на співбесіді, пов’язані з даними, будуть відрізнятися залежно від посади та необхідних навичок.

Ось кілька прикладів запитань та відповідей на інтерв’ю, пов’язаних із даними:



Яка різниця між навчанням під наглядом і навчанням без нагляду?

Найбільша різниця між навчанням під наглядом і навчанням без нагляду полягає у використанні позначених і немаркованих наборів даних. Контрольоване навчання використовує вихідні та вхідні дані, які позначені, а алгоритми навчання без нагляду – ні. Інша відмінність полягає в тому, що контрольоване навчання має механізм зворотного зв’язку, а навчання без нагляду – ні. Нарешті, зазвичай використовувані алгоритми навчання з керуванням включають логістичну регресію, машину опорних векторів і дерева рішень, тоді як алгоритми навчання без нагляду — це кластеризація k-середніх, ієрархічна кластеризація та апріорний алгоритм.

Яка різниця між глибоким навчанням і машинним навчанням?

На це питання може бути важко відповісти чітко, оскільки тут, очевидно, є деяке збігання. Почніть з пояснення, що глибоке навчання, по суті, є підсферою машинного навчання і що обидва підпадають під парасольку штучного інтелекту. Там, де машинне навчання використовує алгоритми для аналізу даних і в кінцевому підсумку вчиться приймати рішення на основі того, що воно виводить з даних, глибоке навчання поширює ці алгоритми на створення штучних нейронних мереж, здатних навчатися та приймати зважені рішення.

  • Чи можете ви надати детальне пояснення алгоритму дерева рішень?
  • Що таке вибірка? Зі скількома методами відбору проб ви знайомі?
  • Як відрізнити помилку типу I та типу II?
  • Будь ласка, визначте лінійну регресію.
  • Що означають терміни p-значення, коефіцієнт і значення r-квадрат? Чому кожен компонент важливий?
  • Будь ласка, визначте упередження відбору.
  • Будь ласка, визначте статистичну взаємодію.
  • Чи можете ви надати приклад набору даних з негауссовим розподілом?
  • Поясніть, будь ласка, формулу біноміальної ймовірності.
  • Чи можете ви пояснити різницю між кластеризацією k-NN і k-середніх?
  • Який ваш підхід до створення моделі логістичної регресії?
  • Що таке правило 80/20? Наскільки важлива перевірка моделі?
  • Визначте точність і запам’ятовування. Як вони пов’язані з кривою ROC?
  • Поясніть, будь ласка, як відрізнити методи регуляризації L1 і L2?
  • Перш ніж застосовувати алгоритми машинного навчання, які кроки потрібно виконати для обговорення та очищення даних?
  • Чи можете ви пояснити різницю між гістограмою та квадратним графіком?
  • Як ви визначаєте перехресну перевірку?
  • Чи можете ви пояснити, що таке хибнопозитивний і хибнонегативний? Що, на вашу думку, краще мати: забагато хибнопозитивних чи забагато помилкових негативів?
  • При розробці моделі машинного навчання, що важливіше: точність моделі чи продуктивність моделі?
  • На вашу думку, що краще: 50 маленьких дерев рішень чи велике?
  • Чи можете ви придумати проект із науки про дані в нашій компанії, який би вас зацікавив?
  • Чи можете ви пригадати кілька прикладів передового досвіду в галузі науки про дані?

Список запитань для інтерв’ю з наукою про дані: запитання щодо технічних навичок

Питання щодо технічних навичок під час співбесіди з даними використовуються для оцінки ваших знань, навичок та здібностей у галузі науки про дані. Ці питання будуть пов’язані з конкретними посадовими обов’язками посади Data Scientist.

Питання для співбесіди з технічних даних можуть мати одну правильну відповідь або кілька можливих рішень. Ви захочете показати свій процес мислення під час розв’язування задач і чітко пояснити, як ви прийшли до відповіді.

Приклади запитань на співбесіді з технічних наукових навичок включають:

Які найкращі інструменти та технічні навички для Data Scientist?

Наука про дані — це високотехнічна галузь, і вам захочеться показати менеджеру з найму, що ви вправно володієте всіма найновішими стандартними інструментами, програмним забезпеченням і мовами програмування. З різних мов статистичного програмування, які використовуються в науці про дані, R і Python найчастіше використовують Data Scientists. Обидва можна використовувати для статистичних функцій, таких як створення нелінійної або лінійної моделі, регресійний аналіз, статистичні тести, аналіз даних тощо. Іншим важливим інструментом науки про дані є RStudio Server, тоді як Jupyter Notebook часто використовується для статистичного моделювання, візуалізації даних, функцій машинного навчання тощо. Звичайно, існує ряд спеціальних інструментів візуалізації даних, які широко використовують Data Scientists, включаючи Tableau, PowerBI. , Боке, Сюжет та Інфограма. Data Scientists також потребує достатнього досвіду використання SQL та Excel.

У вашій відповіді також слід вказати будь-які конкретні інструменти або технічні компетенції, яких вимагає робота, на яку ви збираєтеся на співбесіду. Перегляньте опис роботи, і якщо є якісь інструменти або програми, якими ви не користувалися, можливо, варто ознайомитися з ними перед співбесідою.

Як ви ставитеся до виняткових значень?

Деякі типи викидів можна видалити. Сміттєві значення або значення, які, як ви знаєте, не можуть бути істинними, можна відкинути. Виброси з екстремальними значеннями далеко за межами решти точок даних, згрупованих у набір, також можна видалити. Якщо ви не можете відмовитися від викидів, ви можете переглянути, чи вибрали ви правильну модель, ви можете використовувати алгоритми (наприклад, випадкові ліси), на які значення викидів не вплинуть так сильно, або ви можете спробувати нормалізувати свої дані.

  • Розкажіть, будь ласка, про оригінальний алгоритм, який ви створили.
  • Яке ваше улюблене програмне забезпечення для статистики і чому?
  • Чи працювали ви над проектом із науки про дані, який вимагав значного компонента програмування? Що ви взяли з досвіду?
  • Опишіть, як ефективно представляти дані з п’ятьма вимірами.
  • Вам потрібно створити прогнозну модель за допомогою множинної регресії. Який ваш процес перевірки цієї моделі?
  • Як ви гарантуєте, що зміни, які ви вносите в алгоритм, є покращенням?
  • Будь ласка, надайте свій метод обробки незбалансованого набору даних, який використовується для прогнозування (тобто значно більше негативних класів, ніж позитивних).
  • Який ваш підхід до перевірки створеної вами моделі для створення прогнозної моделі кількісної змінної результату за допомогою множинної регресії?
  • У вас є дві різні моделі порівнянної обчислювальної продуктивності та точності. Будь ласка, поясніть, як ви вирішили, що вибрати для виробництва і чому.
  • Вам надається набір даних, що складається зі змінних, у яких значна частина відсутніх значень. Який ваш підхід?

Список запитань на інтерв'ю Data Science: особисті запитання

Поряд із перевіркою ваших знань та навичок із науки про дані роботодавці, ймовірно, також зададуть загальні запитання, щоб краще вас познайомитися. Ці запитання допоможуть їм зрозуміти ваш стиль роботи, особистість і те, як ви можете вписатися в культуру їхньої компанії.

Питання на співбесіді спеціаліста з персональних даних можуть включати:

Що робить хорошого Data Scientist?

Ваша відповідь на це запитання розповість менеджеру з найму багато про те, як ви бачите свою роль і цінність, яку ви приносите організації. У своїй відповіді ви могли б говорити про те, що наука про дані вимагає рідкісного поєднання компетенцій і навичок. Хороший дослідник даних повинен поєднувати технічні навички, необхідні для аналізу даних і створення моделей, з бізнес-чуттям, необхідним для розуміння проблем, які він вирішує, а також для розпізнавання корисних ідей у ​​своїх даних. У своїй відповіді ви також можете обговорити дослідника даних, на якого ви шукаєте, будь то колега, якого ви знаєте особисто, чи глибокий діяч галузі.

  • Розкажіть, будь ласка, про себе.
  • Які ваші найкращі якості у професійному плані? Які ваші слабкі місця?
  • Чи є один Data Scientist, яким ви захоплюєтеся найбільше?
  • Що надихнуло ваш інтерес до науки про дані?
  • Які унікальні навички чи характеристики ви маєте, щоб допомогти команді?
  • Чому ви вирішили залишити останню роботу?
  • Якого рівня винагороди ви очікуєте від цієї роботи?
  • Ви віддаєте перевагу працювати самостійно чи у складі команди Data Scientists?
  • Де ви бачите свою кар’єру через п’ять років?
  • Який ваш підхід до боротьби зі стресом на роботі?
  • Як ви знаходите мотивацію?
  • Який ваш метод вимірювання успіху?
  • Як би ви описали своє ідеальне робоче середовище?
  • Які ваші захоплення чи хобі, крім науки про дані?

Список запитань на інтерв'ю Data Science: Лідерство та комунікація

Лідерство та комунікація є двома цінними навичками для спеціалістів з даних. Роботодавці цінують кандидатів на роботу, які можуть проявляти ініціативу, ділитися своїм досвідом з членами команди та повідомляти цілі та стратегії науки про дані.

Нижче наведено кілька прикладів запитань на інтерв’ю з науки про лідерство та комунікаційні дані:

Що вам подобається в роботі в мультидисциплінарній команді?

Data Scientist співпрацює з багатьма людьми на технічних і нетехнічних посадах. Нерідкі випадки, коли Data Scientist працює з розробниками, дизайнерами, спеціалістами з продуктів, аналітиками даних, відділами продажів і маркетингу, а також керівниками вищого рівня, не кажучи вже про клієнтів. Отже, відповідаючи на це запитання, ви повинні проілюструвати, що ви командний гравець, який насолоджується можливістю зустрічатися та співпрацювати з людьми в організації. Виберіть приклад ситуації, коли ви доповіли високопоставленим людям у компанії, щоб продемонструвати не тільки, що вам комфортно спілкуватися з ким завгодно, але й продемонструвати, наскільки цінними були ваші знання на основі даних у минулому.

  • Чи можете ви пригадати професійну ситуацію, коли у вас була можливість продемонструвати лідерство?
  • Який ваш підхід до вирішення конфліктів?
  • Який ваш підхід до побудови професійних відносин з колегами?
  • Який приклад успішної презентації ви навели? Чому це було так переконливо?
  • Якщо ви розмовляєте з колегою або клієнтом з нетехнічними знаннями, як ви поясните складні технічні проблеми чи проблеми?
  • Будь ласка, пригадайте ситуацію, коли вам довелося обробляти конфіденційну інформацію. Як ви підійшли до ситуації?
  • З вашої власної точки зору, як би ви оцінили свої комунікативні навички?

Список запитань на інтерв'ю Data Science: поведінкові

За допомогою поведінкових запитань на співбесіді роботодавці шукають конкретні ситуації, які демонструють певні навички. Інтерв’юер хоче зрозуміти, як ви справлялися з ситуаціями в минулому, чого ви дізналися і що ви можете принести їх компанії.

Приклади поведінкових запитань в інтерв’ю з науки про дані включають:

Чи пам’ятаєте ви ситуацію, коли вам довелося очистити та впорядкувати великий набір даних?

Дослідження показали, що Data Scientists витрачають більшу частину свого часу на підготовку даних, а не на аналіз даних або моделювання. Тож, якщо у вас є досвід роботи в галузі Data Scientist, майже напевно ви маєте досвід очищення та організації набору великих даних. Правда й те, що це завдання, яке мало кому подобається. Але очищення даних також є одним з найважливіших кроків для будь-якої компанії. Таким чином, ви повинні провести менеджера з найму через процес, яким ви дотримуєтеся під час підготовки даних: видалення повторюваних спостережень, виправлення структурних помилок, фільтрація викидів, усунення відсутніх даних і перевірка даних.

  • Згадайте проект даних, над яким ви працювали, де ви зіткнулися з проблемою або викликом. Яка була ситуація, яка перешкода і як ви її подолали?
  • Будь ласка, надайте конкретний приклад використання даних для покращення досвіду клієнта або зацікавленої сторони?
  • Укажіть конкретну ситуацію, коли ви досягли мети. Як вам це вдалося?
  • Укажіть конкретну ситуацію, коли ви не досягли мети. Що пішло не так?
  • Який ваш підхід до управління та дотримання жорстких термінів?
  • Чи можете ви пригадати час, коли ви стикалися з конфліктом на роботі? Як ви впоралися з цим?

Список запитань на інтерв'ю Data Science від провідних компаній (Amazon, Google, Facebook, Microsoft)

Щоб дати вам уявлення про деякі інші питання, які можуть виникнути під час співбесіди, ми склали список запитань на інтерв’ю з науки про дані від деяких провідних технологічних компаній.

  • Яка різниця між машиною опорного вектора та логістичною регресією? Будь ласка, наведіть приклади ситуацій, коли ви вирішили б використовувати один, а не інший.
  • Якщо видалення відсутніх значень з набору даних викликає упередження, що б ви зробили?
  • Які показники ви б оцінили, дивлячись на здоров’я, залучення чи зростання продукту?
  • Які показники ви б оцінили, намагаючись вирішити або вирішити бізнес-проблеми, пов’язані з нашим продуктом?
  • Як ви оцінюєте продуктивність продукту?
  • Як ви знаєте, чи є нове спостереження винятком?
  • Як би ви визначили компроміс зміщення-дисперсія?
  • Який ваш метод випадкового відбору вибірки з групи користувачів продукту?
  • Який у вас процес обговорення та очищення даних перед застосуванням алгоритмів машинного навчання?
  • Як би ви підійшли до незбалансованої бінарної класифікації?
  • Як відрізнити хорошу візуалізацію даних від поганої?
  • Будь ласка, створіть функцію, яка перевіряє, чи є слово паліндромом.

Kategori: Новини