В кулминацията на филма „Скрити фигури“, номиниран за наградата „Академия“, математикът Катрин Джонсън е призвана да провери изчисленията за координатите за кацане на космическата капсула на Джон Глен, Приятелство 7. Технологията току-що е заменила човешките компютри, хората, изчисляващи данните, завършили сложни уравнения преди появата на компютърната система, но данните от машината имаха несъответствия, които трябваше да бъдат разрешени от човек.
Това беше науката за данните през 1961 г. В наши дни нещата са малко по-различни. Сложните системи за събиране на данни позволяват на компаниите от всеки сектор да научат повече за бизнеса си, клиентите и бъдещите си перспективи. Но подобно на „Скрити фигури“, хората все още са необходими, за да намерят важни истини от вътре в данните.
Ето лъжицата за това как използваме науката за данни всеки ден и основните умения, които са ви необходими, за да бъдете успешен като учен, инженер или анализатор на данни.
Science Science е навсякъде
Потенциалът за учени с данни, далеч отвъд финансовата и технологичната индустрия, процъфтява. „Във всички сектори нараства осъзнаването, че уменията за наука за данни са станали съществени за конкуренцията и усъвършенстването на днешния пазар“, казва Майкъл Галвин, изпълнителен директор на Data Science Corporate Training за Metis, компания за обучение на данни в областта на научните данни, която работи с физически лица и предприятия,
Помислете за бисквитките. Не, не онези, които потапяте в млякото - мощните инструменти за събиране на данни, които помагат на анализаторите на данни, учените и инженерите да научат за потребителските навици в мрежата и да информират алгоритмите около онези „как-знаеха-знам-аз-просто“ мислех реклами, показвани във Facebook. Тяхната цел? За да оцените интересите и поведението на потребителите и да използвате тези анализи, за да помогнете за вземането на ключови бизнес решения - за компании от всички сектори.
„Има по-широка осведоменост за науката за данните в масовия поток. Засягайки всичко от покупките на Amazon до биткойните на Netflix, науката за данни докосва повече хора от всякога “, казва Галвин.
Как се вписвате
С нарастването на областите на науката за данни се наблюдава засилено припокриване между ролите на учен на данни, анализатор на данни и моделиер.
Но според д-р Флавио Виланустре, вицепрезидент по технологиите и HPCC системи за рискови решения на LexisNexis, разграничението между различните позиции всъщност е доста уникално - и предоставя възможности за надарените в конкретни области.
„Анализаторите на данни традиционно се специализират в техники за манипулиране на данни, които изискват обучение по всичко - от езиците на заявките до графичните модели на данни“, казва Виланестре. „Междувременно моделистите анализират числови данни за корелации и модели.“
Що се отнася до науката за данните, Виланутре обяснява, че идеалните кандидати трябва да покажат набор от тези два вида умения, съчетани с познания в областта и бизнеса. „Учените по данни обикновено притежават по-дълбоки познания от анализатора на данни за техники на програмиране и по-широки знания от статистическите моделисти за методологиите за анализ на данни, използващи по-сложни техники.“
Когато кандидатствате за тези позиции, е важно да се отбележи какви задачи наистина изглежда да изпълни една компания.
„Бръмченето около науката за данни доведе до това, че много компании наемат данни учени, които да свършат работа на анализатор на данни, който завършва с почистването и подготовката на данните и изразходва много малко време за действителна наука за данни“, обяснява Ник Крамер, старши директор на „Данни и аналитика“ в SSA & Company, консултантска фирма за управление, която е специализирана в превръщането на анализи на големи данни в операции за компании.
Новите инструменти позволяват създаването на аналитични модели от тези с по-ниски нива на опит, така че разнообразните, свързани умения като бизнес знания и ефективни комуникационни умения са важни, за да разделят търсещите работа. Когато интервюирате, не забравяйте да задавате въпроси, за да прецените какво точно търси една компания - тогава покажете силните си страни.
Нашият офис
Какво трябва да успееш
Старата поговорка за това, че не виждате гората за дърветата, е важно нещо, което трябва да запомните, когато работите като информатик, анализатор или инженер. Макар че точността на основните данни е важна, това е признаването на всеобхватната картина на проблемите, които една компания се надява да реши.
„Има тенденция сред учените за данни да прекаляват с усложнения и да се всмукват в черна дупка от детайли“, предупреждава Галвин. „Вместо това те трябва да помислят за бизнес проблема, който се опитват да решат, да работят нещо и след това да повтарят.“
Освен това интересът към това, което правите - както е вярно за всяка работа - също е от съществено значение.
„Фирмите работят с различни видове данни (като изображения, текст и финансови данни) по различни проблеми. Трябва да се заинтересувате и да разберете вида на данните, с които ще работите, за да успеете “, каза Галвин. „Например, учените по данни, които работят с медицински изображения, обикновено не са самите лекари, но техният краен потребител или клиент ще бъде лекар. Можете ли да разберете какви проблеми се опитват да решат? Интересувате ли се да решите тези проблеми? “
И тогава има комуникация. Казано е, че учените, анализаторите и инженерите на данни говорят собствения си език, но за да постигнете успех на работното място, трябва да можете да общувате ясно с тези, които ще използват и се възползват максимално от вашите умения.
„Сътрудничеството с бизнес заинтересованите страни е все по-важно“, каза Крамер.
Науката за данните и свързаните с нея кариери стигнаха далеч от 60-те години, когато НАСА се нуждаеше от човешки компютри, за да използва и проверява работата на нови компютърни машини. Но блестящите умове, които се интересуват от това как данните могат да оформят как живеем, работим и правим бизнес, все още са толкова важни, колкото винаги - без човешки експерт, който да интерпретира както вложените данни, така и резултатите, науката за данни може да бъде злоупотребявана или просто объркана.