Како започети са подацима

Кредит: хттпс://ввв.флицкр.цом/пхотос/глеонхард/31254136671/ин/пхотостреам/

Сви смо чули звук угриза.

„Највреднији ресурс на свету више нису нафта, већ подаци“ - Тхе Ецономист

Можда. Али ако су подаци попут нафте, стање података у многим организацијама личи на ово:

Излијевање уља Деепватер Хоризон

Безбројни токови података губе се у океану података. Питајте било којег научника за податке и они ће вам рећи да је најтежа ствар у вези са науком података ухватање правих података. Па како да почнемо?

1. Постављајте права питања

Снимање података ради њих троши и много времена. Морамо смислити наше метрике које би требале бити засноване на циљевима пословања. Који су најпродаванији производи? Где корисници напуштају поступак у више корака? Колико активних корисника имамо? Многе организације представљају метрике заинтересованим странама на основу ствари које су у стању да мере (нпр. Приход), а не нужно и оно што најбоље одговара правцу њихове компаније.

Када сазнамо шта покушавамо да измеримо, тада можемо да одредимо одакле да почнемо да тражимо податке и да планирамо кораке за започињање прикупљања релевантних података.

2. Обезбедите културу засновану на подацима

Једном када организација нарасте до одређене величине, више се не може чисто ослањати на „осећај црева“. Одлуке требају бити засноване на подацима и ти подаци требају бити доступни на свим нивоима.

Могу ли запосленици приступити подацима и мјерним подацима или они стоје иза неуобичајених слојева сигурности и бирокрације? Запослени би требали бити овлашћени да врше истраживање података на скуповима података (што би требало бити анонимно и осигурано да поштују приватност). Интернетска платформа за аналитику самопослуживања је идеална за ово. Овај рад мора бити отворен и транспарентан. Поставити рад на контролну таблу и делити га са организацијом широм је неопходно.

Организације морају да пруже подршку, охрабрење и ресурсе за ову врсту рада. То значи време и новац, међутим култура заснована на подацима ће промовисати информисаније доношење одлука.

3. Унајмите инжењере података

Чест је недостатак организација да ангажују научнике података, а не инжењере података. Научници података су апсолутно критични, могу наћи обрасце у подацима, предвидјети исходе и написати моделе који могу да науче да се побољшају. Упозорење је да све зависи од података о квалитету. Подаци који се могу дохватити само путем велике податковне инфраструктуре, ЕТЛ-а и програмирања аутоматизованих токова рада. То је типично улога инжењера података. Дајте посао људима који су за то квалификовани и, што је још важније, уживајте у њему.

4. Почните мало и јефтино

Може бити врло примамљиво ускочити на воз великог броја података, створити тим за науку о подацима, купити софтвер за аналитику предузећа и потрошити велику количину новца уз врло мало да се покажу за то. Пре великог улагања, може се урадити пуно тога. Ево неких алата које било која организација може да користи:

  • Јавасцрипт аналитичке усне као што су Микпанел или Амплитуде. Бесплатан је до одређене количине месечних корисника.
  • Проток ваздуха за аутоматизовано управљање током рада. Креирао Аирбнб и инкубирао га у Апацхе Софтваре Фоундатион, он је отвореног кода и де фацто стандард за инжењере података.
  • Надзорне плоче, графикони и истраживање података помоћу Суперсета (такође Апацхе). Метабасе је такође добра алтернатива и обе су опен соурце.
  • Датабрицкс издање заједнице и Каггле. Обе се могу бесплатно користити за процесе науке о подацима у облаку.
  • Амазон Веб Сервицес С3. Овде није бесплатно, али је овде укључено, јер са технологијама које се данас развијају није увек потребно складиште података. Складиштење је јефтино, а услуге као што су Датабрицкс, МонгоДБ податковно језеро, АВС Атхена значи да можете директно да читате из свог податковног језера.

Ове идеје пружиће добру основу за организацију да почне са хватањем правих података и остваривањем своје вредности.