Com aconseguir el teu primer treball a la ciència de dades?

Com es pot obtenir el seu primer lloc de treball com a científic de dades o analista de dades? Si feu un recorregut pels fòrums de ciències de dades, trobareu moltes preguntes al voltant d’aquest tema. Els lectors del meu bloc de ciències de dades (data36.com) em demanen el mateix de tant en tant. I us puc dir que és un problema totalment vàlid.

He decidit resumir les meves respostes per a totes les preguntes principals.

NOVETAT! He creat un curs de vídeo en línia complet (gratuït) per ajudar-vos a començar amb Data Science. Feu clic aquí per obtenir més informació: Com esdevenir un científic de dades.

REGISTRA AQUÍ (GRATU )T): https://data36.com/how-to-become-a-data-scientist/

# 1: Quines són les habilitats i les eines més importants del científic científic de dades? I com podeu aconseguir-los?

Una bona notícia: una mala notícia.

Començaré pel dolent. En un 90% dels casos, les habilitats que t’ensenyen a les universitats no són realment útils en projectes de ciències de dades de la vida real. Com he escrit unes quantes vegades, en els projectes reals calen 4 habilitats de codificació de dades:

  • bash / línia de comandaments
  • Python
  • SQL
  • R
  • (i de vegades Java)
font: KDnuggets

Quins dos o tres que us resultin més útils depèn realment de la companyia ... Però, si n’heu après, serà molt més fàcil aprendre’n un altre.

La primera gran pregunta és: com podeu aconseguir aquestes eines? Aquí arriba la bona notícia! Totes aquestes eines són gratuïtes. Vol dir que podeu descarregar-les, instal·lar-les i utilitzar-les sense pagar ni un cèntim. Podeu practicar, crear un projecte de passatemps de dades o qualsevol cosa.

Fa poc vaig escriure un article pas a pas sobre com instal·lar aquestes eines a l’ordinador. Consulteu-ho aquí.

# 2: Com aprendre?

Hi ha 2 maneres principals d’aprendre la ciència de dades de manera fàcil i rendible.

1r: Llibres.

Escola antiga de Kinda, però encara és una bona manera d’aprendre. A partir de llibres podeu obtenir coneixements molt enfocats i molt detallats sobre anàlisi de dades en línia, estadístiques, codificació de dades, etc. ... He destacat 7 llibres que us recomano al meu article anterior, aquí.

Els 7 millors llibres de dades que recomano

2n: Seminaris en línia i cursos de vídeo.

Els cursos en línia de ciències de dades s’aconsegueixen amb preus justos (entre 10 i 500 dòlars dòlars) i cobreixen diversos temes que van des de la codificació de dades fins a la intel·ligència empresarial. Si al principi no voleu gastar diners en això, he enumerat cursos gratuïts i materials d'aprenentatge en aquesta publicació.

(3r: El curs del primer mes de Junior Data Scientist) he creat un curs de 6 setmanes en línia sobre ciències de dades per a que els científics aspirants a les dades practiquin i resolguin tasques reals en un conjunt de dades de veritat: El primer mes de Junior Data Scientist .)

# 3: Com es practica i com s’obté experiència real

Això és complicat, oi? Tota empresa vol tenir persones amb almenys una mica d’experiència de vida real ... Però, com s’obté experiència de vida real, si necessiteu experiència real per obtenir el vostre primer treball? Captura 22 clàssica. I la resposta és: projectes per a mascotes.

"Projecte per a mascotes" vol dir que us presentem una idea de projecte de dades que us fa emocionar. Aleshores simplement comenceu a construir-lo. Podeu pensar-hi com una petita arrencada, però assegureu-vos que continueu centrant-vos en la part de ciències de dades del projecte i només podeu ignorar la part comercial. Per donar-vos algunes idees, aquí teniu alguns dels meus projectes per a mascotes dels darrers anys:

  • Vaig crear un script que controlés un lloc web immobiliari i em va enviar per correu electrònic les millors ofertes en temps real, de manera que pogués obtenir aquestes ofertes abans que tothom.
  • Vaig crear un guió que retirava tots els articles de forma ABC, BBC i CNN i, a partir de les paraules utilitzades, vaig connectar els articles sobre el mateix tema als 3 portals de notícies diferents.
  • Vaig crear un chatbot autoaprenentatge a Python. (Però no és massa intel·ligent, ja que encara no l'he entrenat.)

Sigues creatiu! Cerqueu un projecte de mascotes relacionat amb ciències de dades per a vosaltres mateixos i comenceu a codificar. Si heu colpejat al mur amb un problema de codificació, que es pot produir fàcilment, quan comenceu a aprendre un nou llenguatge de dades, només cal que utilitzeu google i / o stackoverflow. Un breu exemple meu: sobre l'eficàcia del flux d'estoc és:

costat esquerre: la meva pregunta - costat dret: la resposta (en 7 minuts)

Fixeu-vos en la marca de temps! He enviat una sèrie de preguntes complicades i he tornat a respondre en 7 minuts. L’única cosa que havia de fer era copiar-enganxar el codi al meu codi de producció i boom, només funcionava!

(Nota: Cross Validated és un altre gran fòrum per a qüestions relacionades amb la ciència de dades.)

+1 suggeriment:

Encara que sigui una mica difícil, proveu d’aconseguir un mentor. Si teniu la sort, trobareu algú que treballi en un paper de Data Scientist en una empresa agradable i que pugui passar una hora setmanal o quinzenal amb vosaltres i discutir o ensenyar coses.

# 4: On i com envieu la vostra primera sol·licitud de treball?

Si no heu aconseguit trobar un mentor, podeu trobar-ne el primer a la vostra primera empresa. Aquesta serà la vostra primera feina relacionada amb la ciència de dades, de manera que us recomano no centrar-vos en diners grans ni en un ambient d’inici fantàstic. Centra’t en trobar un entorn on puguis aprendre i millorar-te.

Posar el vostre primer treball de ciències de dades en una empresa multinacional pot no estar alineat amb aquesta idea, perquè les persones que solen estar molt ocupades amb les seves coses, de manera que no tindran temps ni motivació per ajudar-vos a millorar (per descomptat, sempre hi ha excepcions).

No és bona idea tampoc en el seu cas començar a començar com una primera persona de dades de l'equip, ja que aquestes empreses no tenen informació sobre els que es pot aprendre.

Li aconsello centrar-se en empreses de 50 a 500 empreses. Aquesta és la mitjana daurada. Científics de dades senceres estan a bord, però no estan massa ocupats per ajudar-vos i ensenyar-vos.

D'acord, heu trobat algunes bones empreses ... Com sol·licitar-ho? Alguns principis per al vostre currículum: destaqueu les vostres habilitats i projectes, no la vostra experiència (ja que encara no teniu massa anys en paper). Llisteu els idiomes de codificació rellevants (SQL i Python) que utilitzeu i enllaceu alguns dels vostres repositoris de github relacionats, de manera que podreu demostrar que realment heu utilitzat aquest idioma.

També, en la majoria dels casos, les empreses demanen una carta de presentació. És una bona oportunitat per expressar el vostre entusiasme, per descomptat, però també podeu afegir alguns detalls pràctics, com ara què faríeu les vostres primeres setmanes si us contractessin. (Per exemple, "A la vista del vostre flux de registre, suposo que la pàgina web ____ té un paper important. En les meves primeres setmanes realitzaria ___, ___ i ___ (anàlisis específiques) per demostrar aquesta hipòtesi i entendre-la més profundament. Podria ajudar l’empresa a millorar _____ i, eventualment, a empènyer els _____ KPIs. ”)

Tant de bo això us resulti una entrevista de feina, on pugueu xerrar una mica sobre els vostres projectes de mascotes, els vostres suggeriments de carta de presentació, però es tractarà majoritàriament d’adaptació a la personalitat i, probablement, d’alguna prova bàsica d’habilitats. Si hagueu practicat prou, passareu això ... però si sou de tipus nerviós i voleu practicar més, ho podeu fer a hackerrank.com.

Conclusió

Bé, ja està. Sé que sona més fàcil quan s’escriu, però si realment estàs decidit a ser científic de dades, no serà cap problema fer-ho realitat. Bona sort amb això!

Si voleu provar, com és ser un investigador de dades més jove en un inici de vida real, feu un cop d’ull al meu curs de ciències de dades en línia de sis setmanes: el primer mes de Junior Data Scientist!

I si voleu obtenir més informació sobre ciències de dades, consulteu el meu bloc (data36.com) i / o subscriviu-vos al meu butlletí informatiu. No us perdeu la meva nova sèrie de tutorials de codificació: SQL for Data Analysis!

Gràcies per llegir!

Us ha agradat l'article? Si us plau, informeu-me fent clic a la següent. També ajuda a altres persones a veure la història.

Tomi Mester autor de data36.com Twitter: @ data36_com