Date: Fri, 25 Apr 2014 16:11:01 Subject: Cathy O'Neil/Rachel Scutt, Doing Data Science Hej! Nu har jag läst ut Doing Data Science. En ny (okt 2013) O'Reilly-bok skriven av två mycket kompetenta tjejer, Cathy och Rachel. Data Science är mycket bredare ämne än enbart Computer Science. Utöver CS ingår statistik, matematik, maskinlärande, kommunikation, visualisering och inte minst domänexpertis (kunskap om det datan handlar om). Det är tvärvetenskapligt och kräver både bredd och djup. Boken har 360 sidor och lästes på 9,08 arbetstimmar. Den är mycket relevant för jobbet, men mer för att förstå mina kollegor än för mina vanliga uppgifter. Data science är ju även science, och en ganska ny sådan. Med begrepp som hypotes, korrelation, kausalitet, algoritm, Bayes, mening, etik, vektorer, matriser, problemlösning och redskap som Python, R, sed, Perl, Hadoop osv. Det är ett spännande fält att lära sig om, och jobba med. Big Data är hett på marknaden nu. Boken rekommenderas, även om jag inte förstod allt. :-) mvh aö