Metody statystyczne są kluczowym narzędziem w data science, mimo to niewielu analityków danych zdobyło wykształcenie w ich zakresie. Może im to utrudniać uzyskiwanie dobrych efektów. Zrozumienie ergonomicznych zasad statystyki okazuje się ważne ponadto dla programistów R i Pythona, którzy tworzą rozwiązania dla data science.
Kursy podstaw statystyki rzadko jednak uwzględniają tę perspektywę, a większość podręczników do statystyki w ogóle nie zajmuje się narzędziami wywodzącymi się z informatyki. To drugie wydanie modnego podręcznika statystyki przeznaczonego dla analityków danych.
Uzupełniono je o znaczne przykłady w Pythonie, a także wyjaśnienie, jak stosować poszczególne metody statystyczne w problemach data science, a także jak ich nie używać. Skoncentrowano się też na tych zagadnieniach statystyki, które odgrywają widoczną rolę w data science.
Wyjaśniono, które koncepcje są ważne i przydatne z tej perspektywy, a które mniej widoczne i dlaczego.Co ważne, poszczególne koncepcje i zagadnienia ergonomiczne przedstawiono w sposób przyswajalny i zrozumiały również dla osób nienawykłych do posługiwania się statystyką na co dzień.
W książce między innymi: analiza eksploracyjna we wstępnym badaniu danych próby losowe a jakość obfitych zbiorów informacji podstawy planowania eksperymentów regresja w szacowaniu wyników i wykrywaniu anomalii statystyczne uczenie maszynowe uczenie nienadzorowane a znaczenie informacji niesklasyfikowanych Statystyka: tradycyjne narzędzia w najnowszych technikach!
O autorach Peter Bruce jest ekspertem w dziedzinie nauczania statystyki. Prowadzi Institute for Statistics Education, gdzie oferuje setki kursów skierowanych pomiędzy innymi do naukowców. Dr Andrew Bruce jest głównym analitykiem w Amazonie.
Od trzydziestu lat zajmuje się statystyką i nauką o informacji, opracowując rozwiązania problemów z wielu branż. Dr Peter Gedeck jest badaczem w Collaborative Drug Discovery. Kreuje algorytmy uczenia maszynowego do przewidywania atrybuty substancji stanowiących potencjalne leki.