zapotrzebowania w zakresie analizy znacznych zbiorów danych i wydobywania z nich ergonomicznych danych stale rosną. Spośród przystępnych narzędzi dedykowanych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python.
Apache Spark idealnie się nadaje do analizy pokaźnych zbiorów informacji, a PySpark produktywnie usprawnia integrację Sparka ze specjalistycznymi narzędziami PyData. Aby jednak można było w pełni skorzystać z tych możliwości, niezbędne jest zrozumienie interakcji między algorytmami, zbiorami informacji i wzorcami używanymi w analizie informacji.
Oto użyteczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych przy pomocy interfejsu PySpark, z użyciem prawidłowych praktyk programowania w systemie Spark.
Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na modnych technikach przetwarzania informacji, takich jak klasyfikacja, grupowanie, oczyszczanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach.
Dodatkowym plusem są opisy zastosowania przetwarzania obrazów i języka naturalnego. Zaletą jest także szereg rzeczywistych przykładów wielkich zbiorów danych i ich progresywnej analizy. Dzięki książce poznasz: model programowania w ekosystemie Spark podstawowe metody używane w nauce o danych pełne implementacje analiz obszernych publicznych zbiorów informacji solidne przypadki zastosowania narzędzi uczenia maszynowego kod, któryprzystosujesz do swych potrzeb PySpark: systemowa odpowiedź na problemy inżyniera informacji!
Tytuł progresywna analiza danych w PySpark Autor praca zbiorowa Wydawnictwo Helion EAN 9788383220697 ISBN 9788383220697 Kategoria Literatura, Informatyka liczba stron 192 Rok wydania 2023 Oprawa broszurowa