Ważnym zadaniem inżynierów danych jest kreowanie modeli uczenia maszynowego. Używa się do tego narzędzi do analizy biznesowej, takich jakPower BI. Możliwości Power BI są imponujące, a można je na dodatek rozbudować. Jedną z ciekawszych metod wzbogacania modelu danych i wizualizacji Power BI jest zastosowanie złożonych algorytmów zaimplementowanych w językach Python i R. W ten sposób można nie tylko tworzyć niebanalne wizualizacje danych, lecz także pozyskiwać dzięki nim kluczowe dla biznesu dane.
Dzięki tej książce dowiesz się, jak to zrobić. Zaczniesz od przygotowania środowiska Power BI do używania skryptów w Pythonie i R. Następnie będziesz importować informacje z nieobsługiwanych obiektów i przekształcać je za pomocą wyrażeń regularnych i złożonych algorytmów. Nauczysz się powodować zewnętrzne interfejsy API i korzystać z nowoczesnych technik w celu przeprowadzenia dogłębnych analiz i wyodrębnienia cennych informacji przy pomocy narzędzi statystyki i uczenia maszynowego i poprzez użycie optymalizacji liniowej i innych algorytmów. Zapoznasz się jeszcze z głównymi cechami statystycznymi zestawów danych i z metodami tworzenia przeróżnych wykresów usprawniających zrozumienie relacji pomiędzy zmiennymi.
Najciekawsze zagadnienia:
- złożone przekształcanie danych w Power BI przy pomocy skryptów Pythona i R
- anonimizacja i pseudonimizacja danych
- praca z znacznymi zestawami informacji
- wartości odstające i brakujące dla informacji wielowymiarowych i szeregów czasowych
- tworzenie złożonych wizualizacji informacji
Wyzwól solidną moc Power BI!