Una delle professioni più emergenti nel campo tecnologico è quella del Data Scientist. Ovvero il professionista che è in grado di aggregare e analizzare la grande mole di informazioni di cui oggi una azienda dispone in modo da poterle usare nell’ambito decisionale. Il linguaggio di programmazione Python è molto utilizzato come strumento software per questa analisi. Questo testo, scritto da specialisti, mostra diversi tool e tecniche per gestire i dati provenienti da varie fonti e database allo scopo di renderli fruibili per successive analisi statistiche e computazionali. I capitoli sono brevi, centrati su ogni singola tecnica operativa e sempre conclusi con esercizi e codici di esempio. Oltre a Python vengono quindi descritti una serie di tool e strumenti specifici, perlopiù open source, che supportano il lavoro di sviluppo del software. Imparerete a: - Utilizzare Python per leggere e trasformare i dati in diversi formati - Utilizzare strumenti avanzati come Jupiter, Spark, Parquet, Pandas e Hadoop - Generare statistiche e metriche di base utilizzando i dati su disco - Svolgere elaborazioni distribuite su cluster - Convertire dati da varie fonti in formati di archiviazione o query - Preparare i dati per analisi statistiche, visualizzazioni e machine learning - Presentare i dati sotto forma di grafici efficaci

Format
EPUB
Protection
Watermark
Publication date
October 31, 2019
Publisher
Collection
Page count
234
Language
Italian
EPUB ISBN
9788848140638
PDF ISBN
9788848140621
File size
7 MB
EPUB
EPUB accessibility

Accessibility features

  • Table of contents navigation
subscribe

About Us

About De Marque Work @ De Marque Contact Us Terms of use Privacy Policy Feedbooks.com is operated by the Diffusion Champlain SASU company