Una delle professioni più emergenti nel campo tecnologico è quella del Data Scientist. Ovvero il professionista che è in grado di aggregare e analizzare la grande mole di informazioni di cui oggi una azienda dispone in modo da poterle usare nell’ambito decisionale. Il linguaggio di programmazione Python è molto utilizzato come strumento software per questa analisi. Questo testo, scritto da specialisti, mostra diversi tool e tecniche per gestire i dati provenienti da varie fonti e database allo scopo di renderli fruibili per successive analisi statistiche e computazionali. I capitoli sono brevi, centrati su ogni singola tecnica operativa e sempre conclusi con esercizi e codici di esempio. Oltre a Python vengono quindi descritti una serie di tool e strumenti specifici, perlopiù open source, che supportano il lavoro di sviluppo del software. Imparerete a: - Utilizzare Python per leggere e trasformare i dati in diversi formati - Utilizzare strumenti avanzati come Jupiter, Spark, Parquet, Pandas e Hadoop - Generare statistiche e metriche di base utilizzando i dati su disco - Svolgere elaborazioni distribuite su cluster - Convertire dati da varie fonti in formati di archiviazione o query - Preparare i dati per analisi statistiche, visualizzazioni e machine learning - Presentare i dati sotto forma di grafici efficaci

Formato
EPUB
Protezione
Watermark
Data di pubblicazione
31 ottobre 2019
Editore
Collezione
Numero di pagine
234
Lingua
Italiano
ePub ISBN
9788848140638
PDF ISBN
9788848140621
Dimensioni del file
7 MB
EPUB
EPUB accessibility

Funzionalità di accessibilità

  • Sommario navigabile
sottoscrivi

Chi siamo

A proposito di De Marque Lavori Contattaci Condizioni di utilizzo Politica sulla riservatezza Feedbooks.com is operated by the Diffusion Champlain SASU company