Anonim

GaudiLab / Shutterstock

Hadoop, un framework software open source Apache per l'archiviazione e lo sgretolamento di set di dati di grandi dimensioni tra cluster di macchine, è arrivato alla grande. Mercati e mercati prevedono a gennaio 2017 che il mercato Hadoop potrebbe crescere a oltre $ 40 miliardi entro il 2021. Tali previsioni stanno iniziando a sembrare pessimistiche, infatti, poiché si prevede che i mercati globali miglioreranno costantemente nel 2018. Un rapporto Forbes del 2018 ha previsto che Hadoop e il mercato dei big data salirà a oltre $ 99 miliardi entro il 2022 (che rappresenta un enorme tasso di crescita previsto del 28, 5%).

Una cosa rimane certa: la crescita su così vasta scala crea un bisogno urgente di professionisti IT molto più abili per sviluppare, gestire e amministrare le implementazioni di Hadoop.

Dato ampio tempo e un debole per l'argomento, molte persone sul campo sentono che puoi imparare ciò che devi sapere su Hadoop tramite lo studio autonomo. Per quelle persone, navigare nella pletora di documentazione sul sito Web di Apache Hadoop è un buon punto di partenza. Puoi anche scaricare la versione open source di Hadoop e cogliere l'occasione per girare alcune manopole ed esplorare Hadoop al tuo ritmo.

Gli amministratori e gli sviluppatori che preferiscono un'esperienza di apprendimento più strutturata possono usufruire di corsi di formazione online gratuiti progettati per farti accelerare rapidamente.

Formazione online di Hadoop

In nessun ordine particolare, qui ci sono più di una dozzina di fantastiche fonti gratuite per l'addestramento di Hadoop.

Precedentemente Big Data University, CognitiveClass.ai offre oltre 50 corsi su Hadoop, HBase, Pig, analisi dei big data, SQL, IBM BLU, DB2 e altro ancora, tutti disponibili al tuo ritmo.

Troverai anche due percorsi di apprendimento dedicati all'apprendimento di Hadoop Fundamentals per principianti e Hadoop Programming per i professionisti Hadoop più avanzati.

Offrono anche un'ampia suite di laboratori virtuali per aiutare gli studenti a praticare ciò che apprendono. La maggior parte dei corsi è in inglese, ma alcuni sono in giapponese, spagnolo e russo. BigDataUniversity gestisce ancora siti Web portoghesi (.br) e mandarini (.cn).

2. Cloudera Essentials For Apache Hadoop

Cloudera ha un corso video online Cloudera Essentials for Apache Hadoop distribuito capitolo per capitolo. Alla Cloudera University troverai formazione Hadoop rivolta ad amministratori, analisti di dati, sviluppatori di data scientist e professionisti della sicurezza.

Il tuo prossimo passo potrebbe essere prendere il corso di tre lezioni Introduzione a Hadoop e MapReduce, offerto attraverso Udacity. Cloudera ha anche un workbench di analisi SQL chiamato HUE, progettato per aiutare le aziende a creare le proprie query self-service - è anche un ottimo strumento di apprendimento per coloro che conoscono l'ambiente Hadoop.

3. Coreservlets.com

A dispetto di sfarzo e glam, coreservlets.com offre una serie di tutorial sullo sviluppo di applicazioni per big data con Hadoop fornito da un'interfaccia di testo semplice.

Ogni sezione del tutorial ti consente di seguire usando PDF e / o diapositive, ma ottieni anche macchine virtuali scaricabili in alcuni casi, nonché esercizi (con soluzioni).

Coursera ha una vasta biblioteca di corsi offerti in collaborazione con diverse università di spicco, come UC San Diego, Stanford, Duke e molti altri.

La politica aziendale stabilisce che è possibile accedere gratuitamente alle lezioni video e ad alcuni compiti non classificati in tutti i corsi. Queste anteprime ti danno l'opportunità di decidere se vuoi acquistare un corso (dal prezzo compreso tra $ 29 e $ 99) e magari continuare a completare un certificato.

Alla ricerca più recente, il motore Coursera ottiene 46 risultati per i corsi che menzionano Hadoop, compresi tutti i tipi di big data e argomenti di scienza dei dati, insieme a una lezione di UCSD intitolata Hadoop Platform and Application Framework.

5. edX

Simile a Coursera, edX offre corsi di università rinomate, ma anche aziende high-tech e altri collaboratori. Nella pagina web principale, inserisci "hadoop" nel campo di ricerca per vedere cosa è attualmente disponibile.

Puoi controllare gratuitamente un corso edX e svolgere tutti i compiti e gli esami, ma solo i partecipanti pagati ricevono un certificato di completamento. Al momento, edX offre sette corsi su Hadoop, ognuno dei quali include la copertura del framework e della piattaforma, e tre dei quali menzionano effettivamente Hadoop nel titolo del corso.

6. DeZyre

DeZyre ti consente di conoscere i big data e Hadoop da esperti del settore, ottenere un tutor e completare progetti … a pagamento. Ma i tutorial gratuiti dell'azienda sono disponibili a chiunque, in qualsiasi momento.

Sfoglia il lungo elenco di tutorial nella pagina Tutorial di DeZyre e fai clic su tutto ciò che stimola il tuo interesse - non è necessario registrarti. Ci sono più di 18 corsi sul sito, di cui due gratuiti.

7. Hortonworks

Hortonworks offre molti buoni corsi a pagamento, nonché esercitazioni e tutorial gratuiti su Hadoop. Per la maggior parte dei tutorial, è necessario scaricare e installare Hortonworks Sandbox e la società raccomanda altri tutorial come prerequisiti per assicurarsi di essere pronti ad apprendere in modo più efficiente.

Come creatore della tecnologia Hadoop, Hortonworks offre uno dei portfolio più completi e rispettati della formazione Hadoop.

8. IBM developerWorks

IBM developerWorks offre tutorial e strumenti gratuiti per l'analisi dei big data, il cloud computing e altre categorie ad alta tecnologia, basati sulle tecnologie IBM. Ad esempio, Scegli IBM Open Platform per i tuoi progetti Hadoop e Spark esplora la sua distribuzione Apache Hadoop e Apache Spark. Lungo la strada, descrive lo scopo o la funzione di ciascun componente, come Spark, MapReduce, Sqoop e altro.

Sebbene sia un po 'lungo, i Big Data Open Source per Impatient sono un solido tutorial che ti guida attraverso i fondamenti dei big data e di Hadoop. Ti fa scaricare un'immagine Hadoop (si consiglia Cloudera) per lavorare con esempi di Hadoop, Hive, Pig, Oozie e Sqoop.

9. Hadoop-Online-Tutorials.com

Il sito di formazione e tutorial di Hadoop gestito da Anil Jain fornisce collegamenti a corsi di formazione personalizzati (a pagamento), nonché tutorial e suggerimenti online gratuiti per i libri consigliati su Hadoop.

Molte delle risorse gratuite menzionate da Jain sono presenti in questo post del blog, ma ne troverai altre che meritano sicuramente una visita.

10. MapR Technologies

MapR è il fornitore di una distribuzione leader di Apache Hadoop. I corsi di formazione Hadoop su richiesta dell'azienda includono video lezioni, laboratori, esercitazioni pratiche e altro ancora e possono portare alla certificazione come MapR Certified Cluster Administrator (MCCA), Data Analyst (MCDA) o Certified Hadoop Developer (MCHD).

MapR offre attualmente Apache Hadoop Essentials, sei diversi corsi di amministrazione cluster, tre corsi per sviluppatori Hadoop e molti altri corsi su richiesta che coprono HBase, MapR Streams, Apache Spark, Apache Drill e Apache Hive.

Sfoglia la pagina di formazione su richiesta per un elenco completo delle offerte di corsi.

11. Udacity

Udacity è ben noto per il suo catalogo di corsi di formazione in scienze dei dati, sviluppo web, ingegneria del software e sistemi operativi mobili realizzati da utenti esperti della Silicon Valley come Facebook e Twitter, Cadence e molti altri. Offre corsi gratuiti e materiale didattico, ma è necessario iscriversi a un programma a pagamento per ottenere una credenziale Nanodegree.

Per visualizzare tutti i corsi gratuiti a colpo d'occhio, vai alla pagina Corsi e programmi di nanodegree e seleziona la casella di controllo Corsi gratuiti nella sezione Filtri. Attualmente, una ricerca su Hadoop presenta tre classi: due su Hadoop stesso e un altro sull'analisi in tempo reale con Apache Storm.

12. Udemy

Udemy offre oltre 40.000 corsi gratuiti ea pagamento su quasi tutto sotto il sole. Quando arrivi alla home page, inserisci "Hadoop gratuito" nella casella di ricerca per vedere cosa viene attualmente offerto.

Attualmente, troverai più di 35 corsi che vanno da cinque a più di 60 lezioni ciascuno, rivolti principalmente ai livelli principianti e intermedi. Tutti fanno menzione specifica e dettagliata di Hadoop.

13. Microsoft Virtual Academy

Il Microsoft Professional Program (MPP) offre una varietà di certificati nelle aree dei big data e della scienza dei dati, tra cui una varietà di altri argomenti.

I corsi offerti includono Elaborazione di big data con Azure HDInsight (che è la distribuzione Hadoop gestita da Microsoft che viene eseguita sul cloud di Azure), Elaborazione di dati in tempo reale con Azure HDInsight e Implementazione dell'analisi predittiva con Spark in Azure HDInsight. Per i quiz classificati e un certificato, è richiesta una commissione di $ 99.

14. YouTube

Come ci si aspetterebbe, YouTube ha una lunga lista di video di formazione di Hadoop. Cerca Hadoop sulla pagina principale, taglia i 100 oltre risultati e scegli alcuni video che fanno al caso tuo.

15. Gruppo LinkedIn utenti Hadoop

Ci sono anche ottime informazioni sulle risorse di formazione di Hadoop scambiate dai membri del gruppo LinkedIn degli utenti di Hadoop. Inoltre, se visiti LinkedIn Learning e fai una ricerca su Hadoop, al momento vengono pubblicati non meno di 297 risultati. Roba fantastica!