Curso de Administración de Apache Hadoop con Cloudera
Los asistentes a este curso aprenderán de una forma práctica a instalar y configurar YARN, MapReduce y HDFS, determinar la infraestructura apropiada de hardware para un clúster Hadoop, configurar y desplegar el clúster para integrarse con el centro de datos, cargar datos en el clúster usando Flume y Sqoop, configurar FairScheduler para proporcionar SLAs para múltiples usuarios de un clúster, mejores prácticas para preparar y mantener Apache Hadoop en producción, diagnosticar y resolver fallos en Hadoop.
Información del curso
Tests de autoevaluación
Las unidades didácticas incluyen tests de autoevaluación finales para fijar los conocimientos adquiridos.
Diploma de superación
Los alumnos pueden descargar su diploma inmediatamente después de superar el curso.
Foros del curso
Los alumnos pueden utilizarlos para contactar con los tutores e intercambiar conocimientos con otros compañeros.
Curso de Administración de Apache Hadoop con Cloudera
Objetivos
Los asistentes a este curso aprenderán de una forma práctica a instalar y configurar YARN, MapReduce y HDFS, determinar la infraestructura apropiada de hardware para un clúster Hadoop, configurar y desplegar el clúster para integrarse con el centro de datos, cargar datos en el clúster usando Flume y Sqoop, configurar FairScheduler para proporcionar SLAs para múltiples usuarios de un clúster, mejores prácticas para preparar y mantener Apache Hadoop en producción, diagnosticar y resolver fallos en Hadoop.
Dirigido a
Responsables de sistemas de información, administradores de sistemas, profesionales responsables de la gestión y explotación de los servicios de IT, implementadores de soluciones Big Data y profesionales de TI que deseen adquirir la base de conocimiento necesaria para preparar el examen CCAH (Cloudera Certified Administrator for Apache Hadoop).
Requisitos previos
Disponer de conocimientos (certificación LPIC-1 o conocimiento equivalente) y experiencia en administración básica de Linux, experiencia con tecnologías de virtualización y conocimientos de conceptos de redes: DNS, TCP/IP, Firewalls.
Contenidos del curso
· Componentes principales de Hadoop · Conceptos fundamentales
· HDFS Daemons · Operación de un clúster Apache Hadoop · Objetivos de diseño HDFS · Componentes de un clúster HDFS · Interfaz de usuario Web Namenode
· Serialización de datos · Rutas de lectura y escritura · Comandos para manipulación de archivos · Inserción de datos con Flume · Inserción de datos con Sqoop · Interfaces REST
· ¿Qué es MapReduce? · Conceptos básicos de MapReduce · Arquitectura de clúster YARN · Asignación de recursos · Recuperación de fallos · Interfaz Web YARN
· Consideraciones generales de planificación · Seleccionar el hardware adecuado · Consideraciones de redes · Configuración de nodos · Planificación para la gestión del clúster
· Tipos de despliegues · Instalación de Hadoop · Configuración de Hadoop · Configuración inicial de HDFS · Configuración inicial de MapReduce y YARN · Logging de Hadoop
· Hive · Impala · Pig
· ¿Qué es un cliente Hadoop? · Instalar y configurar clientes Hadoop · Instalar y configurar Hue · Autenticación y autorización en Hue
· Motivos para Cloudera Manager · Características de Cloudera Manager · Versiones Express y Enterprise · Topología de Cloudera Manager · Instalación de Cloudera Manager · Instalar Hadoop usando Cloudera Manager · Tareas básicas de administración con Cloudera Manager
· Parámetros de configuración avanzada · Configuración de puertos de Hadoop · Inclusión y exclusión explícita de hosts · Configuración de HDFS para Rack Awareness · Configuración de HDFS para alta disponibilidad
· Importancia de la seguridad en Hadoop · Conceptos de seguridad en Hadoop · Kerberos · Asegurar un clúster Hadoop con Kerberos
· Gestión de trabajos en ejecución · Programación de trabajos en Hadoop · Configuración de FairScheduler · Impala Query Scheduling
· Estado de HDFS · Copiar datos entre clústers · Añadir y eliminar nodos de un clúster · Rebalancear el clúster · Actualización del clúster
· Monitorización general del sistema · Monitorización de clústers Hadoop · Diagnóstico de fallos en clústers Hadoop · Errores comunes
Otros cursos que te pueden interesar
Solución de problemas y soporte de Windows 8 en la empresa
Informática profesionales
Análisis pericial informático
Informática profesionales
Implementación de entornos de aplicaciones de escritorio con Windows Server
Informática profesionales