Información del curso

Tests de autoevaluación

Las unidades didácticas incluyen tests de autoevaluación finales para fijar los conocimientos adquiridos.

Diploma de superación

Los alumnos pueden descargar su diploma inmediatamente después de superar el curso.

Foros del curso

Los alumnos pueden utilizarlos para contactar con los tutores e intercambiar conocimientos con otros compañeros.

Solicita más información

Curso de Administración de Apache Hadoop con Cloudera

Objetivos

Objetivos

Los asistentes a este curso aprenderán de una forma práctica a instalar y configurar YARN, MapReduce y HDFS, determinar la infraestructura apropiada de hardware para un clúster Hadoop, configurar y desplegar el clúster para integrarse con el centro de datos, cargar datos en el clúster usando Flume y Sqoop, configurar FairScheduler para proporcionar SLAs para múltiples usuarios de un clúster, mejores prácticas para preparar y mantener Apache Hadoop en producción, diagnosticar y resolver fallos en Hadoop.

Dirigido a

Dirigido a

Responsables de sistemas de información, administradores de sistemas, profesionales responsables de la gestión y explotación de los servicios de IT, implementadores de soluciones Big Data y profesionales de TI que deseen adquirir la base de conocimiento necesaria para preparar el examen CCAH (Cloudera Certified Administrator for Apache Hadoop).

Requisitos previos

Requisitos previos

Disponer de conocimientos (certificación LPIC-1 o conocimiento equivalente) y experiencia en administración básica de Linux, experiencia con tecnologías de virtualización y conocimientos de conceptos de redes: DNS, TCP/IP, Firewalls.

Contenidos del curso

Introducción a Apache Hadoop
   · Componentes principales de Hadoop
   · Conceptos fundamentales
HDFS
   · HDFS Daemons
   · Operación de un clúster Apache Hadoop
   · Objetivos de diseño HDFS
   · Componentes de un clúster HDFS
   · Interfaz de usuario Web Namenode
Introducción de datos en HDFS
   · Serialización de datos
   · Rutas de lectura y escritura
   · Comandos para manipulación de archivos
   · Inserción de datos con Flume
   · Inserción de datos con Sqoop
   · Interfaces REST
YARN y MapReduce
   · ¿Qué es MapReduce?
   · Conceptos básicos de MapReduce
   · Arquitectura de clúster YARN
   · Asignación de recursos
   · Recuperación de fallos
   · Interfaz Web YARN
Planificación del clúster Hadoop
   · Consideraciones generales de planificación
   · Seleccionar el hardware adecuado
   · Consideraciones de redes
   · Configuración de nodos
   · Planificación para la gestión del clúster
Instalación y configuración inicial de Hadoop
   · Tipos de despliegues
   · Instalación de Hadoop
   · Configuración de Hadoop
   · Configuración inicial de HDFS
   · Configuración inicial de MapReduce y YARN
   · Logging de Hadoop
Instalación y configuración de Hive, Impala y Pig
   · Hive
   · Impala
   · Pig
Clientes Hadoop
   · ¿Qué es un cliente Hadoop?
   · Instalar y configurar clientes Hadoop
   · Instalar y configurar Hue
   · Autenticación y autorización en Hue
Cloudera Manager
   · Motivos para Cloudera Manager
   · Características de Cloudera Manager
   · Versiones Express y Enterprise
   · Topología de Cloudera Manager
   · Instalación de Cloudera Manager
   · Instalar Hadoop usando Cloudera Manager
   · Tareas básicas de administración con Cloudera Manager
Configuración avanzada del clúster
   · Parámetros de configuración avanzada
   · Configuración de puertos de Hadoop
   · Inclusión y exclusión explícita de hosts
   · Configuración de HDFS para Rack Awareness
   · Configuración de HDFS para alta disponibilidad
Seguridad de Hadoop
   · Importancia de la seguridad en Hadoop
   · Conceptos de seguridad en Hadoop
   · Kerberos
   · Asegurar un clúster Hadoop con Kerberos
Gestión y programación de trabajos
   · Gestión de trabajos en ejecución
   · Programación de trabajos en Hadoop
   · Configuración de FairScheduler
   · Impala Query Scheduling
Mantenimiento del clúster
   · Estado de HDFS
   · Copiar datos entre clústers
   · Añadir y eliminar nodos de un clúster
   · Rebalancear el clúster
   · Actualización del clúster
Monitorización y diagnóstico de fallos en el clúster
   · Monitorización general del sistema
   · Monitorización de clústers Hadoop
   · Diagnóstico de fallos en clústers Hadoop
   · Errores comunes

BUSCADOR DE CURSOS

Encuentra tu curso en un instante

Otros cursos que te pueden interesar

Contacta con nosotros

Cubre el siguiente formulario o envíanos un correo electrónico para contactar con nosotros.

Formulario de contacto

Correo electrónico

info diplomate.es

Hemos recibido su mensaje correctamente.
He leído y acepto los términos de privacidad.
Escribe el resultado: + =       Ayuda