Todos los cursos de Informática profesionales

Curso de Big Data, analista de datos y HBase Cloudera

Curso Big Data, analista de datos y HBase Cloudera

Contenidos del curso

Proporcionar los conocimientos y habilidades necesarios acerca de casos de uso de HBase, Hadoop y RDBMS, uso de Hbase Shell, diseño de esquemas con Hbase, conexión a Hbase mediante la Java API, configuración y administración de un clúster Hbase, fundamentos de Apache Hadoop y datos ETL (extracción, transformación y carga), unión de múltiples conjuntos de datos y análisis de datos dispares con Pig, organización de datos en tablas y simplificación de complejas querys con Hive, realizar análisis interactivos en tiempo real de datos masivos usando SQL con Impala y seleccionar la mejor herramienta de análisis para una tarea concreta con Hadoop.

Información del curso

Tests de autoevaluación

Las unidades didácticas incluyen tests de autoevaluación finales para fijar los conocimientos adquiridos.

Diploma de superación

Los alumnos pueden descargar su diploma inmediatamente después de superar el curso.

Solicita más información

Curso de Big Data, analista de datos y HBase Cloudera

Objetivos

Dirigido a

Profesionales TI analistas de datos, analistas de negocio, desarrolladores y administradores.

Requisitos previos

Conocimientos y experiencia en bases de datos, modelado de datos, SQL y UNIX/Linux.

Contenidos del curso

Consulta todos los contenidos que abordamos a lo largo de este curso.

Introducción

   · Introducción a Hadoop y componentes
   · Introducción y conceptos de Hbase

Hbase Administración API

   · Hbase Shell
   · Creación de tablas
   · Hbase Java API
   · Administración de llamadas

Acceso a datos con la API Hbase

   · Obtención de datos de Shell, API Java y Thrift API
   · Adición y actualización de datos en la Shell
   · Conducir datos de Shell, API Java y Thrift API
   · Adición y actualización de los datos con API
   · Scan API
   · Trabajando con Eclipse

Hbase Arquitectura

   · Componentes del clúster
   · Como escalar Hbase
   · Escribir y leer caminos
   · Compactacións y Splits

Instalación y configuración Hbase

   · Instalación, configuración y consideraciones
   · MapReduce y Hbase clusters
   · Replicación y recuperación ante desastres

Diseño de Row Key en Hbase

   · Desde RDBMS al diseño de Hbase Schema
   · Aplicaciones centradas en el diseño. Diseño de Row Key

Diseño Schema en Hbase

   · Familias de columnas
   · Consideraciones sobre el diseño de Schema

Ecosistema Hbase

   · Open TSDB
   · Kiji
   · Hbase and Hive

Fundamentos de Hadoop

   · HDFS
   · MapReduce
   · Ecosistema Hadoop
   · Lab Scenario
   · Introducción de datos con herramientas Hadoop

Pig

   · Introducción, características y casos de uso de Pig. Sintaxis Pig Latin
   · Carga de datos. Tipos de datos simples. Definiciones de campo
   · Salida de datos
   · Schema
   · Filtrado y ordenación de datos. Funciones de uso común
   · Uso de Pig para un procesamiento ETL
   · Procesamiento de datos complejos con Pig
   · Técnicas de combinación de conjuntos de datos
   · Unión y división de conjuntos de datos
   · Práctica sobre análisis de conjuntos de datos dispares con Pig
   · Macros e importaciones
   · UDFs
   · Agregar flexibilidad con parámetros. Aportar funciones
   · Práctica sobre ampliación de Pig con Streaming y UDF

Pig Troubleshooting y optimización

   · Troubleshooting Ping
   · Hadoop Wb UI
   · Muestreo y depuración de datos
   · Mejora de rendimiento de los Pig Jobs Performance

Hive

   · Hive Schema y almacenamiento de datos. Comparativas con bbdd tradicionales
   · Bases de datos y tablas Hive
   · Basic HiveQl Syntax
   · Tipos de datos. Unión de conjunto de datos. Funciones
   · Práctica sobre ejecución de Hive queries en Shell, scripts y Hue

Gestión de datos y procesamiento de textos Hive

   · Creación de bbdd y gestión de tablas. Formato de datos Hive
   · Tablas auto gestionadas
   · Control de acceso de datos
   · Práctica sobre gestión de datos con Hive
   · Funciones de cadena. Expresiones regulares
   · Sentiment Analysis y N-Grams

Optimización Hive

   · Entendimiento de la query performance
   · Plan de ejecución
   · Particionar
   · Bucketing
   · Indexing fecha
   · SerDes
   · Funciones definidas por el usuario y queries parametrizadas
   · Práctica sobre transformación de datos con Hive

Impala

   · ¿Qué es Impala? Uso de Impala Shell
   · Sintaxis básica. Tipos de datos.
   · Filtrado, ordenación y limitación de datos
   · Inscripción y agrupación de datos
   · Análisis interactiva con Impala

Comparativa

   · MapReduce
   · Pig
   · Hive
   · Impala

BUSCADOR DE CURSOS

Encuentra tu curso en un instante

Explora nuestro catálogo de cursos

Otros cursos que te pueden interesar

Nuevas funciones para administradores de Oracle 12c

Informática profesionales

Programación en Java. Análisis orientado a objetos con UML

Informática profesionales

Solución de problemas y soporte de Windows 8 en la empresa

Informática profesionales

SHOP DIPLÓMATE

En marzo del año 2025 estrenamos nuestra tienda online, Shop Diplómate, donde todos los clientes particulares pueden adquirir una selección de nuestros cursos más populares y acceder a sus contenidos de forma inmediata, obteniendo un diploma certificado por Diplómate Formación España al finalizar. También incluimos pruebas gratuitas, en las que el alumno podrá probar la primera unidad didáctica de cada curso de forma totalmente gratuita. Visita Shop Diplómate para ver nuestra selección de cursos.

Visita nuestra tienda online

Contacta con nosotros

Cubre el siguiente formulario o envíanos un correo electrónico para contactar con nosotros.

Formulario de contacto

Hemos recibido su mensaje correctamente.