Alejandro Mora Sáez

Analista e ingeniero de datos

A medida que avanzo en mi formación, descubro mi creciente pasión por el mundo de los datos. Durante este proceso, he adquirido conocimientos sólidos en el diseño, desarrollo y optimización de arquitecturas de datos, así como en la implementación de procesos eficientes para garantizar la calidad y disponibilidad de la información. Esta combinación de aprendizaje y pasión me impulsa a seguir creciendo y explorando nuevas oportunidades para aplicar mis conocimientos en la gestión y análisis de datos.

A través de mi portfolio personal, quiero compartir mi proceso de aprendizaje y desarrollo, así como los proyectos en los que he aplicado mis conocimientos teóricos y habilidades prácticas para enfrentar diversos problemas relacionados con la integración, procesamiento y aprovechamiento de los datos.

Formación

Mis habilidades

Extracción e integracion

Extracción e integración de los datos desde cualquier fuente, en cualquier formato (Bases de datos, APIs, archivos de texto plano, libros de Excel, XML...) y en cualquier enfoque (Streaming, carga incremental, full load...)

Limpieza y enriquecimiento

Identifico y corrijo inconsistencias, errores y valores atípicos en los conjuntos de datos además de normalizar, deduplicar y, si es necesario, añadir información adicional a los datos para enriquecer su posterior análisis.

Modelado

Comprendo las necesidades y objetivos del negocio para desarrollar a medida estructuras de datos optimizadas para nutrir los motores analíticos mediante los que generar informes dinámicos.

Visualización

Creo informes interactivos con métricas y visualizaciones que dan respuesta a las preguntas de negocio y genero aplicaciones para poder compartir estos informes de manera segura y ordenada a los usuarios de la orgfanización.

Sobre mí

Durante mi etapa escolar, las matemáticas siempre fueron mi asignatura favorita. El proceso de utilizar la lógica para interpretar y aplicar fórmulas adecuadas con el fin de resolver problemas específicos me resultaba muy entretenido. De hecho, veía los ejercicios y los problemas matemáticos como un juego, más que como un trabajo.

A día de hoy, encontrar la solución más eficiente para extraer, almacenar, limpiar o modelar los datos con una estrcutura optimizada y adaptada al contexto de la empresa me transmite una sensación similar a lo que sentía de pequeño al hacer esos ejercicios.

Este descubrimiento me llevó a dar un paso decidido en mi carrera profesional, y iniciar mi fromación en el mundo de los datos. Tras un periodo de formación muy enriquecedor, he adquirido habilidades sólidas en el desarrollo de informes y procesos ETL 100% adaptados a las necesidades de la empresa.

❝ Ver el trabajo como entretenimiento

Herramientas

SSMS

Leer más...

SQL Server Management Studio (SSMS) es esencial en mi día a día para administrar bases de datos SQL Server con eficacia. Su interfaz intuitiva simplifica la creación, edición y eliminación de tablas, columnas y usuarios. Además, su integración perfecta con las herramientas de Microsoft, como por ejemplo Visual Studio, facilita en gran medida el desarrollo de procesos ETL en arquitecturas on-premise.

Power BI

Leer más...

La herramienta de análisis de datos por excelencia por su amplia variedad de visualizaciones y por su capacidad de compartir informes y dashboards. Además incluye Power Query para transformar y modelar la información y tiene la capacidad de conectarse a prácticamente cualquier origen. A día de hoy, todos los proyectos en los que trabajo incluyen esta herramienta como plataforma de visualización de la información.

Excel

Leer más...

Aunque sigue siendo una herramienta con un gran potencial para el análisis de datos yo personalmente la utilizo para el preprocesamiento en bruto de los datos. Incluye una amplia gama de funcionalidades que permiten manipular y transformar los datos y representarlos en forma de gráficos y tablas.

Visual Studio

Leer más...

Visual Studio facilita la construcción de soluciones ETL robustas y escalables mediante una interfaz gráfica muy intuitiva. Su gran integración con el resto de las herramientas de Microsoft la convierten en la mejor opción para la integración y transformación de los datos en arquitecturas  on-premise.

Visual Studio Code

Leer más...

Tanto para el desarrollo Python como para HTML o CSS, es mi editor de código preferido ya que es extremadamente versátil. Su amplia gama de extensiones instalables permite conectarse a cualquier carpeta y desarrollar tanto scripts convencionales de python, por ejemplo, como cuadernos de Jupyter (.ipynb) esenciales para el procesamiento de los datos.

Jupyter Notebook

Leer más...

Es la alternativa a VS Studio Code para desarrollar notebooks .ipynb especialmente útiles para la transformación y análisis de datos. Jupyter Notebook ofrece un enfoque más interactivo y documentado para el desarrollo de archivos .ipynb, especialmente en el contexto del análisis de datos y la exploración de datos interactiva.

Row of computers cabinets aligned in a modern data center server room, illuminated by dark blue light at night. Glass doors protect computer servers with displays full of data, numbers, and blue blinking lights and leds. Diminishing perspective, vanishing point, vertical composition.  Copy space on bottom half of image. No people. Digitally generated image. Blue background

Azure SQL

Leer más...

Utilizo Azure SQL en contextos en los que se requiere una base de datos relacional con un esquema definido, consultas SQL y soporte para transacciones; o en los casos en los que necesito un alto rendimiento y baja latencia para cargas de trabajo transaccionales. Es la proyección del SQL Server convencional con el valor añadido de la escalabilidad y seguridad que aporta Azure.

Azure Data Lake

Leer más...

Esencial para gestionar grandes volúmenes de datos de forma eficiente. ADLS permite almacenar datos estructurados, semi-estructurados y no estructurados en un mismo repositorio común y fácilmente accesible. Además, su perfecta integración con herramientas como Azure Synapse Analytics y Azure Databricks simplifica el desarrollo de pipelines ETL complejos.

Azure Event Hubs

Leer más...

Suelo utilizar Event Hub Namespace para escenarios en los que se requiere una alta escalabilidad y rendimiento para la ingesta y procesamiento de eventos en tiempo real. Es una muy buena opción para transmitir eventos o realizar análisis en tiempo real, establecer comunicación entre microservicios y habilitar escenarios de IoT a gran escala.

Azure Stream Analytics

Leer más...

ASA es imprescindible para analizar datos en tiempo real con precisión y velocidad. Personalmente, utilizo esta herramienta en contextos en los que necesito un análisis instántaneo, independientemente de cuál sea el origen de los datos. Su capacidad para transformar y procesar datos mediante consultas SQL en tiempo real y su integración perfecta con Azure Power BI y Azure Data Lake Storage convierten esta herramienta en la mejor opción para contextos de análisis de datos en streaming.

Azure Synapse Analytics

Leer más...

La herramienta fundamental para el desarrollo ETL en Azure. Permite conectarse a cualquier origen, desarrollar ETL mediante canalizaciones con una interfaz similar a la de SSIS, con la capacidad añadida de utilizar clústeres de Apache Spark o SQL para el procesamiento de los datos en paralelo. Además la funcionalidad de SQL Serverless permite consultar cualquier tipo de archivo almacenado en el Data Lake utilizando consultas SQL.

Azure Databricks

Leer más...

Azure Databricks utiliza una plataforma colaborativa basada en clústeres de procesamiento distribuído de Apache Spark que permite desarrollar procesos ETL sobre grandes volúmenes de datos de manera eficiente. Su integración fluida con Azure Synapse Analytics y Azure Data Lake Storage hacen que sea la opción perfecta para proyectos de datos complejos y análisis en profundidad de grandes volúmenes de información.

Ingeniería de datos

Gestión de bases de datos relacionales y desarrollo ETL (Extracción, Transformación y Carga de datos) on-premise y en Azure. Con herramientas como SSIS, Azure Data Factory, Azure Synapse Anlytics y próximamente en Fabric

Arquitectura Lakehouse end to end

Procesamiento de datos en streaming

ETL - SQL Server Integration Services

Análisis de datos

Entender las necesidades del negocio y limpiar, enriquecer y modelar los datos para optimizar el rendimiento de la información en el motor analítico que nutrirá informes interactivos, personalizados disponibles las 24 horas del día para cualquier usuario de negocio.

Análisis de ventas

Arquitectura Lakehouse

Análisis de informes

Programación Python

Desarrollo scripts y aplicaciones prácticas para automatizar procesos rutinarios. Además tengo algo de experiencia programando a nivel básico redes neuronales y módulos de visión artificial y OCR. Domino también el uso de pandas y pyspark en cuadernos .ipynb para ETL y ciencia de datos.

Twitter Scrapper

Reconocimiento gestual

Diseño y arquitectura web

Sin conocimientos avanzados de frontend ni backend, me busco la vida para ir añadiendo funcionalidades a mis sitios web mientras voy aprendiendo poco a poco, sin ser mi principal prioridad, algo de HTML, CSS y Javascript. Tengo también algunas nociones de SEO y diseño.

Portfolio personal

Márketing de afiliación