Softserve recomienda cinco libros imprescindibles para dominar el Big Data

Francisco Carrasco M. 18 de jun. de 2024 Lectura de 4 minutos

El espacio digital se expande a un ritmo sin precedentes, abarcando desde usos cotidianos hasta la generación masiva de información que impulsará la utilización de modelos de lenguaje grande (LLM, por sus siglas en inglés) y la inteligencia artificial (IA). Sin embargo, según un estudio de Seagate, a pesar del alto volumen de datos creados, solo una quinta parte se analiza.

Esta brecha está comenzando a cerrarse gracias al continuo desarrollo y lanzamiento de nuevos servicios en la industria, lo que está abriendo vastas oportunidades laborales en el sector tecnológico, indica Daniel Restrepo, ingeniero sénior de Big Data en SoftServe y destaca que:

"...[] el mercado de Big Data ha experimentado un crecimiento de 5.3 veces en los últimos siete años y se espera que alcance un valor de 829 mil millones de euros para 2025, según la Comisión Europea. A medida que aumente la demanda, habrá una gran necesidad de especialistas cualificados en Big Data para el mercasdo chileno y regional".

El ingeniero nos comparte una lista de cinco libros que guiarán a principiantes e intermedios por los principios fundamentales y las técnicas más avanzadas de Big Data:

Fundamentos de ingeniería de datos: planificar y construir sistemas de datos robustos

«Fundamentals of Data Engineering: Plan and Build Robust Data Systems» de Joe Reis y Matt Housley guía a los lectores desde los conceptos básicos hasta los avanzados en la ingeniería de datos. Abarca la planificación, diseño y construcción de sistemas de datos robustos, destacando tanto los principios fundamentales como las tendencias emergentes en la nube, especialmente con Azure Data.

Progresando paso a paso - Ingeniería de datos con Python

«Data Engineering with Python» es una guía práctica para diseñar, orquestar y gestionar pipelines de datos usando Python. Cubre técnicas ETL esenciales y ofrece ejemplos claros sobre la personalización y flexibilidad en las canalizaciones de datos, proporcionando herramientas y bibliotecas que agilizan el flujo de datos y empoderan al lector con habilidades técnicas avanzadas.

¿Tienes dudas? Abre tu perspectiva con The Datapreneurs

«The Datapreneurs» de Bob Muglia explora la evolución de la inteligencia artificial y su impacto futuro, destacando la interacción entre el ingenio humano y los datos digitales. Mediante conversaciones con expertos, el libro ofrece una visión profunda de los beneficios, riesgos y cuestiones éticas asociadas a las tecnologías basadas en datos, subrayando su poder transformador.

Aquí está lo bueno - «Aprender Spark» (2ª edición)

«Learning Spark» desglosa los conceptos y aplicaciones de Apache Spark, cubriendo RDD, DataFrame, Dataset, Spark SQL y MLlib. Los autores explican cómo desplegar aplicaciones Spark y garantizan el uso eficiente de los datos. Daniel recomienda complementar este libro con «Spark Cookbook» de O'Reilly para técnicas y prácticas avanzadas.

Explorando la caja de Pandora - Diseño de aplicaciones intensivas en datos

«Designing Data-Intensive Applications» aborda la construcción de sistemas de datos a gran escala, centrado en fiabilidad, escalabilidad y mantenibilidad. Mediante ejemplos y casos de estudio reales, el libro vincula teoría y práctica, proporcionando una comprensión técnica profunda y estrategias para crear sistemas robustos y escalables de datos.