Pasar al contenido principal

ES / EN

¿Quiénes son los científicos de datos y por qué deberían importarte?
Martes, Octubre 18, 2016 - 09:42

Esta profesión se ha convertido en una de las más solicitadas a nivel global, y cuenta con las mejores remuneraciones. Sin embargo, muchos no saben de qué trata.

Día a día conceptos como Big Data y Cloud entran rápidamente en el vocabulario base de cualquier empresario de la región. No obstante, hay una profesión relacionada con estos términos que no ha tenido la misma popularidad dentro de los ejecutivos latinos. Hablamos de los científicos de datos, uno de los roles que serán claves en esta transformación digital pero de los más desconocidos dentro de esta evolución tecnológica.

Actualmente, miles de empresas se están enfrentando a la generación de cada vez más datos relevantes dentro de sus negocios. No obstante, si bien muchas empresas han logrado encontrar un sistema para recopilar toda esta información, no cuentan con los profesionales especializados en analizarla.

Este es el trabajo de estos expertos. Si bien todavía no existe una definición exacta de su profesión, estos expertos son los encargados básicamente de interpretar grandes bases de datos con el fin de diseñar una estrategia de inteligencia de negocios e identificar nuevas oportunidades para las compañías.

"Gracias a sus aptitudes, capacidad de entender y analizar el mundo virtual, pueden analizar gran cantidad de datos históricos para obtener tendencias, comportamientos predictivos y conocimientos", sostiene Marcelo Sukni, gerente general de SAS en Chile y Perú, una empresa especializada en este mercado.

¿Cómo encontrar o convertirse en un científico de datos?

De acuerdo a una encuesta de SAS, realizada a 596 profesionales identificados como científicos de datos, estos especialistas destacan en un 41% por tener características “tradicionales” (analítica, técnica, lógica). No obstante, este trabajo no tiene nada de esta “normalidad” a la hora de ser definido, ya que un 55% de los encuestados tiene menos de tres años de experiencia, y más de un tercio de ellos se están adaptando para cumplir funciones que no están aún bien definidas. En tanto, a nivel de género, hay una división de un porcentaje de 70/30 entre hombres y mujeres.

¿De dónde surge esta profesión? Este tipo de profesionales se encargan de una serie de procesos que hace 20 años eran imposibles. Recién finales de los años 90, el campo del machine learning (aprendizaje automático) empezó a tomar autonomía y la capacidad de trabajar con cantidades inmensas de datos se abarató. No obstante, no fue sino hasta unos años que se vivió una gran "democratización" de estas técnicas. Y, con ello, comenzó el boom de los científicos de datos.

En cuanto a su utilidad en la empresas, los usos para esta profesión son tan variados como la cantidad de datos que analizan día a día. No obstante, no sólo tienen relación con encontrar valor agregado para negocios, o ventajas ante su competencia. Hay investigaciones de este tipo que incluso, podrían llegar a impactar tu vida.

Uno de los ejemplos más conocidos en el área es Microsoft y su investigación para descubrir tratamientos más efectivos contra el cáncer. Los especialistas de la empresa de software usan esta información por medio de un sistema que utiliza aprendizaje automático y procesamiento de lenguaje natural para ayudar a los oncólogos a descubrir tratamientos más efectivos e individualizados, al brindar una manera intuitiva para clasificar todos los datos de investigación disponibles.

De esta manera, mientras por un lado los radiólogos pueden acceder a un entendimiento más detallado del progreso de los tumores de sus pacientes.; los investigadores pueden entender cómo se desarrolla el cáncer y qué tratamientos funcionarán mejor para combatirlo, y así llegar a ser capaces de programar células para combatir enfermedades, incluyendo el cáncer.

“Podemos utilizar métodos que hemos desarrollado para computadoras de programación, que nos permiten programar biología, y luego desbloquear incluso más aplicaciones e incluso mejores tratamientos”, comentó Andrew Phillips, que lidera el grupo de investigación computacional biológica en el laboratorio de Microsoft en Cambridge, Reino Unido.

Esto no significa que el cáncer deje de existir, según señaló Jasmin Fisher, investigadora senior en el grupo de principios y herramientas de programación de este centro y profesora asociada en el departamento de bioquímica en la Universidad de Cambridge. “Pero una vez que lo manejas, una vez que sabes cómo controlarlo, es un problema resuelto”, explicó.

Profesionales inexistentes

Hoy en día se exige un perfil para este tipo de trabajos, que hace unos años prácticamente no existía. De esta manera, se requieren profesionales que no sólo tengan conocimientos estadísticos sino que también informáticos paralelamente.

No obstante, no hay una base académica formada para estos profesionales. Es por esto, que muchos investigadores hoy en día nacieron de una formación autodidacta y se diferencian mucho entre sí. Por ejemplo, según un estudio de Burtch Works, mientras un 32% de los científicos de datos vienen del mundo de las matemáticas y la estadística, también hay un 19% que llegó desde la ingeniería informática y un 16% desde otras ingenierías.

A nivel de remuneraciones, estos dependen del lugar, las funciones y el empleador. No obstante, ahora mismo es una carrera bien pagada. A nivel general y según la encuesta anual de KdNuggets los sueldos/ingresos están en una media de US$141.000 dólares para freelance, US$107.000 para asalariados, US$90.000 para trabajadores gubernamentales o en el sector sin ánimo de lucro; US$70.000 para trabajo en universidades.

No obstante, a nivel regional, si bien Chile, Brasil y Colombia, podrían liderar esta industria, todavía existe un importante déficit de profesionales en esta materia y de industrias nacionales que la estén incorporando. 

Según Cristian Bravo, experto en Data Science y uno de los científicos más reconocidos a nivel mundial en Financial Analytics, esto se debe a que actualmente hay tres tipo de evolución diferentes en las empresas de la región. “Están las que son muy avanzadas en temas desarrollo y análisis de datos como Banca y Telecomunicaciones, que los almacenan de manera correcta, los limpian de manera adecuada y quedan listos para ser usados por otras áreas que saben qué hacer con ellos. En el segundo nivel, te encuentras con las empresas que los almacenan pero en forma deficiente o no saben cómo se utilizan, y por último, tienes a las empresas que guardan todo en cajas, lo que pasa también en organismos de gobierno”, dice. Un fenómeno que evidencia el déficit de científicos de datos, y que será el principal desafío de la región dentro de los próximos años.

“Pensemos solo que en Chile hay 221.000 empresas de tamaño pequeño o superior. Si tomamos una cifra conservadora de aquellas que efectivamente tienen datos suficientes para tener la necesidad de aprovecharlos, tenemos que al menos son 40.000.  No hay 40.000 profesionales capacitados en el área. Formar una cantidad adecuada de profesionales especialistas, demora décadas y ese es el problema de Latinoamérica; partimos quince años más tarde que el mundo desarrollado”, remata Bravo. 

Y todavía queda mucho por delante. Uno de los escenarios en los que será vital la presencia de estos profesionales será la llegada de Internet de las Cosas. Con esta tecnología, se espera que cada vez más equipos sean capaces de conectarse entre sí. De esta manera, de acuerdo al reporte anual Visual Networking Index de Cisco, podría existir el triple del tráfico IP para 2020. 

¿Qué deberá hacer la región para solucionar este desfase? Lamentablemente, eso todavía está por verse.

Autores

AETecno