Pasar al contenido principal

ES / EN

El desafío del “big data”, más que sólo grandes volúmenes de datos
Miércoles, Septiembre 7, 2011 - 17:38

La ya enorme cantidad de datos que generan empresas, usuarios y dispositivos, ha experimentado un crecimiento explosivo que requerirá en un futuro cercano su análisis para obtener ventajas competitivas. La clave de la productividad será transformar el big data en inteligencia de negocios.

Eric Schmidt, director General de Google: “entre el nacimiento del mundo y el año 2003, hubo cinco exabytes de información creada. Ahora creamos cinco exabytes cada dos días”.

La gran mayoría de los CIO y CTO de las grandes compañías dicen que los desafíos más relevantes que deberán enfrentar las empresas en un futuro inmediato, son la movilidad, las aplicaciones en la nube y el  “big data” (BD). Cada vez más mencionado y analizado en medios y publicaciones especializadas, el BD se está configurando como el punto de inflexión de las organizaciones que logren 'dominarlo' y analizarlo, puesto que podrán utilizar la información extraída y procesada para elaborar efectivos planes de business intelligence (BI), anticiparse a crisis y, lo más determinante, a una velocidad casi instantanea. Las oportunidades de capitalizar con rapidez las ventajas competitivas de una organización, estará supeditada a la capacidad de procesar el BD.

“Las empresas se han dado cuenta que la única manera de obtener ventajas competitivas es teniendo capacidad para procesar su principal activo, que es la información que la propia empresa genera", dice Matías Gil, country Manager de Teradata para Chile y Perú. "Por lo que hay que procesar mucha información bajo un modelo lógico de negocios; todas las grandes compañías están preocupadas en poder sacar la inteligencia de los datos”.

Lo quieran o no las empresas, el BD irá en franco aumento, puesto que la utilización de tecnología hace ya casi dos décadas en los procesos de gestión empresarial, ha generado una gran cantidad de información (facturas, planillas, reportes, informes, papers, memos, etcétera), configurando un enorme almacén de datos relevantes que puede transformarse en información útil, sí y sólo sí, están ordenados, analizados y transformados en respuestas en tiempo real que puedan resolver problemas específicos de una compañía. Ahora, niungún dato, por más antiguo o pequeño que parezca, es descartado.

El BD está compuesto por grupos de datos de dimensiones y complejidades que  superan la capacidad de las tecnologías comúnmente utilizadas para capturarlos, gestionarlos y procesarlos a un precio asequible y dentro de un plazo de tiempo aceptable. Para identificar aún más a estos 'almagestos digitales', se pueden dividir en grandes datos de transacciones comerciales (pasadas y presentes) y los grandes datos de las interacciones, como por ejemplo, la irrupción y masificación de los medios sociales, registros de llamadas, etcétera.

Según el estudio realizado por IBM "The Essential CIO - Midmarket CIO Study 2011", en donde se consultó a CIOs de empresas medianas, el 83% de los encuestados considera a la analítica de datos, es decir, la capacidad de extraer información procesable y útil del BD, como el área más importante de inversión, lo que refleja la trascendencia por hacerse cargo del BD en un entorno empresarial cada vez más complejo.

Sin embargo, el desafío del BD no es para todas las empresas, puesto que sólo las grandes compañías tienen la capacidad de invertir en estas tecnologías. Las empresas medianas y pequeñas no se enfrentan áun a la problemática del BD, debido al origen histórico-tecnológico que genera la acumulación de las grandes cantidades de datos.

“Las medianas empresas están en estadios de maduración tecnológica distintos a las grandes empresas, por lo que creo que tienen algún rezago. Además deben invertir en otras aplicaciones primero, por lo que deben estar manejando herramientas más básicas por ahora para el manejo de datos", dice Mariana Zamoszczyk, Program Manager IT Service IDC Latinoamérica. "Será paulatina la adopción en este segmento”.

Ahora bien, el desafío para lograr extraer la inteligencia del BD para que se transforme en nuevas estratégias y fórmulas de éxito empresarial, depende de la acertada identificación de la gran variedad de datos por analizar y por la velocidad de respuesta, factor muy valorado por los departamentos de BI que deben enfrentar problemas y turbulencias cada vez más inesperadas.

Por ejemplo, el BD hoy en día se nutre principalmente de los medios de comunicación social y móviles, que incluyen una gran variedad de datos tabulares (bases de datos), datos jerárquicos, documentos, correos electrónicos, datos de medición, video, imágenes fijas, audio, datos de cotización bursátil, transacciones financieras y mucho más. La velocidad en este proceso es de entrada y de salida, puesto que tanto la cantidad de datos que se deben procesar, que se producen a cada segundo, como la velocidad de procesamiento, son acelerados. Por lo que los sistemas de almacenamiento y procesamiento, hardware y software, deben satisfacer la demanda por respuetas rápidas y acertivas.

"Por ejemplo, una empresa tiene un universo de distintas unidades de información. Uno de contabilidad, que puede ser SAP, Oracle u otro, y esa misma empresa puede tener otro sistema para lo que es su CRM, que puede ser de cualquier proveedor o de propio desarrollo. Además, otro de core business de riesgo, etcétera, y generalmente, cuando son organizaciones grandes, tienen muchos sitemas, entonces cada sistema genera informacion y yo necesito consolidar toda esa información en un único repositorio con una visón lógica e integrada. Allí es donde juega Teradata", dice Gil al explicar la gran cantidad de información proveniente de diferentes fuentes que Teradata procesa.

Tal como dice el ejecutivo, el proceso se inicia con la identificación de cúal es el modelo de datos de negocios y qué información se requiere para extraer la inteligencia y responder a la pregunta que la empresa necesita resolver. Luego se debe modelar y acceder a toda la información que hay dentro de la empresa y plasmarla en un modelo lógico de datos. Esta extracción de inteligencia sobre el data warehouse puede ser con información semanal, mensual, online, etcétera, por lo que la idea es que las respuestas puedan ser en tiempo real para que los ejecutivos puedan estar monitoreando su negocio en línea, tomando decisiones al instante de acuerdo a los indicadores que se le están entregando.

"Un gerente de retail que quiere ver en tiempo real cómo van las ventas de un determinado artículo en determinado momento y en determinada tienda, puede tener esa información y en base a ella, activar en tiempo real campañas, descuentos y promociones, maximizando el retorno de los ingresos en ese producto específicamente", dice Gil.

La importancia de la data. El uso de grandes volúmenes de datos se convertirá en una base clave de la competencia y el crecimiento de las empresas. Desde el punto de vista de la competitividad y la captura potencial de valor, todas las empresas deben tomar los datos con especial seriedad. Según el estudio del McKinsey Global Institute denominado “Big data: The next frontier for innovation, competition, and productivity”, en el sector público el procesamiento del BD tiene un enorme potencial, indicando que en los EE.UU. si el sector Salud, por ejemplo, utilizara sus grandes volúmenes de datos de manera creativa y eficaz, podría aumentar la eficiencia y la calidad, generando más de US$300 millones en valor cada año.

Como una de las grandes innovaciones del 2010 en cuanto a la capacidad de procesamiento del BD, SAP lanzó el HANA (High-Performance Analytic Appliance), tecnología que mezcla hardware y software y que promete analítica en tiempo real de gran cantidad de datos. Empresas como Lenovo, Colgate-Palmolive y Basf utilizan esta tecnología. En cuanto a la entrada en América Latina de esta tecnología, Emilio Mariño, vicepresidente Senior de SAP Business Analytics para Latinoamérica, dice que los usuarios de la solución de base de datos y analítica HANA pudieron mejorar la velocidad de procesamiento en 20 veces. “En la región hemos visto un creciente interés por HANA, ya que los clientes que la han adquirido pueden tener un análisis rápido y tomar acciones a favor de la rentabilidad de sus negocios”.

El BD irrumpió explosivamente y todo indica que seguirá creciendo a un ritmo muy acelerado. IDC estima que 45 gigabytes produce cada persona en el mundo (281 billones de gigabytes), que sumada al volumen y especificación de la información recopilada por las empresas, la masificación de los medios sociales, así como futuras tendencias como la internet de las cosas o la comunicación Machine to Machine, generará un aumento exponencial de los datos en un futuro cercano. El análisis de grandes conjuntos de datos, se convertirá en la nueva llave dorada de la competitividad y la innovación.

Autores

Pablo Albarracín