A juzgar por lo que vi la semana pasada en el evento de IBM, la profesión de moda es la de los científicos de datos. En todas las presentaciones que vi los nombraron como figura crítica. Me cuentan que no hay muchos y que ganan mucho dinero. Las empresas mas exitosas del mundo están creado equipos de científicos de datos. Y también debería tenerlos la suya.

Los científicos de datos son una necesidad latente de cualquier negocio. ¿Quienes son, qué hacen y por qué son tan importantes estos personajes?

Información estructurada vs. información no estructurada

El mundo se está llenando de información. Leí recientemente que en un año cualquiera se produce mas información que toda la que se había producido en el pasado hasta ese momento.

La forma como se produce la información ha cambiado radicalmente. En el inicio de la computación, la mayoría de la información estaba almacenada en bases de datos relacionales. En esencia tablas con campos y registros que compartían campos en común de manera que se pudieran conectar unas a otras.

Para ilustrar la idea, imagínese como usa excel. Posiblemente tiene un cuadro en donde pone el nombre de sus clientes en una columna y al lado cada una de las transacciones que ellos han hecho con ud. En este caso el cuadro sería la tabla. Las columnas (cliente y monto) serían los campos y cada fila un registro. Posiblemente tenga otra lista con los mismos clientes, pero en lugar de transacciones tenga direcciones o contactos. El campo común, el nombre del cliente relaciona a ambas tablas y la información se puede cruzar fácilmente.

En la actualidad, la mayoría de la información no necesariamente se guarda estructurada como en excel, por tablas, filas y columnas con campos comunes identificables entre si. Se parece mas a Word o Powerpoint. Hay información importante allí, pero está embebida en el texto y por ende es difícil de encontrar y analizar. Obviamente no hay un campo común que pueda facilitar el cruce de la información.

Pero reitero el punto crítico de todo esto, hay información muy importante ahí. En las redes sociales, en documentos, en correos electrónicos y chats. La producen sus empleados, la producen sensores y máquinas. Pero sobre todo la producen su clientes, actuales y potenciales. ¿Cómo se puede aprovechar este conocimiento? La llave la tienen los científicos de datos.

¿Qué hace un científico de datos?

Es obvio que hay una lógica computacional detrás de la información. Pero por la forma como está siendo almacenada es muy difícil usarla. No obstante, sabemos que hay allí escondida información crítica para tomar decisiones y ofrecer nuevas propuestas de valor. Usando herramientas especializadas y un método similar al que usan los científicos en un laboratorio, es posible encontrar patrones comunes en la información. Así es como se saca el valor de esta información.

La tarea de los científicos de datos es ejecutar esta búsqueda. Los científicos de datos experimentan con información no estructurada, para encontrar patrones comunes. Cuando encuentran alguna perspectiva que consideran pueda ser importante para el negocio, la publican en un formato que el negocio pueda usar. A esto se le llaman Datasets. Por ejemplo, gracias a los científicos de datos es posible cruzar su búsqueda sobre un tópico, con el contenido de los libros que están indexados en Amazon. Es así como Amazon le puede recomendar libros que le interesen con bastante precisión.

Vale la pena aclarar, porque he visto muchísima confusión, que un científico de datos no es lo mismo que un analista de datos. En la práctica el primero es proveedor del segundo. El científico de datos, elabora y prueba hipótesis, y construye, limpia y publica información. El analista toma la información y construye reportes con los cuales se toman decisiones. Un analista tendrá muchos problemas con su trabajo si le entrega una masa de información sin relación aparente alguna. Un científico se aburrirá en segundos, si lo pone a hacer reportes.

¿Quienes son los perfiles ideales de la profesión?

Por desgracia se trata de una profesión muy nueva. No conozco ninguna universidad que ofrezca esta carrera. Así que encontrar científicos de datos es un reto.

Las personas ideales para esta profesión deben combinar exitosamente conocimientos de matemática, estadística y de programación, pero sobre todo deben saber comunicar sus hallazgos. Los científicos de datos deben ser curiosos y fuertemente tolerantes a la frustración. En esencia, deben ser similares a cualquier científico de laboratorio. En resumen, un perfil casi imposible de encontrar.

Por ende, y teniendo en cuenta que hay una demanda creciente por sus servicios, los científicos de datos no van a ser baratos. Pero tenga la seguridad de que van a pagar su costo con creces. Los resultados de su trabajo lo convertirán en una empresa competitiva y diferente. En últimas la razón, por la cual quería hacer una transformación digital en primera instancia.

  • Victor Espinosa

    Soy Data Scientist de JHU. Me pueden contactar vía twitter a @victuol para sus proyectos de datos.

About Andrés Waldraff

Geek de corazón, pero administrador de profesión, estoy sentado en la confluencia entre los negocios y la tecnología. Soy emprendedor e inversionista. Hoy dedico mi tiempo a mi mayor pasión, impulsar la innovación empresarial a través del emprendimiento. Me puede encontrar en Twitter como @awaldraff

Category

EDITORIAL

Tags

, , ,