Debido al boom de las soluciones basadas en datos, es importante detallar cuál es el proceso para generar análisis de datos para la toma de decisiones. El avance en cuanto a herramientas y capacidad de las computadoras para efectuar cálculos de manera rápida, ha permitido evidenciar situaciones en aspectos como la economía, demografía y hasta nuestra genética, entre muchos otros. A continuación, 6 pasos prácticos para generar mejores análisis de datos:
1. Defina bien su problema
Para plantear una solución basada en datos, la clave más importante para recibir los resultados esperados, es definir el problema en una forma clara y concreta. Si dos seres humanos no pueden estar universalmente de acuerdo en qué constituye el problema, mucho menos en su solución. Lo mismo pasa con las computadoras, son solo una extensión de nuestro cerebro que se encarga de recibir instrucciones y arrojar resultados. Asegúrese de tener claro el “qué” de su problema, facilita mucho el proceso de formular el “cómo” solucionarlo.
2. Conozca sus datos
Identifique qué conjunto de datos tiene, de dónde provienen y su disponibilidad. Estudie también sus metadatos (las características de sus datos) como el tamaño, naturaleza de las variables, alcance, fortalezas y debilidades. Esto para saber el rango de soluciones que cada set de datos pueda ofrecer. Referencias como diccionarios de datos permiten a las demás personas involucradas tener acceso a la información de los datos disponibles.
3. Identifique el set de datos ideal
Basado en el problema que usted quiera solucionar, también sepa a lo que quiere llegar para poder solucionarlo. Por ejemplo, si su problema es “¿cuál de mis empleados ha vendido más en los últimos seis meses? “, su conjunto de datos ideal es una lista de empleados, y la suma de ventas para cada uno, para el último semestre vigente. ¿Fácil verdad? Al conocer su entorno de datos, identifique qué datos le hacen falta, y una estrategia para dar con estos y consumirlos. También, asegúrese de “limpiar” sus variables para evitar confusiones (empleados repetidos, faltas de ortografía o formatos).Una buena estrategia es crear análisis exploratorios, con datos simulados, para poder justificar la compra u obtención de los datos faltantes.
4. Haga su análisis reproducible
Como muchas veces la intención de un análisis es comunicar una evidencia o hecho mediante datos, es importante que las demás personas involucradas sepan exactamente cuál fue suestrategia para llegar a ese resultado. Para esto manuales de usuario y guías son muy útiles, más aún cuando es un análisis que se deba repetir periódicamente. Si se tiene la capacidad, hacer un script o código con la solución implementada siempre es la mejor opción, pues con los mismos datos, se va a llegar siempre a los mismos resultados, sin espacio para confusiones o errores de interpretación. Herramientas de análisis de datos populares como Microsoft Excel, tiene su propio lenguaje de programación (VBA) para poder recrear todas las funcionalidades utilizadas. Existen lenguajes de programación especializados como R para computación estadística o Python, entre muchos otros.
5. Rete su análisis
Ya teniendo resultados preliminares, someta sus resultados a prueba. Ya sea con revisiones de otras personas no involucradas en el proceso o pruebas manuales se pueden identificar problemas, ya sea de formato o de cálculo, que pueden ser modificables y mejorables sin necesidad de cambiar la perspectiva del problema y evitar un análisis erróneo. Recuerde, “garbage in, garbage out” (si entra basura, sale basura). Un análisis mal planteado conlleva a malos resultados.
6. Presente su análisis en formatos multiplataforma
Es decir, no se “case” con una herramienta. Muchos clientes tienen diferentes entornos en sus computadoras, muchos no tienen ni siquiera Microsoft Excel en sus computadoras (software que a muchos nos parece imprescindible) o quieren ver sus resultados en su celular o en su computadora con Linux o Mac. Es mejor utilizar archivos en formatos como CSV (archivos separados por coma), .txt (archivos de texto plano), PDF (Formato de Documento Portátil) o HTML (como las páginas web) que independientemente del dispositivo que se utilice los resultados pueden ser fácilmente visibles.
En Grupo Inco nos especializamos en análisis de datos a la medida, y sabemos lo importante que es para los clientes que la información presentada sea lo más correcta y se apegue a las necesidades que intentan resolver.
- Oriundo de San Ramón, Alajuela, Costa Rica. Autodidacta. Aficionado empedernido del nuevo conocimiento. Constantemente en la búsqueda nuevos retos en el campo tecnológico y en métodos para la aplicación de la tecnología en combinación con el talento humano y el trabajo colaborativo para la construcción de nuevas soluciones de alto impacto en áreas como la medicina, biología, genética, sociología o física. Actualmente, Senior Data Analyst en Grupo Inco, empresa enfocada en la generación de valor económico y social a partir de datos para empresas y gobiernos en Latinoamérica. Ingeniero en Computación de la Universidad de Costa Rica.
No hay comentarios.:
Publicar un comentario