Capítulo 2 Operaciones básicas en Power BI

Power BI es una herramienta de Microsoft destinada al desarrollo de cuadros de mando. Se encuadra dentro del grupo de herramientas de autoservicio de sistemas OLAP, es decir, herramientas destinadas a usuarios finales (decisores) que soportan desde el desarrollo hasta la explotación de sistemas OLAP.

Hay dos versiones de Power BI: una versión web y otra local (Power BI Desktop); la versión local permite compartir datos en la Web. De aquí en adelante, al nombrar a Power BI nos referiremos a la versión local.

En este capítulo se presentan las operaciones básicas para definir informes en Power BI a partir de un conjunto de datos en forma de tabla plana. En primer lugar importaremos los datos, posteriormente los transformaremos y, a partir del resultado, desarrollaremos informes aplicando las operaciones del modelo de datos multidimensional.

Objetivos del capítulo

  • Usar Power BI para realizar operaciones básicas en lo referido a:

    • Importación de datos.

    • Transformación de datos mediante Power Query.

    • Definición de informes.

  • Entender las operaciones de consulta del modelo de datos multidimensional.

2.1 Importar los datos

Al iniciar Power BI se muestra la pantalla de inicio de la figura 2.1. Ofrece la posibilidad de registrarse y compartir informes en la web. Nosotros usaremos exclusivamente las funcionalidades locales por lo que no es necesario registrarse. Cerraremos la ventana para continuar (pulsando sobre Cerrar en la esquina superior derecha4).

Ventana de inicio de Power BI Desktop.

Figura 2.1: Ventana de inicio de Power BI Desktop.

Vamos a comenzar a trabajar sobre los datos de la provincia asignada en formato CSV. Para importar los datos a la herramienta pulsamos sobre la opción Inicio > Datos > Obtener datos > Texto o CSV, como se muestra en la figura 2.2.

Selección del archivo de datos.

Figura 2.2: Selección del archivo de datos.

A continuación, seleccionamos el archivo correspondiente a nuestra provincia en la carpeta de trabajo. En el caso de Granada, el archivo es 2871.csv. El nombre dependerá de la provincia que tengamos asignada.

Visualización de los datos del archivo.

Figura 2.3: Visualización de los datos del archivo.

Una vez seleccionado, nos muestra su contenido (figura 2.3). Podemos modificar las características que ha considerado de manera automática en cuanto a codificación del archivo y carácter delimitador de campos. También ofrece la posibilidad de acceder a una herramienta para transformar los datos (accederemos a ella después), ahora nos limitaremos a cargar su contenido pulsado sobre el botón Cargar.

Campos del archivo.

Figura 2.4: Campos del archivo.

En la parte derecha de la pantalla podemos observar los campos importados del archivo, disponibles para ser consultados (figura 2.4). Considera los campos de tipo numérico como medidas, se pueden distinguir por que tienen el signo \(\sum\) a la izquierda de su nombre.

Las medidas se agregan mediante funciones de agregación (generalmente la suma) al nivel de detalle definido por el resto de campos cuando se incluyen los informes.

2.2 Comprobar el funcionamiento

Para comprobar el funcionamiento de las consultas sobre los datos, seleccionamos los campos pulsando sobre la celda situada la izquierda de su nombre o pulsando-arrastrando-soltando cada campo sobre la parte central de la pantalla, como se indica en la figura 2.5.

Instrucciones iniciales para la definición de un informe.

Figura 2.5: Instrucciones iniciales para la definición de un informe.

También podemos elegir una u otra forma de visualización de los datos de entre las disponibles (figura 2.6). En función de la que elijamos, se configura la parte inferior del catálogo de formas para definir los detalles. En este caso concreto, podemos mover los campos para definir su orden en la tabla elegida.

Formas de visualización de los datos.

Figura 2.6: Formas de visualización de los datos.

En este primer informe, podemos observar que hay un problema con los periodos ya que, en lugar de presentar una columna de periodos, los suma (figura 2.7). El problema es que, al ser de tipo numérico, la herramienta ha considerado al campo Periodo, correspondiente al año, como una medida.

Ejemplo de informe con periodos.

Figura 2.7: Ejemplo de informe con periodos.

Al añadir un campo a un informe, automáticamente también se añade al apartado Filtros. Podemos seleccionar o deseleccionar valores de los campos situados en esta zona. En concreto, para el campo Sexo, deberíamos definir un filtro para no considerar el valor “Total”, resultado de la agregación de los otros valores (figura 2.8).

Deseleccionar el valor agregado para el sexo.

Figura 2.8: Deseleccionar el valor agregado para el sexo.

En la tabla de la figura 2.7 no habría problema por mostrarse los valores numéricos para cada uno de los valores del campo Sexo. Si no se incluye este campo en un informe, sin filtrar los datos, el resultado que se obtendría sería el doble del real por considerarse la suma de la medida para el valor “Hombres”, para el valor “Mujeres” y para el valor “Total”, que es el agregado de ambos.

Deseleccionar el valor agregado para los municipios.

Figura 2.9: Deseleccionar el valor agregado para los municipios.

El mismo problema tenemos en el campo Municipios (figura 2.9), que incluye un valor que representa a toda la provincia (se puede identificar porque el código numérico situado antes del nombre tiene dos dígitos en lugar de cinco), que representa la agregación del resto de valores de este campo.

Para evitar problemas en los informes que no incluyan estos campos, deberíamos deseleccionar los valores correspondientes a agregados (como se ha hecho en las figuras 2.8 y 2.9).

Ejercicio 2.1 Carga los datos de tu provincia en formato CSV en Power BI y muestra dos informes en forma de tabla, considerando uno cualquiera de los dos campos mencionados (Sexo o Municipios), uno sin filtrar los datos y el otro filtrándolos para eliminar los agregados, de manera que se aprecie el problema que se describe en los párrafos anteriores (para documentar este ejercicio, incluye dos capturas de pantalla, una para cada informe).

2.3 Transformar los datos

Para evitar los problemas descritos en el apartado 2.2 vamos a transformar los datos:

  • Cambiaremos el tipo de datos al campo Periodo.

  • Filtraremos los datos de manera que no se incluyan observaciones de valores agregados: las correspondientes al valor “Total” para el campo Sexo o a la provincia para el campo Municipios.

Para transformar los datos pulsamos sobre Inicio > Consultas > Transformar datos (figura 2.10).

Transformar datos.

Figura 2.10: Transformar datos.

Como resultado se abre el Editor de Power Query. Power Query es una herramienta de transformación de datos incluida en Power BI, el capítulo 3 está focalizado en ella. En este apartado nos limitaremos a hacer las transformaciones requeridas y a comentar exclusivamente los aspectos necesarios para entenderlas.

2.3.1 Cambiar el tipo de una columna

En esta herramienta se presenta directamente la tabla de datos y sobre ella podemos definir operaciones de transformación.

Cambiar el tipo de Periodo.

Figura 2.11: Cambiar el tipo de Periodo.

Las transformaciones se definen como consultas sobre los datos, a estas consultas también se les llama tablas por la estructura que suele tener su resultado. Inicialmente se crea una consulta con el nombre de la tabla de partida que se puede ver en la zona izquierda de la figura 2.11.

Para cambiar el tipo asociado a una columna, pulsamos sobre el icono situado a la izquierda de su nombre (se muestra en la parte central de la figura 2.11) y, en el menú que se abre, seleccionamos el tipo deseado. En este caso, para la columna Periodo, seleccionamos el tipo Texto (tenía asignado Número entero).

Aunque no había aparecido explícitamente, la importación de los datos se había realizado mediante Power Query. Las operaciones de transformación realizadas sobre la tabla se pueden ver en la zona inferior derecha de la figura 2.11, en el apartado PASOS APLICADOS. Estas operaciones se han generado automáticamente como respuesta a la operación de importación de datos. Aparecen tres:

  • Origen.

  • Encabezados promovidos.

  • Tipo cambiado.

Son pasos de importación o transformación de datos. En el primero, se define el origen de los datos: la información necesaria para acceder a los datos. En el segundo, la primera fila se define como cabecera de las columnas. En el último paso, se asigna a cada columna un tipo deduciéndolo automáticamente a partir de los datos de dicha columna.

Al cambiar manualmente el tipo a una de las columnas presenta a continuación la ventana de la figura 2.12.

Cambiar el tipo de la columna.

Figura 2.12: Cambiar el tipo de la columna.

Es decir, podemos modificar el paso de transformación existente para que considere el tipo que acabamos de seleccionar o añadir un nuevo paso de transformación de tipo. El resultado en ambos casos es el mismo, la única diferencia está en los pasos de la lista, habrá uno más o no. En este caso, he elegido que sustituya al actual.

2.3.2 Filtrar datos de una columna

Para definir filtros sobre los datos de una columna, pulsamos sobre la flecha situada a la derecha de su nombre. Se pueden definir filtros muy sofisticados. En este caso es suficiente con deseleccionar los valores que no queremos incluir en los datos.

Deseleccionar total de la provincia.

Figura 2.13: Deseleccionar total de la provincia.

En la figura 2.13 se muestra la definición del filtro sobre el campo Municipios: deseleccionamos el nombre correspondiente a la provincia (identificado por tener un código asociado de solo dos dígitos).

De igual manera, deseleccionamos el valor “Total” incluido en la columna Sexo (figura 2.14).

Deseleccionar total por sexo.

Figura 2.14: Deseleccionar total por sexo.

En la zona PASOS APLICADOS de la figura 2.14 (zona inferior derecha), se puede apreciar que, como resultado de las operaciones de filtrado, ha aparecido un nuevo paso llamado Filas filtradas que incluirá todas las operaciones de filtro de datos que se realicen de forma consecutiva.

El resultado de las operaciones definidas se muestra en la zona de la tabla de datos: en este caso, dejarán de mostrarse los datos filtrados.

2.3.3 Renombrar una columna

Vamos a cambiarle el nombre a la columna correspondiente a la medida, en lugar de Total vamos a llamarla Cantidad. Para ello pulsamos doble-clic sobre el nombre de la columna en la tabla y escribimos el nuevo nombre.

Renombrar la columna de medida.

Figura 2.15: Renombrar la columna de medida.

El resultado se muestra en la figura 2.15. Podemos apreciar que se ha añadido un paso a las transformaciones llamado Columnas con nombre cambiado.

2.3.4 Aplicar los cambios

Hasta ahora las operaciones están definidas exclusivamente en Power Query. Una vez definidas todas las operaciones de transformación que necesitemos, debemos aplicarlas a los datos para poder definir los informes que deseemos a partir de ellos.

Aplicar los cambios.

Figura 2.16: Aplicar los cambios.

Para aplicar los cambios, en la ventana de Power Query, pulsamos sobre Inicio > Cerrar > Cerrar y aplicar (figura 2.16). Esto hará que se cierre la ventana de Power Query y accedamos a la de Power BI con los datos obtenidos al aplicar las transformaciones definidas a los datos originales.

Como las transformaciones afectan al informe que habíamos definido, en especial la relativa al cambio de tipo de la columna Periodo, si esta columna está incluida en algún informe nos avisa de que se han producido errores en el informe y nos da la posibilidad de corregirlos pulsando sobre el botón Corregir esto (figura 2.17).

Corregir errores.

Figura 2.17: Corregir errores.

Una vez corregidos los errores, podemos ver el efecto de las transformaciones directamente en el apartado Campos, como se muestra en la figura 2.18.

Campos del archivo actualizados.

Figura 2.18: Campos del archivo actualizados.

Podemos observar que el campo Periodo ya no tiene a su izquierda el signo que lo identifica como numérico y por tanto como una medida. También observamos que los campos aparecen ordenados alfabéticamente, se aprecia mejor por la nueva situación que ocupa la medida al cambiarle el nombre.

Ejercicio 2.2 Aplica transformaciones equivalentes a las descritas en este apartado sobre tus datos (captura la pantalla de Power Query cuando estén todas definidas).

2.4 Operaciones multidimensionales de consulta

Una vez que tenemos los datos con el formato adecuado y solo tenemos los datos base, vamos a realizar operaciones multidimensionales de consulta sobre ellos. La figura 2.19 muestra los elementos que se ofrecen para la definición de informes.

Elementos para la definición de informes.

Figura 2.19: Elementos para la definición de informes.

El elemento básico de presentación de datos es el objeto visual que representa los datos con un formato específico, se puede considerar como un informe elemental. Cada objeto visual tiene asociado un tipo de visualización de entre las disponibles en el apartado Visualizaciones (figura 2.19). El área de trabajo donde se incluyen los objetos visuales es la página: cada página puede contener varios objetos visuales interrelacionados5. Podemos definir varias páginas que componen un documento. Podemos considerar un documento como un informe complejo6 compuesto por uno o más informes elementales.

Los objetos visuales se añaden a la página activa pulsando sobre Inicio > Insertar > Nuevo objeto visual. Se pueden añadir páginas pulsando sobre Nueva página en la parte inferior izquierda de la ventana.

Podemos controlar el contenido y la presentación de cada objeto visual mediante los campos que aparecen en la parte inferior del apartado Visualizaciones. Estos campos se adaptan según el objeto seleccionado.

Además del contenido de los objetos visuales, podemos definir filtros que nos permiten seleccionar qué instancias de los datos se consideran en los informes. Se pueden definir filtros a los distintos niveles del informe (apartado Filtros de la figura 2.19):

  • A nivel del objeto visual seleccionado en la página que se muestra.

  • A nivel de página, para la página que se muestra.

  • Para todas las páginas.

Los campos añadidos a un objeto visual se añaden automáticamente a los filtros del nivel objeto, pero también podemos añadir filtros pulsando-arrastrando-soltando el campo sobre un filtro vacío al nivel que consideremos, incluido el nivel objeto visual.

Para presentar las operaciones multidimensionales, vamos a considerar como punto de partida el informe de la figura 2.20.

Ejemplo de informe de partida.

Figura 2.20: Ejemplo de informe de partida.

Este es un informe sobre la cantidad de personas (Cantidad es una medida de los hechos), sin distinguir entre las instancias de las dimensiones: para todas las instancias de Periodo (agregación de todos los periodos), todas las instancias de Sexo (agregación de todos los sexos) y todas las instancias de Municipios (agregación de todos los municipios).

2.4.1 Slice&Dice

Selección de valores en una dimensión.

Figura 2.21: Selección de valores en una dimensión.

Supongamos que estamos interesados solo en los datos del año 2019. Incluimos Periodo en un filtro del objeto y seleccionamos el año deseado (figura 2.21). Acabamos de realizar una operación de Slice&Dice.

Si nos fijamos en la barra lateral de los objetos de las figuras 2.20 y 2.21, podemos observar cómo han cambiado los valores representados en el objeto visual. Es remarcable que la estructura del informe no ha cambiado, solo han cambiado los datos que se consideran para obtenerlo. El informe está definido exactamente igual que el informe de partida, sin distinguir entre las instancias de las dimensiones: para todas las instancias seleccionadas de Periodo (agregación de todos los periodos seleccionados), todas las instancias de Sexo (agregación de todos los sexos) y todas las instancias de Municipios (agregación de todos los municipios). El único matriz que los diferencia es que consideramos solo las instancias seleccionadas en la operación Slice&Dice7.

2.4.2 Drill-Down

Si añadimos el campo Sexo al informe (pulsando sobre la celda a la izquierda de su nombre en el apartado Campos), podemos ver en la figura 2.22 que los datos se desagregan: hemos hecho una operación de Drill-Down, cambiando el nivel de detalle del informe, hemos pasado a un nivel de detalle más fino que el que tenía el informe anterior.

Distinguir entre instancias de un campo (i).

Figura 2.22: Distinguir entre instancias de un campo (i).

Este cambio en el nivel de detalle se refleja en la estructura del informe: ha cambiado, en este caso el nuevo elemento se ha añadido al eje. Tenemos los datos definidos diferenciando entre las instancias de Sexo, para el resto de dimensiones no se ha modificado el nivel de detalle.

Si añadimos el campo Periodo al informe (pulsando sobre la celda a la izquierda de su nombre en el apartado Campos), el resultado podemos verlo en la figura 2.23. La diferencia respecto al informe de la figura 2.22 es sutil: aparece el campo en la leyenda de la gráfica pero los datos son los mismos.

Distinguir entre instancias de un campo (ii).

Figura 2.23: Distinguir entre instancias de un campo (ii).

Aunque los datos representados son los mismos, hemos hecho otra operación de Drill-Down, hemos pasado de considerar todas las instancias seleccionadas del campo Periodo conjuntamente a diferenciar entre las instancias disponibles, en este caso solo hay una. Para ver más claramente que con esta operación hemos cambiado el nivel de detalle del informe, podemos acceder al filtro del campo Periodo y seleccionamos también los dos años anteriores, es decir, modificamos la operación de Slice&Dice previamente definida.

Distinguir entre instancias de un campo (y iii).

Figura 2.24: Distinguir entre instancias de un campo (y iii).

El resultado lo podemos ver en la figura 2.24: ahora se puede apreciar claramente que, en efecto, se había cambiado el nivel de detalle del informe al añadir el campo Periodo.

2.4.3 Roll-Up

Partiendo del último informe obtenido (figura 2.24), si eliminamos cualquiera de los campos Sexo o Periodo, estaremos haciendo una operación de Roll-Up. Se elimina de la zona Visualización, pulsado sobre Cerrar a la derecha del nombre. El campo restante lo podemos reubicar en el eje o la leyenda pulsando-arrastrando-soltando.

Eliminar distinción entre instancias de un campo.

Figura 2.25: Eliminar distinción entre instancias de un campo.

El resultado obtenido se muestra en la figura 2.25, después de situar el campo Periodo en el eje.

Ejercicio 2.3 Sin repetir lo presentado en este apartado, partiendo de un informe inicial cualquera (se puede obtener aplicando las operaciones que se consideren necesarias sin necesitad de explicarlas), genera nuevos informes mediante las operaciones multidimensionales, al menos uno para cada operación. Una vez se tenga el informe inicial, el resto de informes han de generarse de forma consecutiva (sin saltarse informes intermedios). Para cada informe obtenido, indica la operación aplicada y el nivel de detalle de los datos que representa (captura una pantalla para cada informe).


  1. Esta indicación puede parecer redundante pero la tendencia que he observado es que se pulsa de forma automática el botón para comenzar el registro. Actualmente esto no es necesario.↩︎

  2. En el sentido de que, una vez definidos, cuando interactuemos sobre uno, el resto también responderá a las operaciones que realicemos.↩︎

  3. Power BI es una herramienta destinada a construir cuadros de mandos. Un cuadro de mandos estaría compuesto por los objetos visuales de una o varias páginas.↩︎

  4. En este ejemplo, el haber seleccionado una sola instancia nos puede llevar a pensar erróneamente que hemos cambiado el nivel de detalle.↩︎