En un post anterior, vimos algunas opciones para aplicar seguridad a un linked service en Azure Data Factory. Para conectar Azure Data Lake Analytics a Azure Data Factory, vamos a necesitar registrarlo en el AD de Azure y conectarlo mediante un service principal y una key creada para tal conexión.

Conectar Azure Data Lake Analytics a Azure Data Factory

Primero vamos a crear el servicio de Azure Data Lake Analytics.

Ahora procedemos a crear el linked service desde el Azure Data Factory creado en artículos anteriores.

Necesitamos los siguientes detalles para crear la conexión:

Vemos que necesitamos un Service principal ID y una Service principal Key. El Service principal es algo parecido a tener un proxy que va a permitir que unos servicios de Azure conecten con otros servicios de Azure.

Para realizar esto, navegamos al Azure AD.

Registramos una nueva aplicación.

Una vez creada, se navega automáticamente al overview de la app creada y vemos un valor que es el Application ID. Este será nuestro Service Principal ID, por lo que lo copiamos y lo introducimos en el detalle del linked service anterior.

Para crear la Service Principal Key, vamos a la sección de certificados y secretos de la app.

Creamos un nuevo secret y copiamos el valor para introducirlo en la configuración del linked service.

Si probamos la conexión, obtenemos un error de no autorizado. Esto es debido a que necesitamos dar permisos adicionales a la app registrada, en concreto permisos a la API de Azure Data Lake.

Además, hay que dar permisos de acceso (IAM) al Azure Data Lake Analytics a la app registrada.

Ahora hay que proceder a crear permisos a nivel de Azure Data Lake. Para hacer esto, vamos al wizard de crear usuarios dentro del servicio de Azure Data Lake Analytics y creamos un usuario para la app registrada en el AD de Azure.

En la imagen anterior, estamos dando acceso a todos los catálogos que tengamos en el Azure Data Lake Analytics asociado.

Pulsaremos Run para aplicar toda la configuración seleccionada.

Resultado

Tras realizar todos estos pasos, al probar de nuevo la conexión, obtenemos resultado satisfactorio. A veces, tarda unos minutos en aplicarse todos los cambios.

En próximos posts, veremos como trabajar con extracciones de datos con Azure Data Factory y Azure Data Lake Analytics.

Última modificación: febrero 18, 2021

Autor