Atajos de OneLake para SharePoint y OneDrive ahora soportan identidades de espacio de trabajo y principales de servicio (Preview)

Introducción a los atajos de OneLake

OneLake, el componente de almacenamiento unificado en Microsoft Fabric, permite integrar datos estructurados y no estructurados desde diversas fuentes. Con la reciente actualización en Preview, los atajos de OneLake para SharePoint y OneDrive ahora soportan identidades de espacio de trabajo y principales de servicio (Service Principal Identities). Esto abre nuevas posibilidades para la gestión de datos en entornos empresariales, eliminando duplicación y silos, mientras se habilitan escenarios avanzados como análisis combinados entre datos de Lakehouse y documentos de Microsoft 365.

¿Qué son los atajos de OneLake?

Los atajos de OneLake permiten vincular archivos y carpetas existentes en SharePoint y OneDrive directamente en OneLake sin necesidad de mover o copiar los datos. Esto significa que cualquier archivo en Microsoft 365 puede ser tratado como parte del lago de datos, facilitando el acceso y análisis desde herramientas de BI, analítica y Azure AI.

Note: Los atajos no duplican los datos; simplemente crean una referencia directa a los archivos originales, lo que reduce costos de almacenamiento y simplifica la gobernanza.

Beneficios clave

Integración sin duplicación: Los datos permanecen en su ubicación original mientras son accesibles desde OneLake.
Escenarios híbridos: Combina hojas de cálculo de Excel con datos estructurados en Lakehouse para análisis avanzados.
Indexación para IA: Utiliza Azure AI para indexar documentos y habilitar búsquedas semánticas o generación de insights.

Identidades de espacio de trabajo y principales de servicio

La nueva funcionalidad permite que los atajos de OneLake soporten dos tipos de identidades:

Identidades de espacio de trabajo: Asociadas directamente con un espacio de trabajo en Microsoft Fabric.
Principales de servicio: Identidades administradas que permiten la integración segura entre aplicaciones y servicios.

Esto mejora la seguridad y la flexibilidad en escenarios empresariales, permitiendo que aplicaciones automatizadas accedan a datos de OneLake sin depender de usuarios específicos.

Configuración de un principal de servicio para OneLake

A continuación, mostramos cómo configurar un principal de servicio para habilitar el acceso a atajos de OneLake.

Paso 1: Crear un principal de servicio en Azure AD

Utiliza el siguiente comando para crear un principal de servicio en Azure AD:

az ad sp create-for-rbac --name "OneLakeServicePrincipal" --role "Contributor" --scopes "/subscriptions/{subscription-id}/resourceGroups/{resource-group-name}"

Note: Reemplaza {subscription-id} y {resource-group-name} con los valores correspondientes a tu suscripción y grupo de recursos.

Este comando generará un appId, password y tenant. Guarda estos valores, ya que serán necesarios para autenticar el principal de servicio.

Paso 2: Configurar permisos en SharePoint/OneDrive

Accede al portal de administración de SharePoint y otorga permisos al principal de servicio sobre las bibliotecas de documentos que deseas vincular a OneLake.

Paso 3: Crear un atajo en OneLake

Desde Microsoft Fabric, utiliza el siguiente script para crear un atajo vinculado a una carpeta en SharePoint:

from azure.fabric.onelake import OneLakeClient

# Autenticación con el principal de servicio
client = OneLakeClient(
    client_id="appId",
    client_secret="password",
    tenant_id="tenant"
)

# Crear el atajo
shortcut = client.create_shortcut(
    workspace_id="workspace-id",
    target_url="https://{sharepoint-site}/sites/{site-name}/Shared Documents/{folder-name}",
    alias="MiAtajoSharePoint"
)

print(f"Atajo creado: {shortcut['alias']}")

Warning: Asegúrate de que el workspace_id y la target_url sean correctos. Los errores en estas configuraciones pueden provocar fallos de acceso.

Escenarios prácticos habilitados por esta funcionalidad

1. Análisis combinado entre Lakehouse y documentos

Con los atajos, puedes combinar datos estructurados de Lakehouse con hojas de cálculo en OneDrive. Por ejemplo, utiliza Power BI para crear dashboards que incluyan métricas almacenadas en Lakehouse y datos financieros en Excel.

2. Indexación de documentos para IA

Usa Azure Cognitive Search para indexar documentos vinculados desde SharePoint. Esto habilita capacidades como búsqueda semántica y generación de resúmenes con Azure OpenAI.

Ejemplo: Indexación con Azure Cognitive Search

from azure.search.documents import SearchClient

# Configuración del cliente de búsqueda
search_client = SearchClient(
    endpoint="https://{search-service-name}.search.windows.net",
    index_name="documentos-index",
    credential="api-key"
)

# Indexar documentos desde OneLake
documents = [
    {"id": "1", "content": "Contenido del documento 1"},
    {"id": "2", "content": "Contenido del documento 2"}
]

result = search_client.upload_documents(documents)
print(f"Documentos indexados: {result}")

Note: Configura correctamente el servicio de búsqueda en Azure antes de indexar documentos.

Limitaciones actuales

Aunque esta funcionalidad está en Preview, existen algunas limitaciones:

Soporte limitado para tipos de archivo: Actualmente, algunos tipos de archivo no son completamente compatibles con ciertas herramientas de análisis.
Dependencia de permisos: La configuración de permisos en SharePoint y OneDrive puede ser compleja en entornos con múltiples niveles de gobernanza.

Conclusión

La integración de identidades de espacio de trabajo y principales de servicio en los atajos de OneLake marca un avance significativo para la gestión de datos en Microsoft Fabric. Permite escenarios híbridos, mejora la seguridad y facilita la automatización de procesos. Aunque aún en Preview, esta funcionalidad promete transformar cómo las empresas integran datos estructurados y no estructurados.

Para más información, consulta la fuente oficial. ```