Introducción a los atajos de OneLake
OneLake, el componente de almacenamiento unificado en Microsoft Fabric, permite integrar datos estructurados y no estructurados desde diversas fuentes. Con la reciente actualización en Preview, los atajos de OneLake para SharePoint y OneDrive ahora soportan identidades de espacio de trabajo y principales de servicio (Service Principal Identities). Esto abre nuevas posibilidades para la gestión de datos en entornos empresariales, eliminando duplicación y silos, mientras se habilitan escenarios avanzados como análisis combinados entre datos de Lakehouse y documentos de Microsoft 365.
¿Qué son los atajos de OneLake?
Los atajos de OneLake permiten vincular archivos y carpetas existentes en SharePoint y OneDrive directamente en OneLake sin necesidad de mover o copiar los datos. Esto significa que cualquier archivo en Microsoft 365 puede ser tratado como parte del lago de datos, facilitando el acceso y análisis desde herramientas de BI, analítica y Azure AI.
Note: Los atajos no duplican los datos; simplemente crean una referencia directa a los archivos originales, lo que reduce costos de almacenamiento y simplifica la gobernanza.
Beneficios clave
- Integración sin duplicación: Los datos permanecen en su ubicación original mientras son accesibles desde OneLake.
- Escenarios híbridos: Combina hojas de cálculo de Excel con datos estructurados en Lakehouse para análisis avanzados.
- Indexación para IA: Utiliza Azure AI para indexar documentos y habilitar búsquedas semánticas o generación de insights.
Identidades de espacio de trabajo y principales de servicio
La nueva funcionalidad permite que los atajos de OneLake soporten dos tipos de identidades:
- Identidades de espacio de trabajo: Asociadas directamente con un espacio de trabajo en Microsoft Fabric.
- Principales de servicio: Identidades administradas que permiten la integración segura entre aplicaciones y servicios.
Esto mejora la seguridad y la flexibilidad en escenarios empresariales, permitiendo que aplicaciones automatizadas accedan a datos de OneLake sin depender de usuarios específicos.
Configuración de un principal de servicio para OneLake
A continuación, mostramos cómo configurar un principal de servicio para habilitar el acceso a atajos de OneLake.
Paso 1: Crear un principal de servicio en Azure AD
Utiliza el siguiente comando para crear un principal de servicio en Azure AD:
az ad sp create-for-rbac --name "OneLakeServicePrincipal" --role "Contributor" --scopes "/subscriptions/{subscription-id}/resourceGroups/{resource-group-name}"
Note: Reemplaza
{subscription-id}y{resource-group-name}con los valores correspondientes a tu suscripción y grupo de recursos.
Este comando generará un appId, password y tenant. Guarda estos valores, ya que serán necesarios para autenticar el principal de servicio.
Paso 2: Configurar permisos en SharePoint/OneDrive
Accede al portal de administración de SharePoint y otorga permisos al principal de servicio sobre las bibliotecas de documentos que deseas vincular a OneLake.
Paso 3: Crear un atajo en OneLake
Desde Microsoft Fabric, utiliza el siguiente script para crear un atajo vinculado a una carpeta en SharePoint:
from azure.fabric.onelake import OneLakeClient
# Autenticación con el principal de servicio
client = OneLakeClient(
client_id="appId",
client_secret="password",
tenant_id="tenant"
)
# Crear el atajo
shortcut = client.create_shortcut(
workspace_id="workspace-id",
target_url="https://{sharepoint-site}/sites/{site-name}/Shared Documents/{folder-name}",
alias="MiAtajoSharePoint"
)
print(f"Atajo creado: {shortcut['alias']}")
Warning: Asegúrate de que el
workspace_idy latarget_urlsean correctos. Los errores en estas configuraciones pueden provocar fallos de acceso.
Escenarios prácticos habilitados por esta funcionalidad
1. Análisis combinado entre Lakehouse y documentos
Con los atajos, puedes combinar datos estructurados de Lakehouse con hojas de cálculo en OneDrive. Por ejemplo, utiliza Power BI para crear dashboards que incluyan métricas almacenadas en Lakehouse y datos financieros en Excel.
2. Indexación de documentos para IA
Usa Azure Cognitive Search para indexar documentos vinculados desde SharePoint. Esto habilita capacidades como búsqueda semántica y generación de resúmenes con Azure OpenAI.
Ejemplo: Indexación con Azure Cognitive Search
from azure.search.documents import SearchClient
# Configuración del cliente de búsqueda
search_client = SearchClient(
endpoint="https://{search-service-name}.search.windows.net",
index_name="documentos-index",
credential="api-key"
)
# Indexar documentos desde OneLake
documents = [
{"id": "1", "content": "Contenido del documento 1"},
{"id": "2", "content": "Contenido del documento 2"}
]
result = search_client.upload_documents(documents)
print(f"Documentos indexados: {result}")
Note: Configura correctamente el servicio de búsqueda en Azure antes de indexar documentos.
Limitaciones actuales
Aunque esta funcionalidad está en Preview, existen algunas limitaciones:
- Soporte limitado para tipos de archivo: Actualmente, algunos tipos de archivo no son completamente compatibles con ciertas herramientas de análisis.
- Dependencia de permisos: La configuración de permisos en SharePoint y OneDrive puede ser compleja en entornos con múltiples niveles de gobernanza.
Conclusión
La integración de identidades de espacio de trabajo y principales de servicio en los atajos de OneLake marca un avance significativo para la gestión de datos en Microsoft Fabric. Permite escenarios híbridos, mejora la seguridad y facilita la automatización de procesos. Aunque aún en Preview, esta funcionalidad promete transformar cómo las empresas integran datos estructurados y no estructurados.
Para más información, consulta la fuente oficial. ```