Blog Data Azure AI

Microsoft ODBC Driver para Microsoft Fabric Data Engineering (Preview)

Conexión ODBC con Microsoft Fabric Data Engineering

Introducción al Microsoft ODBC Driver para Microsoft Fabric Data Engineering

El estándar ODBC (Open Database Connectivity) permite que las aplicaciones cliente interactúen con bases de datos y plataformas de big data de manera uniforme. Microsoft ha lanzado en versión preliminar el ODBC Driver para Microsoft Fabric Data Engineering, un conector empresarial diseñado para ofrecer conectividad robusta, segura y flexible a Spark SQL. Este driver amplía las capacidades de Microsoft Fabric, permitiendo que desarrolladores .NET y Python trabajen directamente con datos en Spark SQL.

A continuación, exploraremos los conceptos fundamentales, cómo configurar el driver y ejemplos prácticos para integrarlo en tus proyectos.


¿Qué es el Microsoft ODBC Driver para Microsoft Fabric Data Engineering?

Este driver es una herramienta que facilita la conexión entre aplicaciones cliente y entornos Spark SQL dentro de Microsoft Fabric. Está diseñado para ser:

  • Seguro: Implementa autenticación y cifrado de datos.
  • Flexible: Compatible con múltiples lenguajes de programación como .NET y Python.
  • Fiable: Optimizado para manejar grandes volúmenes de datos en entornos empresariales.

Note: Actualmente, el driver está en versión preliminar (Preview). Algunas funcionalidades pueden cambiar o no estar disponibles en producción.


Requisitos previos

Antes de comenzar, asegúrate de cumplir con los siguientes requisitos:

  1. Microsoft Fabric habilitado: Necesitas acceso a un entorno de Microsoft Fabric con Spark SQL configurado.
  2. Sistema operativo compatible: Windows, macOS o Linux.
  3. Versiones de lenguaje:
    • Python 3.7 o superior.
    • .NET Framework 4.6.1 o superior (o .NET Core).
  4. Descarga del driver: Puedes obtener el ODBC Driver desde la página oficial de Microsoft.

Instalación del driver

En Windows

  1. Descarga el instalador desde el enlace oficial.
  2. Ejecuta el instalador y sigue las instrucciones en pantalla.
  3. Verifica que el driver aparece en la lista de controladores ODBC. Abre el “Administrador de fuentes de datos ODBC” y busca el driver en la pestaña “Drivers”.

En Linux

  1. Descarga el paquete .tar.gz correspondiente.
  2. Extrae el contenido del archivo:
    tar -xvzf microsoft-odbc-driver-fabric.tar.gz
    
  3. Instala el driver utilizando el script incluido:
    sudo ./install.sh
    

Warning: En Linux, asegúrate de que las dependencias de librerías como libssl y libcurl estén instaladas antes de ejecutar el script.


Configuración de la conexión ODBC

Para conectar tu aplicación al entorno Spark SQL de Microsoft Fabric, necesitas configurar un DSN (Data Source Name). Este proceso varía ligeramente según el sistema operativo.

Configuración en Windows

  1. Abre el “Administrador de fuentes de datos ODBC”.
  2. En la pestaña “DSN de usuario”, haz clic en “Agregar”.
  3. Selecciona el driver “Microsoft Fabric ODBC Driver” y haz clic en “Finalizar”.
  4. Configura los siguientes parámetros:
    • Nombre del DSN: Por ejemplo, FabricSparkDSN.
    • Host: Dirección del servidor Spark SQL.
    • Puerto: Generalmente 1433.
    • Base de datos: Nombre de tu base de datos en Spark SQL.
    • Credenciales: Usuario y contraseña.

Configuración en Linux

Edita el archivo odbc.ini en /etc o en tu directorio de usuario (~/.odbc.ini):

[FabricSparkDSN]
Driver=/path/to/microsoft-odbc-driver-fabric.so
Host=spark.fabric.microsoft.com
Port=1433
Database=default
User=myusername
Password=mypassword

Ejemplo práctico: Conexión desde Python

Una vez configurado el DSN, puedes conectarte a Spark SQL desde Python utilizando la librería pyodbc.

Código de ejemplo

import pyodbc

# Configura el DSN
dsn = "FabricSparkDSN"

# Establece la conexión
try:
    conn = pyodbc.connect(f"DSN={dsn}")
    cursor = conn.cursor()

    # Ejecuta una consulta
    cursor.execute("SELECT * FROM my_table LIMIT 10")
    rows = cursor.fetchall()

    # Imprime los resultados
    for row in rows:
        print(row)

    conn.close()
except Exception as e:
    print(f"Error al conectar: {e}")

Note: Asegúrate de que el DSN configurado en tu sistema coincida con el nombre utilizado en el código.


Ejemplo práctico: Conexión desde .NET

En aplicaciones .NET, puedes usar la clase System.Data.Odbc para interactuar con Spark SQL.

Código de ejemplo

using System;
using System.Data.Odbc;

class Program
{
    static void Main()
    {
        string dsn = "FabricSparkDSN";
        string connectionString = $"DSN={dsn};";

        try
        {
            using (OdbcConnection connection = new OdbcConnection(connectionString))
            {
                connection.Open();

                string query = "SELECT * FROM my_table LIMIT 10";
                OdbcCommand command = new OdbcCommand(query, connection);

                using (OdbcDataReader reader = command.ExecuteReader())
                {
                    while (reader.Read())
                    {
                        Console.WriteLine(reader[0]); // Imprime la primera columna
                    }
                }
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Consideraciones finales

El Microsoft ODBC Driver para Microsoft Fabric Data Engineering es una herramienta poderosa para integrar aplicaciones empresariales con Spark SQL. Aunque está en versión preliminar, ya ofrece funcionalidades clave para desarrolladores .NET y Python.

Note: Consulta la documentación oficial para detalles adicionales sobre autenticación avanzada y optimización de consultas.

¿Ya has probado este driver en tus proyectos? Comparte tus experiencias en los comentarios.