La obtención de datos directamente desde un sitio web es una necesidad habitual. Algunos sitios, como el INE o la base de datos SABI, proporcionan funcionalidades para la descarga de datos en formatos más o menos estándar que actúan como puente con nuestros aplicativos. Si necesito analizar una serie estadística en R o SPSS, puedo descargarla en formato xls y a continuación importarla a esa aplicación.
Cuando no hay procedimientos específicos para exportar, es preciso buscar soluciones pragmáticas. Si los datos originales están estructurados en una tabla, con frecuencia copiar+pegar funciona correctamente; también podemos simplemente abrir el sitio web (introduciendo el URL como nombre del fichero).
Si queremos mantener un enlace activo con los datos originales, podemos emplear los asistentes para importación desde la web. En el caso de Excel, accedemos desde la ficha Datos > Obtener datos externos > Desde web; introducimos el URL en el cuadro de texto y hacemos clic en el botón Ir.
En LibreOffice Calc accedemos al sitio como un archivo ordinario (Fichero > Abrir) y en su caso seleccionamos la tabla que queremos importar. Pero, atención, no se crea ningún vínculo con los datos originales: únicamente se trasladan a la hoja.
El resultado es en todo caso incierto, y depende de la configuración del sitio y de la página. Aunque podemos seleccionar qué partes concretas queremos descargar, con frecuencia se mostrarán también menús y otros contenidos del sitio original (naturalmente podemos eliminarlos, pero repararecerán al actualizar el vínculo).