Web crawling, data scraping y automatización

El poder de los datos



El scraping o crawling es una técnica que permite la extracción o raspado de datos online de forma automatizada mediante robots o bots. En este artículo analizamos su legalidad en España.

En el artículo “qué es data scraping scraping y web crawling” tienes mucha más información de cómo funciona y cuáles son sus principales aplicaciones empresariales.

¿Es legal el scraping?

El Scraping es completamente legal como técnica informática que es. Millones de empresas están realizando scraping y crawling ahora mismo mientras estás leyendo estas líneas. Algunos autores hablan de que hasta un 45% de todo el tráfico online está movido por robots y no por personas. Es casi tan antiguo como el propio internet; uno de sus primeros usos fue el de organizar la información online para indexarla.

El data scraping o web crawling se ha asociado durante mucho tiempo a la ciberdelincuencia porque es una técnica que se ha utilizado en numerosas ocasiones con fines ilícitos. Como muchas otras herramientas, puede ser ilegal dependiendo del uso que hagamos de ella. Pongamos por ejemplo el correo electrónico. ¿Es ilegal mandar spam? Sí. ¿Eso convierte al email en ilegal? Por supuesto que no.

El scraping se utiliza de forma ilegal tanto desde el punto de vista del uso; “para qué utilizamos esta información” como de la técnica; “cómo conseguimos esta información”. Uno de los usos más poco éticos del scraping es la copia de material para utilizarlo como propio. Imagina que encontramos un blog que nos gusta con contenidos muy trabajados. Podemos copiar todos los posts (imágenes incluidas), y colgarlos como propios. Efectivamente en este caso el scraping es ilegal. Estamos violando los derechos de autor. Este es un claro ejemplo de ilegalidad desde el punto de vista de “como utilizamos esta información”.

Vamos ahora con un ejemplo de mal uso en la forma de obtener la información. Supongamos que queremos obtener la lista de precios de una tienda online. La finalidad, en este caso, es legal ya que son datos públicos. Pero la persona que programa el bot no tiene experiencia ni conocimientos sólidos. Su robot visita la tienda para extraer datos de precios mandando demasiadas visitas, peticiones a las que el servidor de la web objetivo es incapaz de dar respuesta. Este servidor deja de funcionar durante un tiempo con la consecuente pérdida de ingresos que esto supone para el sitio. Sin saberlo hemos realizado un ataque de denegación de servicio (DDoS).

Tribunal Supremo Español. Demanda de Ryanair contra Atráplo

Uno de los casos más sonados en España fue el de la demanda que interpuso Ryanair contra Atrápalo y que resolvió finalmente el Tribunal Supremo a favor de Atrápalo.

Ryanair, la aerolínea de vuelos low cost, demandó a Atrápalo, agencia de viajes online, por scrapear sus datos. A través del portal de Atrápalo los usuarios podían realizar una búsqueda de vuelos. Atrápalo buscaba esta información trasladando los términos de la búsqueda al buscador de Ryanair y permitía la contratación. Ryanair demandó a atrápalo calificando a las agencias online de viajes como parásitos del sector.

Sin embargo el Alto Tribunal no estuvo de acuerdo con el demandante y consideró el scraping como una técnica legal conforme dictó en la sentencia Sentencia del 9 de octubre de 2012 número 572/2012.

¿En qué casos es ilegal el scraping?

Como ya hemos comentado, el scraping no supone una ilegalidad en sí mismo. No obstante su utilización para determinados fines sí que puede suponer una ilegalidad.

Si queremos mantenernos en la legalidad tenemos que estar atentos y utilizar el scraping de forma ética, mostrando especial interés en no utilizar propiedad intelectual o marcas registradas, no violar derechos de autor, no realizar competencia desleal y cumplir fielmente tanto la LOPD como la nueva ley nuevo reglamento europeo RGPD. Y, por supuesto, no sobrecargar a los servidores de los sitios scrapeados.

El objetivo de este post es explicar los conceptos relacionados con la legalidad del scraping a modo general y no puede utilizarse en ningún caso como un asesoramiento personalizado. Aunque este post intenta ser una ayuda, cada caso concreto tiene que estudiarse muy a fondo, ya que no hay unas leyes generales a las que acogerse.

Cómo afecta la nueva GDPR al scraping

Como ya todas las empresas saben (o deberían saber) el 25 de Mayo de 2018 entró en vigor la nueva ley de privacidad GDPR (Reglamento General de Protección de Datos). Este nuevo reglamento no solo afecta a las empresas europeas si no a todas las que presten servicio a usuarios europeos.

En rasgos muy generales, y sin pretender que esto sirva como guía para entender la RGPD si no como un estudio de los puntos que más puedan afectar al scraping según nuestro criterio, tenemos estas tres novedades en el Reglamento:

  • Los usuarios tienen que dar consentimiento para que se almacenen sus datos

  • En caso de robo de datos hay que avisar inmediatamente a los usuarios afectados

  • Solo podemos obtener y utilizar los datos que realmente necesitamos

La RDPR solo afecta a la recolección y almacenamiento de datos personales. Esto es muy importante porque no afecta a la mayoría de las aplicaciones empresariales del scraping. La RDPR no afecta a listados de productos, listados de precios, etc. Sin embargo si queremos almacenar nombres de personas, sus correos electrónicos o sus teléfonos, tendremos que ir con mucho cuidado y verificar que estos usuarios han dado su permiso.

No pierdas la oportunidad de beneficiarte del Scraping

Nosotros, en Datstrats, realizamos un análisis previo de legalidad para cada uno de los proyectos de nuestros clientes antes de iniciar cualquier acción. Como profesionales del scraping ético y legal, tenemos más experiencia y podemos determinar mejor qué proyectos cumplen con la normativa.

Hay algunos proyectos que necesitan determinados datos que, a priori, parecen imposibles dentro de la legalidad. Pero existen fórmulas y prácticas éticas y legales para conseguirlos y siempre aconsejamos a nuestros clientes ir por este camino.

A la hora de elegir un proveedor de datos es muy importante cerciorarse de que este cumple completamente con la legalidad.

La legalidad del scraping no reside en la extracción de datos como práctica. En cada caso tenemos que saber si es legal el uso que daremos a esos datos y los métodos que vamos a emplear.

Además, el hecho de que sea una tecnología que hasta ahora solo han utilizado las grandes empresas y que no ha llegado todavía a todas las pymes, hace que las organizaciones que empiezan a utilizarla cuenten con una enorme ventaja sobre sus oponentes.

Related posts




Nuestra web utiliza cookies propias y de terceros para recabar información sobre la utilización del mismo y mejorar nuestros servicios.
Puedes cambiar la configuración, conocer cómo deshabilitarlas u obtener más información leyendo nuestra Política de cookies.