Analizamos hoy la relación entre el control de aduanas y el big data en el comercio internacional. En la memoria publicada recientemente por la Agencia Estatal de la Administración Tributaria (AEAT) encontramos una interesante estadística donde se computa el número de controles documentales y físicos realizados en 2020 a la mercancía sujeta a comercio internacional.

En 2019, sin efecto pandémico, las intervenciones fueron alrededor de 700.000, que vienen a ser unas 1.916 operativas de control diarias, mientras que en 2020, con varios meses de baja actividad, se han rondado los 1.600 controles diarios. En este escenario modificado por los efectos de la pandemia, en el que los trámites telemáticos han ganado terreno a los físicos en muchos ámbitos, se ha pasado de un 92% a un 97% de intervenciones documentales sobre el total.

Las previsiones son un terreno sobre el que es difícil edificar afirmaciones sólidas que se sostengan con el paso del tiempo, aunque, a día de hoy existe cierto consenso sobre que la actividad en los puertos va a seguir incrementándose en 2022.

Análisis, big data, data mining y tecnologías del lenguaje

Para cumplir el mandato de la Comisión Europea en cuanto a protección y seguridad del comercio legítimo y los ciudadanos de la Unión, la AEAT debería ser capaz de seguir el ritmo de estos incrementos de comercio. Las herramientas que agilicen el tratamiento masivo de documentos son, sin duda, clave para ese cumplimiento. A principios de 2021, la AEAT adjudicó un contrato por casi 4 millones de euros para el mantenimiento y desarrollo de aplicaciones en los ámbitos del sistema de análisis de la información, big data, minería de datos y tecnologías del lenguaje, según el propio texto de la adjudicación. Según los responsables de la AEAT, estos modelos no tratan de sustituir los sistemas actuales de selección basados en la experiencia humana adquirida en años acumulados de actuación, sino que son herramientas facilitadoras y complementarias.

En los últimos años, se ha incrementado progresivamente la capacidad de recopilación de datos derivada del uso de nuevas fuentes y herramientas de obtención de información. Así, las administraciones tributarias cuentan en su poder con una enorme cantidad de datos, provenientes tanto de fuentes internas -ya sean de carácter tradicional (vía convenio, por captación o por suministro) o de nuevas fuentes de carácter digital-, como de datos transferidos de otros actores económicos nacionales e internacionales, que se encuentran almacenados en distintos formatos, estructurados y sin estructurar. 

Sin embargo, si toda esta información (cada vez más abundante y completa), no tuviese orden y no estuviese conectada, y si sus elementos no pudiesen ser relacionados entre sí, no sería útil, ni gestionable y, por tanto, no serviría a los fines previstos. Por ello, la AEAT viene desarrollando una potente herramienta denominada Hermes para la gestión de riesgos. Se apoya en la información existente en el sistema complejo de bases de datos ZUJAR, que es capaz de ordenar, filtrar y reproducir información para que pueda ser explotada por el sistema DEDALO (y otros tantos), en la forma en que necesite ser consumida.

Modelos predictivos y gestión de la información

Ya no es suficiente con obtener inconsistencias objeto de revisión partiendo de datos concretos de los declarantes específicos, sino que bajo estas nuevas técnicas se generan índices de riesgo a través de la visión tipificada de ratios y desviaciones estándar, generando perfiles de riesgo que se van perfeccionando con las sucesivas actuaciones que alimentan el sistema.

Las máquinas ya están en proceso de aprendizaje, por lo que es cuestión de tiempo que los algoritmos se perfeccionen y detecten desviaciones cada vez menores en los modelos generados con toda esta cantidad de datos históricos. Datos que permiten predecir probabilidad de fraude e incorrección en casos similares a los que han alimentado los modelos. Es decir, el sistema predice lo que espera de cada declarante y comprueba si la realidad se ajusta a sus cálculos. Por eso, los operadores económicos se van a ver más obligados que nunca a gestionar su propia información de forma completa, eficiente, contrastada y detallada para mantener sus datos en los parámetros previsibles de su actividad, si no quieren recibir una inoportuna sorpresa.