Título: Implementing dictionaries of regulatory concepts and reporting obligations by assisted machine learning. Final report
Resumen:Este documento informa sobre el proyecto Implementación de diccionarios de conceptos normativos y obligaciones de información mediante aprendizaje automático asistido (FISMA 2019:050/E). El proyecto tiene los siguientes objetivos: 1. Cubrir todo el cuerpo normativo en el ámbito de la DG FISMA. La solución debe ser escalable a nuevos documentos. 2. Construir un glosario de conceptos (palabras o frases) e identificar sus definiciones. Este glosario debe ampliar y ser coherente con la taxonomía FISMA existente. 3. 3. Construir un diccionario de las obligaciones de información establecidas en el corpus de documentos cubiertos (dicha obligación establece quién debe informar, sobre qué debe informar, etc.). El diccionario debe ser coherente con la taxonomía FISMA existente. 4. Asegurarse de que la precisión de los diccionarios compilados se aproxima al 100% combinando la automatización con la asistencia humana. 5. Ampliar las herramientas existentes de la autoridad contratante (AC) y, cuando sea necesario, diseñar y desarrollar nuevas herramientas para utilizar los diccionarios en el trabajo práctico de la AC. Estas herramientas deberían poder integrarse fácilmente en el ecosistema digital de la AC.
Summary:This document reports on the project Implementing dictionaries of regulatory concepts and reporting obligations by assisted machine learning (FISMA 2019:050/E). The project has the following objectives: 1. Cover the entire body of legislation in the scope of DG FISMA. The solution needs to be scalable to new documents. 2. Build a glossary of concepts (words or phrases) and identify their definitions. This glossary must extend and be coherent with the existing FISMA Taxonomy. 3. Build a dictionary of reporting obligations laid out in the covered corpus of documents (such an obligation states who needs to report, what needs to be reported on, etc.). The dictionary must be coherent with the existing FISMA Taxonomy. 4. Make sure accuracy of the compiled dictionaries approximates 100% by combining automation with human assistance. 5. Extend existing tools of the contracting authority (CA) and where necessary design and develop new tools to use the dictionaries in practical work of the CA. It should be possible to easily integrate these tools in the CA’s digital ecosystem.
Fecha publicación: 12-11-2021
Autor: Crosslang , Dirección General de Estabilidad Financiera, Servicios Financieros y Unión de los Mercados de Capitales , IDLab , Milieu
ISBN / ISSN: 978-92-76-42382-9
Link: https://bit.ly/3Di4f1k
Palabras clave: aprendizaje automático , diccionario , informe , informática documental , legislación , motor de búsqueda , obra de referencia
Keywords: dictionary , documentary tool , information storage and retrieval , legislation , machine learning , report , search engine