DataMapper: Konfigurering til minimering af falske positiver

Hvordan konfigurerer man indstillinger i DataMapper for at minimere for mange ‘falske positiver’?

Svar:

Definition af høj risiko: For at klassificere et dokument som høj risiko, leder DataMapper efter højrisko-numre. For mere præcis detektion af numre er det nødvendigt at vælge det eller de relevante land(e)formater, så DataMapper kan genkende nummeret korrekt.

Eksempel: Filtrering på numre i DataMapper kan gøres via filtre på siden "Risikodokumenter". Vi scanner efter: pasnumre (DK & UK), NINO-numre (UK), kørekort, CPR-numre og betalingskortinformation (kreditkortnumre).

Herfra kan du gennemgå filens resultater med Forhåndsvisning eller Gå til dokument.

Forhåndsvisningen vises som nedenfor:

Forbedring af nøjagtighed i højrisiko-fund med DataMapper

Hos Safe Online forstår vi, at virksomheder arbejder med mange forskellige filtyper og formater på tværs af lande. For at forbedre nøjagtigheden i identifikation af højrisikodata og give en bedre brugeroplevelse, tilbyder vi en tilpasset løsning*.

Sådan fungerer processen:

1. Indledende regelbaseret scanning:

Vi starter med en første scanning ved hjælp af vores regelbaserede modeller. Disse modeller er designet til at identificere følsomme data ved at genkende specifikke mønstre og nøgleord, som fx NINO-numre i UK.

2. Gennemgang og analyse:

Når den indledende scanning er afsluttet, samarbejder vi med kunden om at gennemgå resultaterne. Dette trin indebærer at identificere eventuelle falske positiver (forkert markerede data) samt følsomme data, der eventuelt er blevet overset.

3. Tilpasset træning med LLM:

Baseret på data fra gennemgangen udfører vi yderligere træning af vores Large Language Model (LLM) med kundens specifikke data. Denne tilpassede træning hjælper LLM’en med bedre at forstå konteksten og reducere falske positiver i fremtidige scanninger.

4. Re-scanning for forbedret nøjagtighed:

Efter LLM’en er blevet trænet med kundespecifikke data, gennemfører vi en ny scanning. Dette sikrer mere præcise fund med væsentligt færre falske positiver og oversete følsomme data.

Fordele ved denne proces:

  • Øget nøjagtighed: Skræddersyet scanning og træning giver mere præcis identifikation af højrisikodata.
  • Reducerede falske positiver: Forbedret LLM-behandling minimerer forkerte markeringer, hvilket sparer tid og ressourcer.
  • Bedre brugeroplevelse: Mere præcise resultater giver en mere smidig og effektiv databehandling for brugeren.
  • Kontinuerlig forbedring: Systemet bliver mere præcist over tid, efterhånden som flere data behandles og LLM’en yderligere trænes.

Ved at udnytte kraften i DataMapper og vores avancerede AIM-motor sikrer Safe Online, at din virksomheds følsomme data identificeres præcist og effektivt – med øget sikkerhed og brugertilfredshed.


Har du flere spørgsmål?

Du er altid velkommen til at kontakte os! Skriv til os på support@safeonline.dk eller brug chatknappen i nederste venstre hjørne i DataMapper.

Still need help? Contact Us Contact Us