Få adgang til CVR-data i en kvalitet, du indtil nu kun har drømt om!

Få adgang til CVR-data i en kvalitet, du indtil nu kun har drømt om!

Det offentlige Danmark stiller en masse data til rådighed – kvit og frit. Det burde jo gøre det nemt og ligetil at hente de data ud, man skal bruge – men sådan fungerer det bare ikke altid i virkeligheden!

I det her blogindlæg ser vi nærmere på én af de datakilder, som burde give mening i virksomheder i alle mulige brancher, nemlig det centrale virksomhedsregister (CVR), og vi fortæller, hvordan du får adgang til CVR-data i en kvalitet, du indtil kun har kunnet drømme om!

 

Udfordringer med brugen af data fra CVR

Det centrale virksomhedsregister CVR indeholder oplysninger om alle registrerede virksomheder i Danmark og Grønland. Du kan finde oplysninger om virksomheders adresser, brancher, ejerkredse og regnskaber osv.

Oplysningerne findes på et offentligt website. Midt på siden finder du et link: system-til-system adgang – hvor du kan læse om de muligheder, Erhvervsstyrelsen stiller til rådighed.

Så burde det jo bare være at klikke og gå i gang med at hente data. Men – det viser sig hurtigt, at det kræver meget mere end bare en adgang, når man ønsker at basere sig på ’andres’ data! Her er nogle af de udfordringer, vi er stødt ind i med CVR, og hvordan vi har løst dem.

 

Svingende datakvalitet

På mange af virksomhederne mangler der data. Vi kan tage antal ansatte som eksempel.

Det er tal, der iflg. Erhvervsstyrelsen (ES) er indhentet fra Antal ansatte (oplysningerne kommer fra Danmarks Statistik og bygger på tal fra Skattestyrelsens eIndkomst)

Hvis vi ser på antal virksomheder i postnummer 8000, så findes der 14.723. Heraf har 9.026 virksomheder eller ca. 61 % ingen ansatte – det virker forkert!

Et andet eksempel er virksomhedens hjemmeside. Hver virksomhed har et felt hos ES, som virksomhederne selv har ansvaret for, og langt de fleste har desværre ikke udfyldt feltet. I postnummer 8000-området mangler informationen hos 85 %!

Og det er ikke de eneste felter, hvor datakvaliteten i værste fald er så mangelfuld, at den i visse tilfælde er ubrugelig.

Vi benytter forskellige metoder til bedre datakvalitet – blandt andet machine learning, og vi indsamler også data fra andre datakilder.

 

Hvordan får vi data integreret

Hvad er det så for et ekstra skridt, vi har taget med ML – og hvordan? Vi bruger ML til at styrke vores data, til at udbygge vores data og til at udnytte vores data.
En af de opgaver, vi ofte løser hos Openminds, er systemintegration. I CVR-tilfældet er det naturligt at finde anvendelse for udvalgte virksomhedsdata i egne systemer. Hos ES kan der søges, filtreres og udvælges data så at sige direkte fra ’databasen’.

Løsningen er funderet i open source produktet Elasticsearch (www.elastic.co). Via et såkaldt API (Application Programming Interface) kan der foretages simple og komplicerede søgninger, filtreringer, sorteringer, grupperinger, og du kan udvælge præcis de data, du ønsker. Det kræver blot et brugernavn og password, som alle kan få tildelt ved henvendelse til cvrselvbetjening@erst.dk. De tekniske formater er REST+JSON og er relativt ligetil at gå til.

Før du går i gang med at integrere til CVR, er det en god ide at læse “API – det handler om forretning“.

 

Tilgængelighed

De forskellige services hos ES har naturligvis deres eget liv. Det betyder blandt andet, at du desværre ikke er sikret et svar her-og-nu. I mange tilfælde kan man leve med lidt svartid – men det er ikke nødvendigvis godt nok, hvis man baserer sin forretning på at få virksomhedsoplysninger anytime.

Undervejs i vores arbejde med CVR-data har vi også oplevet at komme i kø, når kaldene til API’et blev for hyppige. Det har stor betydning, når virksomhedsdataene anvendes i egne systemer, og der her foretages en masse opdateringer. Det problem har man ikke med vores løsning – vi har de samme forbedrede data, men deler dem kun med vores kunder.

 

Viderebehandling

Vores erfaringer med data er, at de sjældent står alene – de indgår oftest i et større kompleks af informationer. De fleste IT-løsninger arbejder netop med at samle data for brugerne, så den rigtige forretningsbeslutning kan træffes.

Aggregering af data kræver altså, at alle datakilder er til rådighed, og at kvaliteten er tilstrækkelig god – ellers bremses egen viderebehandling, i værste fald med fuldt stop til følge.

Vores løsning kan indgå som primær og/eller sekundær datakilde og kan integreres på et utal af måder.

 

CVR regnskabsdata

Erhvervsstyrelsen tilbyder også muligheden for at få virksomhedernes regnskaber digitalt via en systemadgang.

Men her øges kompleksiteten væsentligt. Hvert regnskab kan fremsøges og hentes som PDF og/eller XBRL. Det betyder, at data skal yderligere behandles, før de kan anvendes. Ser vi bort fra systematisk at hente data ud fra PDF’erne, så er det via XBRL-formatet (læs: XML).

Kvaliteten af regnskaber er – på trods af at de oftest er eksporteret fra et ERP-system – piv-ringe! Vi har arbejdet rigtig meget på at få kvaliteten op på et niveau, hvor det giver mening at anvende dem i forretningsøjemed – se fx “Helt nye muligheder med CVR

 

Få adgang til lige præcis de CVR-data, du har brug for

Hos Openminds har vi arbejdet intensivt med at øge datakvaliteten og sikre tilgængeligheden af CVR-data.

Et eksempel på, hvad det betyder i praksis, er, at vi har udarbejdet en komponent, der kan finde en virksomheds hjemmeside – selvom hjemmesiden ikke findes som en del af CVR-stamdata!

Et andet eksempel er, at vi ved at kombinere stamdata og tilføje en søgemaskine har fundet en løsning, der i løbet af sekunder fx kan finde alle virksomheder inden for ’stål, jern, projektering eller fabrikat’, som har en omsætning over 10 mio. kr. og ligger i Midtjylland.

Så sidder du og bokser med et problem med at skaffe de rigtige data, så tag fat i Aage fra Openminds – så hjælper vi dig med at få præcis de data og den datakvalitet, som passer ind i jeres IT-landskab!

Aage Nielsen

Mail: ani@openminds.dk
Mobil: +45 5390 1639

Læs mere

Seneste blogindlæg

Det handler ikke kun om at udvikle gode systemer

Hør hvad vores tidligere studentermedhjælper, praktikant, bachelorstuderende og nu fastansatte medarbejder, Haroldas, har at sige om sin læring og udvikling hos Openminds.

Mød vores nyeste medarbejder Marius Thøgersen

Udvikleren skal kunne sit håndværk!
Det sikrer vi hos Openminds fx ved at holde ugentlige møder, hvor vi diskuterer faglige spørgsmål og trækker på hinandens styrker

Er ny teknologi ét skridt frem og to tilbage?

Danske virksomheder kan trække rigtig meget forretningsværdi ud af deres eksisterende it-setup uden at skulle investere i en masse ny teknologi. Men ny teknologi som fx AI og big data er blevet så hypet, at virksomhederne bliver i tvivl, om det overhovedet er muligt at udnytte data uden et CERN-lignende arrangement.