En hybrid AI-arkitektur muliggjorde sikker søgning, intern chat og direkte API-adgang

Klient

Danmarks Statistik

Industri

Offentlige data / Offentlig infrastruktur

Udfordring

Muliggør AI på følsomme data uden at rådata forlader den interne infrastruktur

Resultater

En hybrid AI-arkitektur muliggjorde sikker semantisk søgning, intern chat og direkte API-adgang for eksterne agenter

Omfang

AI-kapaciteter uden at afsløre følsomme data

Danmarks Statistik forvalter nogle af Danmarks mest følsomme offentlige data. Det eliminerede værktøjer som ChatGPT og Gemini fra dag ét.

Projektet startede som et internt forskningsprojekt for at evaluere mulighederne for at bruge AI i stor skala hos DST. Organisationen havde allerede stærke interne udviklingskapaciteter og investerede i intern infrastruktur, herunder næste-generations GPU'er, til at køre AI-arbejdsbelastninger internt. Udfordringen var ikke, om AI kunne bruges, men hvordan man kunne opbygge nyttige kapabiliteter i stor skala uden at gå på kompromis med sikkerheden eller helt at stole på kommercielle API'er.

Omfanget omfattede:

Design af en AI-arkitektur, hvor rådata aldrig forlod interne systemer
Muliggørelse af semantisk søgning på tværs af store og vanskelige datasæt
Opbygning af et internt chatværktøj til brugsscenarier med følsomme data
Oprettelse af en mere pålidelig grænseflade til eksterne AI-agenter, der interagerer med offentlige data
Træning af teams inden for observerbarhed, værktøjer, compliance og AI-workflows

Koncept

Sikkerhed og kapacitet, uden kompromis

Arkitekturen blev bygget op omkring et simpelt princip: rå data forbliver indeni, mens mening sikkert kan bevæge sig gennem vektorer.

Interne modeller, der kører på Danmarks Statistiks egen hardware, håndterer anonymisering og vektorisering. Eksterne modeller opererer kun på vektorer under kørsel, aldrig på de underliggende rådata. Dette skaber et hybridsetup, der kombinerer sikkerheden af et lukket system med fleksibiliteten og ydeevnen af eksterne modeller.

Ud over kernearkitekturen byggede BCT et internt chatværktøj drevet af en stor open source-model, hvilket gjorde det muligt for personalet at arbejde samtalemæssigt med følsomme data i et sikkert miljø. BCT opsatte også en MCP-server omkring Danmarks Statistik’s offentlige API, hvilket gjorde det muligt for eksterne AI-agenter at forespørge strukturerede data direkte i stedet for at skrabe websitet på klientsiden.

Resultatet var ikke kun nye værktøjer, men et mere skalerbart og bæredygtigt AI-fundament.

Proces

BCT designede og implementerede den tekniske opsætning, samtidig med at de hjalp organisationen med at opbygge intern kapacitet omkring den.

Hybrid AI-arkitektur

Vi designede en arkitektur, hvor interne modeller håndterer anonymisering og vektorisering på Danmarks Statistiks egen infrastruktur, mens eksterne modeller kun interagerer med vektorrepræsentationer under kørslen. Dette sikrede, at rådata forblev beskyttet, samtidig med at det muliggjorde moderne AI-kapabiliteter.

Vektordatabaser og semantisk søgning

Danmarks Statistiks datatabeller er store og komplekse. Vi indlejrede dataene og byggede vektordatabaser ovenpå, hvilket gjorde tidligere svært fremkommeligt indhold søgbart gennem semantiske forespørgsler.

MCP server for den offentlige API

For at reducere den belastning, der var forårsaget af AI-agenter, der skrabede hjemmesiden, byggede vi en MCP-server omkring den eksisterende API. Dette gav agenterne en struktureret, pålidelig måde at få adgang til offentlige data direkte via backend'en i stedet for via klientens oplevelse.

Internt chatværktøj

Vi byggede et sikkert internt chatmiljø drevet af en open source-model med 120 milliarder parametre, der kørte på intern infrastruktur. Medarbejdere kunne arbejde med vektoriserede følsomme data på naturligt sprog, med dynamiske visualiseringsfunktioner under udvikling.

Træning og enablement

Udover det tekniske arbejde gennemførte vi et seks-måneders træningsprogram, der dækkede AI-observerbarhed, automatiseringsværktøjer, IDE-integration og compliance-strategi – hvilket hjalp teamet med at opbygge varig intern kapacitet omkring AI.

Resultater

Resultatet var et AI-setup, der ikke tvang Danmarks Statistik til at vælge mellem sikkerhed og kapacitet.

Følsomme data kunne nu vektoriseres, søges og bruges i AI-drevne arbejdsgange uden at forlade intern infrastruktur. Eksterne modeller kunne levere ydeevne i stor skala uden nogensinde at røre de rå data.

Dette gjorde det muligt at:

Aktiver sikker semantisk søgning på tværs af komplekse interne data
Tilbyd medarbejderne et internt chatværktøj til brugsscenarier med følsomme data
Erstat webteskrapning med eksterne AI-agenter med en struktureret API-baseret grænseflade
Reducer belastningen på klient-ressourcer gennem direkte backend-adgang
Opbyg stærkere interne kompetencer gennem træning og praktisk enablement

Mere bredt skabte projektet en model for, hvordan højt regulerede organisationer kan arbejde med AI på en ansvarlig måde – uden at opgive hverken ydeevne eller kontrol.

Behov for AI-kapaciteter, som din nuværende sikkerhedsmodel ikke tillader?

Hvis din organisation sidder på følsomme data og forsøger at finde ud af, hvad der rent faktisk er muligt inden for jeres begrænsninger, så bør vi tale sammen.

Tal med os om dit projekt.

Kontakt os