Hjem » Danmarks Statistik

En hybrid AI-arkitektur möjliggjorde säker sökning, intern chatt och direkt API-åtkomst

Kund
Danmarks Statistik
Industri
Offentlig data / Statlig infrastruktur
Utmaning
Möjliggör AI på känsliga data utan att rådata lämnar intern infrastruktur
Resultat

En hybrid AI-arkitektur möjliggjorde säker semantisk sökning, intern chatt och direkt API-åtkomst för externa agenter

Omfattning

AI-funktioner utan att exponera känsliga data

Danmarks Statistik hanterar en del av Danmarks mest känsliga offentliga data. Det eliminerade verktyg som ChatGPT och Gemini från dag ett.

Projektet startade som ett internt forskningsprojekt för att utvärdera möjligheterna att använda AI i stor skala på DST. Organisationen hade redan starka interna utvecklingsmöjligheter och investerade i intern infrastruktur, inklusive nästa generations GPU:er, för att köra AI-arbetslaster internt. Utmaningen var inte om AI kunde användas, utan hur man kunde bygga användbara funktioner i stor skala utan att kompromissa med säkerheten eller förlita sig helt på kommersiella API:er.

Omfattningen inkluderade:

  • Att designa en AI-arkitektur där rådata aldrig lämnade interna system
  • Möjliggör semantisk sökning i stora och svårnavigerade datamängder
  • Att bygga ett internt chattverktyg för användningsfall med känslig data
  • Att skapa ett mer tillförlitligt gränssnitt för externa AI-agenter som interagerar med offentliga data
  • Utbildning av team inom observabilitet, verktyg, regelefterlevnad och AI-arbetsflöden

Koncept

Säkerhet och kapacitet, utan kompromisser

Arkitekturen byggdes kring en enkel princip: rådata stannar kvar internt, medan mening kan flyttas säkert genom vektorer.

Interna modeller som körs på Danmarks Statistiks egen hårdvara hanterar anonymisering och vektorisering. Externa modeller arbetar endast med vektorer vid körtid, aldrig med den underliggande rådatan. Detta skapar en hybridlösning som kombinerar säkerheten i ett slutet system med flexibiliteten och prestandan hos externa modeller.

BCT byggde, vid sidan av kärnarkitekturen, ett internt chattverktyg som drivs av en stor open source-modell, vilket gör det möjligt för personalen att arbeta konversationellt med känsliga data i en säker miljö. BCT satte också upp en MCP-server runt Danmarks Statistiks publika API, vilket gör det möjligt för externa AI-agenter att ställa frågor till strukturerad data direkt istället för att skrapa webbplatsen på klientsidan.

Resultatet blev inte bara nya verktyg, utan en mer skalbar och hållbar AI-grund.

Bearbeta

BCT utformade och implementerade den tekniska installationen, samtidigt som de hjälpte organisationen att bygga intern kapacitet kring den.

Hybrid AI-arkitektur

Vi designade en arkitektur där interna modeller hanterade anonymisering och vektorisering på Statistiska centralbyråns egen infrastruktur, medan externa modeller endast interagerade med vektorrepresentationer under körning. Detta säkerställde att rådata förblev skyddad samtidigt som moderna AI-funktioner möjliggjordes.

Vektordatabaser och semantisk sökning

Danmarks Statistiks datatabeller är stora och komplexa. Vi bäddade in data och byggde vektordatabaser ovanpå, vilket gjorde tidigare svårnavigerat innehåll sökbart genom semantiska frågor.

MCP-server för det publika API:et

För att minska belastningen som orsakas av AI-agenter som skrapar webbplatsen byggde vi en MCP-server runt det befintliga API:et. Detta gav agenter en strukturerad, pålitlig metod för att få tillgång till offentliga data direkt via backend istället för via klientupplevelsen.

Intern chattverktyg

Vi byggde en säker intern chattmiljö som drivs av en öppen källkodsmodell med 120 miljarder parametrar som körs på intern infrastruktur. Anställda kunde arbeta med vektoriserad känslig data på naturligt språk, med dynamiska visualiseringsfunktioner under utveckling.

Utbildning och kompetensutveckling

Parallellt med det tekniska arbetet genomförde vi ett sex månader långt utbildningsprogram som täckte AI-observerbarhet, automationsverktyg, IDE-integration och strategier för regelefterlevnad – vilket hjälpte teamet att bygga en varaktig intern kompetens kring AI.

Resultat

Resultatet blev en AI-lösning som inte tvingade Danmarks Statistik att välja mellan säkerhet och kapacitet.

Känsliga data kan nu vektoriseras, sökas och användas i AI-drivna arbetsflöden utan att lämna intern infrastruktur. Externa modeller kan leverera prestanda i stor skala utan att någonsin röra rådata.

Detta möjliggjorde:

  • Aktivera säker semantisk sökning över komplex intern data
  • Tillhandahåll ett internt chattverktyg för personalen för användningsfall med känslig data
  • Ersätt webbskrapning av externa AI-agenter med ett strukturerat API-baserat gränssnitt
  • Minska belastningen på klientresurser genom direkt åtkomst till backend
  • Bygg starkare intern kapacitet genom utbildning och praktiskt stöd

Mer generellt skapade projektet en modell för hur hårt reglerade organisationer kan arbeta med AI på ett ansvarsfullt sätt – utan att ge upp vare sig prestanda eller kontroll.

Behöver AI-funktioner som din nuvarande säkerhetsmodell inte tillåter?

Om din organisation sitter på känslig data och försöker reda ut vad som faktiskt är möjligt inom era begränsningar, bör vi prata.

Prata med oss om ditt projekt.
Vi bygger skalbara mjukvaru- och AI-lösningar som faktiskt fungerar
– pragmatiskt, datadrivet och gjort av riktiga människor.
Född digital. Byggd annorlunda.
Kontakta oss
info@blackcapitaltechnology.com +45 60 92 92 60
Mølleå 3-5,
9000 Aalborg
Danmark
(+45) 60 92 92 60
CVR-nummer
DK-42380784
Turbinveien 9,
0195 Oslo
Norge
(+47) 907 00 863
Org. nr.:
NO-933435458