Claus har kodet millioner af datapunkter for at kigge politikerne efter i sømmene

IT Politik
Programmøren Claus vil måle politikerne på deres stemmer – ikke deres taler. Nu kan vælgerne selv tjekke, om der er sammenhæng mellem ord og handling.
På billedet ses Claus Due og Christiansborg. Kredit: Privatfoto og Wikicommon

Skrevet af Emma Inge Hansen

Den 24. marts er der folketingsvalg. Men det afgørende er ikke kun, hvad politikerne siger i valgkampen. Det er, hvad de stemmer, når kameraerne er slukket, og hypen har lagt sig.

Folketinget stiller enorme mængder åbne data til rådighed. Men vil du finde ud af, hvad en bestemt politiker faktisk har stemt, kræver det tålmodighed – og mange, mange klik.

Det vil Claus Due lave om på.

Fra åbne data til søgbar indsigt

Claus Due, der til dagligt er selvstændig programmør, har skabt hjemmesiden politikdata.dk, som skal gøre det nemmere at se, hvad en bestemt politiker eller part tidligere har stemt.

“Grundlæggende bruger systemet Folketingets åbne data. Det betyder, at jeg kan hente alle afstemninger, alle sager, personoplysninger og partidetaljer. Når man kombinerer de fire ting, kan man faktisk bygge et arkiv over alt, hvad en politiker eller et parti har stemt om i Folketinget,” forklarer Claus Due.

Persondataene omfatter blandt andet biografiske oplysninger og partiforhold – herunder hvornår en politiker har været medlem af et bestemt parti.

“Det gør, at jeg kan knytte en konkret stemme til en konkret person på et bestemt tidspunkt. Hvis en politiker var medlem af et parti, da stemmen blev afgivet, så tæller stemmen hos det parti. På den måde har jeg både overblik over, hvad den enkelte har stemt, og hvad partierne samlet har stemt.”

Forskellen fra Folketingets egen hjemmeside er ifølge Claus Due, at man slipper for at gå ind på hver enkelt sag for at finde ud af, hvordan politikerne og partierne har stemt:

“Jeg har vendt det på hovedet, så du kan bruge politikeren eller partiet som indgang.”

Derudover har Claus Due lavet en kandidat-test på siden. Her vælger man selv de emner, man går op i, og systemet finder konkrete afstemninger inden for netop de områder. Til sidst får man en rangliste over, hvilke partier der stemmer mest som én selv – baseret på faktiske stemmer, ikke politiske løfter.

Frustration blev til løsning

Ideen opstod af egen frustration.

“Jeg havde selv brug for at lave en research og blev frustreret over, at Folketingets system ikke gav mig mulighed for at slå en politiker op og se det hele samlet. Som programmør tænker jeg automatisk: De data findes jo – ellers kunne de ikke vise dem. Så kan jeg ikke bruge dem på en smartere måde?”

For Claus Due handler det om at give vælgerne mulighed for at danne sig en mening på et mere oplyst grundlag.

Politikere – og i virkeligheden alle mennesker – bør bedømmes på, hvad de gør, ikke hvad de siger

“Politikere – og i virkeligheden alle mennesker – bør bedømmes på, hvad de gør, ikke hvad de siger,” mener han.

Et stort puslespil af relationer

Teknisk set er løsningen bygget på et API – et Application Programming Interface – hvor Folketinget stiller data til rådighed.

“Man kan skrive et program, der henter alle dataene ned. De hænger sammen i relationer: En sag hænger sammen med en afstemning, en afstemning med en stemme, og en stemme med en person. Det er et stort puslespil af relaterede data.”

Claus Due har skrevet et program, der henter dataene ned i sin egen database.

“Så kan jeg selv bestemme, hvordan jeg vil lave forespørgsler på relationerne. Hvis jeg bare vil vide, hvad en sag handler om, behøver jeg ikke alle stemmedata. Men hvis jeg vil vide, hvem der stemte hvad, skal jeg hente både sagen og alle de relaterede afstemninger,” siger Claus Due, der har arbejdet i kodesproget PHP for at bygge politikdata.dk.

Millioner af rækker

Ifølge Claus Due er det ikke helt ligetil at lave en løsning som politikdata.dk.

“Der er meget store datamængder, vi taler om. Nogle af tabellerne indeholder millioner af rækker. Hvis man forestiller sig et regneark med en million linjer, så begynder man at forstå størrelsen.”

Derfor kræver det erfaring med store datastrukturer og relationer mellem tabeller at få det hele til at spille, understreger han.

Og det er noget, som mange af de store sprogmodeller sætter pris på at kunne udnytte.

Ifølge Claus er det ikke kun borgere og journalister, der bruger siden. Store sprogmodeller som ChatGPT benytter sig også af den.

“De her modeller bruger mit projekt til at finde oplysninger. Før skulle de gøre det ligesom en bruger på Folketingets hjemmeside – bare hurtigere. Nu kan de lave mere præcise opslag direkte hos mig.”

Han kan se i sine logs, hvilke klienter der henter data, og her viser loggen, at AI-modellerne ofte er på besøg.

“ChatGPT identificerer sig som ChatGPT. Man kan også spørge modellen, hvordan den fandt informationen, og så forklarer den, at den har brugt søgefunktionen.”

Claus Due har valgt ikke at blokere AI-bots, men at sætte begrænsninger på dem.

“Hvis de får lov, kan de hente 30 sider i sekundet, og det kan overbelaste serveren. Så jeg har bedt dem om at tage det roligt - de må nøjes med en eller to sider i sekundet. Men jeg har valgt ikke at blokere dem, fordi det betyder, at endnu flere kan få nytte af den data, der er derinde.”

PROSA – din IT-fagforening
God nyhed: Ingen cookies her

Vi indsamler kun statistik på vores egen server uden at bruge cookies.

Ingen person-tracking, ingen profilering, ingen "accepter alle"-knapper.

GDPR-artikel 5 kalder det dataminimering.

Vi kalder det god stil.