Software, Arbejdsmarkedet

Robotjournalistik skaber arbejde til it-folk

Medier og andre brancher har fået øjnene op for tekster skabt af robotter. Tendensen kan ”radikalt forandre den måde, indhold bliver produceret på – på tværs af brancher”, siger en forsker. Et nyt marked for it-folk åbner sig.

Det er ikke længere forbeholdt mennesker at producere journalistik, marketing og videnskabelig litteratur. Autogenereret indhold er på indtog i mediebranchen, og teknologien er relevant for mange andre brancher.
– Vi tror virkelig på det her område, lyder det eksempelvis fra Kristoffer Gravgaard, der er udviklingsdirektør hos nyhedsbureauet Ritzau.

Ritzau har bygget to robotjournalister. Den ene skriver om fodbold og gik i luften sidste år. For eksempel skriver den en nyhed til nordjyske.dk, hver gang to nordjyske fodboldhold har spillet en kamp. Den anden blev lanceret i juni og skriver om bolighandler.

Begejstrede chefer

Udviklingen er stadig i sin spæde start hos Ritzau. Bureauet har haft en enkelt udvikler og en journalist til at bygge den seneste boligrobot, men indsatsen har vokseværk.
Mediehuset Altinget er også i gang. Til det seneste folketingsvalg publicerede mediehuset over 900 robot-artikler – én om hver kandidat.
– Det var et eksperiment. Vi vidste ikke, hvor godt det blev. Men vi var meget stolte af det, da det endelig kom frem, siger Altingets projektchef, Kristoffer Hecquet.

Robotjournalistik er ifølge brancheorganisationen Danske Medier stadig en ny tendens i Danmark.
– Men vi kan se, at mange af vores medlemmer bruger det, siger organisationens publicistiske chef, Jesper Jürgensen.

Også uden for mediebranchen har teknologien fået fat. Blandt andet hos markedsdatavirksomheden Lasso X, der har robotter til at skrive mere end 1.000 nyheder om danske virksomheder om dagen.
– Vi er stødt på mange brancher, der kan gøre brug af det her, fortæller chief technology officer Jeppe Bech Madsen.

Stort potentiale uden for medierne

Filip Wallberg forsker og underviser i digitale medier på Syddansk Universitet. Han har fulgt tendensen, siden den for alvor begyndte at røre på sig i Danmark i 2017 – et par år efter USA.
– Der ligger et kæmpe potentiale i automatiseret indholdsproduktion. Og hvis potentialet bliver forløst, kan det helt grundlæggende og radikalt forandre den måde, indhold bliver produceret på – på tværs af brancher, siger han.

De største vækstmuligheder ser han dog ikke i mediehusene.
– Det største potentiale ligger i andre brancher. Tag for eksempel hele den offentlige sektor eller beskrivelser af produkter til hjemmesider: Alt, hvor der skal ske en systematisk kommunikation, der kan trækkes igennem en skabelon, siger Filip Wallberg.

Derfor er autogenereret indhold lige så relevant for blandt andet marketingbranchen, mener Leon Derczynski, der forsker i sprogteknologi på IT-Universitetet i København.

Faktisk var marketingbranchen en af frontløberne, da tendensen tog fart på globalt plan for fem-syv år siden.
– En af de ting, der virkelig skubbede det frem, var, da det blev mainstream at skrive anmeldelser af hoteller og produkter. Det førte til en kæmpe flod af autogenererede falske anmeldelser, siger han.

Normalt hyrede et stort firma et marketingfirma. Dernæst hyrede marketingfirmaet et andet firma til at skrive gode anmeldelser for dem. Og så fandt dét firma ud af, at det var lettere at få maskiner til at skrive anmeldelserne, forklarer han.

Men teknologien kan også bruges til formål, der typisk bliver betragtet som mere etisk korrekte.
– Outsourcing af små artikler til marketingformål kan stoppe nu. Man behøver ikke længere at betale folk på Filippinerne. Nu kan vi i stedet gøre det automatisk, siger Leon Derczynski.

Han skynder sig at understrege, at han taler om engelsksprogede tekster.
 – Det er anderledes på andre sprog, siger han.

Virker bedst på engelsk

Teknologien rykker hurtigere på engelsk end på andre sprog. Det skyldes blandt andet, at der er et større marked for software, der ’snakker’ engelsk. Og dét fører til hurtigere softwareudvikling.

Desuden er mængden af tilgængelige tekster på nettet – som er skrevet af mennesker – meget større på engelsk end andre sprog. Og det betyder, at nyere systemer, der bygger på machine learning, har mere materiale at træne med.

Algoritmer kan også overtage mange resumeringsfunktioner, vurderer Leon Derczynski.
– Nogle gange skal en læge læse 20 års noter. Det er bedre, hvis en computer kan lave et resumé, siger han.

Konceptet fandt for nylig vej til den videnskabelige litteratur. I april publicerede det videnskabelige forlag Springer Nature en bog, der opsummerede den seneste forskning inden for lithium-ion-batterier. Forfatteren var en maskine.

Webmagasinet Advanced Science News skriver i en anmeldelse af bogen, at sproget langtfra er perfekt, men: ”Vi må som redaktører indrømme, at vi har læst langt værre tekster fra meget menneskelige forskere”.

De modeller, der driver robotjournalistikken i Danmark, bygger indtil videre på skabeloner, hvis-sætninger og strukturerede data. Og som Filip Wallberg siger det:
– Hvis du tager den helt simple artikelgenerator, er der ikke sket noget væsentligt de seneste år. Der er ikke noget nyt i hvis-sætninger. Det er basal programmering.

Men det er ingen dårlig ting, at teknologien er simpel, understreger forskeren.
– Man kan nå sindssygt langt med den basale udgave. Det er bare et spørgsmål om, at man sætter sig ned og gør det. Man kan spare, effektivisere og øge kvaliteten betydeligt. Det er der slet ikke nogen tvivl om, vurderer han.

Neurale netværk på vej

Men hvis-sætninger er formentlig kun begyndelsen. I kulissen lurer neurale netværk, der er i gang med at opbygge en slags ’forståelse’ for sproget. Og som selv finder ud af, hvad de vil skrive.

Google bruger allerede neurale netværk til at drive ­Google Translate. Og der forskes meget i neurale netværk til indholdsproduktion, fortæller Leon Derczynski fra IT- Universitetet.

Han er ikke i tvivl om, at fremtiden for autogenereret indhold tilhører neurale netværk, og han peger på to ”kæmpe fremskridt” i det seneste halve år.

Det første er GPT-2: Et neuralt netværk udviklet af den amerikanske forskningsinstitution OpenAI. Netværket kan afslutte en artikel, hvis man skriver de første sætninger. Dele af koden kan hentes gratis på GitHub. Men teamet holder den fulde kode tilbage på grund af ”bekymringer om ondsindede anvendelser af teknologien”, ifølge forskernes hjemmeside. Sagen er, at sådan et system kunne publicere en endeløs strøm af falsk indhold.

Det andet system, som Leon Derczynski peger på, er Grover: Et neuralt netværk, som er udviklet af – blandt andre – forskere på Washington University. Grover kan både producere og opdage falsk indhold. Man kan prøve en demo på hjemmesiden grover.allenai.org
Begge systemer demonstrerer, at neurale netværk nu kan skrive tekster, der kan være svære at skelne fra tekster skrevet af mennesker. Ingen af dem er dog bygget til at bekymre sig om fakta.

Stadig grundforskning

Filip Wallberg er enig i, at neurale netværk er der, hvor det afgørende nye sker.
– Men det er stadig grundforskning og ’research and development’. Det er derfor, vi stadig har den skabelonstyrede artikel, siger han.

Skabelonrobotterne har den fordel, at de kan programmeres, så de stort set ikke kan lave fejl. Og at teknologien er så enkel, at de fleste programmører kan bygge en simpel robotjournalist. Det vurderer i hvert fald it-konsulent Niels Erik Kaaber Rasmussen, der står bag den robot, som skrev de 900 artikler til Altinget ved det seneste folketingsvalg.

Og indtil videre står markedet åbent for innovative udviklere. Men situationen kan hurtigt forandre sig.
– Det hele kommer an på, om der kommer et udenlandsk firma, der kan løse det hele. Hvis det sker, er der ikke en skid i det for danske it-folk, siger Filip Wallberg.

Tre udenlandske eksempler på autogenereret indhold

WORDSMITH
Wordsmith er en platform, der kan omsætte komplekse datamængder til tekst. Bag det står Automated Insights, og blandt kunderne finder man Associated Press og Yahoo. Du kan få en gratis prøve på wordsmith.com

BETA WRITER
I april publicerede det videnskabelige forlag Springer Nature en bog, der opsummerer den seneste forskning i lithium-ion-batterier. Bag bogen stod robotten Beta Writer. Du kan hente bogen gratis på nettet ved at søge på titlen: ’Lithium-Ion Batteries – A Machine-Generated Summary of Current Research’.

GROVER
Forskere fra blandt andet Washington University har bygget et neuralt netværk, der både kan skrive og opspore falsk indhold. Du kan prøve kræfter med systemet på grover.allenai.org. Hvis du indsætter nogle parametre – såsom en overskrift og et medie, hvis skrivestil netværket skal læne sig op ad – skriver systemet en tekst af egen drift. Resultatet bliver dog højst utroværdigt, for Grover bekymrer sig ikke om fakta.