NRK Rettelser

Som vg.no/rettelser, bare for NRK

Metode

Slik samler, behandler og publiserer vi data om NRKs rettelser.

Hva er dette?

NRK Rettelser er en uoffisiell oversikt over offentliggjorte rettelser i NRKs nettjournalistikk. Siden er inspirert av vg.no/rettelser, som samler VGs egne rettelser på ett sted.

NRK har ingen tilsvarende samlet oversikt. Dette prosjektet fyller den tomrommet ved å automatisk lete etter rettelsesformuleringer i NRKs artikler.

Hvorfor?

Åpenhet om feil er en forutsetning for tillit til journalistikk. Når medier retter seg selv, er det i utgangspunktet bra — men verdien av rettelsen avhenger av om den er synlig.

En rettelse begravd midt i en artikkel, uten noe samlet sted å finne den, er vanskelig å oppdage for lesere som ikke tilfeldigvis klikker seg inn igjen. Aggregering gjør rettelsene tilgjengelige og søkbare, og gjør det enklere å se mønstre over tid: Hvilke saker rettes? Hvor raskt? Hvilke deler av redaksjonen?

NRK er finansiert av allmennheten gjennom lisensen. Det gir ekstra grunn til å følge med på hvordan redaksjonen håndterer egne feil. Dette prosjektet er et forsøk på å gjøre den oppgaven litt lettere.

Datakilder

Vi henter artikler fra to kilder:

Begge metodene mater inn i samme rådatafil, som deretter berikes og kvalitetssikres.

Slik oppdages rettelser

Hver artikkel analyseres for kjente uttrykk som indikerer en rettelse. Vi ser etter disse ordene og vendingene (uten hensyn til store/små bokstaver):

Bokmål

i en tidligere versjon i en eldre versjon i en tidligere publisert versjon nrk retter nrk har rettet nrk korrigerer nrk beklager rettelse: rettelse retting: retting korrigering: presisering: endringen er gjort vi har rettet artikkelen er oppdatert tidligere skrev vi etter publisering

Nynorsk

endringane er gjort endringane vart gjort det er gjort endringar artikkelen er endra

Når en slik formulering finnes, hentes rettelsesteksten ut med en tre-trinns strategi:

Navigasjonstekst og andre kjente støykilder filtreres bort automatisk.

Berikelse og kvalitetssikring med KI

Alle nye funn går gjennom et automatisk berikelsesteg som bruker Google Gemini 3.1 Flash Lite. Opptil 20 000 tegn av artikkelens brødtekst sendes til modellen for kontekst. KI-en produserer følgende for hver oppføring:

Oppdateringsfrekvens

Datainnsamlingen kjøres automatisk via GitHub Actions med tre arbeidsflyter:

Alle arbeidsflyter bruker en felles samtidighetsgruppe slik at de ikke kjører parallelt og skaper konflikter.

Nye rettelser dukker normalt opp på siden innen seks timer etter at de er publisert på nrk.no.

Begrensninger

Listen er ikke komplett. Vi fanger ikke opp:

Prosjektet er under løpende utvikling og dekningen vil forbedres over tid.

Kildekode og data

All kode og alle data er åpent tilgjengelig. Du kan laste ned datasettet som JSON direkte fra forsiden, eller utforske kildekoden på GitHub:

github.com/annar-bohn/nrk-rettelser →