Översikt


Hittar du inte vad du letar efter? Klicka här för att söka.
Annons
Annons

”Felaktig bevisvärdering gör att brottslingar går fria”

Debatt
Publicerad: 2020-01-22 11:50

DEBATT – av Thomas Ahlstrand, vice chefsåklagare på Riksenheten mot Internationell och organiserad brottslighet och Johan Bring, docent i statistik med stor erfarenhet från juridisk bevisvärdering.

Del 1.
Bevisvärdering i brottmålsprocessen är svårt. Fällorna, felkällorna, är många. Än svårare är det att lägga samman bevisning, särskilt om varje enskild del i bevisningen är svag och bevisen ändå är många. Alltså i fall där det är fråga om huruvida sammanträffande omständigheter kan påvisa skuld i sådan omfattning att ett åtal är styrkt. I dessa fall blir teknisk bevisning, där domstolen kan lita på experters tolkning av fysiska fynd såsom spår, fingeravtryck, krutstänk med mera, än mer betydelsefullt. Det sker dessutom en utveckling inom brottmål överlag där den tekniska bevisningen blir allt viktigare. Därför är det helt avgörande att teknisk bevisning värderas på ett korrekt sätt.

Vi kommer i denna artikel att gå igenom hur Nationellt Forensiskt Centrum (NFC) beskriver och värderar teknisk bevisning, och i en senare artikel beskriva hur domstolar försöker lägga samman, eller inte lägga samman, viss bevisning.

NFC värderar spår som polisen funnit i försök att besvara frågor såsom ”Kommer fingeravtrycket från person A eller från en annan person?” eller ”Har namnteckningen skrivits av person B eller av någon annan?”.
I sin bevisvärdering använder NFC en niogradig skala, från Grad -4 till Grad +4, som indikerar hur starkt beviset är. Grad +4 indikerar att beviset i hög grad stärker åklagarens hypotes. Till denna skala finns både kvalitativa beskrivningar och kvantitativa mått för att beskriva bevisens styrka.

Hur NFC beskriver skalan har betydelse för hur styrkan i ett bevis tolkas. Ett exempel på hur illa det kan gå om skalan, och beskrivningen av den, missförstås är en inbrottsdom från Svea Hovrätt[1] . Bevis i målet var ett DNA-spår som NFC knöt till en person och värderade bevisets styrka till Grad + 4. I beskrivningen av Grad+4 står det ”Resultaten talar extremt starkt för att DNA-spåret kommer från den utpekade, om man bortser från möjligheten att det kommer från en nära släkting”. Hovrätten tolkade – begripligt, men felaktigt – NFC:s beskrivning som att DNA-spåret lika gärna kunde komma från den misstänktes bror eller far. Men egentligen innebär ett DNA-spår av Grad+4 att den enda tänkbara släkting som skulle kunna komma i fråga för förväxling är en hypotetisk enäggstvilling.

Vi anser att användningen av denna skala kan leda till kraftig undervärdering av bevis och resultera i felaktiga domar. I denna artikel (del 1 av 2) ska vi illustrera hur pass illa NFC:s klassificering stämmer överens med rimliga tolkningar av bevisvärdet. I del 2 kommer vi att diskutera sammanvägningen av flera bevis i en aktuell rättegång.

Nedan kommer två exempel från utlåtanden från mordrättegångar där offret skjutits i samband med gängkriminalitet.

Första exemplet rör en skjutning i Bromma där gärningsmännen körde ikapp offret och sköt honom med ett automatvapen från baksätet på sin bil. Ett av bevisen är krutstänk som fanns på ett par handskar som hittades i attentatsbilen. NFC laborerar med två hypoteser:

”Huvudhypotes: Handskarna har varit i nära anslutning till skjutvapen då det avfyrats eller har varit i kontakt med något vapenrelaterat till exempel skjutvapen eller patronhylsor.
Alternativ hypotes: Handskarna har inte varit i nära anslutning till skjutvapen då det avfyrats eller varit i kontakt med något vapenrelaterat till exempel skjutvapen eller patronhylsor.
Det bedöms fullt möjligt att få det erhållna resultatet om huvudhypotesen är sann. Det bedöms något mindre sannolikt att få detta resultat om den alternativa hypotesen är sann.
Slutsats: Resultaten talar i någon mån för att handskarna har varit i nära anslutning till skjutvapen då det avfyrats eller har varit i kontakt med något vapenrelaterat till exempel skjutvapen eller patronhylsor (Grad +1).”

I detta exempel görs en kvalitativ sannolikhetsbedömning hur sannolikt krutstänk är betingat på de två olika hypoteserna.

Det andra exemplet kommer från en skjutning utanför en pizzeria i Segeltorp i södra Stockholm. Polisen hade funnit den misstänktes DNA på ett vapen och en skoter. Frågan var om dessa fynd kunde bevisa att den misstänkte var skyldig. Försvaret hävdade att anledningen till att den misstänktes DNA fanns på vapnet och skotern var att den misstänkte använt dem vid ett tidigare tillfälle och att gärningsmannen sedan hade tagit dem. NFC beräknade att sannolikheten att finna de aktuella bevisen under antagandet att den misstänkte var gärningsmannen var 265 gånger större jämfört med sannolikheten att finna de aktuella bevisen under antagandet att någon annan var gärningsmannen. Beräkningarna baserades på antal vapen och antal skotrar av de aktuella märkena som antogs finnas i Stockholm. Vi går inte igenom hur de räknade utan presenterar bara NFC:s slutsats:

”Det sammantagna resultatvärdet för Resultat 1 (DNA på skjutvapnet) och Resultat 2 (DNA på skotern) blir därför:

Vilket innebär Grad +2 i NFC:s utlåtandeskala.”

I det första exemplet gjordes kvalitativa överslagsmässiga sannolikhetsöverväganden som sedan översattes till Grad +1 på bevisskalan. I det andra exemplet räknade man mer formellt och kom fram till talet 265 som sedan översattes till Grad +2 på bevisskalan.

NFC har på sin hemsida en utförlig presentation av sin utlåtandeskala. Det finns fem olika beskrivningar av varje steg på bevisskalan. Dels graderingen från -4 till +4, dels i form av en matematisk kvot (V) men det finns också en verbal förklaring av denna kvot, en verbal tolkning av kvoten och till sist en kort formulering. I tabellen nedan återges de fem olika formuleringarna för ett bevis av Grad +1.

 Tabell 1, Exempel på formulering och tolkning av bevis av Grad +1.

Grunden för skalan är beräkningen av V[2]. Detta mått kallas inom statistik för likelihoodkvot och är kvoten mellan hur sannolikt beviset är enligt huvudhypotesen (i regel åklagarens beskrivning av vad som hänt) och hur sannolikt beviset är enligt den alternativa hypotesen (i regel försvarets förklaring till vad som hänt). Denna beräkning av V är väl accepterad som det optimala sättet att beräkna bevisvärdet. Men, att förstå sannolikheter är svårt, och att förstå innebörden av kvoten mellan två sannolikheter är ännu svårare. För att underlätta tolkningen av V ges också verbala förklaringar samt graderingar som exemplifierats i tabell 1.

Däremot stämmer inte naturliga tolkningar av de olika verbala beskrivningarna med det matematiska bevisvärdet. En språklig tolkning av uttrycket ”talar i någon mån för” ger en mycket svagare sannolikhet än det angivna bevisvärdet. Detta leder till att bevisvärdet underskattas.

För att verifiera detta har vi bland annat låtit 40 personer placera olika bevis på NFC:s utlåtandeskala.  Deltagarna fick se den verbala tolkningen av skalstegen Grad 0 till Grad +4 (se mittkolumnen i tabell 2).  Därefter fick de åtta olika kombinationer av sannolikheter som de skulle placera in på den nivå som de ansåg passade bäst. T.ex. att sannolikheten för beviset enligt huvudhypotesen är 80 % och sannolikheten för beviset enligt den alternativa hypotesen är 2 %. Respondenten skulle då svara på hur mycket mer sannolikt 80 % är än 2 %, genom att placera in beviset på lämplig nivå enligt tolkningsskalan i tabell 2.

Tabell 2, Beskrivning av Grad 0 till Grad +4. (Kolumnen med V presenterades inte för deltagarna i studien.)

19 respondenter ansåg att 80 % är mycket mer sannolikt än 2 %. 21 personer ansåg att 80 % är extremt mycket mer sannolikt än 2 %, se figur 1.

Men enligt NFC:s beräkningar blir bevisvärdet V=40 (80/2=40). Ett V=40 motsvaras av Grad +1 vilket därmed språkligt tolkas som att 80 % bara är något mer sannolikt än 2 %.  Ingen av respondentera ansåg att 80 % bara är något mer sannolikt än 2 %.

Figur 1, 40 personers bedömning av hur mycket mer sannolikt 80% är jämfört med 2%. (V=40 anger var beviset hamnar enligt NFC:s skala)

I figur 2 finns tre andra exempel på hur respondenterna graderat bevisen i jämförelse med NFC:s gradering.

Figur 2, Tre exempel hur 40 personer värderat olika sannolikheter enligt NFC:s skala. (I rött anges V och den placering beviset hamnar enligt NFC:s beräkning)

I samtliga av dessa fall är bevisvärdet enligt NFC betydlig lägre än uppfattningen hos respondenterna. Ett annat sätt att beskriva detta är att personers tolkning av hur NFC värderar beviset enligt den verbala beskrivningen inte alls stämmer överens med den kvantitativa värderingen av beviset.

För att ytterligare illustrera denna problematik ska vi använda en enkel modell. I figur 3 finns två burkar med svarta och röda kulor. Varje burk innehåller 5000 kulor. Burk 1 innehåller 4999 svarta kulor och en röd kula, burk 2 innehåller enbart 5000 röda kulor. Antag att vi singlar slant om vilken av burkarna vi ska välja och sedan slumpmässigt drar en kula ur den valda burken. Frågan som skall besvaras är ur vilken burk vi dragit kulan.

Antag att den dragna kulan blev röd. Hur starkt är detta bevis (den röda kulan) för att vi dragit ur burk 2? Låt oss använda NFC:s bevisskala.

Sannolikheten att få en röd kula om vi drar ur burk 2 (huvudhypotes) är 100% (den innehåller bara röda kulor). Sannolikheten att få en röd kula ur burk 1 är 0.02% (1/5000), (det finns en röd kula i burken). Beräkningen av V ger resultatet 5000 (100/0.02=5000).  Detta skulle enligt NFC:s bevisskala hamna på Grad +2. NFC skulle sedan översätta detta till att det är mer sannolikt att få en röd kula ur burk 2 än burk 1.  

Figur 3, Två burkar med röda och svarta kulor.

Det ska således, enligt NFC, inte anses mycket mer sannolikt att få en röd kula ur burk 1 jämfört med ur burk 2 utan endast mer sannolikt. Beviset räcker därför inte till Grad +3. För de flesta människor är dock en sannolikhet på 100% mycket mer, eller extremt mycket mer sannolikt än 0.02%. Återigen illustrerar detta att den verbala beskrivningen av bevisvärdet inte stämmer med den korrekta kvantitativa tolkningen. Den verbala tolkningen leder till en kraftig underskattning av det faktiska bevisvärdet.

Utöver det problem som illustrerats i det tidigare avsnittet finns ett annat allvarligt problem som kan leda till underskattning av bevisvärdet. Problemet benämns ’the weak evidence effect’.  I en studie av Martire (2014)[3] lät forskarna försökspersoner få bevis presenterat för sig på olika sätt. Dels i termer av likelihoodkvoter (V), dels grafiskt och dels verbalt. Studien visade att bevisvärdet av svaga bevis som presenterades verbalt underskattades. Det var till och med så att respondenterna tolkade det svaga, verbalt beskrivna beviset som stöd för den alternativa hypotesen, trots att beviset talade för huvudhypotesen.  

Det finns flera studier som visar detta fenomen och flera teorier om varför detta problem uppstår. Om, till exempel, ett bevis sägs vara något mer sannolikt enligt huvudhypotesen jämfört med alternativhypotesen (Grad +1), kan det verka svagt. Om den misstänkte är skyldig borde väl beviset vara åtminstone mycket mer sannolikt. Formuleringen något mer sannolikt gör att beviset framstår som svagt. Om bevisets likelihoodkvot (V), som ligger på intervallet 6-100, presenterades istället, framgår att oddset för att den misstänkte är skyldig ökar med 6-100 gånger och det ”svaga” beviset framstår som starkt. Det matematiskt korrekta sättet att förstå värdet av ett bevis är via Bayes teorem. Det finns många skrifter och applikationer[4] som beskriver detta tydligt.

Vi har i denna artikel argumenterat för att det kvantitativa bevisvärdet enligt V inte stämmer överens med personers uppfattning om skillnad i sannolikheter. NFC:s översättning från matematiskt värde till språklig beskrivning leder till en kraftig underskattning av bevisvärdet. De verbala formuleringarna uppfattas mycket svagare än det faktiska kvantitativa bevisvärdet.  Det finns även belägg för att ett svagt bevis som stärker åklagarens hypotes till och med kan få motsatt effekt, det vill säga verkar försvaga åklagarens hypotes, när det presenteras verbalt.

Dessa resultat är extra viktiga för de mål där det finns flera svagare bevis som tillsammans kan utgöra tillräcklig bevisning. Om de enskilda bevisen underskattas av rätten så blir förstås den sammanlagda bevisningen för svag. I del 2 illustrerar vi ett konkret rättsfall där vi anser att rätten underskattade de enskilda bevisen och det totala bevisvärdet.

Fotnoter:
[1] Svea Hovrätt 2019-09-23 i B4510-19
[2] Se t.ex. Nordgaard A och B. Rasmusson (2012), ‘The likelihood ratio as a value of evidence – more than a question of numbers’, Law, Probability and Risk 11:303-315.
[3] Martire et al (2014), ‘On the interpretation of likelihood ratios in forensic science evidence: Presentation formats and the weak evidence effect’. Forensic Science International 240: 61-68
[4] T.ex. https://svara.statisticon.se/Bayes/Home/Calculator


Dela sidan:
Skriv ut:

Dagens Juridik
red@dagensjuridik.se