Koll på tillgänglighet: 2. Ljud och video

OBS! Nu är allt innehåll i artikelserien Koll på tillgänglighet uppdaterat och samlat i en gratis publikation på digitill.se.

Ljud och video har formligen exploderat på Internet: 2013 är podcastens år och Webbdagarna har i år huvudtemat “Rörligt“. Behovet av att uppfylla den andra av tolv riktlinjer i WCAG 2.0 har egentligen aldrig varit större. Få verkar bry sig.

Det här upplevs ofta som det tuffaste, och dyraste, kravet att uppnå i WCAG. Problemet med video och/eller ljud är att det utesluter människor som inte kan tolka information i det formatet. Det här inlägget är en del av en serie poster om tillgänglighet.

wcag-ljud-video

Ljud är, i grunden, bra

Möjligheten till ljud förs ofta fram som en fördel, just för att det har potentialen att göra innehåll tillgängligt för människor med nedsatt synförmåga. Och så är det. Problemen uppstår oftast när vi har ljud i kombination med video, och bilderna krävs för att förmedla innehållet. Men bara för att synskadade har fått en välförtjänst stark position i designtänkande så får vi inte glömma bort det stora antalet hörselskadade och alla former av kognitiva handikapp.

För att uppfylla riktlinjerna för tillgänglighet när det gäller ljud och video så måste man, för att uppfylla det lägst ställda kravet (nivå A):

  • Ha ett textalternativ för allt försinspelat ljud som återger likvärdig information som ljud-spåret.
  • Ha antingen ett textalternativ eller ett extra ljudspår som förklarar det visuella innehållet i förinspelad video.
  • För synkroniserad video (ljud och bild) erbjuds bildtext (captions).

Det här innebär förstås att den stora massan av ljud och film vi tar del av på nätet inte uppfyller det lägst ställda kravet. Även om YouTube erbjuder en integrerad tjänst för bildtext så är det tyvärr bara en handfull som använder den funktionaliteten.

Det behövs en del kampanjande och insiktsskapande om att väldigt många har nytta av bildtext och textalternativ; det handlar inte bara om hörselnedsättningar utan även om människor som har svårt att förstå språket och har stor nytta av textkomplement för bättre förståelse. Det ger också fördelar om sökmotorer och andra verktyg kan tolka innehållet.

Samtidigt kan det vara billigare än många tror, och även för ett hobbyprojekt som exempelvis UX Podcast, en podcast jag medproducerar, så har vi emellanåt prioriterat transkribering av programmen. Vi har då använt oss av fiverr.com. Generellt är det förstås billigare med engelskt innehåll, eftersom utbudet av människor som transkriberar är betydligt större, men en snabb sökning i Google ger dig flera företag att börja kolla upp prisbilden med.

Exempel: När jag bäddar in video i bloggen som jag inte själv kan påverka, som söndagens TED-talk med Elizabeth Gilbert, så försöker jag förklara andemeningen i videons presentation i min text. Det är en god ansträngning när man inte själv har producerat videon, men enligt konstens alla regler är faktiskt inte ens det nivå A av tillgänglighet – eftersom jag inte förklarar det visuella innehållet (hur Gilbert ser ut och rör sig i filmen) och det inte finns bildtext i själva videon.

Nivå AA — inte många lever upp

Vi kämpar vidare med nivå A men låt oss också kika på vad som krävs för att nästa nivå (AA) ska uppfyllas. Det här är speciellt intressant eftersom de flesta företag och organisationer säger sig uppfylla nivå AA av WCAG 2.0. Men i 99 fall av 100 gör de alltså inte det.

  • Bildtext (captions) ska finnas tillgänglig för alla live-sändningar av media med ljud. Det betyder alltså att du måste ha någon som simultanskriver i samband med sändningen, eller ett färdigt manus som lyfts in.
  • Ljudbeskrivningar ska finnas tillgängliga för allt video-innehåll.

Ljudbeskrivningar är inte text, det är ljud som förstärker och kompletterar ljud-delen av presentationen när bild-delen inte är tillgänglig (alltså för de som inte kan ta till sig bilden). Inom befintliga pauser i videon så lägger man till information om beteenden, karaktärer, scenförändringar och eventuell skärmtext som är viktig men inte beskrivs eller uttalas i det primära ljudspåret.

Men låt oss för all del inte stanna där. Det finns en nivå till i denna riktlinje. För att uppfylla nivå AAA krävs:

  • All förinspelad video har teckenspråkstolkning.
  • Avancerade ljudbeskrivningar. När videon inte har tillräckligt många/långa pauser för att lägga in ljudbeskrivningar så pausas videon automatiskt för att ljudbeskrivningarna ska få tillfälle att förmedla känslan i videon.
  • Ett fullgott textalternativ finns för all video med visuellt innehåll: ett sådant läses nästan som en bok om det finns visuell information, med till exempel beskrivningar av sammanhang, beteende och människors ansiktsuttryck.
  • För ljud som är live tillahandahålls motsvarande textalternativ för ljudet. Det innebär live-transkribering eller, om det är tal som följer ett manus, en länk till manuset.

Medvetet beslut eller huvudet i det blå?

För företag och organisationer som jobbar med video och ljud ska det ligga i budget hur man skapar och säkerställer en tillgänglig produktion. Trenden som jag ser just nu, där man har en okunskap och i viss mån total brist på empati för behovet, är oroväckande.

Jag kan acceptera att man väljer bort tillgänglighet i vissa fall om det är ett beslut som man har värderat och begrundat på riktigt när det gäller teknik, resurser och användare. Att välja att skapa otillgängligt innehåll ska framför allt vara ett medvetet beslut som någon kan stå till svars och argumentera för. Att gömma huvudet i sanden och nynna för sig själv, som så ofta när det gäller video, borde inte vara den framkomliga väg som det är idag.

Nåväl, nu när vi har klarat av en genomgång av det tuffaste, och i alla fall det mest ignorerade, kravet så är det bara nerförsbacke härifrån. Vi ses!