Inicio Precios Blog Contacto

Subtitulos Accesibles WCAG 2.2 y EAA: Como Cumplir la Ley sin Volverte Loco

Desde el 28 de junio de 2025, la European Accessibility Act (EAA) es de obligado cumplimiento en toda la UE. Si tu empresa vende servicios digitales — e-commerce, banca, e-learning, streaming, transporte, libros electronicos — tus videos tienen que llevar subtitulos accesibles. No es una recomendacion: hay multas de hasta 600.000 EUR en Espana (Ley 11/2023) y sanciones similares en el resto de paises.

Pero "subtitulos accesibles" no es lo mismo que "subtitulos". WCAG 2.2 exige captions con identificacion de hablantes, descripcion de sonidos y contraste minimo. La autocaption de YouTube no cumple. En esta guia ves el workflow completo para hacerlo bien con IA + revision humana.

600k€
Multa maxima EAA Espana
87M
Personas con discapacidad en UE
4.5:1
Contraste minimo WCAG AA

Tres normas se solapan. Conoce cada una porque las auditorias las miran las tres:

Quien esta obligado: empresas con mas de 10 empleados o que facturen mas de 2M EUR anuales que vendan e-commerce, banca, streaming, e-learning, ebooks, billetes de transporte o telecomunicaciones en la UE. Las microempresas estan exentas en servicios, pero NO en productos.

Subtitulos vs Closed Captions (SDH)

Esta es la confusion mas comun y la que te puede costar la auditoria:

SUBTITULOS BASICOS:
- Solo dialogo o traduccion
- Sin identificacion de hablantes
- Sin descripcion de sonidos
- NO cumplen WCAG 1.2.2
- Pensados para idioma extranjero
CLOSED CAPTIONS / SDH:
- Dialogo + sonidos relevantes
- Identifica al hablante (nombre o color)
- [musica], [risas], [telefono]
- Cumplen WCAG 1.2.2 nivel A
- Pensados para personas sordas
- Subtitulo cerrado (activable)

Para cumplir WCAG nivel AA necesitas siempre SDH closed caption, nunca solo subtitulos basicos. La diferencia en coste de produccion es minima si usas subtitulos automaticos con IA y los enriqueces despues.

Workflow Paso a Paso con IA

1. Transcribir con timestamps (5 min): Sube el video a VOCAP y obten transcripcion con marcas de tiempo a nivel de palabra. Esto es la base — sin timing preciso no hay subtitulo decente. Mira como transcribir con timestamps.

2. Segmentar en bloques (10 min): Cada bloque dura 1-3 segundos y tiene maximo 2 lineas de 37-42 caracteres. Los bloques deben respetar pausas naturales y unidad sintactica.

3. Identificar hablantes (5 min): Si hay varios hablantes, prefijo con nombre o cambio de color. La diarizacion automatica te lo da hecho en el 80% de casos.

4. Anadir descripciones no verbales (5 min): Revisa el audio y marca sonidos relevantes para la narrativa: [musica suspense], [puerta golpea], [risa nerviosa], [silencio]. No marques sonidos ambientales irrelevantes.

5. Exportar SRT o WebVTT (1 min): SRT si vas a YouTube/Vimeo; WebVTT si usas reproductor HTML5 propio. Los dos son texto plano editables.

6. Validar y subir (5 min): Valida con WAVE, axe DevTools o el evaluador de accesibilidad nativo del CMS. Sube como pista cerrada (closed), nunca quemada al video.

Pro tip: Un video de 10 minutos = 30 minutos de workflow completo (transcripcion + edicion + SDH + validacion). Sin IA serian 2 horas. Con IA + revision humana es viable producir 20-40 videos accesibles al mes con un solo editor.

Formato Tecnico: SRT, VTT, Timing

Las reglas tecnicas que tienen que pasar cualquier auditoria:

Especificacion tecnica

TIMING:
- Duracion bloque: 1-3 segundos (max 6s)
- Velocidad lectura: 160-180 wpm
- Gap entre bloques: minimo 80ms
- Sincronia: desfase max 100ms

FORMATO TEXTO:
- Maximo 2 lineas por bloque
- Maximo 37-42 caracteres por linea
- Sin partir palabras al cambiar linea
- Puntuacion completa
- Mayusculas para enfasis solo si imprescindible

VISUAL:
- Contraste minimo 4.5:1 sobre fondo
- Fondo translucido oscuro recomendado
- Sans-serif, tamano min 4% altura video
- No superponer a texto critico del video
- Posicion: tercio inferior centrado

El formato WebVTT es mas potente que SRT — permite posicionamiento, estilos CSS y metadata. Si tu reproductor lo soporta, prefierelo. Para detalles sobre crear subtitulos paso a paso mira la guia de subtitulos para videos con IA.

Descripciones No Verbales y Hablantes

Este es el bloque que mas suspenden las auditorias. La regla es: todo lo que un oyente percibe sin ver, una persona sorda debe poder leer.

Musica

[musica suspense], [musica alegre], [musica triste]. No "[musica]" a secas — la emocion importa para la narrativa.

Sonidos narrativos

[puerta golpea], [telefono suena], [pasos se acercan]. Solo los que afectan a la trama o al contexto.

Tono de voz

(susurrando), (gritando), (con sarcasmo). Marcalo cuando el tono cambia el significado del dialogo.

Hablantes

"MARIA: Hola" o cambio de color por hablante. Imprescindible cuando hay 2+ voces sin imagen del hablante en pantalla.

Empieza con transcripcion precisa: VOCAP te da timestamps por palabra y diarizacion.

Probar VOCAP gratis

Checklist de Cumplimiento WCAG 2.2 AA

Checklist por video antes de publicar

WCAG 1.2.2 - Captions (prerecorded):
[ ] Caption disponible (no autocaption sin revisar)
[ ] Sincronia < 100ms de desfase
[ ] Identificacion de hablantes
[ ] Sonidos relevantes descritos
[ ] Closed (activable/desactivable)

WCAG 1.4.3 - Contraste:
[ ] Ratio 4.5:1 minimo con el fondo
[ ] Fondo opaco u oscuro semitransparente

WCAG 1.4.4 - Resize text:
[ ] Subtitulos escalables al 200% sin perder funcion

WCAG 1.2.5 - Audio description (AAA):
[ ] Audiodescripcion si hay info visual critica
[ ] Pista de audio separada o version con AD

FORMATO:
[ ] SRT o WebVTT, no quemado
[ ] Idioma declarado (lang="es")
[ ] Velocidad < 180 wpm

Para validar el video completo (no solo subtitulos) usa la guia general de accesibilidad de contenido.

Errores que te Dejan Fuera de la Ley

EVITA:
- Autocaption de YouTube sin revisar
- Quemar subtitulos en el video (open)
- Solo dialogo sin descripciones no verbales
- No identificar hablantes con 2+ voces
- Bloques de 1 linea de 80 caracteres
- Sin contraste con fondo claro
- Timing desfasado mas de 100ms
- Idioma sin declarar en el archivo
- "Accesible" para marketing pero sin SDH
HAZ:
- IA + revision humana siempre
- Closed caption SRT o WebVTT
- SDH: hablantes + sonidos relevantes
- 2 lineas de 37-42 caracteres maximo
- Contraste 4.5:1 con fondo
- Sincronia exacta a nivel palabra
- Idioma declarado en el VTT
- Velocidad 160-180 wpm maximo
- Audit interno trimestral + log de cambios

Preguntas Frecuentes

Que diferencia hay entre subtitulos y closed captions (SDH)?

Los subtitulos basicos transcriben o traducen solo el dialogo. Los closed captions o subtitulos para sordos (SDH) incluyen ademas descripciones de sonidos relevantes [musica suspense], identificacion de hablantes y emociones [risa nerviosa]. WCAG 1.2.2 exige captions, no subtitulos basicos.

La European Accessibility Act me obliga a poner subtitulos?

Si tu empresa tiene mas de 10 empleados o factura mas de 2M EUR y vendes servicios digitales B2C en la UE (e-commerce, banca, streaming, e-learning, transporte, ebooks), desde el 28 junio 2025 estas obligado a cumplir EN 301 549 que referencia WCAG 2.1 nivel AA. En Espana las multas llegan a 600.000 EUR (Ley 11/2023). Las microempresas en servicios estan exentas, pero NO en productos digitales.

Vale con la autocaption automatica de YouTube?

No. WCAG 1.2.2 exige captions con precision suficiente para entender el contenido. La autocaption de YouTube tiene errores en nombres propios, terminologia tecnica, idiomas mezclados y no marca sonidos ni hablantes. Si te auditan, no cumple. Toca usar transcripcion IA + revision humana + enriquecer con SDH.

Que formato uso: SRT, VTT o quemar los subtitulos?

SRT para compatibilidad amplia (YouTube, Vimeo, casi todos). WebVTT para web HTML5 con estilos CSS y posicionamiento. Nunca quemes los subtitulos en el video (open caption) si quieres cumplir accesibilidad: el usuario debe poder activarlos y desactivarlos. Closed caption siempre, o no cumples.

Cuanto cuesta hacer un video accesible con IA?

Con VOCAP, transcribir 1h de video cuesta desde 1 EUR. La edicion SDH + validacion anade unos 30-45 minutos por video de 10 minutos. Para un volumen de 20 videos/mes con editor freelance (25-35 EUR/h) sale aprox 250-350 EUR/mes vs 1.500-2.500 EUR/mes de un servicio profesional de captioning tradicional. ROI claro vs riesgo de multa de 600.000 EUR.

La accesibilidad ya no es opcional. Y la transcripcion es el primer paso.

Genera transcripciones con timestamps precisos y diarizacion para producir subtitulos SDH que cumplan WCAG 2.2 nivel AA.

15 minutos gratis · Sin tarjeta · Desde 1€/hora

Empezar Gratis
Prueba VOCAP gratis 15 min de transcripcion
Empieza Gratis →