Software de transcripción conforme al RGPD: transcripción con IA sin riesgo para los datos
Cómo usar software de transcripción conforme al RGPD: por qué las herramientas cloud de EE. UU. son arriesgadas, qué importa legalmente y cuándo el procesamiento local es la solución más limpia.

Una entrevista de investigación, una llamada con un cliente grabada, una nota de voz llena de apuntes de proyecto: la transcripción con IA convierte horas de tecleo en minutos de cómputo. Y exactamente por eso, innumerables equipos están subiendo ahora mismo sus grabaciones a cualquier servicio de transcripción sin preguntarse dónde acaba realmente ese audio.
La verdad incómoda: casi toda grabación contiene datos personales, a menudo datos especialmente protegidos. Si los envías a un servicio en la nube fuera de la UE, tienes un problema de RGPD antes de que se transcriba la primera palabra. Este artículo muestra qué importa de verdad en un software de transcripción conforme al RGPD, qué preguntas deberías hacer a cualquier proveedor y por qué la transcripción local con IA evita que la mayoría de estos problemas lleguen siquiera a surgir.
Una aclaración previa: esto es una visión general, no asesoramiento jurídico. La valoración concreta depende siempre de tu escenario de uso. Si lo tuyo es el dictado en vivo y no la transcripción de grabaciones, encontrarás el análisis legal en nuestro artículo sobre software de dictado conforme al RGPD.
Por qué la transcripción es un tema de privacidad más delicado que el dictado
Al dictar procesas tu propia voz y tus propios pensamientos. Al transcribir grabaciones se añade una dimensión decisiva: los datos de otras personas. Una entrevista contiene la voz y las declaraciones de tu interlocutora. Una reunión grabada contiene las palabras de todos los participantes. Y una voz, por sí sola, ya es una característica biométrica.
El contenido se vuelve sensible enseguida. Las entrevistas cualitativas suelen tocar la salud, las opiniones políticas o la historia de vida de las personas entrevistadas, es decir, categorías especiales de datos personales según el art. 9 del RGPD. Las llamadas con clientes contienen detalles contractuales, las reuniones de equipo asuntos internos y de personal. Quien procesa esas grabaciones es responsable de datos que otras personas le han confiado.
A esto se suma una obligación que rige antes de cualquier transcripción: la propia grabación necesita una base jurídica. Grabar conversaciones sin el conocimiento y el consentimiento de los participantes es ilícito en muchos casos y puede incluso constituir delito. Recabar consentimientos no es, por tanto, una formalidad, sino la base de todo lo que viene después.
El problema de los servicios de transcripción en la nube

Los servicios de transcripción más conocidos funcionan en la nube, muchos con servidores en Estados Unidos. Eso te abre varios frentes a la vez.
En cuanto un proveedor procesa audio por encargo tuyo, necesitas un contrato de encargado del tratamiento según el art. 28 del RGPD. Si el servidor está fuera de la UE, se añade la transferencia a un tercer país, que desde la sentencia Schrems II exige garantías adicionales para proveedores estadounidenses y aun así conserva un riesgo residual. Frente a las personas grabadas tienes deberes de información según los arts. 13 y 14 del RGPD: deben saber que su grabación va a un proveedor de servicios, a cuál, y adónde. Un consentimiento que solo cubre la grabación no cubre automáticamente la subida a un servicio estadounidense.
Hay un punto que se pasa por alto con frecuencia: el entrenamiento de modelos de IA. Algunos servicios se reservan el derecho de usar el audio o las transcripciones subidas para mejorar sus modelos. Para grabaciones confidenciales eso es un criterio de exclusión, independientemente de dónde esté el servidor. Un proveedor que no se comprometa de forma clara y contractual a no usar tus contenidos para entrenamiento no es una opción para grabaciones sensibles.
Para las profesiones sujetas a secreto, todo se endurece aún más. Médicos, abogados y terapeutas que revelan sin autorización secretos de clientes o pacientes se exponen a consecuencias profesionales y a menudo penales. Una entrevista con una paciente o la grabación de una reunión con un cliente sencillamente no pinta nada en el servidor de un proveedor que no controlas contractualmente.
Transcripción local con IA: resolver el problema de raíz
La buena noticia: la tecnología ha cambiado de raíz. Los modelos modernos de reconocimiento de voz como Whisper funcionan hoy directamente en portátiles normales, sin contacto con servidores y con una calidad que compite con los servicios en la nube. Puedes leer más sobre la tecnología en nuestra guía de software de dictado offline para Mac y Windows.
Para la privacidad, eso lo cambia todo. Si la transcripción se ejecuta localmente en tu dispositivo, la grabación nunca lo abandona. No hay destinatario, así que no hay contrato de encargado para este paso, ni transferencia a terceros países, ni cuestión Schrems II, ni preocupación por el entrenamiento de modelos ajenos. Tus deberes de información frente a las personas grabadas se simplifican, porque puedes decir con total verdad: la grabación se queda en este equipo.
Precisamente en la investigación cualitativa es un avance práctico. Los comités de ética y los delegados de protección de datos preguntan sistemáticamente adónde van las grabaciones de las entrevistas. "La transcripción se ejecuta localmente en el ordenador del estudio" es una respuesta que acorta notablemente los procesos de aprobación. Lo mismo vale para las redacciones que protegen a sus fuentes y para todas las profesiones sujetas a secreto.
La valoración honesta sigue siendo: lo local resuelve la cuestión de la transferencia, no todas las obligaciones. Sigues necesitando una base jurídica para la propia grabación, además de una seguridad razonable del equipo, es decir, cifrado de disco, control de acceso y una rutina limpia de borrado para las grabaciones que ya no necesites.
Si hay nube: entonces europea y desactivable

Hay casos en los que la potencia de la nube es realmente útil, por ejemplo grabaciones muy largas en hardware antiguo. Entonces la pregunta no es "nube sí o no", sino cuál. Una vía en la nube es viable bajo el RGPD si el procesamiento pasa exclusivamente por subencargados europeos, si existe un contrato de encargado del tratamiento, si los subencargados están listados con transparencia y si el proveedor garantiza la zero data retention, es decir, que tu audio no se conserva tras el procesamiento ni se usa para entrenamiento. Y tú debes poder controlar si algo va siquiera a la nube: local por defecto, nube solo como decisión deliberada, función por función.
Lista de comprobación: preguntas para cualquier proveedor de transcripción
Antes de subir una grabación o implantar una herramienta, estas preguntas deberían tener respuestas claras. ¿La transcripción se ejecuta localmente por defecto, o cada audio va a la nube? Si interviene la nube: ¿dónde están los servidores, quiénes son los subencargados, existe un contrato de encargado del tratamiento? ¿Se usan el audio o las transcripciones para entrenar IA o se almacenan tras el procesamiento? ¿Puede la nube desactivarse por completo? Y por último, de tu lado: ¿tienes el consentimiento de todas las personas grabadas, que cubra el tipo de tratamiento que realmente planeas?
Un proveedor que solo responde a estas preguntas con fórmulas de marketing normalmente no las tiene bajo control. Una declaración clara y verificable en la política de privacidad vale más que cualquier eslogan.
Preguntas frecuentes sobre el RGPD y el software de transcripción
¿Puedo transcribir entrevistas con un servicio en la nube de EE. UU.?
Es arriesgado. Necesitas un contrato de encargado del tratamiento, una base sólida para la transferencia a un tercer país y un consentimiento de las personas entrevistadas que cubra la subida. Incluso así, desde Schrems II queda un riesgo residual. El procesamiento local o basado en la UE evita el problema.
¿Necesito el consentimiento de las personas grabadas?
Por regla general sí, y ya para la propia grabación, no solo para la transcripción. Las grabaciones ocultas son ilícitas en muchos casos y pueden constituir delito. El consentimiento debería cubrir también cómo y con qué herramientas se procesa después la grabación.
¿Es la transcripción local con IA peor que la transcripción en la nube?
En la práctica, ya no. Los modelos locales modernos como Whisper alcanzan en hardware actual una calidad comparable a los servicios en la nube para entrevistas, notas de voz y reuniones. En hardware antiguo, una nube europea con zero data retention puede ser un compromiso razonable.
¿Qué significa zero data retention?
Que el proveedor no almacena tu audio ni tus transcripciones tras el procesamiento y no los usa para fines propios como el entrenamiento de modelos. Para grabaciones confidenciales debería estar garantizado por contrato.
¿Basta un servidor en la UE para cumplir el RGPD?
Resuelve la transferencia a terceros países, pero no todo. Sigues necesitando un contrato de encargado del tratamiento, transparencia sobre los subencargados y la garantía de que tus contenidos no se usan para entrenamiento. Y nunca sustituye el consentimiento de las personas grabadas.
¿Qué rige para médicos, abogados y otras profesiones sujetas a secreto?
Para ellos el listón está más alto: la revelación no autorizada de secretos profesionales acarrea consecuencias disciplinarias y a menudo penales. Las grabaciones que implican a pacientes o clientes no deberían, idealmente, abandonar nunca un dispositivo bajo tu propio control. La transcripción local es a menudo la única vía limpia.
Conclusión: la mejor transferencia es ninguna transferencia
La transcripción conforme al RGPD empieza antes de la primera subida: con el consentimiento de las personas grabadas y con la pregunta de si la grabación tiene que abandonar siquiera tu dispositivo. Si la transcripción con IA se ejecuta localmente, las obligaciones más difíciles desaparecen, porque sencillamente no hay destinatario. Si aun así necesitas potencia de nube, entonces exclusivamente europea, asegurada por contrato, sin entrenamiento con tus datos y desactivable en cualquier momento.
Ownvox: transcripción local con IA, desarrollada en Alemania
Ownvox sigue exactamente este principio, con un enfoque claro: la transcripción en vivo. Ownvox convierte tu voz en texto en tiempo real, directamente en el cursor de cualquier aplicación, y el reconocimiento de voz se ejecuta por defecto localmente en tu Mac o PC con Windows. Tu voz y tus transcripciones nunca abandonan tu dispositivo. Si tu caso de uso es poner por escrito tu propia habla, es decir, notas, memorandos, expedientes o documentos enteros, obtienes la arquitectura más respetuosa con la privacidad que existe actualmente. Opcionalmente puedes activar una nube europea cuya inferencia corre en Francia con Scaleway y cuyo proxy en Alemania con Hetzner, con zero data retention y sin entrenamiento con tus contenidos. Un interruptor de privacidad desactiva todas las funciones de nube con un clic, hay disponible un contrato de encargado del tratamiento, y Ownvox se desarrolla en Alemania.
Si buscas un reconocimiento de voz que no promete la conformidad con el RGPD sino que la integra en su arquitectura, descarga Ownvox y dicta tu primer texto sin que tu voz salga nunca de tu equipo.